sql正则表达式匹配一个字符？sparksql字符串匹配

发布时间：2023-11-29 16:49:19

发布者：网友

本篇文章给大家谈谈sql正则表达式匹配一个字符，以及sparksql字符串匹配对应的知识点，文章可能有点长，但是希望大家可以阅读完，增长自己的知识，最重要的是希望对各位有所帮助，可以解决了您的问题，不要忘了收藏本站喔。

一、如何写一个能匹配字符串的mysql语句

我想匹配abcde，也就是一个*代表一个字符

在正则中*代表0个或者多个，因此此处的存储有问题，应该存储.或者_那么查询sql可以通过like和REGEXP来实现

mysql>select*fromtestwhere'abcde'likereplace(name,'*','_');

mysql>select*fromtestwhere'abcde'regexpreplace(name,'*','.');

二、sql中只查一个字母怎么查

1、在SQL中，只需要在查询语句中使用通配符“%”来代表任意字符，即可查询一个字母。

2、例如，如果要查询所有以字母“a”开头的单词，可以使用以下语句：

3、SELECT*FROMtable_nameWHEREcolumn_nameLIKE'a%';这里的“%”表示任意字符，所以查询结果会包括所有以“a”开头的单词。

4、当然，也可以使用其他通配符如“_”代表一个字符，或者使用正则表达式等方式实现更复杂的查询。总之，SQL提供了丰富的语法和功能，能够帮助我们精确地查询数据。

三、如何查sql表中包含的字符

1、要查找包含某个字符的SQL表中的数据，可以使用SQL查询语句中的LIKE关键字。

2、例如，假设有一个表名为"employees"，其中有一个列名为"last_name"，要查找包含字符"son"的姓氏，可以使用以下查询语句：

3、SELECT*FROMemployeesWHERElast_nameLIKE'%son%';

4、该查询语句使用了通配符"%"来表示任意字符的任意长度，所以它会返回包含"son"字符的任何姓氏（例如"Johnson"、"Jameson"等）的数据行。如果要查找以"son"结尾的姓氏，可以使用以下查询语句：

5、SELECT*FROMemployeesWHERElast_nameLIKE'%son';

6、该查询语句使用了通配符"%"来表示以任意字符为前缀的任意长度，所以它会返回以"son"结尾的任何姓氏（例如"Jackson"、"Williamson"等）的数据行。

7、如果要查找以"son"开头的姓氏，可以使用以下查询语句：

8、SELECT*FROMemployeesWHERElast_nameLIKE'son%';

9、该查询语句使用了通配符"%"来表示以任意字符为后缀的任意长度，所以它会返回以"son"开头的任何姓氏（例如"Song","Sondheim"等）的数据行。

10、使用LIKE关键字，您可以根据需要查找SQL表中包含的字符。

四、MySQL正则表达式入门教程

MySQL一直以来都支持正则匹配，不过对于正则替换则一直到MySQL8.0才支持。对于这类场景，以前要么在MySQL端处理，要么把数据拿出来在应用端处理。

比如我想把表y1的列str1的出现第3个action的子串替换成dble，怎么实现？

1.自己写SQL层的存储函数。代码如下写死了3个，没有优化，仅仅作为演示，MySQL里非常不建议写这样的函数。

DROPFUNCTIONIFEXISTS`func_instr_simple_ytt`$$

CREATEDEFINER=`root`@`localhost`FUNCTION`func_instr_simple_ytt`(

f_strVARCHAR(1000),--Parameter1

f_substrVARCHAR(100),--Parameter2

f_timesint--timescounter.onlysupport3.

declarev_resultvarchar(1000)default'ytt';--result.

declarev_substr_lenintdefault0;--searchstringlength.

setv_substr_len=length(f_substr);

selectinstr(f_str,f_substr)into@p1;--Firstrealposition.

selectinstr(substr(f_str,@p1+v_substr_len),f_substr)into@p2;Secondaryvirtualposition.

selectinstr(substr(f_str,@p2+@p1+2*v_substr_len-1),f_substr)into@p3;--Thirdvirtualposition.

if@p1>0&&@p2>0&&@p3>0then--Fine.

concat(substr(f_str,1,@p1+@p2+@p3+(f_times-1)*v_substr_len-f_times)

substr(f_str,@p1+@p2+@p3+f_times*v_substr_len-2))intov_result;

setv_result=f_str;--Neverchanged.

mysql>updatey1setstr1=func_instr_simple_ytt(str1,'action','dble',3);

QueryOK,20rowsaffected(0.12sec)

Rowsmatched:20Changed:20Warnings:0

2.导出来用sed之类的工具替换掉在导入，步骤如下：（推荐使用）1）导出表y1的记录。

mysqlmysql>select*fromy1intooutfile'/var/lib/mysql-files/y1.csv';QueryOK,20rowsaffected(0.00sec)

shellroot@ytt-Aspire-V5-471G:/var/lib/mysql-files#sed-i's/action/dble/3'y1.csv

3）再次导入处理好的数据，完成。

QueryOK,0rowsaffected(0.99sec)

mysql>loaddatainfile'/var/lib/mysql-files/y1.csv'intotabley1;

QueryOK,20rowsaffected(0.14sec)

Records:20Deleted:0Skipped:0Warnings:0

以上两种还是推荐导出来处理好了再重新导入，性能来的高些，而且还不用自己费劲写函数代码。那MySQL8.0对于以上的场景实现就非常简单了，一个函数就搞定了。

mysqlmysql>updatey1setstr1=regexp_replace(str1,'action','dble',1,3);QueryOK,20rowsaffected(0.13sec)Rowsmatched:20Changed:20Warnings:0

还有一个regexp_instr也非常有用，特别是这种特指出现第几次的场景。比如定义SESSION变量@a。

mysqlmysql>set@a='aabbcceefilucy111bs234523556119101020301040';QueryOK,0rowsaffected(0.04sec)

拿到至少两次的数字出现的第二次子串的位置。

mysqlmysql>selectregexp_instr(@a,'[:digit:]{2,}',1,2);+--------------------------------------+|regexp_instr(@a,'[:digit:]{2,}',1,2)|+--------------------------------------+|50|+--------------------------------------+1rowinset(0.00sec)

那我们在看看对多字节字符支持如何。

mysql>set@a='中国美国俄罗斯日本中国北京上海深圳广州北京上海武汉东莞北京青岛北京';

QueryOK,0rowsaffected(0.00sec)

mysql>selectregexp_instr(@a,'北京',1,1);

+-------------------------------+

mysql>selectregexp_instr(@a,'北京',1,2);

+-------------------------------+

mysql>selectregexp_instr(@a,'北京',1,3);

+-------------------------------+

那总结下，这里我提到了MySQL8.0的两个最有用的正则匹配函数regexp_replace和regexp_instr。针对以前类似的场景算是有一个完美的解决方案。

五、sparksql字符串匹配

这里对sql常用的一些正则匹配作一些匹配，都是来源别人博客，此处稍作整理和总结。mark一下

1、sql中有like和rlike，具体区别

ESCAPE关键字定义转义符WHEREColumnALIKE'%5/%%'ESCAPE'/'

rlike是正则，正则的写法与java一样。'\'需要使用'\\',例如'\w'需要使用'\\w'

Arlike'\\d+'匹配一个或多个数字，notArlike'\\d+'匹配非数字

selectcount(*)fromolap_b_dw_hotelorder_fwherecreate_date_widregexp'\\d{8}'

selectcount(*)fromolap_b_dw_hotelorder_fwherecreate_date_widrlike'\\d{8}'

regexp_extract(stringsubject,stringpattern,intindex)将字符串subject按照pattern正则表达式的规则拆分，返回index指定的字符

selectregexp_extract('IloveYou','(I)(.*?)(You)',1)fromtest1limit1//1匹配I，2匹配love，3匹配You

regexp_replace(stringA,stringB,stringC)将字符串A中的符合Java正则表达式B的部分替换为C

selectregexp_replace("IloveYou","You","")fromtest1//Ilove

这里几个函数类似oracle的5个正则函数，具体可参考oracle的正则匹配函数

END，本文到此结束，如果可以帮助到大家，还望关注本站哦！

——————————————小炎智能写作工具可以帮您快速高效的创作原创优质内容，提高网站收录量和各大自媒体原创并获得推荐量，点击右上角即可注册使用