正则表达式可调用的函数 怎么用函数的方法自动提取信息

发布时间:2023-11-30 17:55:18
发布者:网友

各位老铁们,大家好,今天由我来为大家分享正则表达式可调用的函数,以及怎么用函数的方法自动提取信息的相关问题知识,希望对大家有所帮助。如果可以帮助到大家,还望关注收藏下本站,您的支持是我们最大的动力,谢谢大家了哈,下面我们开始吧!

一、怎么用函数的方法自动提取信息

1、要使用函数的方法自动提取信息,首先需要定义一个函数,该函数接受输入参数,例如一个字符串或一个文件。

2、然后,在函数内部使用适当的方法和技术来提取所需的信息。

3、这可以包括使用正则表达式、字符串处理函数、列表操作等。

4、函数应该返回提取到的信息,可以是一个字符串、一个列表或其他适当的数据结构。

5、最后,调用该函数并传入需要提取信息的输入,然后使用返回的结果进行进一步处理或展示。这样,就可以通过函数的方法自动提取信息。

二、js正则表达式怎么定义

1、javascript正则表达式的2种定义方法:一种是直接调用RegExp(),第二种是直接用字面量来定义,即varre=/正则规则/。

2、js正则表达式的2种定义方法本质都是调用RegExp()方法在调用同一段正则代码的时候,ECMAScript3和ECMAScript5中表现完全不一样functionreg(){varre=/\sjavascript/;returnre;}分别在ECMAScript3和ECMAScript5中调用reg()方法多次在ECMAScript3中,调用的是同一个RegExp对象,在ECMAScript5中,调用的是不同的RegExp对象因为在EXCMAScript5中每执行一次,就生成一个新的RegExp对象所以在ECMAScript3中会造成程序的隐患,因为只要在一个地方对这个对象进行修改的话,所有调用到这个对象的地方都会变化。

三、VBA正则表达式语法

正则语法几乎都一样。VBA你调用的是VBScript.RegExp正则库吧。VBScript正则不支持零宽断言语法。相对C#正则来说VBScript正则就弱了一点,其他的语法都是一样的。还有\\d{4}Q\\d{3}这句话我不知道你是不是从C#或C++中复制过来的,VBA中这个“\”斜杠不是转义符来的。所以要注意改成\d{4}Q\d{3}就可以了。

四、MySQL正则表达式入门教程

MySQL一直以来都支持正则匹配,不过对于正则替换则一直到MySQL8.0才支持。对于这类场景,以前要么在MySQL端处理,要么把数据拿出来在应用端处理。

比如我想把表y1的列str1的出现第3个action的子串替换成dble,怎么实现?

1.自己写SQL层的存储函数。代码如下写死了3个,没有优化,仅仅作为演示,MySQL里非常不建议写这样的函数。

DROPFUNCTIONIFEXISTS`func_instr_simple_ytt`$$

CREATEDEFINER=`root`@`localhost`FUNCTION`func_instr_simple_ytt`(

f_strVARCHAR(1000),--Parameter1

f_substrVARCHAR(100),--Parameter2

f_timesint--timescounter.onlysupport3.

declarev_resultvarchar(1000)default'ytt';--result.

declarev_substr_lenintdefault0;--searchstringlength.

setv_substr_len=length(f_substr);

selectinstr(f_str,f_substr)into@p1;--Firstrealposition.

selectinstr(substr(f_str,@p1+v_substr_len),f_substr)into@p2;Secondaryvirtualposition.

selectinstr(substr(f_str,@p2+@p1+2*v_substr_len-1),f_substr)into@p3;--Thirdvirtualposition.

if@p1>0&&@p2>0&&@p3>0then--Fine.

concat(substr(f_str,1,@p1+@p2+@p3+(f_times-1)*v_substr_len-f_times)

substr(f_str,@p1+@p2+@p3+f_times*v_substr_len-2))intov_result;

setv_result=f_str;--Neverchanged.

mysql>updatey1setstr1=func_instr_simple_ytt(str1,'action','dble',3);

QueryOK,20rowsaffected(0.12sec)

Rowsmatched:20Changed:20Warnings:0

2.导出来用sed之类的工具替换掉在导入,步骤如下:(推荐使用)1)导出表y1的记录。

mysqlmysql>select*fromy1intooutfile'/var/lib/mysql-files/y1.csv';QueryOK,20rowsaffected(0.00sec)

shellroot@ytt-Aspire-V5-471G:/var/lib/mysql-files#sed-i's/action/dble/3'y1.csv

3)再次导入处理好的数据,完成。

QueryOK,0rowsaffected(0.99sec)

mysql>loaddatainfile'/var/lib/mysql-files/y1.csv'intotabley1;

QueryOK,20rowsaffected(0.14sec)

Records:20Deleted:0Skipped:0Warnings:0

以上两种还是推荐导出来处理好了再重新导入,性能来的高些,而且还不用自己费劲写函数代码。那MySQL8.0对于以上的场景实现就非常简单了,一个函数就搞定了。

mysqlmysql>updatey1setstr1=regexp_replace(str1,'action','dble',1,3);QueryOK,20rowsaffected(0.13sec)Rowsmatched:20Changed:20Warnings:0

还有一个regexp_instr也非常有用,特别是这种特指出现第几次的场景。比如定义SESSION变量@a。

mysqlmysql>set@a='aabbcceefilucy111bs234523556119101020301040';QueryOK,0rowsaffected(0.04sec)

拿到至少两次的数字出现的第二次子串的位置。

mysqlmysql>selectregexp_instr(@a,'[:digit:]{2,}',1,2);+--------------------------------------+|regexp_instr(@a,'[:digit:]{2,}',1,2)|+--------------------------------------+|50|+--------------------------------------+1rowinset(0.00sec)

那我们在看看对多字节字符支持如何。

mysql>set@a='中国美国俄罗斯日本中国北京上海深圳广州北京上海武汉东莞北京青岛北京';

QueryOK,0rowsaffected(0.00sec)

mysql>selectregexp_instr(@a,'北京',1,1);

+-------------------------------+

+-------------------------------+

+-------------------------------+

mysql>selectregexp_instr(@a,'北京',1,2);

+-------------------------------+

+-------------------------------+

+-------------------------------+

mysql>selectregexp_instr(@a,'北京',1,3);

+-------------------------------+

+-------------------------------+

+-------------------------------+

那总结下,这里我提到了MySQL8.0的两个最有用的正则匹配函数regexp_replace和regexp_instr。针对以前类似的场景算是有一个完美的解决方案。

END,本文到此结束,如果可以帮助到大家,还望关注本站哦!

——————————————小炎智能写作工具可以帮您快速高效的创作原创优质内容,提高网站收录量和各大自媒体原创并获得推荐量,点击右上角即可注册使用

小炎智能写作