sed使用正则表达式不包含字符 sed怎么在指定列前加字符

发布时间:2023-11-29 16:00:57
发布者:网友

大家好,今天小编来为大家解答以下的问题,关于sed使用正则表达式不包含字符,sed怎么在指定列前加字符这个很多人还不知道,现在让我们一起来看看吧!

一、正则表达式中怎么匹配换行符

\n是回车换行,就是光标移动到下一行,从下一行开始输入输出。跟换行符效果一样。\r则只是回车,光标不移动。正则表达式,又称正规表示法、常规表示法(英语:RegularExpression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。许多程序设计语言都支持利用正则表达式进行字符串操作。例如,在Perl中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的。正则表达式通常缩写成“regex”,单数有regexp、regex,复数有regexps、regexes、regexen。

二、sed怎么在指定列前加字符

1、在使用`sed`命令给指定列前添加字符,你可以借助正则表达式和替换操作来实现。

2、以下是一个示例,假设我们有一个名为"file.txt"的文本文件,内容如下:

3、要在第一列前添加字符"fruit_",可以使用以下命令:

4、sed's/^\([^]*\)/fruit_\1/'file.txt

5、执行上述命令后,输出结果如下:

6、-`s/^\([^]*\)/fruit_\1/`:这是一个`s`命令,用于替换文本中匹配的内容。`^`表示行的开头,`[^]*`表示匹配任意非空格字符(即第一列的内容),`\([^]*\)`使用括号将匹配的内容捕获为一个组,`\1`表示对第一个捕获组的引用,即原始内容。最后,将"fruit_"添加到引用的前面进行替换。

7、请根据你的实际需求调整命令,并确保正则表达式和文件路径正确。

三、sed的比较级

1、sed(StreamEditor)是一种流编辑器,用于对文本进行处理和转换。它的比较级是sed的高级用法,可以通过使用正则表达式、命令和选项来实现更复杂的文本操作。比如,可以使用比较级来实现全局替换、删除指定行、插入文本等功能。

2、通过灵活的模式匹配和替换,sed的比较级可以帮助用户更高效地处理大量文本数据。

3、此外,sed还支持脚本编程,可以编写复杂的sed脚本来实现更复杂的文本处理任务。总之,sed的比较级是其强大功能的体现,可以满足用户对文本处理的各种需求。

四、如何用sed或awk模糊匹配指定字符串并删除/替换

sed:sed's/a..e/【替换为的字串,不写就是删除】/g'文件名上面是查找以a**e这样的字符串也可以写其他的正则表达式,并删除或替换awk:awk'{gsub(/a..e/,"替换内容或为空");print}'文件名同上,替换项写成空字符串就能实现删除功能。

五、MySQL正则表达式入门教程

MySQL一直以来都支持正则匹配,不过对于正则替换则一直到MySQL8.0才支持。对于这类场景,以前要么在MySQL端处理,要么把数据拿出来在应用端处理。

比如我想把表y1的列str1的出现第3个action的子串替换成dble,怎么实现?

1.自己写SQL层的存储函数。代码如下写死了3个,没有优化,仅仅作为演示,MySQL里非常不建议写这样的函数。

DROPFUNCTIONIFEXISTS`func_instr_simple_ytt`$$

CREATEDEFINER=`root`@`localhost`FUNCTION`func_instr_simple_ytt`(

f_strVARCHAR(1000),--Parameter1

f_substrVARCHAR(100),--Parameter2

f_timesint--timescounter.onlysupport3.

declarev_resultvarchar(1000)default'ytt';--result.

declarev_substr_lenintdefault0;--searchstringlength.

setv_substr_len=length(f_substr);

selectinstr(f_str,f_substr)into@p1;--Firstrealposition.

selectinstr(substr(f_str,@p1+v_substr_len),f_substr)into@p2;Secondaryvirtualposition.

selectinstr(substr(f_str,@p2+@p1+2*v_substr_len-1),f_substr)into@p3;--Thirdvirtualposition.

if@p1>0&&@p2>0&&@p3>0then--Fine.

concat(substr(f_str,1,@p1+@p2+@p3+(f_times-1)*v_substr_len-f_times)

substr(f_str,@p1+@p2+@p3+f_times*v_substr_len-2))intov_result;

setv_result=f_str;--Neverchanged.

mysql>updatey1setstr1=func_instr_simple_ytt(str1,'action','dble',3);

QueryOK,20rowsaffected(0.12sec)

Rowsmatched:20Changed:20Warnings:0

2.导出来用sed之类的工具替换掉在导入,步骤如下:(推荐使用)1)导出表y1的记录。

mysqlmysql>select*fromy1intooutfile'/var/lib/mysql-files/y1.csv';QueryOK,20rowsaffected(0.00sec)

shellroot@ytt-Aspire-V5-471G:/var/lib/mysql-files#sed-i's/action/dble/3'y1.csv

3)再次导入处理好的数据,完成。

QueryOK,0rowsaffected(0.99sec)

mysql>loaddatainfile'/var/lib/mysql-files/y1.csv'intotabley1;

QueryOK,20rowsaffected(0.14sec)

Records:20Deleted:0Skipped:0Warnings:0

以上两种还是推荐导出来处理好了再重新导入,性能来的高些,而且还不用自己费劲写函数代码。那MySQL8.0对于以上的场景实现就非常简单了,一个函数就搞定了。

mysqlmysql>updatey1setstr1=regexp_replace(str1,'action','dble',1,3);QueryOK,20rowsaffected(0.13sec)Rowsmatched:20Changed:20Warnings:0

还有一个regexp_instr也非常有用,特别是这种特指出现第几次的场景。比如定义SESSION变量@a。

mysqlmysql>set@a='aabbcceefilucy111bs234523556119101020301040';QueryOK,0rowsaffected(0.04sec)

拿到至少两次的数字出现的第二次子串的位置。

mysqlmysql>selectregexp_instr(@a,'[:digit:]{2,}',1,2);+--------------------------------------+|regexp_instr(@a,'[:digit:]{2,}',1,2)|+--------------------------------------+|50|+--------------------------------------+1rowinset(0.00sec)

那我们在看看对多字节字符支持如何。

mysql>set@a='中国美国俄罗斯日本中国北京上海深圳广州北京上海武汉东莞北京青岛北京';

QueryOK,0rowsaffected(0.00sec)

mysql>selectregexp_instr(@a,'北京',1,1);

+-------------------------------+

+-------------------------------+

+-------------------------------+

mysql>selectregexp_instr(@a,'北京',1,2);

+-------------------------------+

+-------------------------------+

+-------------------------------+

mysql>selectregexp_instr(@a,'北京',1,3);

+-------------------------------+

+-------------------------------+

+-------------------------------+

那总结下,这里我提到了MySQL8.0的两个最有用的正则匹配函数regexp_replace和regexp_instr。针对以前类似的场景算是有一个完美的解决方案。

关于本次sed使用正则表达式不包含字符和sed怎么在指定列前加字符的问题分享到这里就结束了,如果解决了您的问题,我们非常高兴。

——————————————小炎智能写作工具可以帮您快速高效的创作原创优质内容,提高网站收录量和各大自媒体原创并获得推荐量,点击右上角即可注册使用

小炎智能写作