正则表达式获取网页中的值 函数怎么提取文字里面的数值

发布时间:2023-12-01 03:16:24
发布者:网友

大家好,关于正则表达式获取网页中的值很多朋友都还不太明白,今天小编就来为大家分享关于函数怎么提取文字里面的数值的知识,希望对各位有所帮助!

一、如何使用正则表达式

QTP使用正则表达式有2种方式,一种是在“常量值选项”对话框或“参数选项”对话框的“值”框中输入字符串的正则表达式语法,可以定义正则表达式。选中“正则表达式”复选框,以指示QuickTest将该值作为正则表达式处理。另一种是使用描述性编程,所有编程描述属性值都均自动作为正则表达式处理。注意:您可以只将正则表达式应用于字符串类型的值。默认情况下,除了句点(.)、连字符(-)、星号(*)、插字号(^)、方括号([])、圆括号(())、货币符号($)、垂直线(|)、加号(+)、问号(?)和反斜杠(\)以外,QuickTest将正则表达式中的所有字符作为文字处理。当一个特殊字符前面带有反斜杠(\)时,QuickTest将其作为文字字符处理。如果在“常量值选项”或“参数选项”对话框的“值”框中输入一个特殊字符,QuickTest会询问您是否要在每个特殊字符前面添加一个反斜杠(\)。如果单击“是”,则相应的特殊字符前面就会加上一个反斜杠(\),以指示QuickTest将该字符作为文字处理。如果单击“否”,QuickTest将该特殊字符作为正则表达式字符处理。本节描述某些更常用的选项,可用于创建正则表达式:?使用反斜杠字符(\)?匹配任意单个字符(.)?匹配列表中的任意单个字符([xy])?匹配不在列表中的任意单个字符([^xy])?匹配某个范围内的任意单个字符([x-y])?特定字符的零次或多次匹配(*)?特定字符的一次或多次匹配(+)?特定字符的零次或一次匹配(?)?对正则表达式进行分组(())?匹配几个正则表达式中的一个表达式(|)?在一行的开始进行匹配(^)?在一行的结尾进行匹配($)?匹配包括下划线在内的任一字母数字字符(\w)?匹配任意非字母数字字符(\W)?组合正则表达式操作符正则表达式的语法规则和标记字符描述:^符号匹配字符串的开头。例如:^abc与“abcxyz”匹配,而不与“xyzabc”匹配$符号匹配字符串的结尾。例如:abc$与“xyzabc”匹配,而不与“abcxyz”匹配。注意:如果同时使用^符号和$符号,将进行精确匹配。例如:^abc$只与“abc”匹配*符号匹配0个或多个前面的字符。例如:ab*可以匹配“ab”、“abb”、“abbb”等+符号匹配至少一个前面的字符。例如:ab+可以匹配“abb”、“abbb”等,但不匹配“ab”。?符号匹配0个或1个前面的字符。例如:ab?c?可以且只能匹配“abc”、“abbc”、“abcc”和“abbcc”.符号匹配除换行符以外的任何字符。例如:(.)+匹配除换行符以外的所有字符串x|y匹配“x”或“y”。例如:abc|xyz可匹配“abc”或“xyz”,而“ab(c|x)yz”匹配“abcyz”和“abxyz”{n}匹配恰好n次(n为非负整数)前面的字符。例如:a{2}可以匹配“aa“,但不匹配“a”{n,}匹配至少n次(n为非负整数)前面的字符。例如:a{3,}匹配“aaa”、“aaaa”等,但不匹配“a”和“aa”。注意:a{1,}等价于a+a{0,}等价于a*{m,n}匹配至少m个,至多n个前面的字符。例如:a{1,3}只匹配“a”、“aa”和“aaa”。注意:a{0,1}等价于a?[xyz]表示一个字符集,匹配括号中字符的其中之一。

二、正则表达式里的!表示什么

可以是惊叹号自身,也可以表示反向预查。

三、正则表达式[\\s\\S]*怎么解释

可以匹配文档中任何一个位置。\s空白符\S非空白符[\s\S]任意字符[\s\S]*0个到任意多个字符[\s\S]*?0个字符,匹配任何字符前的位置。正则表达式中\s代表一个空白字符(可能是空格、制表符、其他空白)。\\s代表查找两个字符\和s,因为\在正则中有特殊意义,所有需要转义,写成了\\。

四、函数怎么提取文字里面的数值

要提取文字中的数值,可以使用字符串处理函数和正则表达式。

在大多数编程语言中,都有内置的字符串处理函数,如Java中的substring()、Python中的split()等;此外还可以使用正则表达式来匹配字符串中的数字。

举个例子,如果要从文本串中提取整数或浮点数,可以使用以下Python代码:

text="Hello,todayis2021-08-17,andthetemperatureis25.5degreesCelsius."

numbers=re.findall(r"\d+\.*\d*",text)

print(numbers)#['2021','08','17','25.5']

上述代码中,首先导入Python的正则表达式模块re,然后定义了一个包含数字的文本串text。接着,通过调用re.findall()函数,并使用正则表达式"\d+\.*\d*"匹配文本串text中的所有数字,得到的结果是一个列表,其中包含所有匹配到的数字,包括整数和浮点数。

五、如何快速提取规格型号中的数字

要快速提取规格型号中的数字,可以使用正则表达式或者Python中的字符串处理方法。下面是两种方法的具体示例:

numbers=re.findall(r'\d+',text)

text="规格型号是ABC1234,尺寸为56.7mm,重量为1.2kg。"

print(numbers)#输出:['1234','56','7','1','2']

numbers=''.join(filter(str.isdigit,text))

text="规格型号是ABC1234,尺寸为56.7mm,重量为1.2kg。"

print(numbers)#输出:123456712

以上两种方法都可以提取出规格型号中的所有数字,根据具体需求,选择合适的方法即可。

文章分享结束,正则表达式获取网页中的值和函数怎么提取文字里面的数值的答案你都知道了吗?欢迎再次光临本站哦!

——————————————小炎智能写作工具可以帮您快速高效的创作原创优质内容,提高网站收录量和各大自媒体原创并获得推荐量,点击右上角即可注册使用

小炎智能写作