使用Perl常规表达式进行匹配

长期以来,Perl以其对常规表达式的固有支持,一直是非常流行的文本处理工具。在这篇入门性文章中,我们将带领你简单了解如何在你自己的程序中使用常规表达式,实现更加强大的文本搜索和替代功能。

我们首先了解最简单的常规表达式:匹配。如果在字符串中找到相匹配的模式,匹配操作就返回真值。因此下面的表达式:

$string =~ m/text/

只有在变量“$string”中的字符串包含子字符串“text”时才返回真值。这是最基本的常规表达式,它对每个字符进行逐字匹配。当然,这只是对常规表达式作用的一个尝试。以需要查找以“ext”结尾的四个字母的单词为例。为达到这个目的,我们使用一个特殊的字符“.”,常规表达式中的句号告诉Perl匹配其中的任何单独的字符。因此下面这个表达式:

$string =~ m/.ext/

将与单词“text”和“next”匹配。

不过,这个表达式并非完美,因为它与包含“ext”的更长单词的一部分相匹配,如“dextrous”和“flextime”。我们可以使用锚字符来限制匹配的位置。“^”字符匹配字符串的开头,因此:

$string =~ m/^.ext/

与“dextrous”匹配,但不与“context”匹配。

同样,“$”字符匹配字符串的结尾:

$string =~ m/.ext$/

与“context”匹配,但不与“dextrous”匹配。

如果你只希望匹配以“ext”结尾的四个字母的字符串,那么你可以组合使用上面的两个表达式,像这样:

$string =~ m/^.ext$/

现在,如果你需要匹配一组给定的字符,而不是句号位置的任何字符,那该怎么办呢?常规表达式通过使用方括号提供一个方法。以下面的表达式为例:

$string =~ m/^[tT]ext$/

这个表达式只与单词“text”和“Text”匹配。一对方括号将转换其中的任何单个字符。这个功能相当强大,例如:

$string =~ m/[aeiouAEIOU]/

如果$string变量中含有元音,则上面的例子返回真值。

如果括号中的第一个字符是“^”,这时它就不是一个锚字符,而是执行“非”操作,匹配不在括号内的任意字符,因此如果$string变量中只包含辅音或标点符号,可以对上面的例子进行调整,使它返回真值:

$string =~ m/[^aeiouAEIOU]/

方括号符号还可以指定字符的范围,让你不必列举一整串连续的数字或字母,例如,下面的例子匹配任何小写字母:

$string =~ m/[a-z]/

到现在为止,我们每次都是处理字符串中的一个字符,但许多情况下我们需要处理更加复杂的问题。我们使用“|”或分段操作达到这个目的。假设我们希望检查$string变量中是否含有“next”或“previous”,我们可以使用下面的表达式:

$string =~ m/next|previous/

如果我们希望在这个表达式中使用锚字符,那么我们需要将选项组合起来,就像在算术中使用圆括号那样。因此,如果我们希望只匹配字符串开头部分的“next”或“previous”,可以这样写表达式:

$string =~ m/^(next|previous)/

· 把年龄相仿的狮虎熊放一起,谁更厉害?结果出人意料

很多人都想知道狮子、老虎和熊打起来谁最厉害,于是便有好事之人把这三种动物关在一起...

· 湖北宜昌三峡坝区水面惊现神秘动物

近日,湖北宜昌,一段视频在当地热传:有网友在三峡坝区拍到神秘动物,体型硕大数米长...

· 什么是语段?语段的类型以及和句群、段落的区别与联系是什么?

句群是最高级的语言单位。 段落(自然段)是章法单位...

 
SED,AWK学习笔记Part 1-----利用正则表达式进行文本匹配
1.3 文本匹配一些unix的文本处理程序让你可以搜索,某些时候可以改变一些文本模式,而不是固定的字串。这些应用包括编辑工具ed,ex,vi和sed,还有awk程序语言和命令行命令grep和egrep.文本模式(更正式地讲应该叫正则表...查看完整版>>SED,AWK学习笔记Part 1-----利用正则表达式进行文本匹配
 
Java中使用正则表达式实现字符串匹配
  黑暗岁月  有一个String,如何查询其中是否有y和f字符?最黑暗的办法就是:  程序1:我知道if、for语句和charAt()啊。  class Test{  public static void main(String args[]) {  String str="For my ...查看完整版>>Java中使用正则表达式实现字符串匹配
 
Java中使用正则表达式实现字符串匹配
  黑暗岁月  有一个String,如何查询其中是否有y和f字符?最黑暗的办法就是:   程序1:我知道if、for语句和charAt()啊。class Test{ public static void main(String args[]) {  String str="For my money...查看完整版>>Java中使用正则表达式实现字符串匹配
 
使用正则表达式进行xml数据验证
     XML Schema是定义XML的数据定义文件,以.xsd作为文件的扩展名。它也以被用来定义一类XML文件。  通常,一些特殊含义的数据不能通过系统预设的数据结构(类型)清楚地描述。  XML Schema 规范中声明:可以...查看完整版>>使用正则表达式进行xml数据验证
 
使用正则表达式进行xml数据验证
使用正则表达式进行xml数据验证 使用正则表达式进行xml数据验证 XML Schema是定义XML的数据定义文件,以.xsd作为文件的扩展名。它也以被用来定义一类XML文件。通常,一些特殊含义的数据不能通过系统预设的数...查看完整版>>使用正则表达式进行xml数据验证