已知开头结尾提取中间字符串的正则表达式

在各种字符操作中经常会遇到这样的情况,那就是:开头结尾的字符具有一致性,但是中间的内容不同。例如,在抓取网页的时候,分析处理HTML标签就是这样的情况。这个时候如果要提取中间的字符,比较高效的方法就是利用正则表达式。

此种情况下的正则表达式如下:

HEAD(.+?)TAIL

使用时将“HEAD”、“TAIL”替换成相应的开头、结尾的字符串

对于PHP,可以利用preg_match_all()函数:

http://php.net/manual/zh/function.preg-match-all.php

对于Python,利用re库即可,相关函数如下:

re.compile(pattern)
re.findall(pattern,text)

继续按照惯例发图

51834462_p0

フランちゃん | ちくわさび [pixiv] http://www.pixiv.net/member_illust.php?mode=medium&illust_id=51834462

已知开头结尾提取中间字符串的正则表达式》上有1条评论

发表评论

电子邮件地址不会被公开。 必填项已用*标注