Python用正则表达式匹配含有中文的字符串，匹配不到？

import res = '<li><a class="nav-first" href="/">首页 <a/></li>'r = re.compile(u'(<li><a\s)+(class=["].*?["])+(\shref=["].*?["])+([\u2e80-\uffff])')r.findall(s)请问问题出在什么地方？结果为空

举报该问题

推荐答案 2018-01-19

ä»£ç å¦ä¸ï¼

#coding=utf-8

import re
s = u'<li><a class="nav-first" href="/">é¦ é¡µ </a></li>'
r = re.compile(u'<li><a\sclass="[^"]*"\shref="[^"]">(.*?)(?=</a></li>)')
ss = r.findall(s)
for str in ss:
print str

è¿è¡ç»æï¼

è¿½é®

è°¢è°¢ä½ çè§£çï¼æç§ä½ çå¹éæ¹å¼ï¼æªå¾åºç»æã

温馨提示：答案为网友推荐，仅供参考

当前网址：http://11.wendadaohang.com/zd/PqFvq777qF8vMSq7Pv7.html

其他回答

第1个回答 2018-01-19

import re

s = '<li><a class="nav-first" href="/">首页 <a/></li>'
r = re.findall(u'[\u2e80-\uffff].+?', s)
print(r)

输出结果：
['首 ', '页 ']

第2个回答 2018-01-19

中文匹配正则表达式：[^\x00-\xff]

相似回答

python3 正则表达式如何实现中文模糊匹配替换并输出?答：要使用正则表达式实现中文模糊匹配替换并输出，你可以使用 Python 的 re 模块。以下是一个示例代码，读取一个名为 input.txt 的文件，将其中的 "竹某婵" 或 "竹婵某" 替换为 "竹婵婵"，然后将结果保存到一个名为 output.txt 的新文件中：import re# 定义一个函数来实现替换操作def replace_patt...