正则表达式问题!获取HTML标记内的内容!

我想在一段网页代码中查找所有的超链接标记<a>的内容,
表达式是:<a.*>.*<\/a>;如果想仅仅获取<a>与</a>之间的内容,也就是用非获取匹配,我写的表达式是:(?=<a.*>).*(?=<\/a>)但为什么获取的结果却包括了<a>的开始标记?错在哪里?正确的应该怎么写?有什么建议?
最新回答
漫妙幽离

2024-10-16 08:44:00

Regex regex = new Regex("<a(?:\w*)>(?<name>.*)</a>");捕获文本到名称为name的组里