如何通过C#正则表达式抓取表格标签中的所有HTML代码?

有没有人在啊,想请问下,如何通过C#正则表达式抓取表格标签中的所有HTML代码??

代码如上图,且网页中只有一个这种表格,请问如何通过正则表达式将其筛选出来?
最新回答
青山一叙

2024-06-05 12:12:45

你是要抓取什么
抓取<td>xxx</td>里面xx部分还是什么
如果是的话
正则匹配

首先获取到这个table的内容
c#正则 "<tbody>.*?</tbody>"
然后用"</td>(.*?)</td>"匹配上个正则匹配到的内容
最后遍历获取的<td>
用字符串函数去掉<td>和</td>就是中间的内容了
追问
和之间所有的代码
追答
匹配和的话 用 ".*?"就行了
然后得到的字符串包括这些也在里面
饮尽孤单

2024-06-05 12:40:16

你要获取table里的html么 不包括tr tbody这样的标签吧
追问
tbody中的所有HTML代码,包括tr td等
追答
(?.*)
获取组 value的值就行了