c# 怎样截取HTML标签<BR><BR>中间的文字

<BR>加格达奇 雷阵雨转阵雨 偏南风2-3级 15/24<BR>
黑河 雷阵雨 偏南风3-4级转4-5级 19/28<BR>
<p style="margin-top: 0pt; margin-bottom: 0pt">哈尔滨 阵雨转多云 西南风2-3级转3-4级 22/28 <BR>
加格达奇 雷阵雨转阵雨 偏南风2-3级 15/24 <BR>
黑河 雷阵雨 偏南风3-4级转4-5级 19/28 <BR>
齐齐哈尔 多云转阵雨 西南风2-3级转偏南风3-4级 21/29</td>

就是想把每个城市的信息作为一条记录插入数据库,请问具体怎么实现啊??急,谢谢大家啦
最新回答
槐序廿柒

2024-05-16 06:00:03

针对你贴出来的字符串而言,

string Htmlstring = "<p style=\"margin-top: 0pt; margin-bottom: 0pt\">哈尔滨 阵雨转多云 西南风2-3级转3-4级 22/28 <BR>加格达奇 雷阵雨转阵雨 偏南风2-3级 15/24 <BR>黑河 雷阵雨 偏南风3-4级转4-5级 19/28 <BR>齐齐哈尔 多云转阵雨 西南风2-3级转偏南风3-4级 21/29</td> ";
Regex regex = new Regex(@"<[^>]+>|</[^>]+>");
//用<BR>分割字符串,得到一个字符串数组,其中每个成员就是一个城市信息,但其中会包含 其它 html标签
string[] resultArray = Htmlstring.Split(new string[] { "<BR>" }, StringSplitOptions.RemoveEmptyEntries);
for (int i = 0; i < resultArray.Length;i++ )
{
resultArray[i] = regex.Replace(resultArray[i], ""); //移除所有html标记,如 <p> </td>
Console.WriteLine(resultArray[i]);
}
Console.ReadLine();
缘来伴一生

2024-05-16 05:16:20

使用正则表达式
但规律不是<BR>之间的文字,而是,中文字符+一个以上空格+中文字符+一个以上空格+中文字符+一个以上空格+15/24这样格式的日期
ヤ偽妳變乖

2024-05-16 00:46:55

javascript就可以获得
document.getElementById().innerText就可以。