如何获取html页面的所有文字

大哥在线求帮请教一下,如何获取html页面的所有文字
最新回答
遗留的忧伤

2024-06-30 00:06:44

用正则表达式的方法
<SCRIPT LANGUAGE="vbScript">
dim str
str="怎样从一个Html页面中提取所有汉字呢?不能有其它Html代码。"
alert RegExpTest("[\u4e00-\u9fa5]",str)

Function RegExpTest(patrn, strng)
Dim regEx, Match, Matches ' 建立变量。
Set regEx = New RegExp ' 建立正则表达式。
regEx.Pattern = patrn ' 设置模式。
regEx.IgnoreCase = True ' 设置是否区分大小写。
regEx.Global = True ' 设置全局替换。
Set Matches = regEx.Execute(strng) ' 执行搜索。
For Each Match in Matches ' 遍历 Matches 集合。
RetStr = RetStr & Match.Value
Next
RegExpTest = RetStr
End Function
</SCRIPT>
冷宫゛失宠妃

2024-06-30 00:35:45

把文字用标签<p>文字</p>括起来就好了,获得到标签就获得到里面的文字了
理想三旬

2024-06-30 00:39:43

不知道你做什么用,如果是内容调用可以用document.all.innerHTML()
如果是采集内容有什么软件可以帮你实现
查理的天使

2024-06-30 00:20:57

document.all.innerHTML()
浅夏忆梦

2024-06-30 00:18:04

包括标签代码?