如果使用正则截取网页中的charset编码

比如:<meta http-equiv=Content-Type content="text/html;charset=gb2312">
或者
<meta http-equiv=Content-Type content=text/html;charset=gb2312>
也或者
<meta http-equiv=Content-Type content="text/html;charset=gb2312"/>

这里有要一个通用的正则表达式,截取charset中的值

String regx = ""; //这里正则怎么写?

Pattern p = Pattern.compile(regx);

Matcher m = p.matcher(body);

System.out.println(m.replaceAll(""));
最新回答
释放

2024-10-13 10:19:46

在工具上验证可行:
<meta[^>]*charset="?(.+)"?>

用的话,记得转意。或者加"@"