这个是需要观察你要匹配的资源的规律用java里的java.util.regex.Pattern和java.util.regex.Matcher给你个我写的例子啊 // 抓取文章标题 private String getTitle(String html) { String patternStrs = "<h1>([^</h1>]*)";//匹配的正则表达式 Pattern pattern = Pattern.compile(patternStrs); Matcher matcher = pattern.matcher(html); String str = ""; while (matcher.find()) { str = matcher.group(1); } return str; }在这个例子中因为我的所有的文章的标题都是用h1标签的,所以就去检查有没有h1标签就行了// 抓取文章内容 private String getContent(String html) { String patternStrs3 = "<P\\s*.*>([^</P>]*)"; Pattern pattern3 = Pattern.compile(patternStrs3); Matcher matcher3 = pattern3.matcher(html); StringBuffer str = new StringBuffer(""); while (matcher3.find()) { // System.out.println(matcher3.group()); str.append(matcher3.group()); } return str.toString(); }这个例子里是文章都在<p>标签里,道理跟上面一样楼主完全可以根据这两个例子写出来,主要还是要找出你的资源的匹配规律,要没规律,就很难匹配了