正则表达式问题！获取HTML标记内的内容！

我想在一段网页代码中查找所有的超链接标记<a>的内容，
表达式是：<a.*>.*<\/a>；如果想仅仅获取<a>与</a>之间的内容，也就是用非获取匹配，我写的表达式是：(?=<a.*>).*(?=<\/a>)但为什么获取的结果却包括了<a>的开始标记？错在哪里？正确的应该怎么写？有什么建议？