如何用正则表达式提取网址?

文件格式(HTML)
网址格式如下:
http://AAA.abc.com/

http://img.abc.com/images/01.jpg

要求返回结果:
AAA
或者
http://AAA.abc.com/


在线等。。。
最新回答
甜味拾荒者

2024-05-12 02:17:37

import re
patt = re.compile(r'(http://[0-9a-z\.]+)/.*',re.I|re.X)
print patt.findall('''
http://AAA.abc.com/

http://img.abc.com/images/01.jpg

''')

>>> ['
http://AAA.abc.com
', '
http://img.abc.com
']