文件格式(HTML)网址格式如下:http://AAA.abc.com/http://img.abc.com/images/01.jpg要求返回结果:AAA或者http://AAA.abc.com/在线等。。。
import repatt = re.compile(r'(http://[0-9a-z\.]+)/.*',re.I|re.X)print patt.findall('''http://AAA.abc.com/http://img.abc.com/images/01.jpg''')>>> ['http://AAA.abc.com', 'http://img.abc.com']