python 网页爬虫怎么抓多页内容

想抓网页上的内容,但页面有多页,怎么抓都只能抓到一个页面的内容,怎么实现把所有页面都抓出来,求大神指教。自己写的下面这样的,python3的

import urllib.request
import re

def getHtml(url):
page = urllib.request.urlopen(url)
html = page.read()
html = html.decode('GBK')
return html

def getMeg(html):
reg = re.compile(r'******')
meglist = re.findall(reg,html)
for meg in meglist:
with open('out.txt',mode='a',encoding='utf-8') as file:
file.write('%s\n' % meg)

if __name__ == "__main__":
html = getHtml(url)
getMeg(html)
最新回答
最初

2024-09-22 11:58:46

先抓包分析链接,得出规律后request请求,然后获取相应并对其进行解析
然后就是数据的处理和存储了
如果网站不加密且没有反爬手段的话,还是很简单的
浪漫尽失

2024-09-22 07:05:01

用url请求抓取页面
谁都逃不过

2024-09-22 14:02:22

先在第一页捉取网页链接,存放在数据库,然后一个个从数据库读取来打开下一个网页。
萌面人

2024-09-22 20:27:18

对应的换掉地址