python 网页爬虫怎么抓多页内容

想抓网页上的内容，但页面有多页，怎么抓都只能抓到一个页面的内容，怎么实现把所有页面都抓出来，求大神指教。自己写的下面这样的，python3的

import urllib.request
import re

def getHtml(url):
page = urllib.request.urlopen(url)
html = page.read()
html = html.decode('GBK')
return html

def getMeg(html):
reg = re.compile(r'******')
meglist = re.findall(reg,html)
for meg in meglist:
with open('out.txt',mode='a',encoding='utf-8') as file:
file.write('%s\n' % meg)

if __name__ == "__main__":
html = getHtml(url)
getMeg(html)

最新回答

最初

2024-09-22 11:58:46

先抓包分析链接，得出规律后request请求，然后获取相应并对其进行解析
然后就是数据的处理和存储了
如果网站不加密且没有反爬手段的话，还是很简单的

浪漫尽失

2024-09-22 07:05:01

用url请求抓取页面

谁都逃不过

2024-09-22 14:02:22

先在第一页捉取网页链接，存放在数据库，然后一个个从数据库读取来打开下一个网页。

萌面人

2024-09-22 20:27:18

对应的换掉地址

我要回答

匿名回答

python 网页爬虫怎么抓多页内容

您可能感兴趣问答

Collapsible

热门标签

热点问答