问题描述
在尝试爬取小说时,发现爬取到的正文格式是正确的,但是章节列表会出现乱码,经过仔细搜索终于解决,特此记录

##源代码
1 | req = requests.get(url=self.target) |
解决方案
确定当前网页的编码格式,可以在控制台中查看,在console中输入
1 | document.charset |
下图可以看出,该网页是采用GBK编码

添加代码,将编码格式设置为对应的编码格式
1 | req = requests.get(url=self.target) |
问题解决

在尝试爬取小说时,发现爬取到的正文格式是正确的,但是章节列表会出现乱码,经过仔细搜索终于解决,特此记录
##源代码
1 | req = requests.get(url=self.target) |
1 | document.charset |
下图可以看出,该网页是采用GBK编码
1 | req = requests.get(url=self.target) |