问题描述
在尝试爬取小说时,发现爬取到的正文格式是正确的,但是章节列表会出现乱码,经过仔细搜索终于解决,特此记录
 
##源代码
| 1 | req = requests.get(url=self.target) | 
解决方案
确定当前网页的编码格式,可以在控制台中查看,在console中输入
| 1 | document.charset | 
下图可以看出,该网页是采用GBK编码
 
添加代码,将编码格式设置为对应的编码格式
| 1 | req = requests.get(url=self.target) | 
问题解决
 
      
    在尝试爬取小说时,发现爬取到的正文格式是正确的,但是章节列表会出现乱码,经过仔细搜索终于解决,特此记录
 
##源代码
| 1 | req = requests.get(url=self.target) | 
| 1 | document.charset | 
下图可以看出,该网页是采用GBK编码
 
| 1 | req = requests.get(url=self.target) | 
