python网页爬取

时间:2026年02月07日 13:23:16

python使用requests爬取网页出现中文乱码-百度经验

发布时间:2017-03-12    点赞人数:21.演示代码如下,在爬取中文网页时,会发现返回结果中的中文为乱码。2.在浏览器中,在待爬取网页上右键单击,选择“查看页面源代码”。可以在HEAD中看到页面的编码为‘GBK’。3.在代码中添加一行,指定requests对象encoding值为‘GBK’。jingyan.baidu.com