[Python][爬虫] 爬出的内容如图，编码方式是'ascii'，那其中的中文字节去哪儿了？求教这种要怎么处理？

如题所述

举报该问题

推荐答案 2016-06-13

Pythonä»£ç éçä¸æ
ä»£ç ç¬¬ä¸è¡ï¼å¦ææèæ¬æ è®°åæ¯ç¬¬äºè¡ï¼å¯ä»¥æç§PEP8å½¢å¼æå®æ¬ä»£ç æä»¶çç¼ç ç±»åãè¥ä¸æå®åæç§asciiï¼py2.xï¼æutf-8ï¼py3ï¼

ä½ éè¦äºè§£çåå®¹
æ¸æ¥ç¥éåå«ä¸æçæä»¶æ¯ç¨çä»ä¹ç¼ç
æ¸æ¥ç¥éèªå·±è¾åºç«¯ï¼å½ä»¤è¡ï¼htmlï¼GUIï¼ï¼ç¨ä»ä¹ç¼ç
æ¸æ¥ç¥éç¼ç çåºæ¬ç¥è¯

ä½ éè¦çpythonç¸å³åå®¹
ä»¥python2.7.xä¸ºä¾ï¼
print/file.writeçå®è´¨ä¸åªè¾åºstrå¯¹è±¡ï¼å¦æè¾åºåå®¹ä¸æ¯strå¯¹è±¡ï¼åä½¿ç¨strå½æ°è¿è¡è½¬æ¢
strå½æ°æ¯ä¸ªå£³ï¼å®è´¨æ¯è°ç¨å¯¹è±¡æ¹æ³__str__
encodeå½æ°æ¯å°ä¸ä¸ªunicodeç±»æç§æå®çç¼ç ï¼å¦æä¸æå®åä½¿ç¨defaultencodingï¼è½¬æ¢ä¸ºä¸å¸¦ç¼ç æ è®°çstrç±»
decodeå½æ°æ¯å°ä¸ä¸ªstrç±»æç§æå®ç¼ç ï¼å¦æä¸æå®åä½¿ç¨defaultencodingï¼è½¬æ¢ä¸ºä½¿ç¨utf-8ç¼ç çunicodeç±»
ç´æ¥printä¸ä¸ªå®¹å¨ï¼dict/list/tupleï¼çæ¶åä¸ä¼å¯¹å¶ä¸çåç¬¦ä¸²è¿è¡ç¼ç ï¼å æ¤çå°çéasciiåç¬¦éåå®¹å°ä¼ä»¥\xAAæè\uAAAAä¹ç±»çå½¢å¼è¾åº

Python3ä¸ï¼strè¡ä¸ºä¸py2çunicodeè¡ä¸ºä¸è´ï¼bytesè¡ä¸ºä¸py2çstrè¡ä¸ºä¸è´ãè¿½é®

éå¸¸æè°¢æ¨çåçãä¹åä¸ç´è§å¾å¯¹äºç¬è«æ¥è¯´ä¸è¾¹åä¸è¾¹å¦ä¼æ´ææçï¼ç°å¨æ¥çè¿æ¯éè¦è¡¥åäºçè®ºç¥è¯ï¼æè½ä¸è¿äºç²ç®ã

温馨提示：答案为网友推荐，仅供参考

当前网址：http://11.wendadaohang.com/zd/SMMSPvvPPMSFSM4FvS.html

第1个回答 2016-06-13

贴代码，贴这玩意有啥用

相似回答

python爬虫,读取本地html时编码报错:UnicodeDecodeError...答：Beautiful Soup自动将输入文档转换为Unicode编码，输出文档转换为utf-8编码。你不需要考虑编码方式，除非文档没有指定一个编码方式，这时，Beautiful Soup就不能自动识别编码方式了。然后，你仅仅需要说明一下原始编码方式就可以了。python3 区分了 unicode str 和 byte arrary，并且默认编码不再是 ascii 关于...

大家正在搜

汉字内码的编码方式常用的编码方式有哪几种 python为什么叫爬虫爬虫可以爬付费内容吗爬虫可以爬到用户的什么信息四种编码方式字段直接编码方式 java编码方式如何用python爬数据

python爬虫抓下来的网页，中间的中文乱码怎么解决

python 爬虫中文编码转换出错

python爬虫，读取本地html时编码报错：Unicode...

python爬虫，为什么爬出来没有东西，求大佬教下

python3爬虫爬出的文本如何去掉\n\xa0

python2和python3的区别

python爬虫项目要做多久，你们都是去哪儿找的项目？