python - Notepad2與PyCharm區別
問題描述
同樣的代碼在 Notepad 環境(測試過記事本)過不了,在 Pycharm 可以過( Python3.5 )代碼:
import urllibimport urllib.requesturl = 'http://www.baidu.com'data = urllib.request.urlopen(url).read()data = data.decode(’UTF-8’)
這條語句,兩個環境都可以過
data.decode(’gbk’, ’ignore’).encode(’UTF-8’)print(data)
在 Pycharm 顯示爬出的網頁,在 cmd 窗口顯示
UnicodeEncodeError: ’gbk’ codec can’t encode character ’xbb’ in position 26830:illegal multibyte sequence
必須去除無效字符。
import urllibimport urllib.requesturl = 'http://www.baidu.com'data = urllib.request.urlopen(url).read()data.decode(’gbk’, ’ignore’).encode(’UTF-8’)print(data)
這樣可以過,求解釋
問題解答
回答1:你遇到的可能和我一樣是python編碼問題,或者使用的terminal的編碼支持問題。看看下面的問題。
【python編碼問題?】分享自@SegmentFault,傳送門:/q/10...
相關文章:
1. node.js - nodejs+express+vue2. javascript - vue2.0中使用vue2-dropzone的demo,vue2-dropzone的github網址是什么??百度不到。3. objective-c - ios 怎么實現微信聯系列表 最好是swift4. vue計算屬性怎么樣與for結合使用5. angular.js - vue/react 渲染內容抖動6. PHP能實現百度網盤的自動化么?7. Python 子類能否覆蓋全局函數?8. mysql - sql 找出2個數據庫的差異表名9. javascript - vue上傳圖片,并顯示在頁面中的插件10. kv存儲 - 怎樣用 Redis 緩存微博的評論列表?
