1.另存為記事本時,您可以選擇幾種編碼模式來保存文本,即:
ANSI:默認保存的編碼格式采用本地操作系統的默認內碼,簡體中文壹般為GB2312。
Unicode: UTF-16,加上BOM簽名:0xFFFE。
Unicode bigendian:Unicode編碼:UTF-16的bigendian字節順序,加上BOM簽名:0xFEFF。
UTF-8:編碼格式為UTF-8,其BOM為0xEF BB BF(UTF-8不區分字節順序,此BOM只標記UTF-8編碼)。
Python應該在讀取txt文件時將其解碼成unicode代碼。
def read _ out(self):with codecs . open(self . filename,' r+') as get: return get.read()。解碼(“gbk”)
然後在編寫時將其編碼成相應的想要的編碼類型,這樣可以保證源文件的編碼方式不會改變,中文不會亂碼。
整個代碼過程保持使用unicode編碼方式,使用try…except判斷具體使用哪種編碼方式。
f . write(self . filename . encode(' gbk '))
其次,raw_input通過鍵盤輸入的文本由sys模塊中的stdin.encodeing解碼。
內容=原始輸入()。解碼(sys.stdin.encoding)
類型(內容)?Unicode暫時就這麽多了。