古詩詞大全網 - 成語經典 - unicode編碼是什麽?

unicode編碼是什麽?

Unicode是壹種字符編碼方案,它為每種語言中的每個字符都設定了統壹唯壹的二進制編碼,以實現跨語言、跨平臺進行文本轉換、處理的要求。

Unicode是國際組織制定的可以容納世界上所有文字和符號的字符編碼方案。目前的Unicode字符分為17組編排,0x0000至0x10FFFF,每組稱為平面(Plane),而每平面擁有65536個碼位,***1114112個。

主要內容

為了使Unicode與已存在和廣泛使用的舊有編碼互相兼容,尤其是差不多所有電腦系統都支援的基本拉丁字母部分,所以Unicode的首256字符仍舊保留給ISO8859-1所定義的字符,使既有的西歐語系文字的轉換不需特別考量。

另方面因相同的原因,Unicode把大量相同的字符重復編到不同的字符碼中去,使得舊有紛雜的編碼方式得以和Unicode編碼間互相直接轉換,而不會遺失任何資訊。

舉例來說,全角格式區段包含了主要的拉丁字母的全角格式,在中文、日文、以及韓文字形當中,這些字符以全角的方式來呈現,而不以常見的半角形式顯示,這對豎排文字和等寬排列文字有重要作用。