古詩詞大全網 - 四字成語 - 中華字庫工程的項目簡介

中華字庫工程的項目簡介

項目名稱:中華字庫工程

項目編號:0610-1041BJNF2328

項目單位名稱:中華人民***和國新聞出版總署

“中華字庫”工程以對文字學深入研究為基礎,充分利用新技術,開發相應的軟件工具,探索人-機結合的文字收集、整理、篩選、比對和認同的操作與管理流程,從數千年流傳下來的文字載體中盡可能將所有出現過的漢字形體和少數民族文字形體匯聚起來,建立字際聯系,最終按照出版印刷及網絡數字化需求,制作出符合各種應用需求的漢字及少數民族文字的編碼及主要字體字符庫。

“中華字庫”工程是引領中華文化步入信息化、數字化時代的先導性、奠基性工程,目的是要“建立全部漢字及少數民族文字的編碼和主要字體字符庫。重點研發漢字的編碼體系、輸入、輸出、存儲、傳輸以及兼容等關鍵技術”。完成後的“中華字庫”,預計可編碼字符數在50萬左右(漢字古文字約10萬、楷書漢字約30萬、各少數民族文字約10萬),力爭達到能對我國所有的出土、傳世文獻和當代文字作品進行數字化處理,全面打通信息化的發展瓶頸,使中華各民族文字的使用,中華文明的普及與傳播,更加方便和高效。

“中華字庫”工程還研發超大規模字庫的輸入輸出、存儲傳播以及相互兼容等關鍵技術。完成後的“中華字庫”能對中國各種出土、傳世文獻和當代文字作品進行數字化處理,也能夠滿足社會數字化服務和數字化監管需求,如國土資源管理、公民身份管理等。

“中華字庫”工程由中國出版集團公司牽頭組建總體組。工程***分為28個包,預計5年內完成。有近30家高校、研究院所和企業參與了“中華字庫”工程的研發工作。

“中華字庫”工程研發工作啟動大會2011年7月26日在京舉行 ,這標誌著“中華字庫”工程從籌備階段正式進入全面研發建設階段。