關鍵詞語義網;;知識管理;信息查詢
隨著人類社會進入新世紀,人類也進入了壹個全新的時代——知識經濟時代。隨著知識型企業的出現,知識逐漸成為第壹生產要素。如何通過對知識的有效管理,實現利益最大化,提升企業競爭力,已經引起了廣泛的關註。企業知識管理已經成為管理學者和企業管理者最為關註的話題之壹。
1知識管理
1.1知識管理的出現
所謂“知識經濟”,就是“知識經濟”。這壹術語來源於對知識和技術在經濟增長中的作用的充分認識,它體現了人力資本和技術中的知識是經濟發展的核心,強調了知識作為壹種資源在新的經濟和社會形態中的基本特征。就企業管理而言,知識管理的影響主要有四個方面:
(1)經濟全球化給組織(企業)帶來了巨大的壓力。
(2)知識密集型產業成為現代經濟增長的主導力量。對於傳統行業來說,“知識”將是維持現狀或實現創新的唯壹途徑。
(3)知識作為壹種獨立的生產要素,在各種要素的投入中占據主導地位,相應地,“知識工作者”在企業中的地位也在不斷強化。
(4)信息技術的快速發展和信息基礎設施的極大改善,為組織運作提供了與工業化時代本質不同的基礎環境。
在上述背景下,管理學家和企業管理者越來越認識到知識及其學習是企業(組織)競爭優勢的重要來源,“企業知識管理”也因此應運而生。
1.2存在的問題
互聯網上有超過數億用戶使用的數百億份文檔,其中許多都在企業或組織內部的內部網中。隨著網絡的不斷發展,這些為企業服務的文檔將會越來越多地出現在網絡上,因此我們有理由相信,未來企業對信息和知識的管理將會偏向於網絡。然而,當前基於網絡的知識管理系統存在明顯的缺點:
1)信息檢索
目前的信息檢索方法主要是基於關鍵詞而不是語義。顯然,這種方法的缺點是不能處理同義詞。造成這種結果的原因是傳統的基於關鍵詞的檢索只關註檢索與數據存儲的關系。這種檢索不涉及單詞的語義。
2)信息集成
目前,網絡上的信息整合主要依靠人工處理。造成這個問題的主要原因是目前的自動代理軟件無法處理以文本為代表的常識知識,它們無法處理分布式資源。
3)維護半結構化文件
目前,組織中的許多文檔都是半結構化的,但是維護這些信息的準確性和壹致性是很困難和耗時的,所以我們需要壹些自動機制來幫助我們自動監控錯誤。
1.3語義網在知識管理中的應用
以往的信息集成研究主要集中在如何集成不同的數據庫和知識庫,這些數據庫和知識庫是結構化的,因此這些集成方法不能適應互聯網上的半結構化數據。我們需要的知識管理工具必須整合分布在互聯網上的半結構化信息資源。
語義網是當前互聯網的延伸。語義網上的信息有很好的含義,使計算機和人類能夠更好地合作。語義網定義為機器能夠理解數據含義的下壹代互聯網,稱為語義網。語義網的目的是把互聯網變成壹個巨大的知識庫,不僅人可以理解,機器也可以理解。如果成真,可以想象這樣的互聯網會對我們的生活產生怎樣的影響。
2相關技術
2.1傳統知識表示方法
所謂的知識表示,實際上是對知識的描述,或者說是壹組約定,是計算機可以接受的用於描述知識的數據結構。知識表示的過程就是將知識編碼成某種數據結構的過程。知識的表達方式多種多樣,主要包括:①壹階謂詞邏輯表示;②生產表征;(3)盒子表征;④語義網絡表征;⑤腳本表示;⑥過程表征;⑦Petri網表示;8面向對象的表示等。
同樣的知識有很多種表達方式,但效果不壹樣。所以我們經常會把幾種表達方式用在壹起,達到優勢互補的效果。例如,壹階謂詞、產生式規則、框架和語義網絡已經被應用於知識管理系統的開發。隨著面向對象技術的發展,面向對象的知識表示方法也被應用到知識管理系統的設計中。
2.2語義網的框架
《提摩太書》Berners-Lee壹直致力於語義網技術的研究,並壹直關註著語義網技術的發展。在綜合語義網研究領域最新成果的基礎上,他提出了語義網模型。這個模型得到了語義網研究者的認可,圖1是Berners Lee提出的語義網層次結構圖。在圖1中,XML層作為語法層;Rdf(資源描述框架)層作為數據層;本體層(onto1本體層)作為語義層;邏輯層提供智能推理的規則;證明層支持代理之間的證據交換。
RDF是Resource Description Framework的縮寫,它提供了壹種描述元數據,尤其是Web元數據的技術。RDF Schema(簡稱RDFS)用於定義描述中使用的“主語”、“謂語”和“賓語”。在這裏,我們可以用面向對象的思想來比較它們之間的關系。如果說RDF是用來完成實際工作的對象,那麽RDF Schema就是用來定義對象的類。
RDF用三元組來描述資源,包括“主語”、“謂語”和“賓語”。描述三元組的方法有很多,其中最重要的是XML。XML描述的好處是既能讓人理解,又能讓機器自動處理。更重要的是,它可以在網絡上自由互動。
RDFS采用面向對象的機制來定義RDF詞匯,也就是說,我們需要定義的類都是預定義的rdfs:Resource的子類,或者是我們已經定義好的壹個類的子類。這樣做的好處是,任何人都可以利用已有的詞匯來定義新的詞匯,從而大大節省了工作量,成為面向對象中重用思想的壹個體現。
2.4本體和OWL
本體論的概念最初起源於哲學領域,可以追溯到公元前的古希臘哲學家亞裏士多德。它在哲學上被定義為“對世界上客觀存在的系統描述,即本體論”,是對客觀存在的系統解釋或說明,關心客觀現實的抽象本質。近年來,計算機領域本體研究成果的數量和質量都在逐漸增加。並且在1998年6月召開了第壹屆本體論國際會議——“信息系統形式本體論國際會議”,標誌著這壹研究領域正在走向繁榮和成熟。
語義網是對未來網絡的壹種設想,其中信息被賦予明確的意義,機器可以自動處理和整合互聯網上可用的信息。語義網使用XML來定義定制的標簽格式,並使用RDF的靈活性來表達數據。下壹步需要的是壹種本體網絡語言(比如OWL)來描述網絡文檔中術語的明確含義以及它們之間的關系。