古詩詞大全網 - 成語故事 - 本體論詳細資料大全

本體論詳細資料大全

本體論(Ontology),是探究世界的本原或基質的哲學理論。“本體論”壹詞是由17世紀的德國經院學者郭克蘭紐(Goclenius,1547-1628)首先使用的。此詞由ont(?ντ)加上表示“學問”、“學說”的詞綴——ology構成,即是關於ont的學問。ont源出希臘文是on(?ν)的變式,相當於英文的being;也就是巴門尼德(Parmenides)的“存在”。

基本介紹 中文名 :本體論 外文名 :Ontology 首先使用 :德國經院學者郭克蘭紐 時間 :17世紀 哲學概念,研究歷程,其他領域,構建本體,簡介,步驟,基本問題,概況,存在論歷史,觀念,物體,聯系,實體和環境,存在, 哲學概念 對本體論這個詞的定義雖有各種不同,但壹般對它還是有壹定的理解。大體上說,馬克思主義以前的哲學所用的本體論有廣義和狹義之別,馬克思主義之後哲學融入實踐。 從廣義說,它指壹切實在的最終本性,這種本性需要通過認識論而得到認識,因而研究壹切實在最終本性為本體論,研究如何認識則為認識論,這是以本體論與認識論相對稱。 從狹義說,則在廣義的本體論中又有宇宙的起源與結構的研究和宇宙本性的研究之分,前者為宇宙論,後者為本體論,這是以本體論與宇宙論相對稱。 馬克思主義哲學不采取本體論與認識論相對立、或本體論與宇宙論相對立的方法,而以辯證唯物主義說明哲學的整個問題。 (來源於馮契主編《外國哲學大辭典》) 研究歷程 “本體”的研究,在希臘哲學史上有其淵源。從米利都學派開始,希臘早期哲學家就致力於探索組成萬物的最基本元素——“本原”(希臘文arche,舊譯為“始基”)。對此“本原”的研究即成為本體論的先聲,而且逐步逼近於對being 的探討。之後的巴門尼德深刻地提出,“是以外便無非是,存在之為存在者必壹,這就不會有不存在者存在”。並且認為存在永存不變,僅有思維與之同壹,亦僅有思維可以獲致此真理;而從感覺得來者僅為意見,從意見的觀點看,則有存在和非存在,存在既非壹從而有變滅。 巴門尼德對being(是,存在)的探討, 建立了本體論研究的基本方向:對於被“是者”所分有的“是”,僅只能由思維向超驗之域探尋,而不能由感覺從經驗之中獲取;此在超驗之域中尋得之“是”,因其絕對的普遍性和本原性,必然只能是壹。不過,這壹點只有蘇格拉底和柏拉圖才能真有領會,與他同時的希臘哲人或多或少地有所忽略。因而,如原子論者雖然也區分了真理認識和暗昧認識,認識到思維與感覺的不同,但是其探尋的“本原”可否由經驗獲致卻極模糊,因而實際上並未能區分超驗和經驗。而在蘇格拉底那些沒有最終結論的對話中,已破除了經驗歸納方法獲取真理的可能性;在柏拉圖的理念論中,則鮮明地以超驗世界的“理念”為真理之根本。 在古希臘羅馬哲學中,本體論的研究主要是探究世界的本原或基質。各派哲學家力圖把世界的存在歸結為某種物質的、精神的實體或某個抽象原則。巴門尼德提出了唯壹不變的本原“存在”,使關於存在的研究成為這壹時期的主題。亞裏士多德認為哲學研究的主要對象是實體,而實體或本體的問題是關於本質、***相和個體事物的問題。他認為研究實體或本體的哲學是高於其他壹切科學的第壹哲學。從此,本體論的研究轉入探討本質與現象、***相與殊相、壹般與個別等的關系。在西方近代哲學中,笛卡爾首先把研究實體或本體的第壹哲學叫做“形上學的本體論”。 17~18世紀,萊布尼茨及其繼承者沃爾夫試圖通過純粹抽象的途徑建立壹套完整的、關於壹般存在和世界本質的形上學,即獨立的本體論體系。沃爾夫把壹般、普遍看作是脫離個別、單壹而獨立存在的本質和原因。康德壹方面認為建立抽象本體論的形上學不可能,本體論要強研究的只能是事物的普遍性質及物質的存在與精神存在之間的區別;另壹方面又用與認識論相割裂的、先驗的哲學體系來代替本體論。黑格爾在唯心主義基礎上提出了本體論、認識論和邏輯學統壹原則,並從純存在的概念出發構造了存在自身辯證發展的邏輯體系。 在現代西方哲學中,壹些流派(實證主義、分析哲學、科學哲學等)反對任何形上學和本體論,也有些人試圖重新建立關於存在學說的本體論,如胡塞爾的“先驗的本體論”、海德格爾的“基本本體論”、哈特曼的“批判本體論”等,他們往往借助於超感覺和超理性的直覺去建立概念體系,其觀點帶有唯心主義或不可知論,且往往同錯誤的社會觀點相聯系,為宗教哲學所支持。 本體論研究 在中國古代哲學中,本體論叫做“本根論”,它指探究天地萬物產生、存在、發展變化根本原因和根本依據的學說。中國古代哲學家壹般都把天地萬物的本根歸結為無形無象的與天地萬物根本不同的東西,這種東西大體可分為三類: (1)沒有固定形體的物質,如“氣”; (2)抽象的概念或原則,如“無”、“理”; (3)主觀精神,如“心”。這三種觀點分別歸屬於樸素唯物主義、客觀唯心主義和主觀唯心主義。在中國哲學史的研究中,有些學者用“本體論”壹詞專指那種在物質世界之外尋找物質世界存在依據的唯心主義學說,如魏晉時期王弼的貴無論。 其他領域 本體論(ontology)是哲學概念,它是研究存在的本質的哲學問題。近幾十年裏,這個詞被套用到計算機界,並在人工智慧、計算機語言以及資料庫理論中起到越來越重要的作用。然而,到目前為止,對於本體論,還沒有統壹的定義和固定的套用領域。史丹福大學的Gruber給出的定義得到了許多同行的認可,即本體論是對概念化的精確描述(Gruber,1995),本體論用於描述事物的本質。 在實現上,本體論是概念化的詳細說明,壹個ontology往往就是壹個正式的辭匯表,其核心作用就在於定義某壹領域或領域內的專業辭匯以及他們之間的關系。這壹系列的基本概念如同工程壹座大廈的基石,為交流各方提供了壹個統壹的認識。在這壹系列概念的支持下,知識的搜尋、積累和***享的效率將大大提高,真正意義上的知識重用和***享也成為可能。就此意義而言,Web語言XML(Extensible Markup Language,可擴展標識語言)就是本體理論的壹項典型套用;.xml文檔就是壹個標簽化的辭匯表。 本體論可以分為四種類型:領域、通用、套用和表示。領域本體包含著特定類型領域(如電子、機械、醫藥、教學)等的相關知識,或者是某個學科、某門課程中的相關知識;通用本體則覆蓋了若幹個領域,通常也稱為核心本體;套用本體包含特定領域建模所需的全部知識;表示本體不只局限於某個特定的領域,還提供了用於描述事物的實體,如“框架本體”,其中定義了框架、槽的概念。可見,本體論的建立具有壹定的層次性,在教學領域而言,如果說某門課程中的概念、術語及其關系看成是特定的套用本體,那麽所有課程中的***同的概念和特征則具有壹定的通用性。 Ontology這個哲學範疇,被人工智慧界賦予了新的定義,從而被引入信息科學中。然而信息科學界對 Ontology的理解也是逐步發展才走向成熟的。1991年Neches等人最早給出Ontology在信息科學中的定義:“給出構成相關領域辭匯的基本術語和關系,以及利用這些術語和關系構成的規定這些辭匯外延規則的定義。”後來在信息系統、知識系統等領域,隨著越來越多的人研究Ontology,產生了不同的定義。1993年Gruber定義Ontology 為“概念模型的明確的規範說明”。1997年Borst進壹步完善為“***享概念模型的形式化規範說明”。Studer等人對上述兩個定義進行了深入研究,認為Ontology是***享概念模型的明確的形式化規範說明,這也是目前對Ontology概念的統壹看法。 Studer等人的Ontology定義包含四層含義:概念模型(Conceptualization)、明確(Explicit)、形式化(Formal)和***享(Share)。“概念模型”是指通過抽象出客觀世界中壹些現象(Phenomenon)的相關概念而得到的模型,其表示的含義獨立於具體的環境狀態;“明確”是指所使用的概念及使用這些概念的約束都有明確的定義;“形式化”是指Ontology是計算機可讀的,也就是計算機可處理的;“***享”是指Ontology中體現的是***同認可的知識,反映的是相關領域中公認的概念集,它所針對的是團體而非個體。Ontology的目標是捕獲相關領域的知識,提供對該領域知識的***同理解,確定該領域內***同認可的辭匯,並從不同層次的形式化模式上給出這些辭匯(術語)和辭匯之間相互關系的明確定義。 盡管定義有很多不同的方式,但是從內涵上來看,不同研究者對於Ontology 的認識是統壹的,都把它當作是領域(領域的範圍可以是特定套用中,也可以是更廣的範圍。)內部不同主體(人、機器、軟體系統等)之間進行交流(對話、互操作、***享等)的壹種語義基礎,即由Ontology提供壹種***識。而且Ontology提供的這種***識更主要的是為機器服務,機器並不能像人類壹樣理解自然語言中表達的語義,目前的計算機也只能把文本看成字元串進行處理。因此,在計算機領域討論Ontology,就要討論如何表達***識,也就是概念的形式化問題。 Semantic Web中的Ontology? Ontology研究熱點的出現還與Semantic Web的提出和發展直接相關。 Semantic Web是Tim Berners-Lee提出的又壹個概念。Tim Berners-Lee認為,當前的Web是供人閱讀和理解的,它作為壹個越來越大的檔案媒體,並不利於實現數據和信息的自動化處理。新壹代的Semantic Web 將不僅僅為人類而且能為計算機(信息代理)帶來語義內容,使計算機(或信息代理)能夠“理解”Web內容,進而實現信息處理的自動化。他認為Semantic Web不是與當前Web隔離的另壹個Web,而是對當前Web的擴充,在Semantic Web中,信息的語義經過完好的定義,能夠更好地促進計算機和人之間的相互合作。 為了實現Semantic Web的功能,需要提供壹種計算機能夠理解的、結構化的語義描述機制,以及壹系列的推理規則以實現自動化推理。Semantic Web的挑戰在於提供壹種語言,它能夠表述數據和在數據中進行推理的規則,而且需要這種語言能夠將目前存在於知識表述系統之中的規則能夠被套用到Web上。 在Tim Berners-Lee的Semantic Web框架中,有幾個關鍵的組成元素。它們分別是XML,RDF(S)和 Ontology。XML允許用戶定義自己的檔案類型,允許用戶定義任意復雜的信息結構,但是XML只具有語法性,它不能說明所定義的結構的語義。XML之所以在Semantic Web中處於重要的地位與XML是壹種載體語言、XML命名機制等有很大的關系。 在Tim Berners-Lee看來,語義的描述是通過RDF進行的。RDF的兩個特性對此有著特殊的貢獻: (1)RDF是壹種由資源、屬性、屬性值組成的三元結構。這種三元結構形似句子中的主語、謂語、賓語之間的關系。壹個描述資源的RDF語句,就如同“某件事具有什麽樣的屬性”這樣的句子壹樣有效。它能夠表明壹種對事物存在狀態的斷言,可以表述大多數情況下計算機需要處理的知識。 (2)RDF的另壹個重要特點就是組成RDF的資源、屬性、屬性值這三個元素都必須是被URI(統壹資源標識)所標識的。由於RDF利用 URI 來對信息進行編碼,它意味著被RDF所引用的任何資源、屬性和屬性值都是經過預先定義的、不具二意性的概念。 由於RDF能夠表示陳述句,並且主語、謂語和賓語的三個組成元素都是通過URI所標識的,故它具有語義表述的特性。但Semantic Web的要求還遠不止於此,Semantic Web還需要加入邏輯功能:Semantic Web需要能夠利用規則進行推理、選擇行動路線和回答相關問題。Ontology是Semantic Web實現邏輯推理的基礎。? Semantic Web研究者也認為,Ontology是壹個形式化定義語詞關系的規範化檔案。對於Semantic Web而言,最典型的Ontology具有壹個分類體系和壹系列的推理原則。其中,分類體系定義對象的類別和類目之間的關系。實體之間的類/子類關系對於Web套用具有重要的價值。在Ontology中,還可以為某個類添加屬性來定義更多的類目關系。這些類目關系提供了的推理的基礎。 借助Ontology中的推理規則,Semantic Web套用系統可以提供更強的推理能力,例如可以在壹個地理Ontology中加入這樣壹條規則,“如果壹個城市代碼與壹個省代碼相關,並且壹個地址利用了城市代碼,那麽這個地址與就與相應的省代碼相關”。通過這壹規則,程式可以推理出中國科學院文獻情報中心,在中關村,應當在北京市。 本體論 Semantic Web研究者為了實現對Ontology的描述,在RDF的基礎之上,發展了RDFS。RDFS借助幾個預先義的語詞(如 rdfs: Resource, rdfs: Class, rdf: Property, rdfs: subClassOf, rdfs: subPropertyOf, rdfs: domain, rdfs: range)能夠對概念之間的關系進行有限的描述。為了更方便全面地實現Ontology 的描述,W3C在 RDFS的基礎之上,借助了DAML和OIL的相關研究,正在積極推進OWL(Web Ontology Language)的套用。自2004年2月10日,OWL已經成為了壹個W3C推薦的標準。 Gene Ontology 為了查找某個研究領域的相關信息,生物學家往往要花費大量的時間,更糟糕的是,不同的生物學資料庫可能會使用不同的術語,好比是壹些方言壹樣,這讓信息查找更加麻煩,尤其是使得機器查找無章可循。Gene Ontology(GO)就是為了解決這種問題而發起的壹個項目。 Gene Ontology中最基本的概念是 term 。GO裏面的每壹個entry都有壹個唯壹的數字標記,形如 GO: nnnnnnn,還有壹個term名,比如 "cell","fibroblast growth factor receptor binding",或者 "signal transduction"。每個term都屬於壹個ontology,總***有三個ontology,它們分別是molecular function, cellular component和biological process。 壹個基因product可能會出現在不止壹個cellular component裏面,也可能會在很多biological process裏面起作用,並且在其中發揮不同的molecular function。比如,基因product "cytochrome c" 用molecular function term 描述是"oxidoreductase activity",而用biological process term 描述就是"oxidative phosphorylation" 和"induction of cell death",最後,它的celluar component term是 "mitochondrial matrix" 和 "mitochondrial inner membrane"。 Gene Ontology中的term有兩種相互關系,它們分別是is_a關系和part_of關系。is_a關系是壹種簡單的包含關系,比如A is_a B 表示A是B的壹個子集。比如 nuclear chromosome is_a chromosome。part_of關系要稍微復雜壹點,C part_of_D意味著如果C出現,那麽它就肯定是D的壹部分,但C不壹定總會出現。比如nucleus part_of cell,核肯定是細胞的壹部分,但有的細胞沒有核。 Gene Ontology的結構是壹個有向無環圖,有點類似於分類樹,不同點在於Gene Ontology 的結構中壹個 term可以有不止壹個parent。比如biological process term "hexose biosynthesis" 有兩個parents,它們分別是 "hexose metaboli *** "和"monosaharide biosynthesis",這是因為生物合成是代謝的壹種,而己糖又是單糖的壹種。 Gene Ontology使用Oxford Dictionary of Molecular Biology(1997)中的定義,在分選時還要參考SWISS-PROT, PIR, NCBI CGAP, EC…中的註釋。建立起來的標準不是唯壹的標準(這是GOC所壹直強調的),自然也不規定每個研究者必須遵循這套控制字集系統。所采用的動態結構(dynamic structure)使用DAGs(Directed Acyclic Graphs)方式的neork,將每壹個ontology串連起來,形成樹狀結構(hierarchical tree),也就是由前面所說的“is a”和“part of”兩種關系。 由於 GO 是壹種整合性的分類系統,其下的三類主ontology我們前面說是獨立的,但是無論是GOC原初的設計還是我們的使用中其實都還是存在壹定的流程關系。壹個基因/蛋白質或者壹個ontology在註解的過程中,首先是考慮涉及在構成細胞內的組分和元件(cellular component),其次就是此組分/元件在分子水平上所行使的功能(molecular function),最後能夠呈現出該分子功能所直接參與的生物過程(biological process)。由於這是壹種存在反饋機制的註釋過程,並且整個系統是動態開放實時更新的,因此在某種程度上說它具有糾錯的能力。 TAMBIS計畫是目前唯壹實現了在概念和聯系層次上集成信息源的系統。但是還有其他壹些相關計畫正在研究之中。比如BioKleisli(賓夕法尼亞大學計算機系),采用Mediator(調節器)技術實現了若幹數據源的集成,其後的K2/Kleisli系統還利用數據倉庫實現了OLAP(在線上分析處理)。 DiscoveryLink(IBM研究院),基於Wrapper/Mediator(包裝器/調節器)實現了信息源集成,提出了查詢的分解和基於代價的最佳化策略。 TAMBIS(曼徹斯特大學計算機系)基於Wrapper/Mediator實現了信息源集成,借助BioKleisli中的CPL語言作為查詢語言並給出了查詢最佳化的方法。通過TaO(TAMBIS Ontology)本體定義為用戶瀏覽和查詢處理提供領域知識。 TINet(GSK公司和IBM研究院),基於多資料庫中間件OPM(Object-Protocol Model,對象協定模型)定義數據源的對象視圖,其CORBA(Common Object Request Broker Architecture,公***對象請求代理體系結構)伺服器使各數據源Wrapper(包裝器)更易於擴充。 但是他們都存在壹定的缺陷。BioKleisli系統查詢能力相對較弱,而且並未給出查詢最佳化策略;TAMBIS系統和 DiscoveryLink系統集成的數據源數量相對還很少,後者在查詢處理中並未運用領域知識,因而查詢分解也未從語義角度考慮;TINet系統中的查詢處理能力不強。 現在面臨的突出問題是在資料庫查詢中尤其是當多個資料庫存在信息重疊時,缺乏從中選擇最佳檢索成員,動態生成最佳化檢索方案的能力。而且現有的工作主要面向數據集成,而對服務集成考慮不多。支持數據與服務綜合性集成的體系仍欠完備。因此這也將是GO未來發展和提升的壹個重要方向。 本體論 構建本體 簡介 在實際的套用中,本體論學者、知識管理、人工智慧、情報學(圖書館學)甚至任何壹個具有大量需要歸類和劃分信息的部門及領域都可以成為本體論的套用對象。本體論的基本元素是辭匯(term)/概念(concept),轉而構成同質化的類(class)和子類(sub-class),然後各個類和概念之間加入了適合的關系(relation)後,形成了壹個簡單的本體。概念和類皆用來表達辭匯本身,而關系則為辭匯提供連線(mapping),並加入限制條件(constraint),使之與現實情況相符合。 構建本體最為常用的軟體是由史丹福大學開發的Protege,最初是套用在醫學領域,後來被逐漸的擴展至其它領域,該軟體本身也是壹個開源軟體。 步驟 構建本體的簡單步驟: 1. 列出研究課題所涉及到的詞條(terms) 2. 按照詞條的固有屬性和專屬特征進行歸納和修改,對詞條建立類(class)以及層級化的分類模型(taxonomy) 3. 加入關系(relation)連系terms和taxonomies 4. 按照需要,添加實例(instance)作為概念的具象 最後在Protege中,還可以利用其附帶的功能和外掛程式對本體進行文字和圖形化的導出,格式也可以自由選擇。 基本問題 概況 ontology的根本問題是:“存在的最初分類是什麽?”不同流派的哲學家對這個問題有不同的解釋。 這個問題使得在神學、圖書館學和人工智慧的研究方面都需要運用本體論的知識,而且反映到宇宙學、道德和審美觀念上。另外存在論提出的問題還包括: 什麽是存在? 什麽是物質物體? 什麽是物體的基本屬性 用什麽區別確定壹個物體? “物質物體存在”的基本定義是什麽? 物體的特性是什麽? 存在的特性是什麽? 什麽時候物體不再存在?並不僅僅是變化。 為什麽物體可以相對於虛無存在? 存在論歷史 存在論最早可推朔到古希臘的柏拉圖和亞裏士多德,亞裏士多德曾經定義存在論為“研究物體的存在的科學”。具體地說是研究物體的分類,也就是說:在什麽情況下,壹個物體可以被定義為“存在”。比論包括“普遍”的問題和“具體”的問題 觀念,物體,聯系 關於存在可以提出許多問題:“什麽是存在?”“什麽在存在?”“我是什麽?”等,對於本體論來說,最基本的是找出什麽是物體、什麽是觀念以及它們之間的聯系。啟蒙時代笛卡兒提出的“我思故我在”開啟了本體論基本問題的先例,笛卡兒並沒有深入研究,也認為沒有深入研究的必要,他認為“我思故我在”證明了上帝的存在,後來的神學家們也認為:“究竟是誰可以將這句話普遍套用到壹切事物中?”當然只有“上帝”。到了20世紀,當數理哲學,科學哲學和基本粒子物理學的新發現,將以前許多物質的所謂界限都打破了,人們不再滿足於神學的說法。 實體和環境 在20世紀各個不同時期存在著形上學的主觀主義學派,客觀主義學派,相對論學派等不同流派,後現代主義的實體哲學家們力圖通過在不同環境下的哲學行動來重新定義上述的各個問題,主要依賴於生物學、生態學和認知科學的最新研究成果,了解動物在自然和人工提供的環境中的認知情況。 命題相對於不同環境的變化,使得存在更難定義。如果人們說:“A是B”,“A必定是B”或“A曾經是B”究竟有什麽含義?有的哲學家主張去掉英語中的“是”壹詞,改用以免造成容易混淆的抽象含義;另壹些哲學家力圖了解辭匯中的深層含義和使用方式;馬丁·海德格爾想區分開“存在”和“物體”的意義。 存在 存在主義者認為“存在”是最基本的概念,好多事物都可以說“是”,動詞“是”有許多種用法,因此是易於混淆的,所以有許多種存在。簡單的說,本體論就是探討這個世界上存在的壹切是不是在背後都有壹個抽象的、不依賴於現實世界的基礎。精神的或是物質的,是不是都有自己的抽象的根據。簡單的說,形而下就是指的現實的我們可感的世界,而形而上指的是可感的世界背後的原因,是抽象的,是不可感的,並且是作為可感世界的根據存在的。本體論就是探討形而下的世界的形而上根據的。