版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

[科普中國]-正規(guī)概念分析法

科學(xué)百科
原創(chuàng)
科學(xué)百科為用戶提供權(quán)威科普內(nèi)容,打造知識科普陣地
收藏

正規(guī)概念分析是個非監(jiān)督式機器學(xué)習(xí)技巧和資料分析方法。透過正規(guī)概念分析建立一個概念點陣,可以將所有的正規(guī)概念組織起來。這個點陣是由一群"自然"物件和"自然"屬性所組成。

簡介正規(guī)概念分析是一種將物件概念和其屬性自動依造本體論進行分析的方法。這個詞匯最早是由Wille于1984所提出。它應(yīng)用了格理論將物件和其所對應(yīng)的屬性互相關(guān)聯(lián)。所應(yīng)用到的格理論則是由Birkhoff等人于1930年代所發(fā)展的。1

歷史正規(guī)概念分析的最初動機是尋找數(shù)學(xué)秩序理論的現(xiàn)實意義。一般性的一種可能性是數(shù)據(jù)表可以轉(zhuǎn)換為稱為完全格子的代數(shù)結(jié)構(gòu),并且這些可以用于數(shù)據(jù)可視化和解釋。表示對象和屬性之間的二元關(guān)系的數(shù)據(jù)表,因此將“對象g具有屬性m”形式的表格列表,被認(rèn)為是基本數(shù)據(jù)類型,并且被稱為正式上下文。在這個理論中,形式概念被定義為一對(A,B),其中A是一組對象(稱為范圍),B是一組屬性(意圖),這樣

范圍A由在B和dually中共享屬性的所有對象組成

意圖B由A中對象共享的所有屬性組成。

通過這種方式,形式概念分析形式化了擴展和內(nèi)涵的語義概念。

任何形式背景的形式概念可以-作為解釋如下-be下令在一個名為更加正式的上下文的層次結(jié)構(gòu)“概念格”。概念格可以圖形方式顯示為“線圖”,這可能有助于理解數(shù)據(jù)。然而,這些晶格通常太大而無法實現(xiàn)可視化。然后,形式概念分析的數(shù)學(xué)理論可能是有幫助的,例如,用于將晶格分解成沒有信息損失的較小塊,或者用于將其嵌入到更容易解釋的另一結(jié)構(gòu)中。

目前形式的理論可以追溯到20世紀(jì)80年代早期,由達(dá)姆施塔特工業(yè)大學(xué)的Rudolf Wille,Bernhard Ganter和Peter Burmeister領(lǐng)導(dǎo)的研究小組。然而,它的基本數(shù)學(xué)定義在20世紀(jì)30年代由Garrett Birkhoff作為一般晶格理論的一部分引入。其他以前采用同一理念的方法來自法國的各種研究小組,但達(dá)姆施塔特小組對該領(lǐng)域進行了規(guī)范化,并系統(tǒng)地計算出其數(shù)學(xué)理論及其哲學(xué)基礎(chǔ)。后者特別提到了Charles S. Peirce,但也提到了Port-Royal的邏輯。2

本體在計算機科學(xué)與信息科學(xué)領(lǐng)域,理論上,本體是指一種“形式化的,對于共享概念體系的明確而又詳細(xì)的說明”。本體提供的是一種共享詞表,也就是特定領(lǐng)域之中那些存在著的對象類型或概念及其屬性和相互關(guān)系;或者說,本體就是一種特殊類型的術(shù)語集,具有結(jié)構(gòu)化的特點,且更加適合于在計算機系統(tǒng)之中使用;或者說,本體實際上就是對特定領(lǐng)域之中某套概念及其相互之間關(guān)系的形式化表達(dá)(formal representation)。本體是人們以自己興趣領(lǐng)域的知識為素材,運用信息科學(xué)的本體論原理而編寫出來的作品。本體一般可以用來針對該領(lǐng)域的屬性進行推理,亦可用于定義該領(lǐng)域(也就是對該領(lǐng)域進行建模)。此外,有時人們也會將“本體”稱為“本體論”。

作為一種關(guān)于現(xiàn)實世界或其中某個組成部分的知識表達(dá)形式,本體目前的應(yīng)用領(lǐng)域包括(但不僅限于):人工智能、語義網(wǎng)、軟件工程、生物醫(yī)學(xué)信息學(xué)、圖書館學(xué)以及信息架構(gòu)。1

格物論在數(shù)學(xué)中,是其非空有限子集都有一個上確界(叫)和一個下確界(叫)的偏序集合(poset)。格也可以特征化為滿足特定公理恒等式的代數(shù)結(jié)構(gòu)。因為兩個定義是等價的,格理論從序理論和泛代數(shù)二者提取內(nèi)容。半格包括了格,依次包括海廷代數(shù)和布爾代數(shù)。這些"格樣式"的結(jié)構(gòu)都允許序理論和抽象代數(shù)的描述。

考慮任意一個偏序集合(L,≤),如果對集合L中的任意元素a,b,使得a,b在L中存在一個最大下界,和最小上界,則(L,≤)是一個格。

這里對于取a,b的最大下界的操作用表示;

對于取a,b的最小上界操作用 表示。

有界格有一個最大元素和一個最小元素,按慣例分別指示為1和0(也叫做)。任何格都可以通過增加一個最大元素和最小元素而轉(zhuǎn)換成有界格。

使用容易的歸納論證,你可以演繹出任何格的所有非空有限子集的上確界(并)和下確界(交)的存在。一個很重要的格的種類是完全格。一個格是完全的,如果它的所有子集都有一個交和一個并,這對比于上述格的定義,這里只要求所有非空有限子集的交和并的存在。2

本詞條內(nèi)容貢獻者為:

王沛 - 副教授、副研究員 - 中國科學(xué)院工程熱物理研究所