1.3 首次提出KDK
與雙基融合機(jī)制相關(guān),首次獨(dú)立提出基于知識庫的知識發(fā)現(xiàn)(KDK),即從海量的知識庫中發(fā)現(xiàn)更深層次的知識的非平凡過程。這是至今在國內(nèi)外尚待開拓的專題,它的成功將直接作用于知識獲取和大型知識庫的構(gòu)建,不僅為海量數(shù)據(jù)挖掘中領(lǐng)域知識的參與奠定了基礎(chǔ),也對人工智能中的其它一些重要問題(如智能系統(tǒng)等)的實(shí)現(xiàn)具有重要意義。針對知識庫里的事實(shí),采用歸納學(xué)習(xí)方法產(chǎn)生歸納假設(shè),再用卡爾納普的歸納邏輯進(jìn)行假設(shè)的驗(yàn)證與評價;針對知識庫里的規(guī)則,采用廣義概念格方法產(chǎn)生歸納假設(shè),再用柯恩的歸納邏輯進(jìn)行假設(shè)的驗(yàn)證與評價。該項(xiàng)內(nèi)容已正式申報國家發(fā)明專利《一種融入R型協(xié)調(diào)器的KDK系統(tǒng)》(200510086965.8)、《一種融入R型與S型協(xié)調(diào)器的KDK系統(tǒng)》(200510086964.3)和《一種基于雙基融合機(jī)制的的KDK*系統(tǒng)》(200510086966.2)(見附件 )。
1.4與相關(guān)工作的對比分析
當(dāng)我們在1997—2000年做出上述研究成果后,我們花費(fèi)大量時間仔細(xì)查找該領(lǐng)域國際著名學(xué)者發(fā)表論文的字里行間中有無類似的學(xué)術(shù)思想,并加以對比分析,其結(jié)果如下:
1) 1992年, Gregory Piatetsky-Shapiro等提出“采用領(lǐng)域知識輔助初始發(fā)現(xiàn)的聚焦”,“限定性搜索”的思想.
雙庫協(xié)同原理(機(jī)制). 在知識發(fā)現(xiàn)的過程中,在知識庫與數(shù)據(jù)庫特定的構(gòu)造下, 知識庫中素結(jié)點(diǎn)與數(shù)據(jù)庫中數(shù)據(jù)子類結(jié)構(gòu)的層之間一一對應(yīng), 即結(jié)構(gòu)對應(yīng)定理. 為 “定向搜索”與“定向挖掘”奠定了可實(shí)現(xiàn)性的理論基礎(chǔ)與方法. 此外, 基于結(jié)構(gòu)對應(yīng)關(guān)系, 我們從認(rèn)知心理學(xué)的“創(chuàng)見意向”與“心理信息修復(fù)”出發(fā), 構(gòu)造了“啟發(fā)型協(xié)調(diào)器”, 這就具體實(shí)現(xiàn)了領(lǐng)域知識(基礎(chǔ)知識庫)——知識短缺——創(chuàng)見意向——領(lǐng)域知識輔助聚焦(原來靠用戶感興趣度實(shí)施聚焦)——系統(tǒng)自主形成定向挖掘.
2) 1993年, J. P. Yoon與L. Kerschberg提出“知識與數(shù)據(jù)庫同步進(jìn)化的思想”.
我們從認(rèn)知系統(tǒng)的角度, 構(gòu)造了“維護(hù)型協(xié)調(diào)器”, 每從數(shù)據(jù)庫中發(fā)現(xiàn)一條新知識都要實(shí)時地到知識庫中進(jìn)行定向搜索, 以處理冗余、重復(fù)、矛盾、循環(huán)與從屬現(xiàn)象, 進(jìn)行“實(shí)時維護(hù)”.
反之, 數(shù)據(jù)庫被動態(tài)擴(kuò)張后, 根據(jù)我們發(fā)現(xiàn)的“信息擴(kuò)張原理(機(jī)制)” ——揭示了動態(tài)挖掘進(jìn)程中的參數(shù)演化規(guī)律(即參數(shù)演化定理)、突變規(guī)律,對知識的進(jìn)化、評價與可理解性處理等提出了能行可判定方法.
3) 1996年, Sarabjot. S. Anand等提出“用戶的先驗(yàn)知識與先前發(fā)現(xiàn)的知識可以耦合到發(fā)現(xiàn)過程中”的思想.
“雙基融合原理(機(jī)制)”揭示了兩個截然不同的知識發(fā)現(xiàn)(即一個是基于數(shù)據(jù)庫的KDD, 另一個是基于知識庫的KDK)過程模型邏輯等價關(guān)系(定理). 據(jù)此, KDD與KDK可以耦合在新知識發(fā)現(xiàn)過程模型KD(D&K)中(這時, KDK歸納出的假設(shè)可以到KDD中進(jìn)行挖掘驗(yàn)證). 另一層意思是通過雙庫協(xié)同原理(機(jī)制), 對先前發(fā)現(xiàn)的知識, 不斷地以用戶的先驗(yàn)知識(背景知識)為參照系, 在知識發(fā)現(xiàn)過程中加以耦合.
結(jié)論:迄今為止,人工智能與計算機(jī)科學(xué)界,對知識發(fā)現(xiàn)這一年輕學(xué)科尚無人系統(tǒng)與可實(shí)現(xiàn)地研究過知識發(fā)現(xiàn)系統(tǒng)(過程)的內(nèi)在認(rèn)知機(jī)理。我們的工作另辟蹊徑,從一開始就定位在認(rèn)知科學(xué)的全新理念上,改變固有的學(xué)術(shù)思想,并導(dǎo)致了下述的基于內(nèi)在認(rèn)知機(jī)理的知識發(fā)現(xiàn)理論KDTICM的產(chǎn)生。
2. 原創(chuàng)性技術(shù)發(fā)明點(diǎn)(創(chuàng)新點(diǎn))
2.1 三個機(jī)制的實(shí)現(xiàn)技術(shù) 2.1.1 雙庫協(xié)同機(jī)制的實(shí)現(xiàn)技術(shù)
雙庫協(xié)同機(jī)制主要是利用認(rèn)知心理學(xué)的兩個重要特征(即“創(chuàng)建意向”與“心理信息修復(fù)”)來研究知識發(fā)現(xiàn)的兩個重要主題,從而對知識發(fā)現(xiàn)的過程進(jìn)行改造,該機(jī)制通過兩個協(xié)調(diào)器來實(shí)現(xiàn)。具體而言:(1)通過模擬“創(chuàng)建意向”來實(shí)現(xiàn)系統(tǒng)自主發(fā)現(xiàn)知識短缺,實(shí)施啟發(fā)式的聚焦(除用戶感興趣式的聚焦外);(2)通過模擬“心理信息修復(fù)”來實(shí)現(xiàn)知識庫的實(shí)時維護(hù)。該項(xiàng)內(nèi)容已獲國家發(fā)明專利《一種基于雙庫協(xié)同機(jī)制的KDD*方法及系統(tǒng)》(ZL 01145080.0)(見附件 )。
1) 啟發(fā)協(xié)調(diào)算法與啟發(fā)型協(xié)調(diào)器
啟發(fā)型協(xié)調(diào)器的功能是模擬“創(chuàng)建意向”這一認(rèn)知心理特征,從而實(shí)現(xiàn)“主動推送”,即系統(tǒng)自身發(fā)現(xiàn)知識短缺。在經(jīng)典KDD進(jìn)程中,系統(tǒng)的聚焦通常是由用戶提供感興趣方向,KDD沿此方向進(jìn)行挖掘。但如果僅沿此方向進(jìn)行,大量數(shù)據(jù)中的潛在有用的信息往往被用戶忽略。為幫助KDD盡可能多的搜索到對用戶有用的信息,以彌補(bǔ)用戶或領(lǐng)域?qū)<易陨淼木窒扌,提高機(jī)器的認(rèn)知自主性,我們構(gòu)造了啟發(fā)型協(xié)調(diào)器。這樣,知識發(fā)現(xiàn)系統(tǒng)在原有的用戶聚焦的基礎(chǔ)上,又增加了系統(tǒng)自身提供聚焦方向的功能。啟發(fā)型協(xié)調(diào)器是通過啟發(fā)協(xié)調(diào)算法來實(shí)現(xiàn)的,算法的奠基是等價定理與結(jié)構(gòu)對應(yīng)定理; 圖2將給出該算法的流程圖:
圖2 啟發(fā)協(xié)調(diào)算法流程圖
上一頁 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] 下一頁
|