2) 維護(hù)型協(xié)調(diào)算法和維護(hù)型協(xié)調(diào)器
維護(hù)型協(xié)調(diào)器的功能是模擬“心理信息修復(fù)” 這一認(rèn)知心理特征,從而實(shí)現(xiàn)知識(shí)庫(kù)的實(shí)時(shí)維護(hù)。由于維護(hù)型協(xié)調(diào)器對(duì)KDD過(guò)程的介入,可以在對(duì)于重復(fù)性、一致性、冗余性、從屬性、循環(huán)性等給予準(zhǔn)確定義的基礎(chǔ)上,利用超圖等理論工具,實(shí)時(shí)地、盡
早地將重復(fù)、矛盾、冗余的知識(shí)進(jìn)行處理,從而做到只對(duì)那些有可能成為新知識(shí)的假設(shè)進(jìn)行評(píng)價(jià),最大限度地減少了評(píng)價(jià)工作量;同時(shí),可對(duì)知識(shí)庫(kù)進(jìn)行實(shí)時(shí)維護(hù)。在實(shí)際的專(zhuān)家系統(tǒng)中,最終成為新知識(shí)的假設(shè)占原假設(shè)的比例是很小的,大量假設(shè)會(huì)是重復(fù)和冗余的,因此維護(hù)型協(xié)調(diào)器的引入將提高KDD的效率。該協(xié)調(diào)器是通過(guò)維護(hù)協(xié)調(diào)算法來(lái)實(shí)現(xiàn)的,圖3將給出該算法的流程圖:
圖3維護(hù)協(xié)調(diào)算法流程圖
2.1.2 雙基融合機(jī)制的實(shí)現(xiàn)技術(shù)
雙基融合機(jī)制是由三個(gè)協(xié)調(diào)器來(lái)具體實(shí)現(xiàn)的。該項(xiàng)內(nèi)容已正式申報(bào)國(guó)家發(fā)明專(zhuān)利《一種融入R型協(xié)調(diào)器的KDK系統(tǒng)》(200510086965.8)、《一種融入R型與S型協(xié)調(diào)器的KDK系統(tǒng)》(200510086964.3)和《一種基于雙基融合機(jī)制的的KDK*系統(tǒng)》(200510086966.2)(見(jiàn)附件 )。
1)R型協(xié)調(diào)器:通過(guò)綜合歸納推理來(lái)發(fā)現(xiàn)新知識(shí).知識(shí)庫(kù)的組成包括事實(shí)和規(guī)則兩部分.
2)S型協(xié)調(diào)器:KDK發(fā)現(xiàn)的規(guī)則(特別是難于決斷的知識(shí))在進(jìn)行評(píng)價(jià)前,先將其送入KDD*過(guò)程中進(jìn)行定向挖掘,用KDD*的發(fā)掘結(jié)果先行評(píng)估,若此條規(guī)則在KDD*過(guò)程中也可被發(fā)現(xiàn),則認(rèn)為該規(guī)則有效的幾率較大;反之,則認(rèn)為此知識(shí)缺乏數(shù)據(jù)支持.
3)T協(xié)調(diào)器:在規(guī)則已被KDK過(guò)程確認(rèn)后,將產(chǎn)生一個(gè)定向搜索進(jìn)程,搜索知識(shí)庫(kù)中對(duì)應(yīng)位置是否有此生成規(guī)則的重復(fù)、冗余和矛盾.這樣可以對(duì)知識(shí)庫(kù)進(jìn)行實(shí)時(shí)維護(hù),做到只對(duì)那些最有可能成為新知識(shí)的假設(shè)進(jìn)行評(píng)價(jià),從而最大限度的減少評(píng)價(jià)量.
2.2 新過(guò)程模型構(gòu)造方法
目前知識(shí)發(fā)現(xiàn)研究的主流是尋求在各類(lèi)數(shù)據(jù)庫(kù)和應(yīng)用背景下高性能、高擴(kuò)展性的挖掘算法。對(duì)挖掘的過(guò)程(結(jié)構(gòu))模型的研究較少,如何從根本上改進(jìn)數(shù)據(jù)挖掘流程是當(dāng)前知識(shí)發(fā)現(xiàn)研究所面臨的一個(gè)極富挑戰(zhàn)性的問(wèn)題。在原創(chuàng)性的三個(gè)機(jī)制的基礎(chǔ)上,我們用系統(tǒng)論與認(rèn)知科學(xué)的思想和方法(特別是模型化的方法)來(lái)研究復(fù)雜的知識(shí)發(fā)現(xiàn)過(guò)程,相應(yīng)的過(guò)程(結(jié)構(gòu))模型的描述如下所示:
由內(nèi)在認(rèn)知機(jī)理的研究成果誘導(dǎo)出決定知識(shí)發(fā)現(xiàn)過(guò)程信息流程與挖掘線(xiàn)路的七個(gè)新過(guò)程(結(jié)構(gòu))模型----是將原有的知識(shí)發(fā)現(xiàn)過(guò)程模型融合上述的三個(gè)機(jī)制而產(chǎn)生的。即:①KDD*=KDD+雙庫(kù)協(xié)同機(jī)制;②KDK*=KDK+雙基融合機(jī)制;③KD(D&K)=KDD*+KDK*;④基于KD(D&K)又演變出分布式綜合知識(shí)發(fā)現(xiàn)系統(tǒng)DKD(D&K)模型;⑤KDD*E=KDD*+信息擴(kuò)張機(jī)制;⑥用于復(fù)雜類(lèi)型數(shù)據(jù)挖掘的發(fā)現(xiàn)特征子空間模型DFSSM;⑦基于KDTICM及DFSSM還提出了圖像挖掘過(guò)程模型IMDFSSM。以下分述之:
上一頁(yè) [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] 下一頁(yè)
|