97骚碰,毛片大片免费看,亚洲第一天堂,99re思思,色好看在线视频播放,久久成人免费大片,国产又爽又色在线观看

知識依賴(lài)度約簡(jiǎn)的論文

時(shí)間:2021-06-11 19:18:41 論文 我要投稿
  • 相關(guān)推薦

關(guān)于知識依賴(lài)度約簡(jiǎn)的論文

  基于知識依賴(lài)度約簡(jiǎn)的知識發(fā)現研究

關(guān)于知識依賴(lài)度約簡(jiǎn)的論文

  摘要:粗糙集理論中的屬性約簡(jiǎn)問(wèn)題屬于NP難問(wèn)題。以教育技術(shù)學(xué)專(zhuān)業(yè)讀者2013學(xué)年度圖書(shū)借閱歷史數據為原型,采用借閱類(lèi)目的次數多少作為屬性重要度進(jìn)行啟發(fā)式選擇,利用粗糙集理論中的知識依賴(lài)度對類(lèi)目約簡(jiǎn),挖掘出本專(zhuān)業(yè)和各年級借閱類(lèi)目的核心集,并經(jīng)問(wèn)卷調查證明其規律的正確性。通過(guò)與教育技術(shù)學(xué)專(zhuān)業(yè)學(xué)科知識體系結構的比較,能夠發(fā)現學(xué)科知識體系結構建設的不足之處,以促進(jìn)其更科學(xué)完善。

  關(guān)鍵詞:粗糙集;知識依賴(lài)度;數據挖掘;知識發(fā)現

  0 引言

  高校圖書(shū)館自動(dòng)化建設經(jīng)過(guò)多年發(fā)展,已經(jīng)積累了大量歷史數據,這些數據不但完整,而且質(zhì)量高,充分反映了讀者學(xué)習成長(cháng)的過(guò)程。如何對其進(jìn)行挖掘提煉并從中發(fā)現有價(jià)值的知識,是了解讀者需要、開(kāi)展知識推送服務(wù)的重要信息來(lái)源。前人研究主要是根據讀者的借閱歷史數據,利用關(guān)聯(lián)規則算法發(fā)現某類(lèi)書(shū)籍之間的關(guān)聯(lián)規則[14],或利用聚類(lèi)算法挖掘具有共同閱讀興趣的讀者群體[5],以及通過(guò)時(shí)間流分析得到讀者借閱時(shí)間的分布規律[6]等。

  也可以利用粗糙集進(jìn)行挖掘。例如,柳炳祥等[7]只是介紹有關(guān)理論,文章中并沒(méi)有對粗造集挖掘進(jìn)行深入闡述。這些挖掘結果往往只是反映讀者已往的借閱規律,而不能反映其當前和今后一段時(shí)間的真實(shí)需要,因為這些讀者還需要不斷地進(jìn)行知識更新和深化學(xué)習。本文通過(guò)對教育技術(shù)學(xué)專(zhuān)業(yè)讀者群進(jìn)行數據挖掘,利用知識依賴(lài)度約簡(jiǎn)方法發(fā)現其學(xué)科知識體系結構,并通過(guò)與相關(guān)專(zhuān)業(yè)的知識體系結構建設進(jìn)行比較,以發(fā)現建設中的不足之處。如果利用所得的知識庫進(jìn)行推送服務(wù),則能把讀者真正需要的知識推送給他們。

  1 粗造集有關(guān)理論

  粗糙集理論認為“知識是一種對對象進(jìn)行分類(lèi)的能力”,它將分類(lèi)理解為在特定空間上的等價(jià)關(guān)系,而等價(jià)關(guān)系構成了對該空間的劃分[8]。

  定義1(論域、知識):設U 是感興趣的對象組成的非空有限集合,稱(chēng)為一個(gè)論域。論域U 上的任一子集XU,稱(chēng)為論域U 的一個(gè)概念或范疇。論域U 中的任何子集簇(概念簇)稱(chēng)為關(guān)于U 的抽象知識,簡(jiǎn)稱(chēng)知識[9]。在二維表中,知識是由某些列對所有行的劃分構成的集合所表示。

  定義2(知識庫):給定一個(gè)論域U 和U上的一簇等價(jià)關(guān)系S,稱(chēng)二元組K=(U,S)是關(guān)于論域U 的一個(gè)知識庫或近似空間。因此,論域上的等價(jià)關(guān)系即代表著(zhù)劃分和知識。這樣,知識庫就表示了論域上由等價(jià)關(guān)系導出的各種知識,即劃分或分類(lèi)模式,同時(shí)代表了對論域的分類(lèi)能力,并隱含著(zhù)知識庫中概念之間存在的各種關(guān)系[9]。

  定義3(不可分辨關(guān)系):給定一個(gè)論域U 和U上的一簇等價(jià)關(guān)系S,若PS,且P≠,則∩P(P中所有等價(jià)關(guān)系的交集)仍然是論域U 上的一個(gè)等價(jià)關(guān)系,稱(chēng)為P上的一個(gè)不可分辨關(guān)系,記作IND(P)。IND(P)的等價(jià)類(lèi)稱(chēng)為知識P的基本范疇[9]。

  2 知識發(fā)現

  2.1 樣本數據選取

  2.2 數據預處理

  在進(jìn)行數據挖掘之前,需要對數據進(jìn)行去噪、補缺和轉換等預處理操作。數據預處理步驟如下:①根據年級、專(zhuān)業(yè)代碼和時(shí)間段獲取讀者借閱歷史記錄,并通過(guò)匯總獲得借閱圖書(shū)的人數、未借閱人數和總借閱冊數;②去除借閱書(shū)目的.種次號,得到借閱類(lèi)目,匯總后得到借閱類(lèi)目數。由于中圖法是通過(guò)標記符號代表各級類(lèi)目和固定先后次序的分類(lèi)體系,標記符號不同,其表示的知識類(lèi)目也不同,故不能把相近類(lèi)目合并為一類(lèi);③按類(lèi)目進(jìn)行匯總,求得各類(lèi)目借閱冊數和所有類(lèi)目的平均借閱冊數,并刪除低于平均借閱冊數的類(lèi)目,因為其表現的只是某個(gè)學(xué)生的個(gè)人愛(ài)好,不是大家共同學(xué)習的知識,相當于噪音數據;④求出借過(guò)大于平均借閱冊數類(lèi)目的所有讀者,這些讀者即是進(jìn)行知識約簡(jiǎn)的對象;⑤生成上述讀者對象和其借閱類(lèi)目的二維表,并對表中數據進(jìn)行轉換處理,如果此讀者借過(guò)該類(lèi)目書(shū)籍則為1,否則為0。類(lèi)目列按類(lèi)目總借閱冊數降序添加到表中。

  2.3 知識約簡(jiǎn)

  經(jīng)過(guò)上面的數據預處理后,得到了知識庫的關(guān)系簇S 和論域U,即不小于平均借閱冊數的類(lèi)目和借閱這些類(lèi)目的讀者。然而,即使經(jīng)過(guò)上述預處理后,其約簡(jiǎn)的類(lèi)目數還有幾十種;如果直接利用知識依賴(lài)度(定義5)來(lái)約簡(jiǎn),其需要計算的次數為M*logM*2n(M是讀者數,n是類(lèi)目數),這是指數級時(shí)間復雜度,需要消耗大量計算時(shí)間。為了得到多項式時(shí)間算法,采用以類(lèi)目借閱的冊數多少作為屬性重要度的啟發(fā)式策略,應用知識依賴(lài)度來(lái)約簡(jiǎn)二維表,具體算法如下:

 。1)置K={},R={};// K表示約簡(jiǎn)后得到的知識,R表示臨時(shí)約簡(jiǎn)知識

  //如果單個(gè)知識把論域全覆蓋則作為約簡(jiǎn)知識放入K中

 。2)For r0=1 to count(類(lèi)目) do

  取出count(r0)類(lèi)目I,計算其劃分。

  如果I全覆蓋論域U ,則把I并入K中;否則,退出循環(huán)。

 。3)把I并入R中。

  //計算剩下的類(lèi)目依賴(lài)關(guān)系 (4)For r1=r0+1 to count(類(lèi)目) do

  取出count(r1)類(lèi)目Q,根據類(lèi)目Q求其對論域U 的劃分。

  根據R中的知識求其對論域U 的劃分。

  利用知識依賴(lài)度公式,求Q對R的知識依賴(lài)度γ;如果γ小于0.5,則把Q并入R中,否則認為知識Q歸屬于R而被約簡(jiǎn)掉。

 。5)K=K∪R,并退出。 //即K就是所求的約簡(jiǎn)集合

  2.4 結果分析

  因此,通過(guò)對相關(guān)數據的分析,給出如下建議:①給大一、大二學(xué)生適當介紹本學(xué)科知識體系結構,使其開(kāi)始就明確學(xué)習目標、方向和內容組成;②通過(guò)與教育學(xué)院教師交流發(fā)現,學(xué)院已開(kāi)設《學(xué)科導論》課程,但效果不夠理想。因此,對于開(kāi)設《學(xué)科導論》課的院系,需要扎實(shí)推進(jìn)本導制,發(fā)揮其引導作用;③深入研究小說(shuō)等文學(xué)類(lèi)與教育技術(shù)學(xué)專(zhuān)業(yè)之間的內在關(guān)系,將其納入學(xué)科體系結構中,完善學(xué)科知識體系結構建設;④在低年級中適當開(kāi)設“TP393.092 網(wǎng)絡(luò )瀏覽器”課程,做好相關(guān)理論基礎知識鋪墊,使學(xué)科知識結構布局更加合理。

  3 知識驗證

  4 結語(yǔ)

  本文利用粗糙集理論中的知識依賴(lài)度約簡(jiǎn)方法對某專(zhuān)業(yè)讀者群借閱歷史數據進(jìn)行挖掘,獲得其學(xué)科體系結構知識,并通過(guò)比較,發(fā)現相應學(xué)科體系結構建設中的不足之處,促使學(xué)科結構體系建設更加合理、完善。如果利用所得的知識進(jìn)行推送服務(wù),則能夠根據學(xué)生知識結構的變化進(jìn)行預判,做到有的放矢,提高服務(wù)質(zhì)量。當然,本文還有一些問(wèn)題尚待解決,如表4類(lèi)目順序變化的真正原因是什么,蘊含了哪些知識?小說(shuō)等文學(xué)類(lèi)中哪些知識是教育技術(shù)學(xué)專(zhuān)業(yè)的本質(zhì)需要,如何合理設計它在學(xué)科體系結構的布局等?相關(guān)問(wèn)題有待進(jìn)行下一步更深入的研究。

  參考文獻:

  [3]張紅燕. 關(guān)聯(lián)規則挖掘在高校圖書(shū)館借閱流通中的應用[J]. 數字技術(shù)與應用,2012(5):76,78.

  [4]薛琴榮,李響. 基于數據挖掘技術(shù)的圖書(shū)館個(gè)性化借閱服務(wù)研究[J]. 情報探索,2013(4):110113.

  [7]柳炳祥. 基于數據挖掘的圖書(shū)館個(gè)性化服務(wù)系統[J]. 現代情報,2007(3):108109.

  [9]苗奪謙,李道國. 粗糙集理論、算法與應用[M]. 北京:清華大學(xué)出版社,2008.

  [14]中國圖書(shū)館分類(lèi)法編輯委員會(huì ). 中國圖書(shū)館分類(lèi)法[M]. 第4版. 北京: 書(shū)目文獻出版社,1999.