97骚碰,毛片大片免费看,亚洲第一天堂,99re思思,色好看在线视频播放,久久成人免费大片,国产又爽又色在线观看

網(wǎng)對網(wǎng)和Web數據挖掘在搜索引擎中的運用論文

時(shí)間:2021-05-14 13:25:36 論文 我要投稿

網(wǎng)對網(wǎng)和Web數據挖掘在搜索引擎中的運用論文

  摘 要:當今網(wǎng)絡(luò )信息技術(shù)日益發(fā)展,傳統意義上的搜索引擎更加難以滿(mǎn)足廣大用戶(hù)日益增長(cháng)的信息檢索需求。在這種趨勢下,智能技術(shù)在搜索引擎中的應用顯得越來(lái)越重要。只有將智能技術(shù)引進(jìn)搜索引擎,才能提高用戶(hù)的工作效率,滿(mǎn)足人們日益增長(cháng)的客觀(guān)需求。主要介紹了如今搜索引擎的幾大分類(lèi),傳統搜索引擎需要改進(jìn)的不足以及兩大智能技術(shù)在搜索引擎中的應用。在智能技術(shù)將會(huì )更加智能更加發(fā)達的未來(lái),搜索引擎也將不斷地更新和發(fā)展,為人們提供更加高效的搜索體驗。

網(wǎng)對網(wǎng)和Web數據挖掘在搜索引擎中的運用論文

  關(guān)鍵詞:智能技術(shù);搜索引擎;網(wǎng)對網(wǎng)技術(shù);數據挖掘。

  搜索引擎是根據一定的策略,運用特定的計算機程序來(lái)搜索互聯(lián)網(wǎng)上的信息,在對信息進(jìn)行組織和處理后,將處理后的結果顯示給用戶(hù),是為用戶(hù)提供檢索服務(wù)的系統。而智能技術(shù)在搜索引擎中的實(shí)際應用也越來(lái)越廣泛,不斷有新興的智能技術(shù),搜索引擎也不斷地結合這些智能技術(shù)來(lái)進(jìn)行自身的變革和發(fā)展。這是一個(gè)漸進(jìn)的過(guò)程。本文將詳細介紹 2 種智能技術(shù)在搜索引擎中的應用。

  1.搜索引擎的分類(lèi)。

  搜索引擎可分為以下 3 類(lèi):①全文搜索引擎。全文搜索引擎是最標準的搜索引擎,國外的主要代表是 Google,而國內的主要代表則是百度。全文搜索引擎的主要原理是在互聯(lián)網(wǎng)中檢索與所查目標相匹配的內容,繼而建立數據庫,按序排列并且將其展示給用戶(hù)。②目錄搜索引擎。從本質(zhì)來(lái)說(shuō),目錄搜索引擎其實(shí)不能算是真正的搜索引擎。只是將網(wǎng)站鏈接目錄分類(lèi),用戶(hù)并不需要輸入關(guān)鍵字,根據目錄就完全可以找到想要的.信息。目錄索引最具代表性的就是 Yahoo 和新浪索引。③元搜索引擎。元搜索引擎在接收用戶(hù)的搜索請求后,可以在各個(gè)搜索引擎上同時(shí)搜索,隨后將結果顯示給用戶(hù)。這一種搜索引擎的國內代表是搜星搜索引擎。

  2.傳統搜索引擎相比網(wǎng)絡(luò )信息檢索的缺點(diǎn)。

  傳統搜索引擎作為用戶(hù)在互聯(lián)網(wǎng)進(jìn)行信息檢索的一個(gè)重要途徑,給廣大用戶(hù)提供了相當大的便利,隨著(zhù)互聯(lián)網(wǎng)的迅速發(fā)展,用戶(hù)對搜索引擎又提出了搜索速度更快、搜索效率更高等諸多要求。正是用戶(hù)的這些需求刺激著(zhù)搜索引擎的快速發(fā)展。傳統搜索引擎越來(lái)越滿(mǎn)足不了用戶(hù)的需求,主要存在以下幾點(diǎn)不足:①搜索引擎從互聯(lián)網(wǎng)搜索的各種網(wǎng)頁(yè)水準不一,存在著(zhù)根本沒(méi)用或者暫時(shí)性的網(wǎng)頁(yè)。這嚴重加大了用戶(hù)檢索信息的困難程度,并且嚴重影響了檢索速度。②主流搜索引擎大多采用關(guān)鍵詞來(lái)檢索,由于用戶(hù)水平的差異,極少數可以總結出關(guān)鍵詞或關(guān)鍵詞組,以至于用戶(hù)搜索不到想要的內容,從而加大了檢索難度。③每個(gè)搜索引擎覆蓋的范圍雖然不小,但與龐大的互聯(lián)網(wǎng)相比,簡(jiǎn)直是九牛一毛。④檢索的結果不準確、不唯一,搜索結果為零或者為數萬(wàn)的情況時(shí)有發(fā)生。⑤不能智能搜索,難以滿(mǎn)足用戶(hù)深層次的需求。

  3.智能技術(shù)的運用。

  由于傳統引擎的各種缺點(diǎn),用戶(hù)越來(lái)越渴望更好用、更便捷的搜索方式出現。在這種刺激下,智能技術(shù)在搜索引擎中的應用大量出現。這使得搜索引擎需具有一定的智能化和理解能力。當前主要有以下兩大智能技術(shù)。

  3.1 網(wǎng)對網(wǎng)技術(shù)。

  顧名思義,“網(wǎng)對網(wǎng)技術(shù)”就是網(wǎng)絡(luò )和網(wǎng)絡(luò )對應起來(lái)的意思。這其中又要提到兩個(gè)概念了,是兩個(gè)單詞。一個(gè)單詞我們都相當熟悉了--Internet.我們常說(shuō)的互聯(lián)網(wǎng),就是這個(gè)單詞。而在這里,這個(gè)單詞指的是一個(gè)信息網(wǎng)絡(luò ),也就是我們所說(shuō)的網(wǎng)絡(luò )中的信息網(wǎng)。我們想要搜索什么東西時(shí),將它輸入搜索引擎中,引擎就會(huì )在這個(gè)網(wǎng)絡(luò )庫中查找,找到相關(guān)信息,然后呈現在我們面前。而另一個(gè)詞可能就有一些陌生了--Innernet.表面上看起來(lái)與 Internet 很像,英文詞典中并沒(méi)有這個(gè)詞,我們在這里叫它“內聯(lián)網(wǎng)”.與看起來(lái)更像數據庫的 Internet 比起來(lái),內聯(lián)網(wǎng)更像是人類(lèi)大腦的一個(gè)信息網(wǎng)絡(luò )。這里面不僅僅有我們生活和工作中所用到的各種各樣的信息,更重要的是,信息之間繁雜又緊密的聯(lián)系。就像我們在生活中和他人交流,提到“小伙伴”這個(gè)詞,我們會(huì )想到其他與之有聯(lián)系的詞匯,比如“朋友”“同學(xué)”等。同樣的,當提到“師父”,我們的大腦也會(huì )迅速聯(lián)想到“師門(mén)”“師生”這樣的相關(guān)詞匯。我們所說(shuō)的內聯(lián)網(wǎng),它所著(zhù)重的,也是信息與信息之間這樣息息相關(guān)的聯(lián)系。Internet 和 Innernet都是知識的網(wǎng)絡(luò ),互聯(lián)網(wǎng)時(shí)代的信息社會(huì )發(fā)展日新月異,因此無(wú)論是哪個(gè)網(wǎng)絡(luò ),其內的信息都是不斷變化著(zhù)的。人們將這個(gè)技術(shù)運用在搜索引擎中,大大提高了搜索引擎的實(shí)用性。作為內聯(lián)網(wǎng)的 Innernet 和 Internet 聯(lián)結起來(lái),運用信息之間存在的各種各樣的聯(lián)系,將用戶(hù)輸入搜索引擎中,將復雜的聯(lián)系正確分割開(kāi),然后各自拓展出一些對人們而言有用的信息,將 Internet 中龐大、雜亂的信息進(jìn)行有序化的篩選和整理,最終將信息呈現在人們的眼前。這大大提高了搜索引擎的可操作性,縮短了人們不斷刪改語(yǔ)句來(lái)配合 Internet 的時(shí)間,自然也就提高了用戶(hù)的工作效率。

  3.2 Web 數據挖掘技術(shù)。

  數據挖掘作為一門(mén)交叉學(xué)科,其原理比較復雜,可以從龐大的數據中將更有用、更有新意的數據挖掘出來(lái),而 Web 挖掘,便是將數據挖掘和 Web 發(fā)展聯(lián)系起來(lái)。Web 數據挖掘有 3 種不同的挖掘形式,即內容挖掘、結構挖掘和使用記錄的挖掘。

  3.2.1 內容挖掘。

  內容挖掘指的是從 Web 文檔中或是描述中挖掘,在網(wǎng)頁(yè)中進(jìn)行數據挖掘,其中包括文本、超鏈接、圖像和視頻等,而半結構化的數據和無(wú)結構的文本便是主要的挖掘對象。

  3.2.2 結構挖掘。

  Web 結構挖掘則是通過(guò)網(wǎng)頁(yè)中的超鏈接,發(fā)現其中信息之間的結構及其緊密或稀疏的聯(lián)系。在平時(shí)上網(wǎng)時(shí),我們只能看到一個(gè)個(gè)的網(wǎng)頁(yè),打開(kāi)瀏覽或者關(guān)閉。但是在這些頁(yè)面的背后,其實(shí)隱藏著(zhù)無(wú)數個(gè)結構鏈接。Web 數據挖掘就能夠通過(guò)這些結構上的鏈接,發(fā)現頁(yè)面與頁(yè)面、數據與數據之間的聯(lián)系,隨后對它們分類(lèi),以便為用戶(hù)提供含有相似信息的更多頁(yè)面,幫助用戶(hù)完善自己想要在搜索引擎中得到的信息。

  3.2.3 使用記錄的挖掘。

  與前兩者相比,Web 使用記錄的挖掘讓我們感覺(jué)更加熟悉,至少“使用記錄”4 個(gè)字是我們上網(wǎng)過(guò)程中能夠看到的。當我們點(diǎn)擊一下搜索引擎的輸入框想要輸入文本時(shí),搜索引擎會(huì )自動(dòng)下拉出我們前幾次使用時(shí)所查詢(xún)的內容,以便我們重復查看相似內容的信息。搜索引擎有時(shí)也會(huì )為我們推薦一些內容的信息。這些信息也會(huì )是我們所感興趣的一些內容,是搜索引擎結合了我們之前的使用記錄,為我們提供感興趣的相類(lèi)似的內容。這些都是 Web 使用記錄挖掘在搜索引擎中的實(shí)用例子,但并不是全部。搜索引擎會(huì )從用戶(hù)的訪(fǎng)問(wèn)痕跡中挖掘出很多有意義的數據,包括數據端、服務(wù)器端和代理端的數據。而其獲得這些數據的途徑又分為 KDD 和專(zhuān)業(yè)化追蹤。這些方法和深度的挖掘,使搜索引擎更加“智能”地了解用戶(hù)的興趣和需要。

  4.總結。

  搜索引擎是我們工作、學(xué)習和生活中必不可少的實(shí)用性技術(shù),正如一個(gè)調查中所顯示的,85%的人都是通過(guò)搜索引擎獲取到他們所需要的信息和所喜愛(ài)的網(wǎng)站,可見(jiàn)搜索引擎的重要性。隨著(zhù)智能技術(shù)的不斷更新,人們的生活變得越來(lái)越智能,對搜索引擎的要求也會(huì )隨之越來(lái)越高,因此不斷利用新的技術(shù)完善和提高搜索引擎的智能性,是用戶(hù)的選擇,也是時(shí)代的選擇,是搜索引擎在現在和未來(lái)的發(fā)展中必然的趨勢,且將一直持續下去。

  參考文獻:

  [1]陳勇躍,張玉峰。智能技術(shù)在搜索引擎中的應用[J].情報雜志,2004(02):2-3,6.

  [2]楊占華,楊燕。數據挖掘在智能搜索引擎中的應用[J].微計算機信息,2006(12):244-246.

  [3]朱素媛,馬溪俊,梁昌勇。人工智能技術(shù)在搜索引擎中的應用[J].合肥工業(yè)大學(xué)學(xué)報(自然科學(xué)版),2003(S1):657-661.

【網(wǎng)對網(wǎng)和Web數據挖掘在搜索引擎中的運用論文】相關(guān)文章:

什么是以太網(wǎng)和以太網(wǎng)交換機02-22

淺談歷史微故事在初中教學(xué)中的運用論文12-13

測試你對網(wǎng)購的態(tài)度題目及答案01-16

食物鏈和食物網(wǎng)課件設計05-09

情感美文網(wǎng)04-18

網(wǎng)教教育論文致謝(精選8篇)04-20

網(wǎng)課的教學(xué)反思04-02

網(wǎng)購小學(xué)作文04-06

《夏洛的網(wǎng)》教學(xué)設計04-03

網(wǎng)投簡(jiǎn)歷的編寫(xiě)要點(diǎn)02-24