云計算環(huán)境下的數據挖掘研究論文
摘要:文章首先對云計算的特點(diǎn)進(jìn)行簡(jiǎn)要分析, 在此基礎上對云計算環(huán)境下的數據挖掘進(jìn)行研究。期望通過(guò)本文的論述能夠對數據挖掘效率的提高有所幫助。
關(guān)鍵詞:云計算; 數據挖掘; 服務(wù);
1 云計算的特點(diǎn)分析
1.1 超大規模
國內外大型互聯(lián)網(wǎng)企業(yè)紛紛建立起云平臺, 開(kāi)啟一大批服務(wù)器, 如Google公司、亞馬遜公司、微軟公司等公司都建立了云平臺, 大幅度提升了網(wǎng)絡(luò )平臺數據運算效率、存儲效率和交互效率, 使云計算具備超大規模特點(diǎn)。
1.2 虛擬化
云平臺是向網(wǎng)絡(luò )平臺提供資源的平臺, 網(wǎng)絡(luò )用戶(hù)可借助云計算技術(shù)在任意位置獲取應用服務(wù), 這種應用服務(wù)不是固定實(shí)體, 而是虛擬化的。在云平臺上, 需要運行虛擬化的搜索、儲存、上傳下載操作, 網(wǎng)絡(luò )用戶(hù)無(wú)需了解資源的獲取渠道, 只要通過(guò)終端設備就可以獲取網(wǎng)絡(luò )服務(wù)信息, 實(shí)現數據快速互傳。
1.3 可靠性高
云平臺可提高數據互傳、存儲的可靠性, 其采用計算節點(diǎn)同構可互傳、數據多副本容錯等措施增強服務(wù)的可靠性, 即使在數據傳輸或存儲丟失的情況下, 也可以找回渠道恢復數據, 與計算機自帶硬盤(pán)相比, 網(wǎng)絡(luò )云計算平臺的可靠性更高。
1.4 通用性強
云計算技術(shù)的針對性不強, 對其他設備沒(méi)有過(guò)高的要求, 只需在網(wǎng)絡(luò )平臺上建設平臺, 配備足夠的服務(wù)器, 就可以實(shí)現云計算技術(shù)的應用。在同一云平臺的支撐下, 可滿(mǎn)足不同設備的運行要求。
1.5 擴展性好
云平臺既可以滿(mǎn)足不同類(lèi)型企業(yè)的需求, 也可以滿(mǎn)足個(gè)人用戶(hù)需求, 其本身帶有動(dòng)態(tài)伸縮性。用戶(hù)可根據自身需求對空間、功能進(jìn)行定制, 滿(mǎn)足個(gè)性化的應用要求, 使云平臺具備良好的擴展性。
1.6 按需服務(wù)
云平臺可提供充足的空間, 便于用戶(hù)在云平臺上存儲、調用、傳輸數據資源。為了避免用戶(hù)過(guò)度占用云平臺資源, 云平臺一般設置了計費標準, 要求用戶(hù)按需購入占用量, 促使云平臺成為可交易的資源。
2 云計算環(huán)境下的數據挖掘
2.1 數據挖掘服務(wù)層次結構
2.1.1 基礎設施層
該層主要為整個(gè)數據挖掘服務(wù)提供存儲和計算資源, 在基礎設施層運行中, 通過(guò)接口可連接網(wǎng)絡(luò )資源與物理資源, 實(shí)現不同類(lèi)型資源的`高度共享。該層還提供數據挖掘服務(wù)的虛擬化接口, 滿(mǎn)足資源對接要求, 為資源存儲、共享提供技術(shù)支撐。
2.1.2 虛擬化層
在云計算技術(shù)上建立數據挖掘服務(wù)模式, 利用虛擬化層快速處理大量資源。在結構體系中, 虛擬化層根據云計算技術(shù)虛擬化匯聚分布式資源, 在封裝處理虛擬資源的基礎上, 分類(lèi)和管理不同資源, 從而提高挖掘服務(wù)執行效率。在對資源進(jìn)行封裝后, 通過(guò)開(kāi)發(fā)和利用平臺層實(shí)現資源共享。虛擬化技術(shù)是資源封裝的重要技術(shù), 既可以提高資源運行效率, 也可以實(shí)現對資源的合理調動(dòng), 提高服務(wù)模式的便捷性。
2.1.3 平臺層
在數據挖掘服務(wù)模式中, 平臺層作為數據核心服務(wù)部分, 負責管理不同數據及其功能, 實(shí)現不同服務(wù)目錄的高效管理。用戶(hù)可根據服務(wù)內容和使用需求組合不同服務(wù)目錄, 發(fā)揮數據功能性管理作用。在平臺層中, 可有效調度計算資源, 提高計算資源的運行效率, 這使得平臺層在數據挖掘服務(wù)中占據著(zhù)不可替代的地位。
2.1.4 應用層
該層由終端層和接口層組成, 其中接口層為用戶(hù)提供服務(wù)等級, 滿(mǎn)足各種服務(wù)請求, 終端層將服務(wù)請求顯示出來(lái), 并且可根據請求的服務(wù)內容作出評價(jià)。在終端層的內容訪(fǎng)問(wèn)中, 根據用戶(hù)訪(fǎng)問(wèn)請求、訪(fǎng)問(wèn)內容對訪(fǎng)問(wèn)接入作出不同選擇, 再結合用戶(hù)訪(fǎng)問(wèn)情況, 借助終端設備實(shí)現數據挖掘服務(wù)。
2.2 體系的建模流程
2.2.1 對服務(wù)進(jìn)行自定義
在數據挖掘服務(wù)運行時(shí), 可通過(guò)自定義完成相關(guān)數據的搜集, 從而快速找到與之相關(guān)的資源。由此可以使數據挖掘人員開(kāi)展工作時(shí), 對候選加以充分利用, 進(jìn)而形成服務(wù)目錄, 為用戶(hù)使用提供方便。
2.2.2 組件構建
在對數據挖掘服務(wù)組件進(jìn)行構建時(shí), 應當確保調用服務(wù)接口的統一性, 同時(shí)在構建其它服務(wù)組件時(shí), 需要綁定服務(wù)和數據, 從而構建起數量更多的組件, 為用戶(hù)提供所需的數據挖掘服務(wù)模式。
2.3 數據挖掘體系的服務(wù)過(guò)程
2.3.1 分析階段
該階段主要負責分析數據挖掘內容, 確定需要挖掘的數據, 根據對應的數據服務(wù)內容設置相應的服務(wù)模式, 并對服務(wù)模式作出定義。為保證數據挖掘與實(shí)際需求相符, 在數據挖掘時(shí)需先進(jìn)行數據分析, 深入到外部環(huán)境中調查市場(chǎng)發(fā)展趨勢和市場(chǎng)需求情況, 以市場(chǎng)為導向開(kāi)發(fā)大數據挖掘模式, 使云計算下的數據挖掘服務(wù)更具備高效性、實(shí)用性和針對性。
2.3.2 設計階段
該階段要根據前期市場(chǎng)調查情況對數據挖掘服務(wù)方案進(jìn)行設計, 最終確定符合用戶(hù)使用習慣的數據處理模式。數據挖掘服務(wù)模式設計不僅關(guān)系到用戶(hù)體驗的滿(mǎn)意程度, 而且還影響著(zhù)數據挖掘服務(wù)運行效率。在某些特定的情況下, 甚至可能對供應商與消費者帶來(lái)利益沖突, 阻礙數據挖掘服務(wù)在信息化環(huán)境中的有效應用, 為了解決上述問(wèn)題, 必須以市場(chǎng)調查為前提開(kāi)展數據挖掘服務(wù)模式設計, 避免不必要的矛盾。
2.3.3 開(kāi)發(fā)階段
在該階段, 一套相對完整的數據挖掘服務(wù)體系會(huì )隨著(zhù)設計得以呈現, 各種服務(wù)內容與方法在該階段中得到合理應用。體系開(kāi)發(fā)時(shí), 應對各項功能進(jìn)行定義, 并將所有的功能整合到一起, 以此來(lái)實(shí)現多種不同的服務(wù)目標, 確保數據挖掘服務(wù)模式的高效運行。對體系進(jìn)行開(kāi)發(fā)的過(guò)程中, 可基于服務(wù)接口的實(shí)現, 對相關(guān)的功能進(jìn)行有效地協(xié)調, 從而使開(kāi)發(fā)出來(lái)的功能更符合用戶(hù)的使用需要, 由此可使數據挖掘服務(wù)的價(jià)值得以充分體現, 有利于推動(dòng)數據挖掘服務(wù)市場(chǎng)的持續、穩定發(fā)展。
3 結論
綜上所述, 云計算以其自身所具備的諸多特點(diǎn), 在諸多領(lǐng)域中得到越來(lái)越廣泛的應用。本文在簡(jiǎn)要闡述云計算特點(diǎn)的基礎上, 對云計算環(huán)境下的數據挖掘進(jìn)行分析研究, 提出數據挖掘服務(wù)模式的構建方法, 以期能夠對數據挖掘效率的進(jìn)一步提升有所幫助。
參考文獻
[1]孫亮.數據挖掘服務(wù)模式應用云計算的優(yōu)化策略探究[J].黑河學(xué)院學(xué)報, 2018 (01) :23-25.
[2]王勃, 徐靜.基于云計算的Web數據挖掘Hadoop仿真平臺研究[J].電子設計工程, 2018 (01) :43-44.
[3]包科, 蔡明.高速接入網(wǎng)云計算平臺的大數據挖掘算法研究[J].機床與液壓, 2017 (12) :143-144.
[4]馮麗慧.云計算和挖掘服務(wù)融合下的大數據挖掘體系架構設計及應用[J].電腦編程技巧與維護, 2017 (12) :132-133.
【云計算環(huán)境下的數據挖掘研究論文】相關(guān)文章:
云計算環(huán)境數據安全研究論文11-03
分析論文:云計算環(huán)境下大數據06-26
云計算環(huán)境下大規模數據處理技術(shù)研究論文11-07
研究基于云計算角度下的數據存儲安全技術(shù)論文11-07
云計算環(huán)境下的分布存儲技術(shù)研究論文11-06
數據挖掘論文03-31