數據挖掘技術(shù)下數字化油氣藏研究論文
摘要:油氣藏在勘探開(kāi)發(fā)及其研究與決策過(guò)程中,形成巨量的成果及數據。為了更加科學(xué)開(kāi)發(fā)與管理油氣藏,充分運用和發(fā)揮好這些巨量數據的信息作用成為關(guān)鍵,數據挖掘作為一種有效的信息處理技術(shù),可以在海量數據中快速找出有用信息,為研究與決策提供強有力的數據支持。長(cháng)慶油田在油氣藏研究與決策支持系統(RDMS)建設中充分利用各專(zhuān)業(yè)數據庫及多種數據挖掘方法,構建了一個(gè)滿(mǎn)足勘探、開(kāi)發(fā)、儲量管理、評價(jià)等綜合應用的數據管理、數據操作及可視化展示的一體化平臺,為油氣藏研究與決策人員提供全方位的數據處理與可靠決策,極大地提升了油氣藏的研究效率和決策質(zhì)量。
關(guān)鍵詞:數字化油氣藏;研究與決策;數據挖掘
油氣藏研究包含了從地質(zhì)勘查到石油產(chǎn)品最終用戶(hù)的復雜工藝流程,傳統的油氣藏研究方法存在工作效率低、準確性不高、過(guò)度依賴(lài)人工經(jīng)驗等問(wèn)題。決策者需要從海量的數據中找出有用的關(guān)鍵信息;論證現場(chǎng)中研究人員攜帶和使用的各類(lèi)圖件無(wú)法充分展示其研究成果,也不能在論證現場(chǎng)短時(shí)間內消化大量資料并做出正確的決策,更不能使信息資源的共享和成果的交互上得到充分實(shí)現。信息落后的信息處理方法與單一的研究手段不但花費大量的精力與時(shí)間,更是造成大量寶貴的研究成果無(wú)法應用與共享。近年信息技術(shù)的快速發(fā)展,催生了數字化油藏,促進(jìn)了數字油田的發(fā)展產(chǎn),數據挖掘等信息技術(shù)與油氣勘探開(kāi)發(fā)數據資源的融合不斷加深,能夠提供更智能化的數據分析功能,更好地支持油氣藏勘探開(kāi)發(fā)決策,開(kāi)創(chuàng )了一種全新的油氣藏研究工作模式,降低了決策風(fēng)險,提升開(kāi)發(fā)決策水平。長(cháng)慶油田針對具有數量龐大的、結構不完整的、內容不清晰且含有干擾信息的油氣藏研究工作數據,開(kāi)發(fā)了包括特征提取、規則劃分分類(lèi)分析、關(guān)聯(lián)規則挖掘、聚類(lèi)分析、模式分析及生成趨勢分析等[1-2]系列數據挖掘技術(shù),從中提取出包含在內部的、不被人們知曉的、卻又含有有用的、重要的信息和知識[3-4],為長(cháng)慶油田的高效開(kāi)發(fā)、快速發(fā)展提供了有效的數據信息支持。
一、油氣藏研究與決策支持系統
通過(guò)借鑒國內外著(zhù)名油氣公司在油氣勘探計算機軟件研發(fā)方面的經(jīng)驗[5-6],依托長(cháng)慶油田豐富的數據資源,利用先進(jìn)的軟件研發(fā)技術(shù),長(cháng)慶油田研發(fā)出了一套數字化油氣藏研究(RDMS)系統。它以油氣藏研究為主線(xiàn),業(yè)務(wù)驅動(dòng),數據鏈為手段,由協(xié)同工作平臺、數據整合平臺、數據可視化平臺等組成的一體化多學(xué)科協(xié)同工作環(huán)境。數字化油氣藏研究系統從功能架構上可劃分為數據服務(wù)、基礎工作、協(xié)同研究、決策支持和云軟件五大平臺;A工作平臺是以油氣藏數據鏈技術(shù)為基礎建立的系統底層框架,為各應用場(chǎng)景的協(xié)同工作提供基礎環(huán)境;協(xié)同研究平臺面向科研人員,通過(guò)對不同業(yè)務(wù)崗位定制不同工作場(chǎng)景和工作內容,為研究人員提供便捷的數據組織、共享和知識應用平臺;決策支持平臺面向技術(shù)主管和普通技術(shù)人員,為一體化技術(shù)交流及方案決策提供環(huán)境,并實(shí)現遠程異地協(xié)同決策;云軟件平臺基于虛擬存儲技術(shù)將勘探開(kāi)發(fā)主流軟件統一部署在云中心服務(wù)器,實(shí)現專(zhuān)業(yè)軟件接口統一升級、許可動(dòng)態(tài)調度和集中維護管理。目前,基礎工作平臺、研究工作平臺(29個(gè)研究主題)和決策支持平臺(16個(gè)決策主題)已基本開(kāi)發(fā)完成,在勘探開(kāi)發(fā)研究院、油氣工藝研究院、采油(氣)廠(chǎng)已推廣運行。圖1展示了數字化油氣藏研究與決策支持系統功能模塊的細分情況。
二、數字化油氣藏的數據挖掘技術(shù)
長(cháng)慶油田建設的數字化油氣藏研究與決策支持系統,為油田生產(chǎn)的勘探部署、產(chǎn)能建設等決策提供輔助。在決策支持系統的建設中采用了數據挖掘技術(shù),在數據分類(lèi)的'過(guò)程中使用了神經(jīng)網(wǎng)絡(luò )技術(shù),在數據關(guān)聯(lián)過(guò)程中使用了決策樹(shù)方法,在預測過(guò)程中使用了回歸分析和貝葉斯網(wǎng)絡(luò )。由勘探井的數據結合模型庫系統和數據倉庫系統,為井位部署、產(chǎn)能預測、生產(chǎn)方法等決策提供支持。在圖2的結構中有一個(gè)模型庫系統,它由模型庫、方法庫、數據庫、格式庫、衍生數據庫及其管理系統組成。該系統可被抽象為六元結構,即S={ModelD,methodD,FormD,ParaD,D,DeriveD}。其中,ModelD={model1,model2,…,modeln},它是模型庫,用于集成各種模型。模型庫為整個(gè)系統提供支撐。它有包含模型庫管理子系統(MDBMS)對模型庫進(jìn)行統一的管理,具有對模型定義、建立、存儲、查詢(xún)等功能。模型庫是系統的核心結構。用于油氣藏研究的各種數據庫在模型庫中統一管理、調用;MethodD={method1,method2,…,methodn},它是方法庫,集成各模型計算的參數獲取方法。方法庫系統為系統提供算法模型支撐,它包含方法庫管理子系統(ADBMS)對方法庫進(jìn)行統一的管理;FormD為數據格式庫,定義了每個(gè)數據的數據類(lèi)型,數據格式;ParaD為參數庫,用于存放各種油氣藏分析程序運轉的各種參數;D為數據庫,用于存放計算數學(xué)模型所需的各種數據;DevriveD為衍生數據庫,存放油氣藏研究過(guò)程中產(chǎn)生的新數據。
三、油氣藏數據挖掘技術(shù)的實(shí)現
1.建立數據倉庫建立數據倉庫是實(shí)現數據挖掘的基礎。本系統中使用的是原型法,快速的實(shí)現數據倉,并根據反饋信息修改油氣藏決策步驟中不合理的需求分析和主題情況,為后面的決策工作提供技術(shù)基礎和經(jīng)驗積累。本系統主題是油田勘探井位布置位置、測井實(shí)時(shí)數據、產(chǎn)能分析、儲量管理等主題。在對油氣藏決策系統進(jìn)行分析之后,根據油氣藏決策系統中包含的油氣藏數據、決策內容進(jìn)行邏輯分類(lèi)。針對各個(gè)的分析主題,在油氣藏數據倉庫中建立關(guān)系表,用來(lái)描述與決策結果相關(guān)的各種信息,關(guān)系表主要從油氣藏系統數據庫中的流程表中提取數據,包括地質(zhì)圖、地理圖、地震數據等。在數據倉庫的建設過(guò)程中,對油田的盆地、各級構造、圈閉、地震工區、勘探沉積相、各級儲量區塊、油田各類(lèi)開(kāi)發(fā)生產(chǎn)單元、井等勘探開(kāi)發(fā)圖形對象的轉換、加載入庫,建立完成地質(zhì)信息庫。
2.油氣藏研究工作數據抽象和總結技術(shù)數據總結的最終結果是對油氣藏研究數據進(jìn)行抽象模型化,給出油氣藏研究決策工作流程的總體綜合描述。通過(guò)對油氣藏數據的歸納抽象,數據挖掘方法能夠將數據庫中的所有數據從較低的個(gè)體層次抽象總結到較高的總體層次上,從而實(shí)現對原始基本數據的總體把握。在本系統中使用的數據總結方法是目前最為成熟的數學(xué)方法,也就是利用數學(xué)方法計算出數據庫的各個(gè)數據項的統計學(xué)特征,如總和、方差、最大值、平均、最小值等;或者通過(guò)利用數學(xué)中的統計圖形工具,對數據制作統計圖形,如直方圖、餅狀圖等。長(cháng)慶油田的數字化油氣藏研究系統中利用了OLAP技術(shù)實(shí)現對油田井位的地質(zhì)圖、地理圖、地震數據的多維查詢(xún),分析了多種數據的統計特征,同時(shí)用多個(gè)統計圖形描述了數據間的聯(lián)系。最后對多個(gè)數據進(jìn)行歸納,提取統計信息。
3.數據分類(lèi)數據挖掘中的分類(lèi)是建立需要的分類(lèi)函數或分類(lèi)模型。通過(guò)這個(gè)分類(lèi)模型可以將數據劃分到不同的組中。它的實(shí)現步驟一般是:首先分析工作數據的各種特征,并找出或者建立出工作數據的屬性模型,確定數據的歸屬組別,然后利用這些模型來(lái)分析工作數據,最后預測后面的工作數據可能會(huì )屬的分組。分類(lèi)應用的實(shí)例很多,本系統的采油井中,將油田井位出油量分為好、一般和較差三種類(lèi)型,以此分析這三種類(lèi)型井位的各種屬性,特別是位置、地質(zhì)等屬性,并決定它們分類(lèi)的關(guān)鍵屬性及相互間關(guān)系。此后就可以根據這些關(guān)鍵屬性對每一個(gè)預期的井位進(jìn)行分析,以便決定預期井位屬于哪一種類(lèi)型。
4.關(guān)聯(lián)分析原始數據庫中各個(gè)工作數據都存在相互關(guān)聯(lián)、相互影響的聯(lián)系。兩個(gè)或多個(gè)工作數據的取值之間存在某種邏輯聯(lián)系。這種關(guān)聯(lián)關(guān)系主要有簡(jiǎn)單關(guān)聯(lián)和時(shí)間關(guān)聯(lián)兩種。比如油田井位中的地質(zhì)環(huán)境、地震數據和出油量存在關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出工作數據中隱藏的關(guān)聯(lián)網(wǎng),描述眾多數據項目的密切度或關(guān)聯(lián)關(guān)系。由于事先往往并不知道工作數據的關(guān)聯(lián)是否存在,或者是否可以用精確的關(guān)聯(lián)函數描述。因此,關(guān)聯(lián)分析生成的規則通常都帶有置信度,置信度級別描述了關(guān)聯(lián)規則的強度。
5.聚類(lèi)與分析油藏工作數據往往缺少比較詳細的描述信息,甚至是無(wú)法組織成任何分類(lèi)模式時(shí),通?梢圆捎镁垲(lèi)分析。通過(guò)聚類(lèi)分析,按照約定的相近程度度量方法或者其他的標準,將工作數據分成許多有意義的子集合;每一個(gè)集合中的數據特征相近甚至相同,不同數據集合之間的數據性質(zhì)差異較大,容易區分。長(cháng)慶油田的數字化油氣藏研究在實(shí)現過(guò)程中,使用了Fayyad過(guò)程模型,如圖3所示。在數據挖掘的過(guò)程中,系統執行一個(gè)循環(huán)迭代過(guò)程。在每一步的執行中,從油田的盆地、各級構造、圈閉、地震工區、勘探沉積相、各級儲量區塊、油田各類(lèi)開(kāi)發(fā)生產(chǎn)單元等數據中,分析出勘探井位的位置信息,如果發(fā)現某個(gè)階段產(chǎn)生的結果和預想的內容有出入。則重復前面階段步驟。
四、結束語(yǔ)
長(cháng)慶油田針對油氣藏研究數據量大、信息隱晦的技術(shù)現狀,建立了油氣藏研究與決策支持系統[7-10],并在其中開(kāi)發(fā)和應用了系列數據挖掘技術(shù),取得了較大進(jìn)展:
。1)與眾多學(xué)科及技術(shù)相融合,形成了包括人工智能、統計學(xué)、數據倉庫、在線(xiàn)分析處理、專(zhuān)家系統、數據可視化、高性能計算等數據挖掘技術(shù),將原始數據庫轉化為有用的研究知識,為油氣藏決策了有力支持。
。2)海量數據及其挖掘技術(shù)的開(kāi)發(fā)為油氣藏研究與決策支持系統的高效應用打下了基礎,極大地提高了油氣藏的研究與決策水平,為長(cháng)慶油田快速發(fā)展提供了強有力的技術(shù)支持。
參考文獻
。1]郭萌,王玨.數據挖掘與數據庫知識發(fā)現:綜述[J].模式識別與人工智能,1998,11(03):292-299.
。2]胡侃,夏紹瑋.基于大型數據倉庫的數據采掘:研究綜述[J].軟件學(xué)報,1998(01):54-64.
。3]GrossmanR,KasifS,MooreR,etal.Dataminingresearch:Op—portunitiesandchallenges[C].AreportofthreeNSFworkshopsonmininglarge,massive,anddistributeddata,1999.
。4]Deogu*JS,RaghavanVV,SarkarA,etal.Datamining:Re—searchtrends,challenges,andapplications[J].RoughsSetsandDataMining:AnalysisofImpreciseData,1997:9-45.
。5]王宏琳.油氣勘探計算機軟件:平臺體系結構框架[J].石油工業(yè)計算機應用,2004(02):3-8.
。6](美)HohmannL著(zhù).藍莉,曾永和譯.超越軟件架構創(chuàng )建和維護優(yōu)秀解決方案[M].北京:中國電力出版社,2005.
。7]石玉江.數字油田中的勘探井位快速部署技術(shù)[J].石油工業(yè)計算機應用,2016(12):11-16.
。8]王娟.數字油氣藏數據中心建設的關(guān)鍵技術(shù)[J].石油工業(yè)計算機應用,2016(1):16-18.
。9]付金華,石玉江,王娟,等.長(cháng)慶油田勘探開(kāi)發(fā)服務(wù)型共享數據中心構建研究[J].中國石油勘探,2017,22(6):1-8.
。10]王娟,姚衛華,石玉江,等.基于云架構的油氣藏數據智能管理技術(shù)[J].天然氣工業(yè),2014,34(3):137-141.
【數據挖掘技術(shù)下數字化油氣藏研究論文】相關(guān)文章:
大數據時(shí)代數據挖掘技術(shù)教學(xué)研究論文01-20
數據挖掘技術(shù)在WEB的運用論文04-26
數據挖掘論文03-31
數據挖掘教學(xué)方法研究論文01-20
我國的數據挖掘技術(shù)現狀分析論文04-28
專(zhuān)利數據挖掘的論文06-26