大數據時(shí)代對地觀(guān)測衛星的發(fā)展現狀與趨勢論文
一、前言
對地觀(guān)測是人類(lèi)利用衛星、飛船、航天飛機、飛機以及近空間飛行器等空間平臺和地面、地下的各種傳感器設備獲取觀(guān)測數據,結合各個(gè)學(xué)科的專(zhuān)業(yè)知識,對地面物體和地理過(guò)程進(jìn)行監測和預測的科學(xué)活動(dòng),其目的是更加深刻和科學(xué)地揭示人類(lèi)社會(huì )活動(dòng)所依賴(lài)的地球環(huán)境和人地環(huán)境的規律和變化,增強人類(lèi)對地球的利用和適應能力。對地觀(guān)測研究工作具有非常明顯的信息學(xué)特征。因此,除了地球科學(xué)方法論外,信息科學(xué)方法論也對對地觀(guān)測科學(xué)活動(dòng)有非常重要的指導意義。對地觀(guān)測研究很大程度上是圍繞著(zhù)“信號—數據—信息—知識”的數字化信息過(guò)程來(lái)展開(kāi)的,并構成了“信息獲取—信息傳輸—信息存儲—信息加工—信息挖掘—信息呈現”的數據全生命周期。
從信息科學(xué)的角度來(lái)看,對地觀(guān)測領(lǐng)域知識發(fā)現的方法主要是確定模型分析方法。在遙感技術(shù)的發(fā)展初期,觀(guān)測數據量較小,用于數據挖掘分析的理論和模型也不夠成熟,因此更多是依靠專(zhuān)業(yè)人員的目視判讀進(jìn)行信息解譯和勾繪制圖,然后再利用其他學(xué)科的知識對獲得的信息進(jìn)行修正。這種方法顯然不能滿(mǎn)足日益增大的觀(guān)測數據量和日益復雜的應用模式需求。在數據量不斷增大、信息提取精度不斷提高的情況下,依賴(lài)于計算機處理的數據分析新模式出現了。遙感信息反演的定量化成為對地觀(guān)測信息深度應用的趨勢,這種能力也隨著(zhù)計算機處理能力的提升不斷提高,逐步滿(mǎn)足了 MB(220 字節)、GB(230 字節)、TB(240字節)甚至部分 PB(250 字節)量級的數據分析和信息挖掘工作,從應用上解決了較大地理尺度上的復雜地學(xué)問(wèn)題。提升計算機的處理速度和存儲設備的規模已經(jīng)成為解決觀(guān)測數據量增大和信息模型復雜化所帶來(lái)的問(wèn)題的一個(gè)很好的途徑。進(jìn)入 21 世紀以后,對地觀(guān)測技術(shù)又呈現出很多新的發(fā)展趨勢,其中大數據的出現給對地觀(guān)測的研究帶來(lái)了全新的挑戰和發(fā)展機遇。近年來(lái),隨著(zhù)對地觀(guān)測需求的增加和技術(shù)的進(jìn)步,各種類(lèi)型傳感器獲取數據的能力不斷提高,使得國內外以專(zhuān)業(yè)化、行業(yè)化為特征的各類(lèi)數據中心迅速崛起,對地觀(guān)測領(lǐng)域成為數據密集型計算的一個(gè)典型應用。整個(gè)對地觀(guān)測系統流程突出體現了“需求牽引—知識驅動(dòng)”的概念和原則,形成了以社會(huì )需求為先導來(lái)發(fā)展對地觀(guān)測衛星、傳感器、平臺、數據傳輸、信息處理、應用模型及相應科學(xué)理論的發(fā)展模式。
二、對地觀(guān)測領(lǐng)域的大數據現象
在對地觀(guān)測領(lǐng)域,各類(lèi)分辨率的衛星產(chǎn)生的遙感信息無(wú)疑屬于大數據。以我國遙感衛星為例,2008 年發(fā)射的風(fēng)云三號 A 星搭載著(zhù) 20 通道的中分辨率光譜成像儀和 10 通道的可見(jiàn)光近紅外掃描輻射計,實(shí)現了對整個(gè)地球進(jìn)行連續觀(guān)測,隨后與 2010 年和 2013 年發(fā)射的風(fēng)云三號 B 星和 C 星組網(wǎng),對地球開(kāi)展每天 6 次的觀(guān)測。衛星觀(guān)測數據切割成 5 分鐘段的數據文件,又將 250m 和 1000m 中分辨率光譜成像儀的數據分別存放,每天產(chǎn)生的數據文件和數據量均非常巨大。要管理、處理和分發(fā)這些全球數據需要運用“大數據”的方式,而且需要大量的數據科學(xué)家開(kāi)展基礎研究工作,研究算法,從數據中實(shí)時(shí)提取地球參數信息,進(jìn)而為科研、業(yè)務(wù)的數據信息需求服務(wù)。這一事實(shí)充分說(shuō)明了從海量遙感數據的獲取、存儲、提取與分發(fā)、數值處理,到數據挖掘和知識發(fā)現,對地觀(guān)測活動(dòng)的整個(gè)生命周期體現了大數據的“4V”特性:數據體量大 (volume)、數據來(lái)源和類(lèi)型繁多(variety)、數據的真實(shí)性難以保證(veracity)、數據增加和變化的速度快(velocity)。
國際上,美國和歐洲處理和分發(fā)中分辨率數據較中國稍早幾年,美國處理 MODIS 數據和產(chǎn)品的方式、歐洲處理 ENVISAT/MERIS 數據和產(chǎn)品的方式可為我們借鑒。由于美國沒(méi)有 MODIS 的后續衛星計劃,數據的供給將隨著(zhù)傳感器的失效而終止。歐洲的 ENVISAT/MERIS 于 2012 年失效,只能提供 2002-2012 年間的數據。中國風(fēng)云氣象衛星規劃已持續到 2020 年,因而,在未來(lái)幾年,中國的風(fēng)云衛星中分辨率遙感數據在國際上將是重要的數據源,向全球用戶(hù)提供優(yōu)質(zhì)的數據和產(chǎn)品,將是中國數據科學(xué)家肩上的重任。
1. 觀(guān)測平臺和傳感器的`數據獲取
遙感數據獲取是由載有成像傳感器的遙感飛行平臺來(lái)完成的。遙感飛行平臺的發(fā)展體現在:①先進(jìn)的衛星對地觀(guān)測系統,包括大型的綜合衛星平臺與小衛星星座;②先進(jìn)的集成高—中—低空飛行作業(yè)的航空遙感平臺;③全面一體化的對地觀(guān)測綜合系統。未來(lái)的傳感器搭載平臺將是由相輔相成的高中低軌道上的大小衛星平臺和高中低航空平臺組成的,天地一體化、全球性、立體和多維的觀(guān)測體系。與此同時(shí),對地觀(guān)測傳感器的數據獲取能力將向著(zhù)“三高”(高空間分辨率、高光譜分辨率和高時(shí)相分辨率)和全天候方向發(fā)展。遙感平臺和傳感器的技術(shù)進(jìn)步使得獲取的數據量大幅度增大。比如剛剛退役的 Landsat -5 衛星在其29 年的在軌工作期間,平均每年獲取 8.6 萬(wàn)景影像,每天獲取 67GB 的觀(guān)測數據。而 2012 年發(fā)射的資源 3 號衛星,每天的觀(guān)測數據獲取量可以達到 10TB 以上。類(lèi)似的傳感器現在已經(jīng)大量部署在衛星、飛機等飛行平臺上,未來(lái) 10 年全球天、空、地空間中部署的百萬(wàn)計傳感器每天獲取的觀(guān)測數據將超過(guò) 10PB。
2.天- 空- 地一體化的對地觀(guān)測數據網(wǎng)絡(luò )傳輸
巨大的觀(guān)測能力需要通過(guò)覆蓋天-空-地的高速數據傳輸網(wǎng)來(lái)實(shí)現對地觀(guān)測平臺和全球地面接收站網(wǎng)絡(luò )之間的數據傳遞。這種傳輸能力要通過(guò)一個(gè)由光纜、地面微波、蜂窩移動(dòng)通信和低、中以及靜止軌道的衛星通信系統組成的、服務(wù)于全球的、無(wú)縫隙覆蓋的、全球一體化的高速天-空-地對地觀(guān)測數據傳輸網(wǎng)絡(luò )實(shí)現,F在,單個(gè)傳感器的信號下傳速率已經(jīng)突破了 Gbit/s。
3. 海量數據的快速處理
標準遙感產(chǎn)品的快速生成需要高吞吐量、高精度及自動(dòng)化的分布式數據處理能力,以滿(mǎn)足規;、業(yè)務(wù)化的標準產(chǎn)品生產(chǎn)的要求。標準產(chǎn)品快速處理的突出特點(diǎn)是即時(shí)性和大吞吐量,兼有數據密集、計算密集的性質(zhì)。海量遙感數據的處理需要利用龐大的網(wǎng)絡(luò )計算資源,通過(guò)并行計算、分布式處理以及集群計算技術(shù)來(lái)實(shí)現網(wǎng)絡(luò )化大數據量處理及多機分布式并行處理,以滿(mǎn)足應用的需求。我們可以利用網(wǎng)格技術(shù)把分散在不同地理位置的計算機組織成一個(gè)“虛擬的超級計算機”,來(lái)提供高性能和高吞吐量的計算環(huán)境,為完成計算密集型任務(wù)提供有力的手段;同時(shí)充分利用網(wǎng)絡(luò )上多種閑置計算設備的處理能力,完成傳統計算模式下不能完成的各種大數據量的計算任務(wù),從而保證標準產(chǎn)品的快速處理和生成。
4. 下一代空間數據設施
下一代空間數據設施建設將以全球尺度問(wèn)題求解和多樣化實(shí)體數據設施建設為前提,基于傳統空間數據設施和聯(lián)邦數據設施,通過(guò)松耦合形式建立一種非中心化、虛擬化、按需服務(wù)化和全球化的數據服務(wù)體系。分布在世界各地的各種對地觀(guān)測數據中心,將在下一代空間數據設施的連接下,面向特定專(zhuān)題,與高性能的信息化設施結合,動(dòng)態(tài)形成大量專(zhuān)業(yè)化的虛擬數據設施。這些設施不僅可以匯聚和提供超大規模的數據,還具備對數據進(jìn)行深度加工和挖掘的計算能力。地球觀(guān)測組織(GEO)所推動(dòng)建立的全球綜合地球觀(guān)測系統(GEOSS)就是一種下一代空間數據設施,這種設施管理和處理的都是超大規模的對地觀(guān)測數據和空間數據。
5. 數字地球與未來(lái)地球
作為和對地觀(guān)測銜接的科學(xué)框架,數字地球是一個(gè)廣泛的以信息高速公路和空間基礎設施為依托的概念,其核心思想是用數字化手段整體性解決地球的各種科學(xué)問(wèn)題,并最大限度地利用信息資源。未來(lái)的數字地球不再局限于進(jìn)行地學(xué)數據的表達和呈現,而將成為一種對地球的各種學(xué)科的數據和模型進(jìn)行綜合分析的平臺。同時(shí),由國際科學(xué)理事會(huì )(ICSU)和國際社會(huì )科學(xué)理事會(huì )(ISSC) 共同發(fā)起的“未來(lái)地球”計劃將多學(xué)科交叉研究推向更加重要的位置。不論數字地球還是未來(lái)地球,其多學(xué)科的高度數據復雜性是非常顯著(zhù)的信息特征。和常規的單學(xué)科研究不同,在這種綜合研究場(chǎng)景中,信息技術(shù)要面對的是多學(xué)科復雜數據類(lèi)型之間的數據建模、數據發(fā)現和數據整合問(wèn)題。
三、大數據在對地觀(guān)測領(lǐng)域應用的典型案例
大數據時(shí)代的對地觀(guān)測技術(shù)為發(fā)展空間地球信息科學(xué)奠定了基礎,從對地觀(guān)測過(guò)程的信息學(xué)特征可以清晰地看到此領(lǐng)域大數據的發(fā)展趨勢。但目前大數據研究普遍存在著(zhù)“只有數據、沒(méi)有利用”的問(wèn)題,導致搜集數據、存儲數據付出的成本被浪費。據報道,通過(guò)遙感衛星獲得的影像數據中,目前得到應用的不到 5%,多半數企業(yè)不知如何從數據中獲得價(jià)值,因此這個(gè)問(wèn)題急需解決,下面將介紹一些國內外創(chuàng )新企業(yè)利用大數據技術(shù)為遙感圖像應用找出路的典型案例,希望能夠擴寬我們的視野并從中得到有價(jià)值的借鑒。
1.Digital Globle: 遙感圖像 + 大數據分析助力尋找馬航 MH370 迷蹤
馬航失聯(lián)客機 MH370 去哪兒的問(wèn)題,牽動(dòng)著(zhù)全世界的心。為了找出謎題的答案,尋回239名乘客的信息,各方為此動(dòng)用了許多手段,包括直接分析飛機上設備發(fā)出的各種信號,衛星和雷達的天羅地網(wǎng)等先進(jìn)的科技方式,調遣各類(lèi)船只前往可能事故區域搜網(wǎng)式調查,可惜都無(wú)果而終,就在失聯(lián)事件發(fā)生的 12 天后,澳大利亞宣布從衛星影像中找到了疑似馬航 MH370 失聯(lián)航班殘骸,廣袤的洋面找一架飛機如同大海撈針實(shí)屬不易,雖然還未能確定殘骸是否來(lái)自于 MH370,但在短短幾天內在能夠通過(guò)海量的衛星圖片發(fā)現如此重要的線(xiàn)索可見(jiàn)其背后的數據分析能力之強大,支撐這一能力的正是大數據技術(shù),快速定位殘骸坐標體現了大數據技術(shù)在處理海量高分遙感圖像上的速度優(yōu)勢,展示了大數據與遙感技術(shù)的融合將在災難救援方面的關(guān)鍵作用。
2.Skybox Imaging:邁向大數據時(shí)代的商業(yè)遙感成像公司
Skybox 成像公司成立于 2009 年,目前員工不到 60人,是名副其實(shí)的“小”公司,但卻在多輪融資中備受風(fēng)投的青睞,麻省理工學(xué)院技術(shù)評論將其評為 2012年最具“摧毀性”的 50 家公司之一。
3. 禾訊科技:商業(yè)化衛星遙感服務(wù)現代化農業(yè)生產(chǎn)
農業(yè)是生命之源、發(fā)展之基。由于農業(yè)資源、環(huán)境及多樣化的生產(chǎn)經(jīng)營(yíng)方式,農業(yè)大數據涉及到水、土、光、熱、氣候資源,作物育種、種植、施肥、植保、過(guò)程管理、收獲、加工、存儲、機械化等環(huán)節會(huì )產(chǎn)生大量結構化和非結構化數據,而且隨著(zhù)農業(yè)科技創(chuàng )新發(fā)展和物聯(lián)網(wǎng)的應用,非結構化數據呈現快速增長(cháng)的勢頭,其數量將大大超過(guò)結構化數據,為保障“舌尖上的安全”,利用大數據技術(shù)對不斷產(chǎn)生的大批非結構化數據的信息獲取、挖掘、存貯、處理與智慧應用是農業(yè)現代化不可或缺的手段。
四、大數據情境下對地觀(guān)測研究的發(fā)展趨勢
1.從量變到質(zhì)變
對地觀(guān)測領(lǐng)域的大數據現象,在不同尺度上對現有的技術(shù)水平提出了挑戰。對地觀(guān)測領(lǐng)域的大數據現象包括 4 個(gè)方面:①數據量劇增,已經(jīng)達到 PB 量級;②數據類(lèi)型多樣,來(lái)自空基、天基的各種不同成像機理及數據獲取方式、不同時(shí)空分辨率和光譜特性的傳感器數據和地面臺站的觀(guān)測數據及實(shí)驗模擬數據、統計數據等構成了紛繁復雜的數據類(lèi)型;③應用場(chǎng)景眾多,目前對地觀(guān)測數據在氣象、水文、能源、農林種植、工礦開(kāi)發(fā)及災害應急等諸多領(lǐng)域體現了其應用價(jià)值;④應用服務(wù)時(shí)間尺度多種多樣,天氣預報、災害應急等需要實(shí)時(shí)或準實(shí)時(shí)的數據分發(fā)反饋,而地圖測繪、土地變化等則需要中長(cháng)期的對地觀(guān)測數據,不需要高時(shí)效性。
2.多數據中心協(xié)同處理
傳統的對地觀(guān)測知識發(fā)現的科研模式在大數據情境下已經(jīng)不再適用,原因是傳統的科研模型不具有普適性且支持的數據量受限,受到數據傳輸、存儲及時(shí)效性需求的制約等。因此,新知識正更多來(lái)自于大數據的使用,數據生命周期中信息學(xué)流程的變化正引發(fā)傳統科研模式的變化。以“用戶(hù)需求”為導向的對地觀(guān)測活動(dòng),需要為有不同應用需求的用戶(hù)提供恰當的數據產(chǎn)品及信息資源,要求對地觀(guān)測數據實(shí)時(shí)處理及快速分發(fā)。實(shí)現這一目標的關(guān)鍵是多中心協(xié)同計算,通過(guò)構建分布式多中心計算環(huán)境,將大量松散綁定或獨立的數據處理任務(wù)動(dòng)態(tài)分配給閑置計算資源,實(shí)現資源動(dòng)態(tài)調度及任務(wù)分配。目前需要解決的問(wèn)題是如何實(shí)現有效地調度計算資源及跨異構系統計算時(shí)如何維持系統的高性能等。
3.模型驅動(dòng)到數據中的知識發(fā)現模式
傳統的數據生命周期信息學(xué)流程是從數據到信息,再通過(guò)模型進(jìn)行知識發(fā)現。而隨著(zhù)數據量的爆炸式增長(cháng),可用模型已不能對海量數據進(jìn)行模擬推演,因此由模型發(fā)現知識的傳統方法已經(jīng)不能適應大數據時(shí)代的需求。
4.多學(xué)科交叉的科學(xué)研究
全球性的資源、環(huán)境問(wèn)題日益凸顯,使得全球變化問(wèn)題和可持續發(fā)展成為全世界科學(xué)家關(guān)注的焦點(diǎn)和研究的重點(diǎn)。全球變化的研究對象包括大氣圈、水圈、生物圈、人文圈并涉及外層空間,需要理解并掌握這些圈層中各個(gè)要素之間的物理、化學(xué)、生物、人文的影響過(guò)程和規律,需要自然科學(xué)、社會(huì )科學(xué)和工程科學(xué)相融合的面向大數據的新科學(xué)研究方法,也需要科學(xué)數據和互聯(lián)網(wǎng)數據之間的全新耦合和整合方法。
【大數據時(shí)代對地觀(guān)測衛星的發(fā)展現狀與趨勢論文】相關(guān)文章:
我國IPTV現狀與發(fā)展趨勢的論文03-04
移動(dòng)營(yíng)銷(xiāo)現狀及發(fā)展趨勢論文11-06
國內電子病歷的發(fā)展現狀與趨勢論文05-21
民族體育發(fā)展現狀與發(fā)展趨勢研究論文05-21
機械制造工藝發(fā)展現狀與發(fā)展趨勢論文05-17
林業(yè)發(fā)展現狀及我國林業(yè)發(fā)展趨勢論文05-15