您當前的位置 :首頁 > 科技 > 科技博覽
投稿

全球首個百億級遙感解譯基礎模型發(fā)布

2024-10-07 08:33:55 來源:光明日報 作者: 點擊圖片瀏覽下一頁

 記者日前從中國科學院空天信息創(chuàng)新研究院(以下簡稱“空天院”)獲悉,空天院付琨研究員團隊聯(lián)合鵬城實驗室正式發(fā)布自主研制的百億級遙感解譯基礎模型——“空天·靈眸”3.0版,這是迄今為止全球首個百億參數(shù)級空天一體遙感解譯基礎模型。

“空天·靈眸”是我國首個面向多模態(tài)遙感數(shù)據(jù)生成式基礎模型,也是首個專為遙感領域打造的行業(yè)基礎模型。自2022年首次推出后,空天院研究團隊在“基礎模型+下游任務”計算范式積累上持續(xù)探索。今年3月起,研究團隊與鵬城實驗室深度合作,基于中國算力網“鵬城云腦Ⅱ”樞紐節(jié)點,采用512張昇騰910顯卡,歷時數(shù)月攻關完成了在4億張國產化多模態(tài)空天遙感數(shù)據(jù)樣本上的預訓練,基礎模型參數(shù)規(guī)模首次超過百億。

中國科學院空天信息創(chuàng)新研究院研究員孫顯說:“我們如果把基礎模型看作一個機器人,那么,‘參數(shù)’就相當于它的‘記憶細胞’和‘知識細胞’。如果參數(shù)規(guī)模小,則它能記住和處理的信息就相對有限,只能做一些比較簡單的任務。參數(shù)規(guī)模越大,這兩種細胞就越多,它就能捕捉、記憶和處理更復雜的信息,從而更加準確、精細地完成更困難、更復雜的任務。”

“空天·靈眸”3.0版內核工作架構是聯(lián)合團隊基于熱傳導,自主研發(fā)的一套小而精的原創(chuàng)性架構——受傳熱學物理思想啟發(fā),聯(lián)合團隊將場景目標間視覺語義傳播建模為熱能擴散過程,從而使該架構有效突破了遙感模型推理的性能和速度瓶頸,計算速度較傳統(tǒng)結構模型提升2.4倍以上。

孫顯介紹,這一架構實現(xiàn)了模型數(shù)據(jù)學習、推理等速度的大幅提升。例如,原來訓練1000萬張數(shù)據(jù)樣本,需要大約300多塊顯卡,現(xiàn)在只需要1/3的數(shù)量,處理速度還提升了約2.4倍。

“空天·靈眸”3.0版目前已表現(xiàn)出極為優(yōu)秀的泛化解譯性能,在可見光、合成孔徑雷達、熱紅外、多光譜等多傳感器衛(wèi)星數(shù)據(jù)基礎上,拓展至航空遙感飛機、無人機等不同航空平臺觀測數(shù)據(jù)的自動化、高精度解譯處理。孫顯說:“尤其是航空大傾角成像過程中,極易出現(xiàn)畸變、遮擋、缺失等干擾,模型對此依然可以保持高精度的識別能力。”

目前,“空天·靈眸”3.0版在覆蓋場景分類、目標檢測、語義分割、變化檢測等6大類任務的23個國際基準數(shù)據(jù)集上測試,相較于當前的主流模型,精度平均提升4%至10%,指標均達到領先水平,并已在應急、國土、海洋、住建等多個行業(yè)部署試運行,特別是在最具挑戰(zhàn)性的復雜要素精細分類、運動小目標連續(xù)跟蹤等任務上性能卓越,為天臨空地一體化應用提供了一套行之有效的解決方案。未來,研究團隊將持續(xù)推動“空天·靈眸”3.0版在國民經濟各個行業(yè)的落地應用。

責任編輯: 劉偉
版權聲明:
·凡注明來源為“今日報道網”的所有文字、圖片、音視頻、美術設計和程序等作品,版權均屬今日報道網所有。未經本網書面授權,不得進行一切形式的下載、轉載或建立鏡像。
·凡注明為其它來源的信息,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。
不良信息舉報信箱 網上投稿
關于本站 | 廣告服務 | 免責申明 | 招聘信息 | 聯(lián)系我們
今日報道網 版權所有 Copyright(C)2005-2016 魯ICP備16043527號-1

魯公網安備 37010402000660號