您現在的位置：
首頁
油氣
石油
油氣大模型破局需從三方面發力

油氣大模型破局需從三方面發力

2024-10-21 09:16:21 科技日報　作者：劉合

在人工智能技術日新月異的今天，生成式人工智能的代表——ChatGPT的橫空出世，不僅在短時間內吸引了全世界關注的目光，更激發了各行業對大型預訓練模型的無限遐想。油氣行業作為國民經濟的支柱之一，同樣期待它能為油氣勘探、開發帶來新變革。尤其是隨著國內油氣資源品質逐步劣質化，油氣勘探開發難度逐漸加大，亟須運用新技術提質增效。

油氣大模型應用面臨挑戰

數據、算力和算法是大模型發展的核心要素。其中，數據是大模型應用的基石，算力是大模型應用的保障，算法是大模型應用的工具。由于油氣行業具有特殊性，在上述三個層面，油氣大模型開發都面臨著諸多挑戰。

在數據方面，油氣大模型應用面臨數據稀缺、復雜和安全性的挑戰。一是油氣行業的數據涵蓋了地質勘探、鉆井、生產和運輸等多個環節，每個環節的數據采集都伴隨高昂的成本，樣本數量少且獲取非常困難，采集回的數據還具有多解性和不可驗證性的特點。二是油氣行業的數據類型非常多樣化，處理這些不同種類、不同版本、不同結構的數據本身就充滿挑戰。三是大模型需要學習海量數據，但油氣行業對數據的安全性和保密性有著極高的要求，數據不能上傳公有云，且必須防止泄露，因此普遍存在“數據孤島”問題。這一現狀使得如何在保障數據安全前提下，整合分散的數據并訓練行業基礎模型，成為油氣行業大模型應用的關鍵難題。

在算力方面，油氣大模型的訓練和優化也面臨著算力資源不足的挑戰。大模型的訓練和優化通常需要巨大的算力資源，這往往伴隨著相當高的投入成本。自建算力中心需要巨額資金投入，而租賃算力又存在數據安全和隱私保護的問題。目前，國內油氣行業僅具備有限的微調算力，普遍不具備訓練行業基礎模型所需的高水平算力。此外，由于各種原因，國內油氣行業在短期內很難建立起滿足大模型需求的算力資源。這一問題進一步加劇了算力資源的短缺，使得大模型的應用和發展受到嚴重制約。

在算法方面，油氣大模型也面臨版權糾紛等挑戰。算法的優劣直接影響大模型的實際應用效果。相較于傳統深度學習等算法，大模型的技術門檻更高，目前的發展主要依賴少數高端算法人才推動。盡管許多開源大模型算法可以作為研發基礎，但它們可能缺乏必要的技術支持和安全保障，存在商業機密泄露的風險，且其能力往往不如閉源算法。此外，開源算法的版權協議中存在諸多限制條款，使得基于開源算法進行研發時可能面臨版權糾紛。如果選擇使用閉源算法，則難以實現核心算法的自主可控。

從數據、算力和算法入手推動大模型應用

油氣大模型應用并非坦途，需要在數據、算力和算法等方面破局。

首先，數據之困需破冰。面對數據采集高成本與復雜性并存的挑戰，破解數據之困，要以大模型應用為契機，推動數據治理，確保數據的全面性、準確性和時效性。油氣行業在大模型方面的核心競爭力是“行業數據”，要做好“訓練樣本庫”的基本功。油氣企業必須強化數據全生命周期管理，從數據源頭、數據采集、數據清洗、數據融合和匹配、數據完整性增強、數據標注等環節嚴格規范，建立高質量的訓練樣本庫，提升數據治理能力，為模型提供堅實的數據基礎。同時，應通過數據脫敏、數據加密、訪問控制和審計、合規性審查等方式加強數據安全和隱私性保護。如設置合適的權限和用戶角色，限制用戶對數據庫的訪問和操作，保護數據的安全性。還需進行數據庫的維護和優化工作，包括定期備份、數據清理、性能監控等。在此前提下，構建一批高質量開源數據集，推動油氣大模型研發生態建設。

其次，算力建設應靈活。面對資金投入與隱私保護之間平衡的挑戰，破解算力之困，應以油氣大模型為契機，推動融合算力建設。可采取租賃與自建相結合的方式，注重智算能力建設的同時，加強數據安全與隱私保護。例如，企業應根據自身業務需求、成本預算和技術實力，靈活選擇算力獲取方式。對于常規的計算任務，可通過租賃公有云資源快速響應；而對于涉及敏感數據或需長期穩定運行的任務，則可考慮自建或合作共建數據中心，確保數據安全與算力的可持續供給。在算力設施規劃上，應注重長遠，實現通用計算、智能計算和高性能計算的融合布局，通用計算滿足日常運營的基本計算需求，智能計算側重于深度學習、機器學習等智能算法的高效執行，高性能計算則針對大規模科學計算和復雜模擬，滿足不同場景的需求，顯著提高算力資源的利用效率。

此外，算法創新勿盲從。面對大模型訓練周期長與迭代速度快的雙重考驗，破解算法之困，應量身定做適合行業特性的算法模型，避免盲目跟風。應理性認識大模型的價值，優先實施場景模型和數據質量優良的L2行業基礎模型，重點應放在微調和適配下游任務上，避免盲目投入通用基礎模型的研發，確保技術棧的自主可控。油氣行業應秉持資源優化配置的原則，聚焦油氣主營業務，從投入成本、產出效益、技術成熟度，以及穩定性、行業聚焦、核心競爭力等方面慎重考慮。在巖心分析、地震資料處理解釋、測井數據分析等特定領域，大模型能發揮顯著作用，但不可過度依賴，應明確模型的適用范圍。

為了推動大模型技術的自主可控，還需加強“AI+能源”復合團隊的建設。訓練、應用大模型不能閉門造車，要打破傳統行業壁壘，注重聯合研發生態的建設，例如推動油氣行業與互聯網企業、高校等的合作，促進跨學科人才整合，形成產學研用緊密結合的創新體系，為油氣大模型應用構建可持續的人才保障。同時，可通過項目合作、人才培養、共建研發平臺等方式加強大模型算法等方面的合作交流，并明確合作目標與分工，以及知識產權分配與管理、數據保密和隱私保護等制度和規范。

大模型必將推動油氣行業新質生產力發展，未來可期，但道阻且長。油氣行業要充分認識油氣大模型的特殊性，從數據、算力、算法等方面做好工作，穩扎穩打，逐步推進，讓AI成為推動油氣行業轉型升級的重要驅動力。

（作者系中國工程院院士、中國石油勘探開發研究院正高級工程師）

責任編輯：江曉蓓

標簽：油氣大模型

上一篇：華北油田打造綠色低碳發展新高地為“城市圈... 下一篇：華北油田采油四廠“黨旗紅”引領奪油上產“...

亚洲无码日韩AV无码网站,亚洲制服丝袜在线二区,一本到视频在线播放,国产足恋丝袜在线观看视频

油氣大模型破局需從三方面發力

相關資訊

最新資訊

推薦專題