勞倫斯伯克利國家實驗室(Lawrence Berkeley National Laboratory) 的研究人員在美國各地散布著多達 80 萬口被遺忘的油氣井,他們開發了一種 AI 模型,能夠大規模準確定位可能向環境中泄漏有毒化學物質和溫室氣體(如甲烷) 的井。
該模型旨在識別自 1800 年代中期以來美國挖掘的大約 3.7M 油氣井中的許多井。
但其主要目的是幫助找到特定的井子集:無記錄的孤井 (UOWs)。
這些井并沒有出現在官方記錄中,也沒有已知的所有者,因此沒有任何法律實體負責封存這些“孤井”。此外,這些井的位置,尤其是一個多世紀前鉆得的位置 (當時井口的直徑通常為 6 英寸) 很少出現在識別油氣井的官方數據庫中。
更糟糕的是,這些泄漏的井并非異常。
在美國大約 300 萬平方英里的土地上,估計有 30 萬至 80 萬 UOWs。
要防止可能泄漏的井損害環境,唯一的方法是密封這些井,這通常是用混凝土完成的。
但在密封井口之前,必須先找到井口。
為了大規模準確識別 UOW,LBNL 的團隊在 1947 至 1992 年間創建的美國數字化地圖上訓練了一個視覺語言模型,U-Net。
這些所謂的“四邊形”地圖 (由美國地質調查局匯總并數字化) 的一個關鍵特征是其均勻性和地理參考。井口、油井和森林等物體的符號和顏色大致相同,而且每個符號都準確對應特定的經度和緯度位置。
“這些地圖的一大特色是,它們在整個美國表面高度一致。”勞倫斯伯克利研究人員之一 Fabio Ciulla 說道,他是一篇概述其 AI 和 UOW 工作的論文的主要作者。“我們選擇使用這套特定的歷史地形圖,因為我們可以使用一種以前沒有有效方法來調查大陸范圍內的 UOW。”
研究人員使用加州大學伯克利分校的國家能源研究科學計算中心 (NERSC) 超級計算機(該計算機由 6000 多個 NVIDIA A100 Tensor Core GPU 提供支持),在加利福尼亞州的兩個縣(洛杉磯和克恩)的地圖上訓練他們的井口探測模型,而這兩個縣在 20 世紀初曾是石油和天然氣生產最多的縣。

在開始對模型進行微調之前,研究人員手動標注了 79 張經數字化處理的地理參考地圖,以確保這些地圖能夠準確識別每個井口標志。
借助這些更新后的地圖,該團隊在加利福尼亞州兩個縣的所有地理參考地圖上微調了模型。
為了識別 UOW,研究人員將其在歷史性四邊形地圖上識別的井口模型與加利福尼亞州保存的洛杉磯縣和克恩縣已 知 井口數據庫中的位置進行了交叉引用。
當該模型確定距離已 知 井口超過 100 米的新井口時,研究人員將其視為潛在的 UOW。研究人員在加利福尼亞州和俄克拉荷馬州的四個縣發現了 1,301 個潛在的 UOW。
借助 Google Earth 提供的衛星圖像以及對 UOW 部分潛在站點的現場訪問,該研究團隊致力于驗證井口探測過程的準確性。
研究人員發現,該模型識別 UOW 的準確性各不相同,介于 31%到 98%之間。
在更多的農村地區,該模型在識別 UOW 方面非常準確。但是,在城市地區,該模型的準確性較低,在這些地區,潛在的 UOW 現在可能已經鋪好 (使其更難以驗證),或者模型出錯,混淆了符號為圓形交叉路口或死胡同為井口。
重要的是,該模型證明了其遷移性。
在洛杉磯縣和克恩縣進行交叉參考測試后,該團隊使用相同的微調模型在俄克拉荷馬州的 Osage 和 Oklahoma 縣尋找 UOW。與克恩縣和洛杉磯縣類似,在上世紀末,Osage 和 Oklahoma 縣是該國最大的石油和天然氣生產縣。
該模型從未“看過”俄克拉荷馬州地圖,但其識別潛在 UOW 的準確率與 Kern 縣和 LA 縣相似。
“當我們開始考慮我們的研究時,我們希望找到一種可以擴展到美國許多地區的算法,而無需在許多不同的位置重新訓練模型,”LBNL 的資深科學家兼 UOW 研究的資深作者 Charuleka Varadharajan 說。“我們發現,在加州地圖上訓練的模型,在識別俄克拉荷馬州潛在的 UOW 時,即使不是更高的精度,也保持不變。”
這項研究是美國能源部旨在幫助各州識別 UOW 的計劃的一部分。
展望未來,Ciulla 和 Varadharajan 計劃繼續優化其模型,將其擴展到其他地區,并與有興趣利用其工作來識別 UOW 的州合作。
閱讀研究人員關于 UOW 的論文。
查看有關伯克利研究人員研究的其他 報告 以及勞倫斯伯克利實驗室自己的報告。