• <xmp id="om0om">
  • <table id="om0om"><noscript id="om0om"></noscript></table>
  • 數據科學

    人工智能致力于為法律領域帶來秩序

    斯坦福大學的一個研究團隊開發了一個 LLM 系統,以減少官樣文章。

    被稱為“System for Statutory Research” (STARA) 的 LLM 可以幫助政策制定者快速、廉價地解析大量規則,以識別冗余、過時或過于繁重的法律。研究人員表示,它最終可以提高政府的效率。

    舊金山市律師 David Chiu 的辦公室最近使用 STARA 篩選該市的市政代碼和已發布的解決方案,其中包括 27 卷和近 1600 萬個字。幾十年來,這些法律要求不同的機構創建大約 500 份報告供該市審查。AI 分析了舊金山的法律,確定了每個城市授權的報告,并強調了可以調整的報告,與類似的報告相結合,或者完全歸零。

    領導 STARA 團隊的斯坦福大學法學教授 Daniel Ho 表示:“監管改革的最大障礙之一是僅僅了解現有法律或法規的內容。”他表示,舊金山因程序問題而聲名大噪,而且靠近硅谷,這似乎是測試 STARA 的好地方。

    像律師一樣思考

    從歷史上看,僅使用布爾搜索來梳理聯邦、州或城市代碼是一項艱巨的任務,而且在很大程度上是不夠的。即使是最好的單詞或短語搜索也會被不透明的法律術語阻止。定律有自己定義的術語,通常交叉參考章節或單個段落嵌套在截然不同的法規中。

    也許最令人苦惱的是,法律密集且很少更新。

    《美國法典》是所有聯邦法律的集合,包含超過 3200 萬個字詞,包括 54 個不同的標題。國會授權的報告數量太多 (官方估計從 2500 份到 3359 份不等) ,因此國會對這些報告置若聞。2020 年,國會研究局表示,他們“不知道有一種搜索方法可以準確說明需要提交給國會的所有報告。”

    同樣,包括 San Francisco 在內的州和城市也必須避開密集的法律威脅。

    斯坦福大學監管、評估、治理實驗室 (RegLab) 的研究人員訓練 AI 像律師一樣思考。

    Ho 表示,STARA 旨在全面解釋法律文本,尋找“statutory trees”。在實踐中,這意味著一起閱讀法律的各個方面,而不是作為獨立的組成部分。例如,法律的標題、章節和 statutory definitions,以及對其他法律的任何 cross-references,都是根據上下文理解的。

    RegLab 團隊發現,這種基于領域信息的解讀顯著提高了準確性和速度。

    “我們的模型系統對準則條款進行推理的方式與我們向法律專業學生教授《Statutory Interpretation 101》的方式相同,”Ho 說。“從本質上講,我們教會學員必須注意定義的術語、代碼中的交叉引用以及代碼的整體結構。”

    研究人員使用 LLaMA-3 70b 和 NVIDIA A100 Tensor Core GPU 以及 PyTorch 和 vLLM 作為基礎模型。經過預訓練,模型能夠在 94% 到 99% 的時間內準確識別法規和法定授權報告中的相關語言。他表示,STARA 的性能明顯優于需要執行相同搜索的現有 LLM,其提取精度比基礎系統高 2.7 倍。

    節省資金和時間

    STARA 的價格和節省時間的潛力或許與注重成本的立法者相關。

    一項研究任務需要兩個人 8 到 13.5 小時,花費約 3000 美元,STARA 只需 20 分鐘就能完成,花費約 86 美分。

    Ho 和他的團隊計劃在《Proceedings of the International Conference on AI and Law (ICAIL)》上發表一篇關于 STARA 的論文。在這篇論文中,RegLab 團隊引用了舊金山市副檢察長的話,稱該模型“非常有用”

    在舊金山與 STARA 和 Ho 的團隊的合作下,市檢察長 Chiu 發起立法,修改了近 500 份城市報告中的三分之一,并完全刪除了 140 份報告。

    Ho 和他的團隊目前正在與幾個有興趣使用 STARA 來幫助簡化其法定制度的州和市進行討論。

    “與我們合作的市政律師有力地說明了技術如何幫助減少政策上的污。”Ho 說。

    閱讀有關 STARA 的更多報道,以及 RegLab 如何部署類似技術來在加利福尼亞州圣克拉拉執行非法的種族契約。

    0

    標簽

    人人超碰97caoporen国产