FLARE – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Thu, 17 Apr 2025 05:49:19 +0000 zh-CN hourly 1 196178272 在大型語言模型時代,通過消息量化和流式傳輸實現高效的聯邦學習 http://www.open-lab.net/zh-cn/blog/efficient-federated-learning-in-the-era-of-llms-with-message-quantization-and-streaming/ Wed, 16 Apr 2025 05:23:34 +0000 http://www.open-lab.net/zh-cn/blog/?p=13572 Continued]]> 聯邦學習 (Federated Learning, FL) 已成為一種在分布式數據源中訓練機器學習模型的有前景的方法,同時還能保護數據隱私。但是,在平衡模型要求和通信能力時,FL 面臨著與通信開銷和本地資源限制相關的重大挑戰。 特別是在當前的大語言模型 (LLMs) 時代,FL 在部署具有數十億參數的 LLMs 時面臨著計算挑戰。這些模型的龐大規模加劇了通信和內存限制。由于帶寬限制,一次性傳輸完整的模型更新可能不可行,并且本地內存限制可能會使處理大型模型進行通信具有挑戰性。解決這些問題需要創新策略。 NVIDIA FLARE 是一款與領域無關、開源且可擴展的聯邦學習 SDK,通過引入可靠的通信功能、對多個并發訓練作業的支持以及針對可能因網絡條件而中斷的作業的魯棒性,增強了現實世界的聯邦學習體驗。 NVFlare 2.4.0 版本引入了流式傳輸 API,

Source

]]>
13572
借助 NVIDIA FLARE 和 Meta ExecuTorch,在移動設備上輕松進行聯邦學習 http://www.open-lab.net/zh-cn/blog/effortless-federated-learning-on-mobile-with-nvidia-flare-and-meta-executorch/ Fri, 11 Apr 2025 05:41:04 +0000 http://www.open-lab.net/zh-cn/blog/?p=13578 Continued]]> NVIDIA 和 Meta 的 PyTorch 團隊宣布開展突破性合作,通過集成 NVIDIA FLARE 和 ExecuTorch ,將聯邦學習 (FL) 功能引入移動設備。 NVIDIA FLARE 是一款與領域無關、開源、可擴展的 SDK,使研究人員和數據科學家能夠根據聯合范式調整現有的機器學習或深度學習工作流程。它還使平臺開發者能夠為分布式多方協作構建安全、隱私保護的產品。 ExecuTorch 是一種端到端解決方案,可跨移動和邊緣設備實現設備端推理和訓練功能。它是 PyTorch Edge 生態系統的一部分,支持將各種 PyTorch 模型高效部署到邊緣設備。 通過集成這兩者,我們為您提供了一個解決方案,讓您在移動設備上利用 FL 的強大功能,同時保護用戶隱私和數據安全。要啟用跨設備 FL,有兩個關鍵組件: 借助 NVIDIA FLARE 和…

Source

]]>
13578
集成 Flower和 NVIDIA FLARE,加速聯邦學習生態系統發展 http://www.open-lab.net/zh-cn/blog/supercharging-the-federated-learning-ecosystem-by-integrating-flower-and-nvidia-flare/ Mon, 24 Mar 2025 09:19:21 +0000 http://www.open-lab.net/zh-cn/blog/?p=13375 Continued]]> 近年來, Flower 和 NVIDIA FLARE 等開源系統已成為聯邦學習 (FL) 領域的關鍵工具,每個系統都有其獨特的關注點。Flower 支持統一的 FL 方法,使研究人員和開發者能夠輕松設計、分析和評估 FL 應用。 隨著時間的推移,它積累了一套豐富的策略和算法,在學術界和行業中培育了一個蓬勃發展的社區。 另一方面,NVIDIA FLARE 面向生產級應用程序,提供專為可靠性和可擴展性而構建的企業就緒型運行時環境。通過專注于強大的基礎設施,FLARE 使 FL 部署能夠無縫滿足現實世界環境的需求。 本文介紹了我們在連接這兩個框架方面所做的努力,并展示了它們的聯合優勢如何提升整個 FL 生態系統。這種集成使使用 Flower 開發的應用能夠在 FLARE 運行時上以原生方式運行,而無需修改任何代碼。通過將 Flower 廣泛采用、

Source

]]>
13375
利用 XGBoost 中的 CUDA 加速同態加密實現聯邦學習數據隱私安全性 http://www.open-lab.net/zh-cn/blog/security-for-data-privacy-in-federated-learning-with-cuda-accelerated-homomorphic-encryption-in-xgboost/ Wed, 18 Dec 2024 09:22:20 +0000 http://www.open-lab.net/zh-cn/blog/?p=12489 Continued]]> XGBoost 是一種廣泛用于表格數據建模的機器學習算法。為了將 XGBoost 模型從單站點學習擴展到多站點協作訓練,NVIDIA 開發了 Federated XGBoost ,這是一種用于聯邦學習的 XGBoost 插件。它包括用于跨去中心化數據源聯合訓練 XGBoost 模型的垂直協作設置,以及 水平直方圖和樹的聯合學習 。 在垂直環境下,每個方擁有面向全體人口的部分特征,并且只有一個方持有該標簽。標簽所有者被稱為主動方,而所有其他方都是被動方。在橫向設置下,每個方擁有所有特征和標簽信息,但僅限部分人口。 此外, NVIDIA FLARE 是一款與領域無關、開源且可擴展的聯邦學習 SDK,通過引入處理通信挑戰的功能來增強現實世界的聯邦學習體驗。其中包括多項并發訓練作業,以及可能因網絡條件而中斷的作業。 目前,

Source

]]>
12489
NVIDIA FLARE 助力聯邦 XGBoost 實現實用高效 http://www.open-lab.net/zh-cn/blog/federated-xgboost-made-practical-and-productive-with-nvidia-flare/ Fri, 28 Jun 2024 05:21:48 +0000 http://www.open-lab.net/zh-cn/blog/?p=10546 Continued]]> XGBoost 是一種高效且可擴展的機器學習算法,廣泛應用于回歸、分類和排名任務。它基于梯度提升原則,將多個弱學習者(通常是決策樹)的預測結合起來,以生成穩健的整體模型。 XGBoost 在處理大型數據集和復雜數據結構方面表現優異,這要歸功于其高效的實施和高級功能,如正則化、并行處理和處理缺失值。其通用性和高性能使其成為各行各業數據科學競賽和實際應用的熱門選擇。 XGBoost 1.7.0 版本引入了 Federated XGBoost,使多個機構能夠無需移動數據即可聯合訓練 XGBoost 模型。在 XGBoost 2.0.0 版本中,此功能得到進一步增強,以支持垂直聯合學習。OSS Federated XGBoost 提供 Python APIs 用于模擬基于 XGBoost 的聯合訓練。 自 2023 年以來,NVIDIA 聯邦學習應用程序運行時環境 (FLARE)…

Source

]]>
10546
借助 NVIDIA FLARE 2.4,在幾分鐘內將機器學習轉變為聯邦學習 http://www.open-lab.net/zh-cn/blog/turning-machine-learning-to-federated-learning-in-minutes-with-nvidia-flare-2-4/ Wed, 06 Mar 2024 06:12:36 +0000 http://www.open-lab.net/zh-cn/blog/?p=9115 Continued]]> 協同學習 (FL) 受到加速采用的原因在于其分布式、保護隱私的特性。在醫療健康和金融服務等領域,協同學習 (FL) 作為一種隱私增強技術,已成為技術堆棧的關鍵組成部分。 在本文中,我們討論了 FL 及其優勢,深入探討了聯邦學習為何如此受歡迎。此外,我們還介紹了 NVIDIA FLARE 2.4.0 版本中引入的三個關鍵特征,這些特征有助于從集中式機器學習過渡到聯邦學習,并通過流式傳輸 API 增強大型語言模型 (LLM) 支持。此外,我們還展示了各種參數調整任務。 最新版本的 FLARE 擴展了 FL 工作流模式,為研究人員提供更多工作流程自定義選項。我們分享了醫療健康、銀行、金融服務和保險 (BFSI) 領域的不同用例,以展示 FL 應用程序在生產環境中或通過示例。 FL 是一種機器學習方法,允許在分布式設備上進行模型訓練和數據分析,同時保護本地數據的私密性。

Source

]]>
9115
借助 NVIDIA FLARE 實現可擴展聯邦學習,提升 LLM 性能 http://www.open-lab.net/zh-cn/blog/scalable-federated-learning-with-nvidia-flare-for-enhanced-llm-performance/ Thu, 29 Feb 2024 07:02:21 +0000 http://www.open-lab.net/zh-cn/blog/?p=9150 Continued]]> 隨著人工智能技術的不斷發展,大型語言模型(LLM) 的有效數據管理成為一個重要挑戰。數據是模型性能的核心。盡管大多數先進的 機器學習 算法以數據為中心,但由于各種因素(如隱私、監管、地緣政治、版權問題和移動大型數據集所需的巨大努力),并非所有必要數據都可以集中。 本文探討了如何利用聯邦學習(FL),由NVIDIA FLARE提供支持,以簡單且可擴展的方式應對這些挑戰。這些功能支持監督式微調和參數效率的精細調整,從而增強模型的準確性和穩健性。 在許多 LLM 任務中,需要從多個來源獲取數據是一種常見場景。例如,為醫學研究收集來自不同醫院的報告,或從各種機構收集金融數據進行分析。集中這些數據可能不切實際,也可能受到隱私問題、法規和其他障礙的限制。聯合學習提供了一個精美的解決方案。 FL 已成為解決這些數據挑戰的技術。

Source

]]>
9150
使用 NVIDIA FLARE 通過聯合學習防止健康數據泄露 http://www.open-lab.net/zh-cn/blog/preventing-health-data-leaks-with-federated-learning-using-nvidia-flare/ Thu, 28 Sep 2023 04:54:39 +0000 http://www.open-lab.net/zh-cn/blog/?p=7969 Continued]]> 在 2021 年,超過 4000 萬人的健康數據被泄露,而且這個趨勢并不樂觀。 聯邦學習和分析的主要目標是在不訪問遠程站點原始數據的情況下執行數據分析和機器學習。這就是您不擁有且不應該直接訪問的數據。但是,如何更自信地實現這一點? 想象一個孤立的聯邦學習場景,一家生物技術公司與醫院網絡合作。他們正在根據本地基礎設施中存儲的圖像的 CT 掃描結果,合作開發改進的肺癌檢測模型。 聚合器和生物技術數據科學家均不得直接訪問圖像或下載圖像。他們只能對遠程模型進行聯合學習、訓練和驗證,并構建更好的聚合模型,然后與所有醫院共享這些模型,以提高通用性和檢測準確性。 數據保護的目標一開始似乎顯而易見。這是一個權限、角色的問題,可能還有一些加密問題。遺憾的是,這并不像看上去那么簡單。 聯合學習解決方案往往側重于以下方面:

Source

]]>
7969
人人超碰97caoporen国产