]]>14409聚焦:使用 Iguazio 的 MLRun 和 NVIDIA NIM 構建可擴展和可觀察的 AI 以投入生產
http://www.open-lab.net/zh-cn/blog/spotlight-build-scalable-and-observable-ai-ready-for-production-with-iguazios-mlrun-and-nvidia-nim/
Wed, 28 May 2025 05:32:20 +0000http://www.open-lab.net/zh-cn/blog/?p=14048Continued]]>Iguazio (被麥肯錫收購) 與 NVIDIA 的合作使企業組織能夠構建生產級 AI 解決方案,這些解決方案不僅具有高性能和可擴展性,而且具有敏捷性,可用于現實世界的部署。 NVIDIA NIM 微服務對于這些功能至關重要,旨在加速任何云或數據中心的生成式 AI 部署。NIM 微服務支持各種 AI 模型,包括 NVIDIA AI 基礎、社區和自定義模型,支持使用行業標準 API 進行無縫、可擴展的 AI 推理。 在運行時,NIM 會為基礎模型、GPU 和系統的任意組合選擇最佳推理引擎。NIM 容器還提供標準的可觀察性數據源,并內置支持在 NVIDIA GPU 上使用 Kubernetes 進行自動擴展。 MLRun 是一個開源 AI 編排框架,可自動執行整個 AI 工作流,支持在生產環境中部署 NIM。這包括企業級生產就緒型應用所需的所有工作流元素,包括 MLRun…
]]>14048聚焦:個人 AI 借助 NVIDIA Riva 為小企業主帶來 AI 接待員
http://www.open-lab.net/zh-cn/blog/spotlight-personal-ai-brings-ai-receptionists-to-small-business-owners-with-nvidia-riva/
Tue, 29 Apr 2025 08:27:20 +0000http://www.open-lab.net/zh-cn/blog/?p=13660Continued]]>星期二晚上 10 點,Sapochnick Law Firm (一家位于加利福尼亞州圣地亞哥的專業律師事務所) 的電話鈴響了。作為這家公司的客戶,打電話的人在電話鈴響時焦急萬分。他們收到了一封包含可能改變生活的消息的重要信件,并向律師提出了緊急問題。 客戶很快意識到 Sapochnick 團隊可能在幾小時前離開了辦公室,但他們一直在排隊等待,希望至少有一個語音郵件問候可以提供某種幫助。沒有錄音,聲音用熱情、專業的問候打破了沉默。雙方之間自然而然地展開了對話,很明顯,律師事務所發出的聲音遠不止接電話。該公司精通細致入微的移民程序,熟悉該公司處理特定法律場景的方法,最重要的是,該公司擁有公司創始人 Jacob Sapochnick 廣泛的專有知識。 這種真正的互動之所以能夠實現,是因為 Personal AI Receptionist 是一項由 Personal AI 和…
]]>12880聚焦:xpander AI 為 NVIDIA NIM 應用配備 Agentic 工具
http://www.open-lab.net/zh-cn/blog/spotlight-xpander-ai-equips-nvidia-nim-applications-with-agentic-tools/
Wed, 11 Sep 2024 07:50:47 +0000http://www.open-lab.net/zh-cn/blog/?p=11273Continued]]>為智能體 AI 應用配備工具將引領 AI 進入下一階段。通過使自主智能體和其他 AI 應用能夠獲取實時數據、執行操作,并與外部系統交互,開發者可以彌合與新的真實用例之間的差距,從而顯著提高工作效率和用戶體驗。 xpander AI 是 NVIDIA Inception 計劃的成員,該公司開發了獨特的 AI 就緒型連接器技術,可在 AI 應用和互補系統之間實現連接,從而將強大的新用例變為現實。xpander 幫助 AI 工程師使用高級工具調用用例構建應用,而無需進行大量集成工作或提高工具調用的準確性,這兩者都是生產過程中的常見障礙。 xpander AI 連接器可通過多智能體 AI 工作流幫助開發者克服這些挑戰,該工作流可提取與目標系統相關的數據,并為該系統創建經過優化的連接器,以供智能體應用使用。
]]>10426借助 Union.ai 和 NVIDIA DGX 云實現 AI 工作流程的大眾化
http://www.open-lab.net/zh-cn/blog/democratizing-ai-workflows-with-union-ai-and-nvidia-dgx-cloud/
Tue, 23 Apr 2024 04:31:17 +0000http://www.open-lab.net/zh-cn/blog/?p=9623Continued]]>GPU 最初專用于在電子游戲中渲染 3D 圖形,主要用于加速線性代數計算。如今,GPU 已成為 AI 革命的關鍵組成部分之一。 現在,我們依靠這些主力來完成深度學習工作負載,處理龐大而復雜的半結構化數據集。 然而,隨著對基于 AI 的解決方案的需求大幅增加,獲取高端 GPU 變得更加困難,更不用說為自己的用例設置和配置高端 GPU 所帶來的投資了。 為滿足 AI 訓練需求,NVIDIA 提供先進的加速計算資源,供用戶訪問,而無需自行尋找、設置和配置基礎設施。對于希望突破深度學習范式所能完成的工作的 AI 團隊來說,NVIDIA DGX Cloud 提供了一場游戲變革。 除了訪問云端的 AI 超級計算之外,您還必須構建代碼并圍繞代碼進行計算,以提高 AI 應用程序的效率和性能。根據我們的經驗,要做到這一點,最好的方法是使用 AI 編排:基礎設施、代碼、數據和模型之間的交集。