• <xmp id="om0om">
  • <table id="om0om"><noscript id="om0om"></noscript></table>
  • 生成式人工智能/大語言模型

    基于 NVIDIA AI 基礎模型的高性能 Mamba-Chat

    本周發布的內容使用了 NVIDIA 優化過的 Mamba 聊天模型,您現在就可以在瀏覽器中體驗。

    本文是 Model Mondays 計劃的一部分,該計劃致力于讓用戶輕松訪問先進的社區和 NVIDIA 構建的模型。 NVIDIA 使用 TensorRT-LLM 對這些模型進行優化,并以 。nemo 文件的形式提供,以便輕松進行自定義和部署。

    NVIDIA AI 基礎模型和端點 提供對社區和 NVIDIA 構建的一系列精心策劃的生成式 AI 模型的訪問權限,以便在企業應用程序中體驗、自定義和部署。如果您尚未嘗試使用領先的模型,例如 Nemotron-3, Mixtral 8X7B, Lama 70B 以及 穩定擴散,請在 NVIDIA AI Playground 中進行訓練。

    Mamba-Chat

    Mamba-Chat 生成式 AI 模型由 Haven 發布,是一種先進的語言模型,它使用狀態空間模型架構,將其與之前主導該領域的傳統基于 Transformer 的模型區分開來。這種創新方法使 Mamba-Chat 能夠更高效地處理更長的序列,而無需處理隨輸入長度二次擴展的計算復雜性。

    相反,其架構支持序列長度的線性擴展,并集成了選擇性聚焦機制。這顯著增強了其以前所未有的效率處理大規模復雜數據集的能力。

    2.8 B 模型在各種任務中表現出色。Mamba-Chat 通過針對特定應用程序(例如網絡安全)的微調突出了其通用性,展示了其在專業知識領域的適應性和潛力。

    該模型的效率使其特別適合各種應用,從聊天機器人交互到基因組學和時間序列數據分析等領域的復雜數據分析。

    體驗模型

    NVIDIA 優化了 Mamba-Chat,現在您可以通過 NGC 目錄上的簡單用戶界面直接在瀏覽器中進行體驗。在Mamba-Chat Playground 輸入您的提示,然后查看在完全加速的堆棧上運行的模型生成的結果。

    Screenshot of the Mamba-Chat model running in the NGC catalog user interface, where the model understands natural language and generates responses based on user input prompt.
    圖 1.Mamba 聊天根據用戶提示生成響應的示例

    您還可以使用 API 測試模型。登錄 NGC 目錄,然后訪問 NVIDIA Cloud Credits,通過將應用程序連接到 API 端點來大規模體驗模型。

    開始使用

    NVIDIA AI Enterprise 提供安全性、支持、穩定性和可管理性,以提高 AI 團隊的生產力,降低 AI 基礎架構的總成本,并確保從 POC 到生產的平穩過渡。當 AI 模型準備好部署以用于業務運營時,安全性、可靠性和企業級支持至關重要。

    試用 Mamba-Chat 通過用戶界面或 NGC 目錄中的 API。

    ?

    0

    標簽

    人人超碰97caoporen国产