大型語言模型( LLMs )

2023年 10月 12日
適用于數據中心和 AI 時代的網絡
十多年來,傳統的云數據中心一直是計算基礎設施的基石,滿足了各種用戶和應用程序的需求。然而,近年來,
1 MIN READ

2023年 10月 11日
宣布推出 SteerLM:在推理期間自定義 LLM 的簡單實用技術
近年來,隨著大語言模型 (LLMs)例如 GPT-3、Megatron-Turing、Chinchilla、PaLM-2、
3 MIN READ

2023年 9月 11日
NVIDIA GH200 Grace Hopper 超級芯片首次亮相,取得領先的 MLPerf 推理 v3.1 結果
人工智能正在改變計算方式,推動AI在全球范圍內的應用部署。智能聊天機器人、圖像和視頻合成的簡單文本提示、
4 MIN READ

2023年 9月 8日
NVIDIA TensorRT-LLM 在 NVIDIA H100 GPU 上大幅提升大語言模型推理能力
大語言模型(LLM)提供異常強大的新功能,拓展了 AI 的應用領域。但由于其龐大的規模和獨特的執行特性,很難找到經濟高效的使用方式。
3 MIN READ

2023年 8月 29日
在 GPU 加速的 Google Cloud 上使用 NVIDIA NeMo 簡化生成式 AI 開發
生成式人工智能已成為我們時代的變革力量,使各行各業的組織能夠實現無與倫比的生產力水平,提升客戶體驗,并提供卓越的運營效率。
2 MIN READ

2023年 8月 10日
選擇大型語言模型定制技術
大語言模型(LLM)正在成為企業不可或缺的工具,用于改善他們的運營、客戶互動和決策過程。然而,由于行業特定的術語、領域專業知識或獨特的要求,
3 MIN READ

2023年 8月 8日
使用 NVIDIA AI Workbench 無縫開發和部署可擴展的生成式 AI 模型
開發自定義 生成式人工智能 模型和應用程序是一段旅程,而不僅僅是一個目標。這個過程從選擇一個預訓練的模型開始,例如 大語言模型,
3 MIN READ

2023年 8月 4日
緩解針對 LLM 應用程序的存儲提示注入攻擊
Large Language Model (LLM) 的應用程序安全性中存在即時注入攻擊。這些攻擊是獨特的,因為惡意文本會被存儲在系統中。
2 MIN READ

2023年 8月 3日
保護 LLM 系統不受即時注入的影響
即時注入是一種新的攻擊技術,專門針對 大語言模型 (LLMs),使得攻擊者能夠操縱 LLM 的輸出。由于 LLM 越來越多地配備了“插件”,
3 MIN READ

2023年 7月 10日
使用分布式數據集上的聯合學習使 LLM 適應下游任務
大型語言模型( LLM ),如 GPT,由于其理解和生成類人文本的能力,已成為自然語言處理( NLP )中的革命性工具。
2 MIN READ

2023年 6月 14日
如何從大型語言模型中獲得更好的輸出
大語言模型(LLM)因其前所未有的規模理解和處理人類語言的能力,在全球引發轟動,改變了我們與技術互動的方式。 經過大量文本語料庫的訓練,
3 MIN READ

2023年 6月 14日
借助 NVIDIA FLARE 實現的聯合學習,提升您的人工智能工作流程
在工作流程中利用人工智能的企業面臨的主要挑戰之一是管理支持大規模培訓和部署機器學習( ML )模型所需的基礎設施。為此,
2 MIN READ

2023年 5月 29日
使用 NVIDIA Spectrum-X 網絡平臺進行渦輪增壓生成 AI 工作負載
大型語言模型( LLM )和人工智能應用程序,如ChatGPT和 DALL-E 最近出現了快速增長。由于 GPU 、 CPU 、 DPU 、
2 MIN READ

2023年 5月 26日
人工智能推動科學計算革命
AI 及其最新子域,生成式人工智能正在顯著加快科學計算研究。從藥物和材料科學到天文學,這項改變游戲規則的技術正在開辟新的可能性,
2 MIN READ

2023年 5月 15日
使用 Alpa 和 Ray 在大型 GPU 集群中高效擴展 LLM 訓練
近年來,大型語言模型( LLM )的數量激增,它們超越了傳統的語言任務,擴展到生成式人工智能這包括像 ChatGPT 和 Stable…
4 MIN READ

2023年 4月 25日
NVIDIA 實現值得信賴、安全可靠的大型語言模型對話系統
大語言模型( LLM )非常強大,能夠回答復雜的問題,進行創造性的寫作、開發、調試源代碼等。通過將 LLM 應用程序連接到外部工具,
1 MIN READ