翻譯 – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Fri, 28 Feb 2025 06:30:03 +0000
zh-CN
hourly
1
196178272 -
在 NVIDIA GPU 上訓練的 Microsoft Phi SLM 的多模態最新進展
http://www.open-lab.net/zh-cn/blog/latest-multimodal-addition-to-microsoft-phi-slms-trained-on-nvidia-gpus/
Wed, 26 Feb 2025 06:19:58 +0000
http://www.open-lab.net/zh-cn/blog/?p=13020
Continued]]>
大語言模型(LLMs)已滲透到各行各業,并改變了技術潛力。但是,由于規模龐大,它們對于許多公司目前面臨的資源限制來說并不切實際。 小語言模型 (SLMs)的興起通過創建資源占用更小的模型,將質量和成本聯系起來。SLMs 是語言模型的一個子集,這些模型傾向于專注于特定領域,并使用更簡單的神經架構構建。隨著模型的發展模仿人類感知周圍環境的方式,模型必須接受多種形式的多模態數據。 Microsoft 宣布在 Phi 系列中推出新一代開放式 SLM,并新增兩項功能: Phi-4-multimodal 是第一個加入該系列的多模態模型,接受文本、音頻和圖像數據輸入。 這些模型足夠小,可以在設備上部署。此版本基于 2024 年 12 月發布的 Phi-4 14B 參數 SLM 的研究版本構建而成,可用于兩個新的較小模型的商業用途。
Source
]]>
13020
-
使用 Whisper 和 Canary 架構部署 NVIDIA Riva 多語種 ASR,同時選擇性地停用 NMT
http://www.open-lab.net/zh-cn/blog/deploying-nvidia-riva-multilingual-asr-with-whisper-and-canary-architectures-while-selectively-deactivating-nmt/
Thu, 20 Feb 2025 04:05:01 +0000
http://www.open-lab.net/zh-cn/blog/?p=12956
Continued]]>
NVIDIA 持續開發自動語音識別 (ASR) 模型,這些模型在業內樹立了基準。 早期版本的 NVIDIA Riva 是一種適用于 ASR 、 TTS 和 NMT 的 GPU 加速語音和翻譯 AI 微服務的集合,支持基于 Conformer 架構的英語-西班牙語和英語-日語代碼交換 ASR 模型,以及基于 Parakeet 架構的支持 EMEA 地區多種語言(即英國英語、歐洲西班牙語、法語、意大利語、標準德語和亞美尼亞語)的模型。 最近,NVIDIA 發布了 Riva 2.18.0 容器和 SDK ,以不斷改進其語音 AI 模型。在此新版本中,我們現在提供以下服務: 自動語音翻譯 (AST)是將一種語言的語音翻譯為另一種語言的文本,而無需以第一種語言進行中間轉錄。
Source
]]>
12956
-
利用特定領域的微調和 NVIDIA NIM 提高翻譯質量
http://www.open-lab.net/zh-cn/blog/improving-translation-quality-with-domain-specific-fine-tuning-and-nvidia-nim/
Wed, 05 Feb 2025 04:30:55 +0000
http://www.open-lab.net/zh-cn/blog/?p=12871
Continued]]>
翻譯在助力公司實現跨國業務擴展方面發揮著至關重要的作用,在語調、準確性和技術術語處理方面的要求差異很大。 主權 AI 的出現凸顯了 大語言模型(LLM) 面臨的嚴峻挑戰,尤其是他們難以捕捉英語主導框架之外的細微文化和語言背景。隨著全球通信變得日益復雜,組織必須仔細評估翻譯解決方案,以平衡技術效率與文化敏感性和語言準確性。 在本文中,我們將探討 LLMs 如何解決以下兩種截然不同的英語到繁體中文翻譯用例: 這些用例需要采用常規翻譯以外的專門方法。雖然 使用指令調整 LLMs 進行提示工程 可以處理某些情境,但此類更精細的任務通常無法達到預期效果。因此,在針對每個翻譯環境收集的特定數據集上單獨微調 Low-Rank Adaptation(LoRA)適配器變得至關重要。 在此項目中,我們將使用 Llama 3.1 8B Instruct 作為預訓練模型,
Source
]]>
12871
-
人工智能腦植入恢復腦卒中幸存者的雙語交流
http://www.open-lab.net/zh-cn/blog/ai-brain-implant-restores-bilingual-communication-for-stroke-survivor/
Thu, 20 Jun 2024 05:53:50 +0000
http://www.open-lab.net/zh-cn/blog/?p=10442
Continued]]>
科學家通過訓練神經假體植入物來解碼一名不會說話的中風幸存者的雙語大腦活動,使其能夠用西班牙語和英語進行交流。 這項研究發表在《自然生物醫學工程》上,來自加利福尼亞大學舊金山分校教授 Dr. Edward Chang 博士的實驗室,它建立在他 2021 年對同一名患者進行的開創性研究的基礎上,該研究證明了將嚴重癱瘓患者的大腦活動轉化為文字的功效。 在最新的研究中,神經假體解碼了同一個人——Pancho——的大腦活動,并使用雙語人工智能模型將大腦活動轉化為西班牙語或英語單詞,這取決于 Pancho 打算用哪種語言交流,然后,他的單詞和句子被投影到計算機屏幕上。 這兩項研究都為無法說話或依賴觸摸屏或眼動監測設備進行交流的人提供了遠不那么繁重的交流承諾。這些結果也是在潘喬身上神經假體最初植入四年后得出的,突顯了該技術的壽命及其潛在的長期影響。
Source
]]>
10442
-
掌握 LLM 技術:訓練
http://www.open-lab.net/zh-cn/blog/mastering-llm-techniques-training/
Thu, 16 Nov 2023 05:30:20 +0000
http://www.open-lab.net/zh-cn/blog/?p=8313
Continued]]>
大型語言模型 (LLM) 是一類使用 Transformer 網絡構建的生成式 AI 模型,能夠利用非常大的數據集來識別、匯總、翻譯、預測和生成語言。正如我們所知,LLM 有望改變社會,但訓練這些基礎模型極具挑戰性。 此博客闡述了使用 Transformer 網絡構建 LLM 的基本原理,涵蓋模型架構、注意力機制、嵌入技術和基礎模型訓練策略。 模型架構定義了 Transformer 網絡的骨干,大致規定了模型的功能和限制。LLM 的架構通常稱為編碼器、解碼器或編碼器 – 解碼器模型。 一些熱門架構包括: 另一個熱門架構決策是擴展到多模態模型,這些模型結合了來自文本、圖像、音頻和視頻等多種模式或形式的數據的信息。雖然訓練具有挑戰性,但多模態模型提供了來自不同模式的互補信息的關鍵優勢,正如人類通過分析來自多種感官的數據所理解的那樣。
Source
]]>
8313
-
使用 NVIDIA AI 基礎模型構建自定義企業級生成式 AI
http://www.open-lab.net/zh-cn/blog/build-custom-enterprise-grade-generative-ai-with-nvidia-ai-foundation-models/
Wed, 15 Nov 2023 07:14:09 +0000
http://www.open-lab.net/zh-cn/blog/?p=8261
Continued]]>
在構建企業級 生成式 AI 和 大型語言模型 (LLM) 時,需要收集高質量數據、搭建加速基礎架構以及擁有優化模型的專業知識。 開發者可以從預訓練模型開始,并根據其用例對其進行微調,從而節省時間,并使其解決方案更快地投入市場。開發者需要一種簡單的方法來嘗試模型,并通過 API 集成模型來評估其功能。這有助于他們確定最適合其應用的模型。 NVIDIA AI 基礎模型 是一組經過精心策劃的社區模型和 NVIDIA 構建的模型,它們針對峰值性能進行了優化。開發者可以直接通過 API 或 * 圖形用戶界面從瀏覽器中快速使用這些模型,無需任何設置。模型 * 通過 NVIDIA TensorRT-LLM 和激活感知型權重量化 (AWQ) 進行配置,以實現最高吞吐量和最低延遲,并在 NVIDIA 加速計算堆棧上大規模運行。 我們的 NVIDIA Nemotron-3 8B…
Source
]]>
8261
-
借助 NVIDIA AI on Azure 機器學習提升企業生成式 AI 應用開發速度
http://www.open-lab.net/zh-cn/blog/elevate-enterprise-generative-ai-app-development-with-nvidia-ai-on-azure-machine-learning/
Wed, 15 Nov 2023 07:08:50 +0000
http://www.open-lab.net/zh-cn/blog/?p=8256
Continued]]>
生成式 AI 正在徹底改變各行各業的組織利用數據來提高生產力、推進個性化客戶互動并促進創新的方式。鑒于其巨大的價值,企業正在尋找工具和專業知識,以幫助他們有效、可靠地將這項新技術集成到其業務運營和戰略中。 NVIDIA 和 Microsoft 攜手合作,利用 NVIDIA AI on Azure Machine Learning (Azure ML),為企業提供用于構建、優化和部署 AI 應用程序(包括生成式 AI)的全面解決方案。 在本周的 Microsoft Ignite 上, NVIDIA 和 Microsoft 宣布了另外兩個里程碑,為 Azure ML 帶來管理生產級 AI 和開發生成式 AI 應用的新功能。 6 月,我們發布了一篇博文,解釋了 NVIDIA AI Enterprise 軟件與 Azure 機器學習集成 的詳情及入門指南。
Source
]]>
8256
-
數據中立化如何轉變客戶服務聯絡中心
http://www.open-lab.net/zh-cn/blog/how-language-neutralization-is-transforming-customer-service-contact-centers/
Tue, 30 May 2023 05:21:28 +0000
http://www.open-lab.net/zh-cn/blog/?p=7090
Continued]]>
根據 Gartner® 的數據,“近一半的數字工作者很難找到他們工作所需的數據,近三分之一的人由于缺乏信息意識而做出了錯誤的商業決定。”1為了應對這一挑戰,越來越多的企業正在客戶服務中部署人工智能,因為它有助于提供更高效、更信息化的個性化服務。 諸如 語音轉文字,文本到語音,翻譯,深度學習, transformer 模型,以及生成式人工智能改變了企業與客戶互動的方式。這些技術實現了: 人工智能算法可以處理和分析大量數據,識別客戶需求和行為模式,并幫助創造吸引人和令人滿意的客戶體驗。總體而言,人工智能在客戶服務中的使用顯著提高了客戶互動的質量和效率,使企業和客戶都受益。 在全球經濟中,企業在不同國家開展業務,為具有不同語言和文化背景的客戶提供服務。這種全球語言多樣性給聯絡中心帶來了獨特的挑戰。 有效的溝通對于提供卓越的客戶服務至關重要,而語言障礙可能會導致溝通失誤、
Source
]]>
7090
人人超碰97caoporen国产