Deep dive

2025年 7月 2日
通過低精度量化優化用于圖像編輯的 FLUX.1 Kontext
FLUX.1 Kontext 是 Black Forest Labs 最近發布的模型,是對社區圖像生成模型的一項令人著迷的補充。
3 MIN READ

2025年 7月 1日
適用于有效 FP8 訓練的按張量和按塊擴展策略
在本博文中,我們將分解主要的 FP8 縮放策略 (按張量縮放、延遲和電流縮放以及按塊縮放 (包括 Blackwell 支持的 MXFP8…
2 MIN READ

2025年 6月 30日
出色的多模態 RAG:Llama 3.2 NeMo 檢索器嵌入模型如何提高工作流準確性
數據遠不止于文本,它本質上是多模態的,包括圖像、視頻、音頻等,通常采用復雜的非結構化格式。雖然常見的方法是將 PDF、掃描圖像、
2 MIN READ

2025年 6月 25日
NVIDIA DOCA 3.0 助力 AI 平臺開啟網絡新紀元
NVIDIA DOCA 框架已發展成為新一代 AI 基礎設施的重要組成部分。從初始版本到備受期待的 NVIDIA DOCA 3.0 發布,
3 MIN READ

2025年 6月 24日
隆重推出 NVFP4,實現高效準確的低精度推理
為了充分利用 AI,優化至關重要。當開發者考慮優化用于推理的 AI 模型時,通常會想到量化、蒸餾和剪枝等模型壓縮技術。毫無疑問,
4 MIN READ

2025年 6月 18日
NVIDIA 集合通信庫 2.26 實現性能和監控功能的提升
NVIDIA 集合通信庫 (NCCL) 可實現針對 NVIDIA GPU 和網絡優化的多 GPU 和多節點通信基元。
3 MIN READ

2025年 6月 17日
通過 NVIDIA Holoscan for Media 上的全新 AI 應用實例,實現實時 AI 媒體效果增強
直播媒體工作流越來越多地使用 AI 微服務來增強制作能力。然而,先進的 AI 模型大多托管在云端,由于網絡延遲、帶寬和實時可擴展性方面的限制,
1 MIN READ

2025年 6月 16日
使用世界基礎模型生成的合成軌跡數據提高機器人學習效果
在機電一體化和機器人 AI 基礎模型的進步的推動下,通用型機器人技術已經問世。但關鍵的瓶頸依然存在:
2 MIN READ

2025年 6月 12日
NVIDIA Holoscan 傳感器橋接技術賦予開發者實時數據處理能力
在快速發展的機器人和邊緣 AI 領域,高效處理和傳輸傳感器數據的能力至關重要。許多邊緣應用正在擺脫單傳感器固定功能解決方案,
3 MIN READ

2025年 6月 12日
借助 RAPIDS 單細胞技術推動十億細胞分析和生物學突破
細胞生物學和虛擬細胞模型的未來取決于大規模測量和分析數據。在過去 10 年里,單細胞實驗一直以驚人的速度增長,從數百個細胞開始,
2 MIN READ

2025年 6月 12日
借助 MMseqs2-GPU 和 NVIDIA NIM 加速蛋白質科學序列對齊
蛋白質序列對齊 (比較蛋白質序列的相似性) 是現代生物學和醫學的基礎。它通過重建進化關系 (技術上稱為 homology…
3 MIN READ

2025年 6月 11日
使用 NVIDIA Cosmos Predict-2 構建自定義物理人工智能基礎模型
構建更智能的機器人和自動駕駛汽車 (AV) 始于能夠理解現實世界動態的物理 AI 模型。這些模型發揮著兩個關鍵作用:
2 MIN READ

2025年 6月 11日
借助全新 NVIDIA Cosmos 世界基礎模型簡化端到端自動駕駛汽車開發
隨著向為自動駕駛汽車 (AV) 提供動力支持的端到端規劃模型的轉變,人們對基于物理性質的高質量傳感器數據的需求也在不斷增加。
1 MIN READ

2025年 6月 10日
借助 AI 超級計算和 NVIDIA CUDA-Q Academic 變革量子教育
隨著量子計算機的擴展,它們將與 AI 超級計算機集成,以解決世界上一些最具挑戰性的問題。這些加速量子超級計算機將運行利用 CPU、
2 MIN READ

2025年 6月 9日
借助 EoRA 快速恢復 LLM 壓縮錯誤的免微調方法
模型壓縮技術已經過廣泛探索,可減少為大語言模型 (LLM) 或其他大型神經網絡提供服務所需的計算資源。 但是,與未壓縮的模型相比,
5 MIN READ

2025年 6月 5日
利用 NVIDIA cuML 中的森林推理庫加速樹模型推理
樹集成模型仍然是表格數據的首選,因為它們準確、訓練成本相對較低且速度快。但是,如果您需要低于 10 毫秒的延遲或每秒數百萬次的預測,
3 MIN READ