Posts by Pavlo Molchanov
對話式人工智能
2024年 11月 22日
Hymba 混合頭架構提高小型語言模型性能
Transformer 及其基于注意力的架構,憑借強大的性能、并行化功能以及通過鍵值 (KV) 緩存進行的長期召回,已成為語言模型 (LM)…
5 MIN READ
計算機視覺/視頻分析
2024年 5月 3日
基于 VILA 的 NVIDIA 硬件可視化語言模型
視覺語言模型最近有了顯著的發展。然而,現有技術通常僅支持一個圖像。他們無法在多個圖像之間進行推理、支持上下文學習或理解視頻。此外,
3 MIN READ