
記事論文
arXiv••3 min read
Nemotron 3 Nano:MoE+Mambaで推論効率3.3倍、NVIDIAらがオープン公開
NVIDIAが発表したNemotron 3 Nano 30B-A3Bは、MoEとMamba-Transformerを組み合わせた軽量LLMで、同等規模モデルの3.3倍のスループットを実現しつつエージェント推論性能も向上させています。
#LLM#MoE#Mamba
一次情報の確認と要約は編集部が担当し、生成AIはリサーチ補助とドラフト作成に使っています。出典・確認日を明記し、誤りやリンク切れは順次修正します。