編集体制

一次情報の確認と要約は編集部が担当し、生成AIはリサーチ補助とドラフト作成に使っています。出典・確認日を明記し、誤りやリンク切れは順次修正します。

TTT-E2E

Research / 1

記事公式発表
NVIDIA4 min read

NVIDIA TTT-E2E|コンテキストを重みに圧縮してLLMが推論時に学習

NVIDIAが発表したTTT-E2E(Test-Time Training with an End-to-End formulation)は、LLMのメモリの在り方を根本から再考する研究です。長文脈を扱う際、従来のTransformerはコンテキスト長に比例してコストが増大する問題を抱えていました。TTT-E2Eはコンテキストを次トークン予測によりモデルの重みに圧縮することで、推論レイテンシをコンテキスト長に依存しない一定値に抑えます。

#研究#長文脈#推論最適化