1. これは何の話?

ChatGPTがユーザーに関する情報をどのように記憶し活用しているのか、その内部構造を会話を通じてリバースエンジニアリングした分析結果が報告されました。筆者は、ChatGPTの記憶システムがベクトルデータベースや会話履歴に対するRAGのような複雑なものではなく、よりシンプルな4つの層で構成されていると推測しています。AIの仕組みに興味がある開発者や一般ユーザーにとって興味深い分析です。

2. 何がわかったか

分析によると、ChatGPTのコンテキスト構造は以下の4つの主要な記憶関連コンポーネントで構成されている可能性があります:

  1. セッションメタデータ:デバイスタイプ、ブラウザ、場所、サブスクリプションレベル、使用パターンなど、セッション開始時に一度だけ注入される一時的な情報
  2. ユーザーメモリ:ユーザーが明示的に「覚えて」と指示した、または会話から検出された長期的な事実(名前、職業、好みなど)
  3. 最近の会話の要約:過去のチャットのタイトルとユーザーメッセージの断片からなる軽量なダイジェスト(約15件程度)
  4. 現在のセッションメッセージ:現在の会話の完全な履歴(トークン数制限内のスライディングウィンドウ)

ChatGPTの4層メモリ構造

3. 他とどう違うのか

多くの人が予想するような過去の全会話履歴をベクトル化して類似検索を行うRAGシステムとは異なり、ChatGPTはより軽量な「最近の会話の要約」と、明示的に保存された「ユーザーメモリ」を組み合わせています。これにより、詳細な過去のコンテキストよりも速度と効率を優先している可能性があります。

4. なぜこれが重要か

ChatGPTのような大規模言語モデルが、どのようにしてユーザーとの継続的な対話を実現し、パーソナライズされた応答を生成しているのかを垣間見ることができます。シンプルな構造でも、ユーザーに「覚えている」と感じさせることができる巧妙な設計が示唆されます。

5. 未来の展開・戦略性

この4層構造は、パーソナライゼーション、パフォーマンス、トークン効率のバランスを取るための実用的なアプローチかもしれません。OpenAIはユーザー体験を損なわずに計算コストを抑える方法を模索しており、この設計はパイプライン全体を制御できる場合にはシンプルで効果的なアプローチとなり得ます。

6. どう考え、どう動くか

ChatGPTの記憶の仕組みを理解することで、より効果的にAIと対話するヒントが得られます。

指針:

  • ChatGPTに覚えておいてほしい重要な事実は、明示的に「覚えて」と伝えてみる。
  • 過去の会話を完全に覚えているわけではないことを念頭に置き、重要な文脈は再度伝える。
  • AIの「記憶」がどのように機能し、どのような限界があるのかに関心を持つ。

次の一歩:

  • 今日やること:ChatGPTに「私について何を覚えていますか?」と質問してみる。
  • 今週やること:重要な情報をChatGPTに記憶させる実験をしてみる。

7. 限界と未確定

  • この分析はOpenAIが公開した情報ではなく、会話を通じたリバースエンジニアリングに基づいています。
  • 実際の内部実装とは異なる可能性があります。
  • トークン制限の正確な値など、詳細は不明です。

8. 用語ミニ解説

  • RAG(Retrieval Augmented Generation):外部データベースから関連情報を検索し、それを基に回答を生成するAIの手法。
  • スライディングウィンドウ:最新の情報を保持し、古い情報から順に破棄していくデータ管理の手法。

9. 出典と日付

Manthan Gupta (公開日・最終確認日:2025-12-12):https://manthanguptaa.in/posts/chatgpt_memory/