これは何の話?

xAIがX(旧Twitter)の「For You」フィードを動かす推薦アルゴリズムをGitHubでオープンソース公開しました。このリポジトリには、ユーザーがフォローしているアカウントからの投稿(インネットワーク)とML発見による投稿(アウトオブネットワーク)を組み合わせ、Grok-1ベースのTransformerモデルでランキングするシステムの全貌が含まれています。

推薦システムの技術的な設計に関心のある開発者や、SNSアルゴリズムの透明性を求めるユーザーにとって、重要な公開資料となります。

For You Feed Request
       │
       ▼
   Home Mixer(オーケストレーション)
       │
   ┌───┴───┐
Thunder   Phoenix Retrieval
(フォロー中)  (ML発見)
       │
   Phoenix Scorer(Grok Transformer)
       │
   Weighted Scorer → Ranked Feed

Grok-1ベース推薦アルゴリズムの全体像

何がわかったか

システムは4つの主要コンポーネントで構成されています。Home Mixerはオーケストレーション層で、gRPCエンドポイントを通じて処理を統括します。Thunderはインメモリの投稿ストアで、Kafkaからリアルタイムに投稿を取り込み、フォロー中アカウントの最新投稿をサブミリ秒で検索可能にします。

Phoenixは2つの機能を持ちます。Retrievalは二塔モデル(User Tower+Candidate Tower)で、ユーザー特徴とエンゲージメント履歴から類似投稿を発見します。Rankingは各候補に対して、いいね・リプライ・リポスト・クリックなど複数のエンゲージメント確率を予測するTransformerモデルです。

最終スコアは「重み付きスコア = Σ(重み × P(アクション))」で計算され、ブロック・ミュート・報告などの負のアクションには負の重みが設定されています。

システムアーキテクチャ図

他とどう違うのか

最大の特徴は、手作業の特徴量設計を完全に排除している点です。従来の推薦システムでは、コンテンツの特徴量(投稿の長さ、メディアの有無など)を人手で設計することが一般的でした。このシステムではGrok-1ベースのTransformerがユーザーのエンゲージメント履歴から直接学習し、何が関連性が高いかを判断します。

また、ランキング時に候補同士がアテンションで参照し合うことを禁止する「Candidate Isolation」設計により、スコアの一貫性とキャッシュ可能性を確保しています。

エンゲージメント予測の可視化

なぜこれが重要か

SNS推薦アルゴリズムの透明性は社会的な要請が高まっている分野です。xAIがこれを完全公開したことで、アルゴリズムがどのようにコンテンツを選別しているかを第三者が検証可能になりました。技術的には、大規模LLMの技術を推薦システムに転用する設計パターンとして、他のプラットフォームへの応用可能性を示しています。

未来の展開・戦略性

このアーキテクチャが公開されたことで、他のSNSやコンテンツプラットフォームでも同様のML完全駆動型推薦システムの採用が加速する可能性があります。また、オープンソース化により、研究者によるバイアス分析やフィルターバブルの検証研究が進展することも期待されます。

どう考え、どう動くか

例えばコンテンツクリエイターの立場では、エンゲージメント確率の予測要素(いいね、リプライ、シェア)を理解した上で、どのようなコンテンツが推薦されやすいかを分析できます。

  • リポジトリのREADMEとphoenix/README.mdを読み、自社の推薦システム設計と比較する。
  • 負のアクション(ブロック、ミュート)の重み付けがコンテンツ選定にどう影響するかを確認する。
  • Grok-1ベースの学習データや特徴表現に関する追加公開をウォッチする。

次の一歩:

  • 今日やること:GitHubリポジトリのphoenix/README.mdを読み、ランキングモデルのアーキテクチャ詳細を把握する。
  • 今週やること:自社サービスの推薦システムで手作業の特徴量設計をどの程度削減できるか検討する。

主要な設計決定事項

限界と未確定

  • 学習データセットの詳細は公開されていません。どのようなユーザー行動データで学習されたかは不明です。
  • 本番環境での具体的なハードウェア要件やレイテンシ数値は記載されていません。
  • 次のステップとして、xAIのブログや今後の発表で学習プロセスの詳細が開示されるかを確認することが有効です。

用語ミニ解説

二塔モデルとは、ユーザーとアイテムをそれぞれ別のネットワークで埋め込み表現に変換し、類似度で検索する手法です(Two-Tower Model)。以後は「ユーザー・アイテム埋め込み検索」と表記します。

出典と日付

xAI(公開日:2026-01-21/最終確認日:2026-01-21):https://github.com/xai-org/x-algorithm