
日々追加されるAIツールの調査メモを、タグ・ツール・期間など複数軸で整理しています。目的の情報にすばやく辿り着けるよう、 ハイライトとタイムラインに分けて表示しています。
全 553 件からタイトルや要約を横断検索できます

OpenAIがChatGPTコンシューマープランに年齢予測機能を導入。アカウント作成時期や利用パターンなどの行動シグナルから18歳未満を推定し、グラフィック暴力や危険なチャレンジなど未成年向け不適切コンテンツを自動フィルタリングします。

OpenAIがCodexの開発者向けドキュメントを公開。ブラウザ、CLI、IDE拡張機能で利用可能なコーディングエージェントで、コード生成、レガシーコードの理解、レビュー、デバッグ、開発タスクの自動化を支援します。

OpenAIがビル&メリンダ・ゲイツ財団と提携し、アフリカのプライマリ・ヘルスケア向けAIパイロット「Horizon 1000」を発表。5000万ドルの資金と技術支援で、2028年までに1000のクリニックにAIツールを展開します。

OpenAIが「Stargate Community」計画を発表。2029年までに米国で10GWのAIデータセンター容量を構築し、数千億ドル規模のインフラ投資を行います。地域電力コストへの影響を抑える「自己負担型」エネルギー戦略が特徴です。
553件中 1〜100件を表示
2026年1月
95 件

OpenAIがChatGPTコンシューマープランに年齢予測機能を導入。アカウント作成時期や利用パターンなどの行動シグナルから18歳未満を推定し、グラフィック暴力や危険なチャレンジなど未成年向け不適切コンテンツを自動フィルタリングします。

OpenAIがCodexの開発者向けドキュメントを公開。ブラウザ、CLI、IDE拡張機能で利用可能なコーディングエージェントで、コード生成、レガシーコードの理解、レビュー、デバッグ、開発タスクの自動化を支援します。

OpenAIがビル&メリンダ・ゲイツ財団と提携し、アフリカのプライマリ・ヘルスケア向けAIパイロット「Horizon 1000」を発表。5000万ドルの資金と技術支援で、2028年までに1000のクリニックにAIツールを展開します。

OpenAIが「Stargate Community」計画を発表。2029年までに米国で10GWのAIデータセンター容量を構築し、数千億ドル規模のインフラ投資を行います。地域電力コストへの影響を抑える「自己負担型」エネルギー戦略が特徴です。

Remotion創設者がClaude Codeを使ったビデオ制作セッションを公開。AIとReactベースのビデオ開発における実践的なコード生成・修正ワークフローを示し、開発者のプログラマティック動画作成効率化の可能性を提示しています。

AIエージェント向けのオープンスキルエコシステム「skills.sh」が登場。npxコマンド一発でスキルをインストールでき、Vercel React Best PracticesやRemotionなど180以上のスキルがリーダーボードで公開されています。

xAIがX(旧Twitter)の「For You」フィードを動かす推薦アルゴリズムをGitHubで公開。Grok-1ベースのTransformerモデルを使い、手作業の特徴量設計を完全に排除した新アーキテクチャの技術詳細と設計思想を解説します。

42,447件のAIエージェントSkillsを分析した大規模研究で、26.1%に脆弱性、5.2%に悪意ある挙動を確認。プロンプトインジェクション、データ流出、権限昇格など14パターンの脅威を分類。Skillsエコシステムの安全性確保が急務。

Z.aiがGLM-4.7-Flashを公開。30B-A3BのMoE構成で30Bクラス最強性能を謳い、vLLM・SGLang対応でローカル推論も容易。軽量デプロイと高性能の両立を狙う開発者向けオープンモデル。

ManusでAIが生成したモバイルアプリをGoogle PlayやApp Storeに公開する手順を解説。AAB形式でのAndroid公開、TestFlightを使ったiOSテスト配布、外部テスターへの招待リンク作成まで、Manus公式ヘルプに基づく具体的なフローを紹介します。

Claude CodeやCodex向けスキル(Skills)マーケットプレイスのセキュリティリスクを解説。野良Skills約26%に脆弱性、5%に悪意ある挙動という研究結果を踏まえ、npmやPyPIとの成熟度比較、Anthropic公式の警告を紹介します。

AnthropicがClaude利用状況を分析したAI経済指標レポート第4回を発表。日本のAUI(AI活用指数)は1.59で、翻訳用途が世界平均の2.5倍。AIは過去100年の主要技術の10倍速で米国に普及、拡張型利用が51.7%。

OpenAIが月額8ドルの新プラン「ChatGPT Go」を世界171カ国に展開。無料版の10倍のメッセージ上限、画像生成、GPT-5.2 Instant無制限利用が可能。無料版・Go版では広告導入も開始予定。

Google DeepMindのデミス・ハサビスCEOがCNBCで、中国のAI開発は米国より「数カ月遅れ」と発言。従来の1〜2年差という予測から大幅に縮小。ただし真の技術革新能力には疑問も呈示。

OpenAIが自社のビジネスモデルを「知能の価値とともにスケールするビジネス」と定義。サブスク、API、広告、コマース、コンピュート提供の5本柱。2025年末で評価額5000億ドル、収益200億ドル超、しかし依然赤字で2029年黒字化を目指す。

Webフレームワーク「Astro」を開発するThe Astro Technology CompanyがCloudflareに参画。Astroはオープンソース・MITライセンスを維持し、Cloudflare以外への展開も継続。Astro 6ベータ版も公開中です。

MicrosoftのCopilot Studio拡張機能がVS Codeで正式リリース。エージェント定義をGit管理し、PRベースのレビュー、GitHub Copilotとの連携でAI開発ワークフローを実現。開発チーム向けにソースコントロールとデプロイ自動化を提供します。

OpenAIがChatGPTに広告導入を発表。無料版と新プラン「ChatGPT Go」(月額8ドル)が対象で、Plus・Pro・Business・Enterpriseは広告なし。回答の客観性維持と会話データの非売却を原則として掲げています。

SkillsMPはClaude Code、Codex、ChatGPT用のAIエージェントスキルを6万6千件以上収録したオープンソースマーケットプレイスです。GitHubからスキルを自動索引化し、開発者がAIに新しい能力を追加できます。

GoogleがGemma 3ベースのオープン翻訳モデル「TranslateGemma」を公開。4B/12B/27Bの3サイズで55言語に対応し、12Bモデルが27Bベースラインを上回る効率性を実現。画像内テキスト翻訳にも対応しています。

OpenAI支援の1XがヒューマノイドNEO向けに新AIワールドモデルを導入。動画学習でテレオペレーターへの依存を減らし、ロボット自身がデータを収集して自律学習を進める方針を発表しました。2026年末までに完全自律動作を目指します。

CES 2026でBoston Dynamicsのヒューマノイドロボット「Atlas」が大きな注目を集めました。AI統合による新たなデモが披露され、産業用途での実装可能性が報じられています。

OpenAIがログイン不要の翻訳サイト「ChatGPT Translate」をひっそりと公開しました。29言語に対応し、ビジネス文書や子ども向けなど4種類の文体変換機能も搭載。翻訳市場におけるAIネイティブサービスの新たな選択肢として注目されます。

Claude CodeのAgent Skills機能について、CLAUDE.mdやcommands、Hooksとの違いを整理しながら解説します。必要なときだけ専門知識を読み込む仕組みで、セッション間の「繰り返し説明」問題を解決できます。

Claude Codeで実装し、Codexでレビュー、指摘を受けて修正という往復作業を自動化するSkill「codex-review」の設計と使い方を解説します。規模に応じた戦略切り替えや安全なサンドボックス実行がポイントです。

Claude CodeとCodex CLIの連携をMCPからSkillに変更した事例を紹介します。Skillとして実装することでコマンド直接実行が可能になり、Codexの動作が可視化されて開発体験が改善しました。

PromptArmorがClaude Coworkにファイル流出の脆弱性を公開しました。悪意あるファイルに隠されたプロンプトインジェクションにより、ユーザーの機密ファイルが攻撃者のAnthropicアカウントにアップロードされる危険があります。

ELYZAが日本語性能に特化した拡散言語モデル「ELYZA-LLM-Diffusion」を公開しました。従来の自己回帰型とは異なり複数トークンを同時生成でき、推論コスト低減の可能性を秘めた次世代アーキテクチャとして注目されます。

Hugging FaceがOpenAIのResponses APIをベースにした「Open Responses」を発表しました。エージェント時代に適したツール呼び出しやサブエージェントループに対応し、複数プロバイダー間のルーティングを標準化する推論規格です。

Hyundai Motor GroupがTeslaのヒューマノイドロボット部門元責任者を戦略顧問に任命。Boston Dynamicsを傘下に持つHyundaiが、ヒューマノイドロボット事業をさらに強化する動きと見られています。

Vercelが10年以上のReact・Next.js最適化知見を「react-best-practices」として公開しました。8カテゴリ40超のルールをAIエージェント向けに構造化し、ウォーターフォール排除やバンドル削減を優先順位付けしています。

GeminiにPersonal Intelligenceが登場。Gmail・Photos・YouTube・Searchとワンタップ連携し、個人データを活用したパーソナライズを実現。プライバシー設計と米国ベータ開始の詳細を解説します。

Zhipu AIがオープンソースの画像生成モデル「GLM-Image」を発表。自己回帰(9B)と拡散デコーダ(7B)を組み合わせたハイブリッド構造で、テキストレンダリングや知識集約的な画像生成に強みを持ちます。

OpenAIがコーディング特化モデル「GPT-5.2-Codex」を提供。40万トークン文脈・最大出力12.8万、長時間のエージェント型コーディングに最適化。機能と料金を解説します。

OpenAIがCerebras Systems社と提携し、世界最大のAIチップ「Wafer-Scale Engine」を推論インフラに統合。長文出力やリアルタイム推論の高速化を2028年までに段階的に実現します。

Google AntigravityがAIエージェント拡張のためのSkillsシステムを公開。agentskills.ioのオープン標準に基づき、SKILL.mdファイルでエージェントの能力を拡張可能。ワークスペース固有とグローバルの2種類の配置に対応し、プログレッシブ・ディスクロージャーで自動的にスキルを選択・実行する。

Appleが動画編集のFinal Cut Pro、音楽制作のLogic Pro、画像編集のPixelmator Proなど主要クリエイティブアプリを統合したサブスクリプションApple Creator Studioを発表しました。月額12.99ドル(年額129ドル)で提供され、教育機関向けは月額2.99ドル(年額29.99ドル)。新規Mac・iPad購入で3ヶ月無料特典も。

Node.js 20.x〜25.xの4つのリリースラインで8件の脆弱性(High 3件、Medium 4件、Low 1件)が修正されました。バッファ未初期化メモリ露出やシンボリックリンクによるパーミッションバイパスなど、実運用に影響する深刻な問題が含まれています。

米国防長官ピート・ヘグセスがSpaceXスターベースでAI優先の軍事変革戦略を発表しました。xAIのGrokをGenAI.milプラットフォームに追加、機密・非機密の全軍ネットワークへ主要AIモデルを展開する方針を示しました。市民団体はGrokの安全性に懸念を表明しています。

AppleがCNBCに対し、次世代版SiriにGoogle Geminiを採用すると公式に発表しました。「慎重な評価の結果、Googleの技術がApple Foundation Modelsの最も有能な基盤を提供すると判断した」との声明を出しています。 この次世代Siriは2024年のWWDC基調講演で初めて予告されていたものの、その後延期が発表されていました。現在はiOS 26.4で2026年3〜4月に一般公開される見込みです。iPh

AnthropicがClaude Coworkをリサーチプレビューとして公開しました。Claude Codeで培ったエージェント的な自律動作機能を、コーディング以外の作業にも活用できるよう設計されたツールです。Claude Max契約者であればmacOSアプリから今すぐ利用開始でき、開発者でないユーザーもClaude Codeと同等の体験を得られます。 ユーザーが指定したローカルフォルダへのアクセス権限をClaudeに与えると、ファイル

NVIDIAが発表したTTT-E2E(Test-Time Training with an End-to-End formulation)は、LLMのメモリの在り方を根本から再考する研究です。長文脈を扱う際、従来のTransformerはコンテキスト長に比例してコストが増大する問題を抱えていました。TTT-E2Eはコンテキストを次トークン予測によりモデルの重みに圧縮することで、推論レイテンシをコンテキスト長に依存しない一定値に抑えます。

React Router 7.0.0〜7.11.0および関連するRemixパッケージに複数のセキュリティ脆弱性が報告されました。いずれもWebアプリケーションのセキュリティを脅かす深刻な問題であり、CSRF(クロスサイトリクエストフォージェリ)、XSS(クロスサイトスクリプティング)、任意ファイルへのアクセスといった攻撃につながる可能性があります。 React RouterやRemixを使用している開発チームは、早急にバージョンを確認し

GoogleがVeo 3.1 Ingredients to Videoの大型アップデートを発表。画像から動画を生成する機能が強化され、ネイティブ9:16縦動画出力、1080p/4Kアップスケール、キャラクター・背景の一貫性維持が可能に。Geminiアプリ、YouTube Shorts、Flow、Vertex AIで利用可能。

AIエージェントの評価手法を体系的に解説。タスク・トライアル・グレーダー・トランスクリプトなど基本概念から、コーディング・会話・リサーチエージェント別の評価設計、20〜50タスクから始める実践的ロードマップまで網羅しています。

生成AI導入が失敗する根本原因は、AIの苦手な問いをそのまま投げていること。完璧性を要求する業務、ステップが長く連鎖する業務は避け、全体感が正しければ成果になる仕事にAIを活用する設計が重要です。

GoogleがGmailに新AI機能を導入。「Help Me Write」で執筆スタイルを学習して提案、AI Overviews風の会話型検索、受信箱からToDoリストを自動生成するAI Inboxなど、30億ユーザーの生産性を変える可能性があります。

Alibabaが発表したQwen3-VL-EmbeddingとRerankerは、テキスト・画像・動画を横断するマルチモーダル情報検索に特化したモデル。MMEB-V2とMMTEBでSOTA達成。2B/8Bサイズで企業のRAGシステム強化に活用可能です。

AISmileyが金融・保険業界向けAIソリューションのカオスマップを公開しました。リスク管理の高度化と収益機会の創出を革新する最新AIソリューションを一覧で把握できます。

AMDがCES 2026でノートPC向けAIプロセッサ「Ryzen AI 400シリーズ」とAI特化GPU「MI455X」を発表しました。60TOPSのNPU搭載でIntel Core Ultra 9比1.7倍、MI455Xは前世代比10倍の性能向上を実現します。

CES 2026でAIを搭載したコンパニオンロボットやペット型デバイスが多数展示されました。LG CLOiDやSwitchBot Onero H1などの実用的なヒューマノイドだけでなく、「存在するだけ」を目的としたAI機器が新たなトレンドとして注目されています。

Hyundai Motor GroupのRobotics LABがCES Foundry 2026で、DEEPX社と共同開発したオンデバイスAIチップの量産開始を発表しました。5ワット以下で動作するエッジAIチップがロボットの自律運転を実現します。

Microsoftがリテール業界向けにエージェントAIソリューションを発表しました。Copilot Checkoutで会話から購入まで完結し、Brand AgentsやCopilot Studioのテンプレートでパーソナライズされたショッピング体験を提供します。

ChatGPT連携のAIイヤホン「NeoVoice」がMakuakeで目標金額の1651%を達成しました。115言語のリアルタイム翻訳、録音、文字起こし、要約機能をこれ1台で実現します。

ArmがPhysical AI専門の事業部門を立ち上げ、ロボティクス市場への本格参入を表明しました。CPUアーキテクチャの強みを活かし、ロボットや自律システム向け半導体エコシステムの構築を目指します。

OpenAIが週2.3億人の健康関連クエリに対応する専用機能「ChatGPT Health」を発表。Apple Health、MyFitnessPalなどとデータ連携し、医療記録の確認や健康管理をAIがサポート。プライバシー重視でトレーニングには使用されない設計。

DatabricksはAIエージェントのデータ検索精度を向上させる新アーキテクチャ「Instructed Retriever」を発表しました。従来のRAGと比較して70%の精度向上を達成し、曖昧なクエリでも暗黙の条件を明示的な検索パラメータに変換できます。

ビジネスプロセス管理プラットフォームのFlowfinityが、ワークフローにAIアシスタントを組み込んだ大型アップデートを発表しました。アクセス制御機能も強化され、セキュリティと利便性を両立しています。

NVIDIAがCES 2026で発表したAlpamayoは、100億パラメータのVision-Language-Actionモデルを核とするオープンな自動運転AIプラットフォームです。従来の知覚ベースシステムと異なり、推論・判断・説明能力を持ち、Level 4自動運転の実現を目指します。

OpenRouterを使えばClaude Codeで任意のAIモデル(GPT-5.1、GPT-5.2など)を利用可能です。環境変数を設定するだけでAnthropicモデル以外も活用でき、GitHub Actionsでの自動化にも対応しています。

Claude Opus 4.5のリリースを受けて「コーディングは終わりに近い」という投稿が議論を呼びました。著者はソフトウェアエンジニアリングの歴史を振り返りつつ、AIと人間が共進化する時代の新しい職能について考察しています。

TensorがCES 2026でPhysical AI向けオープンソーストレーニングプラットフォーム「OpenTau(τ)」を発表しました。ロボットや自律システムの開発を加速させる強力なAIトレーニングツールチェーンです。

Boston DynamicsとGoogle DeepMindがCES 2026で戦略的提携を発表しました。DeepMindのGemini Robotics基盤モデルを新型Atlasロボットに統合し、自動車産業を皮切りに製造業変革を目指します。

AI分析プラットフォームのCogziaとマーケティングエージェンシーのMarketing Mavenが戦略的パートナーシップを発表しました。AIを活用したマーケティング分析と戦略立案のサービスを共同で提供します。

MicrosoftがOfficeスイートをMicrosoft 365 Copilotにリブランドしたことで、プライバシー懸念やAI統合への反発がユーザー間で拡大しています。企業向けには好評な一方、個人ユーザーには戸惑いと不満が広がっています。

NVIDIAがCES 2026でフィジカルAI向け新オープンモデル群を発表しました。Cosmos世界モデル、GR00T N1.6視覚言語行動モデル、Jetson Thor搭載ヒューマノイドなど、ロボット開発の次世代インフラを一挙公開しています。

RazerがCES 2026でAI搭載ウェアラブルヘッドセット「Project Motoko」を発表しました。耳カップにデュアルカメラを搭載し、OpenAI・Gemini・Grokなど主要AIモデルに対応するコンセプト製品です。

LLMアプリケーション向けの自動テストフレームワーク「STELLAR」が提案されました。進化的最適化を用いて障害を引き起こす入力を探索し、従来手法の最大4.3倍の障害検出を実現しています。

SwitchBotがCES 2026で家庭用ヒューマノイドロボット「Onero H1」を発表しました。洗濯物の折り畳み、窓掃除、コーヒーメーカー操作など日常タスクを22自由度のアームで実行します。

Boston DynamicsとGoogle DeepMindがCES 2026でAIパートナーシップを発表。Gemini Robotics基盤モデルをAtlasロボットに統合し、自動車製造から産業変革を目指す。2026年内に共同研究を開始予定。

AnthropicがClaude Opus 3の提供終了スケジュールを発表しました。長文処理に強みを持つモデルの終了により、ユーザーは代替手段の検討が必要になります。

TII(Technology Innovation Institute)がハイブリッド推論モデル「Falcon H1R 7B」を発表しました。7Bパラメータながら高度な推論能力を持ち、オープンソースで公開されています。

German BionicがCES 2026で最新エクソスケルトン「Exia」を発表。1動作あたり最大38kg(84ポンド)のリフト支援を提供し、数十億の実人体動作データで訓練されたAugmented AIがリアルタイムで動作をサポートする量産型パワースーツ。

CES 2026でGoogle TVへのGemini強化を発表。音声で画質・音質調整、写真検索、インタラクティブなDeep Diveが可能に。さらにQualcommとの自動車向けAIエージェント提携を10年に拡大、次世代車載AIを共同開発へ。

NVIDIAは1月5日、ラスベガスで開催したCEOジェンスン・フアン氏の基調講演において、AIデータセンター向けの新型GPU「Rubin」とCPU「Vera」を正式発表しました。現行世代のBlackwellの後継となるRubinは、新しいGPUアーキテクチャとHBM4メモリを採用し、AI推論と学習性能を大幅に向上させています。 RubinはNVFP4演算時に推論50PFLOPS、学習35PFLOPSを実現します。Blackwell世代(

動画生成AIの開発企業Runwayが、NVIDIAの次世代AIプラットフォーム「Rubin」上で同社の動画生成モデル「Gen-4.5」を動作させることに成功したと発表しました。Gen-4.5は世界で初めてRubin対応を果たした動画生成モデルとなります。さらにRunwayは、ワールドモデル「GWM-1」の開発も進めており、NVIDIAとの連携により物理法則を理解するAIモデルの研究を加速させる構えです。 Gen-4.5は現在世界トップレ

アブダビのTII(Technology Innovation Institute)がFalcon H1R 7Bをオープンソースで公開。7Bパラメータながら、Microsoft・Alibaba・NVIDIAの大型モデルを数学・コーディング・推論ベンチマークで上回り、AIME-24で88.1%の精度を達成。

ElevenLabs Studio 3.0は、AIボイス・音楽・効果音・動画編集を1つのエディターに統合したクリエイター向けプラットフォームです。テキスト編集でナレーション修正が可能なSpeech Correction、32言語対応、自動キャプション生成など、従来は複数ツールが必要だった作業を単一環境で完結させます。

Claude Codeの隠れた機能から上級テクニックまで31日分を凝縮したガイド。日常のショートカットからマルチエージェント構成まで完全解説しています。

Anthropic公式がClaude 4.5向けプロンプトベストプラクティスを公開。精密な指示追従、自動サブエージェントオーケストレーション、フロントエンド設計のコツなど実践的なガイダンスを提供しています。

GitHubがAI時代のコード品質維持について3つの戦略を提唱。速度と品質のパッケージ化、開発者がドライバーであり続けること、思考の可視化が鍵です。

AIエージェントを活用した開発で増大する認知負荷問題を現場目線で考察。全承認の一極集中、ドカンと積まれる成果物、レビューしきれない問題、コードの所有感喪失など、便利さの裏にある課題と、メンターとして使う現実的な対処法を解説。

リマインダーもToDo管理も続かない人間が、AIエージェントにPavlok(電気刺激ウェアラブル)の制御権限を付与する実証実験。CLI型エージェントがコーチング役となり、悪習慣検知時に物理的な罰を与える仕組みで、ジム習慣・禁パチンコ・禁ラーメンに成功。

LLMに計画タスクを解かせる前に問題の明示的モデルを構築させるMFRアプローチ。多くの失敗が「表現の欠如」に起因することを示し、計画精度を大幅に向上させました。

OpenAIが2025年に発表した「Grove」は、AI領域で創業を目指す技術者向けの5週間プログラム。約15名の初回コホートがサンフランシスコ本社で対面ワークショップやオフィスアワーを受け、OpenAI研究者とのコラボレーションや未公開ツール・モデルへの早期アクセスを得られる。

RAG(Retrieval-Augmented Generation)システムで回答精度73%から100%への改善を実現したチャンキング戦略検証の全記録。Large Chunk方式が複雑なParent-ChildやHypothetical Questionsより効果的だった理由と、Re-rankingで逆に精度が悪化した原因を解説。

多段LLMパイプラインの各ステップを効率的に最適化するADOPTフレームワーク。依存関係を考慮したテキスト勾配推定で、既存手法を上回る安定した最適化を実現します。

2026年のAI業界は「ハイプからプラグマティズムへ」。スケーリングの限界が認識される中、小型モデル・ワールドモデル・MCPがトレンドとして浮上しています。

スマートビルのエネルギー管理にLLMエージェントを活用する研究。自然言語でのデバイス制御86%精度を達成し、人中心のAI駆動型ビル管理の可能性を示しました。

LLMの反復デプロイが計画能力を向上させるメカニズムを解明。この過程が暗黙の強化学習を実装していることを示し、AIセーフティへの含意を議論しています。

Hyper-Connections(HC)の訓練不安定性とスケーラビリティ問題を解決するmHC(Manifold-Constrained Hyper-Connections)を提案。多様体制約により恒等写像特性を復元し、大規模LLM訓練での安定性と性能向上を実証した査読前論文。

MicrosoftがWindows 11向けにサードパーティAIエージェントの統合を可能にする「Agent Launchers」フレームワークのプレビューを公開しました。OSレベルでのエージェント体験が変わる可能性があります。

OpenAI初のAI終端ハードウェア製品は、当初予定の立訊(Luxshare)から鴻海(Foxconn)へ製造委託先を変更。非中国サプライチェーンを重視し、越南または米国での生産を計画。2026〜2027年発売見込み。

パーソナライズAIにおける秘密情報漏洩リスクを評価するPrivacyBench。RAGシステムで最大26%の漏洩を確認し、現行アーキテクチャの構造的脆弱性を指摘しています。

Prime Intellectが提唱するRecursive Language Models(RLM)は、コンテキスト折りたたみ(context folding)でLLMエージェントの長期タスク処理を効率化。Python REPLとサブLLM委譲により、コンテキスト腐敗(context rot)を回避しつつトークンコスト削減を実現する新パラダイム。
2025年12月
5 件

RAGのトークン予算問題を解決するAdaGReS。冗長性を考慮した適応的コンテキスト選択により、限られたトークン枠内で高品質な回答生成を実現します。

Claude Codeのすべてのバージョン履歴を1年間追い続けてきた開発者が、2025年のAIコーディング体験を振り返った分析記事です。著者はClaude Code v1.0.x系以降の176回のアップデートをすべて検証し、その変化とAIコーディングの在り方について考察しています。 Claude Codeを導入検討している開発チームや、すでに利用中で効率化を図りたいエンジニアに向けて、1年間の実体験から得られた知見が整理されています。2

Anthropicが開発するAIアシスタントClaudeのChrome拡張機能「Claude for Chrome」が、3ヶ月間のパイロットテストを経て、Pro・Team・Enterpriseプランのユーザーに正式展開されました。当初は1,000名のMaxプランユーザー限定でしたが、2025年12月18日から有料プラン全体へ拡大しています。 ブラウザ上でAIエージェントを活用したい開発者やビジネスユーザーにとって、公式が提供するセキュア

中国・上海交通大学の科学者チームが、情報転送に電気ではなく光を用いる新しいAIチップ「LightGen」を発表しました。このチップはNVIDIAの最先端GPU「A100」と比較して100倍の処理速度と100分の1の消費電力を実現したと報告されています。 AIチップの開発動向を追う技術者やデータセンター運用者にとって、光コンピューティングの実用化レベルを判断する重要な研究成果です。研究結果はScience誌に掲載されており、査読済みの学術

LLMエージェントのMCPツール活用能力を測定するMCPAgentBench。実世界タスクとシミュレート環境の組み合わせで、複雑なマルチステップツール呼び出しの性能差を可視化します。