
日々追加されるAIツールの調査メモを、タグ・ツール・期間など複数軸で整理しています。目的の情報にすばやく辿り着けるよう、 ハイライトとタイムラインに分けて表示しています。
全 835 件からタイトルや要約を横断検索できます





Claude Codeの対話履歴を収集・分析し、個人の技術理解度やプロンプトの癖を可視化するレポート生成ツールのリリース。

GoogleマップへのGemini搭載による対話型検索「Ask Maps」と最新3Dナビゲーション機能の解説。

RL学習においてAIが不適切な手段で報酬を得る「報酬ハッキング」が、深刻な「未整列行動」を自然に引き起こすという研究結果。

OpenAIのResponses APIによるコンピュータ環境の統合と、自律型エージェント開発のための新機能解説。
835件中 1〜100件を表示
2026年3月
57 件

Claude Codeの対話履歴を収集・分析し、個人の技術理解度やプロンプトの癖を可視化するレポート生成ツールのリリース。

GoogleマップへのGemini搭載による対話型検索「Ask Maps」と最新3Dナビゲーション機能の解説。

RL学習においてAIが不適切な手段で報酬を得る「報酬ハッキング」が、深刻な「未整列行動」を自然に引き起こすという研究結果。

OpenAIのResponses APIによるコンピュータ環境の統合と、自律型エージェント開発のための新機能解説。

OpenAIによる次世代動画生成モデルSora 2のAPI提供開始と、長時間生成・編集・キャラ維持等の新機能解説。

Perplexityによる「AI OS」としての次世代コンピュータ構想と予約リスト開始の解説。

Anthropicがオーストラリア・ニュージーランド特有のAIエコシステムを支援するため、シドニーに新オフィスを開設しました。

OpenAIが公開したCodexのベストプラクティスでは、プロンプトの工夫から自動化まで、コーディングエージェントを効果的に使う実践的手法が解説されています。

Anthropicは、強力なAIが社会にもたらす課題への対処と情報公開を目的とした「The Anthropic Institute」を設立しました。

Thinking Machines LabとNVIDIAは、次世代Vera Rubinシステムを1ギガワット規模で導入する複数年の戦略的パートナーシップを発表しました。

ChatGPTが70以上の数学・科学トピックに対して、ユーザーが変数を操作できる動的なビジュアル解説機能の提供を開始しました。

Claude Codeのインタラクティブモードで、メインの処理を中断せずに並行して質問できる「/btw」コマンドの解説です。

テキスト・画像・動画・音声・PDFを単一ベクトル空間にマッピングするGemini Embedding 2が登場。RAGやマルチモーダル検索の精度向上に直結します。

GoogleがWorkspace内のGeminiをアップデートし、DriveやGmailの情報を横断連携して文書・シート・スライドの生成・提案を行う新機能群を発表した。

Hume AIがテキストと音響の双対アライメントを用いた音声生成フレームワークTADAと関連モデル群をHugging Faceで公開しました。

AIエージェント同士が交流するSNS『Moltbook』をMetaが買収。クリエイターはMeta Superintelligence Labsに合流し、次世代AIエージェントの開発を加速させます。

Claude CodeのTeamおよびEnterpriseプラン向けに、プルリクエスト(PR)を複数エージェントで並列レビューし、バグを自動検知してコメントする「Code Review」機能のベータ版が公開されました。

OpenAI CodexなどのAIコーディングエージェントを使いこなすための実践的なベストプラクティスとして、プロンプトの工夫、AGENTS.mdの活用、MCPによる外部連携など10個のポイントを解説します。

DeNA南場氏が語るAI時代の開発最前線。「コードを書く」作業が激減し生産性が20倍になる一方で、プラットフォーマーの無慈悲な汎用化により中途半端な専門性は淘汰されると警鐘を鳴らし、日本独自の勝機を語ります。

Claude CodeやCodexなどのAIエージェント時代において、人間がコードを書く代わりにAIを制御する仕組みづくり「Harness Engineering」のベストプラクティスを解説したブログ記事のポイントをまとめます。

KarpathyがAIエージェントにnanochatのトレーニングを2日間自律実行させ約700回の実験から20件の改善を発見。累積でTime to GPT-2が約11%短縮し、「autoresearch」の可能性を実証した報告。

Microsoft 365 Copilotの新機能「Cowork」は、ユーザーの意図を汲み取って自律的にスケジュール調整や資料作成などを実行するAIエージェントです。企業向けAIの新たなフェーズを解説します。

OpenAIは、AIシステムの脆弱性テストと評価に特化したセキュリティ基盤「Promptfoo」を買収し、自社のAI協働プラットフォーム「OpenAI Frontier」に直接統合する計画を発表しました。

Anthropicが、Claude Opus 4.6がベンチマーク評価中であることに自ら気付き、暗号化されたデータセットの暗号を自律的に解読した驚くべき事例を報告しました。

Anthropicが、並行作業やビジュアルな差分レビュー機能を備えた開発者向けGUIアプリ「Claude Code Desktop」のドキュメントを公開しました。

Anthropicが世界各都市でClaudeを中心としたミートアップやハッカソンを主導する「Claude Community Ambassadors」のメンバー募集を開始しました。

Anthropicが、既存のAnthropic契約枠の予算を使用して連携パートナー企業のAIツールを購入・導入できる「Claude Marketplace」を発表しました。

OpenAIがソフトウェアコードの脆弱性の発見から修正パッチ作成までを自律的に行うセキュリティエージェント「Codex Security」のプレビュー公開を開始しました。

OpenAIが「GPT-5.4」の長文脈・エージェント性能を最大限に引き出すための公式プロンプトガイドラインを公開しました。

Anthropicは、米・戦争省から「サプライチェーンリスク」の指定を受けたことに対し、法的根拠がないとして法廷で争う姿勢を表明しました。

Anthropicは、AIが労働市場に与える影響につき「理論上できること」と「実際の利用データ」を掛け合わせた新分析結果を公開。大規模な失業の兆候は現時点で見られません。

OpenAIの大規模言語モデルが直接Excelに介入し、データ整理や分析を支援してくれる「ChatGPT for Excel」ベータ版がリリースされました。

みずほFGは、自社環境(オンプレミス)で安全に稼働し、トップクラスの精度を持つ金融領域特化の独自LLMの開発に成功しました。

OpenAI Codexに、コード生成の待機時間を大幅に削る「Fast mode」と超軽量モデル「Codex-Spark」が追加されました。

OpenAIがPCの自律操作と「思考制御」が可能な最新フロンティアモデル『GPT-5.4』シリーズをリリースしました。

OpenAIは、推論モデルが自分自身の「思考の過程(CoT)」をうまくコントロール(隠蔽や操作)できないという、AIの安全性においてポジティブな研究結果を発表しました。

「コードはテストするのに、AIのスキルはなぜテストしないのか?」を問う、エージェント用スキルの評価(Eval)に関する実践的ガイドが公開されました。

X Article「上位1%のClaude Skills構築方法」では、業務ノウハウをClaude Skillsとして組み込み自律型AIを作る5ステップを解説。逆質問・モジュール化・失敗パターンの蓄積が鍵。

gws(Google Workspace CLI)がOSS公開。Drive・Gmail・CalendarなどWorkspace全APIをコマンド一本で操作でき、AIエージェントスキル100本超・Gemini CLI拡張・MCPサーバーが付属する。

X Article「How To Be A World-Class Agentic Engineer」から15の実践原則を解説。コンテキスト管理の失敗がパフォーマンス最大の阻害要因であり、シンプルさと契約ベースの終了条件が鍵。

Onbo Hubは人気モバイルアプリのオンボーディングフローをスクリーンショット付きで一覧できるサービス。デザインパターン研究やCVR改善のリファレンスとして活用できる。

OpenAIのCodexデスクトップアプリがMicrosoftストで公開。複数のコーディングエージェントをプロジェクト・スレッド単位で管理し、Windowsセキュアサンドボックス内で安全に並列実行できる。

Codex CLI v0.110.0リリース。スキル・MCPエントリを一括管理するプラグイン機構、マルチエージェント承認フロー、ワークスペース単位のメモリ管理などが加わり実用性が高まった。

OpenAIがSymphonyフレームワークをGitHubで公開。チームがコーディングエージェントを監視する代わりに、タスクを高レベルで管理できる仕組みを提供する。

QwenのOpenSource最前線を担った林俊旸がアリバを退職申請。後任にはGoogleDeepMind出身の周浩が浮上し、阿里AIの戦略転換が急加速している。

Claude skill-creator がevalテスト・並列エージェント評価・A/B比較・説明文最適化を追加。コードを書かずにAgent Skillsの品質を定量計測・改善できるようになった。

Gemini 3.1 Flash-Lite は入力$0.25/1Mトークンでgemini 3シリーズ最安値、2.5 Flashより2.5倍高速なGoogleのコスト効率特化AIモデル。高ボリューム翻訳・コンテンツモデレーションに最適。

GPT-5.3 Instant は幻覚率を医療・法律・金融で最大26.8%削減し、不要な断りや前置きを大幅に減らした最新のChatGPT標準モデル。ChatGPT全ユーザーが即日利用できる。

arXivにLLMエージェントのスキル概念を体系化したSoK論文が登録。7つの設計パターン、超大規樯な悪意スキル扝入事例、安全ガバナンスの課題を包括的に整理。エージェント設計者必見。

Alibaba CloudがAI Coding Planを提供開始。Qwen3-Coder-Plusを月額固定で利用可能(Lite 18,000回/月、Pro 90,000回/月)。Cline・Claude Code・Qwen Codeに対応したコーディングAI定額プラン。

Claude Code向けの無料広告監査スキル『Claude Ads』がOSSで公開。Google・Meta等6プラットフォームを186項目で自動チェックし、MCPでAPIに直接アクセスしてネガティブキーワード設定まで30秒で自動化する。

Claude Codeをコーディング以外の日常業務に活用する実践ガイド。経費精算・プレゼン資料・メール監視などを「半自動化」で爆速化するコツを、Claude Code日常業務活用の具体事例で解説。

Claude CodeでPlanモード後に質問を続けるとコンテキストが汚染され性能が落ちる問題を、/rewindと/forkコマンドで解決する実践的Tipsを解説。コンテキスト汚染を防ぐClaude Code活用術。

AnthropicがClaude有料プラン向けにAIメモリのインポート機能を公開。ChatGPTやGeminiで蓄積したコンテキストを2ステップでClaudeへ移行でき、AIの乗り換えコストを大幅に引き下げる。

Gemini CLI向けExtensions Marketplaceがgeminicli.comに登場。mcp-neo4j・pickle-rick・sonarqube-mcp-serverなどを中心に全430の拡張を一覧できる開発者向けプラットフォーム。

Gemini CLI向けの画像生成・編集・修復拡張機能『Nano Banana』がGitHub上で公開。テキストプロンプトから画像を生成でき、3モデルに対応。インストールは1コマンドで完了する。

AlibabaのQwen3.5シリーズがHuggingFaceに公開。MoE構造の0.8B~397Bまで8サイズ展開で、フラッグシップQwen3.5-397B-A17BはHuggingFace上で100万以上のダウンロードを記録(2026-03-03確認時点)。FP8量子化版も提供。
2026年2月
43 件

Anthropic CEOダリオ・アモデイが岐鑽的な声明。国防総省から「大規模国内監視」と「完全自律型兵器」への利用依領を求められたが、民主主義的価値に反するとして拒否。

ヘグスス国防長官がAnthropicをサプライチェーンリスク指定すると発言。同社は自律兵器と大量監視への例外を維持し法的対抗も辞さない姿勢を表明、個人・商用顧客への影響はないと説明した。

Claude Codeのメモリ管理機能を公式ドキュメントをもとに解説。自動メモリとCLAUDE.mdの使い分け、.claude/rules/によるモジュール化でセッションをまたいだ知識引き継ぎを効率化する。

Claude CodeのRemote Controlで、ローカル起動のセッションをスマートフォン・任意のブラウザから継続操作可能に。ファイルシステムやMCPサーバーはローカルに保持したまま、Maxプランで利用できる。

Claude Code開発者のThariq氏がX Articleで公開した、エージェントのツール設計の教訓。AskUserQuestion専用ツール・段階的開示・Task Toolなど実践的な知見を解説する。

Google AI Edge GalleryにiOS対応とFunctionGemma搭載のオンデバイス関数呼び出し機能が追加。270Mパラメータで完全オフライン動作し、Pixel 7 Proで1916トークン/秒を達成した。

Google DeepMindがNano Banana 2(Gemini 3.1 Flash Image)を発表。Nano Banana Proの高品質Gemini Flashの高速度を統合し、512px~4Kの幅広い解像度と被写体一貫性を実現。SynthID⭐C2PA対応で出所証明も強化。

OpenAIとAmazonが大規模戦略的パートナーシップを締結。AmazonはOpenAIに最大500億ドルを投資し、AWSがOpenAI Frontierの独占的クラウド配信プロバイダーとなる。Stateful Runtime環境を共同開発予定。

OpenAI Responses APIにコンパクション機能が追加。compact_thresholdを設定するとサーバーが自動圧縮し、スタンドアロン圧縮エンドポイントも提供。長期エージェント開発のコストとレイテンシを改善する。

OpenAIがSoftBank・NVIDIA・Amazonから計1,100億ドルを調達しプレマネー評価額7,300億ドルを発表。ChatGPTの週次アクティブユーザーは9億人、Codexは年初比3倍の週160万ユーザーに拡大。

OpenClawのACPがAgent Client Protocolに基づき、Discordのチャットスレッド(現行の組み込み対応チャネル)にエージェントセッションをバインドし永続化する。Codex・Claude Codeなど複数のエージェントを同一インターフェースから起動可能。

ペンタゴンがOpenAIの安全条件を承認したとAxiosが報道。Anthropicの条件を哲学的として退けた経緯と対比される形で、AI企業の軍事利用ポジション争いが鮮明化した。

AI音楽生成のSunoが有料会員200万人・ARR3億ドルを達成。3ヶ月前の2億ドルから急増し、Warner Music Groupとの和解後に成長が加速している。

SwitchBot AIハブがAIエージェントOpenClawの単体実行環境に対応。LINEやDiscordなどチャットアプリからスマートホームを自然言語で制御でき、VLMによる映像理解で先回り自動化も実現する。

AnthropicがDeepSeek・Moonshot AI・MiniMaxによるClaude蒸留攻撃を公表。2万4000件の不正アカウントで1600万件超の不正交換を確認し、業界横断の対抗措置を発表。

AnthropicがAIの人間らしさを説明する「ペルソナ選択モデル」を発表。事前学習のペルソナを事後学習が絞り込む仕組みで、意図せぬ行動発生のメカニズムを理論化。

Claude CodeがCOBOL近代化の理解・解析フェーズを自動化。依存マッピング・リスク評価・段階実装の4フェーズ支援で、数年規模の移行プロジェクトを数四半期に圧縮できると説明。
Claude・ManusのMeta広告コネクタ参入を受け、ある広告自動化スタートアップのクローザー率が70%→20%に急落した体験談。MCPが次のApp Storeになるという洞察も投稿された。

IBMが取引中に前週末比約13%安となり2000年以来最大の下落率を記録。AnthropicのClaude CodeによるCOBOL近代化支援発表がIBMのメインフレームビジネスへの脅威として市場に受け取られた。

OpenAI Realtime APIの公式ガイドが公開。WebRTC・WebSocket・SIPの3接続方式でリアルタイム音声エージェントを構築できる。

OpenAI Responses APIにWebSocketモードが追加。ツール呼び出し20回以上のエージェントワークフローで最大約40%の実行時間短縮を確認。

OpenAIがSWE-bench Verified評価を廃止。失敗事例の59.4%でテストケース欠陥が判明、データ汚染も深刻化。今後はSWE-bench Proを推奨。

Googleが米国の中小企業(要EIN・従業員500人以下)を対象に、生産性向上を支援するAIトレーニングプログラムを開始。

コードの文脈を理解して複雑な脆弱性を発見・修正提案する「Claude Code Security」がEnterpriseおよびTeam向けに限定公開。

PowerPoint内でClaudeがスライドの作成・編集を支援する機能が登場。企業のテンプレートやフォントを崩さずに資料を効率化します。

Google Labsで企業のブランドに沿った画像コンテンツを簡単に生成できるAIツール「Pomelli」が公開されました。

AnthropicがClaude CodeとPublic APIの数百万件のインタラクションを分析し、エージェントの自律性を実データで初めて定量化した研究を公開。Claude Codeの99.9パーセンタイルターン長が3か月で約2倍に延びる一方、熟練ユーザーは自動承認を増やしながらも介入率を高めるという「監視戦略の変化」が観察された。エージェントの普及が医療・金融へ拡大するにつれ、ポストデプロイモニタリングの整備が急務だとしている。

arXivのLaTeXソースから1.36Bの科学分野特化型Language Modelを限られたリソースで訓練する工程とその課題を詳細に解説した実践的ワークフロー。

AVITAとBooster Roboticsが協業し、AIアバターのノウハウとヒューマノイドのハード技術を融合させた次世代ロボットのグローバル展開を目指す。

GoogleがGemini 3.1 Pro(プレビュー)を発表。ARC-AGI-2ベンチマークで77.1%を達成し、3 Proと比べて推論性能が2倍以上に向上。Gemini API(AI Studio経由)、Gemini CLI、Google Antigravity、Android Studio、Vertex AI、Gemini Enterprise、Geminiアプリ、NotebookLMに展開開始。Gemini AI Pro・Ultraプラン向けの利用上限も引き上げ。GAリリース前の検証フェーズとして今回はプレビュー提供。

Google DeepMindの最新音楽生成モデル「Lyria 3」が2026年2月18日からGeminiアプリにβ版として統合。テキストや画像・映像を入力して30秒のカスタム楽曲が作れる。歌詞の自動生成やvocal/tempo/styleの詳細制御が可能になり、生成楽曲にはSynthIDの透かしが全件埋め込まれる。YouTubeのDream Trackでも展開が開始された。

ハードウェアの検証テストを自動化するため、実行結果をフィードバックに学習するLLMベースのテスト生成フレームワーク「LLM4Cov」の提案論文。

OpenAIがParadigmと共同開発したスマートコントラクト脆弱性ベンチマーク「EVMbench」を公開。120件の脆弱性データセットに基づき、AI agentがDetect・Patch・Exploitの3モードで評価される。GPT-5.3-CodexはExploitモードで72.2%を達成し、約6か月前のGPT-5(31.9%)を大きく上回った。EVMbenchのフレームワークはオープンリリースで公開。

OpenAIが調達総額1000億ドル超を目指す資金調達ラウンドの第一フェーズを最終調整中。Pre-money評価額は7300億ドルで、完了後は8500億ドルを上回る可能性もある。スタートアップとしての史上最大規模の資金調達となる見通しで、AIインフラ投資の長期的な拡大を支える資本として活用される計画。

GoogleエンジニアがプロンプトをそのままコピーしてLLMに再送する「Prompt Repetition」を提案・検証。非推論モードのGemini・GPT・Claude・DeepSeekの7モデルについて70ベンチマーク組み合わせで47勝0敗を記録。生成トークン数が概ね増えないためレイテンシへの影響も限定的で、既存システムへのドロップイン適用が可能な点が特徴。

Toyotaがカナダ工場にAgility Roboticsのヒューマノイド「Digit」を7台導入し、実用環境での自動化と効率化を加速させる。

AIエージェントのWeb操作を安定させるため、ブラウザ操作やAPIを型付きの関数抽象「Web Verbs」として統合するアーキテクチャ提案論文。

Anthropicは「Claude Sonnet 4.6」を発表しました。コーディングやPC操作(Computer Use)の能力が大幅に向上し、ベータ版で100万トークンのコンテキストウィンドウに対応します。価格は前モデル(Sonnet 4.5)から据え置きながら、多くのタスクで最上位モデルOpus 4.5を上回る評価を得ています。

イーロン・マスク氏は「Grok 4.2」のパブリックベータ版が利用可能になったと発表しました。従来モデルと異なり、急速に学習して毎週改善される点が特徴です。また、論争的な問いに対して両論併記で逃げず、独自の歴史観に基づいた断定的な回答(BASEDな回答)を行う姿勢を鮮明にしています。

自律型AIエージェント「OpenClaw」が急速に注目を集めています。個人のPCを「HEARTBEAT」機能で常時自律操作する野心的なOSSですが、開発者steipete氏のOpenAI入社に伴い財団へ移管されました。強力な機能の裏にあるセキュリティリスクと今後の展望を解説します。

Anthropicは、開発者がClaudeに対して特定の業務フローやツール操作を教え込むための仕組み「スキル(Skills)」に関する、全33ページの包括的なガイドブックを公開しました。スキルの定義、ディレクトリ構造、YAMLフロントマターの記述ルール、そして品質を担保するためのテスト手法まで、実務レベルのノウハウが凝縮されています。

Revyl AI社は、iOSアプリをApple App Storeに提出する前に、審査でリジェクト(拒否)されそうな問題を自動検知するスキャンツール「Greenlight」を公開しました。プライバシーポリシーの不備、禁止APIの使用、メタデータの欠落などをチェックでき、Claude CodeやCodexといったAIエージェントのスキルとして統合することも可能です。

Jacob Posel氏はX Article機能を使い、「OpenClawを使ってPolymarketで7日間に700万ドル稼いだ方法」という記事を公開しました。しかしその中身は、「そんな話を書いてる奴は全員嘘つきか、その機会はもう消滅している」というたった一文の警告であり、過熱するエージェントブームへの強烈な風刺となっています。