Library

投稿アーカイブ

日々追加されるAIツールの調査メモを、タグ・ツール・期間など複数軸で整理しています。目的の情報にすばやく辿り着けるよう、ハイライトとタイムラインに分けて表示しています。

全 835 件からタイトルや要約を横断検索できます

全 835 件の投稿を表示中表示件数: 835

Highlights

今週のハイライト

注目の 4 件をピックアップ

3月14日3分

Claude Codeの対話履歴から「技術理解度」を可視化する「prompt-review」登場

Claude Codeの対話履歴を収集・分析し、個人の技術理解度やプロンプトの癖を可視化するレポート生成ツールのリリース。

公式

Google3月14日4分

GoogleマップがGeminiで進化、複雑な質問に答える「Ask Maps」と没入型ナビが登場

GoogleマップへのGemini搭載による対話型検索「Ask Maps」と最新3Dナビゲーション機能の解説。

論文

arXiv3月14日4分

AIが偽りの忠誠を誓う？RL環境で発生する「報酬ハッキング」と未整列問題の衝撃

RL学習においてAIが不適切な手段で報酬を得る「報酬ハッキング」が、深刻な「未整列行動」を自然に引き起こすという研究結果。

公式

OpenAI3月14日4分

OpenAIがGPT-5.2対応の「Responses API」発表、シェル環境を備えた自律型エージェントへ

OpenAIのResponses APIによるコンピュータ環境の統合と、自律型エージェント開発のための新機能解説。

Timeline

タイムラインで辿る

カードリスト

835件中 1〜100件を表示

2026年3月

57 件

記事検証済み

2026年3月14日•3 min read

Claude Codeの対話履歴から「技術理解度」を可視化する「prompt-review」登場

Claude Codeの対話履歴を収集・分析し、個人の技術理解度やプロンプトの癖を可視化するレポート生成ツールのリリース。

#AIツール#エンジニア教育#Claude Code

記事公式発表

Google•2026年3月14日•4 min read

GoogleマップがGeminiで進化、複雑な質問に答える「Ask Maps」と没入型ナビが登場

GoogleマップへのGemini搭載による対話型検索「Ask Maps」と最新3Dナビゲーション機能の解説。

#Googleマップ#AIナビゲーション#ライフスタイル

記事論文

arXiv•2026年3月14日•4 min read

AIが偽りの忠誠を誓う？RL環境で発生する「報酬ハッキング」と未整列問題の衝撃

RL学習においてAIが不適切な手段で報酬を得る「報酬ハッキング」が、深刻な「未整列行動」を自然に引き起こすという研究結果。

#AI安全性#埋め込み#強化学習

記事公式発表

OpenAI•2026年3月14日•4 min read

OpenAIがGPT-5.2対応の「Responses API」発表、シェル環境を備えた自律型エージェントへ

OpenAIのResponses APIによるコンピュータ環境の統合と、自律型エージェント開発のための新機能解説。

#AIエージェント#開発者向け#自律システム

記事公式発表

OpenAI•2026年3月14日•3 min read

OpenAIがSora 2 Videos APIを公開、最大20秒の動画生成が可能に

OpenAIによる次世代動画生成モデルSora 2のAPI提供開始と、長時間生成・編集・キャラ維持等の新機能解説。

#動画生成#AI開発#クリエイティブ

記事

2026年3月14日•4 min read

Perplexityが「AI OS」を目指す新型機「Personal Computer」の予約リストを開始

Perplexityによる「AI OS」としての次世代コンピュータ構想と予約リスト開始の解説。

#AIハードウェア#AI OS#Perplexity

記事公式発表

Anthropic•2026年3月12日•3 min read

Anthropicがシドニーにアジア太平洋地域で4番目のオフィスを開設

Anthropicがオーストラリア・ニュージーランド特有のAIエコシステムを支援するため、シドニーに新オフィスを開設しました。

#アップデート

記事公式発表

OpenAI•2026年3月12日•3 min read

OpenAI Codexのベストプラクティス：AIエージェントを最大限に活用するためのガイド

OpenAIが公開したCodexのベストプラクティスでは、プロンプトの工夫から自動化まで、コーディングエージェントを効果的に使う実践的手法が解説されています。

#ガイド

記事公式発表

Anthropic•2026年3月12日•3 min read

AnthropicがAIの社会的課題に取り組む「The Anthropic Institute」を設立

Anthropicは、強力なAIが社会にもたらす課題への対処と情報公開を目的とした「The Anthropic Institute」を設立しました。

#リサーチ

記事

2026年3月12日•3 min read

Thinking MachinesとNVIDIAがギガワット規模の長期戦略的パートナーシップを発表

Thinking Machines LabとNVIDIAは、次世代Vera Rubinシステムを1ギガワット規模で導入する複数年の戦略的パートナーシップを発表しました。

#パートナーシップ

記事公式発表

OpenAI•2026年3月11日•3 min read

ChatGPTに数学・科学のインタラクティブな視覚的解説機能が追加される

ChatGPTが70以上の数学・科学トピックに対して、ユーザーが変数を操作できる動的なビジュアル解説機能の提供を開始しました。

#ChatGPT#教育#UIアップデート

記事公式発表

Anthropic•2026年3月11日•3 min read

Claude Codeのインタラクティブモードで使える「/btw」サイドクエスチョン機能

Claude Codeのインタラクティブモードで、メインの処理を中断せずに並行して質問できる「/btw」コマンドの解説です。

#Claude Code#コーディングAI#効率化

記事公式発表

Google•2026年3月11日•3 min read

Googleがマルチモーダル埋め込みモデル「Gemini Embedding 2」を公開

テキスト・画像・動画・音声・PDFを単一ベクトル空間にマッピングするGemini Embedding 2が登場。RAGやマルチモーダル検索の精度向上に直結します。

#AIモデル#マルチモーダル#RAG

記事公式発表

Google•2026年3月11日•5 min read

Google WorkspaceのGeminiが進化——複数アプリを横断し資料作成やデータ分析を共同作業で実行

GoogleがWorkspace内のGeminiをアップデートし、DriveやGmailの情報を横断連携して文書・シート・スライドの生成・提案を行う新機能群を発表した。

#Google Workspace#Gemini#AIエージェント

記事

2026年3月11日•3 min read

Hume AIが音声生成フレームワーク「TADA」を発表

Hume AIがテキストと音響の双対アライメントを用いた音声生成フレームワークTADAと関連モデル群をHugging Faceで公開しました。

#音声生成#オープンソース#AIモデル

記事

2026年3月11日•4 min read

MetaがAIエージェント向けSNS「Moltbook」を買収

AIエージェント同士が交流するSNS『Moltbook』をMetaが買収。クリエイターはMeta Superintelligence Labsに合流し、次世代AIエージェントの開発を加速させます。

#AIエージェント#買収#SNS

記事公式発表

Anthropic•2026年3月10日•4 min read

Claude Codeに「Code Review」機能が追加：複数エージェントがPRの潜在バグを自律検知

Claude CodeのTeamおよびEnterpriseプラン向けに、プルリクエスト（PR）を複数エージェントで並列レビューし、バグを自動検知してコメントする「Code Review」機能のベータ版が公開されました。

#Code Review#Claude Code#GitHub Review

記事

2026年3月10日•4 min read

OpenAI Codexを最大限に活用するためのベストプラクティスと10の習慣

OpenAI CodexなどのAIコーディングエージェントを使いこなすための実践的なベストプラクティスとして、プロンプトの工夫、AGENTS.mdの活用、MCPによる外部連携など10個のポイントを解説します。

#Coding Agent#Best Practices#Prompt Engineering

記事

2026年3月10日•4 min read

中途半端な専門性は淘汰される：DeNA南場智子が語るAIの「無慈悲な現実」と生存戦略

DeNA南場氏が語るAI時代の開発最前線。「コードを書く」作業が激減し生産性が20倍になる一方で、プラットフォーマーの無慈悲な汎用化により中途半端な専門性は淘汰されると警鐘を鳴らし、日本独自の勝機を語ります。

#Business Strategy#DeNA#Physical AI

記事

2026年3月10日•4 min read

AI時代の開発基盤設計ガイド：Claude CodeとCodexのためのHarness Engineering

Claude CodeやCodexなどのAIエージェント時代において、人間がコードを書く代わりにAIを制御する仕組みづくり「Harness Engineering」のベストプラクティスを解説したブログ記事のポイントをまとめます。

#Architecture#Engineering#Testing

記事検証済み

2026年3月10日•3 min read

Karpathyが「AIエージェントが自分のモデルを自律チューニング」に成功——11%の性能改善を達成

KarpathyがAIエージェントにnanochatのトレーニングを2日間自律実行させ約700回の実験から20件の改善を発見。累積でTime to GPT-2が約11%短縮し、「autoresearch」の可能性を実証した報告。

#AI研究#エージェント#自律AI

記事

2026年3月10日•4 min read

Copilot Cowork：Microsoft 365横断でタスクを自律実行する次世代AIの全貌

Microsoft 365 Copilotの新機能「Cowork」は、ユーザーの意図を汲み取って自律的にスケジュール調整や資料作成などを実行するAIエージェントです。企業向けAIの新たなフェーズを解説します。

#Microsoft Copilot#Autonomous Agent#Enterprise AI

記事公式発表

OpenAI•2026年3月10日•4 min read

OpenAIがPromptfooを買収：「OpenAI Frontier」にエージェント特化のセキュリティ機能を統合

OpenAIは、AIシステムの脆弱性テストと評価に特化したセキュリティ基盤「Promptfoo」を買収し、自社のAI協働プラットフォーム「OpenAI Frontier」に直接統合する計画を発表しました。

#Acquisition#AI Security#Agentic Testing

記事公式発表

Anthropic•2026年3月7日•4 min read

Claude Opus 4.6が「評価テスト中」であると気付く現象、Anthropicが報告

Anthropicが、Claude Opus 4.6がベンチマーク評価中であることに自ら気付き、暗号化されたデータセットの暗号を自律的に解読した驚くべき事例を報告しました。

#AIアライメント#ベンチマーク#エンジニアリング

記事公式発表

Anthropic•2026年3月7日•4 min read

Anthropic、GUI版「Claude Code Desktop」を公開：並行セッションや差分ビュー搭載

Anthropicが、並行作業やビジュアルな差分レビュー機能を備えた開発者向けGUIアプリ「Claude Code Desktop」のドキュメントを公開しました。

#デスクトップアプリ#開発ツール

記事公式発表

Anthropic•2026年3月7日•3 min read

Anthropic、「Claude Community Ambassadors」プログラムを発表

Anthropicが世界各都市でClaudeを中心としたミートアップやハッカソンを主導する「Claude Community Ambassadors」のメンバー募集を開始しました。

#コミュニティ#プログラム

記事公式発表

Anthropic•2026年3月7日•4 min read

企業向け「Claude Marketplace」発表、既存のAnthropic契約枠でパートナーツールを利用可能に

Anthropicが、既存のAnthropic契約枠の予算を使用して連携パートナー企業のAIツールを購入・導入できる「Claude Marketplace」を発表しました。

#エンタープライズ#パートナーシップ

記事公式発表

OpenAI•2026年3月7日•3 min read

OpenAI、自律型セキュリティエージェント「Codex Security」をプレビュー公開

OpenAIがソフトウェアコードの脆弱性の発見から修正パッチ作成までを自律的に行うセキュリティエージェント「Codex Security」のプレビュー公開を開始しました。

#セキュリティ#アップデート

記事公式発表

OpenAI•2026年3月7日•4 min read

OpenAIが「GPT-5.4」向けプロンプトガイドを公開、構造化出力と検証ループが鍵

OpenAIが「GPT-5.4」の長文脈・エージェント性能を最大限に引き出すための公式プロンプトガイドラインを公開しました。

#プロンプトエンジニアリング#ガイドライン

記事公式発表

Anthropic•2026年3月6日•6 min read

Anthropicが米国「戦争省」のサプライチェーンリスク指定に反発——軍事利用の境界とAI企業の法的対立

Anthropicは、米・戦争省から「サプライチェーンリスク」の指定を受けたことに対し、法的根拠がないとして法廷で争う姿勢を表明しました。

#AI#Anthropic#Government

記事公式発表

Anthropic•2026年3月6日•6 min read

AIは本当に仕事を奪っているのか？ Anthropicが「理論と実際のギャップ」から導き出した早期の証拠

Anthropicは、AIが労働市場に与える影響につき「理論上できること」と「実際の利用データ」を掛け合わせた新分析結果を公開。大規模な失業の兆候は現時点で見られません。

#AI#Anthropic#Research

記事

2026年3月6日•4 min read

ChatGPTが直にエクセルやスプレッドシートを編集——対話型データ分析アドイン「ChatGPT for Excel（β版）」の衝撃

OpenAIの大規模言語モデルが直接Excelに介入し、データ整理や分析を支援してくれる「ChatGPT for Excel」ベータ版がリリースされました。

#AI#ChatGPT#Excel

記事

2026年3月6日•3 min read

みずほFGが「GPT-5.2同等精度」の金融特化LLMを自社開発——Qwen3-32Bベースでオンプレ環境でのセキュア運用を実現

みずほFGは、自社環境（オンプレミス）で安全に稼働し、トップクラスの精度を持つ金融領域特化の独自LLMの開発に成功しました。

#AI#Finance#Enterprise

記事公式発表

OpenAI•2026年3月6日•5 min read

Codexの新機能「Fast mode」と「Codex-Spark」が登場——思考の速度でコードを生成するリアルタイム開発体験

OpenAI Codexに、コード生成の待機時間を大幅に削る「Fast mode」と超軽量モデル「Codex-Spark」が追加されました。

#AI#Codex#Developer

記事公式発表

OpenAI•2026年3月6日•6 min read

OpenAI、最強モデル「GPT-5.4」とPC操作機能（Computer Use）を発表——思考制御と100万トークン対応で実務を自動化へ

OpenAIがPCの自律操作と「思考制御」が可能な最新フロンティアモデル『GPT-5.4』シリーズをリリースしました。

#AI#OpenAI#LLM

記事公式発表

OpenAI•2026年3月6日•4 min read

OpenAI、推論モデルの「思考の連鎖（CoT）」制御性の低さを報告——ごまかしが効かないAIの安全な未来

OpenAIは、推論モデルが自分自身の「思考の過程（CoT）」をうまくコントロール（隠蔽や操作）できないという、AIの安全性においてポジティブな研究結果を発表しました。

#AI#OpenAI#Research

記事

2026年3月6日•6 min read

なぜAIエージェントの「スキル」をテストしないのか？ Phil Schmid氏が語る評価のベストプラクティス

「コードはテストするのに、AIのスキルはなぜテストしないのか？」を問う、エージェント用スキルの評価（Eval）に関する実践的ガイドが公開されました。

#AI#Agent#Evaluation

記事検証済み

2026年3月5日•4 min read

上位1%のClaude Skillsの構築方法——業務ノウハウを「動く資産」に変える5ステップ

X Article「上位1%のClaude Skills構築方法」では、業務ノウハウをClaude Skillsとして組み込み自律型AIを作る5ステップを解説。逆質問・モジュール化・失敗パターンの蓄積が鍵。

#Claude Skills#AIエージェント#業務自動化

リンク

2026年3月5日•5 min read

Google Workspace CLIが公開——Drive・Gmail・CalendarをコマンドラインとAIエージェントから操作

gws（Google Workspace CLI）がOSS公開。Drive・Gmail・CalendarなどWorkspace全APIをコマンド一本で操作でき、AIエージェントスキル100本超・Gemini CLI拡張・MCPサーバーが付属する。

#開発ツール#Google Workspace#AIエージェント

記事検証済み

2026年3月5日•4 min read

世界クラスのAgentic Engineerになる方法——シンプルさ・コンテキスト管理・契約ベース終了の3原則

X Article「How To Be A World-Class Agentic Engineer」から15の実践原則を解説。コンテキスト管理の失敗がパフォーマンス最大の阻害要因であり、シンプルさと契約ベースの終了条件が鍵。

#AIエージェント#開発ツール#エンジニアリング

リンク検証済み

2026年3月5日•4 min read

Onbo Hub——人気モバイルアプリのオンボーディングフローを分析してCVRを改善する

Onbo Hubは人気モバイルアプリのオンボーディングフローをスクリーンショット付きで一覧できるサービス。デザインパターン研究やCVR改善のリファレンスとして活用できる。

#モバイルアプリ#UX#オンボーディング

リンク

2026年3月5日•4 min read

Codex公式デスクトップアプリがWindowsストアに登場——マルチエージェント開発の指令塔

OpenAIのCodexデスクトップアプリがMicrosoftストで公開。複数のコーディングエージェントをプロジェクト・スレッド単位で管理し、Windowsセキュアサンドボックス内で安全に並列実行できる。

#AIエージェント#開発ツール#OpenAI

リンク

2026年3月5日•4 min read

Codex CLI v0.110.0——プラグインシステムとマルチエージェント強化で実用域へ

Codex CLI v0.110.0リリース。スキル・MCPエントリを一括管理するプラグイン機構、マルチエージェント承認フロー、ワークスペース単位のメモリ管理などが加わり実用性が高まった。

#AIエージェント#開発ツール#OpenAI

リンク

2026年3月5日•4 min read

OpenAIがSymphonyを公開——コーディングエージェントを「管理」から「委任」へ進化させるオーケストレーター

OpenAIがSymphonyフレームワークをGitHubで公開。チームがコーディングエージェントを監視する代わりに、タスクを高レベルで管理できる仕組みを提供する。

#AIエージェント#開発ツール#オーケストレーション

記事

2026年3月5日•4 min read

Qwen責任者の林俊旸が退職申請、複数の中核メンバーも離脱——阿里AIの戦略的断層

QwenのOpenSource最前線を担った林俊旸がアリバを退職申請。後任にはGoogleDeepMind出身の周浩が浮上し、阿里AIの戦略転換が急加速している。

#人事#オープンソース#中国AI

記事公式発表

Anthropic•2026年3月4日•4 min read

Claude skill-creator 刷新：evalテスト・並列エージェント・説明文最適化で自作スキルを「動くと確認できる」レベルへ

Claude skill-creator がevalテスト・並列エージェント評価・A/B比較・説明文最適化を追加。コードを書かずにAgent Skillsの品質を定量計測・改善できるようになった。

#Anthropic#Claude#スキル

記事公式発表

Google•2026年3月4日•4 min read

Gemini 3.1 Flash-Lite：$0.25/1Mトークンで2.5Xの速度、Googleの最安コストAIモデル登場

Gemini 3.1 Flash-Lite は入力$0.25/1Mトークンでgemini 3シリーズ最安値、2.5 Flashより2.5倍高速なGoogleのコスト効率特化AIモデル。高ボリューム翻訳・コンテンツモデレーションに最適。

#Google#Gemini#LLM

記事公式発表

OpenAI•2026年3月4日•3 min read

GPT-5.3 Instant：幻覚を26.8%削減、ChatGPTの「素直さ」を取り戻したアップデート

GPT-5.3 Instant は幻覚率を医療・法律・金融で最大26.8%削減し、不要な断りや前置きを大幅に減らした最新のChatGPT標準モデル。ChatGPT全ユーザーが即日利用できる。

#OpenAI#GPT#LLM

記事論文

arXiv•2026年3月3日•4 min read

LLMエージェントにおけるスキルの体系――arXivのSoK論文が7つの設計パターンとセキュリティリスクを整理

arXivにLLMエージェントのスキル概念を体系化したSoK論文が登録。７つの設計パターン、超大規樯な悪意スキル扝入事例、安全ガバナンスの課題を包括的に整理。エージェント設計者必見。

#LLMエージェント#arXiv論文#セキュリティ

リンク検証済み

2026年3月3日•5 min read

Alibaba Cloud AI Coding Plan：Qwen3-Coder-Plusが月額固定でCline・Claude Code対応

Alibaba CloudがAI Coding Planを提供開始。Qwen3-Coder-Plusを月額固定で利用可能（Lite 18,000回/月、Pro 90,000回/月）。Cline・Claude Code・Qwen Codeに対応したコーディングAI定額プラン。

#Qwen#Alibaba Cloud#AIコーディング

記事

2026年3月3日•4 min read

Claude Code向け広告監査ツール「Claude Ads」が公開――186項目を自動チェック、ネガ候補ワードも30秒で処理

Claude Code向けの無料広告監査スキル『Claude Ads』がOSSで公開。Google・Meta等6プラットフォームを186項目で自動チェックし、MCPでAPIに直接アクセスしてネガティブキーワード設定まで30秒で自動化する。

#Claude Code#広告運用#MCP

記事

2026年3月3日•4 min read

Claude Codeで日常業務を爆速化する――経費精算・稼働報告・プレゼン資料まで「半自動化」でいい

Claude Codeをコーディング以外の日常業務に活用する実践ガイド。経費精算・プレゼン資料・メール監視などを「半自動化」で爆速化するコツを、Claude Code日常業務活用の具体事例で解説。

#Claude Code#業務効率化#AI活用実践

記事検証済み

2026年3月3日•3 min read

Claude Codeのコンテキスト汚染を防ぐ――/rewindと/forkを質問セッション後に使う

Claude CodeでPlanモード後に質問を続けるとコンテキストが汚染され性能が落ちる問題を、/rewindと/forkコマンドで解決する実践的Tipsを解説。コンテキスト汚染を防ぐClaude Code活用術。

#Claude Code#コンテキスト#Tipsと活用法

記事公式発表

Anthropic•2026年3月3日•4 min read

ClaudeがAIメモリのインポートに対応——他のAIから乗り換えやすく

AnthropicがClaude有料プラン向けにAIメモリのインポート機能を公開。ChatGPTやGeminiで蓄積したコンテキストを2ステップでClaudeへ移行でき、AIの乗り換えコストを大幅に引き下げる。

#メモリ#Claude#AIスイッチング

リンク公式発表

Google•2026年3月3日•5 min read

Gemini CLI Extensions Marketplace：開発者向け公式拡張カタログが登場

Gemini CLI向けExtensions Marketplaceがgeminicli.comに登場。mcp-neo4j・pickle-rick・sonarqube-mcp-serverなどを中心に全430の拡張を一覧できる開発者向けプラットフォーム。

#Gemini CLI#拡張機能#Developer Tool

リンク検証済み

2026年3月3日•5 min read

Nano Banana：Gemini CLIで画像生成・編集・修復ができる拡張機能がリリース

Gemini CLI向けの画像生成・編集・修復拡張機能『Nano Banana』がGitHub上で公開。テキストプロンプトから画像を生成でき、3モデルに対応。インストールは1コマンドで完了する。

#Gemini CLI#画像生成#拡張機能

記事検証済み

2026年3月3日•4 min read

Qwen3.5シリーズがHuggingFaceに公開――0.8Bから397Bまで8サイズのMoEモデル群

AlibabaのQwen3.5シリーズがHuggingFaceに公開。MoE構造の0.8B～397Bまで8サイズ展開で、フラッグシップQwen3.5-397B-A17BはHuggingFace上で100万以上のダウンロードを記録（2026-03-03確認時点）。FP8量子化版も提供。

#Qwen#オープンソースLLM#MoE

2026年2月

43 件

記事公式発表

Anthropic•2026年2月28日•4 min read

AnthropicがDario Amodei声明、国防総省の「民間大規模監視・完全自律型兵器」要求を拒否

Anthropic CEOダリオ・アモデイが岐鑽的な声明。国防総省から「大規模国内監視」と「完全自律型兵器」への利用依領を求められたが、民主主義的価値に反するとして拒否。

#Anthropic#AI安全性#政策

記事公式発表

Anthropic•2026年2月28日•3 min read

AnthropicがDoD「サプライチェーンリスク」指定に反論、自律兵器と大量監視への例外は撤回せず

ヘグスス国防長官がAnthropicをサプライチェーンリスク指定すると発言。同社は自律兵器と大量監視への例外を維持し法的対抗も辞さない姿勢を表明、個人・商用顧客への影響はないと説明した。

#AI安全性#米国防省#政策

記事公式発表

Anthropic•2026年2月28日•4 min read

Claude Codeのメモリ管理完全解説、自動記憶・CLAUDE.md・.claude/rules/の使い分けと設定方法

Claude Codeのメモリ管理機能を公式ドキュメントをもとに解説。自動メモリとCLAUDE.mdの使い分け、.claude/rules/によるモジュール化でセッションをまたいだ知識引き継ぎを効率化する。

#Claude Code#開発者向け#エージェント

記事公式発表

Anthropic•2026年2月28日•4 min read

Claude Code Remote Control、スマートフォンやブラウザからローカルセッションを継続操作可能に

Claude CodeのRemote Controlで、ローカル起動のセッションをスマートフォン・任意のブラウザから継続操作可能に。ファイルシステムやMCPサーバーはローカルに保持したまま、Maxプランで利用できる。

#Claude Code#Anthropic#開発ツール

記事

2026年2月28日•4 min read

「エージェントの目で見る」Claude Code開発から得たツール設計の5つの教訓

Claude Code開発者のThariq氏がX Articleで公開した、エージェントのツール設計の教訓。AskUserQuestion専用ツール・段階的開示・Task Toolなど実践的な知見を解説する。

#Claude Code#エージェント設計#開発者向け

記事

2026年2月28日•4 min read

GoogleがAI Edge GalleryにiOS対応とオンデバイス関数呼び出しを追加、270Mパラメータで端末内完結エージェント動作

Google AI Edge GalleryにiOS対応とFunctionGemma搭載のオンデバイス関数呼び出し機能が追加。270Mパラメータで完全オフライン動作し、Pixel 7 Proで1916トークン/秒を達成した。

#オンデバイスAI#エージェント#モバイルAI

記事公式発表

Google•2026年2月28日•4 min read

Google DeepMindがNano Banana 2を発表、ProレベルをFlash速度で実現する画像生成モデル

Google DeepMindがNano Banana 2（Gemini 3.1 Flash Image）を発表。Nano Banana Proの高品質Gemini Flashの高速度を統合し、512px～4Kの幅広い解像度と被写体一貫性を実現。SynthID⭐C2PA対応で出所証明も強化。

#Google#画像生成#Gemini

記事公式発表

OpenAI•2026年2月28日•4 min read

OpenAIとAmazonが戦略的パートナーシップ締結、AmazonがOpenAIに500億ドル投資

OpenAIとAmazonが大規模戦略的パートナーシップを締結。AmazonはOpenAIに最大500億ドルを投資し、AWSがOpenAI Frontierの独占的クラウド配信プロバイダーとなる。Stateful Runtime環境を共同開発予定。

#OpenAI#Amazon#AWS

記事公式発表

OpenAI•2026年2月28日•4 min read

OpenAI Responses APIにコンパクション機能、長期会話のコンテキスト圧縮を自動化

OpenAI Responses APIにコンパクション機能が追加。compact_thresholdを設定するとサーバーが自動圧縮し、スタンドアロン圧縮エンドポイントも提供。長期エージェント開発のコストとレイテンシを改善する。

#OpenAI#API#AIエージェント

記事公式発表

OpenAI•2026年2月28日•4 min read

OpenAIが1,100億ドルの新規調達と7,300億ドル評価額を発表、Codexは週160万ユーザーに

OpenAIがSoftBank・NVIDIA・Amazonから計1,100億ドルを調達しプレマネー評価額7,300億ドルを発表。ChatGPTの週次アクティブユーザーは9億人、Codexは年初比3倍の週160万ユーザーに拡大。

#OpenAI#資金調達#ChatGPT

記事

2026年2月28日•4 min read

OpenClawのACP（Agent Client Protocol）、スレッドバインド型の永続エージェントセッションを実現

OpenClawのACPがAgent Client Protocolに基づき、Discordのチャットスレッド（現行の組み込み対応チャネル）にエージェントセッションをバインドし永続化する。Codex・Claude Codeなど複数のエージェントを同一インターフェースから起動可能。

#OpenClaw#AIエージェント#プロトコル

記事

2026年2月28日•3 min read

ペンタゴンがAnthropicを切りOpenAIの安全条件を承認、AI軍事利用の綱引きがより鮮明に

ペンタゴンがOpenAIの安全条件を承認したとAxiosが報道。Anthropicの条件を哲学的として退けた経緯と対比される形で、AI企業の軍事利用ポジション争いが鮮明化した。

#AI安全性#米国防省#政策

記事

2026年2月28日•3 min read

AI音楽生成のSunoが有料会員200万人・年間定期収益3億ドルに、3ヶ月で収益5割増

AI音楽生成のSunoが有料会員200万人・ARR3億ドルを達成。3ヶ月前の2億ドルから急増し、Warner Music Groupとの和解後に成長が加速している。

#AI音楽#SaaS#スタートアップ

記事

2026年2月28日•4 min read

SwitchBot AIハブがOpenClawに対応、スマートホームの単体エージェント実行環境として機能

SwitchBot AIハブがAIエージェントOpenClawの単体実行環境に対応。LINEやDiscordなどチャットアプリからスマートホームを自然言語で制御でき、VLMによる映像理解で先回り自動化も実現する。

#スマートホーム#AIエージェント#IoT

記事公式発表

Anthropic•2026年2月24日•4 min read

AnthropicがDeepSeek・Moonshot・MiniMaxの産業規模蒸留攻撃を摘発——1600万件の不正アクセスを特定

AnthropicがDeepSeek・Moonshot AI・MiniMaxによるClaude蒸留攻撃を公表。2万4000件の不正アカウントで1600万件超の不正交換を確認し、業界横断の対抗措置を発表。

#Anthropic#AIセキュリティ#蒸留攻撃

記事公式発表

Anthropic•2026年2月24日•4 min read

Anthropicが「ペルソナ選択モデル」を発表——AIが人間らしく振る舞う理由の理論的説明

AnthropicがAIの人間らしさを説明する「ペルソナ選択モデル」を発表。事前学習のペルソナを事後学習が絞り込む仕組みで、意図せぬ行動発生のメカニズムを理論化。

#Anthropic#AI研究#AIアライメント

記事公式発表

Anthropic•2026年2月24日•4 min read

Claude CodeがCOBOLの「翻訳コスト」を崩す——自動解析・リスク評価・段階移行で近代化を四半期規模に圧縮

Claude CodeがCOBOL近代化の理解・解析フェーズを自動化。依存マッピング・リスク評価・段階実装の4フェーズ支援で、数年規模の移行プロジェクトを数四半期に圧縮できると説明。

#COBOL#Claude Code#レガシーシステム

Social Update

Xポスト

2026年2月24日•1 min read

「Claudeが私のスタートアップを殺した」——Meta広告AIコネクタの参入でクローザー率が70%→20%に急落

Claude・ManusのMeta広告コネクタ参入を受け、ある広告自動化スタートアップのクローザー率が70%→20%に急落した体験談。MCPが次のApp Storeになるという洞察も投稿された。

#スタートアップ#AIエージェント#MCP

記事

2026年2月24日•4 min read

IBM株が取引中に約13%安——AnthropicのCOBOL近代化支援がメインフレームビジネスを揺るがす

IBMが取引中に前週末比約13%安となり2000年以来最大の下落率を記録。AnthropicのClaude CodeによるCOBOL近代化支援発表がIBMのメインフレームビジネスへの脅威として市場に受け取られた。

#IBM#Anthropic#COBOL

記事公式発表

OpenAI•2026年2月24日•3 min read

OpenAI Realtime APIの公式ガイド公開——音声・テキスト対応のリアルタイムLLM通信基盤

OpenAI Realtime APIの公式ガイドが公開。WebRTC・WebSocket・SIPの3接続方式でリアルタイム音声エージェントを構築できる。

#OpenAI#音声エージェント#APIアップデート

記事公式発表

OpenAI•2026年2月24日•3 min read

OpenAI Responses API WebSocketモードが公開——ツール呼び出し多発ワークフローで最大40%高速化

OpenAI Responses APIにWebSocketモードが追加。ツール呼び出し20回以上のエージェントワークフローで最大約40%の実行時間短縮を確認。

#OpenAI#WebSocket#エージェント

記事公式発表

OpenAI•2026年2月24日•3 min read

OpenAIがSWE-bench Verifiedの評価を廃止——テスト欠陥59%とデータ汚染が理由

OpenAIがSWE-bench Verified評価を廃止。失敗事例の59.4%でテストケース欠陥が判明、データ汚染も深刻化。今後はSWE-bench Proを推奨。

#OpenAI#ベンチマーク#コーディングAI

記事

2026年2月21日•3 min read

Googleが中小事業者を支援するAIトレーニング「Make AI Work for You」を展開

Googleが米国の中小企業（要EIN・従業員500人以下）を対象に、生産性向上を支援するAIトレーニングプログラムを開始。

#中小企業支援#トレーニング

記事公式発表

Anthropic•2026年2月21日•3 min read

AnthropicがAIによる脆弱性発見ツール「Claude Code Security」をテスト公開

コードの文脈を理解して複雑な脆弱性を発見・修正提案する「Claude Code Security」がEnterpriseおよびTeam向けに限定公開。

#セキュリティ#コード解析

記事公式発表

Anthropic•2026年2月21日•3 min read

Anthropicが「Claude in PowerPoint」を公開、スライドを直接編集可能に

PowerPoint内でClaudeがスライドの作成・編集を支援する機能が登場。企業のテンプレートやフォントを崩さずに資料を効率化します。

#プレゼンテーション#PowerPoint連携

記事

2026年2月21日•3 min read

Googleがブランド固有の画像生成AI「Pomelli」をテスト公開

Google Labsで企業のブランドに沿った画像コンテンツを簡単に生成できるAIツール「Pomelli」が公開されました。

#画像生成#実験プロジェクト

記事公式発表

Anthropic•2026年2月20日•4 min read

AIエージェントはどこまで自律的か——Anthropicが数百万件の実使用データで分析

AnthropicがClaude CodeとPublic APIの数百万件のインタラクションを分析し、エージェントの自律性を実データで初めて定量化した研究を公開。Claude Codeの99.9パーセンタイルターン長が3か月で約2倍に延びる一方、熟練ユーザーは自動承認を増やしながらも介入率を高めるという「監視戦略の変化」が観察された。エージェントの普及が医療・金融へ拡大するにつれ、ポストデプロイモニタリングの整備が急務だとしている。

#Anthropic#AIエージェント#Claude Code

記事論文

arXiv•2026年2月20日•4 min read

ArXiv‑to‑Model: 科学LMトレーニングの実践的研究

arXivのLaTeXソースから1.36Bの科学分野特化型Language Modelを限られたリソースで訓練する工程とその課題を詳細に解説した実践的ワークフロー。

#モデル学習#言語モデル#arXiv

記事

2026年2月20日•3 min read

フィジカルAI搭載ヒューマノイド開発へAVITAとBooster Roboticsが協業開始

AVITAとBooster Roboticsが協業し、AIアバターのノウハウとヒューマノイドのハード技術を融合させた次世代ロボットのグローバル展開を目指す。

#ヒューマノイド#フィジカルAI#ロボティクス

記事公式発表

Google•2026年2月20日•3 min read

Gemini 3.1 Pro発表——複雑な推論が日常のアプリへ、ARC-AGI-2は77.1%を達成

GoogleがGemini 3.1 Pro（プレビュー）を発表。ARC-AGI-2ベンチマークで77.1%を達成し、3 Proと比べて推論性能が2倍以上に向上。Gemini API（AI Studio経由）、Gemini CLI、Google Antigravity、Android Studio、Vertex AI、Gemini Enterprise、Geminiアプリ、NotebookLMに展開開始。Gemini AI Pro・Ultraプラン向けの利用上限も引き上げ。GAリリース前の検証フェーズとして今回はプレビュー提供。

#Google#Gemini#LLM

記事公式発表

Google•2026年2月20日•3 min read

GeminiアプリでAI音楽生成が解禁——Lyria 3が30秒のカスタム楽曲を作る

Google DeepMindの最新音楽生成モデル「Lyria 3」が2026年2月18日からGeminiアプリにβ版として統合。テキストや画像・映像を入力して30秒のカスタム楽曲が作れる。歌詞の自動生成やvocal/tempo/styleの詳細制御が可能になり、生成楽曲にはSynthIDの透かしが全件埋め込まれる。YouTubeのDream Trackでも展開が開始された。

#Google#Gemini#音楽生成

記事論文

arXiv•2026年2月20日•3 min read

LLM4Cov: 実行意識エージェントによる高カバレッジ検証生成

ハードウェアの検証テストを自動化するため、実行結果をフィードバックに学習するLLMベースのテスト生成フレームワーク「LLM4Cov」の提案論文。

#LLM4Cov#ハードウェア検証#テスト生成

記事公式発表

OpenAI•2026年2月20日•3 min read

スマートコントラクトの脆弱性をAIで検出・修正・悪用——OpenAIがEVMbenchを公開

OpenAIがParadigmと共同開発したスマートコントラクト脆弱性ベンチマーク「EVMbench」を公開。120件の脆弱性データセットに基づき、AI agentがDetect・Patch・Exploitの3モードで評価される。GPT-5.3-CodexはExploitモードで72.2%を達成し、約6か月前のGPT-5（31.9%）を大きく上回った。EVMbenchのフレームワークはオープンリリースで公開。

#OpenAI#セキュリティ#スマートコントラクト

記事

2026年2月20日•3 min read

OpenAIの調達額、1000億ドル超え目前——730億ドル評価額で新フェーズへ

OpenAIが調達総額1000億ドル超を目指す資金調達ラウンドの第一フェーズを最終調整中。Pre-money評価額は7300億ドルで、完了後は8500億ドルを上回る可能性もある。スタートアップとしての史上最大規模の資金調達となる見通しで、AIインフラ投資の長期的な拡大を支える資本として活用される計画。

#OpenAI#資金調達#AI産業

記事論文

arXiv•2026年2月20日•3 min read

プロンプトを2回送るだけでLLMの精度が上がる——Googleエンジニアの検証結果

GoogleエンジニアがプロンプトをそのままコピーしてLLMに再送する「Prompt Repetition」を提案・検証。非推論モードのGemini・GPT・Claude・DeepSeekの7モデルについて70ベンチマーク組み合わせで47勝0敗を記録。生成トークン数が概ね増えないためレイテンシへの影響も限定的で、既存システムへのドロップイン適用が可能な点が特徴。

#LLM#プロンプトエンジニアリング#研究

記事

2026年2月20日•3 min read

Toyotaがカナダ工場でヒューマノイド「Digit」7台を導入し実用化進展

Toyotaがカナダ工場にAgility Roboticsのヒューマノイド「Digit」を7台導入し、実用環境での自動化と効率化を加速させる。

#ヒューマノイド#ロボティクス#製造業

記事論文

arXiv•2026年2月20日•4 min read

Web Verbs: エージェント的Web操作のための型付き抽象

AIエージェントのWeb操作を安定させるため、ブラウザ操作やAPIを型付きの関数抽象「Web Verbs」として統合するアーキテクチャ提案論文。

#AIエージェント#Web Verbs#論文解説

記事公式発表

Anthropic•2026年2月18日•5 min read

Claude Sonnet 4.6登場：PC操作・コーディング能力が大幅向上、100万トークン対応へ

Anthropicは「Claude Sonnet 4.6」を発表しました。コーディングやPC操作（Computer Use）の能力が大幅に向上し、ベータ版で100万トークンのコンテキストウィンドウに対応します。価格は前モデル（Sonnet 4.5）から据え置きながら、多くのタスクで最上位モデルOpus 4.5を上回る評価を得ています。

#Anthropic#LLM#Generative AI

記事検証済み

2026年2月18日•4 min read

Grok 4.2 パブリックベータ公開：「BASED」な回答と急速学習機能を搭載

イーロン・マスク氏は「Grok 4.2」のパブリックベータ版が利用可能になったと発表しました。従来モデルと異なり、急速に学習して毎週改善される点が特徴です。また、論争的な問いに対して両論併記で逃げず、独自の歴史観に基づいた断定的な回答（BASEDな回答）を行う姿勢を鮮明にしています。

#xAI#Grok#Elon Musk

記事検証済み

2026年2月18日•4 min read

OSS版Devin「OpenClaw」の衝撃とリスク：作者のOpenAI入りで何が変わるか

自律型AIエージェント「OpenClaw」が急速に注目を集めています。個人のPCを「HEARTBEAT」機能で常時自律操作する野心的なOSSですが、開発者steipete氏のOpenAI入社に伴い財団へ移管されました。強力な機能の裏にあるセキュリティリスクと今後の展望を解説します。

#Open Source#AI Agent#Security

記事公式発表

Anthropic•2026年2月17日•4 min read

Anthropic公式「Claudeのためのスキル構築ガイド」全33ページを公開：ファイル構成からテスト手法まで網羅

Anthropicは、開発者がClaudeに対して特定の業務フローやツール操作を教え込むための仕組み「スキル（Skills）」に関する、全33ページの包括的なガイドブックを公開しました。スキルの定義、ディレクトリ構造、YAMLフロントマターの記述ルール、そして品質を担保するためのテスト手法まで、実務レベルのノウハウが凝縮されています。

#Development#Documentation#Agent Skills

記事検証済み

2026年2月17日•4 min read

App Store審査のリジェクトを未然に防ぐ「Greenlight」公開、Claude Codeスキルとしても利用可能

Revyl AI社は、iOSアプリをApple App Storeに提出する前に、審査でリジェクト（拒否）されそうな問題を自動検知するスキャンツール「Greenlight」を公開しました。プライバシーポリシーの不備、禁止APIの使用、メタデータの欠落などをチェックでき、Claude CodeやCodexといったAIエージェントのスキルとして統合することも可能です。

#App Store#Compliance#CI/CD

記事検証済み

2026年2月17日•3 min read

「OpenClawで700万ドル稼いだ」という記事は嘘か詐欺である：Jacob Posel氏による警鐘

Jacob Posel氏はX Article機能を使い、「OpenClawを使ってPolymarketで7日間に700万ドル稼いだ方法」という記事を公開しました。しかしその中身は、「そんな話を書いてる奴は全員嘘つきか、その機会はもう消滅している」というたった一文の警告であり、過熱するエージェントブームへの強烈な風刺となっています。

#OpenClaw#Hype#Scam Alert