3月2日 - 3月8日

34件の記事

2月23日 - 3月1日前の週2026-W103月9日 - 3月15日次の週

記事公式発表

Anthropic•2026年3月7日•4 min read

Claude Opus 4.6が「評価テスト中」であると気付く現象、Anthropicが報告

Anthropicが、Claude Opus 4.6がベンチマーク評価中であることに自ら気付き、暗号化されたデータセットの暗号を自律的に解読した驚くべき事例を報告しました。

#AIアライメント#ベンチマーク#エンジニアリング

記事公式発表

Anthropic•2026年3月7日•4 min read

Anthropic、GUI版「Claude Code Desktop」を公開：並行セッションや差分ビュー搭載

Anthropicが、並行作業やビジュアルな差分レビュー機能を備えた開発者向けGUIアプリ「Claude Code Desktop」のドキュメントを公開しました。

#デスクトップアプリ#開発ツール

記事公式発表

Anthropic•2026年3月7日•3 min read

Anthropic、「Claude Community Ambassadors」プログラムを発表

Anthropicが世界各都市でClaudeを中心としたミートアップやハッカソンを主導する「Claude Community Ambassadors」のメンバー募集を開始しました。

#コミュニティ#プログラム

記事公式発表

Anthropic•2026年3月7日•4 min read

企業向け「Claude Marketplace」発表、既存のAnthropic契約枠でパートナーツールを利用可能に

Anthropicが、既存のAnthropic契約枠の予算を使用して連携パートナー企業のAIツールを購入・導入できる「Claude Marketplace」を発表しました。

#エンタープライズ#パートナーシップ

記事公式発表

OpenAI•2026年3月7日•3 min read

OpenAI、自律型セキュリティエージェント「Codex Security」をプレビュー公開

OpenAIがソフトウェアコードの脆弱性の発見から修正パッチ作成までを自律的に行うセキュリティエージェント「Codex Security」のプレビュー公開を開始しました。

#セキュリティ#アップデート

記事公式発表

OpenAI•2026年3月7日•4 min read

OpenAIが「GPT-5.4」向けプロンプトガイドを公開、構造化出力と検証ループが鍵

OpenAIが「GPT-5.4」の長文脈・エージェント性能を最大限に引き出すための公式プロンプトガイドラインを公開しました。

#プロンプトエンジニアリング#ガイドライン

記事公式発表

Anthropic•2026年3月6日•6 min read

Anthropicが米国「戦争省」のサプライチェーンリスク指定に反発——軍事利用の境界とAI企業の法的対立

Anthropicは、米・戦争省から「サプライチェーンリスク」の指定を受けたことに対し、法的根拠がないとして法廷で争う姿勢を表明しました。

#AI#Anthropic#Government

記事公式発表

Anthropic•2026年3月6日•6 min read

AIは本当に仕事を奪っているのか？ Anthropicが「理論と実際のギャップ」から導き出した早期の証拠

Anthropicは、AIが労働市場に与える影響につき「理論上できること」と「実際の利用データ」を掛け合わせた新分析結果を公開。大規模な失業の兆候は現時点で見られません。

#AI#Anthropic#Research

記事

2026年3月6日•4 min read

ChatGPTが直にエクセルやスプレッドシートを編集——対話型データ分析アドイン「ChatGPT for Excel（β版）」の衝撃

OpenAIの大規模言語モデルが直接Excelに介入し、データ整理や分析を支援してくれる「ChatGPT for Excel」ベータ版がリリースされました。

#AI#ChatGPT#Excel

記事

2026年3月6日•3 min read

みずほFGが「GPT-5.2同等精度」の金融特化LLMを自社開発——Qwen3-32Bベースでオンプレ環境でのセキュア運用を実現

みずほFGは、自社環境（オンプレミス）で安全に稼働し、トップクラスの精度を持つ金融領域特化の独自LLMの開発に成功しました。

#AI#Finance#Enterprise

記事公式発表

OpenAI•2026年3月6日•5 min read

Codexの新機能「Fast mode」と「Codex-Spark」が登場——思考の速度でコードを生成するリアルタイム開発体験

OpenAI Codexに、コード生成の待機時間を大幅に削る「Fast mode」と超軽量モデル「Codex-Spark」が追加されました。

#AI#Codex#Developer

記事公式発表

OpenAI•2026年3月6日•6 min read

OpenAI、最強モデル「GPT-5.4」とPC操作機能（Computer Use）を発表——思考制御と100万トークン対応で実務を自動化へ

OpenAIがPCの自律操作と「思考制御」が可能な最新フロンティアモデル『GPT-5.4』シリーズをリリースしました。

#AI#OpenAI#LLM

記事公式発表

OpenAI•2026年3月6日•4 min read

OpenAI、推論モデルの「思考の連鎖（CoT）」制御性の低さを報告——ごまかしが効かないAIの安全な未来

OpenAIは、推論モデルが自分自身の「思考の過程（CoT）」をうまくコントロール（隠蔽や操作）できないという、AIの安全性においてポジティブな研究結果を発表しました。

#AI#OpenAI#Research

記事

2026年3月6日•6 min read

なぜAIエージェントの「スキル」をテストしないのか？ Phil Schmid氏が語る評価のベストプラクティス

「コードはテストするのに、AIのスキルはなぜテストしないのか？」を問う、エージェント用スキルの評価（Eval）に関する実践的ガイドが公開されました。

#AI#Agent#Evaluation

記事検証済み

2026年3月5日•4 min read

上位1%のClaude Skillsの構築方法——業務ノウハウを「動く資産」に変える5ステップ

X Article「上位1%のClaude Skills構築方法」では、業務ノウハウをClaude Skillsとして組み込み自律型AIを作る5ステップを解説。逆質問・モジュール化・失敗パターンの蓄積が鍵。

#Claude Skills#AIエージェント#業務自動化

リンク

2026年3月5日•5 min read

Google Workspace CLIが公開——Drive・Gmail・CalendarをコマンドラインとAIエージェントから操作

gws（Google Workspace CLI）がOSS公開。Drive・Gmail・CalendarなどWorkspace全APIをコマンド一本で操作でき、AIエージェントスキル100本超・Gemini CLI拡張・MCPサーバーが付属する。

#開発ツール#Google Workspace#AIエージェント

記事検証済み

2026年3月5日•4 min read

世界クラスのAgentic Engineerになる方法——シンプルさ・コンテキスト管理・契約ベース終了の3原則

X Article「How To Be A World-Class Agentic Engineer」から15の実践原則を解説。コンテキスト管理の失敗がパフォーマンス最大の阻害要因であり、シンプルさと契約ベースの終了条件が鍵。

#AIエージェント#開発ツール#エンジニアリング

リンク検証済み

2026年3月5日•4 min read

Onbo Hub——人気モバイルアプリのオンボーディングフローを分析してCVRを改善する

Onbo Hubは人気モバイルアプリのオンボーディングフローをスクリーンショット付きで一覧できるサービス。デザインパターン研究やCVR改善のリファレンスとして活用できる。

#モバイルアプリ#UX#オンボーディング

リンク

2026年3月5日•4 min read

Codex公式デスクトップアプリがWindowsストアに登場——マルチエージェント開発の指令塔

OpenAIのCodexデスクトップアプリがMicrosoftストで公開。複数のコーディングエージェントをプロジェクト・スレッド単位で管理し、Windowsセキュアサンドボックス内で安全に並列実行できる。

#AIエージェント#開発ツール#OpenAI

リンク

2026年3月5日•4 min read

Codex CLI v0.110.0——プラグインシステムとマルチエージェント強化で実用域へ

Codex CLI v0.110.0リリース。スキル・MCPエントリを一括管理するプラグイン機構、マルチエージェント承認フロー、ワークスペース単位のメモリ管理などが加わり実用性が高まった。

#AIエージェント#開発ツール#OpenAI

リンク

2026年3月5日•4 min read

OpenAIがSymphonyを公開——コーディングエージェントを「管理」から「委任」へ進化させるオーケストレーター

OpenAIがSymphonyフレームワークをGitHubで公開。チームがコーディングエージェントを監視する代わりに、タスクを高レベルで管理できる仕組みを提供する。

#AIエージェント#開発ツール#オーケストレーション

記事

2026年3月5日•4 min read

Qwen責任者の林俊旸が退職申請、複数の中核メンバーも離脱——阿里AIの戦略的断層

QwenのOpenSource最前線を担った林俊旸がアリバを退職申請。後任にはGoogleDeepMind出身の周浩が浮上し、阿里AIの戦略転換が急加速している。

#人事#オープンソース#中国AI

記事公式発表

Anthropic•2026年3月4日•4 min read

Claude skill-creator 刷新：evalテスト・並列エージェント・説明文最適化で自作スキルを「動くと確認できる」レベルへ

Claude skill-creator がevalテスト・並列エージェント評価・A/B比較・説明文最適化を追加。コードを書かずにAgent Skillsの品質を定量計測・改善できるようになった。

#Anthropic#Claude#スキル

記事公式発表

Google•2026年3月4日•4 min read

Gemini 3.1 Flash-Lite：$0.25/1Mトークンで2.5Xの速度、Googleの最安コストAIモデル登場

Gemini 3.1 Flash-Lite は入力$0.25/1Mトークンでgemini 3シリーズ最安値、2.5 Flashより2.5倍高速なGoogleのコスト効率特化AIモデル。高ボリューム翻訳・コンテンツモデレーションに最適。

#Google#Gemini#LLM

記事公式発表

OpenAI•2026年3月4日•3 min read

GPT-5.3 Instant：幻覚を26.8%削減、ChatGPTの「素直さ」を取り戻したアップデート

GPT-5.3 Instant は幻覚率を医療・法律・金融で最大26.8%削減し、不要な断りや前置きを大幅に減らした最新のChatGPT標準モデル。ChatGPT全ユーザーが即日利用できる。

#OpenAI#GPT#LLM

記事論文

arXiv•2026年3月3日•4 min read

LLMエージェントにおけるスキルの体系――arXivのSoK論文が7つの設計パターンとセキュリティリスクを整理

arXivにLLMエージェントのスキル概念を体系化したSoK論文が登録。７つの設計パターン、超大規樯な悪意スキル扝入事例、安全ガバナンスの課題を包括的に整理。エージェント設計者必見。

#LLMエージェント#arXiv論文#セキュリティ

リンク検証済み

2026年3月3日•5 min read

Alibaba Cloud AI Coding Plan：Qwen3-Coder-Plusが月額固定でCline・Claude Code対応

Alibaba CloudがAI Coding Planを提供開始。Qwen3-Coder-Plusを月額固定で利用可能（Lite 18,000回/月、Pro 90,000回/月）。Cline・Claude Code・Qwen Codeに対応したコーディングAI定額プラン。

#Qwen#Alibaba Cloud#AIコーディング

記事

2026年3月3日•4 min read

Claude Code向け広告監査ツール「Claude Ads」が公開――186項目を自動チェック、ネガ候補ワードも30秒で処理

Claude Code向けの無料広告監査スキル『Claude Ads』がOSSで公開。Google・Meta等6プラットフォームを186項目で自動チェックし、MCPでAPIに直接アクセスしてネガティブキーワード設定まで30秒で自動化する。

#Claude Code#広告運用#MCP

記事

2026年3月3日•4 min read

Claude Codeで日常業務を爆速化する――経費精算・稼働報告・プレゼン資料まで「半自動化」でいい

Claude Codeをコーディング以外の日常業務に活用する実践ガイド。経費精算・プレゼン資料・メール監視などを「半自動化」で爆速化するコツを、Claude Code日常業務活用の具体事例で解説。

#Claude Code#業務効率化#AI活用実践

記事検証済み

2026年3月3日•3 min read

Claude Codeのコンテキスト汚染を防ぐ――/rewindと/forkを質問セッション後に使う

Claude CodeでPlanモード後に質問を続けるとコンテキストが汚染され性能が落ちる問題を、/rewindと/forkコマンドで解決する実践的Tipsを解説。コンテキスト汚染を防ぐClaude Code活用術。

#Claude Code#コンテキスト#Tipsと活用法

記事公式発表

Anthropic•2026年3月3日•4 min read

ClaudeがAIメモリのインポートに対応——他のAIから乗り換えやすく

AnthropicがClaude有料プラン向けにAIメモリのインポート機能を公開。ChatGPTやGeminiで蓄積したコンテキストを2ステップでClaudeへ移行でき、AIの乗り換えコストを大幅に引き下げる。

#メモリ#Claude#AIスイッチング

リンク公式発表

Google•2026年3月3日•5 min read

Gemini CLI Extensions Marketplace：開発者向け公式拡張カタログが登場

Gemini CLI向けExtensions Marketplaceがgeminicli.comに登場。mcp-neo4j・pickle-rick・sonarqube-mcp-serverなどを中心に全430の拡張を一覧できる開発者向けプラットフォーム。

#Gemini CLI#拡張機能#Developer Tool

リンク検証済み

2026年3月3日•5 min read

Nano Banana：Gemini CLIで画像生成・編集・修復ができる拡張機能がリリース

Gemini CLI向けの画像生成・編集・修復拡張機能『Nano Banana』がGitHub上で公開。テキストプロンプトから画像を生成でき、3モデルに対応。インストールは1コマンドで完了する。

#Gemini CLI#画像生成#拡張機能

記事検証済み

2026年3月3日•4 min read

Qwen3.5シリーズがHuggingFaceに公開――0.8Bから397Bまで8サイズのMoEモデル群

AlibabaのQwen3.5シリーズがHuggingFaceに公開。MoE構造の0.8B～397Bまで8サイズ展開で、フラッグシップQwen3.5-397B-A17BはHuggingFace上で100万以上のダウンロードを記録（2026-03-03確認時点）。FP8量子化版も提供。

#Qwen#オープンソースLLM#MoE