
AnthropicがClaudeの「新たな憲章(Constitution)」を公開
AnthropicはAIモデルClaudeの行動原則・価値観を定義する新たな憲章を公開し、倫理と判断に基づく振る舞いを重視する方向性を示した。
50件の記事

AnthropicはAIモデルClaudeの行動原則・価値観を定義する新たな憲章を公開し、倫理と判断に基づく振る舞いを重視する方向性を示した。

AiMOGA Robotics製AI警備ロボットR001が中国複数都市で展開され、警察業務支援や巡回活動に従事する姿がSNSで話題になっています。

Claude Code(Anthropic)の相棒としてCodex CLI(OpenAI)を使う際、公式推奨されるMCPサーバー経由での接続には「進捗が見えない」「タイムアウトが怖い」という課題がありました。筆者はこれを「Skill(コマンド実行)」として再定義することで、ターミナルでリアルタイムに実行状況を確認できるようにし、開発体験を劇的に改善しました。 

Microsoftが視覚・触覚を統合するロボティクスAIモデルRho-alphaを公開し、自然言語で物理操作タスクを指示可能な物理AI基盤を提示しました。

プロンプト評価ではLLMの時系列情報理解が過小評価される点を示し,内部表現の線形プローブが性能を大幅に改善することを明らかにします.

テスラのヒューマノイドロボットOptimusが生産ラインに加わった一方、現代自動車の工場でBoston DynamicsのAtlas導入が労組問題で進まず、ロボット活用の現実と課題が対照的に報じられています。

xAIのGrokで内部開発向け「Dev Models」設定管理機能の断片情報がリークされ、高度なモデル設定管理機能の存在が示唆された。
Claude Codeをローカルで動かす方法 (100%無料・完全プライベート). Claude CodeをローカルLLM (Qwen 2.5 Coderなど) を使って、完全に自分のマシン上で動作させる方法についてのチュートリアル動画。

「Clawdbot」の衝撃 - マルチプラットフォームで動く"行動する"AIアシスタント. 1. これは何の話? PC(Mac/Windows/Linux)上で常駐し、ユーザーの代わりに「実際の行動」を起こせるパーソナルAIアシスタント 「Clawdbot」 についての紹介です。

Google Labsが「Stitch Agent Skills」を公開 - AIエージェント向けスキル標準. 1. これは何の話? Google Labsが、AIコーディングエージェント向けのスキルライブラリ 「Stitch Agent Skills」 をGitHubで公開しました。

「技術がAIに追い抜かれた日」に見る、AI時代の専門家の生存戦略. 1. これは何の話? LINEヤフー研究所で25年以上「類似画像検索」を研究してきた岩崎氏が、自身の専門領域がAIによって「追い抜かれた」瞬間と、そこから見出した新しい研究者の生き方について語ったインタビュー記事です。

OpenAIが「Codex Agent Loop」の裏側を公開 - Codex CLIと最適化手法. 1. これは何の話? OpenAIが、自律型コーディングエージェント「Codex」の動作原理となる「Codex Agent Loop」についての技術解説を公開しました。

OpenAIはいかにして8億人のChatGPTユーザーを単一のPostgreSQLで支えているか. 1. これは何の話? Arpit Bhayani氏による、OpenAIがChatGPTの8億人規模のユーザーベースを、どのようにして 単一のPostgreSQLプライマリ

Anthropicが公開したClaude Codeのベストプラクティス公式ドキュメントを解説。効果的なCLAUDE.mdの書き方、Skills・サブエージェントの活用、コンテキスト管理、並列実行のスケーリング手法を網羅しています。

ElevenLabsがEleven Musicを使用し、ライザ・ミネリやアート・ガーファンクルなどグラミー受賞アーティストとコラボした「The Eleven Album」をリリース。AIと人間のアーティストが共創する新しい音楽制作の形を提示しています。

言語学習スタートアップPraktikaがOpenAIのGPT-5シリーズを活用し、AIチューターによる会話型言語学習を実現。マルチエージェント構成でDay-1リテンション24%向上、収益倍増を達成した事例をOpenAIが紹介しています。

Alibaba Qwenチームが公開したQwen3-TTSは、自然言語で声質を設計でき、3秒の音声から声をクローン可能。10言語対応、97msの超低レイテンシを実現したオープンソース音声合成モデルです。

敏感な領域(人種、社会、政治)でのLLMの価値一貫性を向上させる敵対的アラインメントフレームワークがarXivで公開されました。継続事前学習、指示ファインチューニング、敵対的学習を組み合わせ、中英バイリンガル評価で既存モデルを上回る結果を示しています。

AnthropicはClaudeモデルに対する包括的な行動規範ドキュメント「Claude's Constitution」を発表しました。57ページにわたり、武器開発支援禁止、重要インフラ攻撃への関与禁止など「ハード制約」を明示し、AIの倫理的振る舞いの根拠を詳細に記述しています。

中国自動車大手Chery Groupが「Chery AI Night 2026」でエンボディドAI技術を活用した「AiMOGA Robotics」の成果を公開しました。交通警察ロボットや医療サービスロボットなど多様な製品ラインナップを展示し、自動車を超える第3の成長曲線として位置付けています。

Anthropicのエージェント型開発ツール「Claude Code」が開発者コミュニティで注目を集めています。ファイルシステム直接アクセスとUnixコマンド実行により、従来のAIコーディングツールを超えた自律的な開発支援を実現し、2026年のAIコーディング採用を加速させています。

LLMエージェントの効率性に焦点を当てたサーベイ論文がarXivで公開されました。メモリ管理、ツール学習、計画メカニズムの3つのコア要素について、レイテンシ・トークン消費・ステップ数などのコスト削減手法を体系的に整理しています。

LLMの隠れ層表現からハルシネーションリスクを検出する軽量プローブ「HALT」がarXivで公開されました。推論と並列実行可能でほぼゼロ遅延、複数ベンチマークで高いAUROC/AURACを達成。エージェンティックAIの信頼性向上に貢献します。

長コンテキストLLM推論でのKVキャッシュを動的に圧縮するフレームワーク「HeteroCache」がarXivで公開されました。訓練不要でアテンションヘッドの時間的・空間的特性を活用し、224Kコンテキストでデコーディングを最大3倍高速化しています。

OpenAIがChatGPTコンシューマープランに年齢予測機能を導入。アカウント作成時期や利用パターンなどの行動シグナルから18歳未満を推定し、グラフィック暴力や危険なチャレンジなど未成年向け不適切コンテンツを自動フィルタリングします。

OpenAIがCodexの開発者向けドキュメントを公開。ブラウザ、CLI、IDE拡張機能で利用可能なコーディングエージェントで、コード生成、レガシーコードの理解、レビュー、デバッグ、開発タスクの自動化を支援します。

OpenAIがビル&メリンダ・ゲイツ財団と提携し、アフリカのプライマリ・ヘルスケア向けAIパイロット「Horizon 1000」を発表。5000万ドルの資金と技術支援で、2028年までに1000のクリニックにAIツールを展開します。

OpenAIが「Stargate Community」計画を発表。2029年までに米国で10GWのAIデータセンター容量を構築し、数千億ドル規模のインフラ投資を行います。地域電力コストへの影響を抑える「自己負担型」エネルギー戦略が特徴です。

学術論文の査読応答(リバタル)作成を支援するマルチエージェントフレームワーク「Paper2Rebuttal(RebuttalAgent)」がarXivで公開されました。複雑なフィードバックを原子的な懸念に分解し、内部・外部エビデンスに基づく透明な応答計画を生成します。

Remotion創設者がClaude Codeを使ったビデオ制作セッションを公開。AIとReactベースのビデオ開発における実践的なコード生成・修正ワークフローを示し、開発者のプログラマティック動画作成効率化の可能性を提示しています。

AIエージェント向けのオープンスキルエコシステム「skills.sh」が登場。npxコマンド一発でスキルをインストールでき、Vercel React Best PracticesやRemotionなど180以上のスキルがリーダーボードで公開されています。

AI音楽制作プラットフォームSuno Studioで、複数曲を組み合わせる「マッシュアップ」機能が実装されました。既存の楽曲素材を融合させて新しい音楽表現を生み出せるようになり、クリエイターの制作幅が広がります。

xAIがX(旧Twitter)の「For You」フィードを動かす推薦アルゴリズムをGitHubで公開。Grok-1ベースのTransformerモデルを使い、手作業の特徴量設計を完全に排除した新アーキテクチャの技術詳細と設計思想を解説します。

自律LLMエージェントを100万トークン規模の実世界シナリオで評価するベンチマーク「AgencyBench」が登場しました。32シナリオ・138タスクを収録し、クローズドソースモデルがオープンソースを大幅に上回る(48.4% vs 32.1%)ことを明らかにしています。

42,447件のAIエージェントSkillsを分析した大規模研究で、26.1%に脆弱性、5.2%に悪意ある挙動を確認。プロンプトインジェクション、データ流出、権限昇格など14パターンの脅威を分類。Skillsエコシステムの安全性確保が急務。

ElevenLabsがKarthik Rajaram氏をインド担当ゼネラルマネージャー兼カントリーヘッドに任命し、AI音声・オーディオ技術のインド市場拡大を本格化。20年以上のテック企業経験を持つ同氏の下、メディア・エンタメ・エンタープライズ向け音声AIビジネスの成長を狙います。

AI音声のElevenLabsと動画生成のLightricksが提携し、音声を入力として映像を自動生成する「Audio-to-Video」機能を発表。1月20日にLTX StudioとElevenLabs Image & Videoで利用開始、27日からAPI提供予定。音声主導の制作ワークフローを実現します。

ElevenLabsが字幕・キャプション制作向けの最新STT(音声認識)モデル「Scribe V2」を発表しました。90以上の言語に対応し、長尺音声の大規模文字起こしをより高精度かつ安定的にスケールできます。

Z.aiがGLM-4.7-Flashを公開。30B-A3BのMoE構成で30Bクラス最強性能を謳い、vLLM・SGLang対応でローカル推論も容易。軽量デプロイと高性能の両立を狙う開発者向けオープンモデル。

最先端LLM 6モデル(GPT-5.2、Gemini 3 Pro、Qwen3-VL、Grok 4.1 Fast、Nano Banana Pro、Seedream 4.5)の安全性を統一プロトコルで評価したレポートがarXivで公開されました。標準ベンチマークでは高得点でも、敵対的テストでは安全率が6%未満に低下することが判明しています。

ManusでAIが生成したモバイルアプリをGoogle PlayやApp Storeに公開する手順を解説。AAB形式でのAndroid公開、TestFlightを使ったiOSテスト配布、外部テスターへの招待リンク作成まで、Manus公式ヘルプに基づく具体的なフローを紹介します。

複数のLLMエージェントを推論時に協調させる強化学習フレームワーク「MATTRL(Multi-Agent Test-Time Reinforcement Learning)」が提案されました。テスト時に専門知識を動的に統合し、医学・数学・教育分野のベンチマークで平均3.67%の精度向上を達成しています。

OpenAIとServiceNowが複数年のパートナーシップ契約を締結しました。GPT-5.2をServiceNowプラットフォームに統合し、年間800億以上のワークフローにフロンティアAI機能を提供します。IT、財務、営業、人事などの業務で「理解→判断→実行」を自動化する構想です。

歩道配送ロボットのServe RoboticsがDiligent Roboticsを買収し、物理AIプラットフォームを屋内・医療分野へ拡大します。DiligentのMoxiロボットは全米25以上の病院で125万回以上の自律配送を完了しており、年間20〜40万ドルの売上が見込まれます。

Claude CodeやCodex向けスキル(Skills)マーケットプレイスのセキュリティリスクを解説。野良Skills約26%に脆弱性、5%に悪意ある挙動という研究結果を踏まえ、npmやPyPIとの成熟度比較、Anthropic公式の警告を紹介します。

AnthropicがClaude利用状況を分析したAI経済指標レポート第4回を発表。日本のAUI(AI活用指数)は1.59で、翻訳用途が世界平均の2.5倍。AIは過去100年の主要技術の10倍速で米国に普及、拡張型利用が51.7%。

OpenAIが月額8ドルの新プラン「ChatGPT Go」を世界171カ国に展開。無料版の10倍のメッセージ上限、画像生成、GPT-5.2 Instant無制限利用が可能。無料版・Go版では広告導入も開始予定。

Google DeepMindのデミス・ハサビスCEOがCNBCで、中国のAI開発は米国より「数カ月遅れ」と発言。従来の1〜2年差という予測から大幅に縮小。ただし真の技術革新能力には疑問も呈示。

ElevenLabs JapanがSORABITOと戦略的パートナーシップを締結し、建設・レンタル・物流・製造業界向けの対話型AIエージェント開発を加速します。両社は「産業特化対話AIラボ」を共同発足し、電話起点業務の次世代運用基盤実現を目指します。

OpenAIが自社のビジネスモデルを「知能の価値とともにスケールするビジネス」と定義。サブスク、API、広告、コマース、コンピュート提供の5本柱。2025年末で評価額5000億ドル、収益200億ドル超、しかし依然赤字で2029年黒字化を目指す。