
AI投資がデータセンター契約を記録的高水準に押し上げ
2025年のAI活用拡大に伴い、データセンター関連の契約・取引額が過去最高の約610億ドルに達したとのレポートが発表されました。AI学習や推論に必要な計算能力への需要が急増し、データセンターインフラへの投資が世界規模で加速しています。 AIインフラ投資の動向に関心を持つ企業経営者、不動産・インフラ投資家、エネルギー事業者にとって、この市場動向は重要な指標となります。
94件の記事

2025年のAI活用拡大に伴い、データセンター関連の契約・取引額が過去最高の約610億ドルに達したとのレポートが発表されました。AI学習や推論に必要な計算能力への需要が急増し、データセンターインフラへの投資が世界規模で加速しています。 AIインフラ投資の動向に関心を持つ企業経営者、不動産・インフラ投資家、エネルギー事業者にとって、この市場動向は重要な指標となります。

中国の電池メーカー大手CATLが、自社工場内でヒューマノイドロボットを本格的に展開していることが報じられました。ヒューマノイドロボットを製造現場で大規模に運用する先駆的な事例として、世界的に注目を集めています。 製造業の自動化、ヒューマノイドロボットの実用化に関心を持つ製造業経営者、ロボット技術者、産業アナリストにとって、重要な参照事例となります。

AnthropicがClaude Skill作成のベストプラクティスを公式ドキュメントで公開。トークン効率を最大化しつつ、タスクの複雑さに応じた自由度設定、ワークフロー設計のコツを解説しています。

Cornell大学の研究チームが、大規模言語モデル(LLM)の利用が学術論文の執筆に与える影響を分析した研究結果を発表しました。LLMの活用により論文の執筆数は増加傾向にある一方、論文の品質にばらつきが生じる懸念も指摘されています。 学術研究に携わる研究者、大学の研究支援部門、学術出版に関わる編集者にとって、AIと研究活動の関係を考える上で示唆に富む内容となっています。

DeepLearning.ai The Batch Issue 332の注目記事。GPT-5.2がGemini 3に対抗するベンチマーク結果と、わずか32例でLLMをマルチモーダル化する「SEMI」技術を解説。

米国エネルギー省(DOE)が、OpenAI、Google DeepMindをはじめとする主要AI企業との間で協力協定を締結し、「Genesis Mission」と名付けた取り組みを発表しました。AI技術を科学研究と発見に活用することを目的とした官民連携プロジェクトです。 エネルギー、気候変動、材料科学など科学技術分野でのAI活用に関心を持つ研究者や企業にとって、今後の研究開発の方向性を示す重要な動きとなります。

GoogleがGemini 3を活用したエージェント構築の実践例を公開。ADK、Agno、Browser Use、Eigent、Letta、mem0の6フレームワークとの連携サンプルを解説。すぐにクローンして動かせるリポジトリ付き。

米国保健福祉省(HHS)が、AIを活用して医療コストの削減や臨床ケアの改善を図るための意見募集(RFI: Request for Information)を公開しました。医療現場でのAI導入を促進するための政策立案に向けて、幅広いステークホルダーからのフィードバックを求めています。 米国の医療AI市場に関心を持つ企業、医療機関でのAI導入を担当する方、ヘルスケアテック領域で事業を展開する企業にとって、今後の規制動向を占う重要な動きです。

カリフォルニア州マウンテンビューで、ヒューマノイドロボットに特化した国際カンファレンス「ヒューマノイド・サミット」が開催されました。このイベントでは、ヒューマノイドロボット産業が研究段階から商用展開段階に移行したとの発表があり、業界の転換点として注目を集めています。 ロボット産業への投資を検討している投資家、ヒューマノイドロボットの導入を検討する企業、ロボット研究者にとって、市場の現状と将来性を把握する重要な機会となりました。

鎌倉市の鎌倉高校前駅周辺で、AIカメラを使った観光客混雑対策の実証実験が始まりました。映像AI解析技術を活用してオーバーツーリズム(過剰観光)による地域課題の緩和を試みる社会実験です。 地方自治体の観光政策担当者、スマートシティ関連事業者、AI技術の社会実装に関心を持つ方にとって、参照事例となる取り組みです。

Metaが「Mango」「Avocado」というコードネームで呼ばれる次世代AIモデルの開発を進行しており、OpenAIやGoogleに対抗するAI競争への再参入を目指しているとの報道がありました。Llamaシリーズに続く新たなモデルファミリーとして注目されています。 最先端AI技術の動向に関心を持つ開発者、AI研究者、テクノロジー業界アナリストにとって、Metaの戦略転換を示す重要なニュースです。

NTTデータ先端技術、NTT・TCリース、Nutanixの3社が共同で、企業向けに生成AIの体験・検証が可能なサブスクリプションサービス「INTELLILINK Private AIスタートパック」を提供開始すると発表しました。自社のプライベート環境内で生成AIを試用・評価できるサービスです。 生成AIの導入を検討しているものの、クラウドサービスへのデータ送信に懸念がある企業のIT部門やセキュリティ担当者にとって、オンプレミス環境でAI

Alibabaが画像を複数のRGBAレイヤーに自動分解するAIモデル「Qwen Image Layered」を発表。プロ向けデザインツールのような編集可能性をAIで実現。Apache 2.0ライセンスでオープンソース公開。

ロボット研究において、実機を使って1日で1,000種類以上の物理タスクを学習させることに成功したという研究成果が報じられました。単一のデモンストレーションから効率的に学習する新しいフレームワークを適用した結果です。 汎用ロボットや家庭用アシスタントロボットの開発に関心を持つ研究者、ロボット関連スタートアップ、製造業のエンジニアにとって、技術的なブレークスルーとして注目すべきニュースです。

OpenAI CEOのSam Altman氏がBig Technology Podcastに出演。Gemini 3への対抗策、年間3倍の計算能力増強計画、2026年IPOの可能性、1兆ドル規模のAIインフラ投資戦略について語った内容を解説します。

360ChannelがGoogle AIプロジェクト『Music Video with Gemini』に参画し、藤井隆の名曲3曲のMV制作で動画生成AI「Veo」を活用。オリジナルCFの世界観をAIで拡張するプロンプトエンジニアリングを担当。

AIセーフティ研究者や開発者向けに、OpenAI が Chain of Thought(CoT)監視可能性に関する包括的な評価フレームワークを発表しました。CoT監視可能性とは、AIモデルのステップバイステップの推論プロセスを観察・解釈し、不正行為や意図を検出できる能力を指します。2025年12月に公開されたこの研究は、13の評価・24の多様な環境で構成され、AIの安全性向上に向けた重要な取り組みとして注目されています。 - 不正検出効

エッジAI開発者やオンデバイスAIに関心のある読者向けに、Google が FunctionGemma を発表しました。これはGemma 3 270M をベースに関数呼び出し(Function Calling)向けにファインチューニングしたモデルで、自然言語のコマンドをAPIアクションに変換するエッジエージェント構築を可能にします。2025年の Gemma ファミリーは1億から3億以上のダウンロードに成長しており、開発者からの要望No.

科学研究やAI政策に関心のある読者向けに、Anthropic が米エネルギー省(DOE)と複数年パートナーシップを締結したことが発表されました。これはDOEが主導するGenesis Mission(AI活用でアメリカの科学リーダーシップを強化するイニシアチブ)の一環で、Anthropicはエネルギー優位性・生命科学・科学生産性の3分野でClaudeを提供します。ホワイトハウスでのGenesis Mission発表イベントにAnthrop

開発者・ソフトウェアエンジニア向けに、OpenAI が GPT-5.2 Codex をリリースしました。2025年12月18日に公開されたこのモデルは、GPT-5.2 をコーディングタスク向けに最適化したバージョンで、大規模なリファクタリングや技術的マイグレーションといった高度なソフトウェアエンジニアリングタスクに対応します。有料ChatGPTユーザー向けにすべてのCodexプラットフォームで利用可能になりました。 - コンテキスト圧縮

ロボット基盤モデル(VLA)を活用した汎用ロボットワーカーを開発するMuso Actionがシードラウンドで1億円を調達。East VenturesやGMO AI&ロボティクス商事から出資を受け、製造・物流現場での実証実験を加速。

動画生成AI「NoLang」が全18言語への多言語対応を開始。日本語のプレゼン資料からAIアバターとクローンボイスで多言語営業動画を即座に生成可能に。登録者15万人を超えるサービスが日本企業の海外展開を支援。

Primech Holdings(Nasdaq: PMEC)がCES 2026で自律型トイレ清掃ロボットHytronを北米初披露。幅400mmの小型設計でトイレ個室に進入可能、NVIDIA Jetson Orin Super搭載で99%以上の除菌性能を実現。

LLM研究者やエッジAI開発者向けに、Google が T5Gemma 2 を発表しました。これは Gemma 3 をベースにしたエンコーダー・デコーダー型のモデルファミリーで、初のマルチモーダル対応とロングコンテキスト対応を実現したエンコーダー・デコーダーモデルです。270M-270M(約370Mパラメータ)から4B-4B(約7Bパラメータ)までの3サイズが公開されています。 - アーキテクチャ革新 ─ エンコーダーとデコーダーで埋め

韓国のロボティクスソフトウェア企業TeamGRITが日本で合弁事業Remote Robotics(R2)を展開。超低遅延通信(0.2秒未満)と統合型ロボット運用プラットフォームで、災害対応や製造現場での実用的自律性を実現へ。

TopMediaiがAI動画エフェクト機能にクリスマス演出を追加し、ワンクリックで季節感ある短尺動画を生成可能に。美容プロモーション、コスチュームショー、ダンスなどのテンプレートを提供。

AIエージェント開発者やGitHub Copilotユーザー向けに、VS CodeでAgent Skillsのサポートがプレビュー公開されました。Agent Skillsは、AIエージェントに専門的な能力や知識を動的にロードできる仕組みで、オープン規格としてagentskills.ioで仕様が公開されています。従来のカスタム指示(Custom Instructions)がコーディングガイドライン中心だったのに対し、スキルはスクリプト・サ

Alibaba Cloudが次世代視覚基盤モデル「Wan 2.6」を発表。10秒の長尺Text-to-Video/Image-to-Video、音声同期(Audio Generation)、強化されたプロンプト追従性を搭載し、シネマグレードの映像生成を目指す。

AmazonがAI組織を大幅再編。27年ベテランのPeter DeSantisがNovaモデル・Graviton/Trainiumチップ・量子コンピューティングを統合した新組織を率い、Pieter Abbeelがフロンティアモデルチームを統括。

朝日新聞社の「AI短歌プロジェクト」がAI Creative Future Awards(AICA)賞を受賞。100年以上の歴史を持つ「朝日歌壇」と生成AIを融合し、短歌生成AIの開発と歌人との対話を通じて文化的価値を追求する取り組みが評価。

ElevenLabsは、これまでの音声合成・音声クローン技術に加え、画像および動画生成機能をStudioに統合しました。テキスト、画像、またはフレームから動画を生成し、ElevenLabsの音声技術と組み合わせることで、コンテンツ制作の全工程を一つのプラットフォームで完結できるようになりました。[1] - 対応モデル(動画生成): Google Veo 3、OpenAI Sora 2 Pro、Kling、Seedance、Wan。[1]

EQTと1X Technologiesが戦略提携を発表。2026〜2030年に最大1万台のNEOヒューマノイドロボットをEQTポートフォリオ企業に提供する覚書を締結。物流・倉庫・製造・ヘルスケア分野での活用を想定。

GoogleがGemini 3 Flashを発表し、AI検索モードとGeminiアプリのデフォルトモデルに採用。入力100万トークンあたり0.50ドルという価格設定で競合を圧倒しつつ、GPQA Diamond 90.4%など高性能を維持する戦略を解説。

Googleがインド政府設立のAIセンター・オブ・エクセレンス4カ所に800万ドルを支援すると発表。ヘルスケア、都市ガバナンス、教育、農業分野でのAI活用を推進し、現地AIエコシステムの成長を後押し。

LLMエージェントのメモリ機構「Hindsight」は保持・想起・反映の3操作で会話ストリームを構造化されたメモリバンクに変換。20Bオープンソースモデルで91.4%、GPT-4oを超える精度を達成。

Metaが提供するスマートフォン向け動画編集アプリ「Edits」に、2025年12月17日付けで大型アップデートが行われました。AIを活用した新しいビデオエフェクトや、InstagramのReelsとの連携機能が追加されています。[1] - AIエフェクト: SAM 3(Segment Anything Model 3)を活用し、動画内の人物やオブジェクトを自動検出。Scribble、Outline、Glitterなどのエフェクトを適用

MicrosoftのAI責任者Mustafa Suleymanが「制御から逃れるリスクがあるAIシステムからは撤退する」と表明。安全性を最優先する「ヒューマニスト・スーパーインテリジェンス」のビジョンを語り、医療AIやユニバーサルベーシックインカムにも言及。

Mistral AIが企業向けOCR 3をローンチ。フォーム・スキャン文書・複雑な表・手書き文字で競合製品に対し74%の勝率を主張し、1,000ページあたり2ドルで提供。生成AI活用の前段階となる文書デジタル化を強化。

MITが自然言語指示で椅子を組み立てるAIロボットシステムを発表。生成AIモデルで3D設計、別のAIでパーツ配置を推論、ロボットが自動組み立て。ユーザー評価で90%以上が従来手法より高評価。

NTTドコモビジネスが生成AIエージェントを使った「発話ベースルーティング」を三菱UFJ銀行に提供開始。顧客の発話内容をAIがリアルタイム解析し、最適なオペレーターへ自動接続することで満足度向上と業務効率化を実現。

NVIDIAのRev LebaredianがOmniverseプラットフォームを「認知幼稚園」と表現。ロボットが物理法則を学ぶシミュレーション環境で数千年分の経験を短期間で蓄積し、現実世界で動作できる「物理知能」の実現を目指す。

米国最高裁(SCOTUS)判決文分類におけるLLMの記憶戦略を評価した論文。プロンプト+メモリ付きモデルが従来のBERT系手法を約2ポイント上回る精度を達成し、法律文書分類へのLLM活用可能性を示す。
業界団体SEMIが半導体製造装置の販売予測を発表。AI向けロジックチップ・メモリーチップの生産能力拡大を背景に、2026年は約9%増の1,260億ドル、2027年は7.3%増の1,350億ドルを見込む。

マルチモーダルLLMを動画データなしで時間認識型埋め込みモデルに変換する手法「TARA」。時間的に反対の動作を識別するベンチマークを提案し、否定表現・動詞・副詞理解でもSoTAを達成。

xAIは、音声で話しかけると音声で返す「Grok Voice Agent API」を開発者向けに公開しました。[1] ツール呼び出しやリアルタイム検索を組み合わせ、音声エージェントを作るための基盤を提供します。[1] - 速さ:xAIは「平均TTFA(Time To First Audio)が1秒未満」と記載し、「最も近い競合より約5倍速」とも述べています。[1] - 成績:xAIは「Big Bench Audioで#1、スコア95%」

自動車部品大手AptivとAMR専業Vecna Roboticsが戦略的パートナーシップを締結し、次世代自律搬送ロボット(AMR)を共同開発すると発表しました。Aptivの360度知覚PULSEセンサーとVecnaのオーケストレーション基盤を統合し、より安全で効率的な倉庫・工場自動化を目指します。

CATLがビジョン言語アクション(VLA)モデル搭載のヒューマノイドロボット「Xiao Mo」を電池パック製造ラインへ大規模導入し、新エネルギー電池生産における世界初のヒューマノイド本格稼働を実現しました。高電圧端子接続の危険作業を自動化し、接続成功率99%超・作業量3倍を達成しています。

一般社団法人AIロボット協会(AIRoA)がNEDO委託事業として「国産汎用ロボット開発コンペティション」のプレエントリー受付を開始しました。双腕モバイルマニピュレーターの試作・量産を通じて日本のロボット産業競争力強化を目指し、納入機会・開発支援・販路開拓支援などの参加メリットを用意しています。

JoyPix.AIが静止画から高品質な対話動画を生成できる新機能「Motion-2-Dialog」を正式リリースしました。2人の会話シーンを自然に表現するため、感情やテンポを細かく調整可能で、マーケティング・教育・エンタメなど幅広い用途への活用が期待されています。

Luma AIがAIと人間のハイブリッド編集ワークフロー向けの新モデル「Ray3 Modify」を発表し、Dream Machineで提供開始しました。既存映像の動き・タイミング・感情を保持しながらシーンを修正でき、セットを再構築せずにAIで撮り直しが可能になります。

シンガポールのQuikBot Technologiesが自律配送ロボット「QuikFox」「QuikCat」を都市部のビジネス地区で稼働させ、ラストワンマイル配送の自動化を進めています。FedExとの提携により商用展開を拡大し、30%高速・20%低排出の配送効率を掲げています。

OpenAIアプリケーションCEOのFidji Simo氏がApple MusicのChatGPT統合を発表。「パーティ用のプレイリストを作って」といった自然言語で即座にプレイリスト生成が可能になります。Spotify連携に続く音楽サービス連携で、Adobe、Airtable、Salesforceなど多数のアプリ統合も予告されました。

OpenAIが2026年第1四半期にChatGPTへ「アダルトモード」を導入する計画を発表。成人ユーザーに対してコンテンツ制限を緩和し、より自由な会話を可能にする方針です。年齢認証にはAI行動分析や政府ID確認を組み合わせ、未成年のアクセス防止を図ります。プライバシーやAIとの親密性に関する懸念も浮上しています。

OpenAIがChatGPTの自動モデル選択機能「モデルルーター」を無料・Goティアで撤回。ユーザーの待ち時間への不満とDAU低下を受け、GPT-5.2 Instantをデフォルトに戻す判断。Google Geminiとの競争激化の中での戦略転換。

Googleは検索のAI Modeを更新し、既定モデルとして「Gemini 3 Flash」を導入しました。これにより、AI Modeの応答がより速くなり、複雑な質問にも対話形式で対応しやすくなります。[1][2] Gemini 3 FlashはAI Modeの既定モデルとして提供され、検索体験のテンポが上がります。[1][2] また米国では、より深い支援向けに「Thinking with Gemini 3 Pro」の利用範囲が広がりま

Google Labsが開発するAIミニアプリ作成ツール「Opal」がGeminiウェブアプリに直接統合されました。Gemsマネージャーから実験的なGemsとしてミニアプリを作成でき、プロンプトをステップリストで可視化する新機能も追加。高度なカスタマイズにはopal.googleのAdvanced Editorを利用可能です。

OpenAIがChatGPTの画像生成機能を大幅刷新。新モデル「GPT Image 1.5」は生成速度4倍、プロンプト理解力向上、細部まで維持する編集精度を実現。専用Imagesワークスペースも新設され、テンプレートやトレンドプロンプトで直感的な画像作成が可能に。API利用コストは20%削減。

Metaが音声セグメンテーションモデル「SAM Audio」を発表し、オープンソース公開しました。複雑な音声ミックスから「犬の鳴き声」「歌声」などをテキスト指定で分離したり、映像中の人物をクリックしてその音声だけを抽出したりできます。業界初の時間スパン指定機能も搭載し、Segment Anything Playgroundで試用可能です。

OpenAIは、ChatGPT内で動くサードパーティ製アプリ(Apps)の申請受付を開始しました。承認されると、ChatGPTのUIからアプリを呼び出し、外部サービス連携を含む"アクション"体験を提供できます。[1] Apps SDK(ベータ)が提供され、開発者はアプリを実装して申請できます。[1] 申請には、MCP接続(外部ツール/データ連携)などの情報提出が含まれます。[1] App DirectoryはChatGPT内で提供され、

OpenAIがAIの科学推論能力を評価する新ベンチマーク「FrontierScience」を発表。PhD専門家が作成した700問超の難問で、GPT-5.2はオリンピアード形式で77.1%を達成したものの、オープンエンドな研究タスクでは25.3%に留まり、複雑な科学的問題解決に課題が残ることが判明。

Alibaba Qwenチームがコーディング支援ツール「Qwen-Code」のv0.5.0をリリースしました。ロシア語サポート追加、終了時のセッション再開コマンド表示、ターミナルベル設定、VSCode IDEコンパニオンの改良など、開発者体験向上に焦点を当てたアップデートです。

Speech-to-Speech(音声をテキスト化せず、音声で入れて音声で返す)モデルを、Artificial Analysisの比較ページで俯瞰する記事です。 同じ「音声AI」でも、推論が強いモデルと、レイテンシが強いモデルは分かれます。 Speech ReasoningはBig Bench Audioなどの指標で比較され、Gemini 2.5 Native Audio Thinkingが高スコアとして紹介された例があります。 またx

日本の産業ガス最大手・大陽日酸がTechtouch AI Hubを導入し、業務システム上にAIレイヤーを構築。画面遷移なしで生成AIを活用できる仕組みを全社展開へ。問い合わせ対応工数削減と生産性向上を目指す。

XiaomiがMixture-of-Experts構造を採用した大規模言語モデル「MiMo-V2-Flash」をオープンソース公開しました。総パラメータ309B(推論時アクティブ15B)で150トークン/秒の高速推論を実現。SWE-Bench Verifiedでオープンソース最高の73.4%を記録し、GPT-5クラスの性能に匹敵する場面も。

Adobe Fireflyがブラウザベースの動画エディタβ版を公開し、AI生成動画のタイムライン編集、プロンプトベースの部分編集、4Kアップスケールなどの機能を追加しました。

米AmazonがOpenAIへの投資について協議していると報道されました。これが実現すればOpenAIの企業価値は5000億ドル超と評価される可能性があり、AI市場の勢力図を左右する重大な動きとして注視されています。

Adobe FireflyがAI動画生成機能を大幅にアップデートし、生成後の動画を自然言語プロンプトで編集できる「Prompt to Edit」機能や、カメラモーション制御、Firefly Video Editorベータなどを発表。[1] 「Prompt to Edit」機能により、AI生成動画に対して「左側の人物を削除」「背景をスタジオに変更」「ゴールデンアワーの照明に」といった自然言語指示で編集が可能になった。再生成せずに部分的な調

中国科学技術大学の精密・スマート化学全国重点実験室において、AIと大規模言語モデルを搭載したロボット「スマート科学者」110台が自律的に科学実験を遂行している。[1] 「スマート科学者」は、試薬の配置、サンプルの合成、性能特性評価といった一連の操作を正確に行い、実験データをリアルタイムでスマートオペレーティングシステムに送信する。24時間実験が可能で、論文を読み、プランを考え、経験から学ぶこともできる。第一世代「小来」は1日2000回の

ブラックボックスLLMの各入力トークンが出力にどれだけ影響するかを可視化する「Distribution-Based Sensitivity Analysis(DBSA)」手法を提案する研究論文。[1] DBSAは、LLMの出力分布の変化を統計的に分析することで、各入力トークンの重要度を推定する。従来の勾配ベース手法と異なり、モデル内部へのアクセスを必要とせず、APIエンドポイント経由でも適用可能。LLMが確率的関数であるという特性を活か

ElevenLabsの初サミットで俳優マシュー・マコノヒー(アカデミー賞受賞)が登場し、同社に数年間投資していたことを明かしました。自身のニュースレター「Lyrics of Livin'」をスペイン語AI音声版として展開すると発表。本人の声を維持したまま多言語でストーリーを届ける事例として、クリエイターエコノミーにおけるAI音声技術の活用可能性を示しています。

自然言語のテキスト記述からBPMN(Business Process Model and Notation)プロセス図を自動生成するための「InstruBPM」手法を提案する研究論文。[1] InstruBPMは、ペア化されたテキスト-ダイアグラムデータを準備し、パラメータ効率の良いファインチューニング(PEFT)と量子化を用いてオープンソースLLMを指示チューニングする。評価では、BLEU、ROUGE-L、METEORなどのテキスト類

AI汎用エージェント「Manus」がバージョン1.6をリリースしました。新しいフラッグシップモデル「Manus 1.6 Max」を投入し、モバイルアプリのエンドツーエンド開発に対応。画像作成用のインタラクティブなDesign Viewも搭載され、ビジュアル編集体験が大幅に向上しています。

マルチエージェントシステムにおける「協調的レジリエンス」(集団の幸福に影響する破壊的イベントを予測・抵抗・回復・変容する能力)を、人間グループとLLMベースエージェントで比較評価する研究論文。[1] Melting Potスイートの「コモンズの悲劇」環境で、明示的コミュニケーションの有無を変えて評価。持続的な非持続可能消費ボットと間欠的な環境ショック(共有リソースの確率的除去)という破壊的条件下で協調的レジリエンスを測定。コミュニケーシ

AI画像・動画生成企業Runwayが、物理法則を理解する世界モデル「GWM-1」を公開。Google DeepMindのGenie-3などと競合する分野に参入。[1] GWM-1はフレームごとの予測を通じて動作し、物理法則と時間経過に伴う世界の振る舞いを理解したシミュレーションを生成する。Runwayは「世界モデルを構築するには、まず本当に優れた動画モデルを構築する必要があった」とし、ピクセル予測が汎用シミュレーションへの正しいアプロー

ServiceNowがAIエージェントプラットフォームMoveworksの買収を2025年12月15日に完了したことを発表。買収額は28.5億ドル(現金と株式の組み合わせ)。[1] この買収により、ServiceNowのエージェントAIとインテリジェントワークフロー機能が、Moveworksのエンタープライズ検索と推論技術と統合される。従業員が質問、情報検索、タスク完了を会話型インターフェースで自然に行える「AI-native fron

LLMエージェントが新規タスクに適応する際の課題(ツール不足と経験再利用の困難)を解決するため、動的ツール生成とタスク間経験共有を統合した「SMITH(Shared Memory Integrated Tool Hub)」認知アーキテクチャを提案する研究論文。[1] SMITHはエージェントのメモリを手続き的・意味的・エピソード的の3つのコンポーネントに階層化。ツール生成はサンドボックス環境での反復的コード生成として形式化し、経験共有は

マルチモーダル生成AIのリーダー企業ShengShu Technologyが、ワンクリックでプロ品質の動画を生成する「Vidu Agent」を発表。[1] Vidu Agentは、クリエイティブ企画、ショット構成、自動編集を単一ワークフローに統合。1〜7枚の画像と短い説明を入力するだけで、15〜30秒の完成動画を約3分で生成。スクリプト生成は約1分で完了。2つ・3つのビュー参照を認識し、製品の特徴や被写体のアイデンティティを動画全体で一

スタートアップ「find」がAI画像認識を活用した落とし物検索サービスを開始。京浜急行・羽田空港など6社で横断検索が可能になり、2026年4月にはJR東日本も参加予定。

ElevenLabsやHume AIの音声クローン技術でAIポッドキャストが急増。Inception Point AIは20万エピソードを制作し、1話1ドルで40万購読者を獲得。一方、信頼性や透明性への懸念も議論されている。

Phaser StudioのBeamがGoogleのVeo 3.1を活用した「playable video」プラットフォームを発表。生成AI動画をノーコードでミニゲームや分岐ストーリーに変換し、ブラウザ上で公開可能に。

Stable Diffusion開発者が創業したドイツのBlack Forest LabsがシリーズBで3億ドルを調達。評価額32.5億ドルとなり、画像生成AI「Flux」シリーズでGoogleに対抗する構え。

Dify v1.11.1で画像ベクトル化とクロスモーダル検索に対応したマルチモーダルナレッジベースが正式公開。テキストから画像、画像からテキスト、画像から画像の検索が可能に。RAGの活用範囲が拡大。

神奈川県が自動配送ロボット「Hakobot」を使った工場間公道実証実験を発表。最大100kg搬送可能な四輪駆動設計で、2026年1月から横浜市金沢区で実施。従業員の業務効率化と安全性向上を検証。

Higgsfieldが「Nano Banana Pro Inpaint」など新機能を発表。構造を保持しながら高精度な画像編集を実現するAIエンジンで、シームレスな合成とゼロ歪みを特長とする。

川崎重工が2025国際ロボット展でヒューマノイドロボット「Kaleido 9」を初公開しました。2015年開発開始から第9世代となり、シミュレーション上で数千体を同時に動作させるAI強化学習を採用。3D環境認識、多言語対話にも対応し、工場でのロボット指揮、家庭での庭掃除、災害現場での救助活動を実演しました。

Liberawareと九電ドローンサービスが那覇市上下水道局の協力で、沖縄県初となるドローン「IBIS2」による雨水管内部のデモ飛行を実施しました。外形194mm×198mm・重量243gの世界最小級ドローンで、人が立ち入れない狭小空間の点検を実証。3次元データ計測システム「SEAMS」と連携し、地上・地下一体の3Dモデル作成にも成功しました。

MetaがElevenLabsと連携し、InstagramやHorizonにAI音声機能を統合。Reelsの多言語吹替、音楽生成、VRキャラクターボイスなどを強化。70言語以上・1.1万種類の音声ライブラリを活用。

n8n 2.1.0ベータでChat Hub機能が公開。単一のチャットインターフェースからワークフロー実行、独自エージェント呼び出し、複数AIモデル利用をまとめて操作可能に。チャット専用ロールで利用者管理も実現。

NVIDIAがオープンモデル「Nemotron 3」ファミリーを発表しました。Nano・Super・Ultraの3サイズで提供され、Nemotron 3 NanoはHugging Face、Baseten、Fireworks、Together AIなど複数の推論サービスから即日利用可能。SuperとUltraは2026年前半に公開予定です。

OpenAIが元Googleシニアディレクターのアルバート・リー氏をコーポレート開発担当VPに採用しました。約14年間GoogleでクラウドやデepMind部門のM&A・戦略投資を主導し、60件以上・500億ドル超の取引実績を持つ人物です。CFOのサラ・フライアー直属で、OpenAIの買収・投資戦略を統括します。

北海道札幌市で米国製除雪ロボット「Yarbo」の実証試験が始まりました。株式会社QYURUと開北工業が共同で実施し、積雪環境下での走行性能・投雪能力・運用性を評価します。Yarboは米国で1万台以上の納入実績を持ち、2025年12月から国内販売を開始。深刻化する除雪人手不足の解決策として注目されています。

SCSKが法人向け画像生成サービス「MIM for Business」を2025年12月より提供開始しました。1枚の商品画像からAIモデルによる着用イメージを自動生成でき、身長・体重・年齢・人種・性別・ポーズ・背景を自由に設定可能。従来のモデル撮影では対応困難だった少量生産品や小物の着用画像を安価かつ即日で生成できます。

中国・深圳市が世界初となる「ロボットフレンドリー」デモゾーンの構築計画を発表。広東省は2024年にロボット産業で全国トップの生産シェアを維持し、2025年末には約1万台のヒューマノイドロボット導入を見込む。

トランプ大統領が州ごとのAI規制を禁止し連邦レベルで統一する大統領令に署名。コロラド州のAI法を名指しで批判し、同州は法廷闘争も視野に入れている。