
AI投資がデータセンター契約を記録的高水準に押し上げ
AI投資がデータセンター契約を記録的高水準に押し上げ. 1. これは何の話? 2025年のAI活用拡大に伴い、データセンター関連の契約・取引額が過去最高の約610億ドルに達したとのレポートが発表されました。AI学習や推論に必要な計算能力への需要が急増し、データセンターインフラへの投資が世界規模で加速しています。
97件の記事

AI投資がデータセンター契約を記録的高水準に押し上げ. 1. これは何の話? 2025年のAI活用拡大に伴い、データセンター関連の契約・取引額が過去最高の約610億ドルに達したとのレポートが発表されました。AI学習や推論に必要な計算能力への需要が急増し、データセンターインフラへの投資が世界規模で加速しています。

中国CATLが工場でヒューマノイドロボットを大規模展開. 1. これは何の話? 中国の電池メーカー大手CATLが、自社工場内でヒューマノイドロボットを本格的に展開していることが報じられました。ヒューマノイドロボットを製造現場で大規模に運用する先駆的な事例として、世界的に注目を集めています。

AnthropicがClaude Skill作成のベストプラクティスを公式ドキュメントで公開。トークン効率を最大化しつつ、タスクの複雑さに応じた自由度設定、ワークフロー設計のコツを解説しています。

Cornell大学研究:AI使用で論文数は増加も質への懸念. 1. これは何の話? Cornell大学の研究チームが、大規模言語モデル(LLM)の利用が学術論文の執筆に与える影響を分析した研究結果を発表しました。LLMの活用により論文の執筆数は増加傾向にある一方、論文の品質にばらつきが生じる懸念も指摘されています。

DeepLearning.ai The Batch Issue 332の注目記事。GPT-5.2がGemini 3に対抗するベンチマーク結果と、わずか32例でLLMをマルチモーダル化する「SEMI」技術を解説。

DOEがAI産業協力協定を発表、主要AI企業と科学発見の推進で連携. 1. これは何の話? 米国エネルギー省(DOE)が、OpenAI、Google DeepMindをはじめとする主要AI企業との間で協力協定を締結し、「Genesis Mission」と名付けた取り組みを発表しました。

GoogleがGemini 3を活用したエージェント構築の実践例を公開。ADK、Agno、Browser Use、Eigent、Letta、mem0の6フレームワークとの連携サンプルを解説。すぐにクローンして動かせるリポジトリ付き。

米HHSがAI活用の公衆意見募集を発表. 1. これは何の話? 米国保健福祉省(HHS)が、AIを活用して医療コストの削減や臨床ケアの改善を図るための意見募集(RFI: Request for Information)を公開しました。

ヒューマノイド・サミットが米カリフォルニアで開催、商業化段階へ. 1. これは何の話? カリフォルニア州マウンテンビューで、ヒューマノイドロボットに特化した国際カンファレンス「ヒューマノイド・サミット」が開催されました。

AI搭載カメラで観光地のオーバーツーリズム対策実証実験開始. 1. これは何の話? 鎌倉市の鎌倉高校前駅周辺で、AIカメラを使った観光客混雑対策の実証実験が始まりました。映像AI解析技術を活用してオーバーツーリズム(過剰観光)による地域課題の緩和を試みる社会実験です。

MetaがMango/Avocadoモデル計画でAI競争再参入へ. 1. これは何の話? Metaが「Mango」「Avocado」というコードネームで呼ばれる次世代AIモデルの開発を進行しており、OpenAIやGoogleに対抗するAI競争への再参入を目指しているとの報道がありました。

NTTデータ先端技術など、生成AI体験・検証サービスを提供開始. 1. これは何の話? NTTデータ先端技術、NTT・TCリース、Nutanixの3社が共同で、企業向けに生成AIの体験・検証が可能なサブスクリプションサービス「INTELLILINK Private AIスタートパック」を提供開始すると発表しました。

Alibabaが画像を複数のRGBAレイヤーに自動分解するAIモデル「Qwen Image Layered」を発表。プロ向けデザインツールのような編集可能性をAIで実現。Apache 2.0ライセンスでオープンソース公開。

ロボットが1,000以上の物理タスクを1日で習得する新手法が実機で実証. 1. これは何の話? ロボット研究において、実機を使って1日で1,000種類以上の物理タスクを学習させることに成功したという研究成果が報じられました。単一のデモンストレーションから効率的に学習する新しいフレームワークを適用した結果です。

OpenAI CEOのSam Altman氏がBig Technology Podcastに出演。Gemini 3への対抗策、年間3倍の計算能力増強計画、2026年IPOの可能性、1兆ドル規模のAIインフラ投資戦略について語った内容を解説します。

360ChannelがGoogle AIプロジェクト『Music Video with Gemini』に参画し、藤井隆の名曲3曲のMV制作で動画生成AI「Veo」を活用。オリジナルCFの世界観をAIで拡張するプロンプトエンジニアリングを担当。

OpenAI Chain of Thought監視可能性研究:AIの思考プロセスを観察して不正行為を検出. 1. これは何の話? AIセーフティ研究者や開発者向けに、OpenAI が Chain of Thought(CoT)監視可能性に関する包括的な評価フレームワークを発表しました。

Google FunctionGemma発表:270Mパラメータでエッジデバイス向け関数呼び出しを実現. 1. これは何の話? エッジAI開発者やオンデバイスAIに関心のある読者向けに、Google が FunctionGemma を発表しました。これはGemma 3 270M

Anthropicが米エネルギー省と複数年パートナーシップ:Genesis Missionで科学研究にAIを活用. 1. これは何の話? 科学研究やAI政策に関心のある読者向けに、Anthropic が米エネルギー省(DOE)と複数年パートナーシップを締結したことが発表されました。これはDOEが主導するGenesis

OpenAI GPT-5.2 Codexリリース:コーディング特化モデルがWindows対応とサイバーセキュリティ機能を強化. 1. これは何の話? 開発者・ソフトウェアエンジニア向けに、OpenAI が GPT-5.2 Codex をリリースしました。2025年12月18日に公開されたこのモデルは、GPT-5.2

ロボット基盤モデル(VLA)を活用した汎用ロボットワーカーを開発するMuso Actionがシードラウンドで1億円を調達。East VenturesやGMO AI&ロボティクス商事から出資を受け、製造・物流現場での実証実験を加速。

動画生成AI「NoLang」が全18言語への多言語対応を開始。日本語のプレゼン資料からAIアバターとクローンボイスで多言語営業動画を即座に生成可能に。登録者15万人を超えるサービスが日本企業の海外展開を支援。

Primech Holdings(Nasdaq: PMEC)がCES 2026で自律型トイレ清掃ロボットHytronを北米初披露。幅400mmの小型設計でトイレ個室に進入可能、NVIDIA Jetson Orin Super搭載で99%以上の除菌性能を実現。

Google T5Gemma 2発表:Gemma 3ベースのマルチモーダル・エンコーダー・デコーダーモデル. 1. これは何の話? LLM研究者やエッジAI開発者向けに、Google が T5Gemma 2 を発表しました。これは Gemma 3

韓国のロボティクスソフトウェア企業TeamGRITが日本で合弁事業Remote Robotics(R2)を展開。超低遅延通信(0.2秒未満)と統合型ロボット運用プラットフォームで、災害対応や製造現場での実用的自律性を実現へ。

TopMediaiがAI動画エフェクト機能にクリスマス演出を追加し、ワンクリックで季節感ある短尺動画を生成可能に。美容プロモーション、コスチュームショー、ダンスなどのテンプレートを提供。

VS CodeでAgent Skills対応:AIエージェントに専門スキルを動的ロードするオープン規格. 1. これは何の話? AIエージェント開発者やGitHub Copilotユーザー向けに、VS CodeでAgent Skillsのサポートがプレビュー公開されました。Agent

Alibaba Cloudが次世代視覚基盤モデル「Wan 2.6」を発表。10秒の長尺Text-to-Video/Image-to-Video、音声同期(Audio Generation)、強化されたプロンプト追従性を搭載し、シネマグレードの映像生成を目指す。

AmazonがAI組織を大幅再編。27年ベテランのPeter DeSantisがNovaモデル・Graviton/Trainiumチップ・量子コンピューティングを統合した新組織を率い、Pieter Abbeelがフロンティアモデルチームを統括。

朝日新聞社の「AI短歌プロジェクト」がAI Creative Future Awards(AICA)賞を受賞。100年以上の歴史を持つ「朝日歌壇」と生成AIを融合し、短歌生成AIの開発と歌人との対話を通じて文化的価値を追求する取り組みが評価。

ElevenLabsが画像・動画生成機能を統合:Sora、Veo、Klingなど主要AIモデルをStudioで一元化. 1. これは何の話? ElevenLabsは、これまでの音声合成・音声クローン技術に加え、画像および動画生成機能をStudioに統合しました。

EQTと1X Technologiesが戦略提携を発表。2026〜2030年に最大1万台のNEOヒューマノイドロボットをEQTポートフォリオ企業に提供する覚書を締結。物流・倉庫・製造・ヘルスケア分野での活用を想定。

GoogleがGemini 3 Flashを発表し、AI検索モードとGeminiアプリのデフォルトモデルに採用。入力100万トークンあたり0.50ドルという価格設定で競合を圧倒しつつ、GPQA Diamond 90.4%など高性能を維持する戦略を解説。

Googleがインド政府設立のAIセンター・オブ・エクセレンス4カ所に800万ドルを支援すると発表。ヘルスケア、都市ガバナンス、教育、農業分野でのAI活用を推進し、現地AIエコシステムの成長を後押し。

LLMエージェントのメモリ機構「Hindsight」は保持・想起・反映の3操作で会話ストリームを構造化されたメモリバンクに変換。20Bオープンソースモデルで91.4%、GPT-4oを超える精度を達成。

Metaが動画編集アプリ『Edits』を大幅アップデート:SAM 3によるAIエフェクトやReels連携を追加. 1. これは何の話? Metaが提供するスマートフォン向け動画編集アプリ「Edits」に、2025年12月17日付けで大型アップデートが行われました。

MicrosoftのAI責任者Mustafa Suleymanが「制御から逃れるリスクがあるAIシステムからは撤退する」と表明。安全性を最優先する「ヒューマニスト・スーパーインテリジェンス」のビジョンを語り、医療AIやユニバーサルベーシックインカムにも言及。

Mistral AIが企業向けOCR 3をローンチ。フォーム・スキャン文書・複雑な表・手書き文字で競合製品に対し74%の勝率を主張し、1,000ページあたり2ドルで提供。生成AI活用の前段階となる文書デジタル化を強化。

MITが自然言語指示で椅子を組み立てるAIロボットシステムを発表。生成AIモデルで3D設計、別のAIでパーツ配置を推論、ロボットが自動組み立て。ユーザー評価で90%以上が従来手法より高評価。

NTTドコモビジネスが生成AIエージェントを使った「発話ベースルーティング」を三菱UFJ銀行に提供開始。顧客の発話内容をAIがリアルタイム解析し、最適なオペレーターへ自動接続することで満足度向上と業務効率化を実現。

NVIDIAのRev LebaredianがOmniverseプラットフォームを「認知幼稚園」と表現。ロボットが物理法則を学ぶシミュレーション環境で数千年分の経験を短期間で蓄積し、現実世界で動作できる「物理知能」の実現を目指す。

米国最高裁(SCOTUS)判決文分類におけるLLMの記憶戦略を評価した論文。プロンプト+メモリ付きモデルが従来のBERT系手法を約2ポイント上回る精度を達成し、法律文書分類へのLLM活用可能性を示す。
業界団体SEMIが半導体製造装置の販売予測を発表。AI向けロジックチップ・メモリーチップの生産能力拡大を背景に、2026年は約9%増の1,260億ドル、2027年は7.3%増の1,350億ドルを見込む。

マルチモーダルLLMを動画データなしで時間認識型埋め込みモデルに変換する手法「TARA」。時間的に反対の動作を識別するベンチマークを提案し、否定表現・動詞・副詞理解でもSoTAを達成。

xAIが『Grok Voice Agent API』公開:低遅延の音声エージェントを開発者に開放. 1. これは何の話? xAIは、音声で話しかけると音声で返す「Grok Voice Agent API」を開発者向けに公開しました。[1]

自動車部品大手AptivとAMR専業Vecna Roboticsが戦略的パートナーシップを締結し、次世代自律搬送ロボット(AMR)を共同開発すると発表しました。Aptivの360度知覚PULSEセンサーとVecnaのオーケストレーション基盤を統合し、より安全で効率的な倉庫・工場自動化を目指します。

CATLがビジョン言語アクション(VLA)モデル搭載のヒューマノイドロボット「Xiao Mo」を電池パック製造ラインへ大規模導入し、新エネルギー電池生産における世界初のヒューマノイド本格稼働を実現しました。高電圧端子接続の危険作業を自動化し、接続成功率99%超・作業量3倍を達成しています。

一般社団法人AIロボット協会(AIRoA)がNEDO委託事業として「国産汎用ロボット開発コンペティション」のプレエントリー受付を開始しました。双腕モバイルマニピュレーターの試作・量産を通じて日本のロボット産業競争力強化を目指し、納入機会・開発支援・販路開拓支援などの参加メリットを用意しています。

JoyPix.AIが静止画から高品質な対話動画を生成できる新機能「Motion-2-Dialog」を正式リリースしました。2人の会話シーンを自然に表現するため、感情やテンポを細かく調整可能で、マーケティング・教育・エンタメなど幅広い用途への活用が期待されています。

Luma AIがAIと人間のハイブリッド編集ワークフロー向けの新モデル「Ray3 Modify」を発表し、Dream Machineで提供開始しました。既存映像の動き・タイミング・感情を保持しながらシーンを修正でき、セットを再構築せずにAIで撮り直しが可能になります。

シンガポールのQuikBot Technologiesが自律配送ロボット「QuikFox」「QuikCat」を都市部のビジネス地区で稼働させ、ラストワンマイル配送の自動化を進めています。FedExとの提携により商用展開を拡大し、30%高速・20%低排出の配送効率を掲げています。

OpenAIアプリケーションCEOのFidji Simo氏がApple MusicのChatGPT統合を発表。「パーティ用のプレイリストを作って」といった自然言語で即座にプレイリスト生成が可能になります。Spotify連携に続く音楽サービス連携で、Adobe、Airtable、Salesforceなど多数のアプリ統合も予告されました。

OpenAIが2026年第1四半期にChatGPTへ「アダルトモード」を導入する計画を発表。成人ユーザーに対してコンテンツ制限を緩和し、より自由な会話を可能にする方針です。年齢認証にはAI行動分析や政府ID確認を組み合わせ、未成年のアクセス防止を図ります。プライバシーやAIとの親密性に関する懸念も浮上しています。

OpenAIがChatGPTの自動モデル選択機能「モデルルーター」を無料・Goティアで撤回。ユーザーの待ち時間への不満とDAU低下を受け、GPT-5.2 Instantをデフォルトに戻す判断。Google Geminiとの競争激化の中での戦略転換。

Google検索に『Gemini 3 Flash』統合:AI Modeが高速化し世界展開へ. 1. これは何の話? Googleは検索のAI Modeを更新し、既定モデルとして「Gemini 3 Flash」を導入しました。これにより、AI Modeの応答がより速くなり、複雑な質問にも対話形式で対応しやすくなります。

Google Labsが開発するAIミニアプリ作成ツール「Opal」がGeminiウェブアプリに直接統合されました。Gemsマネージャーから実験的なGemsとしてミニアプリを作成でき、プロンプトをステップリストで可視化する新機能も追加。高度なカスタマイズにはopal.googleのAdvanced Editorを利用可能です。

OpenAIがChatGPTの画像生成機能を大幅刷新。新モデル「GPT Image 1.5」は生成速度4倍、プロンプト理解力向上、細部まで維持する編集精度を実現。専用Imagesワークスペースも新設され、テンプレートやトレンドプロンプトで直感的な画像作成が可能に。API利用コストは20%削減。

Metaが音声セグメンテーションモデル「SAM Audio」を発表し、オープンソース公開しました。複雑な音声ミックスから「犬の鳴き声」「歌声」などをテキスト指定で分離したり、映像中の人物をクリックしてその音声だけを抽出したりできます。業界初の時間スパン指定機能も搭載し、Segment Anything Playgroundで試用可能です。

ChatGPTが『プラットフォーム』へ:サードパーティ製アプリの一般申請が受付開始. 1. これは何の話? OpenAIは、ChatGPT内で動くサードパーティ製アプリ(Apps)の申請受付を開始しました。承認されると、ChatGPTのUIからアプリを呼び出し、外部サービス連携を含む"アクション"体験を提供できます。

OpenAIがAIの科学推論能力を評価する新ベンチマーク「FrontierScience」を発表。PhD専門家が作成した700問超の難問で、GPT-5.2はオリンピアード形式で77.1%を達成したものの、オープンエンドな研究タスクでは25.3%に留まり、複雑な科学的問題解決に課題が残ることが判明。

Alibaba Qwenチームがコーディング支援ツール「Qwen-Code」のv0.5.0をリリースしました。ロシア語サポート追加、終了時のセッション再開コマンド表示、ターミナルベル設定、VSCode IDEコンパニオンの改良など、開発者体験向上に焦点を当てたアップデートです。

Speech-to-Speech比較:Artificial Analysisが推論・レイテンシ・価格を可視化. 1. これは何の話? Speech-to-Speech(音声をテキスト化せず、音声で入れて音声で返す)モデルを、Artificial Analysisの比較ページで俯瞰する記事です。

日本の産業ガス最大手・大陽日酸がTechtouch AI Hubを導入し、業務システム上にAIレイヤーを構築。画面遷移なしで生成AIを活用できる仕組みを全社展開へ。問い合わせ対応工数削減と生産性向上を目指す。

XiaomiがMixture-of-Experts構造を採用した大規模言語モデル「MiMo-V2-Flash」をオープンソース公開しました。総パラメータ309B(推論時アクティブ15B)で150トークン/秒の高速推論を実現。SWE-Bench Verifiedでオープンソース最高の73.4%を記録し、GPT-5クラスの性能に匹敵する場面も。

Adobe Fireflyがブラウザベースの動画エディタβ版を公開し、AI生成動画のタイムライン編集、プロンプトベースの部分編集、4Kアップスケールなどの機能を追加しました。

米AmazonがOpenAIへの投資について協議していると報道されました。これが実現すればOpenAIの企業価値は5000億ドル超と評価される可能性があり、AI市場の勢力図を左右する重大な動きとして注視されています。

Adobe FireflyがAI動画編集を大幅強化、Prompt to EditとFirefly Video Editorベータを発表. 1. これは何の話? Adobe FireflyがAI動画生成機能を大幅にアップデートし、生成後の動画を自然言語プロンプトで編集できる「Prompt to

中国でAIロボット「スマート科学者」110台が実験室の主力として稼働. 1. これは何の話? 中国科学技術大学の精密・スマート化学全国重点実験室において、AIと大規模言語モデルを搭載したロボット「スマート科学者」110台が自律的に科学実験を遂行している。[1]

ブラックボックスLLMの入力トークン重要度を可視化するDBSA手法を提案. 1. これは何の話? ブラックボックスLLMの各入力トークンが出力にどれだけ影響するかを可視化する「Distribution-Based Sensitivity Analysis(DBSA)」手法を提案する研究論文。[1]

ElevenLabsの初サミットで俳優マシュー・マコノヒー(アカデミー賞受賞)が登場し、同社に数年間投資していたことを明かしました。自身のニュースレター「Lyrics of Livin'」をスペイン語AI音声版として展開すると発表。本人の声を維持したまま多言語でストーリーを届ける事例として、クリエイターエコノミーにおけるAI音声技術の活用可能性を示しています。

オープンウェイトLLMを指示チューニングしてBPMNプロセスモデルを自動生成. 1. これは何の話? 自然言語のテキスト記述からBPMN(Business Process Model and Notation)プロセス図を自動生成するための「InstruBPM」手法を提案する研究論文。[1]

AI汎用エージェント「Manus」がバージョン1.6をリリースしました。新しいフラッグシップモデル「Manus 1.6 Max」を投入し、モバイルアプリのエンドツーエンド開発に対応。画像作成用のインタラクティブなDesign Viewも搭載され、ビジュアル編集体験が大幅に向上しています。

マルチエージェントシステムの協調的レジリエンスを人間とLLMで比較評価. 1. これは何の話? マルチエージェントシステムにおける「協調的レジリエンス」(集団の幸福に影響する破壊的イベントを予測・抵抗・回復・変容する能力)を、人間グループとLLMベースエージェントで比較評価する研究論文。[1]

成田空港で会話型AI搭載ロボットが旅客案内の実証実験を開始. 1. これは何の話? 成田国際空港株式会社が第3ターミナルにおいて、会話型AIを搭載した自律移動ロボットによる旅客案内の実証実験を開始したことを発表。[1]

Runwayが世界モデルGWM-1を公開、Gen-4.5にネイティブ音声統合も追加. 1. これは何の話? AI画像・動画生成企業Runwayが、物理法則を理解する世界モデル「GWM-1」を公開。Google DeepMindのGenie-3などと競合する分野に参入。[1]

ServiceNowがMoveworks買収を完了、エージェントAIとワークフロー統合を加速. 1. これは何の話? ServiceNowがAIエージェントプラットフォームMoveworksの買収を2025年12月15日に完了したことを発表。買収額は28.5億ドル(現金と株式の組み合わせ)。[1]

LLMエージェントの動的ツール生成と経験共有を統合するSMITH認知アーキテクチャ. 1. これは何の話? LLMエージェントが新規タスクに適応する際の課題(ツール不足と経験再利用の困難)を解決するため、動的ツール生成とタスク間経験共有を統合した「SMITH(Shared Memory Integrated Tool

TopMediaiがMusic5.0を発表、歌詞・画像・説明からAI作曲が可能に. 1. これは何の話? Cleverguard Technology傘下のTopMediaiが、AI音楽生成の最新モデル「Music5.0」を発表。歌詞、画像、または説明文から即座にオリジナル音楽を生成できる。[1]

視覚言語モデルの幻覚を抑制するVEGAS手法を提案. 1. これは何の話? 大規模視覚言語モデル(LVLM)が画像内容と矛盾する出力を生成する「幻覚」問題を抑制する「VEGAS(Vision-Encoder Attention Guided Adaptive Steering)」手法を提案する研究論文。[1]

Vidu Agentがワンクリック動画生成で広告制作を革新. 1. これは何の話? マルチモーダル生成AIのリーダー企業ShengShu Technologyが、ワンクリックでプロ品質の動画を生成する「Vidu Agent」を発表。[1]

スタートアップ「find」がAI画像認識を活用した落とし物検索サービスを開始。京浜急行・羽田空港など6社で横断検索が可能になり、2026年4月にはJR東日本も参加予定。

ElevenLabsやHume AIの音声クローン技術でAIポッドキャストが急増。Inception Point AIは20万エピソードを制作し、1話1ドルで40万購読者を獲得。一方、信頼性や透明性への懸念も議論されている。

Phaser StudioのBeamがGoogleのVeo 3.1を活用した「playable video」プラットフォームを発表。生成AI動画をノーコードでミニゲームや分岐ストーリーに変換し、ブラウザ上で公開可能に。

Stable Diffusion開発者が創業したドイツのBlack Forest LabsがシリーズBで3億ドルを調達。評価額32.5億ドルとなり、画像生成AI「Flux」シリーズでGoogleに対抗する構え。

Dify v1.11.1で画像ベクトル化とクロスモーダル検索に対応したマルチモーダルナレッジベースが正式公開。テキストから画像、画像からテキスト、画像から画像の検索が可能に。RAGの活用範囲が拡大。

神奈川県が自動配送ロボット「Hakobot」を使った工場間公道実証実験を発表。最大100kg搬送可能な四輪駆動設計で、2026年1月から横浜市金沢区で実施。従業員の業務効率化と安全性向上を検証。

Higgsfieldが「Nano Banana Pro Inpaint」など新機能を発表。構造を保持しながら高精度な画像編集を実現するAIエンジンで、シームレスな合成とゼロ歪みを特長とする。

川崎重工が2025国際ロボット展でヒューマノイドロボット「Kaleido 9」を初公開しました。2015年開発開始から第9世代となり、シミュレーション上で数千体を同時に動作させるAI強化学習を採用。3D環境認識、多言語対話にも対応し、工場でのロボット指揮、家庭での庭掃除、災害現場での救助活動を実演しました。

Liberawareと九電ドローンサービスが那覇市上下水道局の協力で、沖縄県初となるドローン「IBIS2」による雨水管内部のデモ飛行を実施しました。外形194mm×198mm・重量243gの世界最小級ドローンで、人が立ち入れない狭小空間の点検を実証。3次元データ計測システム「SEAMS」と連携し、地上・地下一体の3Dモデル作成にも成功しました。

MetaがElevenLabsと連携し、InstagramやHorizonにAI音声機能を統合。Reelsの多言語吹替、音楽生成、VRキャラクターボイスなどを強化。70言語以上・1.1万種類の音声ライブラリを活用。

n8n 2.1.0ベータでChat Hub機能が公開。単一のチャットインターフェースからワークフロー実行、独自エージェント呼び出し、複数AIモデル利用をまとめて操作可能に。チャット専用ロールで利用者管理も実現。

NVIDIAがオープンモデル「Nemotron 3」ファミリーを発表しました。Nano・Super・Ultraの3サイズで提供され、Nemotron 3 NanoはHugging Face、Baseten、Fireworks、Together AIなど複数の推論サービスから即日利用可能。SuperとUltraは2026年前半に公開予定です。

OpenAIが元Googleシニアディレクターのアルバート・リー氏をコーポレート開発担当VPに採用しました。約14年間GoogleでクラウドやデepMind部門のM&A・戦略投資を主導し、60件以上・500億ドル超の取引実績を持つ人物です。CFOのサラ・フライアー直属で、OpenAIの買収・投資戦略を統括します。

北海道札幌市で米国製除雪ロボット「Yarbo」の実証試験が始まりました。株式会社QYURUと開北工業が共同で実施し、積雪環境下での走行性能・投雪能力・運用性を評価します。Yarboは米国で1万台以上の納入実績を持ち、2025年12月から国内販売を開始。深刻化する除雪人手不足の解決策として注目されています。

SCSKが法人向け画像生成サービス「MIM for Business」を2025年12月より提供開始しました。1枚の商品画像からAIモデルによる着用イメージを自動生成でき、身長・体重・年齢・人種・性別・ポーズ・背景を自由に設定可能。従来のモデル撮影では対応困難だった少量生産品や小物の着用画像を安価かつ即日で生成できます。

中国・深圳市が世界初となる「ロボットフレンドリー」デモゾーンの構築計画を発表。広東省は2024年にロボット産業で全国トップの生産シェアを維持し、2025年末には約1万台のヒューマノイドロボット導入を見込む。

トランプ大統領が州ごとのAI規制を禁止し連邦レベルで統一する大統領令に署名。コロラド州のAI法を名指しで批判し、同州は法廷闘争も視野に入れている。