12月15日 - 12月21日

94件の記事

12月8日 - 12月14日前の週2025-W5112月22日 - 12月28日次の週

記事

2025年12月20日•3 min read

AI投資がデータセンター契約を記録的高水準に押し上げ

2025年のAI活用拡大に伴い、データセンター関連の契約・取引額が過去最高の約610億ドルに達したとのレポートが発表されました。AI学習や推論に必要な計算能力への需要が急増し、データセンターインフラへの投資が世界規模で加速しています。 AIインフラ投資の動向に関心を持つ企業経営者、不動産・インフラ投資家、エネルギー事業者にとって、この市場動向は重要な指標となります。

#データセンター#AI投資#インフラ

記事

2025年12月20日•3 min read

中国CATLが工場でヒューマノイドロボットを大規模展開

中国の電池メーカー大手CATLが、自社工場内でヒューマノイドロボットを本格的に展開していることが報じられました。ヒューマノイドロボットを製造現場で大規模に運用する先駆的な事例として、世界的に注目を集めています。製造業の自動化、ヒューマノイドロボットの実用化に関心を持つ製造業経営者、ロボット技術者、産業アナリストにとって、重要な参照事例となります。

#ヒューマノイドロボット#製造業#CATL

記事公式発表

Anthropic•2025年12月20日•3 min read

Anthropic公式「Claude Skill作成ベストプラクティス」完全ガイド──トークン効率と自由度のバランス

AnthropicがClaude Skill作成のベストプラクティスを公式ドキュメントで公開。トークン効率を最大化しつつ、タスクの複雑さに応じた自由度設定、ワークフロー設計のコツを解説しています。

#Anthropic#Claude#Skills

記事検証済み

2025年12月20日•3 min read

Cornell大学研究：AI使用で論文数は増加も質への懸念

Cornell大学の研究チームが、大規模言語モデル（LLM）の利用が学術論文の執筆に与える影響を分析した研究結果を発表しました。LLMの活用により論文の執筆数は増加傾向にある一方、論文の品質にばらつきが生じる懸念も指摘されています。学術研究に携わる研究者、大学の研究支援部門、学術出版に関わる編集者にとって、AIと研究活動の関係を考える上で示唆に富む内容となっています。

#学術研究#LLM#論文執筆

記事

2025年12月20日•4 min read

The Batch Issue 332まとめ──GPT-5.2 vs Gemini 3ベンチマーク比較、32例で学習できるSEMI技術

DeepLearning.ai The Batch Issue 332の注目記事。GPT-5.2がGemini 3に対抗するベンチマーク結果と、わずか32例でLLMをマルチモーダル化する「SEMI」技術を解説。

#The Batch#GPT-5.2#Gemini 3

記事

2025年12月20日•3 min read

DOEがAI産業協力協定を発表、主要AI企業と科学発見の推進で連携

米国エネルギー省（DOE）が、OpenAI、Google DeepMindをはじめとする主要AI企業との間で協力協定を締結し、「Genesis Mission」と名付けた取り組みを発表しました。AI技術を科学研究と発見に活用することを目的とした官民連携プロジェクトです。エネルギー、気候変動、材料科学など科学技術分野でのAI活用に関心を持つ研究者や企業にとって、今後の研究開発の方向性を示す重要な動きとなります。

#科学研究#AI協力#米国政策

記事

2025年12月20日•3 min read

Googleが公開「Gemini 3で作る実践エージェント」6フレームワーク連携ガイド

GoogleがGemini 3を活用したエージェント構築の実践例を公開。ADK、Agno、Browser Use、Eigent、Letta、mem0の6フレームワークとの連携サンプルを解説。すぐにクローンして動かせるリポジトリ付き。

#Gemini 3#エージェント#ADK

記事

2025年12月20日•2 min read

米HHSがAI活用の公衆意見募集を発表

米国保健福祉省（HHS）が、AIを活用して医療コストの削減や臨床ケアの改善を図るための意見募集（RFI: Request for Information）を公開しました。医療現場でのAI導入を促進するための政策立案に向けて、幅広いステークホルダーからのフィードバックを求めています。米国の医療AI市場に関心を持つ企業、医療機関でのAI導入を担当する方、ヘルスケアテック領域で事業を展開する企業にとって、今後の規制動向を占う重要な動きです。

#医療AI#米国政策#ヘルスケア

記事検証済み

2025年12月20日•3 min read

ヒューマノイド・サミットが米カリフォルニアで開催、商業化段階へ

カリフォルニア州マウンテンビューで、ヒューマノイドロボットに特化した国際カンファレンス「ヒューマノイド・サミット」が開催されました。このイベントでは、ヒューマノイドロボット産業が研究段階から商用展開段階に移行したとの発表があり、業界の転換点として注目を集めています。ロボット産業への投資を検討している投資家、ヒューマノイドロボットの導入を検討する企業、ロボット研究者にとって、市場の現状と将来性を把握する重要な機会となりました。

#ヒューマノイドロボット#カンファレンス#商業化

記事

2025年12月20日•2 min read

AI搭載カメラで観光地のオーバーツーリズム対策実証実験開始

鎌倉市の鎌倉高校前駅周辺で、AIカメラを使った観光客混雑対策の実証実験が始まりました。映像AI解析技術を活用してオーバーツーリズム（過剰観光）による地域課題の緩和を試みる社会実験です。地方自治体の観光政策担当者、スマートシティ関連事業者、AI技術の社会実装に関心を持つ方にとって、参照事例となる取り組みです。

#オーバーツーリズム#AIカメラ#観光

記事検証済み

2025年12月20日•3 min read

MetaがMango/Avocadoモデル計画でAI競争再参入へ

Metaが「Mango」「Avocado」というコードネームで呼ばれる次世代AIモデルの開発を進行しており、OpenAIやGoogleに対抗するAI競争への再参入を目指しているとの報道がありました。Llamaシリーズに続く新たなモデルファミリーとして注目されています。最先端AI技術の動向に関心を持つ開発者、AI研究者、テクノロジー業界アナリストにとって、Metaの戦略転換を示す重要なニュースです。

#Meta#AIモデル#Mango

記事検証済み

2025年12月20日•3 min read

NTTデータ先端技術など、生成AI体験・検証サービスを提供開始

NTTデータ先端技術、NTT・TCリース、Nutanixの3社が共同で、企業向けに生成AIの体験・検証が可能なサブスクリプションサービス「INTELLILINK Private AIスタートパック」を提供開始すると発表しました。自社のプライベート環境内で生成AIを試用・評価できるサービスです。生成AIの導入を検討しているものの、クラウドサービスへのデータ送信に懸念がある企業のIT部門やセキュリティ担当者にとって、オンプレミス環境でAI

#生成AI#エンタープライズ#プライベートAI

記事

2025年12月20日•3 min read

Qwen Image Layered登場──1枚の画像をPhotoshop風レイヤーに自動分解するAI

Alibabaが画像を複数のRGBAレイヤーに自動分解するAIモデル「Qwen Image Layered」を発表。プロ向けデザインツールのような編集可能性をAIで実現。Apache 2.0ライセンスでオープンソース公開。

#Qwen#画像生成#レイヤー分解

記事検証済み

2025年12月20日•3 min read

ロボットが1,000以上の物理タスクを1日で習得する新手法が実機で実証

ロボット研究において、実機を使って1日で1,000種類以上の物理タスクを学習させることに成功したという研究成果が報じられました。単一のデモンストレーションから効率的に学習する新しいフレームワークを適用した結果です。汎用ロボットや家庭用アシスタントロボットの開発に関心を持つ研究者、ロボット関連スタートアップ、製造業のエンジニアにとって、技術的なブレークスルーとして注目すべきニュースです。

#ロボット学習#模倣学習#汎用ロボット

YouTubeYouTube

2025年12月20日•3 min read

Sam Altman氏、OpenAIの戦略を語る──1兆ドルAIインフラ投資とIPO 2026の現実味

OpenAI CEOのSam Altman氏がBig Technology Podcastに出演。Gemini 3への対抗策、年間3倍の計算能力増強計画、2026年IPOの可能性、1兆ドル規模のAIインフラ投資戦略について語った内容を解説します。

#OpenAI#Sam Altman#IPO

記事

2025年12月19日•3 min read

360ChannelがGoogle Veoで藤井隆MV制作に参画——AI映像生成で「世界観の拡張」を実現

360ChannelがGoogle AIプロジェクト『Music Video with Gemini』に参画し、藤井隆の名曲3曲のMV制作で動画生成AI「Veo」を活用。オリジナルCFの世界観をAIで拡張するプロンプトエンジニアリングを担当。

#動画生成AI#Veo#クリエイティブ

記事公式発表

OpenAI•2025年12月19日•3 min read

OpenAI Chain of Thought監視可能性研究：AIの思考プロセスを観察して不正行為を検出

AIセーフティ研究者や開発者向けに、OpenAI が Chain of Thought（CoT）監視可能性に関する包括的な評価フレームワークを発表しました。CoT監視可能性とは、AIモデルのステップバイステップの推論プロセスを観察・解釈し、不正行為や意図を検出できる能力を指します。2025年12月に公開されたこの研究は、13の評価・24の多様な環境で構成され、AIの安全性向上に向けた重要な取り組みとして注目されています。 - 不正検出効

#OpenAI#AIセーフティ#Chain of Thought

記事公式発表

Google•2025年12月19日•3 min read

Google FunctionGemma発表：270Mパラメータでエッジデバイス向け関数呼び出しを実現

エッジAI開発者やオンデバイスAIに関心のある読者向けに、Google が FunctionGemma を発表しました。これはGemma 3 270M をベースに関数呼び出し（Function Calling）向けにファインチューニングしたモデルで、自然言語のコマンドをAPIアクションに変換するエッジエージェント構築を可能にします。2025年の Gemma ファミリーは1億から3億以上のダウンロードに成長しており、開発者からの要望No.

#Google#Gemma#エッジAI

記事公式発表

Anthropic•2025年12月19日•3 min read

Anthropicが米エネルギー省と複数年パートナーシップ：Genesis Missionで科学研究にAIを活用

科学研究やAI政策に関心のある読者向けに、Anthropic が米エネルギー省（DOE）と複数年パートナーシップを締結したことが発表されました。これはDOEが主導するGenesis Mission（AI活用でアメリカの科学リーダーシップを強化するイニシアチブ）の一環で、Anthropicはエネルギー優位性・生命科学・科学生産性の3分野でClaudeを提供します。ホワイトハウスでのGenesis Mission発表イベントにAnthrop

#Anthropic#Claude#政府連携

記事公式発表

OpenAI•2025年12月19日•3 min read

OpenAI GPT-5.2 Codexリリース：コーディング特化モデルがWindows対応とサイバーセキュリティ機能を強化

開発者・ソフトウェアエンジニア向けに、OpenAI が GPT-5.2 Codex をリリースしました。2025年12月18日に公開されたこのモデルは、GPT-5.2 をコーディングタスク向けに最適化したバージョンで、大規模なリファクタリングや技術的マイグレーションといった高度なソフトウェアエンジニアリングタスクに対応します。有料ChatGPTユーザー向けにすべてのCodexプラットフォームで利用可能になりました。 - コンテキスト圧縮

#OpenAI#GPT-5.2#Codex

記事

2025年12月19日•3 min read

汎用ロボットワーカーのMuso Actionがシード1億円調達——VLAモデルで製造・物流現場の軽作業を代替

ロボット基盤モデル（VLA）を活用した汎用ロボットワーカーを開発するMuso Actionがシードラウンドで1億円を調達。East VenturesやGMO AI&ロボティクス商事から出資を受け、製造・物流現場での実証実験を加速。

#ロボティクス#資金調達#VLA

記事

2025年12月19日•3 min read

NoLangが全18言語対応を開始——日本語資料から自分のAIアバターが語る多言語営業動画を即時生成

動画生成AI「NoLang」が全18言語への多言語対応を開始。日本語のプレゼン資料からAIアバターとクローンボイスで多言語営業動画を即座に生成可能に。登録者15万人を超えるサービスが日本企業の海外展開を支援。

#動画生成AI#多言語対応#AIアバター

記事

2025年12月19日•3 min read

Primech AIがCES 2026で自律型トイレ清掃ロボットHytronを北米初披露——NVIDIA Jetson搭載で99%除菌

Primech Holdings（Nasdaq: PMEC）がCES 2026で自律型トイレ清掃ロボットHytronを北米初披露。幅400mmの小型設計でトイレ個室に進入可能、NVIDIA Jetson Orin Super搭載で99%以上の除菌性能を実現。

#清掃ロボット#CES 2026#自律型ロボット

記事公式発表

Google•2025年12月19日•3 min read

Google T5Gemma 2発表：Gemma 3ベースのマルチモーダル・エンコーダー・デコーダーモデル

LLM研究者やエッジAI開発者向けに、Google が T5Gemma 2 を発表しました。これは Gemma 3 をベースにしたエンコーダー・デコーダー型のモデルファミリーで、初のマルチモーダル対応とロングコンテキスト対応を実現したエンコーダー・デコーダーモデルです。270M-270M（約370Mパラメータ）から4B-4B（約7Bパラメータ）までの3サイズが公開されています。 - アーキテクチャ革新 ─ エンコーダーとデコーダーで埋め

#Google#Gemma#マルチモーダル

記事

2025年12月19日•3 min read

韓国TeamGRITが日本で合弁事業——超低遅延通信と統合型ロボット運用で次世代インフラ構築

韓国のロボティクスソフトウェア企業TeamGRITが日本で合弁事業Remote Robotics（R2）を展開。超低遅延通信（0.2秒未満）と統合型ロボット運用プラットフォームで、災害対応や製造現場での実用的自律性を実現へ。

#ロボティクス#合弁事業#低遅延通信

記事

2025年12月19日•2 min read

TopMediaiがAI動画エフェクトにクリスマス演出を追加——ワンクリックで季節感ある短尺動画を生成

TopMediaiがAI動画エフェクト機能にクリスマス演出を追加し、ワンクリックで季節感ある短尺動画を生成可能に。美容プロモーション、コスチュームショー、ダンスなどのテンプレートを提供。

#動画生成AI#クリスマス#エフェクト

記事公式発表

Microsoft VS Code•2025年12月19日•3 min read

VS CodeでAgent Skills対応：AIエージェントに専門スキルを動的ロードするオープン規格

AIエージェント開発者やGitHub Copilotユーザー向けに、VS CodeでAgent Skillsのサポートがプレビュー公開されました。Agent Skillsは、AIエージェントに専門的な能力や知識を動的にロードできる仕組みで、オープン規格としてagentskills.ioで仕様が公開されています。従来のカスタム指示（Custom Instructions）がコーディングガイドライン中心だったのに対し、スキルはスクリプト・サ

#GitHub Copilot#VS Code#AIエージェント

記事

2025年12月18日•2 min read

Alibaba CloudがWan 2.6を発表、映像に音声同期と高精細化をもたらす次世代視覚モデル

Alibaba Cloudが次世代視覚基盤モデル「Wan 2.6」を発表。10秒の長尺Text-to-Video/Image-to-Video、音声同期（Audio Generation）、強化されたプロンプト追従性を搭載し、シネマグレードの映像生成を目指す。

#動画生成AI#Alibaba Cloud#音声同期

記事

2025年12月18日•3 min read

AmazonがAI組織を再編、Peter DeSantisがAIチップ・量子・フロンティアモデル統括へ

AmazonがAI組織を大幅再編。27年ベテランのPeter DeSantisがNovaモデル・Graviton/Trainiumチップ・量子コンピューティングを統合した新組織を率い、Pieter Abbeelがフロンティアモデルチームを統括。

#Amazon#AI組織#チップ

記事

2025年12月18日•3 min read

朝日新聞社の「AI短歌プロジェクト」がAICA賞を受賞——100年の歌壇とLLMの融合が評価

朝日新聞社の「AI短歌プロジェクト」がAI Creative Future Awards（AICA）賞を受賞。100年以上の歴史を持つ「朝日歌壇」と生成AIを融合し、短歌生成AIの開発と歌人との対話を通じて文化的価値を追求する取り組みが評価。

#AI短歌#AICA賞#クリエイティブAI

記事公式発表

ElevenLabs•2025年12月18日•3 min read

ElevenLabsが画像・動画生成機能を統合：Sora、Veo、Klingなど主要AIモデルをStudioで一元化

ElevenLabsは、これまでの音声合成・音声クローン技術に加え、画像および動画生成機能をStudioに統合しました。テキスト、画像、またはフレームから動画を生成し、ElevenLabsの音声技術と組み合わせることで、コンテンツ制作の全工程を一つのプラットフォームで完結できるようになりました。[1] - 対応モデル（動画生成）: Google Veo 3、OpenAI Sora 2 Pro、Kling、Seedance、Wan。[1]

#ElevenLabs#画像生成#動画生成

記事

2025年12月18日•2 min read

EQTと1Xが戦略提携、2026〜2030年に最大1万台のヒューマノイドロボット導入を視野

EQTと1X Technologiesが戦略提携を発表。2026〜2030年に最大1万台のNEOヒューマノイドロボットをEQTポートフォリオ企業に提供する覚書を締結。物流・倉庫・製造・ヘルスケア分野での活用を想定。

#ヒューマノイドロボット#1X#EQT

記事

2025年12月18日•3 min read

Gemini 3 FlashがAI検索と会話のデフォルトモデルに——Googleが価格破壊で市場をリードへ

GoogleがGemini 3 Flashを発表し、AI検索モードとGeminiアプリのデフォルトモデルに採用。入力100万トークンあたり0.50ドルという価格設定で競合を圧倒しつつ、GPQA Diamond 90.4%など高性能を維持する戦略を解説。

#Gemini#フロンティアモデル#価格戦略

記事

2025年12月18日•2 min read

GoogleがインドのAIセンターに800万ドル支援、ヘルスケア・農業・教育分野で活用へ

Googleがインド政府設立のAIセンター・オブ・エクセレンス4カ所に800万ドルを支援すると発表。ヘルスケア、都市ガバナンス、教育、農業分野でのAI活用を推進し、現地AIエコシステムの成長を後押し。

#Google#インド#AI支援

記事論文

arXiv•2025年12月18日•2 min read

エージェントメモリ「Hindsight」で長期記憶を構造化、GPT-4oを超える精度を達成

LLMエージェントのメモリ機構「Hindsight」は保持・想起・反映の3操作で会話ストリームを構造化されたメモリバンクに変換。20Bオープンソースモデルで91.4%、GPT-4oを超える精度を達成。

#エージェントAI#メモリ#長期記憶

記事公式発表

Meta•2025年12月18日•3 min read

Metaが動画編集アプリ『Edits』を大幅アップデート：SAM 3によるAIエフェクトやReels連携を追加

Metaが提供するスマートフォン向け動画編集アプリ「Edits」に、2025年12月17日付けで大型アップデートが行われました。AIを活用した新しいビデオエフェクトや、InstagramのReelsとの連携機能が追加されています。[1] - AIエフェクト: SAM 3（Segment Anything Model 3）を活用し、動画内の人物やオブジェクトを自動検出。Scribble、Outline、Glitterなどのエフェクトを適用

#Meta#動画編集#AI

記事

2025年12月18日•3 min read

Microsoft AI責任者が「制御できなくなるAIからは撤退する」と安全性最優先を表明

MicrosoftのAI責任者Mustafa Suleymanが「制御から逃れるリスクがあるAIシステムからは撤退する」と表明。安全性を最優先する「ヒューマニスト・スーパーインテリジェンス」のビジョンを語り、医療AIやユニバーサルベーシックインカムにも言及。

#Microsoft#AI安全性#Mustafa Suleyman

記事

2025年12月18日•2 min read

Mistral AIがOCR 3を発表、企業向け文書デジタル化で74%の勝率を主張

Mistral AIが企業向けOCR 3をローンチ。フォーム・スキャン文書・複雑な表・手書き文字で競合製品に対し74%の勝率を主張し、1,000ページあたり2ドルで提供。生成AI活用の前段階となる文書デジタル化を強化。

#OCR#企業向けAI#文書処理

記事

2025年12月18日•2 min read

MITが言葉で椅子を組み立てるロボットを公開、生成AIと物理製造を融合

MITが自然言語指示で椅子を組み立てるAIロボットシステムを発表。生成AIモデルで3D設計、別のAIでパーツ配置を推論、ロボットが自動組み立て。ユーザー評価で90%以上が従来手法より高評価。

#ロボティクス#生成AI#製造

記事

2025年12月18日•2 min read

NTTドコモビジネスが生成AIエージェントでコールセンター自動振り分け、三菱UFJ銀行に導入

NTTドコモビジネスが生成AIエージェントを使った「発話ベースルーティング」を三菱UFJ銀行に提供開始。顧客の発話内容をAIがリアルタイム解析し、最適なオペレーターへ自動接続することで満足度向上と業務効率化を実現。

#コールセンター#生成AIエージェント#NTT

記事

2025年12月18日•3 min read

NVIDIAシミュレーション責任者が語る「物理知能」、Omniverseでロボットに現実世界を教える

NVIDIAのRev LebaredianがOmniverseプラットフォームを「認知幼稚園」と表現。ロボットが物理法則を学ぶシミュレーション環境で数千年分の経験を短期間で蓄積し、現実世界で動作できる「物理知能」の実現を目指す。

#NVIDIA#Physical AI#シミュレーション

記事論文

arXiv•2025年12月18日•2 min read

米国最高裁判例分類におけるLLMの記憶戦略を評価、プロンプト＋メモリ付きモデルが従来法を上回る精度を達成

米国最高裁（SCOTUS）判決文分類におけるLLMの記憶戦略を評価した論文。プロンプト＋メモリ付きモデルが従来のBERT系手法を約2ポイント上回る精度を達成し、法律文書分類へのLLM活用可能性を示す。

#LLM#法律AI#分類タスク

記事

2025年12月18日•2 min read

半導体製造装置販売がAI需要で2026年に9%増、業界団体SEMIが予測

業界団体SEMIが半導体製造装置の販売予測を発表。AI向けロジックチップ・メモリーチップの生産能力拡大を背景に、2026年は約9%増の1,260億ドル、2027年は7.3%増の1,350億ドルを見込む。

#半導体#AI需要#製造装置

記事論文

arXiv•2025年12月18日•2 min read

TARA：動画データなしでマルチモーダルLLMを時間認識型埋め込みモデルに変換する手法

マルチモーダルLLMを動画データなしで時間認識型埋め込みモデルに変換する手法「TARA」。時間的に反対の動作を識別するベンチマークを提案し、否定表現・動詞・副詞理解でもSoTAを達成。

#動画理解#マルチモーダル#検索

記事公式発表

xAI•2025年12月18日•3 min read

xAIが『Grok Voice Agent API』公開：低遅延の音声エージェントを開発者に開放

xAIは、音声で話しかけると音声で返す「Grok Voice Agent API」を開発者向けに公開しました。[1] ツール呼び出しやリアルタイム検索を組み合わせ、音声エージェントを作るための基盤を提供します。[1] - 速さ：xAIは「平均TTFA（Time To First Audio）が1秒未満」と記載し、「最も近い競合より約5倍速」とも述べています。[1] - 成績：xAIは「Big Bench Audioで#1、スコア95%」

#xAI#Grok#音声AI

記事

2025年12月18日•3 min read

AptivとVecna Robotics提携―次世代自律搬送ロボット共同開発へ

自動車部品大手AptivとAMR専業Vecna Roboticsが戦略的パートナーシップを締結し、次世代自律搬送ロボット（AMR）を共同開発すると発表しました。Aptivの360度知覚PULSEセンサーとVecnaのオーケストレーション基盤を統合し、より安全で効率的な倉庫・工場自動化を目指します。

#AMR#自律搬送ロボット#倉庫自動化

記事

2025年12月18日•3 min read

CATL「Xiao Mo」が電池製造ラインに導入―世界初のヒューマノイド大規模稼働

CATLがビジョン言語アクション（VLA）モデル搭載のヒューマノイドロボット「Xiao Mo」を電池パック製造ラインへ大規模導入し、新エネルギー電池生産における世界初のヒューマノイド本格稼働を実現しました。高電圧端子接続の危険作業を自動化し、接続成功率99%超・作業量3倍を達成しています。

#ヒューマノイドロボット#電池製造#VLAモデル

記事

2025年12月18日•3 min read

国産汎用ロボット開発コンペティション始動―NEDO委託でプレエントリー受付開始

一般社団法人AIロボット協会（AIRoA）がNEDO委託事業として「国産汎用ロボット開発コンペティション」のプレエントリー受付を開始しました。双腕モバイルマニピュレーターの試作・量産を通じて日本のロボット産業競争力強化を目指し、納入機会・開発支援・販路開拓支援などの参加メリットを用意しています。

#ロボットコンペ#NEDO#国産ロボット

記事

2025年12月18日•3 min read

JoyPix.AIがAIリップシンク新機能「Motion-2-Dialog」を正式リリース

JoyPix.AIが静止画から高品質な対話動画を生成できる新機能「Motion-2-Dialog」を正式リリースしました。2人の会話シーンを自然に表現するため、感情やテンポを細かく調整可能で、マーケティング・教育・エンタメなど幅広い用途への活用が期待されています。

#AIリップシンク#動画生成#対話動画

記事

2025年12月18日•3 min read

Luma AIがRay3 Modify発表―人間のパフォーマンスを保持するAI動画編集

Luma AIがAIと人間のハイブリッド編集ワークフロー向けの新モデル「Ray3 Modify」を発表し、Dream Machineで提供開始しました。既存映像の動き・タイミング・感情を保持しながらシーンを修正でき、セットを再構築せずにAIで撮り直しが可能になります。

#Luma AI#Ray3#動画生成AI

記事

2025年12月18日•3 min read

QuikBotがシンガポール都市部で自律配送ロボット稼働―FedExと提携

シンガポールのQuikBot Technologiesが自律配送ロボット「QuikFox」「QuikCat」を都市部のビジネス地区で稼働させ、ラストワンマイル配送の自動化を進めています。FedExとの提携により商用展開を拡大し、30%高速・20%低排出の配送効率を掲げています。

#配送ロボット#ラストワンマイル#シンガポール

記事

2025年12月17日•3 min read

Apple MusicがChatGPTに統合へ―自然言語でプレイリスト作成が可能に

OpenAIアプリケーションCEOのFidji Simo氏がApple MusicのChatGPT統合を発表。「パーティ用のプレイリストを作って」といった自然言語で即座にプレイリスト生成が可能になります。Spotify連携に続く音楽サービス連携で、Adobe、Airtable、Salesforceなど多数のアプリ統合も予告されました。

#Apple Music#ChatGPT#アプリ連携

記事

2025年12月17日•3 min read

ChatGPT「アダルトモード」2026年Q1に登場―年齢認証で成人向けコンテンツ解禁へ

OpenAIが2026年第1四半期にChatGPTへ「アダルトモード」を導入する計画を発表。成人ユーザーに対してコンテンツ制限を緩和し、より自由な会話を可能にする方針です。年齢認証にはAI行動分析や政府ID確認を組み合わせ、未成年のアクセス防止を図ります。プライバシーやAIとの親密性に関する懸念も浮上しています。

#ChatGPT#ポリシー変更#年齢認証

記事検証済み

2025年12月17日•3 min read

OpenAIがChatGPTのモデルルーター機能を無料・Goユーザー向けに撤回——GPT-5.2 Instantがデフォルトに

OpenAIがChatGPTの自動モデル選択機能「モデルルーター」を無料・Goティアで撤回。ユーザーの待ち時間への不満とDAU低下を受け、GPT-5.2 Instantをデフォルトに戻す判断。Google Geminiとの競争激化の中での戦略転換。

#ChatGPT#OpenAI#モデルルーター

記事公式発表

Google•2025年12月17日•3 min read

Google検索に『Gemini 3 Flash』統合：AI Modeが高速化し世界展開へ

Googleは検索のAI Modeを更新し、既定モデルとして「Gemini 3 Flash」を導入しました。これにより、AI Modeの応答がより速くなり、複雑な質問にも対話形式で対応しやすくなります。[1][2] Gemini 3 FlashはAI Modeの既定モデルとして提供され、検索体験のテンポが上がります。[1][2] また米国では、より深い支援向けに「Thinking with Gemini 3 Pro」の利用範囲が広がりま

#Google#Gemini#AI検索

記事公式発表

Google•2025年12月17日•2 min read

Google「Opal」がGeminiアプリに統合─AI搭載ミニアプリを直接作成可能に

Google Labsが開発するAIミニアプリ作成ツール「Opal」がGeminiウェブアプリに直接統合されました。Gemsマネージャーから実験的なGemsとしてミニアプリを作成でき、プロンプトをステップリストで可視化する新機能も追加。高度なカスタマイズにはopal.googleのAdvanced Editorを利用可能です。

#Google#Gemini#Opal

記事公式発表

OpenAI•2025年12月17日•3 min read

ChatGPT画像生成が大幅強化「GPT Image 1.5」登場―従来比4倍高速・編集精度も向上

OpenAIがChatGPTの画像生成機能を大幅刷新。新モデル「GPT Image 1.5」は生成速度4倍、プロンプト理解力向上、細部まで維持する編集精度を実現。専用Imagesワークスペースも新設され、テンプレートやトレンドプロンプトで直感的な画像作成が可能に。API利用コストは20%削減。

#画像生成#アップデート#OpenAI

記事公式発表

Meta•2025年12月17日•3 min read

Meta「SAM Audio」発表―テキスト・映像・時間指定で音声を自在に分離

Metaが音声セグメンテーションモデル「SAM Audio」を発表し、オープンソース公開しました。複雑な音声ミックスから「犬の鳴き声」「歌声」などをテキスト指定で分離したり、映像中の人物をクリックしてその音声だけを抽出したりできます。業界初の時間スパン指定機能も搭載し、Segment Anything Playgroundで試用可能です。

#音声AI#オープンソース#Meta

記事公式発表

OpenAI•2025年12月17日•2 min read

ChatGPTが『プラットフォーム』へ：サードパーティ製アプリの一般申請が受付開始

OpenAIは、ChatGPT内で動くサードパーティ製アプリ（Apps）の申請受付を開始しました。承認されると、ChatGPTのUIからアプリを呼び出し、外部サービス連携を含む"アクション"体験を提供できます。[1] Apps SDK（ベータ）が提供され、開発者はアプリを実装して申請できます。[1] 申請には、MCP接続（外部ツール/データ連携）などの情報提出が含まれます。[1] App DirectoryはChatGPT内で提供され、

#OpenAI#ChatGPT#開発者向け

記事公式発表

OpenAI•2025年12月17日•3 min read

OpenAI「FrontierScience」発表―AIの科学推論能力を測る新ベンチマーク

OpenAIがAIの科学推論能力を評価する新ベンチマーク「FrontierScience」を発表。PhD専門家が作成した700問超の難問で、GPT-5.2はオリンピアード形式で77.1%を達成したものの、オープンエンドな研究タスクでは25.3%に留まり、複雑な科学的問題解決に課題が残ることが判明。

#ベンチマーク#科学#OpenAI

記事

2025年12月17日•2 min read

Qwen-Code v0.5.0リリース―ロシア語対応・セッション再開機能を追加

Alibaba Qwenチームがコーディング支援ツール「Qwen-Code」のv0.5.0をリリースしました。ロシア語サポート追加、終了時のセッション再開コマンド表示、ターミナルベル設定、VSCode IDEコンパニオンの改良など、開発者体験向上に焦点を当てたアップデートです。

#コーディングツール#アップデート#オープンソース

記事

2025年12月17日•2 min read

Speech-to-Speech比較：Artificial Analysisが推論・レイテンシ・価格を可視化

Speech-to-Speech（音声をテキスト化せず、音声で入れて音声で返す）モデルを、Artificial Analysisの比較ページで俯瞰する記事です。同じ「音声AI」でも、推論が強いモデルと、レイテンシが強いモデルは分かれます。 Speech ReasoningはBig Bench Audioなどの指標で比較され、Gemini 2.5 Native Audio Thinkingが高スコアとして紹介された例があります。またx

#ベンチマーク#比較#Speech-to-Speech

記事

2025年12月17日•3 min read

大陽日酸がTechtouch AI Hubを導入——業務システム上にAIレイヤーを構築し生成AI活用を加速

日本の産業ガス最大手・大陽日酸がTechtouch AI Hubを導入し、業務システム上にAIレイヤーを構築。画面遷移なしで生成AIを活用できる仕組みを全社展開へ。問い合わせ対応工数削減と生産性向上を目指す。

#エンタープライズAI#デジタルアダプション#生成AI

記事公式発表

Xiaomi•2025年12月17日•3 min read

Xiaomi「MiMo-V2-Flash」オープンソース公開―309Bパラメータで150トークン/秒の高速推論

XiaomiがMixture-of-Experts構造を採用した大規模言語モデル「MiMo-V2-Flash」をオープンソース公開しました。総パラメータ309B（推論時アクティブ15B）で150トークン/秒の高速推論を実現。SWE-Bench Verifiedでオープンソース最高の73.4%を記録し、GPT-5クラスの性能に匹敵する場面も。

#オープンソース#LLM#Xiaomi

記事

2025年12月17日•2 min read

Adobe Fireflyにブラウザ版動画エディタβと4Kアップスケール機能を追加

Adobe Fireflyがブラウザベースの動画エディタβ版を公開し、AI生成動画のタイムライン編集、プロンプトベースの部分編集、4Kアップスケールなどの機能を追加しました。

#Adobe Firefly#動画生成AI#動画編集

記事

2025年12月17日•2 min read

Amazon、OpenAIへの投資を協議―評価額5000億ドル超の可能性

米AmazonがOpenAIへの投資について協議していると報道されました。これが実現すればOpenAIの企業価値は5000億ドル超と評価される可能性があり、AI市場の勢力図を左右する重大な動きとして注視されています。

#Amazon#OpenAI#投資

記事

2025年12月16日•2 min read

Adobe FireflyがAI動画編集を大幅強化、Prompt to EditとFirefly Video Editorベータを発表

Adobe FireflyがAI動画生成機能を大幅にアップデートし、生成後の動画を自然言語プロンプトで編集できる「Prompt to Edit」機能や、カメラモーション制御、Firefly Video Editorベータなどを発表。[1] 「Prompt to Edit」機能により、AI生成動画に対して「左側の人物を削除」「背景をスタジオに変更」「ゴールデンアワーの照明に」といった自然言語指示で編集が可能になった。再生成せずに部分的な調

#動画生成AI#Adobe#編集機能

記事

2025年12月16日•2 min read

中国でAIロボット「スマート科学者」110台が実験室の主力として稼働

中国科学技術大学の精密・スマート化学全国重点実験室において、AIと大規模言語モデルを搭載したロボット「スマート科学者」110台が自律的に科学実験を遂行している。[1] 「スマート科学者」は、試薬の配置、サンプルの合成、性能特性評価といった一連の操作を正確に行い、実験データをリアルタイムでスマートオペレーティングシステムに送信する。24時間実験が可能で、論文を読み、プランを考え、経験から学ぶこともできる。第一世代「小来」は1日2000回の

#ロボット#研究自動化#中国

記事論文

arXiv•2025年12月16日•2 min read

ブラックボックスLLMの入力トークン重要度を可視化するDBSA手法を提案

ブラックボックスLLMの各入力トークンが出力にどれだけ影響するかを可視化する「Distribution-Based Sensitivity Analysis（DBSA）」手法を提案する研究論文。[1] DBSAは、LLMの出力分布の変化を統計的に分析することで、各入力トークンの重要度を推定する。従来の勾配ベース手法と異なり、モデル内部へのアクセスを必要とせず、APIエンドポイント経由でも適用可能。LLMが確率的関数であるという特性を活か

#論文#LLM#解釈可能性

記事

2025年12月16日•3 min read

マシュー・マコノヒーがElevenLabsの投資家兼クリエイターとして登場──AI音声でニュースレターを多言語展開

ElevenLabsの初サミットで俳優マシュー・マコノヒー（アカデミー賞受賞）が登場し、同社に数年間投資していたことを明かしました。自身のニュースレター「Lyrics of Livin'」をスペイン語AI音声版として展開すると発表。本人の声を維持したまま多言語でストーリーを届ける事例として、クリエイターエコノミーにおけるAI音声技術の活用可能性を示しています。

#AI音声#ElevenLabs#クリエイターエコノミー

記事論文

arXiv•2025年12月16日•2 min read

オープンウェイトLLMを指示チューニングしてBPMNプロセスモデルを自動生成

自然言語のテキスト記述からBPMN（Business Process Model and Notation）プロセス図を自動生成するための「InstruBPM」手法を提案する研究論文。[1] InstruBPMは、ペア化されたテキスト-ダイアグラムデータを準備し、パラメータ効率の良いファインチューニング（PEFT）と量子化を用いてオープンソースLLMを指示チューニングする。評価では、BLEU、ROUGE-L、METEORなどのテキスト類

#論文#LLM#BPMN

記事公式発表

Manus•2025年12月16日•4 min read

Manus 1.6 Max登場──フラッグシップエージェント、モバイル開発、Design Viewを搭載

AI汎用エージェント「Manus」がバージョン1.6をリリースしました。新しいフラッグシップモデル「Manus 1.6 Max」を投入し、モバイルアプリのエンドツーエンド開発に対応。画像作成用のインタラクティブなDesign Viewも搭載され、ビジュアル編集体験が大幅に向上しています。

#Manus#AIエージェント#モバイル開発

記事論文

arXiv•2025年12月16日•2 min read

マルチエージェントシステムの協調的レジリエンスを人間とLLMで比較評価

マルチエージェントシステムにおける「協調的レジリエンス」（集団の幸福に影響する破壊的イベントを予測・抵抗・回復・変容する能力）を、人間グループとLLMベースエージェントで比較評価する研究論文。[1] Melting Potスイートの「コモンズの悲劇」環境で、明示的コミュニケーションの有無を変えて評価。持続的な非持続可能消費ボットと間欠的な環境ショック（共有リソースの確率的除去）という破壊的条件下で協調的レジリエンスを測定。コミュニケーシ

#論文#マルチエージェント#レジリエンス

記事

2025年12月16日•2 min read

Runwayが世界モデルGWM-1を公開、Gen-4.5にネイティブ音声統合も追加

AI画像・動画生成企業Runwayが、物理法則を理解する世界モデル「GWM-1」を公開。Google DeepMindのGenie-3などと競合する分野に参入。[1] GWM-1はフレームごとの予測を通じて動作し、物理法則と時間経過に伴う世界の振る舞いを理解したシミュレーションを生成する。Runwayは「世界モデルを構築するには、まず本当に優れた動画モデルを構築する必要があった」とし、ピクセル予測が汎用シミュレーションへの正しいアプロー

#動画生成AI#世界モデル#Runway

記事

2025年12月16日•2 min read

ServiceNowがMoveworks買収を完了、エージェントAIとワークフロー統合を加速

ServiceNowがAIエージェントプラットフォームMoveworksの買収を2025年12月15日に完了したことを発表。買収額は28.5億ドル（現金と株式の組み合わせ）。[1] この買収により、ServiceNowのエージェントAIとインテリジェントワークフロー機能が、Moveworksのエンタープライズ検索と推論技術と統合される。従業員が質問、情報検索、タスク完了を会話型インターフェースで自然に行える「AI-native fron

#買収#エンタープライズAI#エージェントAI

記事論文

arXiv•2025年12月16日•2 min read

LLMエージェントの動的ツール生成と経験共有を統合するSMITH認知アーキテクチャ

LLMエージェントが新規タスクに適応する際の課題（ツール不足と経験再利用の困難）を解決するため、動的ツール生成とタスク間経験共有を統合した「SMITH（Shared Memory Integrated Tool Hub）」認知アーキテクチャを提案する研究論文。[1] SMITHはエージェントのメモリを手続き的・意味的・エピソード的の3つのコンポーネントに階層化。ツール生成はサンドボックス環境での反復的コード生成として形式化し、経験共有は

#論文#LLMエージェント#ツール生成

記事

2025年12月16日•2 min read

Vidu Agentがワンクリック動画生成で広告制作を革新

マルチモーダル生成AIのリーダー企業ShengShu Technologyが、ワンクリックでプロ品質の動画を生成する「Vidu Agent」を発表。[1] Vidu Agentは、クリエイティブ企画、ショット構成、自動編集を単一ワークフローに統合。1〜7枚の画像と短い説明を入力するだけで、15〜30秒の完成動画を約3分で生成。スクリプト生成は約1分で完了。2つ・3つのビュー参照を認識し、製品の特徴や被写体のアイデンティティを動画全体で一

#動画生成AI#広告制作#ワンクリック

記事

2025年12月15日•2 min read

AI画像認識で落とし物を横断検索、複数企業間の連携サービスが開始

スタートアップ「find」がAI画像認識を活用した落とし物検索サービスを開始。京浜急行・羽田空港など6社で横断検索が可能になり、2026年4月にはJR東日本も参加予定。

#AI活用#画像認識#社会実装

記事

2025年12月15日•3 min read

ElevenLabs音声クローンでAIポッドキャストが急増、信頼性の課題も浮上

ElevenLabsやHume AIの音声クローン技術でAIポッドキャストが急増。Inception Point AIは20万エピソードを制作し、1話1ドルで40万購読者を獲得。一方、信頼性や透明性への懸念も議論されている。

#音声AI#ポッドキャスト#ElevenLabs

記事

2025年12月15日•2 min read

BeamがVeo 3.1搭載の「playable video」プラットフォームを発表、動画をゲーム化

Phaser StudioのBeamがGoogleのVeo 3.1を活用した「playable video」プラットフォームを発表。生成AI動画をノーコードでミニゲームや分岐ストーリーに変換し、ブラウザ上で公開可能に。

#生成AI#動画生成#インタラクティブ

記事

2025年12月15日•3 min read

ドイツAI企業Black Forest LabsがシリーズBで3億ドル調達、評価額32.5億ドルに

Stable Diffusion開発者が創業したドイツのBlack Forest LabsがシリーズBで3億ドルを調達。評価額32.5億ドルとなり、画像生成AI「Flux」シリーズでGoogleに対抗する構え。

#生成AI#資金調達#ドイツ

記事

2025年12月15日•3 min read

Dify v1.11.1でマルチモーダルナレッジベースが正式公開——画像ベクトル化とクロスモーダル検索に対応

Dify v1.11.1で画像ベクトル化とクロスモーダル検索に対応したマルチモーダルナレッジベースが正式公開。テキストから画像、画像からテキスト、画像から画像の検索が可能に。RAGの活用範囲が拡大。

#Dify#RAG#マルチモーダル

記事

2025年12月15日•2 min read

自動配送ロボット「Hakobot」が工場間公道で実証実験、最大100kg搬送に対応

神奈川県が自動配送ロボット「Hakobot」を使った工場間公道実証実験を発表。最大100kg搬送可能な四輪駆動設計で、2026年1月から横浜市金沢区で実施。従業員の業務効率化と安全性向上を検証。

#配送ロボット#自動搬送#公道実証

記事公式発表

Higgsfield•2025年12月15日•2 min read

HiggsfieldがNano Banana Pro Inpaintなど新編集機能を発表、AI画像編集を強化

Higgsfieldが「Nano Banana Pro Inpaint」など新機能を発表。構造を保持しながら高精度な画像編集を実現するAIエンジンで、シームレスな合成とゼロ歪みを特長とする。

#画像生成#Nano Banana Pro#インペイント

記事

2025年12月15日•3 min read

川崎重工「Kaleido 9」を2025国際ロボット展で初公開──AI強化学習で進化する次世代ヒューマノイド

川崎重工が2025国際ロボット展でヒューマノイドロボット「Kaleido 9」を初公開しました。2015年開発開始から第9世代となり、シミュレーション上で数千体を同時に動作させるAI強化学習を採用。3D環境認識、多言語対話にも対応し、工場でのロボット指揮、家庭での庭掃除、災害現場での救助活動を実演しました。

#ヒューマノイド#ロボット#AI強化学習

記事

2025年12月15日•3 min read

Liberawareが沖縄初の雨水管内ドローン点検デモ実施──「IBIS2」で狭小空間の安全点検を実証

Liberawareと九電ドローンサービスが那覇市上下水道局の協力で、沖縄県初となるドローン「IBIS2」による雨水管内部のデモ飛行を実施しました。外形194mm×198mm・重量243gの世界最小級ドローンで、人が立ち入れない狭小空間の点検を実証。3次元データ計測システム「SEAMS」と連携し、地上・地下一体の3Dモデル作成にも成功しました。

#ドローン#インフラ点検#狭小空間

記事

2025年12月15日•3 min read

MetaがElevenLabsと提携、InstagramやHorizonにAI音声機能を統合

MetaがElevenLabsと連携し、InstagramやHorizonにAI音声機能を統合。Reelsの多言語吹替、音楽生成、VRキャラクターボイスなどを強化。70言語以上・1.1万種類の音声ライブラリを活用。

#Meta#ElevenLabs#音声AI

記事

2025年12月15日•3 min read

n8nがChat Hubベータを公開——チャット画面からワークフロー・エージェント・複数AIモデルを一元操作

n8n 2.1.0ベータでChat Hub機能が公開。単一のチャットインターフェースからワークフロー実行、独自エージェント呼び出し、複数AIモデル利用をまとめて操作可能に。チャット専用ロールで利用者管理も実現。

#n8n#Chat Hub#ワークフロー自動化

記事公式発表

NVIDIA•2025年12月15日•4 min read

NVIDIA、オープンモデル「Nemotron 3」ファミリーを発表──Nano・Super・Ultraの3構成で展開

NVIDIAがオープンモデル「Nemotron 3」ファミリーを発表しました。Nano・Super・Ultraの3サイズで提供され、Nemotron 3 NanoはHugging Face、Baseten、Fireworks、Together AIなど複数の推論サービスから即日利用可能。SuperとUltraは2026年前半に公開予定です。

#NVIDIA#オープンモデル#LLM

記事

2025年12月15日•3 min read

OpenAI、元Google幹部をコーポレート開発VP に採用──M&A・戦略投資を強化

OpenAIが元Googleシニアディレクターのアルバート・リー氏をコーポレート開発担当VPに採用しました。約14年間GoogleでクラウドやデepMind部門のM&A・戦略投資を主導し、60件以上・500億ドル超の取引実績を持つ人物です。CFOのサラ・フライアー直属で、OpenAIの買収・投資戦略を統括します。

#人事#M&A#企業戦略

記事

2025年12月15日•3 min read

札幌市で除雪ロボット「Yarbo」実証試験が開始──人手不足に挑む自動化の新たな一歩

北海道札幌市で米国製除雪ロボット「Yarbo」の実証試験が始まりました。株式会社QYURUと開北工業が共同で実施し、積雪環境下での走行性能・投雪能力・運用性を評価します。Yarboは米国で1万台以上の納入実績を持ち、2025年12月から国内販売を開始。深刻化する除雪人手不足の解決策として注目されています。

#Physical AI#ロボット#除雪

記事

2025年12月15日•3 min read

SCSKがアパレルEC向けAI画像生成サービス「MIM for Business」を提供開始──1枚の商品画像から多彩な着用イメージを生成

SCSKが法人向け画像生成サービス「MIM for Business」を2025年12月より提供開始しました。1枚の商品画像からAIモデルによる着用イメージを自動生成でき、身長・体重・年齢・人種・性別・ポーズ・背景を自由に設定可能。従来のモデル撮影では対応困難だった少量生産品や小物の着用画像を安価かつ即日で生成できます。

#画像生成AI#アパレル#EC

記事

2025年12月15日•3 min read

中国・深圳が世界初の「ロボットフレンドリー」デモゾーン構築を発表

中国・深圳市が世界初となる「ロボットフレンドリー」デモゾーンの構築計画を発表。広東省は2024年にロボット産業で全国トップの生産シェアを維持し、2025年末には約1万台のヒューマノイドロボット導入を見込む。

#ロボティクス#中国#ヒューマノイド

記事

2025年12月15日•2 min read

トランプ大統領がAI規制の州別制定を禁止する大統領令に署名

トランプ大統領が州ごとのAI規制を禁止し連邦レベルで統一する大統領令に署名。コロラド州のAI法を名指しで批判し、同州は法廷闘争も視野に入れている。

#AI規制#米国政策#大統領令