記事2025年12月17日 00:00公式発表#音声AI#オープンソース#Meta

Meta「SAM Audio」発表―テキスト・映像・時間指定で音声を自在に分離

Metaが音声セグメンテーションモデル「SAM Audio」を発表し、オープンソース公開しました。複雑な音声ミックスから「犬の鳴き声」「歌声」などをテキスト指定で分離したり、映像中の人物をクリックしてその音声だけを抽出したりできます。業界初の時間スパン指定機能も搭載し、Segment Anything Playgroundで試用可能です。

要点まとめ

📌 この記事のポイント

1テキスト・映像・時間スパンの3種類プロンプトに対応
2複雑な音声ミックスから特定の音を分離可能
3Segment Anything PlaygroundとGitHubで公開
4音楽・ポッドキャスト・映像制作への応用を想定

Meta「SAM Audio」発表―テキスト・映像・時間指定で音声を自在に分離のサムネイル

https://about.fb.com/news/2025/12/our-new-sam-audio-model-transforms-audio-editing/

1. これは何の話？

Metaが音声セグメンテーションAIモデル「SAM Audio」を発表し、オープンソースとして公開しました。画像セグメンテーションで有名なSegment Anythingシリーズの音声版であり、複雑な音声ミックスから特定の音を直感的に分離できます。

このモデルは、人間が自然に音を認識する方法を模倣した設計になっています。「犬の鳴き声を消して」「このバンド映像からギターだけ抽出して」といった操作を、専門的な編集スキルなしで実行可能にします。

2. 何がわかったか

SAM Audioは3種類のプロンプト方式をサポートしています。1つ目はテキストプロンプトで、「犬の鳴き声」「歌声」などの言葉で抽出したい音を指定します。2つ目は映像プロンプトで、動画中の人物やオブジェクトをクリックするとその発する音だけを分離できます。

3つ目は業界初となる時間スパンプロンプトで、「この時間帯に聞こえる音」を指定して抽出することが可能です。これら3方式は単独でも組み合わせでも使用でき、精密な音声コントロールを実現しています。

3. 他とどう違うのか

従来の音声分離ツールは「ボーカル除去」「ノイズ除去」など単一目的のものが多く、汎用的な分離には複数ツールの併用が必要でした。SAM Audioは統合モデルとして、あらゆる分離シナリオに1つで対応できます。

また、映像との連動やテキスト指示という自然なインターフェースにより、オーディオエンジニアでなくても高度な編集が可能になった点が画期的です。

4. なぜこれが重要か

音楽制作、ポッドキャスト編集、映像制作、アクセシビリティ、科学研究といった幅広い分野でプロレベルの音声編集が民主化されます。特にコンテンツクリエイターにとって、ノイズ除去や特定パートの抽出が格段に容易になります。

Metaは次世代クリエイティブツールの構築にSAM Audioを活用することを明言しており、Instagram Reelsなどへの統合も視野に入っていると考えられます。

5. 未来の展開・戦略性

SAM Audioがオープンソースであることから、サードパーティによる音楽制作ソフトや動画編集ソフトへの統合が進む可能性があります。また、Metaの既存製品（InstagramやWhatsApp）への機能統合も予想されます。

Segment Anythingシリーズは画像、3D、そして今回の音声と拡張を続けており、将来的には動画全体（映像＋音声）をシームレスに操作できる統合AIへと発展するかもしれません。

6. どう考え、どう動くか

例えば、屋外撮影した動画から風切り音や交通音を除去したいVloggerにとって、SAM Audioは強力なツールになります。

指針：

Segment Anything Playgroundで実際に音声分離を試してみる。
自分のワークフロー（ポッドキャスト編集など）への組み込み可能性を検討する。
GitHubからモデルをダウンロードしてローカル環境で性能を検証する。

次の一歩：

今日やること：Segment Anything Playgroundにアクセスし、サンプル音声で分離を試す。
今週やること：自分のプロジェクト素材でノイズ除去や音声抽出を実験する。

7. 限界と未確定

複雑な音声ミックスでの分離精度の限界は未詳細公開。
リアルタイム処理への対応可否は不明。
商用製品への組み込み時のライセンス条件は要確認。

8. 用語ミニ解説

音声データを意味のある単位（声、楽器、環境音など）に分割すること。（音声セグメンテーション / audio segmentation）

9. 出典と日付

Meta Newsroom（公開日：2025-12-16）：https://about.fb.com/news/2025/12/our-new-sam-audio-model-transforms-audio-editing/

関連メモで深掘り

テーマやツールが近い投稿をピックアップしました。

Meta の最近の動き

同じツールに紐づいた投稿から厳選しました。

3月11日4分

MetaがAIエージェント向けSNS「Moltbook」を買収

AIエージェント同士が交流するSNS『Moltbook』をMetaが買収。クリエイターはMeta Superintelligence Labsに合流し、次世代AIエージェントの開発を加速させます。

#AIエージェント#買収

12月20日3分

MetaがMango/Avocadoモデル計画でAI競争再参入へ

MetaがMango/Avocadoモデル計画でAI競争再参入へ. 1. これは何の話？ Metaが「Mango」「Avocado」というコードネームで呼ばれる次世代AIモデルの開発を進行しており、OpenAIやGoogleに対抗するAI競争への再参入を目指しているとの報道がありました。

#Meta#AIモデル

公式

Meta12月18日3分

Metaが動画編集アプリ『Edits』を大幅アップデート：SAM 3によるAIエフェクトやReels連携を追加

Metaが動画編集アプリ『Edits』を大幅アップデート：SAM 3によるAIエフェクトやReels連携を追加. 1. これは何の話？ Metaが提供するスマートフォン向け動画編集アプリ「Edits」に、2025年12月17日付けで大型アップデートが行われました。

#Meta#動画編集

12月15日3分

MetaがElevenLabsと提携、InstagramやHorizonにAI音声機能を統合

MetaがElevenLabsと連携し、InstagramやHorizonにAI音声機能を統合。Reelsの多言語吹替、音楽生成、VRキャラクターボイスなどを強化。70言語以上・1.1万種類の音声ライブラリを活用。

#Meta#ElevenLabs

似ているタグの投稿

タグの重なりが多い投稿をおすすめしています。

3月11日3分

Hume AIが音声生成フレームワーク「TADA」を発表

Hume AIがテキストと音響の双対アライメントを用いた音声生成フレームワークTADAと関連モデル群をHugging Faceで公開しました。

#音声生成#オープンソース

3月5日5分

Google Workspace CLIが公開——Drive・Gmail・CalendarをコマンドラインとAIエージェントから操作

gws（Google Workspace CLI）がOSS公開。Drive・Gmail・CalendarなどWorkspace全APIをコマンド一本で操作でき、AIエージェントスキル100本超・Gemini CLI拡張・MCPサーバーが付属する。

#開発ツール#Google Workspace

3月5日4分

Qwen責任者の林俊旸が退職申請、複数の中核メンバーも離脱——阿里AIの戦略的断層

QwenのOpenSource最前線を担った林俊旸がアリバを退職申請。後任にはGoogleDeepMind出身の周浩が浮上し、阿里AIの戦略転換が急加速している。

#人事#オープンソース

3月3日4分

Claude Code向け広告監査ツール「Claude Ads」が公開――186項目を自動チェック、ネガ候補ワードも30秒で処理

Claude Code向けの無料広告監査スキル『Claude Ads』がOSSで公開。Google・Meta等6プラットフォームを186項目で自動チェックし、MCPでAPIに直接アクセスしてネガティブキーワード設定まで30秒で自動化する。

#Claude Code#広告運用

Journey

キーワードで深掘り

キーワードをクリックして関連記事を探索しましょう

Timeline

次に読む

Meta のタイムラインの流れで前後の記事を辿れます。

Meta→

公式

Metaが動画編集アプリ『Edits』を大幅アップデート：SAM 3によるAIエフェクトやReels連携を追加

12月18日

←

MetaがElevenLabsと提携、InstagramやHorizonにAI音声機能を統合

12月15日

著者Yuji Sakuta

公開日2025年12月17日

検証日2026年4月18日

元の投稿を開く

記事2025年12月17日 00:00公式発表#音声AI#オープンソース#Meta

Meta「SAM Audio」発表―テキスト・映像・時間指定で音声を自在に分離

要点まとめ

📌 この記事のポイント

1テキスト・映像・時間スパンの3種類プロンプトに対応
2複雑な音声ミックスから特定の音を分離可能
3Segment Anything PlaygroundとGitHubで公開
4音楽・ポッドキャスト・映像制作への応用を想定

https://about.fb.com/news/2025/12/our-new-sam-audio-model-transforms-audio-editing/

1. これは何の話？

2. 何がわかったか

3. 他とどう違うのか

4. なぜこれが重要か

Metaは次世代クリエイティブツールの構築にSAM Audioを活用することを明言しており、Instagram Reelsなどへの統合も視野に入っていると考えられます。

5. 未来の展開・戦略性

6. どう考え、どう動くか

例えば、屋外撮影した動画から風切り音や交通音を除去したいVloggerにとって、SAM Audioは強力なツールになります。

指針：

Segment Anything Playgroundで実際に音声分離を試してみる。
自分のワークフロー（ポッドキャスト編集など）への組み込み可能性を検討する。
GitHubからモデルをダウンロードしてローカル環境で性能を検証する。

次の一歩：

今日やること：Segment Anything Playgroundにアクセスし、サンプル音声で分離を試す。
今週やること：自分のプロジェクト素材でノイズ除去や音声抽出を実験する。

7. 限界と未確定

複雑な音声ミックスでの分離精度の限界は未詳細公開。
リアルタイム処理への対応可否は不明。
商用製品への組み込み時のライセンス条件は要確認。

8. 用語ミニ解説

音声データを意味のある単位（声、楽器、環境音など）に分割すること。（音声セグメンテーション / audio segmentation）

9. 出典と日付

Meta Newsroom（公開日：2025-12-16）：https://about.fb.com/news/2025/12/our-new-sam-audio-model-transforms-audio-editing/

キーワードで深掘り

キーワードをクリックして関連記事を探索しましょう

Timeline

次に読む

Meta のタイムラインの流れで前後の記事を辿れます。

Meta→

公式

Metaが動画編集アプリ『Edits』を大幅アップデート：SAM 3によるAIエフェクトやReels連携を追加

12月18日

←

MetaがElevenLabsと提携、InstagramやHorizonにAI音声機能を統合

12月15日

著者Yuji Sakuta

公開日2025年12月17日

検証日2026年4月18日

元の投稿を開く

Meta「SAM Audio」発表―テキスト・映像・時間指定で音声を自在に分離

📌 この記事のポイント

1. これは何の話？

2. 何がわかったか

3. 他とどう違うのか

4. なぜこれが重要か

5. 未来の展開・戦略性

6. どう考え、どう動くか

7. 限界と未確定

8. 用語ミニ解説

9. 出典と日付

関連ツール

関連メモで深掘り

キーワードで深掘り

次に読む

Meta「SAM Audio」発表―テキスト・映像・時間指定で音声を自在に分離

📌 この記事のポイント

1. これは何の話？

2. 何がわかったか

3. 他とどう違うのか

4. なぜこれが重要か

5. 未来の展開・戦略性

6. どう考え、どう動くか

7. 限界と未確定

8. 用語ミニ解説

9. 出典と日付

関連ツール

関連メモで深掘り

キーワードで深掘り

次に読む