
記事公式発表
Meta••3 min read
Meta「SAM Audio」発表―テキスト・映像・時間指定で音声を自在に分離
Metaが音声セグメンテーションモデル「SAM Audio」を発表し、オープンソース公開しました。複雑な音声ミックスから「犬の鳴き声」「歌声」などをテキスト指定で分離したり、映像中の人物をクリックしてその音声だけを抽出したりできます。業界初の時間スパン指定機能も搭載し、Segment Anything Playgroundで試用可能です。
#音声AI#オープンソース#Meta