1. これは何の話?

ByteDance(バイトダンス)のAIプラットフォーム「Dreamina」にて、最新の動画生成モデル 「Seedance 2.0」 の利用ガイドが公開されました。
公式ガイドによると、テキスト、画像、音声、動画を最大12個まで組み合わせるマルチモーダル入力に対応しています。また、ビデオや画像を参照素材(Reference)として使用する機能も紹介されています。
2. 何がわかったか

公式チュートリアル[1]で解説されている主な仕様は以下の通りです。
- マルチモーダル入力: 1プロジェクトにつき最大12クリップ(画像9枚、動画3本、音声3本)まで参照可能。ただし、動画・音声素材は 各15秒まで という制限があります。
- 同期音声の生成: 映像の生成と同時に、同期した音声やサウンドトラック(synced audio and soundtracks)を生成する機能があります。
- 詳細設定: タイミング、ペーシング、エフェクト(timing, pacing, and effects)の調整が可能と記載されています。
- マルチカメラ・ナラティブフロー: ストーリーラインの生成や動画の続きを生成する際、キャラクターや環境の一貫性を保つ機能があります。
3. その他の特徴
ガイドでは、「Dreamina」プラットフォーム上での機能統合 についても触れられています。
- 統合された環境: Seedance 2.0は「Dreamina」プラットフォーム内で利用でき、入力素材のアップロードから生成までを一貫して行えます。
- 音声の同時生成: 前述の通り、映像生成の段階で音声が含まれる点が特徴の一つとして挙げられています。
4. 利用にあたって

Seedance 2.0は、複数の入力素材(マルチモーダル入力)を組み合わせて動画を生成するモデルです。
公式ガイドでは、テキスト、画像、音声、動画といった複数の素材を組み合わせる手順が解説されています。
5. 今後の展開
公式ガイド内では、各機能の利用方法がステップごとに解説されています。
6. どう考え、どう動くか

まずはDreaminaの公式ガイドを確認し、仕様を正しく理解することが重要です。
- 今日やること: 公式ガイド(How To Use Seedance 2.0)を確認し、各パラメータの意味や入力制限を把握する。
- 今週やること: Dreamina上で実際に機能を試し、ガイド通りの挙動を確認する。
7. 限界と未確定
- 現在の制約: ガイドによると、入力する動画・音声素材は「各15秒まで」という制限があり、長尺素材をそのまま読み込ませることはできません。
- 生成の一貫性: マルチショット生成における一貫性の維持については、入力素材やプロンプトの影響を受ける可能性があります。
8. 用語ミニ解説
マルチモーダル(Multimodal) テキスト、画像、音声など、種類の異なる複数のデータを組み合わせて扱うこと。
9. 出典と日付
Dreamina (2026-02-09): https://dreamina.capcut.com/resource/how-to-use-seedance-2-0


