Seed Audio 1.0
Seed Audio 1.0 波形コントロールルームのビジュアル
再生可能なSeed Audioの例と再利用可能なプロンプト

テスト済みプロンプトと再生可能な結果でSeed Audio 1.0を使う方法

このガイドでは、実際のSeed Audio 1.0の実行結果を使用して、プロンプトの構造が出力をどのように変えるかを示します。クリップを聴き、プロンプトをコピーし、ノートを活用して独自のオーディオシーンを構築してください。

8

再生可能な例

20-30s

例の長さ

24 kHz

MP3プレビュー

4

プロンプトレイヤー

簡潔な回答

最も信頼性の高いプロンプトは、コンパクトなシーンブリーフから始まります。

一般的な音声を要求する代わりに、オーディオディレクターのように出力を説明してください:誰が話すか、シーンがどこで起こるか、声のトーン、存在するアンビエンス、それを支えるBGM、発生するサウンドイベント。

以下の例は意図的に実用的です。会話、ポッドキャスト、ゲームのアンビエンス、オーディオブックのナレーション、教育、ソーシャルビデオ、ウェルネス、博物館ガイドのユースケースをカバーしています。

結果例

確認できる8つのSeed Audio 1.0の例。

各カードには、オーディオプレビュー、正確なプロンプト、独自のシーンを作成する際に使用できる実用的なノートが含まれています。

雨に濡れた路地に二人の刑事がいるシネマティックな会話の例
例 1: 会話 + アンビエンス + サウンドイベント

雨の路地でのシネマティックな会話

短編映画のプレビジュアライゼーション、ラジオドラマ、ストーリーボード

オーディオ

20s

作成日時

23.3s

オーディオプレビュー

プロンプト

Create a 20-second cinematic audio scene in English: two detectives whisper in a rain-soaked alley at midnight. Add distant traffic, soft thunder, wet footsteps, a low suspense pad, and a metal door slam at the end. Keep the dialogue clear and natural.

この例が示すもの

これは、Seed Audioを単なるテキスト読み上げツールではなくシーンジェネレーターとして説明するのに最適な例です。

  • 設定、話し方のスタイル、アンビエンス、音楽レイヤー、最後のサウンドイベントを指定します。
  • 会話の指示は短く保ち、アンビエンスが現れる余地を残します。
  • 単一の順序付けられた効果音キューは、長いサウンドリストよりも効果的な場合があります。
ウェルカムセグメントの例として、マイクが置かれた温かみのあるポッドキャストスタジオ
例 2: ナレーション+スタジオトーン+イントロBGM

ポッドキャストウェルカムセグメント

ポッドキャストのイントロ、ブランド説明動画、YouTubeナレーション

オーディオ

20s

作成日時

23.3s

オーディオプレビュー

プロンプト

Create a 20-second podcast welcome segment in English for a calm creativity show. Use one warm host voice, light studio room tone, a soft synth bed, and a clean broadcast-style ending. Keep the speech friendly, natural, and easy to understand.

この例が示すもの

このプロンプトは、シンプルな役割、明確な話し方、限定された番組形式を使用しているため効果的です。

  • 声の明瞭さが重要な場合は、1人の話者を使用します。
  • 部屋のトーンと音楽BGMは別々に指定します。
  • クリップをタイムラインに編集する場合は、クリーンなエンディングを依頼します。
ゲームのアンビエンス例として、月明かりに照らされたファンタジーの森
例 3: 無音声アンビエンスループ

ゲームの森のアンビエンス

ゲームプロトタイプ、XRシーン、背景雰囲気

オーディオ

20s

作成日時

25.6s

オーディオプレビュー

プロンプト

Create a 20-second looping fantasy game ambience with no speech. Use night forest insects, soft wind through leaves, distant owls, faint magical shimmer, and one small branch snap near the middle. Keep the loop calm and usable in a game scene.

この例が示すもの

無音声の制約は、ナレーション付きシーンではなくアンビエンスBGMが必要な場合に便利です。

  • 純粋なアンビエンスが必要な場合は「no speech」と指定します。
  • ループの目的を説明することで、出力が劇的になりすぎるのを防ぎます。
  • タイミング制御をテストするために、中央に小さなイベントを1つ配置します。
オーディオブックナレーションの例として、日の出時の静かな電車の車両
例 4: ナレーション+控えめな環境音

オーディオブックナレーション

オーディオブック、ストーリーサンプル、音声方向テスト

オーディオ

20s

作成日時

22.7s

オーディオプレビュー

プロンプト

Create a 20-second audiobook narration in English with one clear narrator. The scene is a quiet train ride at sunrise. Add very subtle carriage room tone and soft rail rhythm, but keep the voice intimate, steady, and easy to hear.

この例が示すもの

この形式は、背景のテクスチャが声の明瞭さと競合するかどうかをテストするのに適しています。

  • ナレーションが主役の場合は、アンビエンスに「subtle」を使用します。
  • 完全なプロットではなく、1つの物理的なシーンの手がかりを与えます。
  • 劇的な演技が不要な場合は、安定した話し方を依頼します。
教育用解説動画の例として、教室での音響デモンストレーションのセットアップ
例 5: 教師の声+デモンストレーション音

教育用解説動画

学習コンテンツ、教室でのデモ、マイクロコース

オーディオ

20s

作成日時

23.5s

オーディオプレビュー

プロンプト

Create a 20-second educational explainer in English for students. A friendly teacher voice explains that sound is vibration moving through air, water, or solid objects. Add light classroom ambience and two gentle demonstration tones.

この例が示すもの

明確な指導的役割と2つのデモンストレーショントーンにより、出力の評価が容易になります。

  • 指導的役割と対象者レベルを明記します。
  • デモ音の数を少数に制限します。
  • 刺激的な効果音を避けたい場合は「gentle」を使用します。
短尺ソーシャルビデオのオーディオ例として、日の出前の小さなパン屋
例 6: ナレーション+生活音フォーリー+音楽キュー

短尺ソーシャルビデオストーリー

短尺動画、クリエイター広告、プロダクトストーリーテリング

オーディオ

30s

作成日時

26.5s

オーディオプレビュー

プロンプト

Create a 20-second short-video audio scene in English about a small bakery opening before sunrise. Include a gentle narrator, espresso machine steam, trays sliding into an oven, soft morning street ambience, and an uplifting acoustic music cue.

この例が示すもの

この出力は約30秒になり、時間指定がおおよその目安であることを示す有益な証拠となりました。

  • シーンが豊富なプロンプトは、要求された長さを超える可能性があります。
  • よりタイトなクリップが必要な場合は、フォーリーイベントを減らします。
  • 最も重要な音を最初に配置します。
落ち着いたウェルネスルームと瞑想ベルのある、リラックスできるアプリオーディオの例
例 7: 落ち着いたガイド+パッド+ベル

ウェルネスアプリ瞑想

瞑想アプリ、呼吸法エクササイズ、ウェルネスプロトタイプ

オーディオ

20s

作成日時

22.3s

オーディオプレビュー

プロンプト

Create a 20-second wellness app audio in English. Use a calm guide voice, soft breathing pace, quiet room tone, warm ambient pad, and a gentle bell at the end. Keep the result relaxing, minimal, and clean.

この例が示すもの

最小限のプロンプト形状により、雰囲気が映画的になりすぎるのを防ぎます。

  • アプリUIオーディオには最小限でクリーンなものを使用します。
  • ベルなどの終了マーカーを1つ追加します。
  • 音楽の形容詞を積み重ねすぎないようにします。
オーディオガイドの例として、陶器の花瓶がある静かなミュージアムギャラリー
例 8: ガイド音声+公共スペースのルームトーン

ミュージアムオーディオガイド

観光、ミュージアムアプリ、位置情報ベースのオーディオ

オーディオ

30s

作成日時

26.4s

オーディオプレビュー

プロンプト

Create a 20-second museum audio guide in English. Use a clear narrator describing a restored ceramic vase in a quiet gallery. Add subtle gallery room tone, distant footsteps, and a refined calm delivery suitable for visitors.

この例が示すもの

ベーカリーのサンプルと同様に、要求よりも長いクリップが返されたため、長さ計画の良い例です。

  • 訪問者向けのプロンプトは、洗練された落ち着いた配信の手がかりが効果的です。
  • 公共スペースの雰囲気は遠くて控えめにする必要があります。
  • 正確なタイミングが重要な場合は、結果をトリミングする計画を立てます。

プロンプトパターン

キーワードリストではなく、シーンの概要を使用します。

テストで最も強力なプロンプトは、同じコンパクトな構造に従っていました。

1. 出力タイプ

フォーマットを指定します:ポッドキャストイントロ、オーディオブックナレーション、アンビエンスループ、ミュージアムガイド、または映画シーン。

2. 音声ディレクション

話者数、トーン、ペース、必要な場合のみアクセント、明瞭度の優先順位を定義します。

3. 音響設定

ルームトーン、天候、群衆、通り、車両、ギャラリー、教室、その他の雰囲気を説明します。

4. 音楽とイベントの手がかり

1つの音楽背景と1〜3つのサウンドイベントを追加します。最も重要なイベントを最初に配置します。

ワークフロー

独自のSeed Audio 1.0テストを実行する方法。

最初の生成を診断パスとして扱います。一度に1つの問題を聞き、プロンプトを修正します。

1

テキストのみで開始

15〜25秒のターゲットを使用し、ベースシーンが機能するまで参照ファイルを避けます。

2

最大の問題を聞く

音声の明瞭度、アンビエンスのバランス、音楽の強度、イベントのタイミングを個別に確認します。

3

1つのレイヤーを書き直す

再実行する前に、話者、アンビエンス、音楽、または効果のレイヤーのみを変更します。

4

最終クリップを準備する

最良のドラフトをダウンロードし、正確なタイミングにトリミングし、プロンプトを再利用可能なレシピとして保持します。

失敗原因の確認

生成が失敗する主な原因。

生成が失敗した場合は、まず参照音声の長さ、プロンプトの安全性、保護された実在人物名やキャラクター名を使っていないかを確認してください。

アップロード音声が30秒を超えている

参照音声のアップロードは30秒以下にしてください。長い音声はアップロード前にトリミングしてください。

プロンプトに不適切な内容が含まれている

性的、露骨、暴力的、またはグロテスクな内容は避けてください。これらのリクエストは生成前にブロックされる場合があります。

人物名または保護されたキャラクター名

特定の実在人物、公人、有名人、政治家、または保護されたキャラクターの名前は使用しないでください。代わりに一般的な役割として説明してください。

FAQ

実用的なSeed Audio 1.0の質問。

Seed Audio 1.0 の生成が失敗するのはなぜですか?

失敗の多くは、入力条件またはコンテンツルールに関係します。参照音声が30秒を超えている、プロンプトに性的・露骨・暴力的・グロテスクな内容が含まれている、または特定の実在人物、公人、有名人、政治家、保護されたキャラクターの名前を使っている場合です。参照音声は30秒以内に切り、プロンプトは安全な場面説明にし、具体名ではなく一般的な役割で表現してください。

Seed Audio 1.0を使い始める最良の方法は?

話者、設定、声のスタイル、雰囲気、音楽レイヤー、1つまたは2つのサウンドイベントを指定した短いシーンプロンプトから始めてください。その後、明瞭さを確認してから複雑さを追加してください。

Seed Audio 1.0は音声以外も生成できますか?

はい。これらのテストでは、ナレーション、雰囲気、音楽ベッド、フォーリー風効果、イベントキューなど、完全なサウンドシーンを1つのプロンプトで生成するのに有用でした。

指定した長さと出力の長さは常に一致しますか?

常にではありません。長さは目安として扱い、正確なタイミングが必要な場合は最終クリップをトリミングしてください。

出力がうるさすぎる場合はどうすればよいですか?

サウンドレイヤーの数を減らしてください。話者、1つの雰囲気ベッド、1つの音楽方向、1つまたは2つのサウンドイベントに抑えてください。

まずリファレンス音声を使うべきですか、それともテキストのみのプロンプトを使うべきですか?

モデルを学習している間は、まずテキストのみのプロンプトを使用してください。保持したい声、雰囲気、ペースがわかった後にのみリファレンス音声を追加してください。

最初のシネマティックオーディオを生成する準備はできましたか?

テスト済みのプロンプトから始めて、シーンを適応させてください。

例をコピーし、設定と声の方向を変更し、リファレンスファイルや長いシーンの詳細を追加する前に短いドラフトを実行してください。

Seed Audioを試す