可播放的 Seed Audio 範例與可重複使用的提示詞

如何使用 Seed Audio 1.0：經過測試的提示詞與可播放的結果

本指南使用真實的 Seed Audio 1.0 運行結果，展示提示詞結構如何改變輸出。聆聽音檔、複製提示詞，並利用備註建立自己的音訊場景。

聆聽測試範例開啟生成器

可播放範例

20-30s

範例長度

24 kHz

MP3 預覽

提示詞層次

簡短回答

最可靠的提示詞始於簡潔的場景描述。

與其要求通用的語音，不如像音訊導演一樣描述輸出：誰在說話、場景在哪裡、語調如何、環境音是什麼、支援的音樂背景為何、以及應該發生什麼聲音事件。

以下範例刻意設計得實用，涵蓋對話、播客、遊戲環境音、有聲書旁白、教育、社群影片、健康與博物館導覽等使用案例。

範例結果

八個可供檢視的 Seed Audio 1.0 範例。

每張卡片包含音訊預覽、確切提示詞，以及撰寫自己場景時可用的實用備註。

範例 1：對話 + 環境音 + 聲音事件

雨巷中的電影對話

短片預視、廣播劇、分鏡腳本

音訊

20s

建立於

23.3s

音訊預覽

提示詞

Create a 20-second cinematic audio scene in English: two detectives whisper in a rain-soaked alley at midnight. Add distant traffic, soft thunder, wet footsteps, a low suspense pad, and a metal door slam at the end. Keep the dialogue clear and natural.

此範例展示

這是說明 Seed Audio 作為場景生成器而非純文字轉語音工具的最佳範例。

指定場景、說話風格、環境音、音樂層與最終聲音事件。
對話指示保持簡短，讓環境音有空間呈現。
單一有序的音效提示，效果可能比一長串音效清單更好。

範例 2：旁白 + 錄音室氛圍 + 開場背景音樂

Podcast 開場片段

Podcast 開場、品牌介紹影片、YouTube 旁白

音訊

20s

建立於

23.3s

音訊預覽

提示詞

Create a 20-second podcast welcome segment in English for a calm creativity show. Use one warm host voice, light studio room tone, a soft synth bed, and a clean broadcast-style ending. Keep the speech friendly, natural, and easy to understand.

此範例展示

這個提示之所以有效，是因為它使用了簡單的角色、清晰的表達風格，以及狹義的節目形式。

當語音清晰度很重要時，使用單一說話者。
分別提及房間氛圍和背景音樂。
當片段將被編輯到時間軸時，要求乾淨的結尾。

範例 3：無語音氛圍循環

遊戲森林氛圍

遊戲原型、XR 場景、背景氛圍

音訊

20s

建立於

25.6s

音訊預覽

提示詞

Create a 20-second looping fantasy game ambience with no speech. Use night forest insects, soft wind through leaves, distant owls, faint magical shimmer, and one small branch snap near the middle. Keep the loop calm and usable in a game scene.

此範例展示

當你想要的是氛圍背景而非敘事場景時，無語音的限制非常有用。

當你想要純粹的氛圍時，指定無語音。
描述循環的目的，讓輸出保持較少戲劇性。
在中間放置一個小事件，以測試時間控制。

範例 4：旁白 + 微妙環境音

有聲書旁白

有聲書、故事樣本、語音方向測試

音訊

20s

建立於

22.7s

音訊預覽

提示詞

Create a 20-second audiobook narration in English with one clear narrator. The scene is a quiet train ride at sunrise. Add very subtle carriage room tone and soft rail rhythm, but keep the voice intimate, steady, and easy to hear.

此範例展示

這種格式適合測試背景質感是否會影響語音清晰度。

當旁白是主要產品時，使用微妙的氛圍。
給出一個物理場景提示，而不是完整情節。
當你不想要戲劇化表演時，要求平穩的表達。

範例 5：教師語音 + 示範音效

教育解說影片

學習內容、課堂示範、微課程

音訊

20s

建立於

23.5s

音訊預覽

提示詞

Create a 20-second educational explainer in English for students. A friendly teacher voice explains that sound is vibration moving through air, water, or solid objects. Add light classroom ambience and two gentle demonstration tones.

此範例展示

清晰的教學角色加上兩個示範音調，讓輸出更容易評估。

說明教學角色和聽眾程度。
將示範音效限制在少量。
如果你不想要刺耳的效果，使用柔和。

範例 6：旁白 + 生活環境音 + 音樂提示

短影音社交媒體故事

短影音、創作者廣告、產品故事

音訊

30s

建立於

26.5s

音訊預覽

提示詞

Create a 20-second short-video audio scene in English about a small bakery opening before sunrise. Include a gentle narrator, espresso machine steam, trays sliding into an oven, soft morning street ambience, and an uplifting acoustic music cue.

此範例展示

這個輸出回來的長度接近30秒，這是有用的證據，顯示時長指示是近似值。

場景豐富的提示可能會超出要求的長度。
如果你需要更緊湊的片段，使用較少的環境音事件。
將最重要的聲音放在最前面。

範例 7：平靜引導 + 墊音 + 鈴聲

健康應用程式冥想

冥想應用程式、呼吸練習、健康原型

音訊

20s

建立於

22.3s

音訊預覽

提示詞

Create a 20-second wellness app audio in English. Use a calm guide voice, soft breathing pace, quiet room tone, warm ambient pad, and a gentle bell at the end. Keep the result relaxing, minimal, and clean.

此範例展示

簡潔的提示形狀有助於避免背景音變得太過電影感。

為應用程式 UI 音訊使用簡約乾淨的風格。
加入一個結束標記，例如鈴聲。
避免堆疊過多音樂形容詞。

範例 8：導覽語音 + 公共空間環境音

博物館語音導覽

旅遊、博物館應用程式、基於位置的音訊

音訊

30s

建立於

26.4s

音訊預覽

提示詞

Create a 20-second museum audio guide in English. Use a clear narrator describing a restored ceramic vase in a quiet gallery. Add subtle gallery room tone, distant footsteps, and a refined calm delivery suitable for visitors.

此範例展示

如同烘焙範例，此結果回傳的片段比要求的長，因此是規劃時長的好例子。

面向訪客的提示受益於精緻且平靜的傳達線索。
公共空間的環境音應保持距離且細微。
當時間精確要求時，計劃修剪結果。

提示模式

使用場景簡報，而非關鍵字列表。

測試中最強的提示遵循相同的簡潔結構。

1. 輸出類型

命名格式：播客開場、有聲書旁白、環境音循環、博物館導覽或電影場景。

2. 語音方向

定義說話者人數、語氣、節奏、僅在需要時指定口音，以及清晰度優先。

3. 聲學設定

描述房間環境音、天氣、人群、街道、車輛、畫廊、教室或其他環境。

4. 音樂與事件提示

加入一個音樂背景和一至三個聲音事件。將最重要的事件放在前面。

工作流程

如何執行你自己的 Seed Audio 1.0 測試。

將第一次生成視為診斷通行。一次只聽一個問題，然後修改提示。

從純文字開始

使用 15 到 25 秒的目標，在基礎場景運作前避免參考檔案。

聆聽最大的問題

分別檢查語音清晰度、環境音平衡、音樂強度和事件時機。

重寫一個層

在重新執行前，僅更改說話者、環境音、音樂或效果層。

準備最終片段

下載最佳草稿，修剪精確時長，並保留提示作為可重複使用的配方。

失敗原因排查

常見生成失敗原因。

如果生成失敗，先檢查參考音訊長度、提示詞安全性，以及提示詞中是否使用了受保護的真實人物或角色名稱。

上傳音訊超過 30 秒

參考音訊上傳長度不能超過 30 秒。超過 30 秒會導致失敗，請先裁剪後再上傳。

提示詞包含不安全內容

避免色情、露骨、暴力或血腥內容。這類請求可能會在生成前被攔截。

使用了受保護的人物或角色名稱

不要使用具體真實人物、公眾人物、明星、政治人物或受保護角色的姓名。可以改用通用角色描述。

常見問題

實用的 Seed Audio 1.0 問題。

為什麼我的 Seed Audio 1.0 生成會失敗？

常見原因通常是輸入或內容規則不符合要求：參考音訊上傳超過 30 秒；提示詞包含色情、露骨、暴力或血腥內容；或者提示詞中使用了具體真實人物、公眾人物、明星、政治人物或受保護角色的姓名。建議先把參考音訊裁剪到 30 秒以內，把提示詞改成安全的場景描述，並用通用身分描述替代具體姓名。

開始使用 Seed Audio 1.0 的最佳方式是什麼？

從一個簡短的場景提示開始，描述說話者、設定、語音風格、環境音、音樂層，以及一兩個音效事件。先聆聽清晰度，再增加複雜度。

Seed Audio 1.0 能生成除了語音以外的內容嗎？

可以。在這些測試中，它對於完整的聲音場景很有用：旁白、環境音、音樂背景、擬音效果，以及事件提示，全部在一個提示中完成。

請求的時長是否總是與輸出時長相符？

不一定。將時長視為指導方針，並在需要精確時間時修剪最終片段。

如果輸出聽起來太雜亂，該怎麼辦？

減少聲音層的數量。保留說話者、一個環境音背景、一個音樂方向，以及一兩個音效事件。

應該先使用參考音訊還是純文字提示？

在學習模型時，先使用純文字提示。只有在確定要保留哪種聲音、環境音或節奏後，再加入參考音訊。

準備好生成你的第一個電影級音訊了嗎？

從一個經過測試的提示開始，然後調整場景。

複製一個範例，更改設定和語音方向，在加入參考檔案或更長的場景細節之前，先執行一個簡短的草稿。

試用 Seed Audio