Seed Audio 1.0
注册
Seed Audio 1.0 波形控制室视觉图
可播放的 Seed Audio 示例及可复用提示词

如何使用 Seed Audio 1.0:经过测试的提示词与可播放结果

本指南使用真实的 Seed Audio 1.0 运行结果,展示提示词结构如何改变输出。聆听音频片段,复制提示词,并利用说明构建你自己的音频场景。

8

可播放示例

20-30s

示例时长

24 kHz

MP3 预览

4

提示词层次

简要回答

最可靠的提示词始于一个紧凑的场景简述。

不要要求通用的语音,而是像音频导演一样描述输出:谁在说话、场景发生在哪里、声音应该是什么感觉、存在什么环境音、支持什么背景音乐、以及应该发生什么声音事件。

以下示例特意设计为实用型,涵盖对话、播客、游戏环境音、有声书旁白、教育、社交媒体视频、健康养生和博物馆导览等用例。

示例结果

八个可查看的 Seed Audio 1.0 示例。

每张卡片包含音频预览、精确提示词以及可用于编写自己场景的实用说明。

雨巷中两名侦探的电影级对话示例
示例 1:对话 + 环境音 + 声音事件

雨巷中的电影级对话

短片预可视化、广播剧、故事板

音频

20s

创建于

23.3s

音频预览

提示词

Create a 20-second cinematic audio scene in English: two detectives whisper in a rain-soaked alley at midnight. Add distant traffic, soft thunder, wet footsteps, a low suspense pad, and a metal door slam at the end. Keep the dialogue clear and natural.

此示例展示的内容

这是解释 Seed Audio 作为场景生成器而非纯文本转语音工具的最佳示例。

  • 指定场景、说话风格、环境音、音乐层和最终声音事件。
  • 保持对话方向简短,以便环境音有空间出现。
  • 单个有序的音效提示比一长串声音列表更有效。
温暖的播客录音室,配有麦克风,用于开场片段示例
示例 2:旁白 + 录音室音调 + 开场背景音乐

播客开场片段

播客开场、品牌解说、YouTube 旁白

音频

20s

创建于

23.3s

音频预览

提示词

Create a 20-second podcast welcome segment in English for a calm creativity show. Use one warm host voice, light studio room tone, a soft synth bed, and a clean broadcast-style ending. Keep the speech friendly, natural, and easy to understand.

此示例展示的内容

该提示有效,因为它使用了简单的角色、清晰的表达风格和狭窄的节目形式。

  • 当语音清晰度重要时,使用单一说话者。
  • 分别提及房间音调和音乐背景。
  • 当片段将被编辑到时间线时,要求干净的结尾。
月光下的奇幻森林,用于游戏氛围示例
示例 3:无语音氛围循环

游戏森林氛围

游戏原型、XR 场景、背景氛围

音频

20s

创建于

25.6s

音频预览

提示词

Create a 20-second looping fantasy game ambience with no speech. Use night forest insects, soft wind through leaves, distant owls, faint magical shimmer, and one small branch snap near the middle. Keep the loop calm and usable in a game scene.

此示例展示的内容

当你想要氛围背景而非叙述场景时,无语音约束很有用。

  • 当你想要纯氛围时,指定无语音。
  • 描述循环目的,使输出保持较少的戏剧性。
  • 在中间放置一个小事件以测试时间控制。
日出时安静的火车车厢,用于有声书旁白示例
示例 4:旁白 + 微妙环境

有声书旁白

有声书、故事样本、语音方向测试

音频

20s

创建于

22.7s

音频预览

提示词

Create a 20-second audiobook narration in English with one clear narrator. The scene is a quiet train ride at sunrise. Add very subtle carriage room tone and soft rail rhythm, but keep the voice intimate, steady, and easy to hear.

此示例展示的内容

这种格式适合测试背景纹理是否与语音清晰度冲突。

  • 当旁白是产品时,使用微妙的氛围。
  • 给出一个物理场景提示,而非完整情节。
  • 当你不需要戏剧化表演时,要求稳定的表达。
教室声音演示设置,用于教育解说示例
示例 5:教师声音 + 演示音效

教育解说

学习内容、课堂演示、微课程

音频

20s

创建于

23.5s

音频预览

提示词

Create a 20-second educational explainer in English for students. A friendly teacher voice explains that sound is vibration moving through air, water, or solid objects. Add light classroom ambience and two gentle demonstration tones.

此示例展示的内容

清晰的教学角色加上两个演示音调使输出更易于评估。

  • 说明教学角色和受众水平。
  • 将演示音效限制在少量。
  • 如果你不想要刺耳的效果,使用柔和。
日出前的小面包店,用于短视频音频示例
示例 6:旁白 + 生活拟音 + 音乐提示

短视频社交故事

短视频、创作者广告、产品故事讲述

音频

30s

创建于

26.5s

音频预览

提示词

Create a 20-second short-video audio scene in English about a small bakery opening before sunrise. Include a gentle narrator, espresso machine steam, trays sliding into an oven, soft morning street ambience, and an uplifting acoustic music cue.

此示例展示的内容

此输出接近30秒,这证明时长指令是近似的。

  • 场景丰富的提示可能会超出请求的长度。
  • 如果你需要更紧凑的片段,使用更少的拟音事件。
  • 将最重要的声音放在首位。
极简健康室,配有冥想铃,用于平静应用音频示例
示例 7:平静引导 + 垫音 + 铃声

健康应用冥想

冥想应用、呼吸练习、健康原型

音频

20s

创建于

22.3s

音频预览

提示词

Create a 20-second wellness app audio in English. Use a calm guide voice, soft breathing pace, quiet room tone, warm ambient pad, and a gentle bell at the end. Keep the result relaxing, minimal, and clean.

此示例展示的内容

极简提示有助于避免氛围过于电影化。

  • 为应用UI音频使用极简和干净的提示。
  • 添加一个结束标记,例如铃声。
  • 避免堆叠过多音乐形容词。
安静的博物馆画廊,带有一个陶瓷花瓶,作为语音导览示例
示例 8:导览语音 + 公共空间环境音

博物馆语音导览

旅游、博物馆应用、基于位置的音频

音频

30s

创建于

26.4s

音频预览

提示词

Create a 20-second museum audio guide in English. Use a clear narrator describing a restored ceramic vase in a quiet gallery. Add subtle gallery room tone, distant footsteps, and a refined calm delivery suitable for visitors.

此示例展示的内容

与面包店示例类似,此示例返回的片段比请求的更长,因此是时长规划的好例子。

  • 面向访客的提示受益于精致和冷静的交付提示。
  • 公共空间环境音应保持遥远和微妙。
  • 当精确时长重要时,计划修剪结果。

提示模式

使用场景简述,而非关键词列表。

测试中最强的提示遵循相同的紧凑结构。

1. 输出类型

命名格式:播客开场、有声书旁白、环境音循环、博物馆导览或电影场景。

2. 语音指导

定义说话者数量、语气、节奏、口音(仅在需要时)以及清晰度优先级。

3. 声学环境

描述房间氛围、天气、人群、街道、车辆、画廊、教室或其他环境音。

4. 音乐和事件提示

添加一个音乐背景和一至三个声音事件。将最重要的事件放在首位。

工作流程

如何运行你自己的 Seed Audio 1.0 测试。

将第一次生成视为诊断性测试。每次只关注一个问题,然后修改提示。

1

从纯文本开始

使用15到25秒的目标时长,在基础场景工作之前避免使用参考文件。

2

听取最大问题

分别检查语音清晰度、环境音平衡、音乐强度和事件时机。

3

重写一个层

在重新运行前,仅更改说话者、环境音、音乐或效果层。

4

准备最终片段

下载最佳草稿,修剪精确时长,并将提示保存为可重复使用的配方。

失败原因排查

常见生成失败原因。

如果生成失败,先检查参考音频时长、提示词安全性,以及提示词中是否使用了受保护的真实人物或角色名称。

上传音频超过 30 秒

参考音频上传时长不能超过 30 秒。超过 30 秒会导致失败,请先裁剪后再上传。

提示词包含不安全内容

避免色情、露骨、暴力或血腥内容。这类请求可能会在生成前被拦截。

使用了受保护的人物或角色名称

不要使用具体真实人物、公众人物、明星、政治人物或受保护角色的姓名。可以改用通用角色描述。

常见问题

Seed Audio 1.0 实用问题。

为什么我的Seed Audio 1.0生成会失败 ?

常见原因通常是输入或内容规则不符合要求:参考音频上传超过 30 秒;提示词包含色情、露骨、暴力或血腥内容;或者提示词里使用了具体真实人物、公众人物、明星、政治人物或受保护角色的姓名。建议先把参考音频裁剪到 30 秒以内,把提示词改成安全的场景描述,并用通用身份描述替代具体姓名。

开始使用 Seed Audio 1.0 的最佳方式是什么?

从一个简短场景提示开始,描述说话者、场景、声音风格、氛围、音乐层以及一两个音效事件。先听清晰度,再增加复杂度。

Seed Audio 1.0 能生成除语音之外的内容吗?

可以。在测试中,它适用于完整的音景:旁白、氛围、音乐背景、拟音效果和事件提示,全部在一个提示中完成。

请求的时长是否总是与输出时长一致?

不一定。将时长视为指导,在需要精确时间时修剪最终片段。

如果输出听起来太杂乱怎么办?

减少声音层数。保留说话者、一个氛围层、一个音乐方向和一两个音效事件。

应该先使用参考音频还是纯文本提示?

学习模型时先使用纯文本提示。只有在明确要保留哪种声音、氛围或节奏时,再添加参考音频。

准备好生成你的第一个电影级音频了吗?

从一个经过测试的提示开始,然后调整场景。

复制一个示例,更改场景和声音方向,在添加参考文件或更长的场景细节之前,先运行一个短草稿。

尝试 Seed Audio