什么是 Audiobox?
Audiobox是Meta推出的免费AI语音和声音生成模型,能结合语音输入和自然语言文本提示生成语音和音效。模型包含Audiobox Speech(专注语音生成)和Audiobox Sound(专注音效生成)等专业模型,底层基于共享的自监督模型Audiobox SSL。Audiobox具备语音风格转换等独特功能,是首个实现语音与文本双输入自由语音风格转换的模型。Audiobox能降低音频创作门槛,让任何人都能轻松创作出个性化的音频内容,能用在视频、播客、游戏等多种场景。
主要功能
- 克隆用户声音:录制声音按照用户的声音风格或以任意音频样本的风格生成语音。
- 文本描述生成人声:使用文本描述声音风格的特征以及声学环境生成人声。
- 更改声音风格:可结合声音和文本描述更改现有的声音风格。
- 文本描述生成音效:根据输入的声音特征文本描述生成声音效果。
- 噪音消除:提供Magic Eraser功能消除录音中的瞬态噪声。
- 声音填充:根据文本描述用新的声音替换音频中的一部分。
- 音频故事制作器:结合以上功能,用Audiobox Maker制作原创有趣的音频故事。
使用方法
- 访问Audiobox平台:访问Audiobox官网 https://audiobox.metademolab.com/,点击“Try demos”。
- 选择功能:在页面上选择“Create Audio”或“Edit Audio”中的具体功能。
- 上传或录制语音样本:录制自己的语音或上传现成的音频文件作为参考。
- 输入文本内容:在指定区域输入希望生成语音或音效的文本描述。
- 生成音频:点击“Generate”按钮,让Audiobox根据输入生成音频。
- 查看和下载:播放生成的音频,确认效果后下载保存。
付费策略
免费