Whisper 是一种开源的自动语音识别系统,经过从网络收集的 680,000 小时多语言和多任务监督数据的训练。它被设计为对口音、背景噪音和技术语言具有鲁棒性,并且可以将多种语言的语音转录和翻译成英语。这是一种简单的端到端方法,实现为编码器-解码器 Transformer。它还能够执行语言识别和短语级时间戳。它被设计为易于使用且具有高精度,允许开发人员将语音接口添加到更多应用程序中。
复制网址
当前网址国内可以直接访问
Whisper 是一种开源的自动语音识别系统,经过从网络收集的 680,000 小时多语言和多任务监督数据的训练。它被设计为对口音、背景噪音和技术语言具有鲁棒性,并且可以将多种语言的语音转录和翻译成英语。这是一种简单的端到端方法,实现为编码器-解码器 Transformer。它还能够执行语言识别和短语级时间戳。它被设计为易于使用且具有高精度,允许开发人员将语音接口添加到更多应用程序中。
之前