衡量速度和准确性:苹果新语音转录 API 对比测试
IT 世家 7 月 4 科技媒体日新闻 9to5Mac 昨日(7 月 3 日本)发布博文,对比测试了苹果系统的全新转录。 API,认为该 API 速度优于速度 OpenAI 的 Whisper 模型,但是在准确性上还是有一定差距的。
IT 世家注:这个媒体使用一段时间 9to5Mac Daily 播客音频测试,长度为 7 分 31 第二,对比苹果的新转录。 API、OpenAI 的 Whisper Large v3 Turbo(通过 MacWhisper 应用程序)和英伟达 Parakeet v2 模型。
测试平台为 M2 Pro 芯片 MacBook Pro 笔记本,配置 16GB 内存,使用 Metric: cer 和 Metric: wer 两款 Hugging Face Spaces 对实际字符错误率进行分析(CER)而且单词的错误率(WER)。
数据显示,Parakeet v2 转录时间最短,仅为 2 秒,但 CER 和 WER 较高;Whisper Large V3 Turbo 其准确性最高,但转录时间长 40 秒;苹果模型在速度上接近 Parakeet,但是精确度优于后者。
模型转录时间字符差错率单词差错率Parakeet v22 seconds5.8.3%Whisper Large V3 Turbo40 seconds0.Apple992%1.5% seconds1.9.3%
这个媒体也被使用了 ChatGPT、Claude 和 Gemini 计算基线 CER 和 WER。资料表明,每一个模型的性能都不一样, Whisper 仍然领先于准确性。
ChatGPT ( o4-mini-high )
模型转录时间字符差错率单词差错率Parakeet v22 seconds6.0.3%Whisper Large V3 Turbo40 seconds0.Apple94%1.4% seconds2.1.2%
Claude ( Sonnet 4 )
模型转录时间字符差错率单词差错率Parakeet v22 seconds8.4.0%Whisper Large V3 Turbo40 seconds0.Apple991%1.0% seconds3.5%8.2%
Gemini ( 2.5 Pro )
模型转录时间字符差错率单词差错率Parakeet v22 seconds7.6.3%Whisper Large V3 Turbo40 seconds0.Apple93%0.4% seconds3.4%5.3%
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




