衡量速度和准确性：苹果新语音转录 API 对比测试

2025-07-05

IT 世家 7 月 4 科技媒体日新闻 9to5Mac 昨日（7 月 3 日本)发布博文，对比测试了苹果系统的全新转录。 API，认为该 API 速度优于速度 OpenAI 的 Whisper 模型，但是在准确性上还是有一定差距的。

IT 世家注：这个媒体使用一段时间 9to5Mac Daily 播客音频测试，长度为 7 分 31 第二，对比苹果的新转录。 API、OpenAI 的 Whisper Large v3 Turbo（通过 MacWhisper 应用程序)和英伟达 Parakeet v2 模型。

测试平台为 M2 Pro 芯片 MacBook Pro 笔记本，配置 16GB 内存，使用 Metric: cer 和 Metric: wer 两款 Hugging Face Spaces 对实际字符错误率进行分析（CER）而且单词的错误率（WER）。

数据显示，Parakeet v2 转录时间最短，仅为 2 秒，但 CER 和 WER 较高；Whisper Large V3 Turbo 其准确性最高，但转录时间长 40 秒；苹果模型在速度上接近 Parakeet，但是精确度优于后者。

模型转录时间字符差错率单词差错率Parakeet v22 seconds5.8.3%Whisper Large V3 Turbo40 seconds0.Apple992%1.5% seconds1.9.3%

这个媒体也被使用了 ChatGPT、Claude 和 Gemini 计算基线 CER 和 WER。资料表明，每一个模型的性能都不一样， Whisper 仍然领先于准确性。

ChatGPT ( o4-mini-high )

模型转录时间字符差错率单词差错率Parakeet v22 seconds6.0.3%Whisper Large V3 Turbo40 seconds0.Apple94%1.4% seconds2.1.2%

Claude ( Sonnet 4 )

模型转录时间字符差错率单词差错率Parakeet v22 seconds8.4.0%Whisper Large V3 Turbo40 seconds0.Apple991%1.0% seconds3.5%8.2%

Gemini ( 2.5 Pro )

模型转录时间字符差错率单词差错率Parakeet v22 seconds7.6.3%Whisper Large V3 Turbo40 seconds0.Apple93%0.4% seconds3.4%5.3%

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com