实测对比:苹果新语音转录 API 在速度与准确性之间如何权衡?

文曲星2025-07-04 13:29:2313

7 月 4 日消息,科技媒体 9to5Mac 于 7 月 3 日发布博文,对苹果系统的全新转录 API 进行了对比测试。该媒体使用一段时长 7 分 31 秒的 9to5Mac Daily 播客音频,对比了苹果新转录 API、OpenAI 的 Whisper Large v3 Turbo(通过 MacWhisper 应用)和英伟达的 Parakeet v2 模型。

测试平台为配备 M2 Pro 芯片和 16GB 内存的 MacBook Pro 笔记本,借助 Metric: cer 和 Metric: wer 两款 Hugging Face Spaces 分析实际的字符错误率(CER)和单词错误率(WER)。结果显示,Parakeet v2 转录时间最短,仅 2 秒,但 CER 和 WER 较高;Whisper Large V3 Turbo 准确性最高,不过转录时间长达 40 秒;苹果的模型速度接近 Parakeet,准确性则更优。

此外,该媒体还以 ChatGPT、Claude 和 Gemini 为基线计算 CER 和 WER,结果表明各模型性能有差异,Whisper 在准确性上依然领先。

原文链接:https://www.ithome.com/0/865/702.htm

扫一扫二维码,添加客服微信