惊!45 秒 AI 转录 34 分钟 4K 视频,苹果 Speech 技术超 OpenAI Whisper 快 55%

文曲星2025-06-18 13:48:2320

6 月 18 日消息,科技媒体 macstories 于 6 月 17 日发布博文,公布了一项关于语音转录的实测结果。此次实测使用一段长达 34 分钟、大小为 7GB 的视频文件,对苹果全新的 Speech API 以及其他竞品进行了对比。

据悉,苹果公司在 WWDC 2025 全球开发者大会上宣布推出全新的 Speech 框架,其中包含 SpeechAnalyzer 和 SpeechTranscriber 两款模组。macstories 实测了基于这两款模组开发的 Yap 应用工具,发现它在转录处理该视频时仅用 45 秒就完成了,而 OpenAI Whisper 则需要 101 秒,苹果的 Speech API 比其快了 55%。此外,Yap 远超竞品 MacWhisper(基于 OpenAI 的 Whisper 开源语音转录模型)的 1 分 41 秒。

该媒体还进一步对比了 Yap 与 MacWhisper、VidCap 等主流工具的表现。结果显示,Yap 以 45 秒完成转录并输出 SRT 及 TXT 格式文件,MacWhisper(V3 Turbo)用时 1 分 41 秒,VidCap 用时 1 分 55 秒,MacWhisper(V2)用时 3 分 55 秒。虽然所有工具在专有名词识别上都存在误差,但 Yap 的本地化运算使其速度优势显著,若以每周处理多段视频计算,累计节省的时间效益相当可观。

原文链接:https://www.ithome.com/0/861/733.htm

扫一扫二维码,添加客服微信