7月24日,字节跳动Seed团队发布端到端同声传译模型Seed LiveInterpret 2.0,这是首个延迟和准确率接近人类水平的产品级中英语音同传系统。该模型基于全双工端到端语音生成理解框架,支持中英互译,可实时处理多人语音输入,像人类同传译员一样“边听边说”。其翻译准确率在多人会议场景中超过70%,单人演讲场景中超过80%;翻译延迟低至2-3秒,较传统系统降低超60%。此外,该模型还支持零样本声音复刻,能用说话人的音色特质实时“说出”外语,提升交流的自然度。Seed LiveInterpret 2.0技术报告已公布,基于火山引擎对外开放,Ola Friend耳机也将在8月底接入该模型。
相关文章
2025-08-02103阅读
2025-08-02103阅读
2025-08-02103阅读
2025-08-02103阅读
2025-08-02103阅读
2025-08-02103阅读
2025-08-02103阅读
2025-08-02103阅读
2025-08-02103阅读
2025-08-02103阅读