声网发布Linux Server SDK 支持大模型Python与Go语言-新科技-资讯-头部财经

声网发布Linux Server SDK 支持大模型Python与Go语言

资讯 » 新科技 2024-07-29

AIGC 和大语言模型 LLM 的快速发展正推动人工智能领域的进步和创新,LLM 作为 AIGC 的核心模块,其发展尤为引人注目。随着技术的不断进步,大语言模型的能力也不断进化,一方面,训练数据量与算力的提升,AI 的生成内容更精准、更智能;另一方面,大模型的交互方式,也从文本升级为音频、视频的多模态,可以支持人与AI的语音对话等。

在多模态大模型的趋势下,RTC成为了人与AI交互中的重要一环,越来越多的企业与开发者纷纷探索在大语言模型或者 AI 应用场景中快速集成高效的音视频能力,构建 AI陪聊、AI口语老师等一系列场景。

对此,声网推出Linux Server SDK,支持当下大模型编程最主流的两类语言Python与Go,企业可基于声网Linux SDK,快速接入大模型,上线具备 RTC 传输能力的 AI 应用场景,如 AI 语音助手、AI 口语老师、虚拟恋人、多人语音游戏等。

声网 Linux Server SDK 以 API 的形式提供了一系列的功能,例如 Linux Server SDK for Go 可支持连接管理、信令发送、音频订阅与推送、事件回调通知等,其中信令传输能力不仅可应用于创建 DataStream 数据流,并发送信令,也能应用在大模型中发送数据流消息,例如将 TTS、STT 和 LLM 的结果发送给客户端。

此外,Linux Server SDK 还提供了使用时序的教程,从建立连接、订阅远端用户的音频、获取远端用户的音频数据、推送音频数据、发送文字信令、断开连接等不同流程的详细描述,帮助开发者快速上手。

声网 Linux Server SDK 客户集成实践图

凭借在 RTC 行业日积月累的深耕细作,声网 Linux Server SDK 在 RTC 的低延时、抗弱网、跨国传输、并发等方面具备优秀的性能。

· 低延时与全球部署:声网自研的 SD-RTN™ 实时传输网络覆盖了全球 200 多个国家与地区,音视频的全球端到端延迟平均达到 200ms。声网还通过优化网络传输协议和算法,进一步降低音视频传输的延迟。

· 智能路由与抗弱网:针对网络环境的波动,声网的智能路由技术能够根据用户的网络状况自动选择最优的网络路径,确保通话的稳定性和流畅性。声网的抗弱网传输与抗丢包算法,结合网络探测、抗丢包技术、自适应jitter buffer、网络拥塞控制策略等,为用户在各种网络环境下提供流畅的互动体验。

· 30000+终端机型适配:由于不同的设备可能对于语音处理效果产生影响,声网的 RTC SDK 支持 30000+终端机型适配,中低端机型覆盖广,帮助大模型与客户解决了多设备兼容性的后顾之忧。

· 并发性能:客户集成声网 Linux Server SDK 后可支持上百路的音视频并发。

· 支持多频道多路流:声网 SDK 支持用户同时加入多个频道,同一时间可以在多个频道中接收和发布音视频流。

目前声网 Linux Server SDK 为 Alpha 版,如您想进一步了解或接入,可在声网微信公众号找到这篇文章,扫描文章底部的二维码咨询。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿，经过编辑审核收录，不代表头部财经观点和立场。
证券投资市场有风险，投资需谨慎！请勿添加文章的手机号码、公众号等信息，谨防上当受骗！如若本网有任何内容侵犯您的权益，请及时联系我们。

余承东宣布天生会画正式版将于8月6日上线亮点有点多

2024-07-311阅读
华为将连发两款旗舰平板超强AI赋能实现创作力跨越

2024-07-311阅读
曝33岁字节女员工计划存够300万后躺平已存款240万

2024-07-311阅读
Intel酷睿Ultra 200V Lunar Lake发布时间官宣！还得一个多月

2024-07-311阅读
华为nova Flip小折叠详细参数表曝光机身仅6.88mm厚

2024-07-311阅读
风起之时，跨境物流需要紧抓什么？

2024-07-311阅读
小红书举办live直播伙伴大会：直播是创作者开启新职业的第一选择

2024-07-311阅读
改PPT、开会、做汇报，为什么京沪高铁上的班味儿这么浓

2024-07-311阅读
天际线变革：塑造下一代城市空中交通｜OpenTalk 回顾

2024-07-311阅读
完成数亿元B2轮融资，「深蓝航天」星云-1号可回收火箭年底将首飞入轨 | 独家

2024-07-311阅读