快科技2月27日消息,此前,腾讯元宝里已接入混元Turbo模型,用于快速回答用户问题。
今天,腾讯宣布升级版的Turbo S模型,将逐步在腾讯元宝灰度上线,很快就会全量覆盖。
此次升级,就是为了让用户拥有更好的大模型问答体验:回答速度提升一倍,首字时延降低44%。
腾讯介绍称,此次混元Turbo S创新性地采用了Hybrid-Mamba-Transformer融合模式,一方面发挥了Mamba 高效处理长序列的能力,另一方面也保留Transformer擅于捕捉复杂上下文的优势,最终构建了显存与计算效率双优的混合架构。
腾讯表示,这是工业界首次成功将Mamba架构无损地应用在超大型MoE模型上。
通过长短思维链融合,腾讯混元Turbo S 在保持文科类问题快思考体验的同时,显著改进了理科推理能力,整体效果明显提升。
此外,开发者和企业用户也可以在腾讯云上通过API调用腾讯混元Turbo S,发布当日起一周内免费试用。