Soul作为少有以虚拟人设提供即时交流互动体验的应用和 AI Native 的社交网络,自成立以来一直坚持以AI辅助社交,致力于实现拟人化、自然化情感陪伴体验,拓展用户社交体验。近日,Soul语音大模型再次升级,上线自研端到端全双工语音通话大模型,实现更接近生活日常的交互对话和“类真人”的情感陪伴体验。目前,此模型能力已上线“异世界回响”实时通话场景,并将在后续拓展至AI苟蛋等多个AI陪伴、AI互动场景。
Soul上线的自研端到端全双工语音通话大模型,证明了Soul在行业中扎实的技术能力积累。
区别于传统的级联方案,语音到语音的端到端建模,意味着语音交互体系的颠覆式升级,即不再需要从“语音识别、自然语言理解、语音生成”等多个环节流转,直接语音输入—语音输出的端到端模型能够最大程度实现信息无损传递,降低响应延迟时间。
此次Soul自研的端到端语音通话大模型便具备超低交互延迟、快速自动打断、超真实声音表达和丰富情绪感知理解能力的特点,支持更自然的人机交互体验。
在延迟方面,于实际应用过程中,用户体验与“异世界回响”中虚拟人实时语音通话效果时,延迟时间少于行业平均水平,真正实现即时的AI交流和陪伴。
值得一提的是,端到端的语音语义理解和响应以及更自然的语音指令控制,让Soul语音通话大模型不仅能够给予情感关怀、理解人声情绪情感并给出有温度的回应,还能够理解物理世界的声音场景,模拟物理世界动物声音、理解多人聊天内容,实现多风格语言切换、文艺内容创作和即兴演唱,接近现实交流互动场景需要。
Soul作为深受年轻人喜爱的社交平台,洞察当代年轻人社交痛点和需求,坚持以技术创新来实现“让天下没有孤独的人”的愿景。此次Soul上线端到端语音通话大模型,进一步强化了声音在沟通中赋予的“情绪温度”和“陪伴感”。让线上社交尤其是人机互动中,也能实现真实生活场景聊天的自然流畅感和沉浸现场感,真正完成类现实生活化互动场景中的交互体验。
责任编辑:kj005
文章投诉热线:157 3889 8464 投诉邮箱:7983347 16@qq.com