9月7日消息,人工智能公司出门问问在2020年服贸会上发布两款全新魔音系列产品:AI音频内容生产一站式解决方案——“魔音工坊”,AI虚拟主播——“魔影主播”。目前这两款产品已经应用于光明日报的音视频内容生产中。
作为一家AI技术驱动型公司,出门问问已经推出过系列消费级智能硬件产品,包括AI智能手表TicWatch系列、AI真无线智能耳机TicPods系列、智能音箱TicKasa系列等。凭借在消费级场景积累的AI能力和经验,此次出门问问推出两款AI音视频内容生产工具,意味着其加速向To B企业级场景延伸。
出门问问CEO李志飞在接受TechWeb采访时透露,目前,出门问问公司营收主要来自消费级产品,而且公司海外营收占比超过60%,现在企业级市场也是公司主要发力的一块。
李志飞介绍,尽管受疫情影响,今年前2个季度出门问问的业绩受到一定影响,但是销售业绩在第三季已经出现强势反弹,预计全年营收同比去年仍略有增长。
可编辑的AI音视频生产工具
魔音工坊是一款主打AI音频生产的产品, 旨在以AI助力音频内容创作,通过独创的产品和交互,成为AI音频内容生产一站式解决方案,打造AI音频时代的WORD编辑器。
事实上,市面上已经有包括科大讯飞、搜狗等公司推出了类似AI产品,李志飞向TechWeb表示,魔音工坊最大的特色是后台有一个灵活的编辑工具。
李志飞介绍,尽管AI能力已经越来越强,但是不可否认的是目前由AI直接生成的音频内容还是会存在一些误差,在新闻播报等严肃场合是无法直接使用的。魔音工坊通过引入音频编辑工具,既能实现AI将文字转为音频的快速性,又能实现人工矫正编辑的准确性,这个价值非常大。
据介绍,魔音工坊增加的后台编辑功能,能够非常个性化的对AI生成的语音内容进行定点编辑。利用端到端MeetVoice语音合成引擎,魔音工坊设计了交互友好的产品形态,用户可以快速导入要合成声音的文章,通过类似微软WORD文档的编辑操作,即可快速解决拼音、韵律等中文配音问题,让用户一站式快捷生产出专业精品的音频。
魔音工坊后台编辑不仅能够提供定制发音人、纠正多音字、背景音和音效、多发音人配音等核心功能,还具备数字纠错、变速、韵律纠错、创建个性“随身听”微信小程序等各种便捷有效的工具。
目前魔音工坊已为众多头部媒体提供随身听小程序,将文字内容升级为更有深度和感染力的声音形态。提升自媒体用户体验,让粉丝用户留存、时长和长期忠诚度、活跃度得到更大提升。
此外,出门问问此次发布的另一款全新产品“AI虚拟主播——魔影主播”,可通过语音驱动虚拟形象说话及反馈动作。通过将深度学习和计算机图形学结合,让计算机能够理解语音的内容并精细驱动虚拟形象的口唇动作、面部表情、肢体姿态,生成极具逼真感的虚拟形象动画。结合TTS技术,能够为客户提供具备丰富表情动作反馈的AI虚拟互动助手。编辑人员仅需输入文字内容,即可快速生成具备同步口型、丰富面部表情及模型动作的AI虚拟主播视频。
加速布局赋能新闻媒体业
借助魔音工坊和魔影主播两款产品,出门问问成功实现AI驱动的“文字与音频”、“文字与视频”之间的快速转换。
出门问问高级技术总监叶顺平表示,希望通过这些AI产品帮助传统媒体更好地适应音频和视频形态,多渠道分发,让优质内容触达到更多用户,实现内容价值最大化,为新闻媒体业赋能。未来,在AI的加持下,人人皆可玩转多媒体,多种媒体之间也能实现自由融合与转换。
此外,叶顺平强调,出门问问深耕语音赛道,拥有完整的“端到端”人机交互相关技术栈。在魔影主播与魔音工坊两款产品背后,是出门问问自主研发的全CPU低时延端到端语音合成系统MeetVoice (Mobvoi End-to-End TTS Voice) 。其采用基于神经网络的声码器 Meet-Vocoder,可以实现高度接近真人的声音素质。
出门问问使用多发音人基础模型,提升语音合成效果,汉字发音准确率提升至99.6%以上,保持业界领先水平。在此基础上,MeetVoice最大限度地提高效率,1秒时间能够合成近10秒音频,且无需额外配置GPU。
李志飞表示,目前出门问问可为客户量身定制全栈式的人工智能解决方案,目前已为物联网、金融、电信、餐饮、车载等企业级场景提供服务。
(作者:果青)
责任编辑:kj005
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com