中华网数码

设为书签Ctrl+D将本页面保存为书签,全面了解最新资讯,方便快捷。
业 界/ 互联网/ 行 业/ 通 信/ 数 码/ 手 机/ 平 板/ 笔记本/ 相 机
当前位置:滚动新闻>

一文揭晓科大讯飞最新AIGC整体布局

一文揭晓科大讯飞最新AIGC整体布局
2023-03-31 10:22:02 来源:今报在线

 

经过了2022年AIGC元年的“C位出道”,如今AIGC已经稳步进入发展快车道,无论是底层技术还是具体落地应用都更加牢固和丰富,也一次又一次让人类发出赞叹,2023年被称为AIGC大年,有数据显示,今年我国AIGC市场规模可达170亿元,到2030年中国AIGC市场规模将达到1.15万亿元,面对如此前景和实际应用意义,众多公司纷纷入局,其中便有我国头部科技公司——科大讯飞。

在3月29日由量子位主办的中国AIGC产业峰会上,科大讯飞AI研究院常务副院长高建清对讯飞在AIGC领域的整体布局进行了分享。从文本创作到音频创作再到视觉创作,科大讯飞均有涉及,同时科大讯飞已经有多款AIGC应用产品创新产出AIGC相关应用和产品。

以往我们在看电子书时,可能会打开系统自带的朗读功能,但总是会被比siri还要“冰冷无情”的机器声音所劝退。在音频创作领域,通过研发虚拟声音自动创造系统,讯飞已经实现了语义可控的声音创造,用户输入一个人设,系统便可以生成该人设声音,除此之外,多风格多情感语音合成系统SMART-TTS是科大讯飞的一大杀手锏,11种情感、20档强弱度不同的调节功能,让合成语音更加真实,停顿、重音、语速等能关键声音元素也能够进行随心调节。

《红楼梦》中,未见其人、先闻其声的王熙凤一出场便让人知道她是一个风风火火的人,声音是人设的特点之一,而后面人物的视觉面貌也让人设更加具体。在视觉创作方面,科大讯飞也同样带来了惊喜。从2018年首发多语种虚拟人口唇驱动,到2021年首发2D真人捏脸系统,目前科大讯飞已形成了从3D虚拟形象口唇表情和动作的AI驱动到AI贯穿3D形象构建的全流程,“徒手捏人”不再是女娲专属技能,同时讯飞通过对语音节奏、韵律体会和语义理解,让虚拟人可以随时、流畅地切换动作,拥有更加自然的肢体语言,讯飞研究院还打造了个化3D虚拟人复刻系统,一张人像、一句话便能快速生成个化3D虚拟形象。

目前科大讯飞在AIGC领域打造了AIGC内容创作基地,包括讯飞智作和讯飞音乐“词曲家”台等创新产品,讯飞智作可以为用户提供快捷的音视频制作,基于讯飞在虚拟人的技术基础,2D/3D形象可代替真人主播,从文本到视频可以一键转换。讯飞智作的内容生产已经广泛应用于媒体、金融、智慧文旅、企业数字化、智慧政务、IP运营多个领域。词曲家台则提供了辅助作词、辅助作曲和歌曲试音、质量分析等AI辅助工具,为广大词曲作者和采买方提供一个更加智能、透明和安全的词曲创作交易台。

高建清在中国AIGC产业峰会上表示,“底座+能力+应用”是科大讯飞AIGC整体布局的三层架构:以文本预训练、多模态预训练、多元异构基础资源构建、异构集群构建及大模型训练套件为技术底座,形成了音频创作、视觉创作、文本创作三大AIGC能力,进而衍生出在教育、医疗、人机交互等领域的丰富应用。

从技术到应用,AIGC不是束之高阁的概念,也不是昙花一现的空谈,其底层技术和产业形态已经形成了新的格局,而科大讯飞对AIGC应用落地的推动让更多人切实感受到了时代发展的最新力量。

 

责任编辑:kj005

文章投诉热线:156 0057 2229  投诉邮箱:29132 36@qq.com
关键词:

个保法颁布一周年:个性化广告发展需平衡隐私保护与用户体验

2022-11-14 11:53:20个保法颁布一周年:个性化广告发展需平衡隐私保护与用户体验

2022年全球折叠手机总销量将首度超过千万部大关

2022-02-09 11:40:212022年全球折叠手机总销量将首度超过千万部大关

印度市场智能手机出货量出炉:vivo占比排名第三

2022-02-08 11:19:13印度市场智能手机出货量出炉:vivo占比排名第三

平板电脑进入新的竞争阶段 重新夺回市场主导权

2022-02-07 16:52:08平板电脑进入新的竞争阶段 重新夺回市场主导权

2021年四季度中国手机市场苹果占有率位居第一

2022-01-27 13:33:342021年四季度中国手机市场苹果占有率位居第一

预测2022年中国市场智能机销量达3.4亿部 同比增长8%

2022-01-26 14:57:26预测2022年中国市场智能机销量达3.4亿部 同比增长8%

相关新闻