今年一季度,基于深度学习的大型语言模型ChatGPT迅速爆红,全球用户数强势破亿,成为史上用户增长最快的消费级应用程序。风靡世界的ChatGPT还引发了全球新一轮AI技术迭代浪潮,它与传统“对话机器人”相比读懂人类意图再作答,背后融合了机器学习、神经网络和Transformer模型等多种技术模型。ChatGPT是在GPT3基础上进一步开发的NLP大模型,参数规模由“千亿级”迈入了“万亿级”。
想要实现从大模型到“ChatGPT”的进阶,我国的“底子”也不差,多个国内企业研发出了基于文本或多模态的预训练基础大模型。但要打造一个类ChatGPT大模型还是任重而道远。在数据方面,需要保障用户隐私安全,符合各国法律法规和政策;在算力方面,需要大规模计算集群和对应模型并行算法框架的支撑;在工程实现方面,需要将大模型部署在线上云端,以供大规模用户快速地、经济化地使用。
中国信通院云计算与大数据研究所人工智能部副主任曹峰曾指出,AI大模型是人工智能迈向通用智能(AGI)的里程碑技术,同时具有大规模和预训练两大属性,面向实际任务建模前会在海量通用数据上进行预训练,解决了通用数据激增与专用数据匮乏之间的矛盾,大幅提升了AI的实用性。但由于自研AI大模型技术难度极高、对数据需求极大以及研发时间以“年”为单位,国内可做AI大模型的企业屈指可数。
根据人工智能大事件日历,在4月到5月期间,大量国内科技公司将集中发布基于AI的大模型以及AI软硬件新产品。其中有媒体报道商汤科技要发布的大模型,其画图功能将超过MidjourneyV4,搭配自研新型AI基础设施SenseCore,打通了算力、算法和平台,有助于低成本实现规模化AI创新落地。
科大讯飞则计划在5月6日发布认知智能大模型,并采用“1+N”架构。其中“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”是应用于教育、医疗、工业等多个行业领域的专用大模型版本,比如通过学习海量医学教材、论文和病例,实现专业的医疗领域对话式AI系统,打造“每个医生的AI诊疗助理,每个人的AI健康助手”。据悉此次讯飞AI学习机、讯飞听见等产品将成为该项技术率先落地的产品。科大讯飞副总裁、研究院执行院长刘聪曾表示讯飞基于认知智能全国重点实验室,已在核心算法、行业数据、算力支撑以及团队组建等方面建立了“护城河”,非常有信心实现ChatGPT类似的技术跃迁。
除了“国产军团”外,国外知名公司AIGC Chain与微软、谷歌两大科技巨头也将有“大动作”。AIGC Chain将发布全球首个基于Web3的GPT大模型、谷歌将在I/O 2023全球开发者大会展示多款AI产品、微软将在Build 2023开发者大会带来更多AI领域计划。显而易见,随着越来越多大公司在AI领域发力,将使得缺少AI技术沉淀和数据资源的企业逐渐“掉队”,整个产业正在呈现“大浪淘沙”的新局面。
未来,AI大模型将成为千行百业数字化转型的技术基础、场景基础和数据基础,只有基于行业数据与知识形成专属定制解决方案,才能帮助各行各业跨越认知智能技术的壁垒,提高企业和产品竞争力,最终实现“AI+”协同创新。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
责任编辑:kj005
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com