11月8-10日,2023年世界互联网大会在浙江乌镇举行。
随着AI特别是大模型技术不断发展,AI将更加融入人们的日常生活。作为我国最早一批深耕AI数据行业、并成为本行业首家在主板上市的公司,海天瑞声亮相世界互联网大会“互联网之光”博览会。
作为行业标杆,深耕行业近20年的海天瑞声,正向全行业提供多语言、跨领域、跨模态的人工智能数据及相关数据服务,涵盖智能语音(语音识别、语音合成)、计算机视觉、自然语言等多个核心领域,覆盖全球70多个国家、超过200个主要语种及方言。
海天瑞声与阿里巴巴、腾讯、百度、科大讯飞、海康威视、字节跳动、微软、亚马逊、三星、中国科学院、清华大学等全球近900家科技互联网、社交、IoT、智能驾驶等领域的主流企业,以及教育科研机构等建立了深度合作关系,以专业、可靠、安全的数据服务,成功交付数千个定制项目。
今年开始,全球掀起百模大战,以ChatGPT为代表的大模型产品不断涌现,提到大模型相关的布局,海天瑞声创始人、董事长贺琳在接受潮新闻记者采访时介绍道,“我们已经携手大模型企业及科研机构,包括中国科学院自动化所、信通院泰尔实验室、智谱AI、澜舟科技等,共同打造中文大模型高质量数据集,来推动大模型技术的发展。我们也在准备围绕着大模型的需求,开放一批数据集用于大模型的开发、评测,包括举办一些竞赛”。
在2023中国计算机大会 (CNCC) 上,智谱AI推出了全自研第三代基座大模型 ChatGLM3及相关系列产品,海天瑞声成为智谱AI数据伙伴,为AI未来创新和行业发展携手合作。
贺琳表示,“业界已经形成高度共识,数据和人工智能的关系是密不可分的。大家都知道算力、数据和算法是人工智能的三驾马车。可能算力大家都比较了解了,就是计算的能力。那算法跟数据的关系,我们会有一个比喻,就像是一个孩子生下来,他有大脑、有思考能力,这就是算力、算法的作用。但是他其实对这个世界没有任何认知,因为他没有经过知识的获取和学习。数据相当于是知识,我们要用教科书的形式赋予大脑更多的能力。做数据其实就像是做教科书,教科书越好,大脑学到的知识就越丰富越全面,所以我们做数据就是要努力把这些知识做得更全面更优质,让大脑学会更多的内容,可以去做更多的事情。”
另外,海天瑞声在“互联网之光”博览会重磅推出DOTS-LLM大模型服务平台,平台包括数据采标、数据管理、模型训练和模型评测四大功能,旨在为千行百业数字化转型赋能。海天瑞声CTO黄宇凯向潮新闻记者介绍道。
据了解,海天瑞声围绕大模型方向的最新布局,已经发布了IPO后首次定增计划。
贺琳介绍说,我们会从两个方向发展大模型业务。一个是坚持现有的商业模式的一大特色,做标准化的数据集产品,一次性投入建设,满足市场上大模型训练、调优、评测需求,这不仅会为海天瑞声带来规模化收益,也将解决我国大模型目前面临的数据痛点。
另外一个方向则是,海天瑞声将基于在深度学习阶段数据集生产所积累的know-how,自主研发数据生产垂直大模型,构建大模型数据处理技术通用化解决方案能力,实现完整、可持续迭代的大模型数据技术框架和数据策略,进一步提高公司在人工智能基础数据服务领域的智能化水平,巩固公司的核心技术壁垒,形成长期技术实力支撑。
当前,海天瑞声拥有专业的数据采标团队,深入理解各种应用场景的需求。可提供高精度的数据清洗服务,确保数据的准确性和一致性,为客户的大模型训练提供高质量的数据基础。海天瑞声为国际质量管理体系 (ISO9001) 和数据安全体系 (ISO27001、ISO27701) 认证企业,并拥有行业领先的技术平台来保证数据标注的准确性,同时也提供近1500个高质量自有知识产权的数据集供客户选择,涵盖多个场景、多个环境、多种形式、多样的采集设备和多元化被采集目标,全方位助力AI前沿项目的全球商业落地。
除了开发通用领域的数据资源以外,海天瑞声也已经向垂直行业展开布局,提供垂直行业数据解决方案。公司今年上半年已经发布了DOTS-AD自动驾驶平台,这是一个专门为自动驾驶打造的数据处理平台。未来,海天瑞声将持续在人工智能数据领域深耕细作,以优质的数据和专业的服务,助力大模型技术的不断发展和创新,为千行百业的数字化转型贡献力量。
责任编辑:kj005
文章投诉热线:182 3641 3660 投诉邮箱:7983347 16@qq.com