诺谛智能发布行业首个中文制造业大模型评测数据集Manu-Eval

2024-09-25 14:50:30 来源：今日热点网

小大

近日，诺谛智能发布首个中文制造业大模型评测数据集Manu-Eval，该数据集通过全面、权威以及公平的方式为制造业大模型提供评测依据，也为垂直领域模型创新发展和行业场景赋能提供了重要参考。目前该评测数据集论文已被全国知识图谱与语义计算大会CCKS-IJCKG 2024收录。

作为联想集团战略孵化的、领先的新一代认知与决策人工智能企业，诺谛智能拥有丰富的制造业全链条业务场景实践经验。基于此，本次发布的Manu-Eval大模型评测数据集打破了制造业大模型无评测依据的局面，可针对制造业中机械、汽车、电子、化工、轻工业、制药、运输和食品制造8个主要领域的22个子类别进行全面评测，以评估大模型应对制造业复杂技术术语、复杂流程和专业知识等方面的理解、生成和逻辑推理能力。该评测数据集发布将有助于AI企业分析通用领域模型和特定领域模型的优势和不足，助力大模型更加有效的赋能企业业务场景，加速实现人工智能驱动的智能制造，推动行业生态的开放共赢。

图片1.png

打造全面、权威、公平的制造业大模型评测体系

如今，AI大模型已从百花齐放步入到场景落地阶段。对制造业而言，AI大模型逐渐渗透至各环节，成为制造业通往智能化、柔性化和自动化的核心技术之一。然而制造业极其丰富的应用场景也带来了更高的复杂性，这对大模型能力和其制造特定知识的有效性提出了考验。

为了更好的评估制造业行业大模型能力，提升大模型落地应用价值，诺谛智能利用专业资格考试、职业技能评估以及与制造工艺和运营相关的国家标准/指南等权威知识构建评测数据集，同时采用人工审核和大语言模型筛选的多裁判判别方式优化评测数据集，以确保提供高质量和可靠的评估问题。该评测数据集还设置了零样本测试环节，可以公正、有效地衡量大模型在处理行业特定任务方面的开箱即用能力。

诺谛“支点”行业大模型精准解决制造业场景痛点

在此基础上，诺谛智能也依托Manu-Eval评测数据集对国内外主流通用大模型进行评测。测试中，诺谛自研的“支点”行业模型参数量仅为1.5B，在参数量小于7B的模型评测榜单中排名第一，同时超过部分7B以上大模型效果，体现出更强的制造业知识理解能力和生成能力。此外，诺谛“支点”行业模型还可以进行微调和定制，精准解决制造业场景痛点，为制造企业提供更有针对性的AI场景化解决方案。

以“支点”行业大模型为核心，诺谛智能打造了覆盖制造业研、产、供、销、服全链条的AI场景化解决方案，为合作伙伴在知识应用、客户服务、供应链管理、质量检测等制造业真实业务场景下提供赋能，助力企业指数级提升运营决策效率，实现50%以上成本节省和质量提升。目前，诺谛智能已在3C制造、新能源、航空航天、乳业等近百个制造业客户取得成功实践，为客户节省数亿元成本，并创造了更高的经济与社会价值。

AI大模型的快速发展为制造业等传统行业数字化转型和高质量发展带来新动能，而更为垂直的行业大模型则可以更加有效地捕捉和利用制造业细分领域特性，从而为制造业巨量的应用场景提供精准有效的智能化赋能。

未来，诺谛智能将持续迭代Manu-Eval中文制造业大模型评测数据集，扩充制造业细分场景评估类别，针对机械设计、故障排除、流程优化等制造业核心能力和领域知识设计综合评估，以标准化、系统化、自动化的评测体系为制造业智能化升级提供助力，让更多制造领域知识为企业创造价值。

责任编辑：kj005

文章投诉热线:157 3889 8464 投诉邮箱:7983347 16@qq.com

关键词：

2021三季度企业级SSD市场统计：三星出货份额过半

我国仍有1.4亿老年人使用功能机数字鸿沟问题凸显

8GB+256GB版本！OPPO Find N预售抢购一空

培养一名航天员到底有多难？

中华网数码

诺谛智能发布行业首个中文制造业大模型评测数据集Manu-Eval

个保法颁布一周年：个性化广告发展需平衡隐私保护与用户体验

2022年全球折叠手机总销量将首度超过千万部大关

印度市场智能手机出货量出炉：vivo占比排名第三

平板电脑进入新的竞争阶段重新夺回市场主导权

2021年四季度中国手机市场苹果占有率位居第一

预测2022年中国市场智能机销量达3.4亿部同比增长8%

相关新闻

丰台派出所户籍窗口：巧用“三字诀”，服务展新颜

携手创新专利变现民生银行太原分行携手生态伙伴 探索知识产权质押贷款新模式

【主动创稳】金塔公安围绕“七进”宣传，筑牢秋季道路交通事故预防工作

金融为民消保先行｜中汇人寿四川分公司积极开展2024年“金融教育宣传月”活动

【主动创稳】强化节前安全检查筑牢交通安全防线

黄金投资至少需要多少资金（实情探究）

古今交响对话非遗，共绘文化传承蓝图

成都成华板桥中西医结合医院开业典礼暨中秋晚宴成功举办

【丰收节里看丰收】山西大宁“宁脆”苹果：从哪里“来” 为什么“贵” 又凭什么“贵”

国庆购车就看TA，入门级智能SUV仅需6.08万起

数码推荐

数码图片

CIOE中国国际光博会开幕，伯恩光学持续引领行业技术趋势

全国桥牌通讯系列赛为休闲生活添智慧乐趣

智邦国际以数智赋能财务管理体系重塑，业财一体化ERP携百万用户提质增效

强基固本共筑安全防线乌海市道路运输业工伤隐患排查能力提升培训班顺利开班

新闻排行

从“小树苗”到“大森林” 成都...

探索新赛道哪个领域能成为家电...

2021年全球TV出货下降6.2% 面板...

巨头争相布局全屋智能市场向AI...

Mini LED市场不及预期产业陷...

海南省市场监管局抽查10批次快热...

智能化开辟产品创新边界智能坐...

中国制造主导高端冰箱进入新一...

苹果或正开发Apple Music新功能...

欧洲智能手机2021年“现状”：三...

诺谛智能发布行业首个中文制造业大模型评测数据集Manu-Eval

相关新闻

数码推荐

数码图片

CIOE中国国际光博会开幕，伯恩光学持续引领行业技术趋势

全国桥牌通讯系列赛为休闲生活添智慧乐趣

智邦国际以数智赋能财务管理体系重塑，业财一体化ERP携百万用户提质增效

强基固本 共筑安全防线 乌海市道路运输业工伤隐患排查能力提升培训班顺利开班

新闻排行

强基固本共筑安全防线乌海市道路运输业工伤隐患排查能力提升培训班顺利开班