优秀!云从科技从容大模型测评成绩跻身全球前三
2024-06-27 18:48
6月27日,记者从重庆中科云从科技有限公司获悉,近日,云从科技从容大模型在综合评测权威平台OpenCompass的多模态评测领域中取得重大进展。从容大模型在该体系中的平均得分为65.5,跻身全球前三,仅次于GPT-4o(平均得分69.9)和Claude3.5-Sonnet(平均得分67.9)。而在国内市场,从容大模型的成绩则排名首位。
▲OpenCompass多模态榜单。(云从科技供图)
据悉,OpenCompass大模型开放评测体系是上海人工智能实验室推出的完整开源可复现的评测框架。OpenCompass多模态评测方面采用了8个具有代表性的数据集,从多种视角客观量化多模态大模型的能力,评估维度覆盖目标检测、文字识别、动作识别、图像理解和关系推理、艺术与设计、商业、科学、健康与医学、人文与社会科学、技术与工程、数学推理等多个方面。
▲从容大模型-2.0多模态能力示例。(云从科技供图)
本次测评中,从容大模型在8个数据集之中的6个表现优异,排名国内第一。在OCRBench测试集上,总分为1000分,从容大模型取得全球最高的827分,高于第二名13分,进一步提升了从容大模型在文本识别、以文本为中心的视觉问答、面向文档的视觉问答、关键信息提取等业务场景下的适用性。
云从科技相关负责人表示,从容大模型在此体系中的优秀表现,依赖云从科技自研的高效多模态处理架构和先进的计算技术,实现了高效的多模态数据处理能力,能够在视觉和语言任务之间实现高效的融合和切换,并最大化利用计算资源,保证在处理大规模多模态数据时仍能保持较高的性能和响应速度,使得模型的训练过程更加高效,收敛速度更快,性能更稳定。同时也得益于云从科技长期在视觉、语言领域的深厚积累和不断创新。
此前,从容大模型已在视觉、跨模态领域10次刷新世界纪录,综合性能经第三方SuperClue、C-Eval等综合评测,位列全球前五。
上述负责人还表示,作为一家专注于人机协同技术研发的平台企业,云从科技一直在积极推动AI智能体及大模型技术的发展和应用。随着人工智能技术的迅猛发展,多模态大模型已成为驱动产业变革的核心引擎。此次从容大模型在OpenCompass大模型开放评测体系中的出色表现,不仅是对云从科技技术创新实力的认可,也将激励全球科技企业在新一轮的人工智能竞争中勇攀高峰。
凡注明来源重庆日报的作品,版权均属重庆日报所有,未经授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:重庆日报网”。违反上述声明者,本网将追究其相关法律责任。
除来源署名为重庆日报稿件外,其他所转载内容之原创性、真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考并自行核实。