所在位置: 首页 > 中心动态

关注 | 中电数产“中数天璇行业多模态数据集”顺利通过人工智能数据集质量A++级评估

时间:2026-02-04

近期中电数据产业集团有限公司参与国家工业信息安全发展研究中心人工智能所组织的人工智能数据集质量评估工作,其“中数天璇行业多模态数据集”以总得分99.4分(满分100分)顺利通过评估且数据集整体质量获得当前最高评级A++级此次评估,具体依据国家工业信息安全发展研究中心牵头编制的团体标准人工智能数据集质量评价指标》(T/CQAE 18003—2025开展,主要围绕人工智能数据集的数据元素质量、数据标注质量、数据集成质量和数据安全质量四个维度,采用自动化检测与专家评审相结合的方式,全面评估数据集的规范性、完整性、准确性、时效性、多样性、关联等核心级指标和相关级指标。

此次评估的“中数天璇行业多模态数据集”是通过智能化行业知识注入、数据处理、文本增强、文生图、多模态对齐与融合、自动化标注、质量评估等体系化数据加工流程,构建得到的覆盖绿色低碳、交通物流、金融服务、现代农业、医疗卫生、文化旅游、应急管理、工业制造、智慧能源、移动通信10个行业的多模态融合数据集。数据集由多语种文本、图文对及视频三类子数据集组成,数据规模可观、覆盖维度全面总体数据规模达到5.28T


图1 中数天璇行业多模态数据集文本模态行业分布

未来,中心人工智能所将继续依托国家语音及图像识别产品质量检验检测中心持续优化人工智能数据集质量评估体系,推动相关标准在更广泛场景中落地应用。同时,中心人工智能所计划开展系列化、常态化的数据集测评服务,覆盖从基础数据资源到行业专用数据集、从科研创新到产业应用的多类型数据产品,致力于构建更加安全、可靠、高效的人工智能数据基础设施,为我国人工智能产业健康发展和赋能新型工业化提供有力支撑。

  来源:人工智能所