
《人民日报》,8月26日(记者李Qioochu)人工智能技术发展的成功是对全球工业结构的深入重建,而高质量的数据集则是智能和应用模型中人工培训的基础,已成为国家科学和技术发展的关键要素。高质量的数据集不仅是现代技术的“燃料”,而且是促进未来行业的实施,例如过于人工智能,体现的智能和自动驾驶。
中国信息与通信技术学院副校长Wei Liang在“ 2025年人民数据会议”上发表了主要演讲。人物日记者Weng Qiyu摄
8月26日,Wei Liang,Presi Saidchina信息与通信技术学院的主要演讲在“ 2025人类数据会议”中的主要演讲中人工智能技术以大型模型为代表的人工智能技术是模型的伟大智慧的来源,任何高功能的大型模型都与高质量的数据集密不可分。多模式数据,体现的智能数据,数据思考数据和长视频数据是下一步构建高质量数据集的重点。
随着人工智能的加速重复,大型模型在雨后像蘑菇一样出现。大型模型所需的数据集的增长率高于劳动速度和高质量数据集的生成。高质量和高价值的D该密度将支持企业的各种竞争,并成为发展人工智能业务的护城河。
“拥有高质量数据的任何人都可以训练有用的垂直模型。当垂直模型在较大的劳动力规模上使用时,更高质量的数据将开发并恢复到该模型,从而实现'的影响'数据飞轮'。“ Wei Liang认为有三个步骤可以提供质量数据,尤其是数据技术,数据工程和数据管理:
数据技术包括新一代的标签技术和合成技术。当前,有一些技术内容,知识的高密度和高价值。来自顶级行业专家的高度数据可能价值数十亿美元,这是新一代标签技术的方向。合成技术最初用于解决隐私问题,但现在它也能够应对不足的培训集,包括使用物理模拟,统计模型,机械研究和其他领域。数据工程旨在提高模型数据集的管理和效率,也就是说,它可以大大和高效地生成有用的数据集。开发人员可以围绕管理系统的五个主要因素建造数据工程T和维护,质量控制,资源操作和合规性。数据管理意味着在数据控制过程以及安全性和合规性中实现高质量和可靠性。必须是数据管理中的道德要求,以便数据管理更好地提供数据集构建。
Wei Liang说,高质量数据集的建设是改善人工智能绩效的关键,并保证了促进“人工智能 +”动作的实施。随着“人工智能+”动作的发布,它标志着新的数据驱动阶段的录取。通过AI数据技术,数据工程和数据管理,我们可以共同促进高质量数据元素的良好供应。
(编辑:Sun Hongli,Lu Qian)
遵循官方帐户:人 - 金融融资
分享让许多人看到