专家解读之二 | 繁荣数据标注产业,赋能人工智能高质量发展
文 | 中国信息通信研究院副院长 魏亮
准确理解数据标注产业的内涵和重要性
数据标注是连接数据资源、算法模型与实际应用场景的关键桥梁,是挖掘数据要素价值的关键环节,是人工智能高质量数据集的核心生产力。
(一)从服务国家战略的政治高度定义数据标注产业
狭义来讲,数据标注是指对未经处理的原始数据添加说明、解释、分类或编码的过程,以便数据可以被人工智能算法所理解和使用。《实施意见》从服务国家战略的角度提出,数据标注产业是指对数据进行筛选、清洗、分类、注释、标记和质量检验等加工处理的新兴产业。通过数据治理各环节协同发展,数据标注产业带动数据要素产业的持续健康发展,并奠定人工智能产业发展的坚实基础。
(二)深刻认识发展数据标注产业的重要意义
充分发挥数据标注基地的示范引领作用
国家数据局统筹开展数据标注基地建设,2024年5月24日发布承担数据标注基地建设任务的城市名单,指导承担单位重点围绕技术创新、行业赋能、生态培育、标准应用、人才培养、数据安全等六大任务开展相关试点工作。
(一)明确数据标注基地建设任务要求
数据标注基地建设既是对国家重点工作要求的承接,也是服务和支撑地方经济发展大局的关键路径。《实施意见》提出,鼓励和支持数据标注基地先行先试,打造一批科技水平高、资源集聚强、辐射带动广的典型样板。具体来说,就是鼓励承担试点任务的城市主动开展先行先试,真正把数据标注产业打造成为区域经济高质量发展的新引擎,形成对人工智能高水平自强自立发展的有效支撑。
(二)着力围绕六大任务形成标杆示范
数据标注任务发布以来,各地方主动开展实践探索。在技术创新方面,推动数据标注化“人工”为“智能”,研发自动化和半自动化的标注工具,搭建一体化服务平台,大幅提升数据标注效率及准确性、安全性。在行业赋能方面,通过数据标注带动行业高质量数据集建设,赋能传统产业向数字化、智能化转型。在生态培育方面,加快数据标注龙头企业引育,构建数据标注产业链、价值链和生态系统,带动数字经济产业发展。在标准应用方面,围绕数据标注技术和行业需求,引导企业积极参与标准编制和相关标准在标注过程中的应用。在人才培养方面,通过设立实训基地、举办职业技能大赛等多种形式,推动产教融合发展,培育高端标注人才队伍,形成对就业的带动效应。在数据安全方面,建立数据分类分级安全保护制度,构建数据安全风险防控体系,推动常态化、规范化的数据安全运营。
(三)做好经验总结与复制推广
着力构建完善的数据标注产业生态
完善的产业生态建设对数据标注行业发展至关重要,有助于推动产业链上下游的整合与协同,为行业健康发展提供了基础和保障。
(一)激发各类经营主体的活力
数据标注产业健康有序发展,需要各类主体共同参与和协作。《实施意见》提出要着力壮大经营主体,发挥数据标注龙头企业、科技创新性企业、瞪羚企业和独角兽企业、中小企业等各类主体在数据标注产业发展中的作用,推动数据标注技术的发展和应用,促进产业生态的构建,提升行业竞争力。数据标注龙头企业拥有强大的技术实力和市场影响力,通过自建数据标注平台,推动技术创新和行业标准的制定,在数据标注产业中扮演引领和示范角色。科技创新型企业是推动数据标注技术进步的重要力量,通过研发先进的数据标注工具,提高标注效率和准确性,促进产业的技术升级和应用拓展。瞪羚企业和独角兽企业以其独特的核心技术和市场潜力,成为数据标注行业的领军者和创新标杆。数据标注中小企业通过提供定制化的数据标注服务,满足特定领域和细分市场的需求。
(二)畅通数据标注产业链环节
《实施意见》提出,要畅通数据采集、标注、人工智能应用产业链,推动数据标注产业上下游协同发展,完善数据标注产业生态。数据标注产业链可分为三个部分:上游资源提供方提供原始数据,同时又是数据标注业务的场景赋能对象。中游数据标注核心服务方提供数据标注技术服务、平台服务、交易服务和人力服务,有效提高数据价值,助力数据产业价值释放。下游配套支撑方从标准应用、人才培养、生态培养和安全保障等四个方面赋能数据标注核心产业。推动上游资源提供方、中游数据标注核心服务方和下游配套支撑方产业链协同发展,构建更加完善、高效的产业生态。
(三)推动数据标注业务走出去,技术和人才引进来
《实施意见》提出,依托我国数据基础设施优势,鼓励国内企业承接数据标注国际业务。具体来说,就是要推动我国数据标注企业逐步走向国际市场,拓展海外业务,为国际供给一批符合我国社会主义核心价值观的高质量数据集。《实施意见》提出,开展数据标注科技人才国际交流,深化数据标注领域技术及产业国际合作,支持企事业单位牵头制定数据标注国际标准。具体来说,就是要培养一批具有国际视野的数据标注人才,加速人才链与产业链的有效对接,显著增强中国在全球数据标注产业中的影响力,主导形成国际统一的数据标准和共享机制,促进数据标注产业高质量、国际化发展。
总之,《实施意见》为数据标注产业指明了高质量发展的方向,对于数据标注产业的政策支持、创新驱动、生态培育、需求牵引和服务保障等方面都具有积极的推动作用。以政策为牵引,通过政、产、学、研、用多方协同,我国数据标注产业将迎来繁荣发展,为人工智能高质量发展奠定坚实的数据底座。