2025年3月,全国首个数据标注产业专项规划《合肥数据标注产业发展规划(2025-2027年)》正式发布,标志着我国数据要素产业化进程迈出关键一步。作为人工智能发展的核心"燃料",数据标注产业正成为推动智能技术与实体经济深度融合的新引擎。合肥市以打造"国际领先的数据标注创新基地"为目标,计划到2027年底形成3000TB标注数据规模,撬动千亿级相关产业生态。
产业筑基:从政策引领驱动到生态协同跨越
截至2025年3月,合肥数据标注总规模已达933.3TB,企业总数突破35家,总产值累计8.63亿元,初步形成覆盖数据采集、清洗、标注、应用的全链条生态。据合肥市数据资源管理局总工程师彭辉介绍,到2027年,产业规模将突破30亿元,支撑智能网联汽车、医疗AI等重点领域形成千亿级市场。合肥将围绕“人工智能+”和“数据要素×”重点行业,将构建11个以上行业高质量数据集,打造国际上有特色、有影响力的数据标注基地,合肥市高新区将被打造成数据要素核心引领区,力争成为全球领先的数据标注产业高地。
技术创新:推动数据标注与人工智能深度耦合
在自动驾驶领域,安徽飞数信息科技有限公司自主研发的AI预标注工具与飞智标众包平台协同,实现了对点云连续帧数据的高效标注,支持3D车道线识别、障碍物跟踪等复杂任务,标注准确率达95%以上,将标注效率提升1倍、成本降低50%,助力车企快速迭代自动驾驶算法,缩短商业化落地周期。在医疗影像领域,安徽飞数通过语义分割与病灶标注技术,为AI辅助诊断模型提供高精度训练样本,准确率超98%,此类垂类数据的积累,正打破医疗AI“数据孤岛”,推动诊疗流程的智能化转型。
痛点破局:积极探寻产业升级实践路径
3 月 19 日,由国家数据局主办的 “数据标注领域民营企业座谈会” 在成都召开,合肥市数据产业协会秘书长、安徽飞数信息科技有限公司常务副总谭昶,针对行业痛点提出五大系统性建议,为产业升级提供实践路径:
一是标准筑基,构建统一规范体系。针对行业标准缺失导致的质量参差与协作低效问题,建议分层次推进标准制定,由行业协会联合龙头企业、数据需求方,针对大模型、自动驾驶、医疗影像等场景制定标注规范与质量评估细则,并通过国家数据局择优升级为国家标准。此举可提升标注结果通用性,推动行业从 “劳动外包”向“标准化产品”转型。
二是共享破壁,畅通数据流通机制。为解决高质量数据流通难题,提出 “激励相容”共享方案,建设国家级 / 区域级数据标注公共服务平台,实施 “数据券补贴 + 共享义务” 联动机制。企业享受数据标注补贴时需承担数据共享责任,同时将国家数据局供需对接会转化为线上化、常态化服务。特别建议地方政府通过平台开放交通、气象等公共数据标注权限,形成数据要素市场化配置示范。
三是技术攻坚,加速智能标注突破。面对多模态数据处理需求,呼吁以 “揭榜挂帅” 模式支持关键技术攻关,包括智能预标注、数据合成及复杂场景处理技术。强调政府采购优先选用国产标注工具,要求服务采购包含平台使用费,倒逼企业技术自主创新。
四是人才育用,完善职业认证体系。针对人社部现行 “人工智能训练师” 认证滞后问题,建议增设大模型标注、专业领域标注等专项能力认证,并配套岗位津贴、个税优惠等政策吸引跨领域人才。提出构建 “产教融合 + 技能大赛 + 专项培训” 立体培养体系,破解医疗、法律等领域 “专家型标注员” 短缺困境。
五是区域协同,优化产业空间布局。针对部分地区园区同质化竞争,提出 “梯度分工”策略,中西部承接图片标注、方言标注等基础业务,东部聚焦多语言处理、3D点云标注等高附加值领域。建议通过国家数据标注基地制定行业自律公约与分级定价标准,推动企业技术共享与订单协同,避免低价恶性竞争,形成全国差异化发展格局。
未来图景:新质生产力崛起的新高地
数据标注是人工智能与大数据模型快速发展下衍生出来的新兴行业,是新时代新质生产力的重要领域之一,是人工智能、具身智能、智能网联汽车等产业发展的支撑产业。随着《规划》的发布与实施,合肥数据标注产业将迎来新的发展机遇,有望在全国乃至全球数据标注领域发挥引领作用,推动人工智能产业迈向新高度。
(安徽广播电视台 袁自明)