《关于促进数据标注产业高质量发展的实施意见》提出到2027年,数据标注产业的技术手段、创新模式、应用范围和产业生态等多方面的发展目标:
一、技术手段
1. 智能化程度显著提升
目标是数据标注的工具和技术将更加智能化。例如,通过开发更先进的自动化标注算法,利用机器学习和深度学习技术,实现对文本、图像、音频、视频等多种类型数据的高精度自动标注。像在图像标注领域,能够自动识别图像中的物体、场景、人物等元素并进行准确标注,减少人工标注的工作量和误差。
标注技术将更加适应复杂的数据类型和标注任务。例如对于三维点云数据(在自动驾驶、虚拟现实等领域广泛应用)的标注,能够实现高效、精准的标注,以满足这些领域对人工智能模型训练数据的需求。
二、创新模式
1. 多元创新模式涌现
在商业模式创新方面,会出现更多样化的数据标注服务模式。除了传统的按任务量付费的模式,可能会发展出基于数据标注质量、数据使用效果付费的模式。例如,如果数据标注后的数据集用于训练的人工智能模型在特定指标上达到很高的性能,数据标注服务提供商可以获得额外的收益。
在标注协作模式创新上,有望形成跨区域、跨组织的标注协作网络。比如,通过整合高校、科研机构、企业等多方资源,构建大规模的分布式标注协作平台。高校学生可以利用课余时间参与标注任务,科研机构提供标注技术指导,企业负责项目管理和市场对接,实现资源的高效整合和优势互补。
三、应用范围
1. 广泛覆盖多行业领域
在医疗健康领域,数据标注将为人工智能辅助医疗诊断、疾病预测等应用提供高质量的数据支持。例如,对大量的医学影像(如X光、CT等)进行标注,标注出病变部位、类型等信息,用于训练人工智能模型,提高模型对疾病的诊断准确率。
在工业制造领域,数据标注有助于推动智能制造的发展。如对工业生产线上的传感器数据进行标注,包括设备运行状态、故障特征等,为基于人工智能的设备故障预测和维护系统提供数据基础,实现生产设备的智能运维,提高生产效率,降低生产成本。
在农业领域,数据标注可以服务于智能农业的发展。例如对农作物图像进行标注,识别病虫害、作物生长阶段等信息,通过人工智能模型为农民提供精准的种植决策建议,如施肥量、灌溉时机等。
四、产业生态
1. 形成完善的产业生态系统
在产业主体方面,将培育出一批具有国际竞争力的数据标注企业,涵盖大型综合数据标注企业和专注于特定领域(如自动驾驶数据标注、金融数据标注等)的专业性企业。这些企业在技术水平、服务质量、数据安全管理等方面达到国际先进标准。
在人才培养方面,建立起完善的人才培养体系。包括在高校和职业院校设置相关专业课程,培养数据标注工程师、数据标注项目经理等专业人才。同时,开展在职人员的继续教育和培训,提高整个产业的人才素质。
在标准规范方面,建立健全的数据标注产业标准和规范体系。包括数据标注的质量评估标准、数据安全管理规范、标注人员资质认证标准等,确保产业的健康、有序发展。
|
|