本发明涉及一种基于人机协同学习的数据标注方法,其包括:
1、由领域专家制定分类标准和标注规范,并给出样例作为金标数据;
2、以金标数据作为聚类的中心点对数据进行聚类处理,选出银标数据来训练标注人员,利用金标数据对标注人员进行测试,测试通过即可进行下一步的标注;
3、利用金标数据和银标数据作为训练集对未分类的数据进行分类,得到的置信度高的数据可直接采用,并将其加入训练数据集重新训练分类器;
4、从待标注数据集中选取出最值得标注的数据,分发给标注人员进行标注,将得到的标注结果加入训练集重新训练分类器;迭代步骤3和4,直至分类器的精度达到预设的阈值。本发明能够有效降低人工标注的成本,同时保证标注的高质量。
易创经云咨询有限公司
XXX月前
该服务非常好,速度快,售后很好!该服务非常好,速度快,售后很好!该服务非常好,速度快,售后很好!该服务非常好,速度快,售后很好!该服务非常好,速度快,售后很好!该服务非常好,速度快,售后很好!该服务非常好,速度快,售后很好!该服务非常好,速度快,售后很好!
易创经云咨询有限公司易创经云咨询有限公司
XXX月前
该服务非常好,速度快,售后很好!