CN113918713A - 数据标注方法、装置、计算机设备及存储介质 - Google Patents

数据标注方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN113918713A
CN113918713A CN202111105409.6A CN202111105409A CN113918713A CN 113918713 A CN113918713 A CN 113918713A CN 202111105409 A CN202111105409 A CN 202111105409A CN 113918713 A CN113918713 A CN 113918713A
Authority
CN
China
Prior art keywords
data
template
tag
label
acquiring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111105409.6A
Other languages
English (en)
Inventor
汤海波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Fubao Technology Co ltd
Original Assignee
Nanjing Fubao Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Fubao Technology Co ltd filed Critical Nanjing Fubao Technology Co ltd
Priority to CN202111105409.6A priority Critical patent/CN113918713A/zh
Publication of CN113918713A publication Critical patent/CN113918713A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Technology Law (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本方案涉及一种数据标注方法、装置、计算机设备及存储介质。所述方法包括:采集各个保险产品数据,根据各个保险产品数据生成各个知识标签,将各个知识标签存储至数据库中;获取各个标注项目,分别查找与各个标注项目对应的各个目标知识标签,根据各个目标知识标签生成各个父标签模板;获取待标注项目,从各个父标签模板中查询与待标注项目对应的目标父标签模板,将项目标注数据导入至目标父标签模板中;采集待标注保险产品,根据目标父标签模板,对待标注保险产品进行标注。知识标签是根据保险产品数据生成的,根据知识标签生成父标签模板,从而对待标注保险产品进行标注,用户可以直观的看到保险产品结构化产品信息,降低了对保险的理解成本。

Description

数据标注方法、装置、计算机设备及存储介质
技术领域
本发明涉及数据处理技术领域,特别是涉及一种数据标注方法、装置、计算机设备及存储介质。
背景技术
保险条款是保险公司与投保人关于保险权利义务的约定,是保险合同的核心内容。保险合同是一种定式合同,一般而言,条款由保险公司单方面制订,具有内容复杂、专业性强和非结构化的特点。现有的保险知识结构设计覆盖度低,颗粒度粗,定义不明晰,无法从完整提取一份保单的细节信息,而保险条款通常表述复杂冗长,规则描述充斥在细节里面,语义生涩难懂,不利于消费者阅读且同时也不利于保险公司风险管理。保险购买者在阅读保险条款时,或保险经纪人在录入保险条款信息时,往往难以找寻到保险产品的关键信息,如保险责任给付的条件、结果、限制等。
因此,传统的保险条款中,复杂冗长的条款易导致消费者对保险合同信息提取不完整,需要花费大量时间去理解保险合同,从而增加用户理解保险的成本。
发明内容
基于此,为了解决上述技术问题,提供一种数据标注方法、装置、计算机设备和存储介质,可以降低用户对保险产品的理解成本。
一种数据标注方法,所述方法包括:
采集各个保险产品数据,根据各个所述保险产品数据生成各个知识标签,并将各个所述知识标签存储至数据库中;
获取各个标注项目,分别查找与各个所述标注项目对应的各个目标知识标签,并根据各个所述目标知识标签生成各个父标签模板;
获取待标注项目,从各个所述父标签模板中查询与所述待标注项目对应的目标父标签模板,将项目标注数据导入至所述目标父标签模板中;
采集待标注保险产品,根据所述目标父标签模板,对所述待标注保险产品进行标注。
在其中一个实施例中,所述根据各个所述保险产品数据生成各个知识标签,包括:
分别获取各个所述保险产品数据的标签类型;
根据所述标签类型对各个所述保险产品数据进行分类,得到各个所述保险产品数据的类别汇总;
按照类别汇总后的数据类别将各个所述保险产品数据生成各个知识标签。
在其中一个实施例中,在根据各个所述目标知识标签生成各个父标签模板之后,所述方法还包括:
获取标签添加指令,并根据所述标签添加指令展示所述父标签模板;
通过所述父标签模板采集新增标签,并更新所述父标签模板中的各个所述目标知识标签。
在其中一个实施例中,所述方法还包括:
当检测到子标签模板创建指令时,展示所述父标签模板;
通过所述父标签模板采集子标签模板创建数据,并根据所述子标签模板创建数据在所述父标签模板下生成子标签模板。
在其中一个实施例中,在将项目标注数据导入至所述目标父标签模板中之前,所述方法还包括:
通过所述目标父标签模板获取动态信息;
根据所述动态信息采集所述项目标注数据。
在其中一个实施例中,所述对所述待标注保险产品进行标注,包括:
将所述保险产品数据分别发送至第一终端、第二终端;
接收从所述第一终端反馈的第一标注结果,以及从所述第二终端反馈的第二标注结果。
在其中一个实施例中,所述方法还包括:
比较所述第一标注结果与所述第二标注结果;
当所述第一标注结果与所述第二标注结果不一致时,采集对所述第一标注结果的修改数据,或对所述第二标注结果的修改数据;根据所述修改数据生成结构化文件;或
当所述第一标注结果与所述第二标注结果不一致时,将所述第一标注结果反馈至所述第一终端,并接收所述第一终端发送的修改数据;或将所述第二标注结果反馈至所述第二终端,并接收所述第二终端发送的修改后数据;根据所述修改数据生成结构化文件。
一种数据标注装置,所述装置包括:
标签生成模块,用于采集各个保险产品数据,根据各个所述保险产品数据生成各个知识标签,并将各个所述知识标签存储至数据库中;
模板生成模块,用于获取各个标注项目,分别查找与各个所述标注项目对应的各个目标知识标签,并根据各个所述目标知识标签生成各个父标签模板;
数据导入模块,用于获取待标注项目,从各个所述父标签模板中查询与所述待标注项目对应的目标父标签模板,将项目标注数据导入至所述目标父标签模板中;
产品标注模块,用于采集待标注保险产品,根据所述目标父标签模板,对所述待标注保险产品进行标注。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
采集各个保险产品数据,根据各个所述保险产品数据生成各个知识标签,并将各个所述知识标签存储至数据库中;
获取各个标注项目,分别查找与各个所述标注项目对应的各个目标知识标签,并根据各个所述目标知识标签生成各个父标签模板;
获取待标注项目,从各个所述父标签模板中查询与所述待标注项目对应的目标父标签模板,将项目标注数据导入至所述目标父标签模板中;
采集待标注保险产品,根据所述目标父标签模板,对所述待标注保险产品进行标注。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
采集各个保险产品数据,根据各个所述保险产品数据生成各个知识标签,并将各个所述知识标签存储至数据库中;
获取各个标注项目,分别查找与各个所述标注项目对应的各个目标知识标签,并根据各个所述目标知识标签生成各个父标签模板;
获取待标注项目,从各个所述父标签模板中查询与所述待标注项目对应的目标父标签模板,将项目标注数据导入至所述目标父标签模板中;
采集待标注保险产品,根据所述目标父标签模板,对所述待标注保险产品进行标注。
上述数据标注方法、装置、计算机设备和存储介质,通过采集各个保险产品数据,根据各个所述保险产品数据生成各个知识标签,并将各个所述知识标签存储至数据库中;获取各个标注项目,分别查找与各个所述标注项目对应的各个目标知识标签,并根据各个所述目标知识标签生成各个父标签模板;获取待标注项目,从各个所述父标签模板中查询与所述待标注项目对应的目标父标签模板,将项目标注数据导入至所述目标父标签模板中;采集待标注保险产品,根据所述目标父标签模板,对所述待标注保险产品进行标注。由于知识标签是根据保险产品数据生成的,根据知识标签生成父标签模板,从而对保险产品数据进行标注,用户可以直观的看到保险产品中的标注情况,降低了用户对保险产品的理解成本。
附图说明
图1为一个实施例中数据标注方法的应用环境图;
图2为一个实施例中数据标注方法的流程示意图;
图3为一个实施例中数据标注装置的结构框图;
图4为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述终端,但这些终端不受这些术语限制。这些术语仅用于将第一个终端与另一个终端区分。举例来说,在不脱离本申请的范围的情况下,可以将第一终端称为第二终端,且类似地,可将第二终端称为第一终端。第一终端和第二终端两者都是终端,但其不是同一终端。
本申请实施例提供的数据标注方法,可以应用于如图1所示的应用环境中。如图1所示,该应用环境包括计算机设备110。计算机设备110可以采集各个保险产品数据,根据各个保险产品数据生成各个知识标签,并将各个知识标签存储至数据库中;计算机设备110可以获取各个标注项目,分别查找与各个标注项目对应的各个目标知识标签,并根据各个目标知识标签生成各个父标签模板;计算机设备110可以获取待标注项目,从各个父标签模板中查询与待标注项目对应的目标父标签模板,将项目标注数据导入至目标父标签模板中;计算机设备110可以采集待标注保险产品,根据目标父标签模板,对待标注保险产品进行标注。其中,计算机设备110可以但不限于是各种个人计算机、笔记本电脑、机器人、无人飞行器、平板电脑等设备。
在一个实施例中,如图2所示,提供了一种数据标注方法,包括以下步骤:
步骤202,采集各个保险产品数据,根据各个保险产品数据生成各个知识标签,并将各个知识标签存储至数据库中。
其中,保险产品数据可以包括保险合同基本信息,例如合同编号、适用对象、缴费方式等;保险产品数据还可以包括投保条件,例如年龄要求、职业要求、收入要求等;保险产品数据还可以包括保险理赔,例如赔付条件、赔付金额等。
用户可以通过计算机设备输入各个保险产品数据,计算机设备在采集到各个保险产品数据后,可以根据各个保险产品数据生成各个知识标签。其中,知识标签可以按照标签的标准设计,可以包括标签名称、标签数据类型、标签是否快判、是否允许多条件输入等。其中,标签数据类型可以包括文本框(默认值)、数字类型、日期类型、单选下拉框字典类型、多选下拉框字典类型等。计算机设备可以将生成的各个知识标签存储到数据库中。
步骤204,获取各个标注项目,分别查找与各个标注项目对应的各个目标知识标签,并根据各个目标知识标签生成各个父标签模板。
标注项目可以用于表示不同标注的合作项目。计算机设备可以获取各个不同的标注项目,每个标注项目都有唯一的一个标注父标签模板,计算机设备可以根据获取到的标注项目查找到对应的目标知识标签,其中,目标知识标签可以从是数据库中的各个知识标签查找到的。计算机设备可以根据各个目标知识标签生成各个父标签模板,其中,标签模板可以是知识标签的集合。计算机设备可以根据查找的各个目标知识标签生成各个父标签模板。具体的,标注可以是基于标签模板下的标签进行标注。在本实施例中,用户还可以通过excel上传标签模板,计算机设备可以将上传的标签模板生成父标签模板。
步骤206,获取待标注项目,从各个父标签模板中查询与待标注项目对应的目标父标签模板,将项目标注数据导入至目标父标签模板中。
待标注项目可以是用户按照保险公司的要求创建的数据标注项目。由于每一个标注项目都对应有父标签模板,计算机设备在获取到待标注项目后,可以进一步从各个父标签模板中查询到与待标注项目对应的目标父标签模板。
用户可以通过计算机设备对目标父标签模板进行设置,设置完成后,可以批量将项目标注数据导入到目标父标签模板中。
步骤208,采集待标注保险产品,根据目标父标签模板,对待标注保险产品进行标注。
待标注保险产品可以用于表示需要进行标注的保险合同,计算机设备可以采集待标注保险产品,具体的,用户可以将待标注保险产品导入至计算机设备中。
计算机设备可以根据目标父标签模板对待标注保险产品进行标注,从而完成待标注保险产品的标注操作。
在本实施例中,计算机设备通过采集各个保险产品数据,根据各个保险产品数据生成各个知识标签,并将各个知识标签存储至数据库中;获取各个标注项目,分别查找与各个标注项目对应的各个目标知识标签,并根据各个目标知识标签生成各个父标签模板;获取待标注项目,从各个父标签模板中查询与待标注项目对应的目标父标签模板,将项目标注数据导入至目标父标签模板中;采集待标注保险产品,根据目标父标签模板,对待标注保险产品进行标注。由于知识标签是根据保险产品数据生成的,根据知识标签生成父标签模板,从而对保险产品数据进行标注,用户可以直观的看到保险产品中的标注情况,降低了用户对保险产品的理解成本。
在一个实施例中,提供的一种数据标注方法还可以包括生成各个知识标签的过程,具体过程包括:分别获取各个保险产品数据的标签类型;根据标签类型对各个保险产品数据进行分类,得到各个保险产品数据的数据类别;按照数据类别将各个保险产品数据生成各个知识标签。
计算机设备可以分别获取各个保险产品数据的标签类型,由于保险产品数据有多个,计算机设备可以根据标签类型对各个保险产品数据进行分类,并进一步得到各个保险产品数据的数据类别,从而生成知识标签。
其中,知识标签的级数可以包括5-6级,用户通过计算机设备进行设置时可以自由决定级数;标签类型中包括单选、多选、文本框等,单选、多选需要用户通过计算机设备另外设置选项内容。
在一个实施例中,提供的一种数据标注方法还可以包括更新父标签模板中标签的过程,具体过程包括:获取标签添加指令,并根据标签添加指令展示父标签模板;通过父标签模板采集新增标签,并更新父标签模板中的各个目标知识标签。
其中,标签添加指令可以是用户通过触发显示界面中的添加控件产生的,用户可以在父标签模板生成后,后续动态添加标签。计算机设备可以通过标签添加指令展示父标签模板,从而通过增量方式将新增标签添加到父标签模板中,计算机设备可以通过新增标签来更新父标签模板中的各个目标知识标签,从而得到更新后的父标签模板。在本实施例中,标签输入方式可以设置为快判,快判即快速判断,是指该标签无需标注,直接人工判断输入或选择。
在一个实施例中,提供的一种数据标注方法还可以包括创建子标签模板的过程,具体过程包括:当检测到子标签模板创建指令时,展示父标签模板;通过父标签模板采集子标签模板创建数据,并根据子标签模板创建数据在父标签模板下生成子标签模板。
父标签模板下可以挂多个子标签模板,子标签模板是知识标签按照标注效率、用途的分类维护。子标签模板创建指令可以是用户通过点击显示界面中的创建控件触发产生的,当计算机设备检测到子标签模板创建指令时,可以在显示界面中展示父标签模板,使得用户可以在父标签模板中输入子标签模板创建数据,进而生成子标签模板。其中,父标签模板中的新增标签,在子标签模板中也可以使用。
在一个实施例中,提供的一种数据标注方法还可以包括采集项目标注数据的过程,具体过程包括:通过目标父标签模板获取动态信息;根据动态信息采集项目标注数据。
用户按照保险公司创建数据标注项目,根据每个项目,选择对应的标注模板,并且可以设置质检用户、验收用户等动态信息。计算机设备可以通过目标父标签模板获取动态信息,进而采集项目标注数据。
在一个实施例中,提供的一种数据标注方法还可以包括对待标注保险产品进行标注的过程,具体过程包括:将待标注保险产品分别发送至第一终端、第二终端;接收从第一终端反馈的第一标注结果,以及从第二终端反馈的第二标注结果。
在本实施例中,待标注保险产品可以作为一个标注任务。在确定和保险公司的标注合同后,保险公司会提交待标注保险产品过来。用户可以通过访问计算机设备中的操作系统,将待标注保险产品上传到系统中,在数据库中形成待标注保险产品数据列表。通过系统,可以查看目前项目所有待标注保险产品列表,系统可以支持单选、多选标注文件,用户可以进行任务创建,同时选择标注的标签模板和标注组或者标注员,这样就可以完成标注任务的创建,并形成标注任务数据库。
其中,用户通过计算机设备中的操作系统将待标注保险产品上传后,可以进一步通过计算机设备创建标注任务,且标注任务的时候,可以选择特定子标签模板进行标注;如果是多个子标签模板并行标注的,计算机设备中的操作系统可以自动将标注结果进行横向数据合并,形成完整的标签数据实例。
第一终端、第二终端可以是与标注员相对应的终端,标注员可以通过登录对应终端上的系统,查看到标注任务,进而进入标注工作。其中,同一份待标注保险产品可以分配给不同终端的标注员进行标注工作。即,计算机设备可以将待标注保险产品分别发送至第一终端、第二终端,第一终端、第二终端对应的标注员可以同时进行标注操作,并向计算机设备返回第一标注结果、第二标注结果。其中,标注员领取到标注任务后,可以立刻进行标注,也可以将标注结果存储起来,最后一起提交。标注员通过第一终端或者第二终端进行标注的时候,可以选择手工输入数据、也可以按照数据类型,快判选择数据,同时也可以通过OCR技术,动态识别pdf文件指定输入区域的文字;同时,终端上的操作系统可以根据标签类型,复制多个标注条件,比如单个保险条款多个保险金的情形,可以根据实际情况动态增加情形。此时,由于标注员已经完成了标注任务,第一终端、第二终端显示界面中的标注任务可以转换为待质检状态,等待对标注结果的进一步检验。在进行标注的时候,计算机设备的显示界面中可以同时拥有框选和文字选中两种标注方式,标注员可以通过框选或者文字选中的方式进行标注。
在又一个实施例中,提供的一种数据标注方法还可以包括生成标注文件的过程,具体过程包括:比较第一标注结果与第二标注结果;当第一标注结果与第二标注结果不一致时,采集对第一标注结果的修改数据,或对第二标注结果的修改数据;根据修改数据生成结构化文件;或,当第一标注结果与第二标注结果不一致时,将第一标注结果反馈至第一终端,并接收第一终端发送的修改数据;或将第二标注结果反馈至第二终端,并接收第二终端发送的修改后数据;根据修改数据生成结构化文件。
计算机设备可以比较第一终端返回的第一标注结果与第二终端返回的第二标注结果,并得到比较结果。具体的,计算机设备的待质检列表中,用户可以点击待质检任务,计算机设备会自动把两名标注员标注的数据展开,并自动根据标签,比较标注内容是否一致,从而得到比较结果。用户可以通过父标签模板对标签名称和属性名称进行增删改,并且增删改可以自动同步到已标注结果。
当计算机设备得到的比较结果是第一标注结果与第二标注结果不一致时,计算机设备对应的质检员可以对不一致的内容进行二次核查,质检员可以通过计算机设备对第一标注结果获取对第二标注结果进行修改,计算机设备可以获取到修改数据,并根据修改数据生成结构化文件;质检员还可以通过计算机设备将第一标注结果反馈至第一终端或者将第二标注结果反馈至第二终端,由第一终端或者第二终端对应的标注员对标注结果进行修改,并采集修改数据,从而根据修改数据生成结构化文件。其中,质检员通过计算机设备查看查看已标注的标签时,能方便地跳转至该标签所标注的对应内容处,并强调显示,便于质检员查看。
验收员可以通过计算机设备再次对标注员和质检员的数据进行确认,如果有数据标注不对的,可以将标注任务退回,重新进行标注;如果确认标注数据完整和正确,验收员直接确认后,后台数据库就形成了完整的标注数据库。
在本实施例中,通过这种方式,质检员可以重点关注标注内容有差异的内容,而不用关注一致的内容,从而提升了质检效率;验收员通过计算机设备对标注数据进行再次确认,提高了数据标注的准确性。
应该理解的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图3所示,提供了一种数据标注装置,包括:标签生成模块310、模板生成模块320、数据导入模块330和产品标注模块340,其中:
标签生成模块310,用于采集各个保险产品数据,根据各个保险产品数据生成各个知识标签,并将各个知识标签存储至数据库中;
模板生成模块320,用于获取各个标注项目,分别查找与各个标注项目对应的各个目标知识标签,并根据各个目标知识标签生成各个父标签模板;
数据导入模块330,用于获取待标注项目,从各个父标签模板中查询与待标注项目对应的目标父标签模板,将项目标注数据导入至目标父标签模板中;
产品标注模块340,用于采集待标注保险产品,根据目标父标签模板,对待标注保险产品进行标注。
在一个实施例中,标签生成模块310还用于分别获取各个保险产品数据的标签类型;根据标签类型对各个保险产品数据进行分类,得到各个保险产品数据的类别汇总;按照类别汇总后的数据类别将各个保险产品数据生成各个知识标签。
在一个实施例中,模板生成模块320还用于获取标签添加指令,并根据标签添加指令展示父标签模板;通过父标签模板采集新增标签,并更新父标签模板中的各个目标知识标签。
在一个实施例中,模板生成模块320还用于当检测到子标签模板创建指令时,展示父标签模板;通过父标签模板采集子标签模板创建数据,并根据子标签模板创建数据在父标签模板下生成子标签模板。
在一个实施例中,数据导入模块330还用于通过目标父标签模板获取动态信息;根据动态信息采集项目标注数据。
在一个实施例中,产品标注模块340还用于将待标注保险产品分别发送至第一终端、第二终端;接收从第一终端反馈的第一标注结果,以及从第二终端反馈的第二标注结果。
在一个实施例中,产品标注模块340还用于比较第一标注结果与第二标注结果;当第一标注结果与第二标注结果不一致时,采集对第一标注结果的修改数据,或对第二标注结果的修改数据;根据修改数据生成结构化文件;或,当第一标注结果与第二标注结果不一致时,将第一标注结果反馈至第一终端,并接收第一终端发送的修改数据;或将第二标注结果反馈至第二终端,并接收第二终端发送的修改后数据;根据修改数据生成结构化文件。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种数据标注方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
采集各个保险产品数据,根据各个保险产品数据生成各个知识标签,并将各个知识标签存储至数据库中;
获取各个标注项目,分别查找与各个标注项目对应的各个目标知识标签,并根据各个目标知识标签生成各个父标签模板;
获取待标注项目,从各个父标签模板中查询与待标注项目对应的目标父标签模板,将项目标注数据导入至目标父标签模板中;
采集待标注保险产品,根据目标父标签模板,对待标注保险产品进行标注。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:分别获取各个保险产品数据的标签类型;根据标签类型对各个保险产品数据进行分类,得到各个保险产品数据的类别汇总;按照类别汇总后的数据类别将各个保险产品数据生成各个知识标签。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取标签添加指令,并根据标签添加指令展示父标签模板;通过父标签模板采集新增标签,并更新父标签模板中的各个目标知识标签。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:当检测到子标签模板创建指令时,展示父标签模板;通过父标签模板采集子标签模板创建数据,并根据子标签模板创建数据在父标签模板下生成子标签模板。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:通过目标父标签模板获取动态信息;根据动态信息采集项目标注数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将待标注保险产品分别发送至第一终端、第二终端;接收从第一终端反馈的第一标注结果,以及从第二终端反馈的第二标注结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:比较第一标注结果与第二标注结果;当第一标注结果与第二标注结果不一致时,采集对第一标注结果的修改数据,或对第二标注结果的修改数据;根据修改数据生成结构化文件;或,当第一标注结果与第二标注结果不一致时,将第一标注结果反馈至第一终端,并接收第一终端发送的修改数据;或将第二标注结果反馈至第二终端,并接收第二终端发送的修改后数据;根据修改数据生成结构化文件。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
采集各个保险产品数据,根据各个保险产品数据生成各个知识标签,并将各个知识标签存储至数据库中;
获取各个标注项目,分别查找与各个标注项目对应的各个目标知识标签,并根据各个目标知识标签生成各个父标签模板;
获取待标注项目,从各个父标签模板中查询与待标注项目对应的目标父标签模板,将项目标注数据导入至目标父标签模板中;
采集待标注保险产品,根据目标父标签模板,对待标注保险产品进行标注。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:分别获取各个保险产品数据的标签类型;根据标签类型对各个保险产品数据进行分类,得到各个保险产品数据的类别汇总;按照类别汇总后的数据类别将各个保险产品数据生成各个知识标签。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取标签添加指令,并根据标签添加指令展示父标签模板;通过父标签模板采集新增标签,并更新父标签模板中的各个目标知识标签。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:当检测到子标签模板创建指令时,展示父标签模板;通过父标签模板采集子标签模板创建数据,并根据子标签模板创建数据在父标签模板下生成子标签模板。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:通过目标父标签模板获取动态信息;根据动态信息采集项目标注数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将待标注保险产品分别发送至第一终端、第二终端;接收从第一终端反馈的第一标注结果,以及从第二终端反馈的第二标注结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:比较第一标注结果与第二标注结果;当第一标注结果与第二标注结果不一致时,采集对第一标注结果的修改数据,或对第二标注结果的修改数据;根据修改数据生成结构化文件;或,当第一标注结果与第二标注结果不一致时,将第一标注结果反馈至第一终端,并接收第一终端发送的修改数据;或将第二标注结果反馈至第二终端,并接收第二终端发送的修改后数据;根据修改数据生成结构化文件。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种数据标注方法,其特征在于,所述方法包括:
采集各个保险产品数据,根据各个所述保险产品数据生成各个知识标签,并将各个所述知识标签存储至数据库中;
获取各个标注项目,分别查找与各个所述标注项目对应的各个目标知识标签,并根据各个所述目标知识标签生成各个父标签模板;
获取待标注项目,从各个所述父标签模板中查询与所述待标注项目对应的目标父标签模板,将项目标注数据导入至所述目标父标签模板中;
采集待标注保险产品,根据所述目标父标签模板,对所述待标注保险产品进行标注。
2.根据权利要求1所述的数据标注方法,其特征在于,所述根据各个所述保险产品数据生成各个知识标签,包括:
分别获取各个所述保险产品数据的标签类型;
根据所述标签类型对各个所述保险产品数据进行分类,得到各个所述保险产品数据的类别汇总;
按照类别汇总后的数据类别将各个所述保险产品数据生成各个知识标签。
3.根据权利要求1所述的数据标注方法,其特征在于,在根据各个所述目标知识标签生成各个父标签模板之后,所述方法还包括:
获取标签添加指令,并根据所述标签添加指令展示所述父标签模板;
通过所述父标签模板采集新增标签,并更新所述父标签模板中的各个所述目标知识标签。
4.根据权利要求3所述的数据标注方法,其特征在于,所述方法还包括:
当检测到子标签模板创建指令时,展示所述父标签模板;
通过所述父标签模板采集子标签模板创建数据,并根据所述子标签模板创建数据在所述父标签模板下生成子标签模板。
5.根据权利要求1所述的数据标注方法,其特征在于,在将项目标注数据导入至所述目标父标签模板中之前,所述方法还包括:
通过所述目标父标签模板获取动态信息;
根据所述动态信息采集所述项目标注数据。
6.根据权利要求1所述的数据标注方法,其特征在于,所述对所述待标注保险产品进行标注,包括:
将所述待标注保险产品分别发送至第一终端、第二终端;
接收从所述第一终端反馈的第一标注结果,以及从所述第二终端反馈的第二标注结果。
7.根据权利要求6所述的数据标注方法,其特征在于,所述方法还包括:
比较所述第一标注结果与所述第二标注结果;
当所述第一标注结果与所述第二标注结果不一致时,采集对所述第一标注结果的修改数据,或对所述第二标注结果的修改数据;根据所述修改数据生成结构化文件;或
当所述第一标注结果与所述第二标注结果不一致时,将所述第一标注结果反馈至所述第一终端,并接收所述第一终端发送的修改数据;或将所述第二标注结果反馈至所述第二终端,并接收所述第二终端发送的修改后数据;根据所述修改数据生成结构化文件。
8.一种数据标注装置,其特征在于,所述装置包括:
标签生成模块,用于采集各个保险产品数据,根据各个所述保险产品数据生成各个知识标签,并将各个所述知识标签存储至数据库中;
模板生成模块,用于获取各个标注项目,分别查找与各个所述标注项目对应的各个目标知识标签,并根据各个所述目标知识标签生成各个父标签模板;
数据导入模块,用于获取待标注项目,从各个所述父标签模板中查询与所述待标注项目对应的目标父标签模板,将项目标注数据导入至所述目标父标签模板中;
产品标注模块,用于采集待标注保险产品,根据所述目标父标签模板,对所述待标注保险产品进行标注。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202111105409.6A 2021-09-22 2021-09-22 数据标注方法、装置、计算机设备及存储介质 Pending CN113918713A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111105409.6A CN113918713A (zh) 2021-09-22 2021-09-22 数据标注方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111105409.6A CN113918713A (zh) 2021-09-22 2021-09-22 数据标注方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN113918713A true CN113918713A (zh) 2022-01-11

Family

ID=79235420

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111105409.6A Pending CN113918713A (zh) 2021-09-22 2021-09-22 数据标注方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN113918713A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115223166A (zh) * 2022-09-20 2022-10-21 整数智能信息技术(杭州)有限责任公司 图片预标注方法、图片标注方法及装置、电子设备
CN116127180A (zh) * 2022-11-09 2023-05-16 乾三(北京)科技有限公司 一种标签配置方法、装置、计算机设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108711110A (zh) * 2018-08-14 2018-10-26 中国平安人寿保险股份有限公司 保险产品推荐方法、装置、计算机设备和存储介质
CN109492021A (zh) * 2018-09-26 2019-03-19 平安科技(深圳)有限公司 企业画像信息查询方法、装置、计算机设备和存储介质
CN110750694A (zh) * 2019-09-29 2020-02-04 支付宝(杭州)信息技术有限公司 数据标注实现方法及装置、电子设备、存储介质
CN110825914A (zh) * 2019-10-31 2020-02-21 广州市百果园信息技术有限公司 一种资源的标注管理系统
CN112035675A (zh) * 2020-08-31 2020-12-04 康键信息技术(深圳)有限公司 医疗文本标注方法、装置、设备及存储介质
CN112883234A (zh) * 2021-02-18 2021-06-01 北京明略昭辉科技有限公司 标签数据的生成方法及装置、存储介质、电子设备
CN113139109A (zh) * 2021-04-20 2021-07-20 Oppo广东移动通信有限公司 数据标注方法、装置、服务器及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108711110A (zh) * 2018-08-14 2018-10-26 中国平安人寿保险股份有限公司 保险产品推荐方法、装置、计算机设备和存储介质
CN109492021A (zh) * 2018-09-26 2019-03-19 平安科技(深圳)有限公司 企业画像信息查询方法、装置、计算机设备和存储介质
CN110750694A (zh) * 2019-09-29 2020-02-04 支付宝(杭州)信息技术有限公司 数据标注实现方法及装置、电子设备、存储介质
CN110825914A (zh) * 2019-10-31 2020-02-21 广州市百果园信息技术有限公司 一种资源的标注管理系统
CN112035675A (zh) * 2020-08-31 2020-12-04 康键信息技术(深圳)有限公司 医疗文本标注方法、装置、设备及存储介质
CN112883234A (zh) * 2021-02-18 2021-06-01 北京明略昭辉科技有限公司 标签数据的生成方法及装置、存储介质、电子设备
CN113139109A (zh) * 2021-04-20 2021-07-20 Oppo广东移动通信有限公司 数据标注方法、装置、服务器及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115223166A (zh) * 2022-09-20 2022-10-21 整数智能信息技术(杭州)有限责任公司 图片预标注方法、图片标注方法及装置、电子设备
CN116127180A (zh) * 2022-11-09 2023-05-16 乾三(北京)科技有限公司 一种标签配置方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
US11250209B2 (en) Document collaboration and consolidation tools and methods of use
US11599716B2 (en) Systems and methods for annotating and linking electronic documents
US9514414B1 (en) Systems and methods for identifying and categorizing electronic documents through machine learning
AU2009238294B2 (en) Data transformation based on a technical design document
US20150032645A1 (en) Computer-implemented systems and methods of performing contract review
US20150095841A1 (en) Systems and methods for composable analytics
US11106906B2 (en) Systems and methods for information extraction from text documents with spatial context
US11682091B2 (en) Management systems and methods for claim-based patent analysis
CN113918713A (zh) 数据标注方法、装置、计算机设备及存储介质
US11625660B2 (en) Machine learning for automatic extraction and workflow assignment of action items
US20200142954A1 (en) Document Production by Conversion from Wireframe to Darwin Information Typing Architecture (DITA)
CN112836018A (zh) 应急预案的处理方法及装置
US20230102947A1 (en) Providing operations in accordance with worksheet relationships and data object relationships
CN112286934A (zh) 数据库表导入方法、装置、设备及介质
US20200293577A1 (en) Using a single-entry access point to archive data in and out of an electronic document review and reporting system
US20210174013A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
CN108897727B (zh) 合同备案方法、装置、计算机设备和存储介质
KR20220046380A (ko) 콘텐츠 자산 분류 및 관리시스템
US11372875B2 (en) Using a single-entry access point to archive data in and out of an electronic document review and reporting system
CN112084376A (zh) 基于图谱知识的推荐方法、推荐系统及电子装置
KR102532216B1 (ko) Esg 보조 툴을 이용하여 정형화된 esg 데이터로 이루어진 esg 데이터베이스를 구축하는 방법 및 이를 수행하는 esg 서비스 제공 시스템
TWM590730U (zh) 基於人工智慧之文件管理系統
CN111125483B (zh) 网页数据抽取模板生成方法、装置、计算机装置及存储介质
US11238110B2 (en) Using a single-entry access point to archive data in and out of an electronic documents review and reporting system
KR102043434B1 (ko) 조사 보고서 작성 장치 및 조사 보고서 작성 디스플레이 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination