CN109446357A - 数据标注方法和装置 - Google Patents
数据标注方法和装置 Download PDFInfo
- Publication number
- CN109446357A CN109446357A CN201811216115.9A CN201811216115A CN109446357A CN 109446357 A CN109446357 A CN 109446357A CN 201811216115 A CN201811216115 A CN 201811216115A CN 109446357 A CN109446357 A CN 109446357A
- Authority
- CN
- China
- Prior art keywords
- mark
- instruction
- marked
- data
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000012545 processing Methods 0.000 claims description 38
- 230000033001 locomotion Effects 0.000 claims description 33
- 230000011218 segmentation Effects 0.000 claims description 26
- 239000012634 fragment Substances 0.000 claims description 10
- 235000013399 edible fruits Nutrition 0.000 claims description 2
- 230000008569 process Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 14
- 238000002372 labelling Methods 0.000 description 7
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
Landscapes
- User Interface Of Digital Computer (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明公开了一种数据标注方法和装置。其中,该方法包括:加载待标注数据,其中,待标注数据包含标注对象;显示待标注数据;接收快捷标注指令,其中,快捷标注指令用于快速选中待标注数据中的标注对象并进行标注;根据快捷标注指令,生成标注结果;显示标注结果。本发明解决了现有的数据标注方式效率较低的技术问题。
Description
技术领域
本发明涉及数据处理领域,具体而言,涉及一种数据标注方法和装置。
背景技术
随着计算机和互联网技术的快速发展和普及,互联网上存在海量的数据,这些数据主要以图像、文本、音频和视频等作为信息载体,对这些信息载体进行标注已成为计算机数据训练的重要基础。
在现有的技术方案中,针对图像定位标注主要是通过矩形、折线和曲线进行框选;针对文本标注主要是通过光标选择文本后,对选择好的文本进行标注;针对视频标注主要是对重要的关键帧中的物体进行位置标注,对关键帧之间的帧生成匀速的补间动画;针对音频标注主要手动对音频波纹图形进行分割,分割后对每一段音频标注出转录的文本。这些标注方式的效率都非常的低下。
针对上述现有的数据标注方式效率较低的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种数据标注方法和装置,以至少解决现有的数据标注方式效率较低的技术问题。
根据本发明实施例的一个方面,提供了一种数据标注方法,包括:加载待标注数据,其中,待标注数据包含标注对象;显示待标注数据;接收快捷标注指令,其中,快捷标注指令用于快速选中待标注数据中的标注对象并进行标注;
根据快捷标注指令,生成标注结果;显示标注结果。
进一步地,待标注数据为图像,其中,接收快捷标注指令,包括:接收设定指令,其中,设定指令用于设定框选标注对象的框选图形;接收对标注对象的框选指令,其中,框选指令用于在待标注图像中生成覆盖标注对象的框选区域,框选区域的形状为设定指令设定的框选图形。
进一步地,接收对标注对象的框选指令,包括如下任意之一:接收对待标注图像中第一位置和第二位置的点击指令,其中,第一位置和第二位置均位于标注对象所在区域外;第一位置与第二位置之间的直接连线穿过标注对象;接收对待标注图像中第三位置和第四位置的点击指令,其中,第三位置位于标注对象所在区域外;第四位置位于标注对象所在区域内;第三位置与第四位置之间的直接连线部分穿过标注对象;接收对待标注图像的第一点击滑动指令,其中,第一点击滑动指令的开始位置和结束位置均位于标注对象所在区域外;第一点击滑动指令的开始位置与结束位置之间的直接连线穿过标注对象;接收对待标注图像的第二点击滑动指令,其中,第二点击滑动指令的开始位置位于标注对象所在区域内,第二点击滑动指令的结束位置位于标注对象所在区域外;第二点击滑动指令的开始位置与结束位置之间的直接连线部分穿过标注对象。
进一步地,根据快捷标注指令,生成标注结果,包括:对框选区域内的标注对象进行处理,生成贴合标注对象边缘的多边形或曲线边框;对贴合标注对象边缘的多边形或曲线边框进行标注,得到标注结果。
进一步地,待标注数据为文本,其中,在接收快捷标注指令之前,方法还包括:对待标注文本进行分词处理,得到待标注文本对应的分词结果。
进一步地,接收快捷标注指令,包括:接收点击指令,其中,点击指令用于点击分词结果中一个或多个分词。
进一步地,待标注数据为视频,其中,接收快捷标注指令,包括:在待标注视频的起始帧的图像中,接收对标注对象的第一框选指令;在待标注视频的截止帧的图像中,接收对标注对象的第二框选指令。
进一步地,根据快捷标注指令,生成标注结果,包括:根据第一框选指令和第二框选指令,生成标注对象的第一运动曲线;根据第一框选指令和第二框选指令,对待标注视频的每一帧图像中的标注对象进行分析,得到标注对象的第二运动曲线;根据第一运动曲线和第二运动曲线,确定标注对象的第三运动曲线,其中,第三运动曲线为最接近标注对象实际运动的运动曲线;基于第三运动曲线对待标注视频中的标注对象进行标注,得到标注结果。
进一步地,待标注数据为音频,其中,在接收快捷标注指令之前,方法还包括:对待标注音频进行音频分割,得到多段独立的音频片段。
进一步地,接收快捷标注指令,包括:接收对多段独立的音频片段中任一音频片段的标注指令。
根据本发明实施例的另一方面,还提供了一种数据标注装置,包括:标注对象载入装置,用于加载待标注数据,其中,待标注数据包含标注对象;数据预览装置,与标注对象载入装置相连,用于显示待标注数据,以及接收快捷标注指令,其中,快捷标注指令用于快速选中待标注数据中标注对象并进行标注;数据处理装置,与数据预览装置相连,用于根据快捷标注指令,生成标注结果;数据导出装置,与数据处理装置相连,用于导出标注结果;其中,数据预览装置还用于显示标注结果。
根据本发明实施例的另一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,程序执行上述的数据标注方法。
根据本发明实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述的数据标注方法。
在本发明实施例中,在加载包含标注对象的待标注数据后,显示待标注数据,以便用户可以通过一些快捷标注操作对待标注数据中待标注的标注对象进行标注,根据用户的快捷标注操作,生成相应的标注结果并显示,达到了对文本、图像、视频和音频等任意一种形式的数据进行快速标注的目的,从而实现了提高数据标注效率的技术效果,进而解决了现有的数据标注方式效率较低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种数据标注方法流程图;
图2是根据本发明实施例的一种数据标注装置示意图;
图3是根据本发明实施例的一种可选的图像标注方法流程图;
图4是根据本发明实施例的第一种人工标注图像的过程示意图;
图5是根据本发明实施例的第一种人工标注图像的框选结果示意图;
图6是根据本发明实施例的第二种人工标注图像的过程示意图;
图7是根据本发明实施例的第二种人工标注图像的框选结果示意图;
图8是根据本发明实施例的第三种人工标注图像的过程示意图;
图9是根据本发明实施例的第三种人工标注图像的框选结果示意图;
图10是根据本发明实施例的第四种人工标注图像的过程示意图;
图11是根据本发明实施例的第四种人工标注图像的框选结果示意图;
图12是根据本发明实施例的一种可选的文本标注方法流程图;
图13是根据本发明实施例的第一种人工标注文本的过程示意图;
图14是根据本发明实施例的第二种人工标注文本的过程示意图;
图15是根据本发明实施例的一种可选的视频标注方法流程图;
图16是根据本发明实施例的一种人工标注视频的过程示意图;
图17是根据本发明实施例的一种可选的音频标注方法流程图;以及
图18是根据本发明实施例的一种人工标注音频的过程示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例,提供了一种数据标注方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种数据标注方法流程图,如图1所示,该方法包括如下步骤:
S101,加载待标注数据,其中,待标注数据包含标注对象;
S102,显示待标注数据;
S103,接收快捷标注指令,其中,快捷标注指令用于快速选中待标注数据中的标注对象并进行标注;
S104,根据快捷标注指令,生成标注结果;
S105,显示标注结果。
需要说明的是,上述待标注数据可以是但不限于文本、图像、音频和视频等任意一种形式的数据,上述标注对象是指待标注数据中待标注的对象,例如,一句话中的某个词,一幅图像中的某个物体,一段音频中某段音频,一段视频中某个移动的物体。
通过上述S101至S105公开的方案,在加载包含标注对象的待标注数据后,将待标注数据在界面上显示,以便用户在该界面上对待标注数据中的标注对象进行标注,根据用户输入的快捷标注指令,生成相应的标注结果,并通过界面显示。其中,快捷标注指令是指可以快速对待标注数据中的标注对象进行选中并进行标注的指令,例如,通过一键点击操作便可选中一句话中的某个词,或者一段音频中的某段音频;又或者,通过较少的点击或滑动操作便可选中一幅图像中的某个物体,或者一段视频中某个移动的物体。
下面,本发明实施例以图像、文本、视频和音频分别为例来进行详细说明。
作为第一种可选的实施方式,上述待标注数据为图像,其中,接收快捷标注指令,包括:接收设定指令,其中,设定指令用于设定框选标注对象的框选图形;接收对标注对象的框选指令,其中,框选指令用于在待标注图像中生成覆盖标注对象的框选区域,框选区域的形状为设定指令设定的框选图形。
其中,接收对标注对象的框选指令,包括但不限于如下任意一种方式:
方式一,接收对待标注图像中第一位置和第二位置的点击指令,其中,第一位置和第二位置均位于标注对象所在区域外;第一位置与第二位置之间的直接连线穿过标注对象;
方式二,接收对待标注图像中第三位置和第四位置的点击指令,其中,第三位置位于标注对象所在区域外;第四位置位于标注对象所在区域内;第三位置与第四位置之间的直接连线部分穿过标注对象;
方式三,接收对待标注图像的第一点击滑动指令,其中,第一点击滑动指令的开始位置和结束位置均位于标注对象所在区域外;第一点击滑动指令的开始位置与结束位置之间的直接连线穿过标注对象;
方式四,接收对待标注图像的第二点击滑动指令,其中,第二点击滑动指令的开始位置位于标注对象所在区域内,第二点击滑动指令的结束位置位于标注对象所在区域外;第二点击滑动指令的开始位置与结束位置之间的直接连线部分穿过标注对象。
可选地,上述框选图形的形状可以是但不限于圆形、椭圆形、三角形、正方形、矩形或任意一种形状的多边形,只要可以将标注对象圈起来的图形即可。
进一步地,基于上述第一种可选的实施方式,上述S104可以包括:对框选区域内的标注对象进行处理,生成贴合标注对象边缘的多边形或曲线边框;对贴合标注对象边缘的多边形或曲线边框进行标注,得到标注结果。
作为第二种可选的实施方式,待标注数据为文本,其中,在接收快捷标注指令之前,方法还包括:对待标注文本进行分词处理,得到待标注文本对应的分词结果。
此处需要说明的是,对待标注文本进行分词处理可以是软件采用一定的算法自动进行处理的。只有系统自动对待标注文本进行分词预处理,才能使得用户通过快捷标注指令(例如,点击指令)来选中一个或多个分词。由于对文本进行分词处理的算法很多,本申请不再赘述。本申请旨在保护对待标注文本进行预处理操作,以便使得用户可以通过简单的快捷标注指令对待标注文本进行快速标注的方案。
进一步地,基于上述第二种可选的实施方式,上述S103可以包括:接收点击指令,其中,点击指令用于点击分词结果中一个或多个分词。
作为第三种可选的实施方式,上述待标注数据为视频,其中,S103可以包括:在待标注视频的起始帧的图像中,接收对标注对象的第一框选指令;在待标注视频的截止帧的图像中,接收对标注对象的第二框选指令。
进一步地,基于上述第三种可选的实施方式,S104可以包括:根据第一框选指令和第二框选指令,生成标注对象的第一运动曲线;根据第一框选指令和第二框选指令,对待标注视频的每一帧图像中的标注对象进行分析,得到标注对象的第二运动曲线;根据第一运动曲线和第二运动曲线,确定标注对象的第三运动曲线,其中,第三运动曲线为最接近标注对象实际运动的运动曲线;基于第三运动曲线对待标注视频中的标注对象进行标注,得到标注结果。
作为第四种可选的实施方式,上述待标注数据为音频,其中,在S103之前,上述方法还包括:对待标注音频进行音频分割,得到多段独立的音频片段。
此处需要说明的是,对待标注音频进行分割处理也可以是软件采用一定的算法自动进行处理的。只有系统自动对待标注音频进行分割预处理,得到多段独立的音频片段,才能使得用户通过快捷标注指令(例如,点击指令)来选中任意一段音频,以实现快速标注音频。对音频进行分割的方式包括但不限于按照空白音频进行分割的方式,显然根据具体的应用场景,可以按照其他规则分割音频,此处本申请也不再赘述。本申请旨在保护对待标注音频进行预处理操作,以便使得用户可以通过简单的快捷标注指令对待标注音频进行快速标注的方案。
进一步地,基于上述第三种可选的实施方式,待标注数据为音频,其中,S103可以包括:接收对所述多段独立的音频片段中任一音频片段的标注指令。
根据本发明实施例,还提供了一种用于实现上述数据标注方法的装置实施例,图2是根据本发明实施例的一种数据标注装置示意图,如图2所示,该装置包括:标注对象载入装置201、数据预览装置202、数据处理装置203和数据导出装置204。
其中,标注对象载入装置201,用于加载待标注数据,其中,待标注数据包含标注对象;
数据预览装置202,与标注对象载入装置相连,用于显示待标注数据,以及接收快捷标注指令,其中,快捷标注指令用于快速选中待标注数据中的标注对象并进行标注;
数据处理装置203,与数据预览装置相连,用于根据快捷标注指令,生成标注结果;
数据导出装置204,与数据处理装置相连,用于导出标注结果;
其中,数据预览装置202还用于显示标注结果。
下面,结合图2所示的数据标注装置,分别以图像、文本、视频和音频为例来进一步详细说明本发明实施例。
图3是根据本发明实施例的一种可选的图像标注方法流程图,如图3所示,包括如下步骤:
S100,标注对象载入装置将图像载入;
S110,数据预览装置对图像进行预览显示;
S120,设定框选图形,例如矩形、正方形、椭圆形或圆形等;
S130,人工对待标注图像中需要标注的标注对象进行一次框选,框选动作为使用鼠标或触屏进行操作;
S140,软件根据S130的框选动作,生成S120设定的框选图形,该图形覆盖整个标注对象;
S150,数据处理装置根据框选区域,对区域内的内容自动生成贴合标注对象边缘的多边形或曲线边框标注结果;
S160,数据预览装置对标注结果进行预览显示;
S170,数据导出装置将标注结果导出。
对应于上述S130的一种实施例,作为一种可选的实施方式,图4是根据本发明实施例的第一种人工标注图像的过程示意图,如图4所示,包括如下步骤:
S200,在标注对象外部某一个位置点击;
S220,拖动鼠标到标注对象外部另一个位置,保证S200和S220之间的直接连线穿过标注对象S210。
由图4可以看出,在标注对象区域外点击一次,然后滑动到另一个位置释放点击,这两个位置之间的直接连线穿过标注对象,使得所需要标注的内容被框选。图5是根据本发明实施例的第一种人工标注图像的框选结果示意图,如图5所示,根据S200和S220的位置,生成矩形框选边框S230,保证标注对象S210在S230内部。
对应于上述S130的一种实施例,作为第二种可选的实施方式,图6是根据本发明实施例的第二种人工标注图像的过程示意图,如图6所示,包括如下步骤:
S240,在标注对象内部某一个位置点击;
S250,拖动鼠标到标注对象外部某一个位置,保证S240和S250之间的直接连线部分穿过标注对象S210。
由图6可以看出,在标注对象区域内点击一次,然后滑动到另一个位置释放点击,两个位置之间的直接连线部分穿过标注对象,使得所需要标注的内容被框选。图7是根据本发明实施例的第二种人工标注图像的框选结果示意图,如图7所示,根据S240和S250的位置,生成椭圆形框选边框S260,保证标注对象S210在S260内部。
对应于上述S130的一种实施例,作为第三种可选的实施方式,图8是根据本发明实施例的第三种人工标注图像的过程示意图,如图8所示,包括如下步骤:
第一步:S300,在标注对象外部某一个位置点击;
第二步:S310,在标注对象外部某一个位置点击;保证S300和S310之间的直接连线穿过标注对象S310。
由图8可以看出,在标注对象区域外点击两次,两次点击位置之间的直接连线穿过标注对象,使得所需要标注的内容被框选。图9是根据本发明实施例的第三种人工标注图像的框选结果示意图,如图9所示,根据S300和S310的位置,生成矩形框选边框S330,保证标注对象S310在S330内部。
对应于上述S130的一种实施例,作为第四种可选的实施方式,图10是根据本发明实施例的第四种人工标注图像的过程示意图,如图10所示,包括如下步骤:
S340,在标注对象内部某一个位置点击;
S350,在标注对象外部某一个位置点击,保证S340和S350之间的直接连线部分穿过标注对象S310。
由图10可以看出,在标注对象区域内点击一次,然后在标注对象区域外点击一次,两次点击位置之间的直接连线部分穿过标注对象,使得所需要标注的内容被框选。图11是根据本发明实施例的第四种人工标注图像的框选结果示意图,如图11所示,根据S340和S350的位置,生成椭圆形框选边框S360,保证标注对象S310在S360内部。
图12是根据本发明实施例的一种可选的文本标注方法流程图,如图12所示,包括如下步骤:
S400,标注对象载入装置将文本载入;
S410,数据预览装置对文本进行预览显示;
S420,数据处理装置对文本进行分词处理;
S430,人工对待标注文本中需要标注的内容进行一次点击标注,标注过程使用鼠标或触屏进行操作;
S440,数据处理装置根据点击对象,生成标注结果;
S450,数据预览装置对标注结果进行预览显示;
S460,数据导出装置将标注结果导出。
需要说明的是,上述人工标注文本的操作流程包括但不限于:(1)用户将鼠标移动到文本上;(2)数据预览装置根据数据处理装置的分词结果,针对当前鼠标对应位置的文本,给出包含该文本的分词高亮提示或框选提示;(3)人工点击文本。
对应于上述S430的一种实施例,作为第一种可选的实施方式,图13是根据本发明实施例的第一种人工标注文本的过程示意图,如图13所示,包括如下步骤:
第一步:经过数据处理装置分词处理之后,标注对象S500中包含的S510已被分词处理;
第二步:将鼠标移动到S510上,则该分词会高亮显示;
第三步:点击高亮文本S520进行标注。
对应于上述S430的一种实施例,作为第二种可选的实施方式,图14是根据本发明实施例的第二种人工标注文本的过程示意图,如图14所示,包括如下步骤:
第一步:经过数据处理装置分词处理之后,标注对象S500中包含的S510已被分词处理;
第二步:将鼠标移动到S510上,则该分词会框选显示;
第三步:点击高亮文本S530进行标注。
图15是根据本发明实施例的一种可选的视频标注方法流程图,如图15所示,包括如下步骤:
S600,标注对象载入装置将视频载入;
S610,数据预览装置对视频进行预览显示;
S620,在待标注视频起始帧图像中需要标注的对象进行框选,框选动作为使用鼠标或触屏进行操作;框选的操作方式包括但不限于上文对图像中标注对象进行框选的四种方式,此处不再赘述;
S630,在待标注视频截止帧图像中需要标注的对象进行框选,框选动作为使用鼠标或触屏进行操作;框选的操作方式包括但不限于上文对图像中标注对象进行框选的四种方式,此处不再赘述;
S640,数据处理装置根据第S620和S630两次框选动作,自动拟合标注对象的直线运动曲线;
S650,数据处理装置根据S620和S630两次框选动作,对视频中每一帧图像中的标注对象进行分析处理,自动拟合一条标注对象运动曲线;
S660,数据处理装置根据S640和S650得到的两条拟合曲线,结合其他参数(例如时间参数等),修正得到最终的运动曲线;
S670,数据处理装置根据S660得到的最终拟合结果对标注对象进行自动标注;
S680,数据预览装置对标注结果进行预览显示;
S690,数据导出装置将标注结果导出。
作为一种可选的实施方式,图16是根据本发明实施例的一种人工标注视频的过程示意图,如图16所示,包括如下步骤:
第一步:对视频起始帧中的标注对象S700进行框选得到S710;
第二步:对视频结束帧中的标注对象S700进行框选得到S750;
第三步:数据处理装置根据S710和S750得到直线拟合曲线S720;
第四步:数据处理装置根据S710和S750,对S700分析处理得到一条拟合曲线S730;
第五步:数据处理装置根据S720和S730,结合时间S760等参数,得到最终的修正曲线S740;
第六步:数据处理装置根据S740对标注对象进行自动标注。
图17是根据本发明实施例的一种可选的音频标注方法流程图,如图17所示,包括如下步骤:
S800,标注对象载入装置将音频载入;
S810,数据预览装置对音频波纹进行预览显示;
S820,数据处理装置根据波纹的图形对空白音段进行切割自动将音频分割成多段独立的语音(需要说明的是,数据处理装置对音频分割的方式包括但不限于此处基于空白音频分割的方式,根据实际场景不同,可以采用不同的音频分割方式,本发明实施例旨在保护对音频先分割预处理,以便用户可以通过简单的点击操作来选中某段音频进行标注);
S830,人工对切割之后的独立语音进行标注;
S840,数据预览装置对标注结果进行预览显示;
S850,数据导出装置将标注结果导出。
作为一种可选的实施方式,图18是根据本发明实施例的一种人工标注音频的过程示意图,如图18所示,包括如下步骤:
第一步:数据处理装置根据载入波纹S900的图形对空白音段进行切割自动将音频分割成多段独立的语音S910;
第二步:人工对S910进行标注得到文本S920。
根据本发明实施例,还提供了一种存储介质,存储介质包括存储的程序,其中,程序执行上述方法实施例中任意一项的可选的或优选的数据标注方法。
根据本发明实施例,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述方法实施例中任意一项的可选的或优选的数据标注方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (11)
1.一种数据标注方法,其特征在于,包括:
加载待标注数据,其中,所述待标注数据包含标注对象;
显示所述待标注数据;
接收快捷标注指令,其中,所述快捷标注指令用于快速选中所述待标注数据中的标注对象并进行标注;
根据所述快捷标注指令,生成标注结果;
显示所述标注结果。
2.根据权利要求1所述的方法,其特征在于,所述待标注数据为图像,其中,接收快捷标注指令,包括:
接收设定指令,其中,所述设定指令用于设定框选标注对象的框选图形;
接收对标注对象的框选指令,其中,所述框选指令用于在待标注图像中生成覆盖标注对象的框选区域,所述框选区域的形状为所述设定指令设定的框选图形。
3.根据权利要求2所述的方法,其特征在于,接收对标注对象的框选指令,包括如下任意之一:
接收对待标注图像中第一位置和第二位置的点击指令,其中,所述第一位置和所述第二位置均位于标注对象所在区域外;所述第一位置与所述第二位置之间的直接连线穿过标注对象;
接收对待标注图像中第三位置和第四位置的点击指令,其中,所述第三位置位于标注对象所在区域外;所述第四位置位于标注对象所在区域内;所述第三位置与所述第四位置之间的直接连线部分穿过标注对象;
接收对待标注图像的第一点击滑动指令,其中,所述第一点击滑动指令的开始位置和结束位置均位于标注对象所在区域外;所述第一点击滑动指令的开始位置与结束位置之间的直接连线穿过标注对象;
接收对待标注图像的第二点击滑动指令,其中,所述第二点击滑动指令的开始位置位于标注对象所在区域内,所述第二点击滑动指令的结束位置位于标注对象所在区域外;所述第二点击滑动指令的开始位置与结束位置之间的直接连线部分穿过标注对象。
4.根据权利要求2所述的方法,其特征在于,根据所述快捷标注指令,生成标注结果,包括:
对所述框选区域内的标注对象进行处理,生成贴合所述标注对象边缘的多边形或曲线边框;
对所述贴合所述标注对象边缘的多边形或曲线边框进行标注,得到标注结果。
5.根据权利要求1所述的方法,其特征在于,所述待标注数据为文本,其中,在接收快捷标注指令之前,所述方法还包括:
对待标注文本进行分词处理,得到所述待标注文本对应的分词结果。
6.根据权利要求5所述的方法,其特征在于,接收快捷标注指令,包括:
接收点击指令,其中,所述点击指令用于点击所述分词结果中一个或多个分词。
7.根据权利要求1所述的方法,其特征在于,所述待标注数据为视频,其中,接收快捷标注指令,包括:
在待标注视频的起始帧的图像中,接收对标注对象的第一框选指令;
在待标注视频的截止帧的图像中,接收对所述标注对象的第二框选指令。
8.根据权利要求6所述的方法,其特征在于,根据所述快捷标注指令,生成标注结果,包括:
根据所述第一框选指令和所述第二框选指令,生成所述标注对象的第一运动曲线;
根据所述第一框选指令和所述第二框选指令,对待标注视频的每一帧图像中的标注对象进行分析,得到所述标注对象的第二运动曲线;
根据所述第一运动曲线和所述第二运动曲线,确定所述标注对象的第三运动曲线,其中,所述第三运动曲线为最接近所述标注对象实际运动的运动曲线;
基于所述第三运动曲线对所述待标注视频中的标注对象进行标注,得到标注结果。
9.根据权利要求1所述的方法,其特征在于,所述待标注数据为音频,其中,在接收快捷标注指令之前,所述方法还包括:
对待标注音频进行音频分割,得到多段独立的音频片段。
10.根据权利要求9所述的方法,其特征在于,接收快捷标注指令,包括:
接收对所述多段独立的音频片段中任一音频片段的标注指令。
11.一种数据标注装置,其特征在于,包括:
标注对象载入装置,用于加载待标注数据,其中,所述待标注数据包含标注对象;
数据预览装置,与所述标注对象载入装置相连,用于显示所述待标注数据,以及接收快捷标注指令,其中,所述快捷标注指令用于快速选中所述待标注数据中标注对象并进行标注;
数据处理装置,与所述数据预览装置相连,用于根据所述快捷标注指令,生成标注结果;
数据导出装置,与所述数据处理装置相连,用于导出所述标注结果;
其中,所述数据预览装置还用于显示所述标注结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811216115.9A CN109446357B (zh) | 2018-10-18 | 2018-10-18 | 数据标注方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811216115.9A CN109446357B (zh) | 2018-10-18 | 2018-10-18 | 数据标注方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109446357A true CN109446357A (zh) | 2019-03-08 |
CN109446357B CN109446357B (zh) | 2021-01-05 |
Family
ID=65546780
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811216115.9A Expired - Fee Related CN109446357B (zh) | 2018-10-18 | 2018-10-18 | 数据标注方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109446357B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111400581A (zh) * | 2020-03-13 | 2020-07-10 | 京东数字科技控股有限公司 | 用于标注样本的系统、方法和装置 |
CN111666735A (zh) * | 2020-07-07 | 2020-09-15 | 腾讯科技(深圳)有限公司 | 图像文本标注显示方法和装置、存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103425690A (zh) * | 2012-05-22 | 2013-12-04 | 湖南家工场网络技术有限公司 | 一种基于样式表的图片信息标注和展示方法 |
US20140115441A1 (en) * | 2008-02-19 | 2014-04-24 | Google Inc. | Annotating Video Intervals |
CN106385640A (zh) * | 2016-08-31 | 2017-02-08 | 北京旷视科技有限公司 | 视频标注方法及装置 |
-
2018
- 2018-10-18 CN CN201811216115.9A patent/CN109446357B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140115441A1 (en) * | 2008-02-19 | 2014-04-24 | Google Inc. | Annotating Video Intervals |
CN103425690A (zh) * | 2012-05-22 | 2013-12-04 | 湖南家工场网络技术有限公司 | 一种基于样式表的图片信息标注和展示方法 |
CN106385640A (zh) * | 2016-08-31 | 2017-02-08 | 北京旷视科技有限公司 | 视频标注方法及装置 |
Non-Patent Citations (4)
Title |
---|
ABHISHEK DUTTA等: "VGG Image Annotator", 《VGG IMAGE ANNOTATOR》 * |
LLUIS CASTREJON等: "Annotating Object Instances with a Polygon-RNN", 《2017 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》 * |
找标注网: "标注网站使用方法", 《标注网站使用方法》 * |
聂震云: "基于众包的数据标注系统", 《万方数据》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111400581A (zh) * | 2020-03-13 | 2020-07-10 | 京东数字科技控股有限公司 | 用于标注样本的系统、方法和装置 |
CN111400581B (zh) * | 2020-03-13 | 2024-02-06 | 京东科技控股股份有限公司 | 用于标注样本的系统、方法和装置 |
CN111666735A (zh) * | 2020-07-07 | 2020-09-15 | 腾讯科技(深圳)有限公司 | 图像文本标注显示方法和装置、存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109446357B (zh) | 2021-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104780093B (zh) | 即时通讯过程中的表情信息处理方法及装置 | |
CN109714644B (zh) | 一种视频数据的处理方法、装置、计算机设备和存储介质 | |
CN107071542A (zh) | 视频片段播放方法及装置 | |
US9405847B2 (en) | Contextual grouping of a page | |
JP2023017938A (ja) | 文書を編集するためのプログラム、方法、及び装置 | |
US20120185787A1 (en) | User interface interaction behavior based on insertion point | |
CN110534108A (zh) | 一种语音交互方法及装置 | |
EP1091303A3 (en) | Method and system for providing alternatives for text derived from stochastic input sources | |
EP1605348A3 (en) | Image processing apparatus control method therefor and program | |
EP1182586A3 (en) | System and method for acquisition of related graphical material in a digital graphics album | |
CN109446357A (zh) | 数据标注方法和装置 | |
WO2007008524A3 (en) | Rich drag drop user interface | |
CN1633648A (zh) | 在文本消息中表达感情的方法 | |
CN109388506B (zh) | 一种数据处理方法及电子设备 | |
EP1662363A2 (en) | User interface desiiign apparatus and method | |
CN110519638A (zh) | 处理方法、处理装置、电子装置和存储介质 | |
CN107040457B (zh) | 一种即时通信方法和装置 | |
CN109032731B (zh) | 一种面向操作系统的基于语义理解的语音互动方法及系统 | |
JP2009271498A (ja) | プレゼンテーション制御システムおよびコンピュータプログラム | |
CN109388705B (zh) | 一种文本意图分类方法 | |
CN112416229A (zh) | 音频内容调整方法、装置和电子设备 | |
CN107103312A (zh) | 一种图片处理方法及装置 | |
CN113903067A (zh) | 虚拟对象视频的生成方法、装置、设备及介质 | |
JP2018092582A (ja) | 情報処理方法、情報処理装置、及び、プログラム | |
CN108133209A (zh) | 一种文本识别中的目标区域搜索方法及其装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210105 |