CN111552665B - 标注信息格式转换方法、装置、设备和介质 - Google Patents

标注信息格式转换方法、装置、设备和介质 Download PDF

Info

Publication number
CN111552665B
CN111552665B CN202010342245.8A CN202010342245A CN111552665B CN 111552665 B CN111552665 B CN 111552665B CN 202010342245 A CN202010342245 A CN 202010342245A CN 111552665 B CN111552665 B CN 111552665B
Authority
CN
China
Prior art keywords
format
file
labeling
target file
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010342245.8A
Other languages
English (en)
Other versions
CN111552665A (zh
Inventor
王恬宇
黄卓静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangji Technology Shanghai Co ltd
Original Assignee
Guangji Technology Shanghai Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangji Technology Shanghai Co ltd filed Critical Guangji Technology Shanghai Co ltd
Priority to CN202010342245.8A priority Critical patent/CN111552665B/zh
Publication of CN111552665A publication Critical patent/CN111552665A/zh
Application granted granted Critical
Publication of CN111552665B publication Critical patent/CN111552665B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/116Details of conversion of file system types or formats
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种标注信息格式转换方法。所述方法包括:接收具有标注信息的目标文件;如果所述目标文件的原始文件格式属于预设待转换格式时,则基于所述标注信息将所述目标文件的原始文件格式转换成预设通用格式,其中,所述预设通用格式至少包括所述预设待转换格式;接收用于获取所述目标文件的文件获取请求,如果与所述文件获取请求对应的目标文件格式与所述预设通用格式不同,则将所述目标文件由所述预设通用格式转换为目标文件格式。以实现图像训练数据中不同类型数据的不同标注信息的格式转换,节省算法工程师的时间,提升计算机视觉任务的构建效率。

Description

标注信息格式转换方法、装置、设备和介质
技术领域
本发明实施例涉及计算机视觉技术,尤其涉及一种标注信息格式转换方法、装置、设备和介质。
背景技术
在如今的大数据时代,大量的训练数据是进行深度学习的前提,而训练数据产生离不开数据标注,数据标注作为机器学习工程中重要的一环,是构建AI金字塔的基础。
目前,不同的传统机器学习、深度学习框架和算法对标注数据的格式以及标注信息的文件类型要求各不相同,一般都是当需要对接收的格式不是用户需求的格式时,需要算法工程师现写代码,花大量时间在格式转换及优化上,例如,当用户需要的是Yolo格式的txt文件,而下载的训练数据标注信息为Pascal Voc格式的xml文件,这就需要算法工程师单独写将Yolo格式的txt文件转换为Pascal Voc格式的xml文件的格式转换算法,进而把Pascal Voc格式的xml文件转换为Yolo格式的txt文件,因为不同的格式转换需要不同的格式转换算法,因此,每当用户需要的格式文件与下载的格式文件的格式不一致时,都需要单独写转换算法,这样工作量很大,降低了格式转换的效率。
发明内容
本发明实施例提供一种标注信息格式转换方法、装置、设备和介质,以实现图像训练数据中不同类型数据的不同标注信息的格式转换,节省算法工程师的时间,提升计算机视觉任务的构建效率。
第一方面,本发明实施例提供了一种标注信息格式转换方法,该方法包括:
接收具有标注信息的目标文件;
如果所述目标文件的原始文件格式属于预设待转换格式时,则基于所述标注信息将所述目标文件的原始文件格式转换成预设通用格式,其中,所述预设通用格式至少包括所述预设待转换格式;
接收用于获取所述目标文件的文件获取请求,如果与所述文件获取请求对应的目标文件格式与所述预设通用格式不同,则将所述目标文件由所述预设通用格式转换为目标文件格式。
第二方面,本发明实施例还提供了一种标注信息格式转换装置,该装置包括:
目标文件接收模块,用于接收具有标注信息的目标文件;
第一格式转换模块,用于如果所述目标文件的原始文件格式属于预设待转换格式,则基于所述标注信息将所述目标文件的原始文件格式转换成预设通用格式,其中,所述预设通用格式至少包括所述预设待转换格式;
第二格式转换模块,用于接收用于获取所述目标文件的文件获取请求,如果与所述文件获取请求对应的目标文件格式与所述预设通用格式不同,则将所述目标文件由所述预设通用格式转换为目标文件格式。
第三方面,本发明实施例还提供了一种设备,其特征在于,该设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例中任一所述的标注信息格式转换方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行本发明实施例中任一所述的标注信息格式转换方法。
本发明实施例的技术方案,接收具有标注信息的目标文件,以便后续基于该目标文件,对目标文件的格式进行判断,以及进行转换。如果所述目标文件的原始文件格式属于预设待转换格式时,则基于所述标注信息将所述目标文件的原始文件格式转换成预设通用格式,其中,所述预设通用格式至少包括所述预设待转换格式。这样当后续若客户需要的目标文件的目标文件格式与目标文件的原始文件格式不同时,可以直接通过预设通用格式将目标文件的原始文件格式转换成用户所需的目标文件格式,实现了图像训练数据中不同类型数据的不同标注信息的格式转换。接收用于获取所述目标文件的文件获取请求,如果与所述文件获取请求对应的目标文件格式与所述预设通用格式不同,则将所述目标文件由所述预设通用格式转换为目标文件格式,这样不需算法工程师单独写将原始文件格式的目标文件转换成用户所需的文件格式的目标文件,节省了算法工程师的时间,提升计算机视觉任务的构建效率。
附图说明
图1是本发明实施例一中的标注信息格式转换方法的流程图;
图2是本发明实施例一中的一种标注信息处理平台的架构示意图;
图3是本发明实施例二中的标注信息格式转换方法的流程图;
图4是本发明实施例二中的YOLO格式的目录结构示意图;
图5是本发明实施例三中的标注信息格式转换方法的流程图;
图6是本发明实施例四中的标注信息格式转换装置的结构示意图;
图7是本发明实施例五中的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的标注信息格式转换方法的流程图,本实施例可适用于图像训练数据中不同类型数据的不同标注信息的格式转换的情况,该方法可以由标注信息格式转换装置来执行,该标注信息格式转换装置可以由软件和/或硬件来实现,该标注信息格式转换装置可以配置在计算设备上,具体包括如下步骤:
S110、接收具有标注信息的目标文件。
示例性的,标注信息可以是对一个对象进行标注的信息,例如,对一个画有一只狗的图片,在图片中选中狗这个对象,对狗进行标注,可以标注该对象的名称、该对象的动作,比如,可以对该对象标注为:狗,还可以对该对象标注为:狗在跳跃。目标文件可以是具有对一个对象的标注信息的文件,例如,可以是文件夹,该目标文件中还可以包含有其他子文件夹。
这里接收具有标注信息的目标文件,可以是接收用户上传的具有标注信息的目标文件,示例性的,参考图2所示的一种标注信息处理平台的架构示意图,在该平台上可以对具有标注信息的目标文件进行处理,如图2所示,该平台中具有客户端和服务器端,客户可以在客户端通过文件夹上传模块,将以带相对路径信息的目标文件上传至服务器端,服务器端可以接收客户从客户端上传的目标文件。通过接收具有标注信息的目标文件,以便后续基于该目标文件,对目标文件的格式进行判断,以及进行转换。
S120、如果所述目标文件的原始文件格式属于预设待转换格式时,则基于所述标注信息将所述目标文件的原始文件格式转换成预设通用格式,其中,所述预设通用格式至少包括所述预设待转换格式。
示例性的,原始文件格式可以是目标文件的文件格式。预设待转换格式可以是计算机视觉领域常用的格式类型。可选的,可以是YOLO格式、Pascal VOC格式或COCO格式。预设通用格式可以是将目标文件的原始文件格式转换成的格式,预设通用格式至少包括预设待转换格式。可选的,所述预设通用格式可以是JSON格式,该预设通用格式中可以至少包括:YOLO格式、Pascal VOC格式和COCO格式这三种格式。
可以理解的是,预设待转换格式可以是YOLO格式、Pascal VOC格式或COCO格式,预设通用格式可以是JSON格式,该JSON格式中兼容了YOLO格式、Pascal VOC格式和COCO格式这三种格式,也就是说,预设通用格式可以是预设待转换格式的集合,这里的集合的意思并非通常物理上的集合,而是指,例如,JSON格式中也包含了YOLO格式中的txt文件信息,预设通用格式中文件中的标注信息的标注内容与YOLO格式中的txt文件中的标注内容一致,当将YOLO格式转换为预设通用格式时,txt文件中的标注内容的信息不会丢失。
当服务器端接收到目标文件后,可以通过格式判断模块,对目标文件的原始文件格式进行判断,判断原始文件格式是否属于预设待转换格式,当原始文件格式属于预设待转换格式时,则服务器端通过格式转换模块将原始文件格式转换成预设通用格式,并将预设通用格式的目标文件存储在服务器端,以供后续用户下载使用。例如,具体的可以是,以预设待转换格式是YOLO格式、Pascal VOC格式或COCO格式为例,服务器端接收到的目标文件的原始文件格式为YOLO格式,判断原始文件格式属于预设待转换格式,则基于标注信息将目标文件的原始文件格式转换成预设通用格式。这样当后续若客户需要的目标文件的目标文件格式与目标文件的原始文件格式不同时,可以直接通过预设通用格式将目标文件的原始文件格式转换成用户所需的目标文件格式,实现了图像训练数据中不同类型数据的不同标注信息的格式转换。
S130、接收用于获取所述目标文件的文件获取请求,如果与所述文件获取请求对应的目标文件格式与所述预设通用格式不同,则将所述目标文件由所述预设通用格式转换为目标文件格式。
示例性的,文件获取请求可以是用户输入的获取目标文件的请求。例如,可以是用户在图2中的客户端输入用户想要获取目标文件的请求。具体的,可以是用户在客户端点击下载目标文件,当服务器端接收到用户点击下载目标文件的操作时,即可接收到目标文件的文件获取请求。目标文件格式可以是用户想要获得的目标文件的文件格式。
这里可以理解为:目标文件的原始文件格式为A,预设待转换文件格式为A、B、C,预设通用格式为D,D中包含A、B、C三种格式,判断该目标文件的原始文件格式属于预设待转换文件格式,则将该原始文件格式A转换为预设通用格式D。当服务器接收到用户点击下载目标文件的文件获取请求后,该文件获取请求中请求下载的目标文件的目标文件格式为B,目标文件格式B与预设通用格式D不同,则将目标文件由预设通用格式D转换为目标文件格式B。由于预设通用格式D中包含了目标文件格式B,因此,可将预设通用格式转换为目标文件格式。这样不需算法工程师单独写将原始文件格式的目标文件转换成用户所需的目标文件格式的目标文件,节省了算法工程师的时间,提升计算机视觉任务的构建效率。
本发明实施例的技术方案,接收具有标注信息的目标文件,以便后续基于该目标文件,对目标文件的格式进行判断,以及进行转换。如果所述目标文件的原始文件格式属于预设待转换格式时,则基于所述标注信息将所述目标文件的原始文件格式转换成预设通用格式,其中,所述预设通用格式至少包括所述预设待转换格式。这样当后续若客户需要的目标文件的目标文件格式与目标文件的原始文件格式不同时,可以直接通过预设通用格式将目标文件的原始文件格式转换成用户所需的目标文件格式,实现了图像训练数据中不同类型数据的不同标注信息的格式转换。接收用于获取所述目标文件的文件获取请求,如果与所述文件获取请求对应的目标文件格式与所述预设通用格式不同,则将所述目标文件由所述预设通用格式转换为目标文件格式,这样不需算法工程师单独写将原始文件格式的目标文件转换成用户所需的文件格式的目标文件,节省了算法工程师的时间,提升计算机视觉任务的构建效率。
实施例二
图3为本发明实施例二提供的标注信息格式转换方法的流程图,本发明实施例与上述实施例中各个可选方案可以结合。在本发明实施例中,可选地,所述基于所述标注信息将所述目标文件的原始文件格式转换成所述预设通用格式,包括:将所述目标文件进行拆解,得到所述目标文件的各个子文件;基于所述标注信息,分别将每个所述子文件的原始子文件格式转换成所述预设通用格式。
如图3所示,本发明实施例的方法具体包括如下步骤:
S210、接收具有标注信息的目标文件。
S220、如果所述目标文件的原始文件格式属于预设待转换格式时,将所述目标文件进行拆解,得到所述目标文件的各个子文件。
示例性的,子文件可以是将目标文件进行拆解得到的文件。例如。可以理解为:目标文件为一文件夹,该文件夹下有多个子文件夹,这多个子文件夹即为目标文件的各个子文件。
当目标文件的原始文件格式属于预设待转换格式时,将目标文件拆解,得到各个子文件,这样可利用子文件中的标注信息,将子文件的文件格式转换成预设通用格式。
可选的,目标文件的原始文件格式属于预设待转换格式,具体判断方法可以是:将所述目标文件的原始文件格式的目录结构与所述预设待转换格式的目录结构进行比对;若比对结果一致,则确定所述原始文件格式属于预设待转换格式。
示例性的,目录结构可以是一个文件格式的目录结构。当目标文件的原始文件格式的目录结构与预设待转换格式的目录结构一致时,该原始文件格式属于预设待转换格式。
参考图4所示的YOLO格式的目录结构示意图,如图4中的a图所示,目标文件为一原始文件格式为YOLO格式的文件夹,该文件夹下有obj-train-data、obj.data、obj.names和train这四个子文件。如图4中的b图所示,在obj-train-data这个子文件下,其目录结构为0.jpg、0.txt;1.jpg、1.txt;2.jpg、2.txt;……,即该目录结构为一个图片文件,然后是该图片文件的标注信息文件,再然后是下一个图片文件,下一个图片文件的标注信息文件,以此类推。
以判断原始文件格式是否属于预设待转换格式为YOLO格式为例,在YOLO格式中,一定有obj.data这个子文件,所以在对目标文件的原始文件格式进行判断时,可直接先判断该目标文件中是否有obj.data这个子文件,若没有,则可判断该原始文件格式不属于YOLO格式,然后可判断原始文件格式是否属于预设待转换格式中的其他文件格式。若目标文件中有obj.data这个子文件,则判断obj-train-data这个子文件下的目录结构是否为0.jpg、0.txt;1.jpg、1.txt;2.jpg、2.txt;……,若是,则可确定该原始文件格式属于预设待转换格式YOLO格式。这样通过判断目标文件的原始文件格式的目录结构与预设待转换格式的目录结构是否一致,即可确定原始文件格式是否属于预设待转换格式,不用对原始文件格式进行后续的其他判断,这样可以节省时间,提高了格式转换的效率。
需要说明的是:以YOLO格式为例,这里除了obj.data这个子文件的名称是固定的外,obj-train-data、obj.names和train这三个子文件的名称可以自定义,但是,obj-train-data、obj.names和train这三个子文件与obj.data这个子文件是有关系的。以标注的是一个动物为例,obj.data这个文件中的代码可以是:classes=1;train=data/train.txt;names=data/obj.names;backup=backup/;这里的classes代表标注信息标注的类别的数量,这里标注的是一个动物,只有一个类别,因此,classes=1。Train代表train这个子文件,该train子文件是标注信息的图片文件名列表。Names代表obj.names这个子文件夹,在该子文件是所有类别的列表的文本文件。即obj.names和train这三个子文件与obj.data这个子文件中的代码相对应。除此之外,在YOLO格式中还必须要有一个子文件,该子文件中有标注的图片文件,以及与标注的图片文件对应的标注信息文件,这里将该子文件命名为:obj-train-data。
S230、基于所述标注信息,分别将每个所述子文件的原始子文件格式转换成所述预设通用格式。
示例性的,原始子文件格式可以是目标文件进行拆解后得到的各个子文件的文件格式。以目标文件的原始文件格式为YOLO格式为例,如图4所示,obj.data、obj.names和train这三个子文件的格式分别为DATA格式、NAMES格式和txt格式,然后obj-train-data这个子文件下还分别有jpg格式和txt格式。
将目标文件进行拆解,得到目标文件的各个子文件后,基于各个子文件中的标注信息,可将各个子文件的原始子文件格式转换成预设通用格式,当各子文件的原始子文件格式都转换为预设通用格式时,目标文件的原始文件格式也相应的被转换成了预设通用格式。这样当后续若客户需要是目标文件与目标文件的原始文件格式不同时,可以直接通过预设通用格式将目标文件的原始文件格式转换成用户所需的文件格式,实现了图像训练数据中不同类型数据的不同标注信息的格式转换。
可选的,基于所述标注信息,分别将每个所述子文件的原始子文件格式转换成所述预设通用格式,具体的可以是:对每个所述子文件中的标注信息中的每一行标注内容进行拆解,得到各所述子文件中每一行所述标注内容的语义信息;基于所述语义信息确定所述子文件的原始子文件格式;将各所述原始子文件格式转换成预设通用格式。
示例性的,标注内容可以是标注信息的具体内容。例如,可以是标注区域中的标注对象、标注对象的执行动作和所述标注对象的标注形式。这里的标注区域可以是需要标注的区域,例如可以是一幅图。标注对象可以是标注区域中的需要标注的对象,例如,以标注区域为一幅图为例,标注对象可以是该图中的人物或者动物等。标注对象的执行动作可以是标注对象的动作,例如,以标注区域为一幅图,标注对象可以是该图中的一个人为例,在该图中这个人在跳跃,则标注对象的执行动作为跳跃。标注对象的标注形式可以是对标注对象进行标注的形式,这里的标注形式可以为矩形框标注、点集标注和多边形标注。
需要说明的是,标注内容中具体是标注对象还是标注对象的执行动作,这个取决于具体的标注任务,可以是标注对象,也可以是标注对象的执行动作,还可以是标注对象和标注对象的执行动作同时存在,因为不是所有的标注信息中都会有标注对象的执行动作。
此外,标注内容还可以是标注形式在标注区域中的位置,例如,以原始文件格式为YOLO格式,标注区域为一幅图,该幅图中只有一个标准对象,即标准类型为1,标注对象可以是该图中的一个人,标注形式为矩形框标注为例,矩形框标注在该幅图中坐标位置可以用如下数值来表示,1 0.404528 0.5439630.244094 0.727034,其中,数字与数字间用空格来隔开,这里有5个数字,由于YOLO格式中的数字都是归一化的数字,因此,这5个数字均小于1。其中,第一个数字代表标注对象的类型数量为1,后面的四个数字分别代表矩形框标注宽度归一化之后的中心点x坐标、矩形框标注高度归一化之后的中心点y坐标、矩形框标注宽度归一化之后的矩形框宽度和矩形框标注高度归一化之后的矩形框高度。这样可以很直观的知道标注形式在标注区域中的位置。
语义信息可以是标注信息中每一行标注内容的意思。例如,以标注区域为一幅图,标注对象是该图中的一个人,标注对象的执行动作为跳跃为例,标注内容的第一行的代码代表的意思是:该标注对象为一个人;第二行的代码代表的意思是:这个人在跳跃。那第一行标注内容的语义信息就为:该标注对象为一个人;第二行标注内容的语义信息为:这个人在跳跃。
当将目标文件拆解成各个子文件后,对各个子文件中的标注信息中的每一行标注内容进行拆解,利用解析器解析出每一行标注内容的语义信息,基于每一行标注内容的语义信息,即可确定该子文件的原始子文件格式,将各原始子文件格式转换成预设通用格式,这样各子文件的文件格式就转换成了预设通用格式,进而目标文件的原始文件格式也就转换成了预设通用格式。例如,一个子文中有至少一行标注内容,该标注内容的格式是txt格式,因此该子文件的原始子文件格式也为txt格式,当解析出每一行标注内容的语义信息后,将每一行标注内容的语义信息以预设通用格式进行重新编写,这里预设通用格式可以是json格式,这样该子文件中的标注内容就是json格式的,进而该子文件的原始子文件格式就是json格式。
这样通过每一行标注内容的语义信息,将原始子文件格式转换为预设通用格式,实现了将目标文件的原始文件格式转换为预设通用格式的效果。这样当后续若客户需要的目标文件的目标文件格式与目标文件的原始文件格式不同时,可以直接通过预设通用格式将目标文件的原始文件格式转换成用户所需的目标文件格式,实现了图像训练数据中不同类型数据的不同标注信息的格式转换。
S240、接收用于获取所述目标文件的文件获取请求,如果与所述文件获取请求对应的目标文件格式与所述预设通用格式不同,则将所述目标文件由所述预设通用格式转换为目标文件格式。
可以理解的是,将目标文件的原始文件格式转换为预设通用格式,然后再将预设通用格式的目标文件转换为目标文件格式的目标文件,这里的格式转换可以依靠图2中的标注信息处理平台来实现,当将目标文件上传到服务器端后,服务器端即可实时在线执行对目标文件进行格式转换的步骤,这样在该标注信息处理平台上可自动实时在线实现目标文件的格式转换,实现了图像训练数据中不同类型数据的不同标注信息的格式转换,这样就不用算法工程师单独写格式转换算法,节省了算法工程师的时间,提高了格式转换的效率,同时也提升计算机视觉任务的构建效率。
可以理解的是,对具有标注信息的目标文件进行格式转换是,获得目标文件的标注信息,将标注信息中的标注内容,例如,标注形式、标注对象、标注对象的执行动作等,以预设通用格式保存于图2所示的标注信息处理平台的数据库中。比如YOLO格式、Pascal VOC格式和COCO格式这三种格式都可以表示一个图片上的一个标注对象为“A”的方框,那么系统的第一步是将YOLO格式、Pascal VOC格式和COCO格式这三种格式的标注信息中将“一个图片上的一个标注对象为‘A’的方框”解析出来,解析出来的信息即为:标注对象是一个图片上的“A”,标注形式为矩形框标注。接着将这些解析信息的不同标注内容的语义信息,例如,标注对象、标注形式的语义信息分别以预设通用格式保存在图2的标注信息处理平台的内存中。
本发明实施例的技术方案,通过当目标文件的原始文件格式属于预设待转换格式时,将目标文件进行拆解,得到目标文件的各个子文件,这样可利用子文件中的标注信息,将子文件的文件格式转换成预设通用格式,进而实现将目标文件的原始文件格式转换为预设通用格式,这样当后续若客户需要的目标文件的目标文件格式与目标文件的原始文件格式不同时,可以直接通过预设通用格式将目标文件的原始文件格式转换成用户所需的目标文件格式,实现了图像训练数据中不同类型数据的不同标注信息的格式转换。
实施例三
图5为本发明实施例三提供的标注信息格式转换方法的流程图,本发明实施例与上述实施例中各个可选方案可以结合。在本发明实施例中,可选地,在接收具有标注信息的目标文件之后,所述方法还包括:基于目录结构对所述目标文件进行校验,确定所述目标文件的原始文件格式;若所述原始文件格式属于所述预设待转换格式,则基于基本格式对所述目标文件中的各子文件进行校验,确定各所述子文件的原始子文件格式是否符合规范;若各所述子文件的原始子文件格式符合规范,则基于标注内容对各所述子文件中的标注信息中的标注内容进行校验,确定所述标注内容是否有误。
如图5所示,本发明实施例的方法具体包括如下步骤:
S310、接收具有标注信息的目标文件。
S320、基于目录结构对所述目标文件进行校验,确定所述目标文件的原始文件格式。
示例性的,如图2所示,当服务器端接收到目标文件后,要先对目标文件进行校验,校验分为三步:目录结构校验、基本格式校验和标注内容校验。只有目标文件的原始文件格式、子文件的原始子文件格式符合规范以及标注内容无误后,才可对目标文件进行格式转换。
基于目录结构对目标文件进行校验是校验的第一步,在图2的服务器端中存储有预设待转换格式的目录结构,将目标文件的目录结构与预设待转换格式的目录结构进行对比,来确定目标文件的原始文件格式。这里的将目标文件的目录结构与预设待转换格式的目录结构进行对比的方法,与上述实施例一中S120中的对比方法一致。这样利用目录结构对目标文件进行校验,进而可确定目标文件的原始文件格式,以便于基于原始文件格式对目标文件进行格式转换。
需要说明的是:只有目标文件的原始文件格式属于预设待转换格式时,才可进行后续的校验步骤,当目标文件的原始文件格式不属于预设待转换格式时,则后续的校验步骤不再执行,这样可节省校验时间,提高校验流程的效率。
S330、若所述原始文件格式属于所述预设待转换格式,则基于基本格式对所述目标文件中的各子文件进行校验,确定各所述子文件的原始子文件格式是否符合规范。
示例性的,当原始文件格式属于预设待转换格式时,执行第二步校验,即利用基本格式对目标文件的各子文件进行校验,进而来确定各子文件的原始子文件格式是否符合规范。基本格式校验的目的是校验目标文件的子文件中的数据、字符等格式是否符合规范。
以原始文件格式为Pascal VOC格式为例,在一个子文件下,该子文件中有针对标注形式的描述,例如,代码为;<xmin>228.3740234375</xmin>;<ymin>139.310546875</ymin>;<xmax>462.4626922607422</xmax>;<ymax>276.4533996582031</ymax>,当若<xmin>228.3740234375</xmin>中有添加空格或者其他标识符时,则可确定该子文件的原始子文件格式不符合规范。
这样可以检验子文件的原始子文件格式是否符合规范,避免因其不符合规范,而导致目标文件无法实现格式转换。
S340、若各所述子文件的原始子文件格式符合规范,则基于标注内容对各所述子文件中的标注信息中的标注内容进行校验,确定所述标注内容是否有误。
示例性的,当第二步校验的结果为各子文件的原始子文件格式符合规范时,则进行第三步校验,基于预设的校验方法,基于标注内容对各子文件中的标注信息中的标注内容进行校验,看标注内容是否有误。
以原始文件格式为Pascal VOC格式为例,在一个子文件下,该子文件中有针对标注形式的内容描述,例如,代码为;<xmin>228.3740234375</xmin>;<ymin>139.310546875</ymin>;<xmax>462.4626922607422</xmax>;<ymax>276.4533996582031</ymax>,即针对标注形式的描述代码需要是4个数字的代码描述,即:228.3740234375、139.310546875、462.4626922607422和276.4533996582031,当将其中一个数字删除后,比如,将276.4533996582031删除,则该代码变为:<xmin>228.3740234375</xmin>;<ymin>139.310546875</ymin>;<xmax>462.4626922607422</xmax>,此时对标注内容进行校验,就会发现少了一个数字,此时,标注内容就有误,当标注内容有误时,标注信息不完整,则无法对目标文件进行格式转换。
可选的,基于标注内容对各所述子文件中的标注信息中的标注内容进行校验,具体可以是:在所述子文件中的标注信息中的标注内容中,提取所述标注区域中的标注对象;基于所述标注对象,确定所述标注对象的标注形式;基于所述标注形式,利用与所述标注形式对应的标注内容校验模块对所述标注对象的执行动作进行校验。
示例性的,由于标注内容校验是根据不同标注形式采用不同标注内容校验模块,标注内容校验模块采用插件方式,对标注内容进行校验。在计算机视觉领域,不同标注形式可满足目标检测、语义分割、实例分割、全景分割等不同的任务需求。
在进行标注内容校验时,可以在标注内容中提取出标注对象,根据标注对象的标注形式,利用与该标注形式对应的标注内容校验模块对标注对象的执行动作进行校验。
以原始文件格式为Pascal VOC格式,标注区域为一幅图,标注对象为图中的一个人,标注对象的标注形式为矩形框标注,标注对象的执行动作为跳跃为例,将目标文件上传到图2所示的平台中,该平台具有对标注内容自动识别的作用,可利用该平台,识别出标注内容中的标注对象为一个人,进而根据该标注对象可以识别出该标注对象的标注形式为矩形框标注,当识别出标注对象的标注形式为矩形框标注后,采用与矩形框标注对应的标注内容校验模块,可对标注对象的执行动作进行校验,校验其是否为跳跃。这样实现了对目标文件的标注内容的精确校验。
需要说明的是,当对目标文件进行目录结构校验、基本格式校验和标注内容校验后,则完成了对目标文件的整个校验流程,然后可将校验无问题的目标文件进行格式转换,将其转换为用户所需的目标文件格式。具体的格式转换过程,参照上述实施例一和实施例二的过程。
S350、如果所述目标文件的原始文件格式属于预设待转换格式时,将所述目标文件进行拆解,得到所述目标文件的各个子文件。
S360、基于所述标注信息,分别将每个所述子文件的原始子文件格式转换成所述预设通用格式。
S370、接收用于获取所述目标文件的文件获取请求,如果与所述文件获取请求对应的目标文件格式与所述预设通用格式不同,则将所述目标文件由所述预设通用格式转换为目标文件格式。
这里可以理解为:图2中的平台是一个基于web技术的提供具有标注信息的目标文件的在线校验和格式转换的平台,即该平台除了可实现上述实施例一和实施例二中的格式转换外,还可以实现本发明实施例中的目标文件的校验。因此,该平台涉及到对标注内容的自动识别、具有标注信息的目标文件的在线校验、目标文件的原始文件格式与目标文件格式之间的格式转换。该平台可以为其他计算机视觉训练数据的标注提供透明校验和转换服务。
本发明实施例的技术方案,基于目录结构对所述目标文件进行校验,确定所述目标文件的原始文件格式,以便于基于原始文件格式对目标文件进行格式转换。若所述原始文件格式属于所述预设待转换格式,则基于基本格式对所述目标文件中的各子文件进行校验,确定各所述子文件的原始子文件格式是否符合规范,避免因其不符合规范,而导致目标文件无法实现格式转换。若各所述子文件的原始子文件格式符合规范,则基于标注内容对各所述子文件中的标注信息中的标注内容进行校验,确定所述标注内容是否有误,避免因标注内容有误,不完整,而导致目标文件无法实现格式转换。
实施例四
图6为本发明实施例四提供的标注信息格式转换装置的结构示意图,如图6所示,该装置包括:目标文件接收模块31、第一格式转换模块32和第二格式转换模块33。
其中,目标文件接收模块31,用于接收具有标注信息的目标文件;
第一格式转换模块32,用于如果所述目标文件的原始文件格式属于预设待转换格式,则基于所述标注信息将所述目标文件的原始文件格式转换成所述预设通用格式,其中,所述预设通用格式至少包括所述预设待转换格式;
第二格式转换模块33,用于接收用于获取所述目标文件的文件获取请求,如果与所述文件获取请求对应的目标文件格式与所述预设通用格式不同,则将所述目标文件由所述预设通用格式转换为目标文件格式。
在上述实施例的技术方案的基础上,第一格式转换模块32包括:
目标文件拆解单元,用于将所述目标文件进行拆解,得到所述目标文件的各个子文件;
第一格式转换单元,用于基于所述标注信息,分别将每个所述子文件的原始子文件格式转换成所述预设通用格式。
在上述实施例的技术方案的基础上,第一格式转换单元包括:
语言信息获取子单元,用于对每个所述子文件中的标注信息中的每一行标注内容进行拆解,得到各所述子文件中每一行所述标注内容的语义信息;
原始子文件格式确定子单元,用于基于所述语义信息确定所述子文件的原始子文件格式;
第一格式转换子单元,用于将各所述原始子文件格式转换成预设通用格式。
在上述实施例的技术方案的基础上,第一格式转换模块32还包括:
比对单元,用于将所述目标文件的原始文件格式的目录结构与所述预设待转换格式的目录结构进行比对;
原始文件格式确定单元,用于若比对结果一致,则确定所述原始文件格式属于预设待转换格式。
在上述实施例的技术方案的基础上,该装置还包括:
第一校验模块,用于基于目录结构对所述目标文件进行校验,确定所述目标文件的原始文件格式;
第二校验模块,用于若所述原始文件格式属于所述预设待转换格式,则基于基本格式对所述目标文件中的各子文件进行校验,确定各所述子文件的原始子文件格式是否符合规范;
第三校验模块,用于若各所述子文件的原始子文件格式符合规范,则基于标注内容对各所述子文件中的标注信息中的标注内容进行校验,确定所述标注内容是否有误。
可选的,所述标注内容至少包括:标注区域中的标注对象、所述标注对象的执行动作和所述标注对象的标注形式。
在上述实施例的技术方案的基础上,第三校验模块具体用于:
在所述子文件中的标注信息中的标注内容中,提取所述标注区域中的标注对象;
基于所述标注对象,确定所述标注对象的标注形式;
基于所述标注形式,利用与所述标注形式对应的标注内容校验模块对所述标注对象的执行动作进行校验。
本发明实施例所提供的标注信息格式转换装置可执行本发明任意实施例所提供的标注信息格式转换方法,具备执行方法相应的功能模块和有益效果。
实施例五
图7为本发明实施例五提供的一种设备的结构示意图,如图7所示,该设备包括处理器70、存储器71、输入装置72和输出装置73;设备中处理器70的数量可以是一个或多个,图7中以一个处理器70为例;设备中的处理器70、存储器71、输入装置72和输出装置73可以通过总线或其他方式连接,图7中以通过总线连接为例。
存储器71作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的标注信息格式转换方法对应的程序指令/模块(例如,目标文件接收模块31、第一格式转换模块32和第二格式转换模块33)。处理器70通过运行存储在存储器71中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的标注信息格式转换方法。
存储器71可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器71可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器71可进一步包括相对于处理器70远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置72可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置73可包括显示屏等显示设备。
实施例六
本发明实施例六还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种标注信息格式转换方法。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的标注信息格式转换方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述标注信息格式转换装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (8)

1.一种标注信息格式转换方法,其特征在于,包括:
接收具有标注信息的目标文件;
如果所述目标文件的原始文件格式属于预设待转换格式时,则基于所述标注信息将所述目标文件的原始文件格式转换成预设通用格式,其中,所述预设通用格式至少包括所述预设待转换格式;
接收用于获取所述目标文件的文件获取请求,如果与所述文件获取请求对应的目标文件格式与所述预设通用格式不同,则将所述目标文件由所述预设通用格式转换为目标文件格式;
其中,所述基于所述标注信息将所述目标文件的原始文件格式转换成所述预设通用格式,包括:
将所述目标文件进行拆解,得到所述目标文件的各个子文件;
基于所述标注信息,分别将每个所述子文件的原始子文件格式转换成所述预设通用格式;
其中,所述基于所述标注信息,分别将每个所述子文件的原始子文件格式转换成所述预设通用格式,包括:
对每个所述子文件中的标注信息中的每一行标注内容进行拆解,得到各所述子文件中每一行所述标注内容的语义信息;
基于所述语义信息确定所述子文件的原始子文件格式;
将各所述原始子文件格式转换成预设通用格式。
2.根据权利要求1所述的方法,其特征在于,所述目标文件的原始文件格式属于预设待转换格式,包括:
将所述目标文件的原始文件格式的目录结构与所述预设待转换格式的目录结构进行比对;
若比对结果一致,则确定所述原始文件格式属于预设待转换格式。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于目录结构对所述目标文件进行校验,确定所述目标文件的原始文件格式;
若所述原始文件格式属于所述预设待转换格式,则基于基本格式对所述目标文件中的各子文件进行校验,确定各所述子文件的原始子文件格式是否符合规范;
若各所述子文件的原始子文件格式符合规范,则基于标注内容对各所述子文件中的标注信息中的标注内容进行校验,确定所述标注内容是否有误。
4.根据权利要求3所述的方法,其特征在于,所述标注内容至少包括:标注区域中的标注对象、所述标注对象的执行动作和所述标注对象的标注形式;
所述对各所述子文件中的标注信息中的标注内容进行校验,包括:
在所述子文件中的标注信息中的标注内容中,提取所述标注区域中的标注对象;
基于所述标注对象,确定所述标注对象的标注形式;
基于所述标注形式,利用与所述标注形式对应的标注内容校验模块对所述标注对象的执行动作进行校验。
5.根据权利要求1所述的方法,其特征在于,所述预设待转换格式包括:YOLO格式、Pascal VOC格式和COCO格式;
所述预设通用格式包括:YOLO格式、Pascal VOC格式、COCO格式和目标文件格式。
6.一种标注信息格式转换装置,其特征在于,包括:
目标文件接收模块,用于接收具有标注信息的目标文件;
第一格式转换模块,用于如果所述目标文件的原始文件格式属于预设待转换格式,则基于所述标注信息将所述目标文件的原始文件格式转换成预设通用格式,其中,所述预设通用格式至少包括所述预设待转换格式;
第二格式转换模块,用于接收用于获取所述目标文件的文件获取请求,如果与所述文件获取请求对应的目标文件格式与所述预设通用格式不同,则将所述目标文件由所述预设通用格式转换为目标文件格式;
其中,第一格式转换模块包括:
目标文件拆解单元,用于将所述目标文件进行拆解,得到所述目标文件的各个子文件;
第一格式转换单元,用于基于所述标注信息,分别将每个所述子文件的原始子文件格式转换成所述预设通用格式;
其中,第一格式转换单元包括:
语言信息获取子单元,用于对每个所述子文件中的标注信息中的每一行标注内容进行拆解,得到各所述子文件中每一行所述标注内容的语义信息;
原始子文件格式确定子单元,用于基于所述语义信息确定所述子文件的原始子文件格式;
第一格式转换子单元,用于将各所述原始子文件格式转换成预设通用格式。
7.一种标注信息格式转换设备,其特征在于,所述标注信息格式转换设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的标注信息格式转换方法。
8.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-5中任一所述的标注信息格式转换方法。
CN202010342245.8A 2020-04-27 2020-04-27 标注信息格式转换方法、装置、设备和介质 Active CN111552665B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010342245.8A CN111552665B (zh) 2020-04-27 2020-04-27 标注信息格式转换方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010342245.8A CN111552665B (zh) 2020-04-27 2020-04-27 标注信息格式转换方法、装置、设备和介质

Publications (2)

Publication Number Publication Date
CN111552665A CN111552665A (zh) 2020-08-18
CN111552665B true CN111552665B (zh) 2023-08-01

Family

ID=72003073

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010342245.8A Active CN111552665B (zh) 2020-04-27 2020-04-27 标注信息格式转换方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN111552665B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112052650A (zh) * 2020-09-10 2020-12-08 湖南新云网科技有限公司 一种文件加载方法、装置、设备及计算机可读存储介质
US11445009B1 (en) * 2021-10-13 2022-09-13 International Business Machines Corporation Managing proprietary structured objects
CN116594960B (zh) * 2023-06-08 2024-01-30 镁佳(北京)科技有限公司 描述性文件格式转换方法、装置、计算机设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106528744A (zh) * 2016-10-28 2017-03-22 宁德时代新能源科技股份有限公司 格式转换方法及系统
CN109785942A (zh) * 2019-01-24 2019-05-21 邃蓝智能科技(上海)有限公司 一种医疗影像数据的快速辅助标注及存储方法和系统
CN110737790A (zh) * 2019-10-25 2020-01-31 中国人民解放军国防科技大学 一种基于数据库的通用图像数据集管理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106528744A (zh) * 2016-10-28 2017-03-22 宁德时代新能源科技股份有限公司 格式转换方法及系统
CN109785942A (zh) * 2019-01-24 2019-05-21 邃蓝智能科技(上海)有限公司 一种医疗影像数据的快速辅助标注及存储方法和系统
CN110737790A (zh) * 2019-10-25 2020-01-31 中国人民解放军国防科技大学 一种基于数据库的通用图像数据集管理方法

Also Published As

Publication number Publication date
CN111552665A (zh) 2020-08-18

Similar Documents

Publication Publication Date Title
CN111552665B (zh) 标注信息格式转换方法、装置、设备和介质
CN112101335B (zh) 一种基于ocr和迁移学习的app违规监测方法
AU2019204444B2 (en) System and method for enrichment of ocr-extracted data
CN103678109A (zh) 一种转储文件分析方法、装置和系统
US11170214B2 (en) Method and system for leveraging OCR and machine learning to uncover reuse opportunities from collaboration boards
CN112148343B (zh) 规则发布方法、装置及终端设备
CN109710528B (zh) 一种测试脚本生成方法、装置、设备和介质
CN111782635B (zh) 数据处理方法和装置、存储介质和电子装置
CN114398859A (zh) 一种数据标注方法、装置、电子设备及存储介质
CN111126058B (zh) 文本信息自动抽取方法、装置、可读存储介质和电子设备
CN116088846A (zh) 一种持续集成代码格式的处理方法、相关装置及设备
CN104298671A (zh) 数据统计分析方法及装置
CN117033309A (zh) 一种数据转换方法、装置、电子设备及可读存储介质
CN115454382A (zh) 需求处理方法和装置、电子设备、存储介质
CN111078529A (zh) 客户端写入模块测试方法、装置、电子设备
CN116166533A (zh) 接口测试方法、装置、终端设备以及存储介质
US11281901B2 (en) Document extraction system and method
CN111143643B (zh) 元素识别方法、装置、可读存储介质和电子设备
CN113468076A (zh) 应用程序的异常测试方法、装置、设备及存储介质
CN116959018B (zh) 一种基于ocr的智能查验方法、系统及设备
CN113159951B (zh) 金融数据清算方法、装置、设备及存储介质
CN117236303A (zh) 一种基于数据的目标表格填充方法及装置
CN117349475A (zh) 数据的处理方法、装置、电子设备和可读存储介质
CN114821604A (zh) 基于rpa及ai的车辆信息处理方法、装置、设备及介质
CN116910084A (zh) 字段转换方法、装置及存储介质、电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant