CN114429569A - 训练影像的自动生成系统及其方法 - Google Patents
训练影像的自动生成系统及其方法 Download PDFInfo
- Publication number
- CN114429569A CN114429569A CN202011389588.6A CN202011389588A CN114429569A CN 114429569 A CN114429569 A CN 114429569A CN 202011389588 A CN202011389588 A CN 202011389588A CN 114429569 A CN114429569 A CN 114429569A
- Authority
- CN
- China
- Prior art keywords
- image
- target
- container
- training
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
- Image Generation (AREA)
- Container Filling Or Packaging Operations (AREA)
- Image Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种训练影像的自动生成系统及其方法。本发明添加目标影像至容器影像中以作为训练影像,并记录各目标影像的类别或位置。于目标添加处理处理中,本发明将该目标影像加入至容器影像的目标位置作为候选影像,计算候选影像的可靠度,并重复执行目标添加处理处理直到生成可靠度符合期待的候选影像作为训练影像。本发明可自动产生训练影像,且训练影像的辨识难度可由用户指定,而适用于客制化辨识训练。
Description
技术领域
本发明是与训练影像有关,特别涉及训练影像的自动生成系统及其方法。
背景技术
为了进行人工智能或专业检查人员(如进行违禁品检查的海关人员)的物件辨识训练,必须使用到大量的样本(训练影像),而这些样本得来不易。
为解决前述问题,目前已有一种自动产生样本的方案被提出,前述方案是通过机器学习或乱数产生大量的样本,以用于训练。
然而,物件辨识训练的成果与样本的品质有着密切关联,一旦样本品质不均(如样本之间差异过大或过小,或者样本中的物件的辨识难度过高或过低),会使得训练成果不佳,而造成机器学习模型或人员只会辨识同类型的样本。
举例来说,当一味地提供高难度的样本(如目标与其他物件极为相似)进行辨识训练时,机器学习模型或人员可能只会辨识高难度的样本,却无法辨识低难度的样本(如目标与其他物件完全不同)。
现有的通过机器学习自动产生样本的方案,无论是机器学习或乱数产生,都无法依用户需求调整所产生的样本的辨识难度,而不适合用于训练。
因此,现有自动生成样本的技术存在前述问题,而亟待更有效的方案被提出。
发明内容
本发明的主要目的,在于提供一种训练影像的自动生成系统及其方法,可调整所产生的训练影像的辨识难度。
于一实施例中,一种训练影像的自动生成方法,包括以下步骤:a)取得多个容器影像,自该多个容器影像选择一个来执行一目标添加处理,以变换所选择的该容器影像为包括一目标影像的一训练影像;及,b)记录该训练影像及一目标数据,其中该目标数据包括该目标影像的一目标类别与一目标位置的至少其中之一;其中,该目标添加处理包括以下步骤:c1)取得该目标影像;c2)将该目标影像加入至所选择的该容器影像的该目标位置,以作为一候选影像;c3)计算该候选影像的一可靠度,其中该可靠度是对应该目标影像于该候选影像中的辨识难度;及,c4)于该可靠度不符一临界值时,重复执行所述步骤c1)-c3),直到生成该可靠度符合该临界值的该候选影像,以作为该训练影像。
于一实施例中,一种训练影像的自动生成系统,包括一容器影像源、一目标影像库及一控制模块。该容器影像源具有多个容器影像;该目标影像库具有多个目标影像;该控制模块电性连接该容器影像源与该目标影像库,包括一目标添加模块、一目标记录模块及一可靠度计算模块。该目标添加模块被配置来自该多个容器影像选择一个来执行一目标添加处理,以变换所选择的该容器影像为包括一目标影像的一训练影像,其中,该目标添加处理包括将该目标影像加入至该容器影像的一目标位置,以作为一候选影像;该目标记录模块,被配置来记录该训练影像及一目标数据,该目标数据包括该目标影像的一目标类别与该目标位置的至少其中之一;及,该可靠度计算模块,被配置来计算该候选影像的一可靠度;其中,该控制模块被配置来于该可靠度不符一临界值时,经由该目标添加模块重复执行该目标添加处理,直到生成该可靠度符合该临界值的该候选影像,以作为该训练影像,该可靠度是对应该目标影像于该候选影像的辨识难度。
于一实施例中,一种训练影像的自动生成方法,包括以下步骤:a)取得一容器影像;b)取得一目标影像;c)将该目标影像加入至该容器影像的一目标位置,以作为一候选影像;d)计算该候选影像的一可靠度,其中该可靠度是对应该目标影像于该候选影像中的辨识难度;及,e)于该可靠度不符一临界值时,重复执行所述步骤b)-d),直到生成该可靠度符合该临界值的该候选影像,以作为一训练影像。
本发明可自动产生训练影像,且训练影像的辨识难度可由用户指定,而适用于客制化辨识训练。
附图说明
图1为本发明的一实施例的自动生成系统的架构图。
图2为本发明的另一实施例的自动生成系统的架构图。
图3为本发明的另一实施例的自动生成系统的架构图。
图4为本发明的另一实施例的自动生成系统的部分架构图。
图5为本发明的第一实施例的自动生成方法的流程图。
图6为本发明的第二实施例的自动生成方法的部分流程图。
图7为本发明的第三实施例的自动生成方法的部分流程图。
图8为本发明的第四实施例的自动生成方法的部分流程图。
图9为本发明的第五实施例的自动生成方法的流程图。
图10为本发明的一实施例的目标添加处理的处理示意图。
图11为本发明的一实施例的目标添加处理的显示示意图。
图12为本发明的一实施例的物件辨识的第一示意图。
图13为本发明的一实施例的物件辨识的第二示意图。
图14为本发明的一实施例的物件辨识的第三示意图。
其中,附图标记说明如下:
1:自动生成系统
10:控制模块
11:容器影像源
110:容器影像
12:目标影像库
120:目标影像
13:输出模块
20:变形数据库
200:函式
21:输入模块
30:影像撷取装置
31:输送带模块
32:显示模块
33:训练影像库
330:训练影像
331:目标数据
40:存储模块
400:电脑软件
401:物件检测模型
402:产生条件
403:位置选择规则
404:影像变换规则
405:可靠度临界值
41:网络传输接口
42:网络
43:服务器
50:目标添加模块
500:第一物件检测模块
501:目标位置选择模块
502:目标选择模块
503:影像变换选择模块
504:目标定位模块
505:影像产生模块
506:第二物件检测模块
51:目标记录模块
52:输送带信息取得模块
53:整合显示控制模块
54:可靠度计算模块
60-62:容器影像
61’:训练影像
610-614:影像
70-72:原始物件
73:目标影像
74:目标数据
75、76:变换后目标影像
80:输入影像
800-802:影像区块
90-91:范围
92-94:物件
CBI:输送带信息
P:设定参数
TI:训练影像
S10-S13:目标添加与记录步骤
S20-S24:目标添加步骤
S30-S34:目标影像处理步骤
S40-S42:可靠度计算步骤
S50-S56:目标添加、记录与显示步骤
具体实施方式
兹就本发明的一较佳实施例,配合附图,详细说明如后。
于物件辨识训练中,电脑系统或用户必须从大量影像中辨识出包括目标影像(物体影像,如违禁品或其他指定物件)的训练影像,而目前并无法对目标影像的辨识难度进行调整。
本发明即是提出一种训练影像的自动生成方法与系统,可以指定辨识难度(可靠度临界值),并自动产生符合此辨识难度的训练影像,借以提供不同难度的物件辨识训练。
请参阅图1与图2,本发明的训练影像的自动生成系统1可包括容器影像源11、目标影像库12、输出模块13、与电性连接前述装置的控制模块10。
容器影像源11用以取得多个容器影像110。容器影像110(如行李箱、手提袋、购物车、提篮或其他可装纳物件的容器的影像)为未经处理的原始影像,其收纳空间可以是空的,也可包含物件(原始物件,如化妆品、3C用品、商品、货品或其他可收纳至容器的物件)。
目标影像库12用以存储多个目标影像120。目标影像120即为物件辨识训练中所要辨识出的目标(如手枪、刀械、毒品、电池等违禁品,或者其他指定的物件)的影像。
输出模块13(如后述的显示模块32、存储模块40或网络传输接口41)可用来输出(包括存储、显示或传送至其他电脑)影像。控制模块10(如CPU、GPU、处理器、控制器、SoC等等)用以控制自动生成系统1来自动产生并输出训练影像TI(容后详述)。
请参阅图2,于一实施例中,自动生成系统1可包括电性连接控制模块10的变形数据库20与输入模块21。
变形数据库20存储有多种函式200,各种函式200分别是用来对影像执行不同的影像变换处理(如旋转、翻转、变形、亮度调整、彩度调整、对比调整、低通滤波、高通滤波、上移一层、下移一层等影像处理),以变换影像的外形、亮度、色彩、姿态及/或排列层序等属性。
输入模块21(如键盘、鼠标、触控板、触控屏幕、麦克风等)用以供用户输入操作,如用户可输入难度设定操作来修改设定参数P以调整所产生的训练影像的辨识难度。
请参阅图3,于一实施例中,容器影像源11可以包括影像撷取装置30(如可见光摄影机、X光机、超声波摄影机、热感摄影机等),并用来对实体的容器进行拍摄以获得容器影像110(可为彩色影像、X光等放射线影像、超声波影像、热感影像等)。
值得一提的是,当容器影像110、目标影像120与训练影像TI为放射线影像时,放射线影像的各像素的像素值可表示各像素所对应的物件深度或材料密度。换句话说,控制模块10可依据影像中的各物件的深度或密度来对影像的各像素进行上色,如以不同颜色来区分不同深度或密度的位置,对于相同深度或密度的位置赋予相同的颜色。
并且,目标影像库12的目标影像120、容器影像110与其所产生训练影像TI是相同类型影像,如同为放射线影像,或者同为彩色影像。
于一实施例中,自动生成系统1可包括电性连接控制模块10的显示模块32(如LCD、投影机等显示器)。显示模块32用以显示影像与信息。
于一实施例中,自动生成系统1可包括电性连接控制模块10的训练影像库33。训练影像库33可用以存储每次训练所产生的训练影像TI(即训练影像330),并可存储各训练影像330的目标数据331,目标数据331是如同训练影像330的解答,记录有训练影像330所包括的目标影像120的相关信息(如物件类型及/或影像嵌入位置)。
于一实施例中,自动生成系统1可包括电性连接控制模块10的输送带模块31,控制模块10可取得输送带模块31的输送带信息CBI,以模拟即时物件输送检查的辨识训练(容后详述)。
请参阅图4,于一实施例中,自动生成系统1可包括电性连接控制模块10并用以存储数据的存储模块40(如磁盘、硬盘、快闪存储器、RAM、ROM等)。
于一实施例中,自动生成系统1可包括电性连接控制模块10的网络传输接口41(如Wi-Fi网络模块、以太网络模块、蜂巢网络模块等)。网络传输接口41用以连接网络42(如网际网络或区域网络),并可通过网络42连接远端的服务器43。
于一实施例中,容器影像源11、目标影像库12、变形数据库20与训练影像库33中的一或多者可以是网络数据库,控制模块10是通过网络传输接口41来存取这些网络数据库的数据。
于一实施例中,控制模块10可包括用以实现不同功能的模块50-54、500-506,其功能容后详述。前述模块50-54、500-506是彼此连接(可为电性连接或信息连接),并可为硬件模块(如电子电路模块、集成电路模块、SoC等等)、软件模块(如固件、作业系统或应用程序)或软硬件模块混搭,不加以限定。
值得一提的是,当前述模块50-54、500-506为软件模块时,存储模块40可包括非暂态电脑可读取记录媒体,前述非暂态电脑可读取记录媒体存储有电脑程序400,前述电脑程序400记录有电脑可执行的程序码,当控制模块10执行前述程序码后,可实现前述模块50-54、500-506的控制功能。
请参阅图5。本发明的训练影像的自动生成方法可包括以下步骤。
步骤S10:控制模块10经由容器影像源11取得多个容器影像110,这些容器影像110可以是有序的(如依照行李输送顺序)或是无序的,不加以限定。
执行步骤S11:控制模块10经由目标添加模块50自所取得的多个容器影像110选择至少一个执行目标添加处理,以变换容器影像110为包括目标影像120的训练影像TI。
于一实施例中,存储模块40存储有产生条件402,控制模块10是基于产生条件402来选择部分容器影像110执行目标添加处理。
举例来说,产生条件402可为产生训练影像TI的几率(如0.1%、10%、50%等)、总数量(如一张、两张或一百张训练影像TI)、关系(如至少两张训练影像TI之间必须至少间隔多少张容器影像110,如间隔10张、50张或100张)等,不加以限定
于一实施例中,用户可输入难度设定操作来修改设定参数P,以借由调整产生条件402来调整辨识难度。
本发明通过混合原始影像(无目标影像的容器影像)与训练影像TI(添加目标影像的容器影像)进行物件辨识训练,可对专注度进行训练,而可提升训练成果。并且,本发明可通过调整训练影像TI的出现次数或频率(产生条件402)来调整专注度等级。
于一实施例中,请参阅图6,本发明的目标添加处理可包括以下步骤。
步骤S20:控制模块10通过目标选择模块502来自目标影像库12中选择欲加入至当前的容器影像110的一或多个目标影像120。前述选择可由用户通过输入模块21手动选择,或是目标选择模块502自动选择,如随机选择或依据预设的选择规则(如依据容器影像110的剩余空间大小选择适当(数量或尺寸)的目标影像120,或是依据当前设定的辨识难度选择对应难度的目标影像120)。
步骤S21:控制模块10通过目标添加模块50将所选的目标影像120逐一加入至当前的容器影像110的各目标位置(预计生成位置),并将结果作为候选影像。前述目标位置可以是用户手动设定或者目标添加模块50自动选择,不加以限定。
步骤S22:控制模块10通过可靠度计算模块54计算本次所产生的候选影像的可靠度(即可靠度分数)。前述可靠度是对应所添加的目标影像120于候选影像中的辨识难度(如目标影像120与其周围影像之间的相似度、对比度等等)。
步骤S23:控制模块10判断候选影像的可靠度是否符合预设的可靠度临界值405(以下简称临界值)。
于一实施例中,若可靠度越高表示辨识难度越高时,控制模块10是于候选影像的可靠度大于或等于临界值405时,判定符合;若可靠度越低表示辨识难度越高时,控制模块10是于候选影像的可靠度小于或等于临界值405时,判定符合。前述方式所产生的训练影像TI的辨识难度是大于或等于用户设定的辨识难度,而不会有过于简单的问题。
于一实施例中,若可靠度与辨识难度成正比,则控制模块10可于候选影像的可靠度小于或等于临界值405时,判定符合;若可靠度与辨识难度成反比,则控制模块10可于候选影像的可靠度大于或等于临界值405时,判定符合。前述方式所产生的训练影像TI的辨识难度是小于或等于用户设定的辨识难度,而不会有过于困难的问题。
于一实施例中,控制模块10可于候选影像的可靠度等于临界值405(可为单一数值或数值范围)时,才判定符合,借以使所产生的训练影像TI具有稳定的辨识难度。
于候选影像的可靠度不符预设的可靠度临界值405(以下简称临界值)时,控制模块10再次执行步骤S20-S22,以重新产生候选影像,直到所生成的候选影像的可靠度符合临界值405。
于一实施例中,用户可输入难度设定操作来修改设定参数P,以借由调整临界值405来调整辨识难度。
于一实施例中,当添加多个目标影像120至同一容器影像110时,可靠度计算模块54分别计算各目标影像120于训练影像TI的可靠度。控制模块10仅针对可靠度不符临界值405的目标影像120重新执行添加处理。
于可靠度符合临界值时,控制模块10执行步骤S24:控制模块10设定此候选影像为训练影像TI,并完成目标添加处理。
复请参阅图5,于完成目标添加处理后,执行步骤S12:控制模块10可通过目标定位模块504来取得目标数据331(可包括目标类别及/或目标位置),并通过目标记录模块51记录各训练影像TI所包括的各目标影像120的目标数据331于训练影像库33。
于一实施例中,可进一步执行步骤S13:控制模块10通过目标记录模块51将各训练影像TI记录于训练影像库33(即训练影像330)。
于一实施例中,目标记录模块51是将各训练影像及其对应的目标数据331关联记录于训练影像库33。
请参阅图7于一实施例中,前述将目标影像120加入至容器影像110的步骤(S21)可包括以下步骤。
步骤S30:控制模块10通过第一物件检测模块500对容器影像110执行物件辨识处理,以检测未添加目标影像120的容器影像110的各原始物件的物件位置。
于一实施例中,第一物件检测模块500可取得物件检测模型401,物件检测模型401可存储于存储模块40,或者云端的服务器43(即云端运算)。物件检测模型401是于事前经由机器学习所产生(其产生方式为机器学习领域常见技术,于此不再赘述)。第一物件检测模块500是基于物件检测模型401对容器影像110执行物件辨识。
步骤S31:控制模块10通过目标选择模块502逐一选择要加入的目标影像120。前述选择可为用户手动选择或由控制模块10自动选择。
步骤S32:控制模块10通过目标位置选择模块501基于预设的位置选择规则403于容器影像110中设定所选择的各目标影像120的目标位置。
于一实施例中,前述位置选择规则403可被存储在存储模块40。并且,用户可输入难度设定操作来修改设定参数P,以借由调整位置选择规则403来调整辨识难度(如将目标影像120与原始物件重叠以提升难度,或将目标影像120设置于无原始物件的位置以降低难度)。
于一实施例中,前述位置选择规则403可包括目标位置与原始物件的物件位置至少部分重叠、目标位置不小于目标影像120的尺寸及/或目标位置大于原始物件的尺寸等,不加以限定。
步骤S33:控制模块10通过影像变换选择模块503基于预设的影像变换规则404自变形数据库20选择至少一函式200来对目标影像120执行影像变换处理。
于一实施例中,前述影像变换处理是变换目标影像120的外形、亮度、色彩、姿态、排列层序(即目标影像120与原始物件之间的重叠关系)及/或其他影像属性。
于一实施例中,前述影像变换规则404可被存储在存储模块40。并且,用户可输入难度设定操作来修改设定参数P,以借由调整影像变换规则404来调整辨识难度(如提高目标影像120与周围影像的相似度以提升难度,或降低目标影像120与周围影像的相似度以降低难度)。
于一实施例中,前述影像变换规则404包括基于目标影像120的目标类别选择函式200、基于容器影像110与目标影像120之间的影像差异选择函式200及/或基于目标位置与各物件位置选择函式200等,不加以限定。
步骤S34:控制模块10通过影像产生模块505将经过至少一种影像变换处理的目标影像120加入至容器影像110的目标位置,以完成添加目标影像120至容器影像110。
本发明通过调整设定参数P(如产生条件402、位置选择规则403、影像变换规则404与/或临界值405)可有效调整所产生的训练影像的辨识难度。
请参阅图8,控制模块10可通过可靠度计算模块54将候选影像作为物件辨识处理的输入影像来获得候选影像的各目标影像的类别辨识分数与完整度辨识分数,再依据前述分数计算可靠度。前述类别辨识分数是对应目标类别被正确辨识的几率,前述完整度辨识分数是对应目标位置被正确辨识的几率。
具体而言,前述计算可靠度的步骤(S22)可包括步骤S40-S42。
步骤S40:控制模块10通过第二物件检测模块506对输入影像(如候选影像)的多个影像区块分别执行物件辨识,以决定各影像区块属于各类别的几率(第一几率),将影像区块设定为最高的第一几率的类别(即设定此影像区块的物件类别),并基于最高的第一几率设定类别辨识分数(即设定此影像区块属于此物件类别的可靠度)。
请参阅图12,候选影像80(为行李影像)可分为多个影像区块。控制模块10可使用物件检测模型401对各影像区块执行物件辨识。如影像区块800的辨识结果为“75%的几率是手枪”,影像区块801的辨识结果为“60%的几率是手枪”,影像区块802的辨识结果为“70%的几率是手机,20%的几率是行李袋底座”。
接着,控制模块10可决定影像区块800为手枪(类别辨识分数0.75),影像区块801为手机(类别辨识分数0.6),影像区块802为手机(类别辨识分数0.7)。借此完成各影像区块的类别辨识分数的计算。
复请参阅图8,步骤S41:控制模块10通过第二物件检测模块506对输入影像的多个范围分别执行完整度辨识,以决定各范围涵盖完整的物件的几率(第二几率),将物件的位置设定为最高的第二几率的范围(即设定此物件的范围),并基于最高的第二几率设定完整度辨识分数(即设定此范围涵盖完整物件的可靠度)。
请参阅图13,控制模块10可于候选影像80中圈选多个范围90-91,并使用物件检测模型401对各范围执行完整度辨识。如范围90的辨识结果为“有60%的几率涵盖完整的枪支”,范围91的辨识结果为“有70%的几率涵盖完整的枪支”。
接着,控制模块10可决定范围90的完整度辨识分数为0.6,范围91的完整度辨识分数为0.7。
复请参阅图8,步骤S42:控制模块10通过可靠度计算模块54基于各目标影像的类别辨识分数与完整度辨识分数计算(如加权平均、相加或相乘等,不加以限定)各目标影像的可靠度。
于一实施例中,控制模块10可依据下列式(一)来计算可靠度:
可靠度=Pr(Class|Grid)*Pr(Object)…………式(一)其中,Pr(Class|Grid)为类别辨识分数;Pr(Object)完整度辨识分数。
请参阅图14,经过前述步骤S40-S44的执行,控制模块10可获得容器影像中所有物件的可靠度(辨识难度),如目标影像92(手枪)的可靠度为0.85,原始物件93(手机)的可靠度为0.98,原始物件94(笔记本)的可靠度为0.95。并且,控制模块10可判断目标影像92的可靠度是否符合所设定的临界值(如0.7、0.9、0.95、0.7-0.95或0.8-0.9等)。
值得一提的是,前述第一物件检测模块500(步骤S30)可采用步骤S40-S42的物件辨识处理来对容器影像110的原始物件执行物件辨识。
于一实施例中,请参阅图3、图9,本发明可提供即时物件输送检查(如海关行李检查)的辨识训练。
自动生成系统1可包括电性连接控制模块10的输送带模块31。输送带模块31用来运送容器(如行李)。设置于定点的影像撷取装置30(如X光机)可逐一拍摄输送带模块31输送的容器以依序获得不同行李的容器影像110(如X光的放射线影像)。
接着,于辨识训练中,控制模块10依序取得所拍摄的多个容器影像110(步骤S50),依据预设的产生条件402选择部分的容器影像来添加目标影像120,以获得训练影像TI(步骤S51、S52),并记录对应的目标数据(S53)。
此外,控制模块10通过输送带信息取得模块52取得输送带模块31的输送带信息CBI(步骤S54),并通过整合显示控制模块53于显示模块32将容器影像110与训练影像TI结合输送带信息CBI依序显示于显示模块32。
于一实施例中,整合显示控制模块53是控制显示模块32依据容器影像110与训练影像TI的取得顺序,滚动显示(即如同跑马灯的显示方式)多个容器影像与训练影像。
于一实施例中,前述滚动显示速度是基于输送带信息的输送速度所决定,如输送速度越快,滚动显示越快(各影像停留在显示画面的时间越短,人员可进行辨识的时间越短),输送速度越慢,滚动显示越慢(各影像停留在显示画面的时间越长,人员可进行辨识的时间越长)。
于一实施例中,控制模块10不会将目标影像120与容器影像110直接合并为单一影像,而是通过于同一画面同时显示目标影像120与容器影像110来实现训练影像。
具体而言,控制模块10可依据输送带信息、容器影像110及目标位置持续计算目标影像120最新的显示位置,于滚动显示对应的容器影像110时,同时以相同的滚动速度于最新的显示位置显示目标影像120,以使目标影像120随着对应的容器影像110移动,而实现显示训练影像的效果。
请参阅图10-11,控制模块10依序取得多张容器影像60-62,并选择对容器影像61执行目标添加处理。
首先,控制模块10载入容器影像(如影像610所示),对容器影像执行物件辨识,以辨识多个原始物件70-71(如影像611所示)。
接着,控制模块10可选择目标位置72(如影像612所示),并将所选择的目标影像73加入至目标位置72(如影像613所示,此时可一并设定目标数据74)。
接着,控制模块10可对目标影像73执行影像变换(如放大处理)为目标影像75,以提升可靠度(如影像614所示)。
若影像614(候选影像)的目标影像75的可靠度不符临界值时,控制模块10可对目标影像75再次执行影像变换(如缩小处理与旋转处理)为目标影像76,以再次提升可靠度(如影像61’所示)。
最后,训练影像61’的目标影像76的可靠度符合临界值,控制模块10可将容器影像61替换为训练影像61’,以完成训练影像的生成(如图11)。
更进一步地,用户可观看依序所播放的容器影像60、训练影像61’与容器影像60,并进行辨识训练的相关操作。
举例来说,用户可以通过输入模块21输入验证操作,来使控制模块10控制显示模块32显示训练影像61’(如以显示过的训练影像)的目标影像76的目标数据,以供用户验证。
于另一例子中,用户可以通过输入模块21输入停止操作或运行操作,以控制输送带模块31的状态停止或继续运行,并改变输送带信息的速度为停止或运行。
并且,控制模块10于输送带信息被设定为停止时,可控制显示模块32停止显示画面的滚动;于输送带信息被设定为运行时,继续显示画面的滚动。
借此,本发明可模拟即时物件输送检查。
本发明可自动产生训练影像,且训练影像的辨识难度可由用户指定,而适用于客制化辨识训练。
以上所述仅为本发明的较佳具体实例,非因此即局限本发明的权利要求,故举凡运用本发明内容所为的等效变化,均同理皆包含于本发明的范围内,合予陈明。
Claims (16)
1.一种训练影像的自动生成方法,包括以下步骤:
a)取得多个容器影像,自该多个容器影像选择一个来执行一目标添加处理,以变换所选择的该容器影像为包括一目标影像的一训练影像;及
b)记录该训练影像及一目标数据,其中该目标数据包括该目标影像的一目标类别与一目标位置的至少其中之一;
其中,该目标添加处理包括以下步骤:
c1)取得该目标影像;
c2)将该目标影像加入至所选择的该容器影像的该目标位置,以作为一候选影像;
c3)计算该候选影像的一可靠度,其中该可靠度是对应该目标影像于该候选影像中的辨识难度;及
c4)于该可靠度不符一临界值时,重复执行步骤c1)-c3),直到生成该可靠度符合该临界值的该候选影像,以作为该训练影像。
2.如权利要求1所述的训练影像的自动生成方法,其中,步骤c1)还包括自一目标影像库中选择该目标影像;以及
步骤c2)还包括以下步骤:
d1)对该容器影像执行一物件辨识处理,以检测该容器影像的一原始物件的一物件位置;
d2)基于一位置选择规则于该容器影像中设定该目标位置;
d3)基于一影像变换规则自一变形数据库选择至少一函式来对该目标影像执行一影像变换处理,以变换该目标影像的外形、亮度、色彩、姿态与排列层序的至少其中之一;及
d4)将处理后的该目标影像加入至该容器影像的该目标位置。
3.如权利要求2所述的训练影像的自动生成方法,其中,该物件辨识处理包括基于经由机器学习产生的一物件检测模型来执行物件辨识;
该位置选择规则包括该目标位置与该物件位置至少部分重叠、该目标位置不小于该目标影像的尺寸、该目标位置大于该原始物件的尺寸的至少其中之一;
该影像变换规则包括基于该目标影像的该目标类别选择该至少一函式、基于该容器影像与该目标影像的间的影像差异选择该至少一函式、基于该目标位置与该物件位置选择该至少一函式的至少其中之一。
4.如权利要求1所述的训练影像的自动生成方法,其中,计算该可靠度包括以下步骤:
e1)将该候选影像作为一物件辨识处理的一输入影像来获得该候选影像的该目标影像的一类别辨识分数与一完整度辨识分数,其中该类别辨识分数是对应该目标类别被正确辨识的几率,该完整度辨识分数是对应该目标位置被正确辨识的几率;及
e2)基于该目标影像的该类别辨识分数与该完整度辨识分数计算该目标影像的该可靠度;
其中,于该候选影像包括多个该目标影像时,步骤c4)还包括于该候选影像的任一该目标影像的该可靠度不符该临界值时,对该目标影像的添加重复执行所述步骤c1)-c3)。
5.如权利要求4所述的训练影像的自动生成方法,其中,该物件辨识处理包括以下步骤:
f1)对该输入影像的多个影像区块分别执行物件辨识,以决定各该影像区块属于各类别的第一几率,将该影像区块设定为最高的该第一几率的该类别,并基于最高的该第一几率设定该类别辨识分数;及
f2)对该输入影像的多个范围分别执行完整度辨识,以决定各该范围涵盖完整的一物件的第二几率,将该物件的位置设定为最高的该第二几率的该范围,并基于最高的该第二几率设定该完整度辨识分数。
6.如权利要求1所述的训练影像的自动生成方法,其中,步骤a)包括取得有序的该多个容器影像,并依据一产生条件选择该容器影像来变换为该训练影像,该方法还包括以下步骤:
g1)于一显示模块依序滚动显示该多个容器影像与该训练影像,其中该滚动显示速度是基于一输送带信息所决定;及
g2)于接受一验证操作时,显示该训练影像的该目标影像的该目标数据。
7.如权利要求1所述的训练影像的自动生成方法,其中,步骤a)包括经由一影像撷取装置依序拍摄多个物件来取得该多个容器影像,并依据一产生条件选择该容器影像来变换为该训练影像,该方法还包括以下步骤:
h1)于一显示模块依序滚动显示该多个容器影像与该训练影像,其中该滚动显示的速度是基于一输送带信息所决定;
h2)于该输送带信息被设定为停止时,停止该显示模块的显示画面的滚动;
h3)于该输送带信息被设定为运行时,继续该显示画面的滚动;及
h4)于接受一验证操作时,输出已显示的该训练影像的该目标影像的该目标数据;
其中,该训练影像的滚动显示包括依据该输送带信息、该容器影像及该目标位置持续计算该目标影像的显示位置,滚动显示对应的该容器影像,并同时于最新的该显示位置显示该目标影像,以使该目标影像随着对应的该容器影像移动。
8.如权利要求1所述的训练影像的自动生成方法,还包括以下任一步骤:
i)将各该训练影像与对应的该目标数据记录于一训练影像库;或
j)于接受一难度设定操作时,基于该难度设定操作调整该临界值、该训练影像的一产生条件、该目标位置的一位置选择规则与该目标影像的一影像变换规则的至少其中之一,以调整该目标影像于该候选影像的辨识难度;其中,该多个容器影像、该目标影像与该训练影像为放射线影像。
9.一种训练影像的自动生成系统,包括:
一容器影像源,具有多个容器影像;
一目标影像库,具有多个目标影像;及
一控制模块,电性连接该容器影像源与该目标影像库,该控制模块包括:
一目标添加模块,被配置来自该多个容器影像选择至少一个来执行一目标添加处理,以变换所选择的该容器影像为包括一目标影像的一训练影像,其中,该目标添加处理包括将该目标影像加入至该容器影像的一目标位置,以作为一候选影像;
一目标记录模块,被配置来记录该训练影像及一目标数据,该目标数据包括该目标影像的一目标类别与该目标位置的至少其中之一;及
一可靠度计算模块,被配置来计算该候选影像的一可靠度;
其中,该控制模块被配置来于该可靠度不符一临界值时,经由该目标添加模块重复执行该目标添加处理,直到生成该可靠度符合该临界值的该候选影像,以作为该训练影像,该可靠度是对应该目标影像于该候选影像的辨识难度。
10.如权利要求9所述的训练影像的自动生成系统,其中,该控制模块还包括:
一第一物件检测模块,被配置来基于一物件检测模型来对该容器影像执行一物件辨识处理,以检测该容器影像的一原始物件的一物件位置;
一目标选择模块,被配置来自该目标影像库选择该目标影像;
一目标位置选择模块,被配置来基于一位置选择规则于该容器影像中设定该目标位置;
一影像变换选择模块,基于一影像变换规则自一变形数据库选择至少一函式来对该目标影像执行一影像变换处理,以变换该目标影像的外形、亮度、色彩、姿态与排列层序的至少其中之一;及
一影像产生模块,将处理后的该目标影像加入至该容器影像的该目标位置以产生该训练影像,
其中,该控制模块还被配置为自一存储模块读取该位置选择规则、该影像变换规则、该临界值及基于经由机器学习产生的该物件检测模型;
其中该位置选择规则包括该目标位置与该物件位置至少部分重叠、该目标位置不小于该目标影像的尺寸、该目标位置大于该原始物件的尺寸的至少其中之一;
其中该影像变换规则包括基于该目标影像的该目标类别选择该至少一函式、基于该容器影像与该目标影像的间的影像差异选择该至少一函式、基于该目标位置与各该物件位置选择该至少一函式的至少其中之一。
11.如权利要求9所述的训练影像的自动生成系统,其中,该控制模块还包括:
一第二物件检测模块,被配置来将该候选影像作为一物件辨识处理的一输入影像来获得该候选影像的该目标影像的一类别辨识分数与一完整度辨识分数,其中该类别辨识分数是对应该目标类别被正确辨识的几率,该完整度辨识分数是对应该目标位置被正确辨识的几率,
其中,该可靠度计算模块被配置来基于该类别辨识分数与该完整度辨识分数计算该目标影像的该可靠度;
其中,该控制模块被配置为于该候选影像包括多个该目标影像且该候选影像的任一该目标影像的该可靠度不符该临界值时,针对该目标影像再次执行该目标添加处理。
12.如权利要求11所述的训练影像的自动生成系统,其中,该第二物件检测模块被配置来于该物件辨识处理中,对该输入影像的多个影像区块分别执行物件辨识,以决定各该影像区块属于各类别的第一几率,将该影像区块设定为最高的该第一几率的该类别,并基于最高的该第一几率设定该类别辨识分数,该第二物件检测模块更被配置来对该输入影像的多个范围分别执行完整度辨识,以决定各该范围涵盖完整的一物件的第二几率,将该物件的位置设定为最高的该第二几率的该范围,并基于最高的该第二几率设定该完整度辨识分数。
13.如权利要求9所述的训练影像的自动生成系统,还包括电性连接该控制模块的一训练影像库;
其中,该控制模块更被配置来经由该容器影像源取得有序的该多个容器影像,自一存储模块读取一产生条件,并依据该产生条件选择该容器影像来变换为该训练影像;
其中,该控制模块还包括:
一输送带信息取得模块,被配置来取得一输送带信息;及
一整合显示控制模块,被配置来于一显示模块依序滚动显示该多个容器影像与该训练影像,其中该滚动显示速度是基于该输送带信息所决定,并被配置来于经由一输入模块接受一验证操作时,显示该训练影像的该目标影像的该目标数据;
其中,该目标记录模块被配置为将各该训练影像与对应的该目标数据记录于该训练影像库。
14.如权利要求9所述的训练影像的自动生成系统,其中,该控制模块还被配置来经由该容器影像源的一影像撷取装置依序拍摄多个物件来取得该多个容器影像,自一存储模块读取一产生条件,并依据该产生条件选择该容器影像来变换为该训练影像;
其中,该控制模块还包括:
一输送带信息取得模块,被配置来取得一输送带模块的一输送带信息;及
一整合显示控制模块,被配置来于一显示模块依序滚动显示该多个容器影像与该训练影像,于该输送带信息被设定为停止时,停止该显示模块的显示画面的滚动,于该输送带信息被设定为运行时,继续该显示画面的滚动,其中该滚动显示的速度是基于该输送带信息所决定;
其中该控制模块还被配置来于经由一输入模块接受一验证操作时,于该显示模块输出已显示的该训练影像的该目标影像的该目标数据;
其中,该整合显示控制模块更被配置来依据该输送带信息、该容器影像及该目标位置持续计算该目标影像的显示位置,滚动显示对应的该容器影像,并同时于最新的该显示位置显示该目标影像,以使该目标影像随着对应的该容器影像移动。
15.如权利要求9所述的训练影像的自动生成系统,其中,该多个容器影像、该目标影像与该训练影像为放射线影像,其中,该控制模块还被配置为于经由一输入模块接受一难度设定操作时,基于该难度设定操作调整该临界值、该训练影像的一产生条件、该目标位置的一位置选择规则与该目标影像的一影像变换规则的至少其中之一,以调整该目标影像于该候选影像的辨识难度。
16.一种训练影像的自动生成方法,包括以下步骤:
a)取得一容器影像;
b)取得一目标影像;
c)将该目标影像加入至该容器影像的一目标位置,以作为一候选影像;
d)计算该候选影像的一可靠度,其中该可靠度是对应该目标影像于该候选影像中的辨识难度;及
e)于该可靠度不符一临界值时,重复执行步骤b)-d),直到生成该可靠度符合该临界值的该候选影像,以作为一训练影像。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17/472,951 US11709913B2 (en) | 2020-10-14 | 2021-09-13 | Automatic generation system of training image and method thereof |
EP21196786.4A EP3985619A1 (en) | 2020-10-14 | 2021-09-15 | Automatic generation system of training image and method thereof |
JP2021155566A JP7357033B2 (ja) | 2020-10-14 | 2021-09-24 | トレーニングイメージの自動生成システム及びその方法 |
US18/205,490 US11989264B2 (en) | 2020-10-14 | 2023-06-02 | Automatic generation system of training image and method thereof |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063091857P | 2020-10-14 | 2020-10-14 | |
US63/091,857 | 2020-10-14 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114429569A true CN114429569A (zh) | 2022-05-03 |
Family
ID=81308989
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011389588.6A Pending CN114429569A (zh) | 2020-10-14 | 2020-12-01 | 训练影像的自动生成系统及其方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN114429569A (zh) |
TW (2) | TWI770699B (zh) |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6548690B2 (ja) * | 2016-10-06 | 2019-07-24 | 株式会社アドバンスド・データ・コントロールズ | シミュレーションシステム、シミュレーションプログラム及びシミュレーション方法 |
CN107067020B (zh) * | 2016-12-30 | 2019-11-15 | 腾讯科技(上海)有限公司 | 图片识别方法及装置 |
TWM553128U (zh) * | 2017-01-20 | 2017-12-21 | 台達電子工業股份有限公司 | 動物載床 |
EP3685350A4 (en) * | 2017-09-22 | 2021-05-19 | Nview Medical Inc. | IMAGE RECONSTRUCTION USING MACHINE LEARNING REGULARIZERS |
TW202006608A (zh) * | 2018-07-02 | 2020-02-01 | 由田新技股份有限公司 | 遞迴性深度學習系統的訓練方法與檢測系統 |
CN114577812A (zh) * | 2018-08-15 | 2022-06-03 | 心鉴智控(深圳)科技有限公司 | 基于超小样本训练高效质检模型的方法及系统 |
CN110335344A (zh) * | 2019-06-20 | 2019-10-15 | 中国科学院自动化研究所 | 基于2d-3d注意机制神经网络模型的三维重建方法 |
-
2020
- 2020-12-01 CN CN202011389588.6A patent/CN114429569A/zh active Pending
- 2020-12-01 TW TW109142187A patent/TWI770699B/zh active
-
2021
- 2021-07-02 TW TW110124351A patent/TWI779696B/zh active
Also Published As
Publication number | Publication date |
---|---|
TWI770699B (zh) | 2022-07-11 |
TW202215374A (zh) | 2022-04-16 |
TWI779696B (zh) | 2022-10-01 |
TW202215291A (zh) | 2022-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10740647B2 (en) | Detecting objects using a weakly supervised model | |
CN111340126B (zh) | 物品识别方法、装置、计算机设备和存储介质 | |
WO2020078119A1 (zh) | 模拟用户穿戴服装饰品的方法、装置和系统 | |
US20150170001A1 (en) | Training image sampling | |
CN109165645A (zh) | 一种图像处理方法、装置以及相关设备 | |
CN108416902A (zh) | 基于差异识别的实时物体识别方法和装置 | |
CN109711508B (zh) | 图像处理方法和装置 | |
CN107918767B (zh) | 目标检测方法、装置、电子设备及计算机可读介质 | |
CN106650743B (zh) | 图像强反光检测方法和装置 | |
CN117115571B (zh) | 一种细粒度智能商品识别方法、装置、设备及介质 | |
CN110222641A (zh) | 用于识别图像的方法和装置 | |
CN108597034B (zh) | 用于生成信息的方法和装置 | |
CN108182457A (zh) | 用于生成信息的方法和装置 | |
CN110059212A (zh) | 图像检索方法、装置、设备及计算机可读存储介质 | |
US11989264B2 (en) | Automatic generation system of training image and method thereof | |
CN115457458A (zh) | 一种非接触式智能盘点系统和方法 | |
CN110490058A (zh) | 行人检测模型的训练方法、装置、系统和计算机可读介质 | |
Buls et al. | Generation of synthetic training data for object detection in piles | |
CN108446693B (zh) | 待识别目标的标记方法、系统、设备及存储介质 | |
CN114429569A (zh) | 训练影像的自动生成系统及其方法 | |
CN110659579B (zh) | 变质物品识别方法、装置、设备和介质 | |
CN113343987B (zh) | 文本检测处理方法、装置、电子设备及存储介质 | |
CN114219401A (zh) | 录入商品信息的方法、装置、设备、介质及程序产品 | |
CN115035129A (zh) | 货物的识别方法、装置、电子设备和存储介质 | |
CN111881338A (zh) | 一种基于社交软件轻应用小程序的印刷品内容检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |