CN110609877A - 一种图片采集的方法、装置、设备和计算机存储介质 - Google Patents

一种图片采集的方法、装置、设备和计算机存储介质 Download PDF

Info

Publication number
CN110609877A
CN110609877A CN201810614334.6A CN201810614334A CN110609877A CN 110609877 A CN110609877 A CN 110609877A CN 201810614334 A CN201810614334 A CN 201810614334A CN 110609877 A CN110609877 A CN 110609877A
Authority
CN
China
Prior art keywords
picture
region
candidate
similarity
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810614334.6A
Other languages
English (en)
Other versions
CN110609877B (zh
Inventor
黄洪森
张文翰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201810614334.6A priority Critical patent/CN110609877B/zh
Publication of CN110609877A publication Critical patent/CN110609877A/zh
Application granted granted Critical
Publication of CN110609877B publication Critical patent/CN110609877B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Abstract

本发明提供了一种图片采集的方法、装置、设备和计算机存储介质,其中方法包括:获取用户采集的第一图片;从所述第一图片中提取候选区域,所述候选区域为不符合要求的目标区域;引导用户针对所述候选区域重新进行采集;获取用户重新采集的第二图片;若所述第二图片符合要求且所述第二图片和所述第一图片中的候选区域的相似度符合预设相似度要求,则将所述第二图片存入数据库。本发明提供的方式有助于提高众包采集的图片质量。

Description

一种图片采集的方法、装置、设备和计算机存储介质
【技术领域】
本发明涉及计算机应用技术领域,特别涉及一种图片采集的方法、装置、设备和计算机存储介质。
【背景技术】
随着智能终端设备的迅速普及和网速的提高,适用于智能终端设备的电子地图业务得到了迅猛的发展。逐渐朝着高覆盖、高精度的方向发展,甚至发展出了实景地图、混合现实地图等方式更准确地表达真实世界。
由于实景地图、混合现实地图等类型的地图需要预先采集大量高质量的实景图片,因此目前大多采用众包的方式进行采集,即将图片采集的工作众包给各用户。用户在拍摄图片时,针对某一目标(例如门脸、招牌、大门、公交站点等)进行拍摄。其中相机的定焦、光照、角度、用户的技术、责任心等都会影响采集的图片质量,从而导致采集到的图片不符合质量要求。目前尚没有很好的方式来解决该问题。
【发明内容】
有鉴于此,本发明提供了一种图片采集的方法、装置、设备和计算机存储介质,以便于提高众包采集的图片质量。
具体技术方案如下:
一方面,本发明提供了一种图片采集的方法,该方法包括:
获取用户采集的第一图片;
从所述第一图片中提取候选区域,所述候选区域为不符合要求的目标区域;
引导用户针对所述候选区域重新进行采集;
获取用户重新采集的第二图片;
若所述第二图片符合要求且所述第二图片和所述第一图片中的候选区域的相似度符合预设相似度要求,则将所述第二图片存入数据库。
根据本发明一优选实施方式,从所述第一图片中提取候选区域包括:
对所述第一图片进行特征提取;
利用提取的特征和预先训练的区域分类模型,识别所述第一图片中不符合要求的目标区域作为候选区域。
根据本发明一优选实施方式,所述引导用户针对所述候选区域重新进行采集包括:
利用所述候选区域进行轮廓识别;
利用识别结果生成拍摄区域;
展示所述拍摄区域。
根据本发明一优选实施方式,该方法还包括:
对所述第二图片进行特征提取;
利用提取的特征和预先训练的区域分类模型,识别所述第二图片中是否存在不符合要求的目标区域;
如果否,则确定所述第二图片符合要求。
根据本发明一优选实施方式,所述特征提取包括:
利用卷积神经网络CNN进行特征提取,提取的特征包括以下一种或任意组合:
图片中物体形状、文字、标志、材质以及纹理。
根据本发明一优选实施方式,所述区域分类模型的分类结果包括:
各预设类型的目标区域以及不符合要求的目标区域,其中不符合要求的目标区域优先级高于所述各预设类型的目标区域。
根据本发明一优选实施方式,所述特征区域分类模型的训练方式包括:
获取已进行区域标注的图片作为训练数据,其中标注的区域包括:各预设类型的目标区域及不符合要求的目标区域,其中不符合要求的目标区域优先级高于所述各预设类型的目标区域;
对训练数据中的各图片进行特征提取;
将提取的特征作为输入,将标注的区域作为输出,训练分类模型,得到所述特征区域分类模型。
根据本发明一优选实施方式,该方法还包括:
利用预先训练的序列到序列seq2seq模型,分别从所述第一图片中的候选区域从提取第一摘要表示以及从所述第二图片中提取第二摘要表示;
计算所述第一摘要表示和所述第二摘要表示之间的相似度,若相似度满足预设要求,则确定所述第二图片和所述第一图片中的候选区域的相似度符合预设相似度要求。
根据本发明一优选实施方式,所述seq2seq模型采用以下方式训练得到:
获取已提取摘要表示的图片作为训练数据;
利用所述训练数据训练seq2seq模型。
根据本发明一优选实施方式,该方法还包括:
若所述第二图片不符合要求,或者所述第二图片和所述第一图片中的候选区域的相似度不符合预设相似度要求,则转至执行所述引导用户针对所述候选区域重新进行采集。
根据本发明一优选实施方式,该方法还包括:
将所述第一图片存入数据库,且标记所述第二图片与所述第一图片的区域关联信息。
另一方面,本发明还提供了一种图片采集的装置,该装置包括:
采集单元,用于获取用户采集的第一图片;
区域提取单元,用于从所述第一图片中提取候选区域,所述候选区域为不符合要求的目标区域;
引导单元,用于引导用户针对所述候选区域重新进行采集;
所述采集单元,还用于获取用户重新采集的第二图片;
检验单元,用于检验是否所述第二图片符合要求且所述第二图片和所述第一图片中的候选区域的相似度符合预设相似度要求;
存储单元,用于在所述检验单元的检验结果为是时,将所述第二图片存入数据库。
根据本发明一优选实施方式,所述区域提取单元,具体执行:
对所述第一图片进行特征提取;
利用提取的特征和预先训练的区域分类模型,识别所述第一图片中不符合要求的目标区域作为候选区域。
根据本发明一优选实施方式,所述引导单元,具体执行:
利用所述候选区域进行轮廓识别;
利用识别结果生成拍摄区域;
展示所述拍摄区域。
根据本发明一优选实施方式,所述检验单元,具体用于:
对所述第二图片进行特征提取;
利用提取的特征和预先训练的区域分类模型,识别所述第二图片中是否存在不符合要求的目标区域;
如果否,则确定所述第二图片符合要求。
根据本发明一优选实施方式,该装置还包括:
训练单元,用于获取已进行区域标注的图片作为训练数据,其中标注的区域包括:各预设类型的目标区域及不符合要求的目标区域,其中不符合要求的目标区域优先级高于所述各预设类型的目标区域;对训练数据中的各图片进行特征提取;将提取的特征作为输入,将标注的区域作为输出,训练分类模型,得到所述特征区域分类模型。
根据本发明一优选实施方式,所述检验单元,还用于:
利用预先训练的序列到序列seq2seq模型,分别从所述第一图片中的候选区域从提取第一摘要表示以及从所述第二图片中提取第二摘要表示;
计算所述第一摘要表示和所述第二摘要表示之间的相似度,若相似度满足预设要求,则确定所述第二图片和所述第一图片中的候选区域的相似度符合预设相似度要求。
根据本发明一优选实施方式,所述引导单元,还用于若所述检验单元的检验结果为否时,引导用户针对所述候选区域重新进行采集。
另一方面,本发明还提供了一种设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述的方法。
再一方面,本发明提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行上述的方法。
由以上技术方案可以看出,本发明能够针对用户采集的图片提取出不符合要求的目标区域,并引导用户针对该区域重新进行采集,直至用户重新采集的图片符合要求后,将重新采集的图片存入数据库,从而有效提高众包采集的图片质量。
【附图说明】
图1为本发明实施例提供的图片采集的方法流程图;
图2为本发明实施例提供的候选区域的提取流程图;
图3为本发明实施例提供的引导用户重新拍摄的实例图;
图4为本发明实施例提供的一种优选实施方式流程图;
图5为本发明实施例提供的装置结构图;
图6示出了适于用来实现本发明实施方式的示例性计算机系统/服务器的框图。
【具体实施方式】
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
本发明所提供的图片采集方法除了地图数据的众包采集之外,还可以适用于其他图片采集的应用场景。在本发明实施例中仅以地图数据中实景图片的众包采集为例进行描述。
图1为本发明实施例提供的图片采集的方法流程图,如图1中所示,该方法可以包括以下步骤:
在101中,获取用户采集的第一图片。
本发明实施例所提供方法的执行主体可以为位于本地终端的应用,或者还可以为位于本地终端的应用中的插件或软件开发工具包(Software Development Kit,SDK)等功能单元,或者,还可以位于服务器端,本发明实施例对此不进行特别限定。
若在本地终端执行,则由本地终端获取用户采集的第一图片。若在服务器端执行,则获取本地终端发送来的用户采集的第一图片。
用户通过终端设备进行实景照片的拍摄,从而获取第一图片。
在102中,从第一图片中提取候选区域,其中候选区域为不符合要求的目标区域。
本步骤中,候选区域就是需要用户重新进行采集的区域。候选区域需要符合两点:
第一是目标区域,在实景照片采集时,重点关注的是一些预设类型的目标,比如文字区域、logo(标识)区域、窗户、门口、楼块、门脸等等与地图元素比较相关的区域,而对于其他非相关区域则并不关心,即便不清楚也不会对实景地图产生很大影响。
第二是不符合要求。其中不符合要求可以是质量不符合要求,例如像素低,也可以是尺寸、角度、被遮挡、发生扭曲等其他情况不符合图片采集的要求。对于目标区域而言,如果符合要求,则不必重新进行采集,如果不符合要求才需要重新进行采集。
在此提供一种优选的实施方式,如图2中所示,首先对第一图片进行特征提取;利用提取的特征和预先训练的区域分类模型,识别第一图片中不符合要求的目标区域作为候选区域。
其中,在进行特征提取时,可以利用CNN(Convolutional Neural Network,卷积神经网络)进行特征提取,提取的特征可以包括但不限于:图片中物体形状、文字、标志、材质以及纹理。另外,除了CNN之外,还可以采用RNN等其他神经网络进行特征提取。
在本发明实施例中,区域分类模型的分类结果可以包括:各预设类型的目标区域以及不符合要求的目标区域,其中不符合要求的目标区域优先级高于所述各预设类型的目标区域。一方面,区域分类模型能够识别出各预设类型的目标区域,另一方面,也能够对各区域进行是否符合要求的识别。当一个区域同时是预设类型的目标区域又是不符合要求的区域时,将其分类为不符合要求的区域。其中预设类型的目标区域可以包括但不限于诸如文字区域、logo(标识)区域、窗户区域、门口区域、楼块区域、门脸区域。
假设用户采集的第一图片经过区域分类模型的识别,包括两个目标区域,文字区域和窗户区域,其中窗户区域不符合要求,则区域分类模型的识别结果为文字区域和不符合要求的区域。
具体地,特征区域分类模型的训练方式可以包括以下步骤:
S11、获取已进行区域标注的图片作为训练数据,其中标注的区域包括:各预设类型的目标区域及不符合要求的目标区域,其中不符合要求的目标区域优先级高于所述各预设类型的目标区域。
训练数据中,对图片区域的标注可以采用人工方式进行。训练数据可以从数据库中获取历史采集到的不符合要求的图片。
S12、对训练数据中的各图片进行特征提取。
本步骤中特征提取的方式与上述对第一图片进行特征提取的方式相同,可以利用CNN、RNN等神经网络模型进行特征提取,提取的特征可以包括但不限于:图片中物体形状、文字、标志、材质以及纹理。
S13、将提取的特征作为输入,将标注的区域作为输出,训练分类模型,得到特征区域分类模型。
其中分类模型可以采用诸如SVM(SupportVectorMachine,支持向量机)、基于神经网络模型的分类模型等。
继续参见图1,得到候选区域之后,在103中,引导用户针对候选区域重新进行采集。
在本步骤中,可以直接将得到的候选区域在界面上展现给用户,并引导用户针对候选区域重新进行采集。作为一种优选的实施方式,可以先利用候选区域进行轮廓识别;然后利用识别结果生成拍摄区域,展示该拍摄区域以引导用户重新进行采集。其中,轮廓识别主要是为了更准确地刻画目标,例如准确地识别出门脸、楼块、窗户等的轮廓,以该轮廓所围成的区域作为拍摄区域。本发明实施例并不限于轮廓识别的具体方式,可以采用传统的边缘检测算子的方式进行轮廓检测,也可以采用数学模型的方式进行轮廓检测。
在引导用户重新拍摄时,可以采用但不限于文字、图标、声音等方式。例如,在确定出拍摄区域后,突出显示该拍摄区域并配以文字“请重新拍摄拍摄区域的清晰放大图”,或者突出显示该拍摄区域并播放声音“请重新拍摄拍摄区域的清晰放大图”。
关于引导再次拍摄的过程举一个例子,如图3中(a)所示,用户首次拍摄了一张照片,通过候选区域分类模型后,识别出候选区域,利用候选区域向用户展示(b)中所示的界面,并引导用户重新拍摄框出区域的清晰放大图。用户重新拍摄一张图片,如图3中(c)所示。
在104中,获取用户重新采集的第二图片。
用户按照上述引导针对候选区域重新进行采集后,将重新采集的图片称为“第二图片”。也就是说,用户可以进行二次采集,但并不限于二次采集,也可能会进行三次采集、四次采集等直至采集到的第二图片符合要求,具体要求参见步骤105。
在105中,判断第二图片是否符合要求且第二图片和第一图片中的候选区域的相似度符合预设相似度要求,如果是,则执行106;否则,转至执行103。
在本步骤中,第二图片一方面需要符合图片采集的要求,另一方面需要和第一图片中的候选区域的相似度符合预设相似度要求。两者必须同时满足,否则重新进行采集。
在判断第二图片是否符合要求时,可以采用简单地判断是否满足像素等质量要求等方式。在此也可以利用上述的区域分类模型进行判断。
具体地,可以包括以下步骤:
S21、先对第二图片进行特征提取。其中,在进行特征提取时,可以利用CNN(Convolutional Neural Network,卷积神经网络)进行特征提取,提取的特征可以包括但不限于:图片中物体形状、文字、标志、材质以及纹理。另外,除了CNN之外,还可以采用RNN等其他神经网络进行特征提取。
S22、利用提取的特征和预先训练的区域分类模型,识别第二图片中是否存在不符合要求的目标区域。
如步骤102中所述的,区域分类模型的分类结果可以包括:各预设类型的目标区域以及不符合要求的目标区域,其中不符合要求的目标区域优先级高于各预设类型的目标区域。也就是说,一旦第二图像中存在不符合要求的目标区域,则会输出该结果。
S23、如果S22的识别结果为否,则确定第二图片符合要求。如果S22的识别结果为是,则确定第二图片不符合要求。
在判断第二图片和第一图片中的候选区域的相似度是否符合预设相似度要求时,可以直接计算第二图片和第一图片中的候选区域的相似度,但在此提供一种优选的方式,具体包括以下步骤:
S31、利用预先训练的seq2seq(序列到序列)模型,分别从第一图片中的候选区域从提取第一摘要表示以及从第二图片中提取第二摘要表示。
seq2seq是一个encoder-decoder结构的网络,它的输入是一个序列,输出也是一个序列。其中,encoder可以将一个可变长度的信号序列变为固定长度的向量表达,decoder将这个固定长度的向量表达变成可变长度的目标信号序列。在本发明实施例中,可以预先获取已提取摘要表示的图片作为训练数据;利用该练数据训练seq2seq模型,从而使得seq2seq模型能够针对输入图片输出该图片的摘要表示。该图片的摘要表示仅仅体现图片的关键因素,而忽略细节,从而降低计算量。
S32、计算第一摘要表示和第二摘要表示之间的相似度,若相似度满足预设要求,则确定第二图片和第一图片中的候选区域的相似度符合预设相似度要求。其中,摘要表示之间的相似度计算可以采用诸如汉明距离等方式进行计算,也可以分别对两个摘要表示进行SIFT(Scale-invariant feature transform,尺度不变特征变换)处理后得到两个摘要表示分别对应的关键点特征向量,然后将两个关键点特征向量的欧式距离作为计算得到的相似度。在此不做详述。
除了上述方式之外,也可以采用现有的“感知哈希算法”来计算第二图片和第一图片中候选区域的相似度。
另外,需要说明的是,上述第二图片是否符合要求的判断以及第二图片和第一图片中的候选区域的相似度是否符合预设相似度要求的判断可以同时进行,也可以以任意的顺序先后执行。
在106中,将第二图片存入数据库。
在本步骤中,除了将符合要求的第二图片存入数据库之外,还可以将第一图片存入数据库,且标记第二图片与第一图片的区域关联信息。例如,在将第一图片和第二图片均存入数据库时,存储第一图片的图片id,第二图片的图片id,并标识第二图片的上下文相关图片id(即第一图片的图片id)以及对应的第一图片的区域信息(可以采用区域在第一图片中的位置信息进行标识)。
若本方法流程的执行主体位于本地终端,则本地终端可以将第一图片和第二图片提供给服务器端,由服务器端存入数据库。若本方法流程的执行主体位于服务器端,则可以由服务器端直接将第一图片和第二图片存入数据库。
图4示出了上述方法的一种优选实施方式,用户进行一次采集得到第一图片,经过CNN对该第一图片进行特征提取,将提取的特征输入预先训练得到的候选区域分类模型。若得到候选区域(即不符合要求的目标区域),则引导用户针对该候选区域重新进行图片采集。用户重新采集得到第二图片,经过CNN对该第二图片进行特征提取,将提取的特征输入候选区域分类模型,判断是否得到不符合要求的目标区域,如果否,则确定第二图片符合要求。另外,针对第二图片经过seq2seq模型得到第二图片的摘要表示,针对第一图片的候选区域经过seq2seq模型得到第一图片的候选区域的摘要表示,利用两个摘要表示进行相似度计算,判断是否符合相似度要求。若第二图片符合图片采集的要求且相似度计算结果也符合相似度要求,则将第一图片和第二图片及其区域关联关系存入数据库,否则引导用户针对第一图片的候选区域重新进行采集。
以上是对本发明所提供方法进行的描述,下面结合实施例对本发明提供的装置进行详细描述。
图5为本发明实施例提供的装置结构图,本装置可以位于本地终端,也可以位于服务器端。如图5所示,该装置可以包括:采集单元01、区域提取单元02、引导单元03、检验单元04以及存储单元05,还可以包括训练单元06。其中各组成单元的主要功能如下:
采集单元01负责获取用户采集的第一图片。
区域提取单元02负责从第一图片中提取候选区域,候选区域为不符合要求的目标区域。
具体地,区域提取单元02可以对第一图片进行特征提取;利用提取的特征和预先训练的区域分类模型,识别第一图片中不符合要求的目标区域作为候选区域。
其中,在进行特征提取时,可以利用CNN(Convolutional Neural Network,卷积神经网络)进行特征提取,提取的特征可以包括但不限于:图片中物体形状、文字、标志、材质以及纹理。另外,除了CNN之外,还可以采用RNN等其他神经网络进行特征提取。
在本发明实施例中,区域分类模型的分类结果可以包括:各预设类型的目标区域以及不符合要求的目标区域,其中不符合要求的目标区域优先级高于所述各预设类型的目标区域。一方面,区域分类模型能够识别出各预设类型的目标区域,另一方面,也能够对各区域进行是否符合要求的识别。当一个区域同时是预设类型的目标区域又是不符合要求的区域时,将其分类为不符合要求的区域。其中预设类型的目标区域可以包括但不限于诸如文字区域、logo(标识)区域、窗户区域、门口区域、楼块区域、门脸区域。
其中不符合要求可以包括但不限于:不符合质量要求(例如像素低)、尺寸不符合要求、角度不符合要求、被遮挡、发生扭曲。
训练单元06负责训练上述特征区域分类模型。训练方式可以包括:获取已进行区域标注的图片作为训练数据,其中标注的区域包括:各预设类型的目标区域及不符合要求的目标区域,其中不符合要求的目标区域优先级高于各预设类型的目标区域;对训练数据中的各图片进行特征提取;将提取的特征作为输入,将标注的区域作为输出,训练分类模型,得到特征区域分类模型。
其中,训练数据中,对图片区域的标注可以采用人工方式进行。训练数据可以从数据库中获取历史采集到的不符合要求的图片。特征提取的方式与上述区域提取单元02对第一图片进行特征提取的方式相同,可以利用CNN、RNN等神经网络模型进行特征提取,提取的特征可以包括但不限于:图片中物体形状、文字、标志、材质以及纹理。上述的分类模型可以采用诸如SVM(Support VectorMachine,支持向量机)、基于神经网络模型的分类模型等。
若区域提取单元02从第一图片中提取出候选区域,则引导单元03负责引导用户针对候选区域重新进行采集。
具体地,引导单元03可以先利用候选区域进行轮廓识别;然后利用识别结果生成拍摄区域,展示该拍摄区域以引导用户重新进行采集。其中,轮廓识别主要是为了更准确地刻画目标,例如准确地识别出门脸、楼块、窗户等的轮廓,以该轮廓所围成的区域作为拍摄区域。本发明实施例并不限于轮廓识别的具体方式,可以采用传统的边缘检测算子的方式进行轮廓检测,也可以采用数学模型的方式进行轮廓检测。
在引导用户重新拍摄时,可以采用但不限于文字、图标、声音等方式。例如,在确定出拍摄区域后,突出显示该拍摄区域并配以文字“请重新拍摄拍摄区域的清晰放大图”,或者突出显示该拍摄区域并播放声音“请重新拍摄拍摄区域的清晰放大图”。
采集单元01获取用户重新采集的第二图片。
检验单元04负责检验是否第二图片符合要求且第二图片和第一图片中的候选区域的相似度符合预设相似度要求。
一方面,检验单元04检验第二图片是否符合图片采集的要求,具体地,可以对第二图片进行特征提取;利用提取的特征和预先训练的区域分类模型,识别第二图片中是否存在不符合要求的目标区域;如果否,则确定第二图片符合要求。
区域分类模型的分类结果可以包括:各预设类型的目标区域以及不符合要求的目标区域,其中不符合要求的目标区域优先级高于各预设类型的目标区域。也就是说,一旦第二图像中存在不符合要求的目标区域,则会输出该结果。
另一方面,检验单元04检验第二图片和第一图片中的候选区域的相似度是否符合预设相似度要求,具体地,可以利用预先训练的序列到序列seq2seq模型,分别从第一图片中的候选区域从提取第一摘要表示以及从第二图片中提取第二摘要表示;计算第一摘要表示和第二摘要表示之间的相似度,若相似度满足预设要求,则确定第二图片和第一图片中的候选区域的相似度符合预设相似度要求。
在本发明实施例中,可以预先获取已提取摘要表示的图片作为训练数据;利用该练数据训练seq2seq模型,从而使得seq2seq模型能够针对输入图片输出该图片的摘要表示。
其中,摘要表示之间的相似度计算可以采用诸如汉明距离等方式进行计算。
在检验单元04的检验结果为是时,存储单元05将第二图片存入数据库。除了将符合要求的第二图片存入数据库之外,还可以将第一图片存入数据库,且标记第二图片与第一图片的区域关联信息。
若检验单元04的检验结果为否时,引导单元03引导用户针对候选区域重新进行采集。
图6示出了适于用来实现本发明实施方式的示例性计算机系统/服务器012的框图。图6显示的计算机系统/服务器012仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统/服务器012以通用计算设备的形式表现。计算机系统/服务器012的组件可以包括但不限于:一个或者多个处理器或者处理单元016,系统存储器028,连接不同系统组件(包括系统存储器028和处理单元016)的总线018。
总线018表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机系统/服务器012典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机系统/服务器012访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器028可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)030和/或高速缓存存储器032。计算机系统/服务器012可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统034可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线018相连。存储器028可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块042的程序/实用工具040,可以存储在例如存储器028中,这样的程序模块042包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块042通常执行本发明所描述的实施例中的功能和/或方法。
计算机系统/服务器012也可以与一个或多个外部设备014(例如键盘、指向设备、显示器024等)通信,在本发明中,计算机系统/服务器012与外部雷达设备进行通信,还可与一个或者多个使得用户能与该计算机系统/服务器012交互的设备通信,和/或与使得该计算机系统/服务器012能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口022进行。并且,计算机系统/服务器012还可以通过网络适配器020与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器020通过总线018与计算机系统/服务器012的其它模块通信。应当明白,尽管图6中未示出,可以结合计算机系统/服务器012使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元016通过运行存储在系统存储器028中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的方法流程。
上述的计算机程序可以设置于计算机存储介质中,即该计算机存储介质被编码有计算机程序,该程序在被一个或多个计算机执行时,使得一个或多个计算机执行本发明上述实施例中所示的方法流程和/或装置操作。例如,被上述一个或多个处理器执行本发明实施例所提供的方法流程。
随着时间、技术的发展,介质含义越来越广泛,计算机程序的传播途径不再受限于有形介质,还可以直接从网络下载等。可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
由以上描述可以看出,本发明提供的方法、装置、设备和计算机存储介质可以具备以下优点:
1)本发明能够针对用户采集的图片提取出不符合要求的目标区域,并引导用户针对该区域重新进行采集,直至用户重新采集的图片符合要求后,将重新采集的图片存入数据库,从而有效提高众包采集的图片质量。
2)候选区域的实时感知可以及时发现遮挡、扭曲、不清晰等区域,从而采集到更合理的图片。
3)利用前置的识别,提高了存入数据库的图片质量,避免了需要对存入的图片进行大量后置的多图覆盖拟补的处理,降低了服务器的计算压力。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (20)

1.一种图片采集的方法,其特征在于,该方法包括:
获取用户采集的第一图片;
从所述第一图片中提取候选区域,所述候选区域为不符合要求的目标区域;
引导用户针对所述候选区域重新进行采集;
获取用户重新采集的第二图片;
若所述第二图片符合要求且所述第二图片和所述第一图片中的候选区域的相似度符合预设相似度要求,则将所述第二图片存入数据库。
2.根据权利要求1所述的方法,其特征在于,从所述第一图片中提取候选区域包括:
对所述第一图片进行特征提取;
利用提取的特征和预先训练的区域分类模型,识别所述第一图片中不符合要求的目标区域作为候选区域。
3.根据权利要求1所述的方法,其特征在于,所述引导用户针对所述候选区域重新进行采集包括:
利用所述候选区域进行轮廓识别;
利用识别结果生成拍摄区域;
展示所述拍摄区域。
4.根据权利要求1所述的方法,其特征在于,该方法还包括:
对所述第二图片进行特征提取;
利用提取的特征和预先训练的区域分类模型,识别所述第二图片中是否存在不符合要求的目标区域;
如果否,则确定所述第二图片符合要求。
5.根据权利要求2或4所述的方法,其特征在于,所述特征提取包括:
利用卷积神经网络CNN进行特征提取,提取的特征包括以下一种或任意组合:
图片中物体形状、文字、标志、材质以及纹理。
6.根据权利要求2或4所述的方法,其特征在于,所述区域分类模型的分类结果包括:
各预设类型的目标区域以及不符合要求的目标区域,其中不符合要求的目标区域优先级高于所述各预设类型的目标区域。
7.根据权利要求2或4所述的方法,其特征在于,所述特征区域分类模型的训练方式包括:
获取已进行区域标注的图片作为训练数据,其中标注的区域包括:各预设类型的目标区域及不符合要求的目标区域,其中不符合要求的目标区域优先级高于所述各预设类型的目标区域;
对训练数据中的各图片进行特征提取;
将提取的特征作为输入,将标注的区域作为输出,训练分类模型,得到所述特征区域分类模型。
8.根据权利要求1所述的方法,其特征在于,该方法还包括:
利用预先训练的序列到序列seq2seq模型,分别从所述第一图片中的候选区域从提取第一摘要表示以及从所述第二图片中提取第二摘要表示;
计算所述第一摘要表示和所述第二摘要表示之间的相似度,若相似度满足预设要求,则确定所述第二图片和所述第一图片中的候选区域的相似度符合预设相似度要求。
9.根据权利要求8所述的方法,其特征在于,所述seq2seq模型采用以下方式训练得到:
获取已提取摘要表示的图片作为训练数据;
利用所述训练数据训练seq2seq模型。
10.根据权利要求1所述的方法,其特征在于,该方法还包括:
若所述第二图片不符合要求,或者所述第二图片和所述第一图片中的候选区域的相似度不符合预设相似度要求,则转至执行所述引导用户针对所述候选区域重新进行采集。
11.根据权利要求1所述的方法,其特征在于,该方法还包括:
将所述第一图片存入数据库,且标记所述第二图片与所述第一图片的区域关联信息。
12.一种图片采集的装置,其特征在于,该装置包括:
采集单元,用于获取用户采集的第一图片;
区域提取单元,用于从所述第一图片中提取候选区域,所述候选区域为不符合要求的目标区域;
引导单元,用于引导用户针对所述候选区域重新进行采集;
所述采集单元,还用于获取用户重新采集的第二图片;
检验单元,用于检验是否所述第二图片符合要求且所述第二图片和所述第一图片中的候选区域的相似度符合预设相似度要求;
存储单元,用于在所述检验单元的检验结果为是时,将所述第二图片存入数据库。
13.根据权利要求12所述的装置,其特征在于,所述区域提取单元,具体执行:
对所述第一图片进行特征提取;
利用提取的特征和预先训练的区域分类模型,识别所述第一图片中不符合要求的目标区域作为候选区域。
14.根据权利要求12所述的装置,其特征在于,所述引导单元,具体执行:
利用所述候选区域进行轮廓识别;
利用识别结果生成拍摄区域;
展示所述拍摄区域。
15.根据权利要求12所述的装置,其特征在于,所述检验单元,具体用于:
对所述第二图片进行特征提取;
利用提取的特征和预先训练的区域分类模型,识别所述第二图片中是否存在不符合要求的目标区域;
如果否,则确定所述第二图片符合要求。
16.根据权利要求13或15所述的装置,其特征在于,该装置还包括:
训练单元,用于获取已进行区域标注的图片作为训练数据,其中标注的区域包括:各预设类型的目标区域及不符合要求的目标区域,其中不符合要求的目标区域优先级高于所述各预设类型的目标区域;对训练数据中的各图片进行特征提取;将提取的特征作为输入,将标注的区域作为输出,训练分类模型,得到所述特征区域分类模型。
17.根据权利要求12所述的装置,其特征在于,所述检验单元,还用于:
利用预先训练的序列到序列seq2seq模型,分别从所述第一图片中的候选区域从提取第一摘要表示以及从所述第二图片中提取第二摘要表示;
计算所述第一摘要表示和所述第二摘要表示之间的相似度,若相似度满足预设要求,则确定所述第二图片和所述第一图片中的候选区域的相似度符合预设相似度要求。
18.根据权利要求12所述的装置,其特征在于,所述引导单元,还用于若所述检验单元的检验结果为否时,引导用户针对所述候选区域重新进行采集。
19.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-11中任一所述的方法。
20.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-11中任一所述的方法。
CN201810614334.6A 2018-06-14 2018-06-14 一种图片采集的方法、装置、设备和计算机存储介质 Active CN110609877B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810614334.6A CN110609877B (zh) 2018-06-14 2018-06-14 一种图片采集的方法、装置、设备和计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810614334.6A CN110609877B (zh) 2018-06-14 2018-06-14 一种图片采集的方法、装置、设备和计算机存储介质

Publications (2)

Publication Number Publication Date
CN110609877A true CN110609877A (zh) 2019-12-24
CN110609877B CN110609877B (zh) 2023-04-18

Family

ID=68887743

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810614334.6A Active CN110609877B (zh) 2018-06-14 2018-06-14 一种图片采集的方法、装置、设备和计算机存储介质

Country Status (1)

Country Link
CN (1) CN110609877B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104871180A (zh) * 2012-12-13 2015-08-26 高通股份有限公司 用于ocr的基于文本图像质量的反馈
CN104867148A (zh) * 2015-04-22 2015-08-26 北京爱普力思健康科技有限公司 预定种类物体图像的获取方法、装置及口腔远程诊断系统
CN107194323A (zh) * 2017-04-28 2017-09-22 阿里巴巴集团控股有限公司 车辆定损图像获取方法、装置、服务器和终端设备
US20170323636A1 (en) * 2016-05-05 2017-11-09 Conduent Business Services, Llc Semantic parsing using deep neural networks for predicting canonical forms
CN107609463A (zh) * 2017-07-20 2018-01-19 百度在线网络技术(北京)有限公司 活体检测方法、装置、设备及存储介质
CN107832765A (zh) * 2017-09-13 2018-03-23 百度在线网络技术(北京)有限公司 对包括文字内容和图像内容的图片识别
CN107832310A (zh) * 2017-11-27 2018-03-23 首都师范大学 基于seq2seq模型的结构化论点生成方法及系统
CN108090050A (zh) * 2017-11-08 2018-05-29 江苏名通信息科技有限公司 基于深度神经网络的游戏翻译系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104871180A (zh) * 2012-12-13 2015-08-26 高通股份有限公司 用于ocr的基于文本图像质量的反馈
CN104867148A (zh) * 2015-04-22 2015-08-26 北京爱普力思健康科技有限公司 预定种类物体图像的获取方法、装置及口腔远程诊断系统
US20170323636A1 (en) * 2016-05-05 2017-11-09 Conduent Business Services, Llc Semantic parsing using deep neural networks for predicting canonical forms
CN107194323A (zh) * 2017-04-28 2017-09-22 阿里巴巴集团控股有限公司 车辆定损图像获取方法、装置、服务器和终端设备
CN107609463A (zh) * 2017-07-20 2018-01-19 百度在线网络技术(北京)有限公司 活体检测方法、装置、设备及存储介质
CN107832765A (zh) * 2017-09-13 2018-03-23 百度在线网络技术(北京)有限公司 对包括文字内容和图像内容的图片识别
CN108090050A (zh) * 2017-11-08 2018-05-29 江苏名通信息科技有限公司 基于深度神经网络的游戏翻译系统
CN107832310A (zh) * 2017-11-27 2018-03-23 首都师范大学 基于seq2seq模型的结构化论点生成方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
崔鸿雁等: "机器学习中的特征选择方法研究及展望", 《北京邮电大学学报》 *
张献等: "深度学习方法在软件分析中的应用", 《计算机工程与科学》 *

Also Published As

Publication number Publication date
CN110609877B (zh) 2023-04-18

Similar Documents

Publication Publication Date Title
EP3564854B1 (en) Facial expression recognition method, apparatus, electronic device, and storage medium
CN107545241B (zh) 神经网络模型训练及活体检测方法、装置及存储介质
CN109117831B (zh) 物体检测网络的训练方法和装置
CN109858555B (zh) 基于图像的数据处理方法、装置、设备及可读存储介质
US10983596B2 (en) Gesture recognition method, device, electronic device, and storage medium
CN108549643B (zh) 翻译处理方法和装置
CN109582880B (zh) 兴趣点信息处理方法、装置、终端及存储介质
CN109934847B (zh) 弱纹理三维物体姿态估计的方法和装置
CN111476284A (zh) 图像识别模型训练及图像识别方法、装置、电子设备
WO2020024851A1 (zh) 目标跟踪方法、计算机设备和存储介质
TW201947528A (zh) 車輛損傷識別的處理方法、處理設備、客戶端及伺服器
WO2020019591A1 (zh) 用于生成信息的方法和装置
CN112016638B (zh) 一种钢筋簇的识别方法、装置、设备及存储介质
CN110349161B (zh) 图像分割方法、装置、电子设备、及存储介质
WO2020233611A1 (zh) 图像化信息承载介质的识别方法、识别装置、计算机设备和介质
WO2017197593A1 (en) Apparatus, method and computer program product for recovering editable slide
JP5832656B2 (ja) 画像中のテキストの検出を容易にする方法及び装置
CN114549557A (zh) 一种人像分割网络训练方法、装置、设备及介质
CN113255516A (zh) 活体检测方法、装置和电子设备
EP3885934A1 (en) Video search method and apparatus, computer device, and storage medium
CN110609877B (zh) 一种图片采集的方法、装置、设备和计算机存储介质
CN113762455A (zh) 检测模型训练方法、单字检测方法、装置、设备及介质
CN113807416B (zh) 一种模型训练方法、装置、电子设备以及存储介质
CN114549904A (zh) 视觉处理及模型训练方法、设备、存储介质及程序产品
CN112965602A (zh) 一种基于手势的人机交互方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant