WO2020259416A1 - 图像采集控制方法、装置、电子设备及存储介质 - Google Patents
图像采集控制方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- WO2020259416A1 WO2020259416A1 PCT/CN2020/097232 CN2020097232W WO2020259416A1 WO 2020259416 A1 WO2020259416 A1 WO 2020259416A1 CN 2020097232 W CN2020097232 W CN 2020097232W WO 2020259416 A1 WO2020259416 A1 WO 2020259416A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- neural network
- image sample
- image
- sample
- processing result
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2155—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/588—Recognition of the road, e.g. of lane markings; Recognition of the vehicle driving pattern in relation to the road
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/08—Detecting or categorising vehicles
Abstract
Description
Claims (29)
- 一种图像采集控制方法,包括:将第一图像样本集提供给第一神经网络;根据所述第一神经网络针对所述第一图像样本集中每个第一图像样本的处理结果,从所述第一图像样本集中筛选出第一困难样本;基于所述第一困难样本,确定所述第一困难样本的采集环境信息;根据所述采集环境信息,生成图像采集控制信息,所述图像采集控制信息用于指示采集包含第二困难样本的第二图像样本集。
- 根据权利要求1所述的方法,其中,所述第一图像样本集包括不具有标注信息的第一图像样本。
- 根据权利要求2所述的方法,其中,所述根据所述第一神经网络针对所述第一图像样本集中每个第一图像样本的处理结果,从所述第一图像样本集中筛选出第一困难样本,包括:检测所述第一神经网络针对所述第一图像样本集中每个第一图像样本的处理结果是否正确;根据检测出的与不正确的处理结果对应的第一图像样本,确定所述第一困难样本。
- 根据权利要求3所述的方法,其中,所述第一图像样本集包括时序连续的多个视频帧样本;所述检测所述第一神经网络针对所述第一图像样本集中每个第一图像样本的处理结果是否正确,包括:对所述第一神经网络基于所述多个视频帧样本分别输出的多个目标对象检测结果,进行目标对象连续性检测;将所述多个目标对象检测结果中不满足预设连续性要求的一个或多个目标对象检测结果,作为所述不正确的处理结果。
- 根据权利要求3所述的方法,所述方法还包括:将所述第一图像样本集提供给第二神经网络,其中,所述检测所述第一神经网络针对所述第一图像样本集中每个第一图像样本的处理结果是否正确,包括:确定所述第二神经网络针对该第一图像样本的第二处理结果与所述第一神经网络针对该第一图像样本的第一处理结果之间的差异;在所述差异不满足预设差异要求的情况下,将所述第一处理结果作为所述不正确的 处理结果。
- 根据权利要求3至5中任一项所述的方法,其中,所述根据检测出的与不正确的处理结果对应的第一图像样本,确定所述第一困难样本,包括:获取与所述不正确的处理结果对应的错误类型;将与属于神经网络处理错误的错误类型的处理结果对应的第一图像样本,作为所述第一困难样本。
- 根据权利要求6所述的方法,其中,所述第一神经网络用于检测所述第一图像样本中的目标对象,所述方法还包括:在与所述不正确的处理结果对应的错误类型表示所述第一神经网络对所述第一图像样本进行检测得到的目标对象检测框不正确的情况下,对所述第一神经网络中包括的用于检测所述目标对象检测框的模块进行调整。
- 根据权利要求6所述的方法,所述方法还包括:在与所述不正确的处理结果对应的错误类型与摄像装置因素相关的情况下,发送更改所述摄像装置的提示信息。
- 根据权利要求1至8中任一项所述的方法,其中,所述采集环境信息包括路段信息、天气信息、以及光线强度信息中的至少一个。
- 根据权利要求9所述的方法,其中,所述采集环境信息包括路段信息;所述根据所述采集环境信息,生成图像采集控制信息,包括:基于所述路段信息,确定与所述第一困难样本匹配的采集路段;利用确定的所述采集路段,生成数据采集路径,将所述数据采集路径包括在图像采集控制信息中,以指示摄像装置按照所述数据采集路径采集所述第二图像样本集。
- 根据权利要求1至10中任一所述的方法,所述方法还包括:将所述第一困难样本加入至训练样本集;利用所述训练样本集对所述第一神经网络进行训练,得到调整后的第一神经网络。
- 根据权利要求11所述的方法,其中,将所述第一困难样本加入至训练样本集,包括:将带有标注信息的第一困难样本加入至所述训练样本集;所述利用所述训练样本集对所述第一神经网络进行训练,得到调整后的第一神经网络,包括:将所述训练样本集中的带有标注信息的第一困难样本提供给所述第一神经网络;根据所述第一神经网络针对每个带有标注信息的第一困难样本的处理结果与对应的标注信息的差异,调整所述第一神经网络的参数,得到调整后的第一神经网络。
- 根据权利要求11或12所述的方法,所述方法还包括:获取所述第二图像样本集;将所述第二图像样本集提供给所述调整后的第一神经网络;根据所述调整后的第一神经网络针对所述第二图像样本集中每个第二图像样本的处理结果,从所述第二图像样本集中筛选出所述第二困难样本。
- 一种图像采集控制装置,包括:提供模块,用于将第一图像样本集提供给第一神经网络;筛选模块,用于根据所述第一神经网络针对所述第一图像样本集中每个第一图像样本的处理结果,从所述第一图像样本集中筛选出第一困难样本;环境确定模块,用于基于所述第一困难样本,确定所述第一困难样本的采集环境信息;采集控制模块,用于根据所述采集环境信息,生成图像采集控制信息,所述图像采集控制信息用于指示采集包含第二困难样本的第二图像样本集。
- 根据权利要求14所述的装置,其中,所述第一图像样本集包括不具有标注信息的第一图像样本。
- 根据权利要求15所述的装置,其中,所述筛选模块包括:第一子模块,用于检测所述第一神经网络针对所述第一图像样本集中每个第一图像样本的处理结果是否正确;第二子模块,用于根据检测出的与不正确的处理结果对应的第一图像样本,确定所述第一困难样本。
- 根据权利要求16所述的装置,其中,所述第一图像样本集包括时序连续的多个视频帧样本;所述第一子模块用于:对所述第一神经网络基于所述多个视频帧样本分别输出的多个目标对象检测结果,进行目标对象连续性检测;将所述多个目标对象检测结果中不满足预设连续性要求的一个或多个目标对象检测结果,作为所述不正确的处理结果。
- 根据权利要求16所述的装置,其中,所述提供模块还用于:将所述第一图像 样本集提供给第二神经网络;所述第一子模块用于:针对所述第一图像样本集中每个第一图像样本,确定所述第二神经网络针对该第一图像样本的第二处理结果与所述第一神经网络针对该第一图像样本的第一处理结果之间的差异;在所述差异不满足预设差异要求的情况下,将所述第一处理结果作为所述不正确的处理结果。
- 根据权利要求16至18中任一项所述的装置,其中,所述第二子模块用于:获取与所述不正确的处理结果对应的错误类型;将与属于神经网络处理错误的错误类型的处理结果对应的第一图像样本,作为所述第一困难样本。
- 根据权利要求19所述的装置,其中,所述第一神经网络用于检测所述第一图像样本中的目标对象;所述装置还包括:优化模块,用于在与所述不正确的处理结果对应的错误类型表示所述第一神经网络对所述第一图像样本进行检测得到的目标对象检测框不正确的情况下,对所述第一神经网络中包括的用于检测所述目标对象检测框的模块进行调整。
- 根据权利要求19所述的装置,其中,所述第二子模块进一步用于:在与所述不正确的处理结果对应的错误类型与摄像装置因素相关的情况下,发送更改所述摄像装置的提示信息。
- 根据权利要求14至21中任一项所述的装置,其中,所述采集环境信息包括路段信息、天气信息、以及光线强度信息中的至少一个。
- 根据权利要求22所述的装置,其中,所述采集环境信息包括路段信息;所述采集控制模块用于:基于所述路段信息,确定与所述第一困难样本匹配的采集路段;利用确定的所述采集路段,生成数据采集路径,将所述数据采集路径包括在图像采集控制信息中,以指示摄像装置按照所述数据采集路径采集所述第二图像样本集。
- 根据权利要求14至23中任一所述的装置,所述装置还包括:训练模块,用于:将所述第一困难样本加入至训练样本集;利用所述训练样本集对所述第一神经网络进行训练,得到调整后的第一神经网 络。
- 根据权利要求24所述的装置,其中,所述训练模块用于:将带有标注信息的第一困难样本加入至所述训练样本集;将所述训练样本集中的带有标注信息的第一困难样本提供给所述第一神经网络;根据所述第一神经网络针对每个带有标注信息的第一困难样本的处理结果与对应的标注信息的差异,调整所述第一神经网络的参数,得到调整后的第一神经网络。
- 根据权利要求24或25所述的装置,其中,所述提供模块还用于:获取所述第二图像样本集;将所述第二图像样本集提供给所述调整后的第一神经网络;所述筛选模块还用于:根据所述调整后的第一神经网络针对所述第二图像样本集中每个第二图像样本的处理结果,从所述第二图像样本集中筛选出所述第二困难样本。
- 一种电子设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述存储器中存储的计算机程序,以实现根据权利要求1-13中任一项所述的图像采集控制方法。
- 一种计算机可读存储介质,其上存储有计算机程序,该计算机程序可被处理器执行,以实现根据权利要求1-13中任一项所述的图像采集控制方法。
- 一种计算机程序,包括计算机指令,所述计算机指令可被处理器执行,以实现根据权利要求1-13中任一项所述的图像采集控制方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021552212A JP2022522375A (ja) | 2019-06-28 | 2020-06-19 | 画像収集制御方法、装置、電子デバイス、記憶媒体及びコンピュータプログラム |
KR1020217028688A KR20210119532A (ko) | 2019-06-28 | 2020-06-19 | 화상 수집 제어 방법, 장치, 전자 디바이스 및 기억 매체 |
US17/560,442 US20220114396A1 (en) | 2019-06-28 | 2021-12-23 | Methods, apparatuses, electronic devices and storage media for controlling image acquisition |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910579147.3A CN112149707A (zh) | 2019-06-28 | 2019-06-28 | 图像采集控制方法、装置、介质及设备 |
CN201910579147.3 | 2019-06-28 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
US17/560,442 Continuation US20220114396A1 (en) | 2019-06-28 | 2021-12-23 | Methods, apparatuses, electronic devices and storage media for controlling image acquisition |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2020259416A1 true WO2020259416A1 (zh) | 2020-12-30 |
Family
ID=73891383
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/CN2020/097232 WO2020259416A1 (zh) | 2019-06-28 | 2020-06-19 | 图像采集控制方法、装置、电子设备及存储介质 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220114396A1 (zh) |
JP (1) | JP2022522375A (zh) |
KR (1) | KR20210119532A (zh) |
CN (1) | CN112149707A (zh) |
WO (1) | WO2020259416A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112733666A (zh) * | 2020-12-31 | 2021-04-30 | 湖北亿咖通科技有限公司 | 一种难例图像的搜集、及模型训练方法、设备及存储介质 |
CN113688975A (zh) * | 2021-08-24 | 2021-11-23 | 北京市商汤科技开发有限公司 | 神经网络的训练方法、装置、电子设备及存储介质 |
CN114418021A (zh) * | 2022-01-25 | 2022-04-29 | 腾讯科技(深圳)有限公司 | 模型优化方法、装置及计算机程序产品 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140355871A1 (en) * | 2012-06-15 | 2014-12-04 | Vufind, Inc. | System and method for structuring a large scale object recognition engine to maximize recognition accuracy and emulate human visual cortex |
CN104361366A (zh) * | 2014-12-08 | 2015-02-18 | 深圳市捷顺科技实业股份有限公司 | 一种车牌识别方法及车牌识别设备 |
CN105184226A (zh) * | 2015-08-11 | 2015-12-23 | 北京新晨阳光科技有限公司 | 数字识别方法和装置及神经网络训练方法和装置 |
CN107220618A (zh) * | 2017-05-25 | 2017-09-29 | 中国科学院自动化研究所 | 人脸检测方法及装置、计算机可读存储介质、设备 |
CN107403141A (zh) * | 2017-07-05 | 2017-11-28 | 中国科学院自动化研究所 | 人脸检测方法及装置、计算机可读存储介质、设备 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018060268A (ja) * | 2016-10-03 | 2018-04-12 | 株式会社日立製作所 | 認識装置および学習システム |
WO2018105122A1 (ja) * | 2016-12-09 | 2018-06-14 | 富士通株式会社 | 教師データ候補抽出プログラム、教師データ候補抽出装置、及び教師データ候補抽出方法 |
JP6922447B2 (ja) * | 2017-06-06 | 2021-08-18 | 株式会社デンソー | 情報処理システム、サーバおよび通信方法 |
JP6936957B2 (ja) * | 2017-11-07 | 2021-09-22 | オムロン株式会社 | 検査装置、データ生成装置、データ生成方法及びデータ生成プログラム |
-
2019
- 2019-06-28 CN CN201910579147.3A patent/CN112149707A/zh active Pending
-
2020
- 2020-06-19 JP JP2021552212A patent/JP2022522375A/ja active Pending
- 2020-06-19 WO PCT/CN2020/097232 patent/WO2020259416A1/zh active Application Filing
- 2020-06-19 KR KR1020217028688A patent/KR20210119532A/ko not_active Application Discontinuation
-
2021
- 2021-12-23 US US17/560,442 patent/US20220114396A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140355871A1 (en) * | 2012-06-15 | 2014-12-04 | Vufind, Inc. | System and method for structuring a large scale object recognition engine to maximize recognition accuracy and emulate human visual cortex |
CN104361366A (zh) * | 2014-12-08 | 2015-02-18 | 深圳市捷顺科技实业股份有限公司 | 一种车牌识别方法及车牌识别设备 |
CN105184226A (zh) * | 2015-08-11 | 2015-12-23 | 北京新晨阳光科技有限公司 | 数字识别方法和装置及神经网络训练方法和装置 |
CN107220618A (zh) * | 2017-05-25 | 2017-09-29 | 中国科学院自动化研究所 | 人脸检测方法及装置、计算机可读存储介质、设备 |
CN107403141A (zh) * | 2017-07-05 | 2017-11-28 | 中国科学院自动化研究所 | 人脸检测方法及装置、计算机可读存储介质、设备 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112733666A (zh) * | 2020-12-31 | 2021-04-30 | 湖北亿咖通科技有限公司 | 一种难例图像的搜集、及模型训练方法、设备及存储介质 |
CN113688975A (zh) * | 2021-08-24 | 2021-11-23 | 北京市商汤科技开发有限公司 | 神经网络的训练方法、装置、电子设备及存储介质 |
CN114418021A (zh) * | 2022-01-25 | 2022-04-29 | 腾讯科技(深圳)有限公司 | 模型优化方法、装置及计算机程序产品 |
CN114418021B (zh) * | 2022-01-25 | 2024-03-26 | 腾讯科技(深圳)有限公司 | 模型优化方法、装置及计算机程序产品 |
Also Published As
Publication number | Publication date |
---|---|
CN112149707A (zh) | 2020-12-29 |
JP2022522375A (ja) | 2022-04-18 |
US20220114396A1 (en) | 2022-04-14 |
KR20210119532A (ko) | 2021-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109584248B (zh) | 基于特征融合和稠密连接网络的红外面目标实例分割方法 | |
EP3777122B1 (en) | Image processing method and apparatus | |
Neumann et al. | Nightowls: A pedestrians at night dataset | |
WO2020259416A1 (zh) | 图像采集控制方法、装置、电子设备及存储介质 | |
US9740967B2 (en) | Method and apparatus of determining air quality | |
EP3579148A1 (en) | Method and apparatus for training, classification model, mobile terminal, and readable storage medium | |
WO2020206850A1 (zh) | 基于高维图像的图像标注方法和装置 | |
Mihail et al. | Sky segmentation in the wild: An empirical study | |
CN113159043B (zh) | 基于语义信息的特征点匹配方法及系统 | |
CN112801158A (zh) | 基于级联融合和注意力机制的深度学习小目标检测方法及装置 | |
CN111832578A (zh) | 兴趣点信息处理方法、装置、电子设备和存储介质 | |
CN113723377A (zh) | 一种基于ld-ssd网络的交通标志检测方法 | |
CN111274988B (zh) | 一种基于多光谱的车辆重识别方法及装置 | |
CN112991218A (zh) | 图像处理的方法、装置、设备以及存储介质 | |
CN111881984A (zh) | 一种基于深度学习的目标检测方法和装置 | |
CN116071315A (zh) | 一种基于机器视觉的产品可视缺陷检测方法及系统 | |
CN110334768B (zh) | 一种冰柜陈列检测方法、系统及电子设备 | |
CN116452573A (zh) | 变电站设备缺陷检测方法、模型训练方法、装置和设备 | |
CN107347125B (zh) | 视频图像的处理方法、装置和终端设备 | |
CN115115973A (zh) | 一种基于多感受野与深度特征的弱小目标检测方法 | |
CN113902740A (zh) | 图像模糊程度评价模型的构建方法 | |
CN113272855A (zh) | 用于重叠多图像应用的响应归一化 | |
EP3877951A1 (en) | Automatic co-registration of thermal and visible image pairs | |
CN109934045B (zh) | 行人检测方法和装置 | |
CN112348823A (zh) | 一种面向对象的高分辨率遥感影像分割算法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 20833634 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2021552212 Country of ref document: JP Kind code of ref document: A |
|
ENP | Entry into the national phase |
Ref document number: 20217028688 Country of ref document: KR Kind code of ref document: A |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
32PN | Ep: public notification in the ep bulletin as address of the adressee cannot be established |
Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205N DATED 18.02.2022) |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 20833634 Country of ref document: EP Kind code of ref document: A1 |