JP2021174135A - 画像認識装置及び画像認識方法 - Google Patents

画像認識装置及び画像認識方法 Download PDF

Info

Publication number
JP2021174135A
JP2021174135A JP2020075959A JP2020075959A JP2021174135A JP 2021174135 A JP2021174135 A JP 2021174135A JP 2020075959 A JP2020075959 A JP 2020075959A JP 2020075959 A JP2020075959 A JP 2020075959A JP 2021174135 A JP2021174135 A JP 2021174135A
Authority
JP
Japan
Prior art keywords
image
recognition
signal processing
signal
fusion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020075959A
Other languages
English (en)
Inventor
憲文 柴山
Norifumi Shibayama
貴希 上野
Takaki UENO
和幸 奥池
Kazuyuki Okuchi
里美 川瀬
Satomi Kawase
秀 小林
Hide Kobayashi
利尚 三宅
Toshinao Miyake
剛史 渡部
Takashi Watabe
孝文 朝原
Takafumi Asahara
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Semiconductor Solutions Corp
Original Assignee
Sony Semiconductor Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Semiconductor Solutions Corp filed Critical Sony Semiconductor Solutions Corp
Priority to JP2020075959A priority Critical patent/JP2021174135A/ja
Priority to US17/995,893 priority patent/US20230161399A1/en
Priority to PCT/JP2021/007945 priority patent/WO2021215116A1/ja
Priority to CN202180028810.6A priority patent/CN115428043A/zh
Publication of JP2021174135A publication Critical patent/JP2021174135A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/329Power saving characterised by the action undertaken by task scheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/3287Power saving characterised by the action undertaken by switching off individual functional units in the computer system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • G06F1/3215Monitoring of peripheral devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/325Power saving in peripheral device
    • G06F1/3278Power saving in modem or I/O interface
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/809Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of classification results, e.g. where the classifiers operate on the same input data
    • G06V10/811Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of classification results, e.g. where the classifiers operate on the same input data the classifiers operating on different input data, e.g. multi-modal recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Multimedia (AREA)
  • Computer Hardware Design (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Studio Devices (AREA)
  • Image Analysis (AREA)

Abstract

【課題】電力、計算量、メモリ占有量、バス帯域占有量を削減でき、しかも高い認識精度を維持できる画像認識装置を提供する。【解決手段】画像認識装置は、互いに機能が異なる複数の画像センサを接続し、接続した画像センサから出力され撮像視野内の対象物を含む画像信号に基づいて信号処理を行い、それぞれ電源供給の制御が可能な複数の信号処理モジュールと、1つの信号処理モジュールの出力信号による対象物の認識処理、複数の信号処理モジュールそれぞれの出力信号とのフュージョン有りによる対象物の認識処理を選択的に実行する認識処理部と、少なくとも1つの信号処理モジュールに電源を供給して、認識処理部にフュージョン無しによる対象物の認識処理を実行させ、認識処理結果の信頼度を判定し、判定結果に基づいて、他の信号処理モジュールの電源供給制御を実行する制御部とを備える。【選択図】図1

Description

本開示(本技術)は、画像認識装置、及びこの画像認識装置による画像認識方法に関する。
近年、センサで検出された画像内の対象物を認識する技術が知られている。このような対象物の認識技術においては、一般に、ステレオ画像センサやミリ波レーダ、レーザレーダ等を代表とする認識センサが用いられているが、これらの認識センサは、周囲環境によって検出精度にばらつきが生じる。このため、各認識センサで検出した結果を組み合わせて対象物を認識するセンサフュージョンと呼ばれる手法が用いられる(特許文献1)。
特許文献1に開示される手法は、ステレオ画像センサ、ミリ波レーダ、レーザレーダを同時に稼働させ、データを処理し、物体認識を行うものである。
特開2007-310741号公報
しかしながら、特許文献1に開示される手法では、多数のセンサを同時稼働させ、さらにその出力データを同時に処理することにより、電力、計算量、メモリ占有量、バス帯域占有量が増大してしまうことになる。
本開示はこのような事情に鑑みてなされたもので、電力、計算量、メモリ占有量、バス帯域占有量を削減でき、しかも高い認識精度を維持できる画像認識装置及び画像認識方法を提供することを目的とする。
本開示の一態様は、互いに機能が異なる複数の画像センサを接続し、接続した画像センサから出力され所定の撮像視野内の対象物を含む画像信号に基づいて信号処理を行い、それぞれ電源供給の制御が可能な複数の信号処理モジュールと、1つの信号処理モジュールの出力信号による前記対象物の認識処理、前記複数の信号処理モジュールそれぞれの出力信号とのフュージョン有りによる前記対象物の認識処理を選択的に実行する認識処理部と、起動時に、前記複数の信号処理モジュールのうち少なくとも1つの信号処理モジュールに電源を供給して、前記認識処理部にフュージョン無しによる前記対象物の認識処理を実行させ、認識処理結果の信頼度を判定し、判定結果に基づいて、他の信号処理モジュールの電源供給制御を実行することで、前記認識処理部に対し前記フュージョン有りによる前記対象物の認識処理の実行・停止を制御する制御部とを備える画像認識装置である。
本開示の他の態様は、それぞれ機能が異なる複数の画像センサを接続し電源供給の制御が可能な複数の信号処理モジュールのうち少なくとも1つの信号処理モジュールに電源を供給して、前記画像センサから出力され所定の撮像視野内の対象物を含む画像信号に基づいて信号処理を行うことと、稼働する信号処理モジュールの出力信号に対し他の出力信号とのフュージョン無しにより前記対象物の認識処理を実行することと、認識処理結果の信頼度を判定することと、判定結果に基づいて、他の信号処理モジュールの電源供給制御を実行することで、他の信号処理モジュールの出力信号とのフュージョン有りによる前記対象物の認識処理の実行・停止を制御することと、を含む画像認識方法である。
本開示の第1の実施形態に係る画像認識装置のブロック構成図である。 比較例1における画像認識装置の一例を示すブロック構成図である。 比較例2における画像認識装置の一例を示すブロック構成図である。 本開示の第1の実施形態に係るシステム制御部の制御処理手順を示すフローチャートである。 本開示の第1の実施形態において、RGBセンサ単体で認識される対象物の画像例を示す図である。 本開示の第1の実施形態において、iToFセンサとRGBセンサとのフュージョン有りにより認識される対象物の画像例を示す図である。 本開示の第2の実施形態に係る画像認識装置のブロック構成図である。
以下において、図面を参照して本開示の実施形態を説明する。以下の説明で参照する図面の記載において、同一又は類似の部分には同一又は類似の符号を付し、重複する説明を省略する。但し、図面は模式的なものであり、厚みと平面寸法との関係、各装置や各部材の厚みの比率等は現実のものと異なることに留意すべきである。したがって、具体的な厚みや寸法は以下の説明を参酌して判定すべきものである。また、図面相互間においても互いの寸法の関係や比率が異なる部分が含まれていることは勿論である。
なお、本明細書中に記載される効果はあくまで例示であって限定されるものでは無く、また他の効果があってもよい。
<第1の実施形態>
<画像認識装置の構成>
本開示の第1の実施形態に係る画像認識装置1Aは、図1に示すように、RGB処理モジュール10と、i(関接)ToF(Time of Flight)処理モジュール20と、システム制御部30とを備え、外界状況を検出する画像センサからの信号を処理して対象物を認識する。なお、認識する対象物は、例えば、視野内の顔の有無、顔の位置検出、視野内の人間の関節位置、手のジェスチャー種別などである。
本開示の第1の実施形態において、RGBセンサ11、iToF方式の測距センサ21(以下、iToFセンサ21と称する)の異なる検出特性を有する2種類の画像センサを用いて、各画像センサの出力に基づいて認識される対象物の情報を統合(フュージョン)して高精度に対象物を認識する例について説明する。
RGB処理モジュール10は、RGBセンサ11の他に、RGB現像処理部12と、RGB前処理部13と、DNN(Deep Neural Network)認識処理部14と、電源15とを備えている。RGBセンサ11、RGB現像処理部12、RGB前処理部13は、1つの信号処理モジュールを構成する。RGBセンサ11は、所定の撮像視野から受光した光量に応じて電荷を生成及び蓄積し、その電荷の蓄積量に応じて例えば毎秒30フレームの撮像視野の画像信号を生成し、出力する。RGB現像処理部12は、RGBセンサ11から出力された画像信号に基づき対象物を特定する特徴量を求める。この特徴量としては、対象物の位置座標値が求められる。
RGB前処理部13は、RGB現像処理部12から出力される特徴量に基づいて、画像のリサイズ等の前処理を実行する。RGB前処理部13で処理された対象物の情報は、DNN認識処理部14に出力される。DNN認識処理部14は、RGB前処理部13の出力に対し、iToF処理モジュール20の出力とのフュージョン無しにより対象物のDNNによる認識処理、及びiToF処理モジュール20の出力とのフュージョン有りによる認識処理を選択的に実行し、画像信号の明度または天候に基づいて、認識処理結果の信頼度スコア(例えば、0〜1の範囲)を算出する。そして、DNN認識処理部14は、認識処理結果及び認識処理結果の信頼度スコアをシステム制御部30に出力する。
システム制御部30は、入力される認識処理結果の信頼度スコアを判断し、判断結果に基づいて、iToF処理モジュール20に対する電源供給制御を実行する。電源15は、RGBセンサ11、RGB現像処理部12、RGB前処理部13に電力を供給する。
一方、iToF処理モジュール20は、iToFセンサ21の他に、iToF現像処理部22と、iToF前処理部23と、電源24とを備えている。iToFセンサ21は、光を照射し、対象物で反射された光を受光し、受光した光量に応じて電荷を生成及び蓄積し、その電荷の蓄積量に応じて例えば毎秒30フレームの撮像視野の画像信号を生成し、出力する。iToF現像処理部22は、iToFセンサ21から出力された画像信号に基づき対象物を特定する特徴量を求める。この特徴量としては、例えば、蓄積された電荷量に応じた位相信号に基づき、対象物までの距離座標値が求められる。
iToF前処理部23は、iToF現像処理部22から出力される特徴量に基づいて、画像のリサイズ、視差補正等の前処理を実行する。ここでは、iToF前処理部23は、iToF現像処理部22の出力信号をRGB前処理部13の出力信号相当の信号に変換する。iToF前処理部23の出力信号は、DNN認識処理部14に出力される。電源24は、iToFセンサ21、iToF現像処理部22、iToF前処理部23に電力を供給する。
システム制御部30は、DNN認識処理部14からの制御信号に基づいて、電源15,24のオン・オフ制御を行うものである。
<比較例1>
図2は、比較例1における画像認識装置の一例を示すブロック構成図である。図2において、上記図1と同一部分には、同一符号を付して詳細な説明を省略する。
比較例1では、RGBセンサ11のみを用いて対象物を認識する例である。DNN処理部A141は、RGB前処理部13の出力に対し、対象物のDNNによる認識処理を実行する。DNN処理部B42は、DNN処理部A141から出力される認識処理結果の信頼度を算出する。
ところで、RGBセンサ11では、可視光により撮像視野の画像信号を生成するため、天候や周辺の明るさにより、対象物を認識できない場合がある。
<比較例2>
図3は、比較例2における画像認識装置の一例を示すブロック構成図である。図3において、上記図1及び図2と同一部分には、同一符号を付して詳細な説明を省略する。
比較例2では、RGBセンサ11の出力及びiToFセンサ21の出力をフュージョンして対象物を認識する例である。DNN処理部A243は、iToF前処理部23の出力に対し、対象物のDNNによる認識処理を実行する。DNN処理部C44は、DNN処理部A141から出力される認識処理結果と、DNN処理部A243から出力される認証処理結果とをフュージョンして出力する。
ところで、比較例2では、iToFセンサ21、iToF現像処理部22、iToF前処理部23及びDNN処理部A243の分だけ、電力、演算処理量、メモリ占有量及びバス帯域占有量が多くなる。
<第1の実施形態による対策>
そこで、本開示の第1の実施形態では、システム制御部30により図4に示す制御処理手順を実行する。システム制御部30は、起動時に、電源15をオンにし、DNN認識処理部14に対し、RGB前処理部13の出力のみによるフュージョン無しのDNNによる認識処理を実行させ(ステップST4a)、入力される認識処理結果の信頼度スコアのうち中間的な信頼度スコア(例えば、0.3〜0.7)の検出を行い(ステップST4b)、検出ありか否かの判断を行う(ステップST4c)。ここで、中間的な信頼度スコアは、図5に示す対象物51がRGBセンサ11で認識される値である。RGBセンサ11は、天候52に影響され、対象物51を認識する精度が低くなる。なお、信頼度スコアが0.3未満であれば、対象物51ではない誤検出であると確信できる。
検出なしと判断した場合(No)、システム制御部30は、DNN認識処理部14に対し、フュージョン無しの認識処理を継続させ(ステップST4d)、上記ステップST4bの処理に移行する。
一方、検出ありと判断した場合(Yes)、システム制御部30は、iToF処理モジュール20の電源24をオンにし、DNN認識処理部14に対し、RGB前処理部13の出力とiToF前処理部23の出力とのフュージョン有りの認識処理を実行させ(ステップST4e)、処理フレーム数をカウントする(ステップST4f)。iToFセンサ21は、対象物51に対し光を照射するため、図6に示すように、天候52に影響されることなく、対象物51を確実に認識できる。
そして、システム制御部30は、カウントした処理フレーム数が例えば1000フレームに達したか否かの判断を行う(ステップST4g)。ここで、1000フレームに達していなければ(No)、システム制御部30は1000フレームに達するまで上記ステップST4e及び上記ステップST4fの処理を繰り返し実行し、1000フレームに達した時点で(Yes)、上記ステップST4aの処理に移行し、iToF処理モジュール20の電源24をオフにし、DNN認識処理部14に対し、フュージョン無しの認識処理を実行させる。
<第1の実施形態による作用効果>
以上のように第1の実施形態によれば、画像センサの中で最も低消費電力のRGBセンサ11を接続したRGB処理モジュール10の電源15をオンにして、DNN認識処理部14にてRGB前処理部13の出力信号に対しフュージョン無しにより対象物の認識処理を実行し、システム制御部30にて認識処理結果の信頼度を判断し、結果的に信頼度が高ければフュージョン無しで認識処理を続行し、信頼度が低い結果しか得られない場合にはiToF処理モジュール20の出力信号とのフュージョン有りで認識処理を実行する。
従って、RGBセンサ11のみで信頼度の高い認識結果が得られる条件下であれば、電力、計算量、メモリ占有量、バス帯域占有量を削減できる。一方、RGBセンサ11のみでは不利な条件の場合、自動的にiToF処理モジュール20が併用されて、高い認識精度が維持される。
また、第1の実施形態によれば、DNN認識処理部14によるフュージョン有りの認識処理の実行に先立って、フュージョンするRGB前処理部13の出力信号とiToF前処理部23の出力信号とを略一致させることができるので、簡単な手順によりフュージョン有りによる認識処理を実行できる。
また、第1の実施形態によれば、フュージョン有りによる認証処理の実行制御時に、フュージョン有りによる認証処理を所定フレーム数繰り返し、所定フレーム数に達した時点で、フュージョン無しによる認証処理の実行制御に戻すことで、条件が変わり、再びフュージョンが不要になる可能性を低頻度でチェックでき、これにより信頼度が低かった状態が一時的なものでその後正常に戻った場合に、自動的にフュージョン無しによる認証処理の実行制御に戻すことができるので、システム全体として消費電力を削減できる。
さらに、第1の実施形態によれば、DNN認識処理部14によりRGBセンサ11から得られる画像信号の明度、天候に基づいて、認識処理結果の信頼度を算出し、システム制御部30により信頼度が決められた範囲に入らないと判断したきに、DNN認識処理部14に対するフュージョン無しによる認証処理の実行制御を行うことで、信頼度が範囲外で高いときに、単体のRGBセンサ11でも確実に対象物を認識でき、信頼度が範囲外で低いときに、対象物ではない誤検出と確信できる。
なお、第1の実施形態では、信頼度スコアを算出するために、画像信号の明度または天候を用いる例について説明したが、RGBセンサ11のレンズの汚れなどを用いるようにしてもよい。また、フュージョン有りによる認識処理からフュージョン無しによる認識処理に戻すための条件として、画像信号の処理フレーム数を用いる例について説明したが、例えば、時間、外部からの信号を用いるようにしてもよい。さらに、DNN以外に、Adaboostにより信頼度スコアを算出することができる。
<第2の実施形態>
次に、第2の実施形態について説明する。第2の実施形態は、第1の実施形態の変形であり、RGB処理モジュール10と、d(直接)ToF処理モジュール60と、システム制御部30とを備え、外界状況を検出する画像センサからの信号を処理して対象物を認識する。
図7は、第2の実施形態に係る画像認識装置1Bを示すブロック構成図である。図7において、上記図1と同一部分には、同一符号を付して詳細な説明を省略する。
dToF処理モジュール60は、dToF方式の測距センサ61(以下、dToFセンサ61と称する)と、dToF現像処理部62と、dToF前処理部63と、電源64とを備えている。dToFセンサ61は、単一のパルス光を発光し、発光に対する反射光(フォトン)を検出する。このdToFセンサ61は、ライン状に配置された画素列ごとにフォトンを読み出すことにより、画素ごとに距離情報を持った撮像フレームの画像信号を出力する。
dToF現像処理部62は、dToFセンサ61から出力された画像信号に基づき対象物を特定する特徴量を求める。この特徴量としては、対象物までの距離座標値が求められる。
dToF前処理部63は、dToF現像処理部62から出力される特徴量に基づいて、画像のリサイズ、視差補正等の前処理を実行する。ここでは、dToF前処理部63は、dToF現像処理部62の出力信号をRGB前処理部13の出力信号相当の信号に変換する。dToF前処理部63の出力信号は、DNN認識処理部14に出力される。電源64は、dToFセンサ61、dToF現像処理部62、dToF前処理部63に電力を供給する。
dToFセンサ61は、iToFセンサ21と同様に、対象物に対し単一のパルス光を照射するため、天候に影響されることなく、対象物を確実に認識できる。
<第2の実施形態による作用効果>
以上のように第2の実施形態であっても、上記第1の実施形態と同様の作用効果が得られる。
<その他の実施形態>
上記のように、本技術は第1の実施形態及び第2の実施形態によって記載したが、この開示の一部をなす論述及び図面は本技術を限定するものであると理解すべきではない。上記の実施形態が開示する技術内容の趣旨を理解すれば、当業者には様々な代替実施形態、実施例及び運用技術が本技術に含まれ得ることが明らかとなろう。また、第1の実施形態及び第2の実施形態がそれぞれ開示する構成を、矛盾の生じない範囲で適宜組み合わせることができる。例えば、複数の異なる実施形態がそれぞれ開示する構成を組み合わせてもよく、同一の実施形態の複数の異なる変形例がそれぞれ開示する構成を組み合わせてもよい。
<他への応用例>
本開示に係る技術は、例えば、病室内で患者を診る場合や、駅、警備室等に適用される。病室内に設置された画像認識装置で患者が認識された場合、この認識結果が病室から監視室に送信される。
なお、本開示は以下のような構成も取ることができる。
(1)
互いに機能が異なる複数の画像センサを接続し、接続した画像センサから出力され所定の撮像視野内の対象物を含む画像信号に基づいて信号処理を行い、それぞれ電源供給の制御が可能な複数の信号処理モジュールと、
1つの信号処理モジュールの出力信号による前記対象物の認識処理、前記複数の信号処理モジュールそれぞれの出力信号とのフュージョン有りによる前記対象物の認識処理を選択的に実行する認識処理部と、
起動時に、前記複数の信号処理モジュールのうち少なくとも1つの信号処理モジュールに電源を供給して、前記認識処理部にフュージョン無しによる前記対象物の認識処理を実行させ、認識処理結果の信頼度を判定し、判定結果に基づいて、他の信号処理モジュールの電源供給制御を実行することで、前記認識処理部に対し前記フュージョン有りによる前記対象物の認識処理の実行・停止を制御する制御部と
を備える画像認識装置。
(2)
前記複数の信号処理モジュールは、
1つの画像センサが接続される第1の信号処理モジュールと、
他の画像センサが接続され、当該画像センサから出力される画像信号を前記第1の信号処理モジュールの出力信号相当の信号に変換する第2の信号処理モジュールと
を備える前記(1)に記載の画像認識装置。
(3)
前記制御部は、前記フュージョン有りによる認証処理の実行制御時に、予め決められた条件に基づいて、前記認識処理部に対し前記フュージョン無しによる認証処理の実行制御に戻す
前記(1)または(2)に記載の画像認識装置。
(4)
前記制御部は、前記条件として、前記認識処理部において、前記複数の信号処理モジュールからそれぞれ出力される複数フレームの画像信号に対し、前記フュージョン有りによる認証処理を所定フレーム数繰り返し実行し、所定フレーム数に達した時点で、前記フュージョン無しによる認証処理の実行制御に戻す
前記(3)に記載の画像認識装置。
(5)
前記認識処理部は、少なくとも前記画像センサから得られる画像信号の明度、天候、前記画像センサの汚れのいずれかに基づいて、前記認識処理結果の信頼度を算出し、
前記制御部は、前記信頼度が決められた範囲に入らないときに、前記フュージョン無しによる認証処理の実行制御を行う
前記(1)から(4)のいずれか1に記載の画像認識装置。
(6)
前記複数の画像センサのうち少なくとも1つは、RGBセンサであり、他の画像センサは、間接ToF(Time of Flight)方式の測距センサである
前記(1)から(5)のいずれか1に記載の画像認識装置。
(7)
前記複数の画像センサのうち少なくとも1つは、RGBセンサであり、他の画像センサは、直接ToF(Time of Flight)方式の測距センサである
前記(1)から(5)のいずれか1に記載の画像認識装置。
(8)
前記制御部は、前記RGBセンサを接続した信号処理モジュールに電源を供給して、稼働する信号処理モジュールの出力信号に対し前記フュージョン無しにより前記対象物の認識処理を実行する
前記(6)または(7)に記載の画像認識装置。
(9)
それぞれ機能が異なる複数の画像センサを接続し電源供給の制御が可能な複数の信号処理モジュールのうち少なくとも1つの信号処理モジュールに電源を供給して、前記画像センサから出力され所定の撮像視野内の対象物を含む画像信号に基づいて信号処理を行うことと、
稼働する信号処理モジュールの出力信号に対し他の出力信号とのフュージョン無しにより前記対象物の認識処理を実行することと、
認識処理結果の信頼度を判定することと、
判定結果に基づいて、他の信号処理モジュールの電源供給制御を実行することで、他の信号処理モジュールの出力信号とのフュージョン有りによる前記対象物の認識処理の実行・停止を制御することと、を含む
画像認識方法。
1A,1B…画像認識装置、10…RGB処理モジュール、11…RGBセンサ、12…RGB現像処理部、13…RGB前処理部、14…DNN認識処理部、15,24,64…電源、20…iToF処理モジュール、21…iToFセンサ、22…iToF現像処理部、23…iToF前処理部、30…システム制御部、51…対象物、52…天候、60…dToF処理モジュール、61…dToFセンサ、62…dToF現像処理部、63…dToF前処理部。

Claims (9)

  1. 互いに機能が異なる複数の画像センサを接続し、接続した画像センサから出力され所定の撮像視野内の対象物を含む画像信号に基づいて信号処理を行い、それぞれ電源供給の制御が可能な複数の信号処理モジュールと、
    1つの信号処理モジュールの出力信号による前記対象物の認識処理、前記複数の信号処理モジュールそれぞれの出力信号とのフュージョン有りによる前記対象物の認識処理を選択的に実行する認識処理部と、
    起動時に、前記複数の信号処理モジュールのうち少なくとも1つの信号処理モジュールに電源を供給して、前記認識処理部にフュージョン無しによる前記対象物の認識処理を実行させ、認識処理結果の信頼度を判定し、判定結果に基づいて、他の信号処理モジュールの電源供給制御を実行することで、前記認識処理部に対し前記フュージョン有りによる前記対象物の認識処理の実行・停止を制御する制御部と
    を備える画像認識装置。
  2. 前記複数の信号処理モジュールは、
    1つの画像センサが接続される第1の信号処理モジュールと、
    他の画像センサが接続され、当該画像センサから出力される画像信号を前記第1の信号処理モジュールの出力信号相当の信号に変換する第2の信号処理モジュールと
    を備える請求項1に記載の画像認識装置。
  3. 前記制御部は、前記フュージョン有りによる認証処理の実行制御時に、予め決められた条件に基づいて、前記認識処理部に対し前記フュージョン無しによる認証処理の実行制御に戻す
    請求項1または2に記載の画像認識装置。
  4. 前記制御部は、前記条件として、前記認識処理部において、前記複数の信号処理モジュールからそれぞれ出力される複数フレームの画像信号に対し、前記フュージョン有りによる認証処理を所定フレーム数繰り返し実行し、所定フレーム数に達した時点で、前記フュージョン無しによる認証処理の実行制御に戻す
    請求項3に記載の画像認識装置。
  5. 前記認識処理部は、少なくとも前記画像センサから得られる画像信号の明度、天候、前記画像センサの汚れのいずれかに基づいて、前記認識処理結果の信頼度を算出し、
    前記制御部は、前記信頼度が決められた範囲に入らないときに、前記フュージョン無しによる認証処理の実行制御を行う
    請求項1から4のいずれか1項に記載の画像認識装置。
  6. 前記複数の画像センサのうち少なくとも1つは、RGBセンサであり、他の画像センサは、間接ToF(Time of Flight)方式の測距センサである
    請求項1から5のいずれか1項に記載の画像認識装置。
  7. 前記複数の画像センサのうち少なくとも1つは、RGBセンサであり、他の画像センサは、直接ToF(Time of Flight)方式の測距センサである
    請求項1から5のいずれか1項に記載の画像認識装置。
  8. 前記制御部は、前記RGBセンサを接続した信号処理モジュールに電源を供給して、稼働する信号処理モジュールの出力信号に対し前記フュージョン無しにより前記対象物の認識処理を実行する
    請求項6または7に記載の画像認識装置。
  9. それぞれ機能が異なる複数の画像センサを接続し電源供給の制御が可能な複数の信号処理モジュールのうち少なくとも1つの信号処理モジュールに電源を供給して、前記画像センサから出力され所定の撮像視野内の対象物を含む画像信号に基づいて信号処理を行うことと、
    稼働する信号処理モジュールの出力信号に対し他の出力信号とのフュージョン無しにより前記対象物の認識処理を実行することと、
    認識処理結果の信頼度を判定することと、
    判定結果に基づいて、他の信号処理モジュールの電源供給制御を実行することで、他の信号処理モジュールの出力信号とのフュージョン有りによる前記対象物の認識処理の実行・停止を制御することと、を含む
    画像認識方法。
JP2020075959A 2020-04-22 2020-04-22 画像認識装置及び画像認識方法 Pending JP2021174135A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2020075959A JP2021174135A (ja) 2020-04-22 2020-04-22 画像認識装置及び画像認識方法
US17/995,893 US20230161399A1 (en) 2020-04-22 2021-03-02 Image recognition device and image recognition method
PCT/JP2021/007945 WO2021215116A1 (ja) 2020-04-22 2021-03-02 画像認識装置及び画像認識方法
CN202180028810.6A CN115428043A (zh) 2020-04-22 2021-03-02 图像识别装置及图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020075959A JP2021174135A (ja) 2020-04-22 2020-04-22 画像認識装置及び画像認識方法

Publications (1)

Publication Number Publication Date
JP2021174135A true JP2021174135A (ja) 2021-11-01

Family

ID=78270486

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020075959A Pending JP2021174135A (ja) 2020-04-22 2020-04-22 画像認識装置及び画像認識方法

Country Status (4)

Country Link
US (1) US20230161399A1 (ja)
JP (1) JP2021174135A (ja)
CN (1) CN115428043A (ja)
WO (1) WO2021215116A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11965754B2 (en) * 2019-03-13 2024-04-23 Sony Semiconductor Solutions Corporation Information processing apparatus, information processing method, and mobile body apparatus
WO2024024471A1 (ja) * 2022-07-28 2024-02-01 ソニーセミコンダクタソリューションズ株式会社 情報処理装置、情報処理方法、及び、情報処理システム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9268399B2 (en) * 2013-03-01 2016-02-23 Qualcomm Incorporated Adaptive sensor sampling for power efficient context aware inferences
US10694106B2 (en) * 2013-06-14 2020-06-23 Qualcomm Incorporated Computer vision application processing
JP7144926B2 (ja) * 2017-09-26 2022-09-30 ソニーセミコンダクタソリューションズ株式会社 撮像制御装置、撮像装置、および、撮像制御装置の制御方法
JP7117566B2 (ja) * 2018-03-27 2022-08-15 パナソニックIpマネジメント株式会社 情報処理システムおよび情報処理方法
US11016492B2 (en) * 2019-02-28 2021-05-25 Zoox, Inc. Determining occupancy of occluded regions
US11017513B1 (en) * 2019-03-28 2021-05-25 Amazon Technologies, Inc. Active sensor fusion systems and methods for object detection

Also Published As

Publication number Publication date
CN115428043A (zh) 2022-12-02
WO2021215116A1 (ja) 2021-10-28
US20230161399A1 (en) 2023-05-25

Similar Documents

Publication Publication Date Title
US10887579B2 (en) Depth-sensing computer vision system
WO2021215116A1 (ja) 画像認識装置及び画像認識方法
US10614322B2 (en) Object recognition device
US20190266425A1 (en) Identification apparatus, identification method, and non-transitory tangible recording medium storing identification program
KR102535618B1 (ko) 융합형 물체 감지 정보를 이용한 운전자 보조 시스템 및 방법
WO2021111891A1 (ja) 情報処理装置、情報処理システム、情報処理方法及びプログラム
KR20210064591A (ko) 차량용 다중 센서를 위한 딥러닝 처리 장치 및 방법
US20150239396A1 (en) Method and information system for filtering object information
US20230040994A1 (en) Information processing apparatus, information processing system, information processing program, and information processing method
WO2021217334A1 (zh) 可移动平台及其避障方法和装置
US11740315B2 (en) Mobile body detection device, mobile body detection method, and mobile body detection program
US11653808B2 (en) Robot cleaner and controlling method thereof
US20230113547A1 (en) Recognition processing system, recognition processing device, and recognition processing method
KR20210023859A (ko) 화상 처리 장치, 이동 장치 및 방법, 그리고 프로그램
KR102535598B1 (ko) 비전기반의 융합형 물체 감지 장치 및 방법
US11508074B2 (en) Sensor data generating device
KR101734490B1 (ko) 초음파 센서를 이용한 avm 시스템 및 그 제어방법
WO2023033040A1 (ja) フレア検出システム、フレア検出装置、フレア検出方法、フレア検出プログラム
US20240163415A1 (en) Sensor for safe detection of intrusions in a 3d volume
US10955553B2 (en) Sensor system for compensating information processing rate
WO2024108360A1 (zh) 信息指示方法、信息处理方法及相关装置、系统
CN116086770B (zh) 产品状态监控方法、散斑投射器、电子设备和存储介质
CN117724477A (zh) 运动路线确定方法、装置、设备和存储介质
CN116110254A (zh) 多通道交汇处的防撞提醒方法、装置、设备及存储介质
WO2024151505A1 (en) Sensor for safe detection of intrusions in a 3d volume