JP7260706B2 - 認識器学習装置、認識装置、電子機器、及び学習方法 - Google Patents

認識器学習装置、認識装置、電子機器、及び学習方法 Download PDF

Info

Publication number
JP7260706B2
JP7260706B2 JP2022151744A JP2022151744A JP7260706B2 JP 7260706 B2 JP7260706 B2 JP 7260706B2 JP 2022151744 A JP2022151744 A JP 2022151744A JP 2022151744 A JP2022151744 A JP 2022151744A JP 7260706 B2 JP7260706 B2 JP 7260706B2
Authority
JP
Japan
Prior art keywords
recognizer
category
control unit
image
object recognizer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022151744A
Other languages
English (en)
Other versions
JP2022188780A (ja
Inventor
暁艶 戴
寛樹 谷本
ジェチョル キム
依珊 謝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Corp
Original Assignee
Kyocera Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Corp filed Critical Kyocera Corp
Publication of JP2022188780A publication Critical patent/JP2022188780A/ja
Priority to JP2023062214A priority Critical patent/JP2023089086A/ja
Application granted granted Critical
Publication of JP7260706B2 publication Critical patent/JP7260706B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Description

特許法第30条第2項適用 1.京セラ株式会社が、2021年6月10日付で、記者会見にて本発明を含む、無人POSシステム全体について説明を行い公開。 2.TBSテレビが2021年6月10日15:49から放送された「Nスタ」において公開。 3.https://www.kyocera.co.jp/news/2021/0602_regi.html https://www.kyocera.co.jp/rd-openinnovation/catalog/auto_regi.html 京セラ株式会社が、2021年6月10日及び11日に自社HPにおいて、出願に係る発明の内容を公開。
本発明は、認識器学習装置、認識装置、電子機器、及び学習方法に関するものである。
近年、画像中に含まれる物体を機械学習によって認識する技術の開発が進められている。
例えば、特許文献1には一般物体認識と特定物体認識とを併用した認識手法が記載されている。
国際公開2011/081192号
従来の技術には改善の余地がある。例えば、データベースに登録されていない対象物を既存の学習済み物体認識モデルに追加する学習を行う際、一般的には機械学習で用いる物体認識モデル全体を再学習する必要があり、学習時間がかかってしまうといったような、物体認識モデルの利用を阻害する要因がある。
かかる点に鑑みてなされた本開示の目的は、物体認識モデルの利用を促進することである。
上述した諸課題を解決すべく、第1の観点による認識器学習装置は、
画像を取得する取得部と、
最上層判定器と、少なくとも一つの下位層判定器とを含む、積層化した複数の段階的判定器によって構成され、前記最上層判定器は撮像された画像に写る対象物をいずれかのカテゴリに分類し、前記下位層判定器はより上位層の前記段階的判定器が分類したカテゴリを更に下位のカテゴリに分類し、前記画像に写る対象物を上位層から下位層に向かって段階的に分類することにより前記対象物を認識する第1の物体認識器を学習させる制御部と、を備え、
前記制御部は、前記取得部が取得した画像に写る対象物を、上位層から下位層に向かって前記段階的判定器に分類させ、既存の下位のカテゴリに分類できない下位層判定器に対応する上位のカテゴリに新規な下位のカテゴリを追加して、前記第1の物体認識器を学習させる。
また、第2の観点による認識器学習装置は、
対象物が撮像された画像を取得する取得部と、
前記対象物を、学習済み対象物を認識可能な第1の物体認識器で認識できない場合、前記学習済み対象物を用いずに前記対象物を用いて該対象物を認識可能な第2の物体認識器を構築する。
また、第3の観点による認識装置は、
撮像された画像を取得する取得部と、
画像を取得する取得部と、最上層判定器と、少なくとも一つの下位層判定器とを含む、積層化した複数の段階的判定器によって構成され、前記最上層判定器は撮像された画像に写る対象物をいずれかのカテゴリに分類し、前記下位層判定器はより上位層の前記段階的判定器が分類したカテゴリを更に下位のカテゴリに分類し、前記画像に写る対象物を上位層から下位層に向かって段階的に分類することにより前記対象物を認識する第1の物体認識器を学習させる制御部と、を有し、前記制御部は、前記取得部が取得した画像に写る対象物を、上位層から下位層に向かって前記段階的判定器に分類させ、既存の下位のカテゴリに分類できない下位層判定器に対応する上位のカテゴリに新規な下位のカテゴリを追加して、前記第1の物体認識器を学習させ、前記制御部は、前記対象物が、前記第1の物体認識器により認識可能な学習済み対象物に類似する場合に前記第1の物体認識器を学習させ、前記学習済み対象物に類似しない場合に該学習済み対象物を用いずに前記対象物を用いて該対象物を認識可能な第2の物体認識器を構築する認識器学習装置から取得する前記第1の物体認識器及び前記第2の物体認識器を構築するパラメータを記憶する記憶部と、
前記画像に含まれる対象物に前記第1の物体認識器による認識を行い、前記第1の物体認識器により認識できない場合に前記第2の物体認識器を用いて該対象物を認識する制御部と、を備える。
また、第4の観点による認識装置は、
撮像された画像を取得する取得部と、
画像を取得する取得部と、最上層判定器と、少なくとも一つの下位層判定器とを含む、積層化した複数の段階的判定器によって構成され、前記最上層判定器は撮像された画像に写る対象物をいずれかのカテゴリに分類し、前記下位層判定器はより上位層の前記段階的判定器が分類したカテゴリを更に下位のカテゴリに分類し、前記画像に写る対象物を上位層から下位層に向かって段階的に分類することにより前記対象物を認識する第1の物体認識器を学習させる制御部と、を有し、前記制御部は、前記取得部が取得した画像に写る対象物を、上位層から下位層に向かって前記段階的判定器に分類させ、既存の下位のカテゴリに分類できない下位層判定器に対応する上位のカテゴリに新規な下位のカテゴリを追加して、前記第1の物体認識器を学習させ、前記制御部は、前記対象物が、前記第1の物体認識器により認識可能な学習済み対象物に類似する場合に前記第1の物体認識器を学習させ、前記学習済み対象物に類似しない場合に該学習済み対象物を用いずに前記対象物を用いて該対象物を認識可能な第2の物体認識器を構築する認識器学習装置から取得する前記第1の物体認識器及び前記第2の物体認識器を構築するパラメータを記憶する記憶部と、
前記画像に含まれる対象物を前記第1の物体認識器及び前記第2の物体認識器それぞれによる認識を行い、認識に際して算出される信頼度に基づいて、前記第1の物体認識器及び前記第2の物体認識器のいずれかの認識を採用する制御部と、を備える。
また、第5の観点による認識装置は、
撮像された画像を取得する取得部と、
画像を取得する取得部と、最上層判定器と、少なくとも一つの下位層判定器とを含む、積層化した複数の段階的判定器によって構成され、前記最上層判定器は撮像された画像に写る対象物をいずれかのカテゴリに分類し、前記下位層判定器はより上位層の前記段階的判定器が分類したカテゴリを更に下位のカテゴリに分類し、前記画像に写る対象物を上位層から下位層に向かって段階的に分類することにより前記対象物を認識する第1の物体認識器を学習させる制御部と、を有し、前記制御部は、前記取得部が取得した画像に写る対象物を、上位層から下位層に向かって前記段階的判定器に分類させ、既存の下位のカテゴリに分類できない下位層判定器に対応する上位のカテゴリに新規な下位のカテゴリを追加して、前記第1の物体認識器を学習させ、前記制御部は、前記対象物が、前記第1の物体認識器により認識可能な学習済み対象物に類似する場合に前記第1の物体認識器を学習させ、前記学習済み対象物に類似しない場合に該学習済み対象物を用いずに前記対象物を用いて該対象物を認識可能な第2の物体認識器を構築し、前記制御部は、前記第2の物体認識器により認識可能な対象物と、前記学習済み対象物とを用いて前記第1の物体認識器を再学習することにより、前記第1の物体認識器を更新する認識器学習装置から取得する更新前の前記第1の物体認識器及び前記第2の物体認識器を構築するパラメータを記憶する記憶部と、
前記画像に含まれる対象物を、前記更新前の第1の物体認識器及び前記第2の物体認識器を用いて認識し、前記更新後の第1の物体認識器を取得後には前記更新後の第1の物体認識器のみを用いて認識する制御部と、を備える。
また、第6の観点による電子機器は、
撮像により画像を生成する撮像部と、
前記撮像部が撮像した画像を、画像を取得する取得部と、最上層判定器と、少なくとも一つの下位層判定器とを含む、積層化した複数の段階的判定器によって構成され、前記最上層判定器は撮像された画像に写る対象物をいずれかのカテゴリに分類し、前記下位層判定器はより上位層の前記段階的判定器が分類したカテゴリを更に下位のカテゴリに分類し、前記画像に写る対象物を上位層から下位層に向かって段階的に分類することにより前記対象物を認識する第1の物体認識器を学習させる制御部と、を有し、前記制御部は、前記取得部が取得した画像に写る対象物を、上位層から下位層に向かって前記段階的判定器に分類させ、既存の下位のカテゴリに分類できない下位層判定器に対応する上位のカテゴリに新規な下位のカテゴリを追加して、前記第1の物体認識器を学習させる認識器学習装置から取得する前記第1の物体認識装置を構築するパラメータを記憶する記憶部と、画像に含まれる対象物を前記第1の物体認識器による認識を行う制御部とを有する認識装置に送信し、前記認識装置から前記画像の認識結果を受信する通信部と、を備える。
また、第7の観点による電子機器は、
撮像により画像を生成する撮像部と、
前記撮像部が撮像した画像を、画像を取得する取得部と、最上層判定器と、少なくとも一つの下位層判定器とを含む、積層化した複数の段階的判定器によって構成され、前記最上層判定器は撮像された画像に写る対象物をいずれかのカテゴリに分類し、前記下位層判定器はより上位層の前記段階的判定器が分類したカテゴリを更に下位のカテゴリに分類し、前記画像に写る対象物を上位層から下位層に向かって段階的に分類することにより前記対象物を認識する第1の物体認識器を学習させる制御部と、を有し、前記制御部は、前記取得部が取得した画像に写る対象物を、上位層から下位層に向かって前記段階的判定器に分類させ、既存の下位のカテゴリに分類できない下位層判定器に対応する上位のカテゴリに新規な下位のカテゴリを追加して、前記第1の物体認識器を学習させ、前記制御部は、前記対象物が、前記第1の物体認識器により認識可能な学習済み対象物に類似する場合に前記第1の物体認識器を学習させ、前記学習済み対象物に類似しない場合に該学習済み対象物を用いずに前記対象物を用いて該対象物を認識可能な第2の物体認識器を構築する認識器学習装置から取得する前記第1の物体認識装置及び前記第2の物体認識器を構築するパラメータを記憶する記憶部と、画像に含まれる対象物を前記第1の物体認識器による認識を行い、前記第1の物体認識器により認識できない場合に前記第2の物体認識器を用いて該対象物を認識する制御部とを有する認識装置に送信し、前記認識装置から前記画像の認識結果を受信する通信部と、を備える。
また、第8の観点による学習方法は、
画像を取得する取得ステップと、
最上層判定器と少なくとも一つの下位層判定器とを含む、積層化した複数の段階的判定器によって構成され、前記最上層判定器は撮像された画像に写る対象物をいずれかのカテゴリに分類し、前記下位層判定器はより上位層の前記段階的判定器が分類したカテゴリを更に下位のカテゴリに分類し、前記画像に写る対象物を上位層から下位層に向かって段階的に分類することにより前記対象物を上位層から下位層に向かって前記段階的判定器に分類させ、既存の下位のカテゴリに分類できない下位層判定器に対応する上位のカテゴリに新規な下位のカテゴリを追加して学習させる学習ステップと、を備える。
また、第9の観点による学習方法は、
画像を取得する取得ステップと、
前記対象物を、学習済み対象物を認識可能な第1の物体認識モデルで認識できない場合、前記学習済み対象物を用いずに前記対象物を用いて該対象物を認識可能な第2の物体認識器を構築する構築ステップと、を備える。
本開示によれば、物体認識モデルの利用を促進することが期待できる。
第1の実施形態に係る認識器学習装置として機能する情報処理装置10を含む情報処理システムの概略構成を示す構成図である。 図1の情報処理装置の概略構成を示すブロック図である。 図1の情報処理システムで用いられる第1の物体認識器の概略構成を示す図である。 図1の端末装置の外観を示す斜視図である。 図4の認識装置の概略構成を示すブロック図である。 図2の制御部が実行する第1の再学習処理を説明するためのフローチャートである。 図2の制御部が実行する第2の再学習処理を説明するためのフローチャートである。 図2の制御部が実行する第1の物体認識器学習のサブルーチンを説明するためのフローチャートである。 図5の制御部が実行する第1の認識処理を説明するためのフローチャートである。 図5の制御部が実行する第2の認識処理を説明するためのフローチャートである。 第2の実施形態において、図2の制御部が実行する第1の再学習処理を説明するためのフローチャートである。 第2の実施形態において、図2の制御部が実行する第2の再学習処理を説明するためのフローチャートである。
以下、本開示の実施形態について、図面を参照して説明する。以下の図面に示す構成要素において、同じ構成要素には同じ符号を付す。
図1に示すように、本開示の第1の実施形態に係る認識器学習装置として機能する情報処理装置10を含む情報処理システム11は、少なくとも一つの端末装置12、ネットワーク13、及び情報処理装置10を含んで構成される。本実施形態において、情報処理システム11は、複数の端末装置12を含む。端末装置12及び情報処理装置10は、ネットワーク13を介して通信してよい。
情報処理システム11は、画像に含まれる検出対象の像に基づいて、検出対象を特定する任意のシステムに適用される。情報処理システム11は、例えば、検出対象である商品を画像に基づいて特定する精算システムに適用される。以下において、精算システムに適用した例を用いて、情報処理システム11を説明する。
端末装置12は、購入者が端末装置12に載置する商品を撮像してよい。端末装置12は、撮像による画像に対して物体認識を行い、画像中に含まれる物体が店舗におけるいずれの商品であるかを推定してよい。画像中の物体は、画像内に描画されている物体を意味する。情報処理装置10は、端末装置12において撮像された全商品の推定結果に基づいて、請求金額を算出してよい。情報処理装置10は、請求金額を端末装置12に通知してよい。端末装置12は、購入者に請求金額を提示し、購入金額の支払いを要求してよい。
情報処理システム11は、商品名をアノテーションデータとして付与された商品の画像を用いて機械学習することにより構築される第1の物体認識器及び第2の物体認識器の少なくとも一方を用いて、物体認識を行う。認識器学習装置として機能する情報処理装置10は、学習されていない商品に対して第1の物体認識器又は第2の物体認識器を学習させる。以下に、情報処理装置10及び端末装置12の詳細を説明する。
図2に示すように、情報処理装置10は、通信部(取得部)14及び制御部15を含んで構成される。情報処理装置10は、更に入力部16及び記憶部17を含んでよい。
通信部14は、ネットワーク13に接続可能な少なくとも1つの通信モジュールを含んでよい。通信モジュールは、例えば、有線LAN(Local Area Network)又は無線LAN、Wi-Fi等の通信規格に対応した通信モジュールである。通信部14は、通信モジュールによって有線LANなどを介して、ネットワーク13に接続されてよい。
通信部14は、例えば通信線を介して、多様な外部機器と通信可能な通信モジュールを含んでよい。通信モジュールは、通信線の規格に対応した通信モジュールである。通信線は、有線及び無線の少なくとも何れかを含んで構成されてよい。
通信部14は、ネットワーク13又は通信線を介して、直接又は間接的に、後述する撮像部に接続されてよい。間接的に撮像部に接続されるとは、例えば、後述するように、撮像部を内蔵する端末装置12に通信部14が接続されることを意味する。通信部14は、撮像部が生成する画像を取得する。
通信部14は、ネットワーク13又は通信線を介して、直接的又は間接的に後述する、出力装置に接続されてよい。
入力部16は、ユーザからの操作入力を検出可能である。入力部16は、ユーザからの入力を検出可能な少なくとも1つの入力用インタフェースを含む。入力用インタフェースは、例えば、物理キー、静電容量キー、ポインティングデバイス、ディスプレイと一体的に設けられたタッチスクリーン、マイク等である。
記憶部17は、半導体メモリ、磁気メモリ、光メモリのいずれかを含んでいる。半導体メモリは、例えば、RAM(Random Access Memory)又はROM(Read Only Memory)等である。RAMは、例えば、SRAM(Static Random Access Memory)又はDRAM(Dynamic Random Access Memory)等である。ROMは、例えば、EEPROM(Electrically Erasable Programmable Read Only Memory)等である。記憶部17は、主記憶装置、補助記憶装置又はキャッシュメモリとして機能してよい。記憶部17は、情報処理装置10の動作に用いられるデータと、情報処理装置10の動作によって得られたデータとを記憶する。例えば、記憶部17は、システムプログラム、アプリケーションプログラム、組み込みソフトウェア等を記憶する。例えば、記憶部17は、物体認識モデルとして第1の物体認識器を記憶する。
制御部15は、少なくとも1つのプロセッサ、少なくとも1つの専用回路又はこれらの組み合わせを含んで構成される。プロセッサは、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)等の汎用プロセッサ又は特定の処理に特化した専用プロセッサである。専用回路は、例えば、FPGA(Field-Programmable Gate Array)、ASIC(Application Specific Integrated Circuit)等であってもよい。制御部15は、情報処理装置10の各部を制御しながら、情報処理装置10の動作に関わる処理を実行する。情報処理装置10の動作に係わる処理とは、例えば、後述する第1の物体認識器の再学習である。
制御部15は、端末装置12から物体認識による認識結果を示す情報を取得する場合、認識結果である推定した物体の販売価格を記憶部17から読出してよい。制御部15は、推定した物体の販売価格を合計した請求金額を算出してよい。制御部15は、推定した物体を示す情報を付与した端末装置12に、請求金額に相当する金額情報を送信してよい。
制御部15は、学習されていない対象物に対して第1の物体認識器を学習させる。図3に示すように、第1の物体認識器18は、積層化した複数の段階的判定器19によって構成される。段階的判定器19は、最上層判定器20及び少なくとも一つの下位層判定器21を含む。最上層判定器20は、撮像された画像に写る対象物をいずれかのカテゴリに分類する。下位層判定器21は、より上位層の段階的判定器19が分類したカテゴリを更に下位のカテゴリに分類する。第1の物体認識器18は、撮像された画像に写る対象物を、積層化させた段階的判定器19の上位層から下位層に向かって段階的に分類することにより対象物を認識する。
最上層判定器20は、第1の物体認識器18が取得する画像に写る対象物のカテゴリを特定するために学習されたモデルであってよい。下位層判定器21は、より上位層の段階的判定器19が特定したカテゴリの、更に下位のカテゴリを特定するために学習されたモデルであってよい。
本実施形態において、段階的判定器19は1つの下位層判定器21を含む。言換えると、第1の物体認識器18は、第1層目の最上層判定器20と、第2層目の下位層判定器21とを有する。以下の説明において、第2層目の下位層判定器21が分類するカテゴリを、「クラス」とも呼ぶことがある。第1の物体認識器18が物体認識をする際に、最上層判定器20が対象物のカテゴリを特定し、下位層判定器21は最上層判定器20が特定したカテゴリの中からクラスに分類することにより、対象物を特定してよい。
第1の物体認識器18は、例えば、後述する、端末装置12において撮像される任意の物体Xを、最初に最上層判定器20を用いて判別する。最上層判定器20は、例えば、最上層におけるカテゴリ群内で物体認識を行うことにより、カテゴリを特定する。情報処理システム11を小売店の販売管理に用いる場合、最上層におけるカテゴリ群は、例えば、ペットボトル及びパン等の商品の種類を含む。最上層判定器20による物体認識は、例えば、DNN(Deep Neural Network)に基づいてよい。
物体Xの最上層におけるカテゴリがペットボトルであると特定された場合、下位層判定器21は、ペットボトルのカテゴリに属するクラス群内で物体認識を行うことにより、クラスを特定する。ペットボトルのカテゴリに属するクラス群は、例えば、お茶A及びスポーツドリンクBを含んでよい。パンのカテゴリに属するクラス群は、例えば、クロワッサンC及びバターロールDを含んでよい。下位層判定器21が特定する、クラス群は、商品名又は当該商品名に紐づいてマスタ上で管理されるIDであってよい。下位層判定器21による物体認識は、例えば、パターンマッチングに基づいてよい。
最上層判定器20が分類する最上層カテゴリ群が商品の種類であることを例として説明したが、それ以外の分け方であってよい。対象物となる物によって、3層以上の階層によって分類されてよい。例えば、第2層目の下位層判定器21が特定したクラスに属するいずれかのサブクラスに第3層目の下位層判定器21が分類することにより対象物が特定されてよい。例えば、第2層目の下位層判定器21が分類したクロワッサンCより下位のサブクラス群が黒糖クロワッサン及びバタークロワッサンを含み、第3層目の下位層判定器21により分類されてよい。換言すれば、これらの分類は、撮像された画像の種類が同一のカテゴリであるか否か、次に同一のクラスであるかいなか、次に同一のサブクラスであるか否かが決まるように構成されてもよい。
制御部15は、第1の物体認識器18の学習において、最初に、通信部14が取得した画像に写る対象物を、上位層から下位層に向かって段階的判定器19に分類させる。制御部15は、段階的な分類において既存の下位のカテゴリに分類できない下位層判定器21を特定する。制御部15は、当該下位層判定器21に対応する上位のカテゴリに新規な下位のカテゴリを追加して、当該下位層判定器21の再学習により第1の物体認識器18を学習させる。上位のカテゴリに新規なカテゴリを追加する方法は、以下に例示される。
制御部15は、新規な下位のカテゴリを指定する操作入力を入力部16が検出する場合、当該操作入力に対応する新規な下位のカテゴリを、下位のカテゴリに分類できない下位層判定器21に対応する上位のカテゴリに追加してよい。操作入力は、新規な下位のカテゴリを含めさせる既存の上位のカテゴリの特定も含んでよい。対象物が第1の物体認識器18が学習していない「ソーダ」である場合を例にして、以下に説明する。第1の物体認識器18は、最上層判定器20において、通信部14を介して取得する画像に写る対象物であるソーダをペットボトルに分類する。しかし、「ペットボトル」のカテゴリに「ソーダ」は存在しないため、「ペットボトル」をより下位のカテゴリに分類する下位層判定器21は分類ができない。この状態で、新規な下位のカテゴリに「ソーダ」の商品名等を入力する操作入力があるとき、制御部15は、「ペットボトル」のカテゴリに「ソーダ」を追加する。言換えると、制御部15は、「ペットボトル」のカテゴリをより下位のカテゴリに分類する下位層判定器21のカテゴリ群に「ソーダ」のカテゴリを追加する。
又は、制御部15は、第1の物体認識器18を用いて対象物の認識結果に基づいて、対象物が学習済みであるかを判別してよい。より具体的には、制御部15は、第1の物体認識器18を用いて対象物の認識を行い、下位層判定器21における下位のカテゴリへの分類における信頼度が閾値以下であるか否かを判別してよい。信頼度は、対象物のカテゴリへの分類結果の確からしさを示す指標である。制御部15は、信頼度が閾値以下である場合、下位のカテゴリへの分類を行った下位層判定器21における上位のカテゴリに、新規な下位のカテゴリを追加してよい。例えば、対象物が第1の物体認識器18が学習していない「ソーダ」である場合、第1の物体認識器18における最上層判定器20は、対象物を「ペットボトル」に分類すると考えられる。「ペットボトル」に対応する第2層目の下位層判定器21は、対象物を、カテゴリとして含まない「ソーダ」の代わりに他のカテゴリに分類する。下位層判定器21は、当該他のカテゴリへの分類に際して、相対的に低い信頼度を算出する。制御部15は、算出された信頼度が閾値以下である場合、「ペットボトル」のカテゴリに「ソーダ」を追加する。
制御部15は、上述のように学習させて更新させた第1の物体認識器18を構築するパラメータを、記憶部17に格納してよい。制御部15は、更新させた第1の物体認識器18を構築するパラメータを、通信部14を介して端末装置12に付与してよい。
制御部15は、通信部14が取得した画像に写る対象物が、第1の物体認識器18により認識可能な学習済みの対象物に類似するか否かを判別してよい。制御部15は、例えば、画素値の平均値、ヒストグラム、相関係数等の特徴量を比較することにより類比判断を行う。制御部15は、通信部14が取得した画像に写る対象物が学習済みの対象物に類似する場合、第1の物体認識器18を上述のように学習させてよい。制御部15は、通信部14が取得した画像に写る対象物が学習済みの対象物に類似しない場合、学習済み対象物を用いずに通信部14が取得した画像に写る対象物を用いて当該対象物を認識可能な第2の物体認識器を構築してよい。
制御部15は、通信部14が取得した画像に写る対象物を、第1の物体認識器18における最上層判定器20がいずれかのカテゴリに分類できるか否かを判別してよい。分類の可否は、最上層判定器20の分類結果の信頼度が閾値以上であるか否かに基づいて判別してよい。制御部15は、最上層判定器20が分類できない場合、第1の物体認識器18により認識可能な学習済み対象物を用いずに、通信部14が取得した画像に写る対象物を用いて当該対象物を認識可能な第2の物体認識器を構築してよい。
第2の物体認識器により認識可能な対象物の数は限定されず、単一であってよく、複数であってよい。言換えると、制御部15は、単一の対象物又は複数の対象物を用いて機械学習を行うことにより、第2の物体認識器を構築してよい。制御部15は、第2の物体認識器の構築中又は構築後に第1の物体認識器により認識できない対象物がある場合、当該第2の物体認識器の学習に当該対象物を用いてよい。又は、制御部15は、第2の物体認識器の構築中又は構築後に第1の物体認識器により認識できない対象物がある場合、当該第2の物体認識器とは別に、当該対象物を認識可能な第2の物体認識器を構築してよい。言換えると、制御部15は、複数の第2の物体認識器を構築してよい。
制御部15は、新規な第2の物体認識器を構築するパラメータを、記憶部17に格納してよい。制御部15は、第2の物体認識器を構築するパラメータを、通信部14を介して端末装置12に付与してよい。
制御部15は、第2の物体認識器を構築するパラメータの付与後に、当該第2の物体認識器により認識可能な対象物と、第1の物体認識器18により認識可能な学習済みの対象物とを用いて、第1の物体認識器18を再学習させてよい。制御部15は、第1の物体認識器18を再学習する場合、第2の物体認識器を構築するパラメータに当該再学習中であるフラグを関連付けて端末装置12に付与してよい。制御部15は、第1の物体認識器18の再学習により第1の物体認識器18を更新してよい。制御部15は、更新した第1の物体認識器18を構築するパラメータを、記憶部17に格納してよい。制御部15は、更新した第1の物体認識器18を構築するパラメータを、通信部14を介して端末装置12に付与してよい。制御部15は、更新した第1の物体認識器18を構築するパラメータに、第2の物体認識器を構築するパラメータに関連付けたフラグを消去する指令を関連付けて端末装置12に付与してよい。
図4に示すように、端末装置12は、撮像部22、出力装置23、載置台24、支持柱25、及び認識装置26を含んで構成される。
撮像部22は、例えば、載置台24の全範囲を撮像可能に固定されている。撮像部22は、例えば、載置台24の側面から延びる支持柱25に固定されている。撮像部22は、例えば、載置台24の上面us全面を撮像可能、かつ当該上面usに光軸が垂直になるように固定されている。
撮像部22は、可視光或いは赤外線のカメラを含んで構成されていてもよい。カメラは、撮像光学系及び撮像素子を含んで構成される。撮像光学系は、例えば、1個以上のレンズ及び絞りなどの光学部材を含む。レンズは、焦点距離に囚われずどのようなものであってもよく、例えば、一般的なレンズ、魚眼レンズを含む広角レンズまたは焦点距離が可変であるズームレンズであってもよい。撮像光学系は、被写体像を撮像素子の受光面に結像させる。撮像素子は、例えば、CCD(Charge Coupled Device)イメージセンサまたはCMOS(Complementary Metal-Oxide Semiconductor)イメージセンサ、FIR(far infrared rays)カメラ等である。撮像素子は、受光面上に結像された被写体像を撮像して撮像画像を生成する。
出力装置23は、画像を表示する、従来公知の任意のディスプレイであってよい。ディスプレイは、後述するように、タッチスクリーンとして機能してよい。出力装置23は、情報を報知するスピーカであってよい。出力装置23は、例えば、認識装置26の物体認識の認識結果を表示してよい。出力装置23は、情報処理システム11等の不具合が発生した場合等に種々の報知を行ってよい。出力装置23は、認識装置26の判定の成否及び第1の物体認識器18の再学習の要否を音声等で放置してよい。
図5に示すように、認識装置26は、通信部27(取得部)、記憶部28、及び制御部29を含んで構成される。認識装置26は、更に、入力部30を含んでよい。認識装置26は、第1の実施形態において、撮像部22及び出力装置23とは別の装置として構成されているが、例えば、撮像部22、載置台24、支持柱25、および出力装置23の少なくともいずれかと一体的に構成されてよい。
通信部27は、例えば、有線または無線を含んで構成される通信線を介して撮像部22と通信する通信モジュールを含む。通信部27は、撮像部22から画像を信号として受信、言い換えると取得する。通信部27は、通信線を介して出力装置23と通信する通信モジュールを含んでよい。通信部27は、表示させる画像を画像信号として出力装置23に向けて送信してよい。通信部27は、ディスプレイである出力装置23から表示面において接触を検知した位置に相当する位置信号を受信してよい。通信部27は、ネットワーク13を介して情報処理装置10と通信する通信モジュールを含む。通信部27は、第1の物体認識器18を構築するためのパラメータを情報処理装置10から受信する。通信部27は、後述する、確定した認識結果に相当する結果情報を情報処理装置10に送信してよい。通信部27は、情報処理装置10から請求金額に相当する金額情報を受信してよい。
入力部30は、ユーザからの操作入力を検出可能である。入力部30は、ユーザからの入力を検出可能な少なくとも1つの入力用インタフェースを含む。入力用インタフェースは、例えば、物理キー、静電容量キー、ポインティングデバイス、ディスプレイと一体的に設けられたタッチスクリーン、マイク等である。本実施形態において、入出力用インタフェースは、出力装置23を用いたタッチスクリーンである。
記憶部28は、半導体メモリ、磁気メモリ、光メモリのいずれかを含んでいる。半導体メモリは、例えば、RAM又はROM等である。RAMは、例えば、SRAM又はDRAM等である。ROMは、例えば、EEPROM等である。記憶部28は、主記憶装置、補助記憶装置又はキャッシュメモリとして機能してよい。記憶部28は、認識装置26の動作に用いられるデータと、認識装置26の動作によって得られたデータとを記憶する。例えば、記憶部28は、システムプログラム、アプリケーションプログラム、組み込みソフトウェア等を記憶する。例えば、記憶部28は、情報処理装置10から取得する第1の物体認識器18及び第2の物体認識器をそれぞれ構築するパラメータを記憶する。
制御部29は、少なくとも1つのプロセッサ、少なくとも1つの専用回路又はこれらの組み合わせを含んで構成される。プロセッサは、CPU)、GPU等の汎用プロセッサ又は特定の処理に特化した専用プロセッサである。専用回路は、例えば、FPGA、ASIC等であってもよい。制御部29は、認識装置26の各部を制御しながら、認識装置26の動作に関わる処理を実行する。認識装置26の動作に係わる処理とは、例えば、物体認識である。
制御部29は、通信部27が取得する画像に含まれる対象物を、最初に第1の物体認識器18を用いて物体認識を行う。制御部29は、第1の物体認識器18により対象物を認識できない場合、第2の物体認識器を用いて物体認識を行う。前述のように、複数の第2の物体認識器が構築される場合、制御部29は、いずれかの第2の物体認識器を用いて物体認識を行ってよい。
又は、制御部29は、通信部27が取得する画像に含まれる対象物を、第1の物体認識器18及び第2の物体認識器それぞれを用いて物体認識を行う。制御部29は、第1の物体認識器18及び第2の物体認識器それぞれを用いた物体認識に際して、信頼度を算出する。制御部29は、第1の物体認識器18及び第2の物体認識器それぞれの物体認識による信頼度に基づいて、第1の物体認識器18及び第2の物体認識器のいずれかの認識結果を採用する。制御部29は、例えば、信頼度がより高い認識結果を採用する。
制御部29は、情報処理装置10から第2の物体認識器を構築するパラメータを取得した後、再学習した第1の物体認識器18が送られるまでの間、通信部27が取得する画像に含まれる対象物を上述のように、更新前の第1の物体認識器18及び第2の物体認識器を用いて物体認識を行う。制御部29は、第2の物体認識器により認識可能な対象物を再学習させた更新後の第1の物体認識器18を構築するパラメータの取得後には、第2の物体認識器を用いずに、当該更新後の第1の物体認識器18のみを用いて物体認識を行う。
制御部29は、物体認識の認識結果を出力装置23に出力させてよい。制御部29は、認識結果を情報処理装置10に付与してよい。
次に、第1の実施形態において情報処理装置10の制御部15が実行する、第1の再学習処理について、図6のフローチャートを用いて説明する。第1の再学習処理は、情報処理装置10の入力部16又は認識装置26の入力部30が第1の再学習の実行指令の操作入力を検出する場合に開始する。
ステップS100において、制御部15は、撮像部22又は情報処理装置10に直接的に接続される撮像部から画像を取得する。必要に応じて、制御部15は、出力装置23又は情報処理装置10に直接的に接続される出力装置に、学習する必要のある可能性の高い対象物を撮像する要求を出力させ、その後に撮像される画像を取得してよい。画像の取得後、プロセスはステップS101に進む。
ステップS101では、制御部15は、ステップS100において取得した画像に含まれる対象物と、第1の物体認識器18において学習済みの対象物との類比判定を行う。類比判定の実行後、プロセスはステップS102に進む。
ステップS102では、制御部15は、ステップS100において取得した画像に含まれる対象物が、学習済みの対象物の少なくとも一つに類似するか否かを判別する。類似する場合、プロセスはステップS200に進む。学習済みの対象物のいずれにも類似しない場合、プロセスはステップS103に進む。
ステップS200においては、制御部15は、後述するように、第1の物体認識器学習のサブルーチンを実行する。サブルーチンの実行後、第1の再学習処理は終了する。
ステップS103では、制御部15は、第1の物体認識器18による学習済みの対象物を除いて、ステップS100において取得した画像に含まれる対象物のみに対する第2の物体認識器を構築する。制御部15は、第2の物体認識器を構築するためのパラメータを記憶部17に格納する。制御部15は、第2の物体認識器を構築するためのパラメータを端末装置12に付与する。付与後、プロセスはステップS104に進む。
ステップS104では、制御部15は、ステップS103において構築した第2の物体認識器により認識可能な対象物と、第1の物体認識器18において学習済みの対象物とを用いて、第1の物体認識器18を再学習させる。制御部15は、再学習により更新した第1の物体認識器18を構築するパラメータを記憶部17に格納する。更に、制御部15は、第1の物体認識器を構築するためのパラメータを端末装置12に付与する。付与後、第1の再学習処理は終了する。
次に、第1の実施形態において情報処理装置10の制御部15が第1の再学習処理の代わりに実行する、第2の再学習処理について、図7のフローチャートを用いて説明する。第1の再学習処理は、情報処理装置10の入力部16又は認識装置26の入力部30が第1の再学習の実行指令の操作入力を検出する場合に開始する。
ステップS300において、制御部15は、第1の再学習処理におけるステップS100と同じ処理を行う。画像の取得後、プロセスはステップS301に進む。
ステップS301では、制御部15は、ステップS300において取得した画像に含まれる対象物を、最上層判定器20で分類可能か否かを判別する。分類可能である場合、プロセスはステップS200に進む。分類不能である場合、プロセスはステップS302に進む。
ステップS200においては、制御部15は、後述するように、第1の物体認識器学習のサブルーチンを実行する。サブルーチンの実行後、第2の再学習処理は終了する。
ステップS302、S303では、制御部15は、第1の再学習処理におけるステップS103、S104と同じ処理を行う。パラメータの付与後、第2の再学習処理は終了する。
次に、第1の実施形態において情報処理装置10の制御部15が実行する、第1の物体認識器学習のサブルーチンについて、図8のフローチャートを用いて説明する。
ステップS201では、制御部15は、第1の物体認識器18に最上層から最下層に向かって段階的な分類を開始させる。分類の開始後、プロセスはステップS202に進む。
ステップS202では、制御部15は、画像に含まれる対象物が要学習対象であることが明確であるか否かを判別する。明確であるか否かの判別は、情報処理装置10の入力部16又は認識装置26の入力部30に、要学習対象であることを示す操作入力の有無により判別される。要学習対象であるか否か不明である場合、プロセスはステップS203に進む。要学習対象であることが明確である場合、プロセスはステップS204に進む。
ステップS203では、制御部15は、段階的判定器19による対象物の物体認識に対する信頼度が閾値以上であるか否かを判別する。すべての階層の段階的判定器19による物体認識の信頼度が閾値以上である場合、第1の物体認識器学習のサブルーチンS200を終了する。いずれかの段階的判定器19による物体認識の信頼度が閾値以上でない場合、プロセスはステップS205に進む。
ステップS204では、制御部15は、第1の再学習処理のステップS100又は第2の再学習処理のステップS300において取得した画像に含まれる対象物の分類が不可能となる段階的判定器19の階層を検出する。階層の検出後、プロセスはステップS205に進む。
ステップS205では、制御部15は、ステップS203において信頼度が閾値未満であった階層以下において対象物が属するカテゴリ、又はステップS204において検出された階層以下において対象物が属するカテゴリの操作入力の要求を、出力装置23又は情報処理装置10に直接的に接続される出力装置に出力させる。出力後、プロセスはステップS206に進む。
ステップS206では、制御部15は、ステップS205において操作入力を要求した全カテゴリが入力されているか否かを判別する。入力されていない場合、プロセスはステップS206に戻る。入力されている場合、プロセスはステップS207に進む。
ステップS207では、制御部15は、ステップS206において入力が確認されたカテゴリを追加して、ステップS203において信頼度が閾値未満であった階層以下、又はステップS204において検出された階層以下の段階的判定器19を再学習させる。制御部15は、学習させた第1の物体認識器を構築するためのパラメータを記憶部17に格納する。制御部15は、学習させた第1の物体認識器を構築するためのパラメータを端末装置12に付与する。付与後、第1の物体認識器学習のサブルーチンは終了する。
次に、第1の実施形態において認識装置26の制御部29が実行する、第1の認識処理について、図9のフローチャートを用いて説明する。第1の認識処理は、撮像部22から画像を取得するたびに開始する。
ステップS400において、制御部29は、第1の物体認識器18が第2の物体認識器の学習済み対象物を学習済みであるか否かを判別する。学習済みである場合、プロセスはステップS401に進む。学習済みでない場合、プロセスはステップS402に進む。
ステップS401では、制御部29は、取得した画像に含まれる対象物に対して、第2の物体認識器の学習済み対象物を学習済みの第1の物体認識器18を用いて物体認識を行う。物体認識後、プロセスはステップS405に進む。
ステップS402では、制御部29は、第2の物体認識器の学習済み対象物を未学習である第1の物体認識器18を用いて物体認識を行う。物体認識後、プロセスはステップS403に進む。
ステップS403では、制御部29は、ステップS402における物体認識により対象物を特定できたか否かを判別する。特定できなかった場合、プロセスはステップS4040に進む。特定できた場合、プロセスはステップS405に進む。
ステップS404では、制御部29は、第2の物体認識器を用いて物体認識を行う。物体認識後、プロセスはステップS405に進む。
ステップS405では、制御部29は、ステップS401、S402、又はS404の物体認識の認識結果を出力装置23に出力する。出力後、第1の認識処理は終了する。
次に、第1の実施形態において認識装置26の制御部29が第1の認識処理の代わりに実行する、第2の認識処理について、図10のフローチャートを用いて説明する。第2の認識処理は、撮像部22から画像を取得するたびに開始する。
ステップS500、S501において、制御部29は、第1の認識処理のステップS401、S402と同じ処理を行う。ステップS501における物体認識後、プロセスはステップS504に進む。
ステップS502では、制御部29は、第1の物体認識器18及び第2の物体認識器の両者それぞれを用いて物体認識を行う。物体認識後、プロセスはステップS505に進む。
ステップS503では、制御部29は、ステップS502における第1の物体認識器18及び第2の物体認識器それぞれの認識結果において、信頼度がより高い認識結果を正式な認識結果として採用する。採用後、プロセスはステップS504に進む。
ステップS504では、制御部29は、ステップS501の物体認識の認識結果、又はステップS503において採用した認識結果を出力装置23に出力する。出力後、第2の認識処理は終了する。
以上のような構成の第1の実施形態の情報処理装置10は、通信部14が取得した画像に写る対象物を、上位層から下位層に向かって段階的判定器19に分類させ、既存の下位のカテゴリに分類できない下位層判定器21に対応する上位のカテゴリに、新規な下位のカテゴリを追加して、第1の物体認識器18を学習させる。このような構成により、情報処理装置10は、階層化した段階的判定器19の一部を学習させるので、階層化されていない物体認識モデルを学習させる場合に比べて、学習時間を短縮させ得る。したがって、情報処理装置10は、物体認識モデルの利用を促進し得る。
また、第1の実施形態の情報処理装置10は、入力部16が検出する操作入力に対応する新な下位のカテゴリを追加する。このような構成により、情報処理装置10は、使用者が未学習であると把握する対象物のカテゴリを、第1の物体認識器18に加えて学習させ得る。
また、第1の実施形態の情報処理装置10は、第1の物体認識器18を用いて対象物の認識を行い、下位のカテゴリへの分類における信頼度が閾値以下である場合、当該下位のカテゴリへの分類を行った下位層判定器21における上位のカテゴリに新規な下位のカテゴリを追加する。このような構成により、情報処理装置10は、対象物が第1の物体認識器18において学習済みであるか不明である場合であっても、学習済みであるか否かを判別し得る。したがって、情報処理装置10は、学習済みであるか否かを使用者が判断することなく、自動的に判断して、第1の物体認識器18を学習させ得る。
また、第1の実施形態の情報処理装置10は、対象物が第1の物体認識器18により認識可能な学習済みの対象物に類似する場合に第1の物体認識器18を学習させ、学習済み対象物に類似しない場合に当該学習済み対象物を用いずに通信部14が新規に取得した画像に含まれる対象物のみを用いて当該対象物を認識可能な第2の物体認識器を構築する。最上層判定器20で分類できない対象物を用いた第1の物体認識器18の学習は、第1の物体認識器18全体の学習が必要であり、学習時間が長期化することがある。このような事象に対して上記の構成を有する情報処理装置10は、対象物を第1の物体認識器18の最上層判定器20で分類できるか否かを判別し、分類できない場合に新規な第2の物体認識器を構築し得る。したがって、情報処理装置10は、第1の物体認識器18全体に比べて、学習時間が短い第2の物体認識器を構築し得るので、未学習の対象物を特定可能な物体認識器の学習時間を短縮させ得る。
また、第1の実施形態の情報処理装置10は、最上層判定器20が分類できない対象物に対して、第1の物体認識器18により認識可能な学習済み対象物を用いずに通信部14が新規に取得した画像に含まれる対象物を用いて当該該対象物を認識可能な第2の物体認識器を構築する。したがって、情報処理装置10は、第1の物体認識器18全体に比べて、学習時間が短い第2の物体認識器を構築し得るので、未学習の対象物を特定可能な物体認識器の学習時間を短縮させ得る。
また、第1の実施形態の情報処理装置10は、第2の物体認識器により認識可能な対象物と、学習済み対象物とを用いて第1の物体認識器18を再学習することにより、第1の物体認識器18を更新する。このような構成により、情報処理装置10は、未学習の対象物に対して複数の第2の物体認識器の無制限な構築を防ぎ、第1の物体認識器18の学習が終わるまでの間、第2の物体認識器を併用する状況を提供し得る。
また、第1の実施形態の認識装置26は、画像に含まれる対象物に第1の物体認識器18による認識を行い、第1の物体認識器18により認識できない場合に第2の物体認識器を用いて当該対象物を認識する。このような構成により、認識装置26は、比較的早くに学習可能な第1の物体認識器18又は第2の物体認識器を用いて対象物を認識できるので、新規な対象物を認識できない期間を短縮し得る。
又は、第1の実施形態の認識装置26は、画像に含まれる対象物を第1の物体認識器18及び第2の物体認識器それぞれによる認識を行い、認識に際して算出される信頼度に基づいて、第1の物体認識器18及び第2の物体認識器のいずれかの認識を採用する。このような構成によっても、認識装置26は、比較的早くに学習可能な第1の物体認識器18又は第2の物体認識器を用いて対象物を認識できるので、新規な対象物を認識できない期間を短縮し得る。
また、第1の実施形態の認識装置26は、画像に含まれる対象物を、更新前の第1の物体認識器18及び第2の物体認識器を用いて認識し、更新後の第1の物体認識器18を取得後には更新後の第1の物体認識器のみを用いて認識する。このような構成により、認識装置26は、未学習の対象物別の複数の第2の物体認識器の構築を防ぎ、第1の物体認識器18の学習が終わるまでの間、第2の物体認識器を併用する状況を提供し得る。
次に、本開示の第2の実施形態に係る情報処理装置について説明する。第2の実施形態では、第1の物体認識モデルの構造が第1の実施形態と異なっている。以下に、第1の実施形態と異なる点を中心に第2の実施形態について説明する。なお、第1の実施形態と同じ構成を有する部位には同じ符号を付す。
第2の実施形態に係る認識器学習装置として機能する情報処理装置10を含む情報処理システム11は、第1の実施形態と同じく、少なくとも一つの端末装置12、ネットワーク13、及び情報処理装置10を含んで構成される。
第2の実施形態における情報処理装置10は、第1の実施形態と同じく、通信部(取得部)14及び制御部15を含んで構成され、更に入力部16及び記憶部17を含んで構成されてよい。第2の実施形態において、通信部14、制御部15、入力部16、及び記憶部17の構成は、第1の実施形態と同じである。第2の実施形態において、通信部14、入力部16、及び記憶部17の機能も、第1の実施形態と同じである。
第2の実施形態において、制御部15は、第1の実施形態と同じく、端末装置12から物体認識による認識結果を示す情報を取得する場合、認識結果である推定した物体の販売価格を記憶部17から読出してよい。制御部15は、推定した物体の販売価格を合計した請求金額を算出してよい。制御部15は、推定した物体を示す情報を付与した端末装置12に、請求金額に相当する金額情報を送信してよい。
第2の実施形態において、制御部15は、第1の実施形態と異なり、通信部14が取得する画像に含まれる対象物を、学習済み対象物を認識可能な第1の物体認識器で認識できない場合、第2の物体認識器を構築する。第1の物体認識器は、機械学習により構築される任意の認識モデルであって、第1の実施形態における第1の物体認識器18と異なっていてよい。言換えると、第2の実施形態における第1の物体認識器は、積層化した複数の段階的判定器を含む構成に限定されない。制御部15は、第1の物体認識器における学習済み対象物を用いずに、通信部14が取得する画像に含まれる対象物を用いて、当該対象物を認識可能な第2の物体認識器を構築する。
第2の実施形態において、制御部15は、第2の物体認識器の構築を開始させる操作入力を入力部16が検出する場合、通信部14が取得する画像に含まれる対象物を、第1の物体認識モデルで認識できないと判断して、第2の物体認識器を新規に構築してよい。
又は、第2の実施形態において、制御部15は、第1の物体認識モデルに、通信部14が取得する画像に含まれる対象物の物体認識を行わせ、物体認識の信頼度を算出してよい。制御部15は、算出した信頼度が閾値以下である場合、第1の物体認識モデルで認識できないと判断して、第2の物体認識器を新規に構築してよい。
第2の実施形態において、制御部15は、第1の実施形態と同じく、新規な第2の物体認識器を構築するパラメータを、記憶部17に格納してよい。制御部15は、第2の物体認識器を構築するパラメータを、通信部14を介して端末装置12に付与してよい。
第2の実施形態において、制御部15は、第1の実施形態と同じく、第2の物体認識器を構築するパラメータの付与後に、当該第2の物体認識器により認識可能な対象物と、第1の物体認識器により認識可能な学習済みの対象物とを用いて、第1の物体認識器を再学習させてよい。制御部15は、第1の物体認識器の再学習により第1の物体認識器を更新してよい。制御部15は、更新した第1の物体認識器を構築するパラメータを、記憶部に格納してよい。制御部15は、更新した第1の物体認識器を構築するパラメータを、通信部14を介して端末装置12に付与してよい。
第2の実施形態における端末装置12は、第1の実施形態と同じく、撮像部22、出力装置23、載置台24、支持柱25、及び認識装置26を含んで構成される。第2の実施形態において、撮像部22、出力装置23、載置台24、支持柱25、及び認識装置26の構成は、第1の実施形態と同じである。第2の実施形態において、撮像部22、出力装置23、載置台24、支持柱25、及び認識装置26の機能も、第1の実施形態と同じである。
次に、第2の実施形態において情報処理装置10の制御部15が実行する、第1の再学習処理について、図11のフローチャートを用いて説明する。第1の再学習処理は、情報処理装置10の入力部16又は認識装置26の入力部30が第1の再学習の実行指令の操作入力を検出する場合に開始する。
ステップS600において、制御部15は、第1の実施形態における第1の再学習処理のステップS100と同じ処理を行う。画像の取得後、プロセスはステップS601に進む。
ステップS601、S602では、制御部15は、第1の実施形態における第1の再学習処理のステップS103、S104と同じ処理を行う。ステップS602において、第1の物体認識器を構築するためのパラメータの端末装置12への付与後、第1の再学習処理は終了する。
次に、第2の実施形態において情報処理装置10の制御部15が第1の再学習処理の代わりに実行する、第2の再学習処理について、図12のフローチャートを用いて説明する。第2の再学習処理は、情報処理装置10の入力部16又は認識装置26の入力部30が第1の再学習の実行指令の操作入力を検出する場合に開始する。
ステップS700において、制御部15は、第1の実施形態における第1の再学習処理のステップS100と同じ処理を行う。画像の取得後、プロセスはステップS701に進む。
ステップS701では、制御部15は、ステップS700において取得した画像に含まれる対象物に対して、第1の物体認識器による物体認識を行う。更に、制御部15は、物体認識の信頼度が閾値以上であるか否かを判別する。閾値以上である場合、第2の再学習処理を終了する。閾値以上でない場合、プロセスはステップS702に進む。
ステップS702、S703では、制御部15は、第1の実施形態における第1の再学習処理のステップS103、S104と同じ処理を行う。ステップS703において、第1の物体認識器を構築するためのパラメータの端末装置12への付与後、第2の再学習処理は終了する。
以上のような構成の第2の実施形態の情報処理装置10は、通信部14が取得した画像に写る対象物を、学習済み対象物を認識可能な第1の物体認識器で認識できない場合、学習済み対象物を用いずに、通信部14が取得した画像に写る対象物を用いて当該対象物を認識可能な第2の物体認識器を構築する。未学習である対象物を用いた既存の第1の物体認識モデルの再学習の学習時間は、長期化することがある。このような事象に対して上記の構成を有する情報処理装置10は、第1の物体認識器で認識できない対象物に対して第2の物体認識器を構築し得る。したがって、情報処理装置10は、第1の物体認識器に比べて、学習時間が短い第2の物体認識器を構築し得るので、未学習の対象物を特定可能な物体認識器の学習時間を短縮させ得る。
また、第2の実施形態の情報処理装置10は、第2の物体認識器の構築を開始させる操作入力を検出する場合、第2の物体認識器を新規に構築する。このような構成により、情報処理装置10は、使用者が未学習であると把握する対象物に対して、第2の物体認識器を構築させ得る。
また、第2の実施形態の情報処理装置10は、通信部14が取得した画像に含まれる対象物の、第1の物体認識器による認識の信頼度を算出し、当該信頼度が閾値以下である場合に第2の物体認識器を新規に構築する。このような構成により、情報処理装置10は、通信部14が取得した画像に含まれる対象物が第1の物体認識器において学習済みであるか不明である場合であっても、学習済みであるか否かを判別し得る。したがって、情報処理装置10は、学習済みであるか否かを使用者が判断することなく、自動的に判断して、第2の物体認識器を構築し得る。
以上、情報処理装置10の実施形態を説明してきたが、本開示の実施形態としては、装置を実施するための方法又はプログラムの他、プログラムが記録された記憶媒体(一例として、光ディスク、光磁気ディスク、CD-ROM、CD-R、CD-RW、磁気テープ、ハードディスク、又はメモリカード等)としての実施態様をとることも可能である。
また、プログラムの実装形態としては、コンパイラによってコンパイルされるオブジェクトコード、インタプリタにより実行されるプログラムコード等のアプリケーションプログラムに限定されることはなく、オペレーティングシステムに組み込まれるプログラムモジュール等の形態であってもよい。さらに、プログラムは、制御基板上のCPUにおいてのみ全ての処理が実施されるように構成されてもされなくてもよい。プログラムは、必要に応じて基板に付加された拡張ボード又は拡張ユニットに実装された別の処理ユニットによってその一部又は全部が実施されるように構成されてもよい。
本開示に係る実施形態について説明する図は模式的なものである。図面上の寸法比率等は、現実のものとは必ずしも一致していない。
本開示に係る実施形態について、諸図面及び実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形又は改変を行うことが可能であることに注意されたい。従って、これらの変形又は改変は本開示の範囲に含まれることに留意されたい。例えば、各構成部等に含まれる機能等は論理的に矛盾しないように再配置可能であり、複数の構成部等を1つに組み合わせたり、或いは分割したりすることが可能である。
例えば、第1の実施形態及び第2の実施形態において、情報処理装置10は認識器学習装置として機能し、端末装置12は認識装置を含む構成である。しかし、情報処理装置10が認識器学習装置及び認識装置として機能してよい。このような構成においては、例えば、端末装置12は、撮像部22が生成する画像を情報処理装置10に送信し、情報処理装置10における第1の物体認識器による認識結果を受信してよい。又は、端末装置12は、撮像部22が生成する画像を情報処理装置10に送信し、情報処理装置10における第1の物体認識器又は第2の物体認識器による認識結果を受信してよい。
本開示に記載された構成要件の全て、及び/又は、開示された全ての方法、又は、処理の全てのステップについては、これらの特徴が相互に排他的である組合せを除き、任意の組合せで組み合わせることができる。また、本開示に記載された特徴の各々は、明示的に否定されない限り、同一の目的、同等の目的、または類似する目的のために働く代替の特徴に置換することができる。したがって、明示的に否定されない限り、開示された特徴の各々は、包括的な一連の同一、又は、均等となる特徴の一例にすぎない。
さらに、本開示に係る実施形態は、上述した実施形態のいずれの具体的構成にも制限されるものではない。本開示に係る実施形態は、本開示に記載された全ての新規な特徴、又は、それらの組合せ、あるいは記載された全ての新規な方法、又は、処理のステップ、又は、それらの組合せに拡張することができる。
本開示において「第1」及び「第2」等の記載は、当該構成を区別するための識別子である。本開示における「第1」及び「第2」等の記載で区別された構成は、当該構成における番号を交換することができる。例えば、第1の物体認識器は、第2の物体認識器と識別子である「第1」と「第2」とを交換することができる。識別子の交換は同時に行われる。識別子の交換後も当該構成は区別される。識別子は削除してよい。識別子を削除した構成は、符号で区別される。本開示における「第1」及び「第2」等の識別子の記載のみに基づいて、当該構成の順序の解釈、小さい番号の識別子が存在することの根拠に利用してはならない。
10 認識器学習装置
11 情報処理システム
12 端末装置
13 ネットワーク
14 通信部
15 制御部
16 入力部
17 メモリ
18 第1の物体認識器
19 段階的判定器
20 最上層判定器
21 下位層判定器
22 撮像部
23 出力装置
24 載置台
25 支持柱
26 認識装置
27 通信部部
28 記憶部
29 制御部
30 入力部

Claims (11)

  1. 最上層判定器と、前記最上層判定の下層に少なくとも2層以上の複数の下位層判定器を積層した下位層判定器群とを含み、前記最上層判定器は画像に写る対象物をいずれかのカテゴリに分類し、前記下位層判定器は前記対象物をより上位層の判定器が分類したカテゴリから更に下位のカテゴリに分類し、前記対象物を上位層から下位層に向かって分類する第1の物体認識器を学習させる制御部を備え、
    前記制御部は、前記下位層判定器によって、前記対象物をより上位層の判定器が分類した第1カテゴリから更に下位の第2カテゴリに分類できないとき、前記第1カテゴリへ前記第2カテゴリと同じ階層に新規な第3カテゴリを追加し、前記第3カテゴリを追加した当該下位層判定器を学習させることで、前記下位層判定器群の一部を学習させる
    認識器学習装置。
  2. 請求項1に記載の認識器学習装置において、
    前記複数の下位層判定器のうち、いずれか1つの下位層判定器は、前記第1カテゴリと対応づけられている
    認識器学習装置。
  3. 請求項1に記載の認識器学習装置において、
    前記制御部は、前記対象物を前記第1の物体認識器によって分類させることで、前記対象物を前記第2カテゴリに分類できない下位層判定器を特定する
    認識器学習装置。
  4. 請求項1から3のいずれか1項に記載の認識器学習装置において、
    前記制御部は、最上層判定器が対象物を分類できないとき、前記第1の物体認識器により認識可能な対象物を用いずに前記対象物を用いて該対象物を認識可能な第2の物体認識器を構築する
    認識器学習装置。
  5. 請求項4に記載の認識器学習装置において、
    前記制御部は、前記第2の物体認識器により認識可能な対象物と、前記第1の物体認識器へ既に学習されている対象物とを用いて前記第1の物体認識器を再学習することにより、前記第1の物体認識器を更新する
    認識器学習装置。
  6. 画像を取得する取得部と、
    前記画像に含まれる対象物に、請求項1に記載される認識器学習装置によって構築された前記第1の物体認識器による認識を行う制御部と、を備える
    認識装置。
  7. 画像を取得する取得部と、
    前記画像に含まれる対象物に、請求項4又は5に記載の認識器学習装置によって構築された前記第1の物体認識器による認識を行い、前記第1の物体認識器により認識できない場合に、前記認識器学習装置によって構築された前記第2の物体認識器を用いて該対象物を認識する制御部と、を備える
    認識装置。
  8. 画像を取得する取得部と、
    前記画像に含まれる対象物を、請求項4又は5に記載の認識器学習装置によって構築された前記第1の物体認識器及び前記第2の物体認識器それぞれによる認識を行い、認識に際して算出される信頼度に基づいて、前記第1の物体認識器及び前記第2の物体認識器のいずれかの認識を採用する制御部と、を備える
    認識装置。
  9. 画像を取得する取得部と、
    前記画像に含まれる対象物を、請求項5に記載の認識器学習装置によって構築された前記更新前の第1の物体認識器及び前記第2の物体認識器を用いて認識し、前記更新後の第1の物体認識器を取得後には前記更新後の第1の物体認識器のみを用いて認識する制御部と、を備える
    認識装置。
  10. 撮像により画像を生成する撮像部と、
    請求項6から9のいずれか1項に記載の認識装置に前記画像を送信し、前記認識装置から前記画像の認識結果を受信する通信部と、を備える
    電子機器
  11. 画像を取得する取得ステップと、
    最上層判定器と、前記最上層判定の下層に少なくとも2層以上の複数の下位層判定器を積層した下位層判定器群とを含み、前記最上層判定器は画像に写る対象物をいずれかのカテゴリに分類し、前記下位層判定器は前記対象物をより上位層の判定器が分類したカテゴリから更に下位のカテゴリに分類し、前記対象物を上位層から下位層に向かって分類する第1の物体認識器に前記画像の対象物を分類させ、より上位層の判定器が分類した第1カテゴリから更に下位第2カテゴリに分類できないとき、前記第1カテゴリへ前記第2カテゴリと同じ階層に新規な第3カテゴリを追加し、前記第3カテゴリを追加した当該下位層判定器を学習させる学習ステップと、を備える
    学習方法。
JP2022151744A 2021-06-09 2022-09-22 認識器学習装置、認識装置、電子機器、及び学習方法 Active JP7260706B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023062214A JP2023089086A (ja) 2021-06-09 2023-04-06 認識器学習装置、認識装置、電子機器、及び学習方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2021096737 2021-06-09
JP2021096737 2021-06-09
JP2021139422A JP7148689B1 (ja) 2021-06-09 2021-08-27 認識器学習装置、認識装置、電子機器、及び学習方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2021139422A Division JP7148689B1 (ja) 2021-06-09 2021-08-27 認識器学習装置、認識装置、電子機器、及び学習方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023062214A Division JP2023089086A (ja) 2021-06-09 2023-04-06 認識器学習装置、認識装置、電子機器、及び学習方法

Publications (2)

Publication Number Publication Date
JP2022188780A JP2022188780A (ja) 2022-12-21
JP7260706B2 true JP7260706B2 (ja) 2023-04-18

Family

ID=83507307

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2021139422A Active JP7148689B1 (ja) 2021-06-09 2021-08-27 認識器学習装置、認識装置、電子機器、及び学習方法
JP2022151744A Active JP7260706B2 (ja) 2021-06-09 2022-09-22 認識器学習装置、認識装置、電子機器、及び学習方法
JP2023062214A Pending JP2023089086A (ja) 2021-06-09 2023-04-06 認識器学習装置、認識装置、電子機器、及び学習方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2021139422A Active JP7148689B1 (ja) 2021-06-09 2021-08-27 認識器学習装置、認識装置、電子機器、及び学習方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023062214A Pending JP2023089086A (ja) 2021-06-09 2023-04-06 認識器学習装置、認識装置、電子機器、及び学習方法

Country Status (4)

Country Link
EP (1) EP4354389A1 (ja)
JP (3) JP7148689B1 (ja)
CN (1) CN117546210A (ja)
WO (1) WO2022260142A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013250809A (ja) 2012-05-31 2013-12-12 Casio Comput Co Ltd 多クラス識別器、方法、およびプログラム
WO2019131742A1 (ja) 2017-12-27 2019-07-04 株式会社 Preferred Networks 検査処理装置、検査処理方法、およびプログラム
JP2019159898A (ja) 2018-03-14 2019-09-19 株式会社日立製作所 計算機及びテンプレート管理方法
CN111709966A (zh) 2020-06-23 2020-09-25 上海鹰瞳医疗科技有限公司 眼底图像分割模型训练方法及设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2779119B2 (ja) * 1992-10-06 1998-07-23 松下電器産業株式会社 学習認識装置
JP5721233B2 (ja) 2009-12-28 2015-05-20 サイバーアイ・エンタテインメント株式会社 画像認識システム
JP2020021378A (ja) * 2018-08-02 2020-02-06 パナソニックIpマネジメント株式会社 物品判別システム、買物支援システム、買物支援方法、物品判別方法、及びプログラム
JP6725194B2 (ja) * 2018-09-28 2020-07-15 三菱電機インフォメーションシステムズ株式会社 学習済みモデルを生成する方法、データを分類する方法、コンピュータおよびプログラム
JP2021061804A (ja) * 2019-10-16 2021-04-22 大日本印刷株式会社 コンピュータプログラム、細胞計数方法及び細胞計数装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013250809A (ja) 2012-05-31 2013-12-12 Casio Comput Co Ltd 多クラス識別器、方法、およびプログラム
WO2019131742A1 (ja) 2017-12-27 2019-07-04 株式会社 Preferred Networks 検査処理装置、検査処理方法、およびプログラム
JP2019159898A (ja) 2018-03-14 2019-09-19 株式会社日立製作所 計算機及びテンプレート管理方法
CN111709966A (zh) 2020-06-23 2020-09-25 上海鹰瞳医疗科技有限公司 眼底图像分割模型训练方法及设备

Also Published As

Publication number Publication date
JP7148689B1 (ja) 2022-10-05
JP2022188725A (ja) 2022-12-21
EP4354389A1 (en) 2024-04-17
JP2022188780A (ja) 2022-12-21
JP2023089086A (ja) 2023-06-27
WO2022260142A1 (ja) 2022-12-15
CN117546210A (zh) 2024-02-09

Similar Documents

Publication Publication Date Title
US11087167B2 (en) First-person camera based visual context aware system
CN108460356B (zh) 一种基于监控系统的人脸图像自动处理系统
CN110168530B (zh) 电子设备和操作该电子设备的方法
JP4505733B2 (ja) テクストンを用いる対象物認識方法及び装置
CN105512685B (zh) 物体识别方法和装置
KR20180051367A (ko) 디바이스가 이미지를 보정하는 방법 및 그 디바이스
KR102544781B1 (ko) 우선 순위에 기반하여 상품과 관련된 정보를 제공하는 방법 및 그 전자 장치
JP6729428B2 (ja) 画像処理システム、光学センサ、及び学習装置
CN111079648A (zh) 数据集清洗方法、装置和电子系统
CN110895934A (zh) 家电控制方法及装置
CN113052142A (zh) 一种基于多模态数据的静默活体检测方法
KR20190119212A (ko) 인공신경망을 이용한 가상 피팅 시스템, 이를 위한 방법 및 이 방법을 수행하는 프로그램이 기록된 컴퓨터 판독 가능한 기록매체
KR20230069892A (ko) 이상 온도를 나타내는 객체를 식별하는 방법 및 장치
JP7260706B2 (ja) 認識器学習装置、認識装置、電子機器、及び学習方法
KR102110375B1 (ko) 학습 전이 기반의 비디오 감시 방법
CN111798019B (zh) 意图预测方法、装置、存储介质及电子设备
CN111797874B (zh) 行为预测方法、装置、存储介质及电子设备
KR101961462B1 (ko) 객체 인식 방법 및 장치
JP7262650B2 (ja) 認識装置、端末装置、認識器構築装置、認識器修正装置、構築方法、及び修正方法
CN115424346A (zh) 一种人体坐姿检测方法、装置、计算机设备及系统
KR102299393B1 (ko) 제품과 사용자의 매칭을 위한 전자 장치 및 이를 포함하는 매칭 시스템
CN111796992B (zh) 行为偏好确定方法、装置、存储介质及电子设备
US11343564B2 (en) Automated learning platform of a content provider and method thereof
JP4158544B2 (ja) 画像探索装置
JP2023183058A (ja) 画像処理装置、画像処理方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221219

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20221219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230307

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230406

R150 Certificate of patent or registration of utility model

Ref document number: 7260706

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150