JP7119348B2 - 情報処理システム、情報処理方法及びプログラム - Google Patents

情報処理システム、情報処理方法及びプログラム Download PDF

Info

Publication number
JP7119348B2
JP7119348B2 JP2017221870A JP2017221870A JP7119348B2 JP 7119348 B2 JP7119348 B2 JP 7119348B2 JP 2017221870 A JP2017221870 A JP 2017221870A JP 2017221870 A JP2017221870 A JP 2017221870A JP 7119348 B2 JP7119348 B2 JP 7119348B2
Authority
JP
Japan
Prior art keywords
shape
feature
information processing
processing system
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017221870A
Other languages
English (en)
Other versions
JP2019095827A (ja
Inventor
静生 坂本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2017221870A priority Critical patent/JP7119348B2/ja
Publication of JP2019095827A publication Critical patent/JP2019095827A/ja
Application granted granted Critical
Publication of JP7119348B2 publication Critical patent/JP7119348B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本発明は、情報処理システム、情報処理方法及びプログラムに関する。
特許文献1には、ニューラルネットワークを用いた画像認識方法が開示されている。当該画像認識方法では、入力画像を原画画像との相関を強く持つように圧縮し、圧縮された画像データを入力することでニューラルネットワークの学習を行わせる手法が採用されている。
特開平5-303626号公報
特許文献1に記載されているようなニューラルネットワークの学習方法において、入力される画像が対象物の分類対象とする領域の形状以外の情報を多く含んでいると、特徴抽出精度が低下する場合がある。
本発明は、上述の課題に鑑みてなされたものであって、より精度よく対象物の形状の特徴抽出を行うことができる情報処理システム、情報処理方法及びプログラムを提供することを目的とする。
本発明の一観点によれば、画像中の対象物のうちの着目領域の形状を含む形状データを取得する取得部と、前記形状データに基づく入力データを用いて、前記着目領域の形状の分類を示す特徴を抽出する特徴抽出部と、前記特徴抽出部により抽出された前記対象物の形状の特徴に基づいて、複数の形状をそれぞれ示す複数の画像同士を、形状が類似する当該画像を形状が類似しない当該画像同士よりも近い位置に配置した特徴マップを生成するマップ生成部とを備え、前記特徴マップの各点には、形状を示す特徴情報が対応づけられており、前記特徴マップの位置を選択することで特徴を入力し、形状を示す画像が点に対応付けられていない箇所が選択された場合、当該特徴を有する形状が選択されたものとして扱う、ことを特徴とする情報処理システムが提供される。
本発明の他の観点によれば、画像中の対象物のうちの着目領域の形状を含む形状データを取得するステップと、前記形状データに基づく入力データを用いて、前記着目領域の形状の分類を示す特徴を抽出するステップと、抽出された前記対象物の形状の特徴に基づいて、複数の形状をそれぞれ示す複数の画像同士を、形状が類似する当該画像を形状が類似しない当該画像同士よりも近い位置に配置した特徴マップを生成するステップとを備え、前記特徴マップの各点には、形状を示す特徴情報が対応づけられており、前記特徴マップの位置を選択することで特徴を入力し、形状を示す画像が点に対応付けられていない箇所が選択された場合、当該特徴を有する形状が選択されたものとして扱う、ことを特徴とする情報処理方法が提供される。
本発明の更に他の観点によれば、コンピュータに、画像中の対象物のうちの着目領域の形状を含む形状データを取得するステップと、前記形状データに基づく入力データを用いて、前記着目領域の形状の分類を示す特徴を抽出するステップと、抽出された前記対象物の形状の特徴に基づいて、複数の形状をそれぞれ示す複数の画像同士を、形状が類似する当該画像を形状が類似しない当該画像同士よりも近い位置に配置した特徴マップを生成するステップとを実行させ、前記特徴マップの各点には、形状を示す特徴情報が対応づけられており、前記特徴マップの位置を選択することで特徴を入力し、形状を示す画像が点に対応付けられていない箇所が選択された場合、当該特徴を有する形状が選択されたものとして扱う、ことを特徴とするプログラムが提供される。
本発明によれば、より精度よく対象物の形状の特徴抽出を行うことができる情報処理システム、情報処理方法及びプログラムを提供することができる。
第1実施形態に係る情報処理システムのハードウェア構成例を示すブロック図である。 第1実施形態に係る情報処理システムの機能ブロック図である。 第1実施形態に係る情報処理システムにより行われる処理の概略を示すフローチャートである。 第1実施形態に係る形状データの生成を示す模式図である。 第1実施形態に係る特徴抽出部の構成を示す模式図である。 第1実施形態に係る情報処理システムにより抽出された特徴パラメータを用いて生成された特徴マップの表示例を示す模式図である。 第1実施形態に係る情報処理システムと、特徴マップを用いたGUIを備える検索システムとを含む概略ブロック図である。 第2実施形態に係る情報処理システムの機能ブロック図である。
以下、図面を参照して、本発明の例示的な実施形態を説明する。図面において同様の要素又は対応する要素には同一の符号を付し、その説明を省略又は簡略化することがある。
[第1実施形態]
以下、本発明の第1実施形態である情報処理システム10について説明する。本実施形態の情報処理システム10は、画像の中に含まれる物体のうちの分類対象として着目した箇所の形状の特徴を示すパラメータを抽出するための画像処理を行うシステムである。本実施形態では、主たる例として自転車の一部の形状を分類するための特徴抽出処理について具体的に説明するが、本実施形態の情報処理システム10の適用対象はこれに限られるものではない。
なお、本明細書において、「画像」の文言は、2次元の静止画像のみならず、複数の静止画像により構成される動画像、奥行き方向の情報を含む3次元画像を含み得る。また、「画像」の文言は、ディスプレイ等に表示された画像自体のみならず、静止画像データ、動画像データ、3次元モデルデータ等の画像を構成するためのデータを指す場合がある。
また、本明細書において「自転車」とは、ペダル又はハンドクランクを用い、主に乗員の人力で駆動操縦され、かつ、駆動車輪をもち、地上を走行する車両の総称である。したがって、自転車に含まれる車輪の個数は特に限定されず、「自転車」は、2輪自転車だけではなく、3輪自転車、補助輪付き自転車等も含み得る。また、補助的な動力を有する電動アシスト自転車も「自転車」に含まれる。
図1は、本実施形態に係る情報処理システム10のハードウェア構成例を示すブロック図である。情報処理システム10は、例えば、サーバ、デスクトップPC(Personal Computer)、ラップトップPC、タブレットPC等のコンピュータであり得る。また、情報処理システム10は、スマートフォン、携帯電話等の情報通信端末であってもよい。
情報処理システム10は、演算、制御及び記憶を行うコンピュータとしての機能を実現するため、CPU(Central Processing Unit)101、RAM(Random Access Memory)102、ROM(Read Only Memory)103及びHDD(Hard Disk Drive)104を備える。また、情報処理システム10は、通信I/F(インターフェース)105、表示装置106及び入力装置107を備える。CPU101、RAM102、ROM103、HDD104、通信I/F105、表示装置106及び入力装置107は、バス108を介して相互に接続される。なお、表示装置106及び入力装置107は、これらの装置を駆動するための不図示の駆動装置を介してバス108に接続されてもよい。
図1では、情報処理システム10を構成する各部が一体の装置として図示されているが、これらの機能の一部は外付け装置により提供されるものであってもよい。例えば、表示装置106及び入力装置107は、CPU101等を含むコンピュータの機能を構成する部分とは別の外付け装置であってもよい。
CPU101は、ROM103、HDD104等に記憶されたプログラムに従って所定の動作を行うとともに、情報処理システム10の各部を制御する機能をも有する。RAM102は、揮発性記憶媒体から構成され、CPU101の動作に必要な一時的なメモリ領域を提供する。ROM103は、不揮発性記憶媒体から構成され、情報処理システム10の動作に用いられるプログラム等の必要な情報を記憶する。HDD104は、不揮発性記憶媒体から構成され、画像データ、プログラム等の記憶を行う記憶装置である。
通信I/F105は、Wi-Fi(登録商標)、4G等の規格に基づく通信インターフェースであり、他の装置との通信を行うためのモジュールである。表示装置106は、液晶ディスプレイ、OLED(Organic Light Emitting Diode)ディスプレイ等であって、画像、文字、インターフェース等の表示に用いられる。入力装置107は、キーボード、ポインティングデバイス等であって、ユーザが情報処理システム10を操作するために用いられる。ポインティングデバイスの例としては、マウス、トラックボール、タッチパネル等が挙げられる。表示装置106及び入力装置107は、タッチパネルとして一体に形成されていてもよい。
なお、図1に示されているハードウェア構成は例示であり、これら以外の装置が追加されていてもよく、一部の装置が設けられていなくてもよい。また、一部の装置が同様の機能を有する別の装置に置換されていてもよい。更に、本実施形態の一部の機能がネットワークを介して他の装置により提供されてもよく、本実施形態の機能が複数の装置に分散されて実現されるものであってもよい。例えば、HDD104は、半導体メモリを用いたSSD(Solid State Drive)に置換されていてもよく、クラウドストレージに置換されていてもよい。
図2は、本実施形態に係る情報処理システム10の機能ブロック図である。情報処理システム10は、画像取得部110、形状データ取得部120、特徴抽出部130、マップ生成部140及び記憶部150を有する。
CPU101は、ROM103等に記憶されたプログラムをRAM102にロードして実行することにより、画像取得部110、形状データ取得部120、特徴抽出部130及びマップ生成部140の機能を実現する。これらの各部で行われる処理については後述する。CPU101は、HDD104を制御することにより記憶部150の機能を実現する。記憶部150は、画像データ、形状データ、学習済みデータ、特徴パラメータ、特徴マップ等のデータを記憶するデータベースとして機能する。
図3乃至図6を参照して、本実施形態における処理の概要について説明する。図3は、本実施形態に係る情報処理システム10により行われる処理の概略を示すフローチャートである。図4は、本実施形態に係る形状データの生成を示す模式図である。図5は、本実施形態に係る特徴抽出部130の構成を示す模式図である。図6は、本実施形態に係る情報処理システム10により抽出された特徴パラメータを用いて生成された特徴マップの表示例を示す模式図である。図3のフローチャートの処理順に沿って、適宜図4乃至図6を参照しつつ、本実施形態における処理を説明する。
情報処理システム10による処理が開始すると、ステップS101からステップS104のループにおいて特徴パラメータの抽出が行われる。このループでは、特徴を抽出しようとする対象物が含まれる複数の画像のそれぞれに対し、特徴パラメータの抽出が行われる。
ステップS101において、画像取得部110は、特徴を抽出しようとする対象物が含まれる画像をデータサーバ等の他の装置から取得し、記憶部150に記憶させる。なお、当該画像は、情報処理システム10内の記憶部150にあらかじめ記憶されていてもよく、その場合ステップS101は省略可能である。また、当該画像は、縦方向及び横方向に並ぶ多数のピクセルにより構成される静止画像のデジタルデータである。
ステップS102において、形状データ取得部120は、記憶部150から画像を取得し、当該画像中の対象物のうちの分類対象として着目した着目領域の形状を示す形状データを取得する。なお、形状データ取得部120は、単に取得部と呼ばれることもある。形状データの取得について、図4を参照してより詳細に説明する。
図4には、ステップS101において取得された画像200が図示されている。画像200には、特徴を抽出しようとする対象物である自転車210が含まれている。自転車210の一部分であるフレーム221は、トップチューブ222、ダウンチューブ223及びシートチューブ224が大きな三角形をなしているという特徴的な形状を有している。そこで、フレーム221の形状を分類対象とするため、形状データ取得部120は、自転車210の中のフレーム221のうちのトップチューブ222、ダウンチューブ223及びシートチューブ224を含む領域を検出し、着目領域220として設定する。
その後、形状データ取得部120は、画像200の一部を切り出すことにより、着目領域220内のフレーム221の形状を示す形状データとして、フレーム231を含む着目領域画像230を取得する。このように、形状データ取得部120は、分類対象として着目した着目領域220内の物体の形状以外の情報のうちの少なくとも一部を除外して着目領域画像230を取得する。これにより、後述の特徴抽出の処理の精度を向上させることができる。着目領域220の設定は、手動又は機械学習によりあらかじめ設定された座標によるものであってもよく、画像認識技術により画像200の中の対象物の位置を検出して自動的に設定されるものであってもよい。手動又は自動による着目領域220の座標の設定方法の一例として以下の手法が挙げられる。ユーザが、キーボード等の入力装置107から直接座標の値を入力してもよい。また、直接座標そのものを入力するのではなく、ユーザが検出しようとする形状の特徴、検出目的等を文字、プルダウンメニュー等により入力し、その入力に基づいて自動的に着目領域220が設定されてもよい。また、過去に行われた処理の履歴に基づいて自動的に着目領域220が選択されてもよい。
ここで、形状データ取得部120は、グレースケール又は二値に変換する処理を行うことにより、フレーム221の色に関する情報を除去して着目領域画像230を取得することが望ましい。また、この処理はエッジ抽出等、色情報の除去とともに対象物の外形を得るものであってもよい。図4では、フレーム221の部分を二値化することにより、黒色に変換されたフレーム231を含む着目領域画像230を取得した例が示されている。フレーム231の色はフレーム231の特徴の1つではあるが、フレーム231との形状とは直接関係しない余分な情報であり、特徴抽出の精度劣化要因となることがある。そのため、色に関する情報を除去することにより後述の特徴抽出の処理の精度を向上させることができる。
また、形状データ取得部120は、特徴抽出対象として着目するフレーム221以外の物体を着目領域画像230から除去する処理を更に行うことが望ましい。図4では、着目領域220内には、ハンドル、タイヤ、ペダル等の物体の一部が含まれているが、取得された着目領域画像230からはフレーム231以外の物体が除去されている。着目領域画像230にフレーム231との形状とは直接関係しない物体が含まれていると、特徴抽出の精度劣化要因となることがある。そのため、フレーム231以外の物体を除去することにより後述の特徴抽出の処理の精度を向上させることができる。
なお、画像200を取得し、画像200から着目領域画像230を切り出して形状データを取得する作業は、上述の説明のようにコンピュータにより自動的に行われるものであってもよいが、ユーザの操作に基づいて行われるものであってもよい。例えば、ユーザが入力装置107であるポインティングデバイス等を用いて着目領域220の座標を入力することにより着目領域220が設定されてもよい。あるいは、画像処理ソフトウェアを用いて、ユーザがあらかじめ画像200から着目領域画像230を切り出して記憶部150に記憶させておいてもよい。この場合、形状データ取得部120は、記憶部150に記憶されている着目領域画像230を読み出して、着目領域画像230を取得する。
図3のステップS103において、特徴抽出部130は、形状データ取得部120で取得された形状データに基づく入力データを用いた機械学習を行う。この機械学習について、図5を参照してより詳細に説明する。
特徴抽出部130は、オートエンコーダ300を含む。オートエンコーダ300は、入力データと出力データとが同一のデータとなることを特徴とするニューラルネットワークであり、複数のニューロン301が入力層、中間層及び出力層の少なくとも3層をなして配された構成をなしている。
着目領域画像230を構成する複数のピクセル232の値は、入力層の複数のニューロン301に入力される。ピクセル232の値が2値化されている場合には、入力値は、例えば、黒色を示す値又は白色を示す値である。入力層の複数のニューロン301は中間層の複数のニューロン301と結合されており、中間層の複数のニューロン301は出力層の複数のニューロン301と結合されている。出力層の複数のニューロン301から出力される値が入力層の複数のニューロン301に入力された複数のピクセル232の値と一致するように各ニューロン301のパラメータを調整することにより、オートエンコーダ300の機械学習が行われる。
図3のステップS104において、特徴抽出部130は、機械学習により得られた中間層のニューロン301のパラメータを特徴パラメータとして抽出し、記憶部150に記憶させる。中間層のニューロン301は、入力されたフレーム231の形状の特徴を示す。したがって、中間層のニューロン301のパラメータは、着目領域画像230に含まれる物体の形状の特徴を示す特徴パラメータとして用いられ得る。
なお、入力層と出力層のニューロン301の個数(次元数)は同数とする。また、中間層のニューロン301の個数(次元数)は、入力層のニューロン301の個数及び出力層のニューロン301の個数よりも少なくなるように構成されることが望ましい。この構成により、中間層において入力データの次元を削減することができ、より少ないパラメータ数で特徴の抽出を行うことができる。
以上のように、本実施形態では、画像200を着目領域の形状を示す形状データに変形してから特徴抽出部130に入力することで、入力データから着目した領域の形状とは関連性が小さい情報を少なくすることができる。これにより、機械学習での特徴抽出時に色、模様、着目領域220外の部分の形状等の要素による外乱を低減することができ、より精度よく対象物の形状の特徴抽出を行うことができる。また、入力データのデータ量を少なくすることができるため、処理負荷を小さくすることができる。
なお、図5では、着目領域画像230のピクセル232の値をオートエンコーダ300にそのまま入力しているが、この処理は、CNN(Convolutional Neural Network)に置き換えられてもよい。この場合、オートエンコーダ300のニューロン301の構成は、CNNに対応可能なように畳み込み層、プーリング層等を含む構成に変形され得る。
ステップS101からステップS104までのループを繰り返し、特徴を抽出しようとする対象物が含まれる複数の画像のすべてに対して特徴パラメータの抽出が完了すると、処理はステップS105に移行する。
図3のステップS105において、マップ生成部140は、特徴抽出部130により抽出された複数の特徴パラメータと特徴パラメータに対応するフレームの画像とを用いて特徴マップの生成を行い、記憶部150に記憶させる。特徴マップとは、情報処理システム10により抽出された対象物の形状の特徴に基づいて対象物の形状の分類を表示した画像である。特徴マップを参照することにより、ユーザは、対象物の形状の分類を視覚的に把握することができる。図6及び図7を参照して特徴マップとこれを用いたGUI(Graphical User Interface)への適用例を説明する。
図6に示されているように、特徴マップには、自転車の一部であるフレームの形状を示す多数の画像が2次元平面上に配置されている。図6において、複数のフレームの画像は、それぞれフレームの特徴に応じた位置に配置されている。この位置は、各フレームの形状の特徴パラメータに応じて定められる。図6の左側には、ステップスルー型と呼ばれる、フレームが斜めになっており乗り降りが容易なフレームが配されている。左上に近いほどフレームの形状が直線的であり、左下に近いほどフレームの形状が曲線的である。右側にはダイヤモンド型と呼ばれる、三角形の形状を有するフレームが配されており、左上から右下に向かうにつれて、トップチューブの形状が斜めから水平に変化するように配置されている。このように、形状が類似したフレーム同士は近い位置に、形状の違いが大きいフレーム同士は離れた位置に配置される。
この特徴マップは、例えば、自転車の検索システムのためのGUIとして用いられ得る。図7は、本実施形態に係る情報処理システム10と、特徴マップを用いたGUIを備える検索システム40とを含む概略ブロック図である。検索システム40は、情報処理システム10の記憶部150に記憶された特徴マップを取得する。特徴マップは、検索システム40のGUIの操作部に表示される。このGUIでは、ユーザは、検索しようとする自転車に近いフレームを特徴マップの中から探し、類似したフレームの近傍の位置をポインティングデバイスで選択することにより、フレームの特徴を入力することができる。なお、図7では情報処理システム10と検索システム40とが別個のブロックとして示されているが、検索システム40が情報処理システム10の一機能として設けられていてもよく、情報処理システム10が検索システム40の一機能として設けられていてもよい。
一例として、ユーザが、図4の自転車210に近いフレームを持つ自転車を検索したいと考えた場合を想定する。図4の自転車210のフレーム221はトップチューブ222、ダウンチューブ223及びシートチューブ224が大きな三角形をなしており、上辺がほぼ水平であるという特徴を有している。ユーザは、図6の特徴マップを参照してこの中から自転車210のフレームに近いフレームを探す。右下付近のフレームが上述の特徴に近いため、ユーザは、図6の特徴マップの右下付近の位置をクリックする。2次元マップの各点には、自転車のフレームの形状を示す特徴情報が対応付けられている。そのため、ユーザは、特徴マップの位置を選択するだけで特徴を入力することができ、検索システム40での内部処理に用いられる特徴情報自体を直接入力する必要はない。なお、類似するフレームが特徴マップ上に無い場合には、フレームが無い場所を選択することもできる。例えば、図6の下側中央付近を選択した場合には、左下のフレームと右下のフレームの中間的な形状を選択したものとして扱われる。
画像検索の技術において、文字、文章、数字等により画像の特徴を入力する手法が一般的である。この技術では、検索に先立ってユーザが自転車の特徴を文字、文章、数字等により表現する必要があるが、自転車のフレーム等の特徴部の形状を文字、文章等で表現することは容易ではない。フレームの形状には、ダイヤモンド型、ステップスルー型、ミキスト型等の名称があるが、これらの名称はあまり一般的なものではなく、ユーザがこれらを熟知しているとは限らない。これに対し、本実施形態の特徴マップを用いたGUIであれば、似た形状のフレームの位置を選択するだけでよく、直感的な入力が可能であるため、ユーザは、容易に自転車の特徴を入力することができ、容易に検索を行うことができる。
なお、ステップS105の処理及びこれを用いたGUIは、特徴パラメータの具体的な利用方法の一例であり、特徴パラメータは、これ以外の処理に適用されてもよい。
上述の処理では、画像中の対象物のうちの形状データを取得する部分として、自転車210のフレーム221が選択されているが、自転車210のフレーム221以外の部分であってもよい。例えば、チェーンカバー、ペダル、タイヤ、サドル、ハンドル、かご、発電機、ライト等の部分であってもよい。このように、分類対象として着目した領域がフレーム221以外の部分である場合にも同様の処理が可能である。
また、上述の処理において、対象物は、自転車以外の物体であってもよい。例えば対象物が二輪自動車である場合には、取得される形状データは、ハンドル、燃料タンク、マフラー等の形状を示す画像データであり得る。これにより、情報処理システム10は、二輪自動車の形状の特徴を示す特徴パラメータの抽出を行うことができる。二輪自動車の場合も自転車の場合と同様にして特徴マップの生成を行うことができ、検索システム40のGUIに適用することができる。
また、本明細書において、「二輪自動車」とは、2個の車輪を備える2軸自動車を指す。ただし、「二輪自動車」は、側車付きのものを含むものとする。
また、上述の処理において、画像取得部110によって取得される画像データは、静止画像データに限られず、動画像データであってもよい。一例として、動画像に走っている人間が含まれているものとする。この場合、特徴を抽出しようとする対象物は人間である。形状データ取得部120は、人間の動きを示す動画像、すなわち、時間に応じて位置及び形状が変化する人間の動画像をシルエットに変換して形状データとして取得する。このとき、人間以外の部分、例えば、背景は除外される。これにより、情報処理システム10は、動画像に含まれる人間の動きの分類を示す特徴パラメータの抽出を行うことができる。この例による情報処理システム10は、具体的には走っている人間の体型及び動きの特徴を抽出することができ、ジェスチャーに基づく人物の照合、走り方の特徴分析の研究等の用途への応用が可能である。なお、画像の例の場合と同様の理由により、本例においてもシルエットへの変換時に色情報を削除することが望ましい。
また、上述の処理において、画像取得部110によって取得されるデータは、静止画像データ、動画像データ等の画像データに限られず、3次元モデルデータであってもよい。3次元モデルデータの例としては、3次元CAD(Computer-Aided Design)データ、3次元測定装置等により得られた3次元形状測定データ等であり得る。この場合、特徴を抽出しようとする対象物は3次元物体である。形状データ取得部120は、対象物の3次元モデルデータをボクセル等のボリュームデータに変換して形状データとして取得する。このとき、3次元モデルデータのうち着目する部分以外のデータは除外される。これにより、情報処理システム10は、3次元の対象物の形状の分類を示す特徴パラメータの抽出を行うことができる。この例による情報処理システム10は、例えば、工業製品の形状解析、顔認証等、3次元形状の解析を行うことがある技術への応用が可能である。なお、2次元画像の例の場合と同様の理由により、本例においてもボリュームデータへの変換時に色情報を削除することが望ましい。
上述の実施形態において説明したシステムは以下の第2実施形態のようにも構成することができる。
[第2実施形態]
図8は、第2実施形態に係る情報処理システム50の機能ブロック図である。情報処理システム50は、取得部510及び特徴抽出部520を備える。取得部510は、画像中の対象物のうちの着目領域の形状を含む形状データを取得する。特徴抽出部520は、前記形状データに基づく入力データを用いて、前記着目領域の形状の分類を示す特徴を抽出する。
本実施形態によれば、より精度よく対象物の形状の特徴抽出を行うことができる情報処理システム50を提供することができる。
[変形実施形態]
本発明は、上述の実施形態に限定されることなく、本発明の趣旨を逸脱しない範囲において適宜変更可能である。
上述の実施形態において、形状データの例として、着目領域画像230等の画像を挙げたが、これに限定されるものではない。例えば形状データは、フレーム231の頂点の座標など、特徴となる形状を特定するための位置を示す数値データであってもよい。
また上述の実施形態において、形状データの取得の例として、着目領域画像230を画像200から切り出す処理を行っているが、他の処理であってもよい。例えば着目領域220以外の領域のピクセルの値をランダムな値又は一様な値に変換することで、着目領域220以外の領域から特徴が抽出されないようにする処理を行っても同様の効果が得られる。
上述の特徴マップの生成において、特徴パラメータに基づいて特徴マップを生成する際に、特徴マップを人間が理解しやすいように調整する処理を行ってもよい。機械学習により自動的に抽出された特徴は、人間にとって理解しやすく整理されたものであるとは限らない。一方、特徴マップをGUI等の人間が直接利用する用途に用いる場合、抽出された特徴は人間が理解しやすいものであることが望ましい。そのため、特徴マップを人間が理解しやすいように調整することが有効である場合がある。
図6に示されている特徴マップは、視認性と特徴の網羅性のバランスが良い2次元平面状となっているが、特徴マップの次元数はこれに限定されない。特徴マップは、縦又は横に特徴画像が並ぶ1次元状であってもよく、奥行きを表現した3次元状であってもよい。1次元状であれば、特徴マップを視認性が良く直感的にわかりやすいものにすることができる。3次元状であれば、多数の特徴を表現できるため、特徴マップを特徴の網羅性が良いものにすることができる。その他にも、2次元平面状の特徴マップを奥行き方向に複数枚重ねることで2.5次元状としたものであってもよい。
上述の実施形態の機能を実現するように該実施形態の構成を動作させるプログラムを記憶媒体に記録させ、記憶媒体に記録されたプログラムをコードとして読み出し、コンピュータにおいて実行する処理方法も各実施形態の範疇に含まれる。すなわち、コンピュータ読取可能な記憶媒体も各実施形態の範囲に含まれる。また、上述のプログラムが記録された記憶媒体だけでなく、そのプログラム自体も各実施形態に含まれる。また、上述の実施形態に含まれる1又は2以上の構成要素は、各構成要素の機能を実現するように構成されたASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)等の回路であってもよい。
該記憶媒体としては例えばフロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD(Compact Disk)-ROM、磁気テープ、不揮発性メモリカード、ROMを用いることができる。また該記憶媒体に記録されたプログラム単体で処理を実行しているものに限らず、他のソフトウェア、拡張ボードの機能と共同して、OS上で動作して処理を実行するものも各実施形態の範疇に含まれる。
上述の各実施形態の機能により実現されるサービスは、SaaS(Software as a Service)の形態でユーザに対して提供することもできる。
なお、上述の実施形態は、いずれも本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
上述の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
画像中の対象物のうちの着目領域の形状を含む形状データを取得する取得部と、
前記形状データに基づく入力データを用いて、前記着目領域の形状の分類を示す特徴を抽出する特徴抽出部と
を備えることを特徴とする情報処理システム。
(付記2)
前記特徴抽出部は、出力データが前記入力データと同一となるように機械学習を行うオートエンコーダを含む
ことを特徴とする付記1に記載の情報処理システム。
(付記3)
前記オートエンコーダは、入力層と、中間層と、出力層とを含み、
機械学習により得られた前記中間層のパラメータが、前記着目領域の特徴として抽出される
ことを特徴とする付記2に記載の情報処理システム。
(付記4)
前記中間層の次元数は、前記入力層の次元数及び前記出力層の次元数よりも小さい
ことを特徴とする付記3に記載の情報処理システム。
(付記5)
前記取得部は、前記着目領域の形状以外の情報のうちの少なくとも一部を除外するように前記形状データを取得する
ことを特徴とする付記1乃至4のいずれか1項に記載の情報処理システム。
(付記6)
前記形状データは、前記対象物の一部分の形状を示す
ことを特徴とする付記1乃至5のいずれか1項に記載の情報処理システム。
(付記7)
前記形状データは、前記対象物の色に関する情報を含まない
ことを特徴とする付記1乃至6のいずれか1項に記載の情報処理システム。
(付記8)
前記形状データは、静止画像データ、動画像データ又は3次元モデルデータである
ことを特徴とする付記1乃至7のいずれか1項に記載の情報処理システム。
(付記9)
前記対象物は自転車であり、前記形状データは、前記自転車のフレーム、チェーンカバー、ペダル、タイヤ、サドル、ハンドル、かご、発電機又はライトの形状を示す画像データである
ことを特徴とする付記1乃至8のいずれか1項に記載の情報処理システム。
(付記10)
前記対象物は二輪自動車であり、前記形状データは、前記二輪自動車のハンドル、燃料タンク又はマフラーの形状を示す画像データである
ことを特徴とする付記1乃至8のいずれか1項に記載の情報処理システム。
(付記11)
前記対象物は人間であり、前記形状データは、前記人間のシルエットの動きを示す動画像データである
ことを特徴とする付記1乃至8のいずれか1項に記載の情報処理システム。
(付記12)
前記対象物は3次元物体であり、前記形状データは、前記3次元物体のボリュームデータである
ことを特徴とする付記1乃至8のいずれか1項に記載の情報処理システム。
(付記13)
前記特徴抽出部により抽出された前記対象物の形状の特徴に基づいて、前記対象物の形状の分類を表示した特徴マップを生成するマップ生成部を更に備える
ことを特徴とする付記1乃至12のいずれか1項に記載の情報処理システム。
(付記14)
付記13に記載の情報処理システムにより生成された特徴マップを用いたGUI(Graphical User Interface)を備える検索システム。
(付記15)
画像中の対象物のうちの着目領域の形状を含む形状データを取得するステップと、
前記形状データに基づく入力データを用いて、前記着目領域の形状の分類を示す特徴を抽出するステップと
を備えることを特徴とする情報処理方法。
(付記16)
コンピュータに、
画像中の対象物のうちの着目領域の形状を含む形状データを取得するステップと、
前記形状データに基づく入力データを用いて、前記着目領域の形状の分類を示す特徴を抽出するステップと
を実行させることを特徴とするプログラム。
10、50 情報処理システム
110 画像取得部
120 形状データ取得部
130、520 特徴抽出部
140 マップ生成部
150 記憶部
510 取得部

Claims (17)

  1. 画像中の対象物のうちの着目領域の形状を含む形状データを取得する取得部と、
    前記形状データに基づく入力データを用いて、前記着目領域の形状の分類を示す特徴を抽出する特徴抽出部と、
    前記特徴抽出部により抽出された前記対象物の形状の特徴に基づいて、複数の形状をそれぞれ示す複数の画像同士を、形状が類似する当該画像を形状が類似しない当該画像同士よりも近い位置に配置した特徴マップを生成するマップ生成部と
    を備え
    前記特徴マップの各点には、形状を示す特徴情報が対応づけられており、前記特徴マップの位置を選択することで特徴を入力し、形状を示す画像が点に対応付けられていない箇所が選択された場合、当該特徴を有する形状が選択されたものとして扱う、
    ことを特徴とする情報処理システム。
  2. 前記特徴抽出部は、出力データが前記入力データと同一となるように機械学習を行うオートエンコーダを含む
    ことを特徴とする請求項1に記載の情報処理システム。
  3. 前記オートエンコーダは、入力層と、中間層と、出力層とを含み、
    前記機械学習により得られた前記中間層のパラメータが、前記着目領域の特徴として抽出される
    ことを特徴とする請求項2に記載の情報処理システム。
  4. 前記中間層の次元数は、前記入力層の次元数及び前記出力層の次元数よりも小さい
    ことを特徴とする請求項3に記載の情報処理システム。
  5. 前記取得部は、前記着目領域の形状以外の情報のうちの少なくとも一部を除外するように前記形状データを取得する
    ことを特徴とする請求項1乃至4のいずれか1項に記載の情報処理システム。
  6. 前記形状データは、前記対象物の一部分の形状を示す
    ことを特徴とする請求項1乃至5のいずれか1項に記載の情報処理システム。
  7. 前記形状データは、前記対象物の色に関する情報を含まない
    ことを特徴とする請求項1乃至6のいずれか1項に記載の情報処理システム。
  8. 前記形状データは、静止画像データ、動画像データ又は3次元モデルデータである
    ことを特徴とする請求項1乃至7のいずれか1項に記載の情報処理システム。
  9. 前記対象物は自転車であり、前記形状データは、前記自転車のフレーム、チェーンカバー、ペダル、タイヤ、サドル、ハンドル、かご、発電機又はライトの形状を示す画像データである
    ことを特徴とする請求項1乃至8のいずれか1項に記載の情報処理システム。
  10. 前記対象物は二輪自動車であり、前記形状データは、前記二輪自動車のハンドル、燃料タンク又はマフラーの形状を示す画像データである
    ことを特徴とする請求項1乃至8のいずれか1項に記載の情報処理システム。
  11. 前記対象物は人間であり、前記形状データは、前記人間のシルエットの動きを示す動画像データである
    ことを特徴とする請求項1乃至8のいずれか1項に記載の情報処理システム。
  12. 前記対象物は3次元物体であり、前記形状データは、前記3次元物体のボリュームデータである
    ことを特徴とする請求項1乃至8のいずれか1項に記載の情報処理システム。
  13. 前記特徴マップは、前記対象物の形状の分類を表示する
    ことを特徴とする請求項1乃至12のいずれか1項に記載の情報処理システム。
  14. 請求項13に記載の情報処理システムにより生成された特徴マップを用いたGUI(Graphical User Interface)を備える検索システム。
  15. 前記特徴マップの配置は、形状の特徴パラメータに応じて定められ、当該特徴パラメータに該当しないほど、前記特徴マップにおいて中央から離れた位置に配置される、
    ことを特徴とする請求項1乃至1のいずれか1項に記載の情報処理システム。
  16. 画像中の対象物のうちの着目領域の形状を含む形状データを取得するステップと、
    前記形状データに基づく入力データを用いて、前記着目領域の形状の分類を示す特徴を抽出するステップと、
    抽出された前記対象物の形状の特徴に基づいて、複数の形状をそれぞれ示す複数の画像同士を、形状が類似する当該画像を形状が類似しない当該画像同士よりも近い位置に配置した特徴マップを生成するステップと
    を備え
    前記特徴マップの各点には、形状を示す特徴情報が対応づけられており、前記特徴マップの位置を選択することで特徴を入力し、形状を示す画像が点に対応付けられていない箇所が選択された場合、当該特徴を有する形状が選択されたものとして扱う、
    ことを特徴とする情報処理方法。
  17. コンピュータに、
    画像中の対象物のうちの着目領域の形状を含む形状データを取得するステップと、
    前記形状データに基づく入力データを用いて、前記着目領域の形状の分類を示す特徴を抽出するステップと、
    抽出された前記対象物の形状の特徴に基づいて、複数の形状をそれぞれ示す複数の画像同士を、形状が類似する当該画像を形状が類似しない当該画像同士よりも近い位置に配置した特徴マップを生成するステップと
    を実行させ
    前記特徴マップの各点には、形状を示す特徴情報が対応づけられており、前記特徴マップの位置を選択することで特徴を入力し、形状を示す画像が点に対応付けられていない箇所が選択された場合、当該特徴を有する形状が選択されたものとして扱う、
    ことを特徴とするプログラム。
JP2017221870A 2017-11-17 2017-11-17 情報処理システム、情報処理方法及びプログラム Active JP7119348B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017221870A JP7119348B2 (ja) 2017-11-17 2017-11-17 情報処理システム、情報処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017221870A JP7119348B2 (ja) 2017-11-17 2017-11-17 情報処理システム、情報処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2019095827A JP2019095827A (ja) 2019-06-20
JP7119348B2 true JP7119348B2 (ja) 2022-08-17

Family

ID=66971662

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017221870A Active JP7119348B2 (ja) 2017-11-17 2017-11-17 情報処理システム、情報処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP7119348B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2021214991A1 (ja) * 2020-04-24 2021-10-28

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004030122A (ja) 2002-06-25 2004-01-29 Fujitsu Ltd 図面検索支援装置および図面検索方法
JP2008191903A (ja) 2007-02-05 2008-08-21 Honda Motor Co Ltd 展開方法
JP2013152595A (ja) 2012-01-25 2013-08-08 Sony Corp 情報処理装置および方法、並びにプログラム
JP2015187826A (ja) 2014-03-10 2015-10-29 俊之介 島野 車種判別システム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004030122A (ja) 2002-06-25 2004-01-29 Fujitsu Ltd 図面検索支援装置および図面検索方法
JP2008191903A (ja) 2007-02-05 2008-08-21 Honda Motor Co Ltd 展開方法
JP2013152595A (ja) 2012-01-25 2013-08-08 Sony Corp 情報処理装置および方法、並びにプログラム
JP2015187826A (ja) 2014-03-10 2015-10-29 俊之介 島野 車種判別システム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
川上 拓也, 外3名,"3-Dシーン観察に基づく手と物体の関係性の学習と把持パタンの想起",情報処理学会 研究報告 コンピュータビジョンとイメージメディア(CVIM),日本,情報処理学会,2016年05月05日,2016-CVIM-202, No.20

Also Published As

Publication number Publication date
JP2019095827A (ja) 2019-06-20

Similar Documents

Publication Publication Date Title
US10176404B2 (en) Recognition of a 3D modeled object from a 2D image
JP6485646B2 (ja) ストリートビューの画像をラベル付けする方法
CN110413816B (zh) 彩色草图图像搜索
US20150278167A1 (en) Automatic measure of visual similarity between fonts
Huang et al. GraNet: Global relation-aware attentional network for semantic segmentation of ALS point clouds
Saavedra et al. Sketch-based image retrieval using keyshapes
CN111353999A (zh) 使用尺度多样化的分割神经网络标识目标对象
US9367735B2 (en) Object identification device
US11392659B2 (en) Utilizing machine learning models to generate experience driven search results based on digital canvas gesture inputs
CN108122239A (zh) 使用深度分割的图像数据中的对象检测
KR20140079262A (ko) 이미지 검색 방법, 실시간 그리기 프롬프팅 방법 및 그 장치
US20230102467A1 (en) Method of detecting image, electronic device, and storage medium
Santosh et al. Integrating vocabulary clustering with spatial relations for symbol recognition
CN106650743B (zh) 图像强反光检测方法和装置
CN102184395A (zh) 基于字符串核的手绘草图识别方法
JP2023073231A (ja) イメージ処理方法及び装置
JP7119348B2 (ja) 情報処理システム、情報処理方法及びプログラム
Castells-Rufas et al. A survey of FPGA-based vision systems for autonomous cars
Shao et al. Efficient three-dimensional point cloud object detection based on improved Complex-YOLO
Fernando et al. Transformer point net: cost-efficient classification of on-road objects captured by light ranging sensors on low-resolution conditions
Luo et al. Critical minerals map feature extraction using deep learning
Ganpatrao et al. Information extraction from topographic map using colour and shape analysis
Bada et al. Garabato: A proposal of a sketch-based image retrieval system for the web
CN110750501A (zh) 文件检索方法和装置、存储介质及相关设备
Pan et al. Identification of road signs using a novel convolutional neural network

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20180413

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201006

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211007

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211012

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220428

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220623

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220705

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220718

R151 Written notification of patent or utility model registration

Ref document number: 7119348

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151