JP6857537B2 - 情報処理装置 - Google Patents
情報処理装置 Download PDFInfo
- Publication number
- JP6857537B2 JP6857537B2 JP2017078242A JP2017078242A JP6857537B2 JP 6857537 B2 JP6857537 B2 JP 6857537B2 JP 2017078242 A JP2017078242 A JP 2017078242A JP 2017078242 A JP2017078242 A JP 2017078242A JP 6857537 B2 JP6857537 B2 JP 6857537B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- captured
- information processing
- captured image
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 60
- 238000003384 imaging method Methods 0.000 claims description 73
- 238000012549 training Methods 0.000 claims description 14
- 239000002131 composite material Substances 0.000 description 136
- 238000004891 communication Methods 0.000 description 20
- 238000012986 modification Methods 0.000 description 14
- 230000004048 modification Effects 0.000 description 14
- 239000000203 mixture Substances 0.000 description 12
- 230000002194 synthesizing effect Effects 0.000 description 12
- 238000000034 method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 238000012937 correction Methods 0.000 description 7
- 238000001514 detection method Methods 0.000 description 7
- 230000033001 locomotion Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000008921 facial expression Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 235000013361 beverage Nutrition 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 206010011469 Crying Diseases 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000010923 batch production Methods 0.000 description 1
- 230000009194 climbing Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Landscapes
- Studio Devices (AREA)
- Image Analysis (AREA)
Description
[構成]
図1は、本発明の一実施形態に係る情報処理システム1の構成を例示する図である。情報処理システム1は、画像認識を行う情報処理装置10と、画像の撮像及び表示を行う撮像表示装置20と、これら情報処理装置10及び撮像表示装置20を通信可能に接続するネットワーク90とを備えている。ネットワーク90は、例えばLAN(Local Area Network)またはWAN(Wide Area Network)、若しくはこれらの組み合わせであり、有線区間又は無線区間を含んでいてもよい。なお、図1には、情報処理装置10及び撮像表示装置20を1つずつ示しているが、これらはそれぞれ複数であってもよい。
図6〜図9を参照して、情報処理システム1の表示制御の例について説明する。まず、ユーザは撮像表示装置20の撮像部21(アウトカメラ)を起動して、自身が所望する物体の撮像を開始する(ステップS11)。撮像部21による撮像結果は、撮像表示装置20の表示領域にリアルタイムに表示され、撮像部21の撮像方向が変わるとこの表示領域上の画像も変更される。例えばユーザが時計台の風景が撮像されるような向きに撮像表示装置20を構えてユーザが所定の操作を行うと、図7(A)に示すように、その撮像画像が撮像表示装置20の表示領域に表示される。この撮像画像を示す撮像画像データは、ユーザの撮像操作があるたびに、又は、その撮像操作時点から定期的に通信IF205から情報処理装置10に、タイマ108で計時された撮像時期とともに送信される(ステップS12)。これにより、1又は複数の撮像画像データが情報処理装置10に送信される。このとき、撮像表示装置20は撮像画像データを適宜圧縮してデータサイズを小さくすることが望ましい。
上述した実施形態は次のような変形が可能である。また、以下の変形例を互いに組み合わせて実施してもよい。
[変形例1]
実施形態において、判断部13は、画像認識された撮像画像とその撮像画像の撮像時期の前又は後に撮像された他の撮像画像との類似度が所定の上限及び下限の範囲に収まる場合には、画像認識された撮像画像に含まれる物体と同一の物体が他の撮像画像に含まれると判断していた。ここで、画像認識エンジンに含まれる学習データの量(データサイズ)が閾値を超えていて補助記憶装置104の空き容量が少ないという場合には、判断部13は、学習データのデータサイズが閾値を超えていない場合に比べて、上記の類似度の上限を低くする又は類似度の下限を高くするようにしてもよい。類似度の上限を低くすると、学習データと判断される確率が小さくなり、その結果、補助記憶装置104に蓄積される学習データの量が少なくなるから、補助記憶装置104の空き容量が節約することができる。同様に、類似度の下限を高くすると、その結果、補助記憶装置104に蓄積される学習データの量が少なくなるから、補助記憶装置104の空き容量が節約することができる。上記のいずれの場合においても、閾値と比較する学習データの量は、画像認識された撮像画像に含まれる物体についての学習データの量であってもよいし、画像認識された撮像画像に含まれる物体に関係なく、画像認識エンジンに含まれる学習データの総量であってもよい。
判断部13は、画像認識された撮像画像を撮像したときの撮像表示装置20の姿勢(撮像姿勢という)と、その撮像画像の撮像時期の前又は後に撮像された他の撮像画像を撮像したときの撮像表示装置20の(前後撮像姿勢という)とに基づいて、学習データの可否判断を行ってもよい。例えば、情報処理装置10において、取得部11は、撮像データとともに、撮像表示装置20のジャイロセンサ等で検出された姿勢データを取得する。姿勢データから特定される撮像姿勢と前後撮像姿勢との差分が閾値以下の場合には、撮像表示装置20の姿勢があまり変わっていないのだから撮像姿勢と前後撮像姿勢とにおいて同一の物体が撮像されている可能性が高いということになる。よって、判断部13は、このような前後撮像姿勢で撮像された撮像データを学習データとして用いる。このようにすれば画像の類比判断を行わなくても、学習データを収集可能となる。
また、例えば、画像認識された撮像画像とその撮像画像の撮像時期の前又は後に撮像された他の撮像画像との類似度が上限及び下限の範囲に収まる場合において、撮像姿勢と前後撮像姿勢との差分が閾値以上のときには、撮像姿勢と前後撮像姿勢とにおいて同一の物体が異なる視点から撮像されている可能性が高いということになる。この場合、判断部13は、このような前後撮像姿勢で撮像された撮像データを学習データとして用いる。これにより、1つの物体を異なる視点から撮像したときの学習データを用意できることになるから、画像認識の精度が向上する。
判断部13は、上述した撮像時期の前又は後の期間を変更する手段を有してもよい。例えば撮像表示装置20においてユーザが上記期間を変更する操作を行うと、この操作に応じて、判断部13は、期間を変更する。また、画像認識エンジンに含まれる学習データの量(データサイズ)が閾値を超えており補助記憶装置104の空き容量が少ないという場合に、判断部13は、画像認識エンジンに含まれる学習データの量(データサイズ)が閾値以下の場合に比べて、上述した撮像時期の前又は後の期間を短くしてもよい。撮像時期の前又は後の期間を短くすると、学習データと判断される撮像データの数が少なくなり、その結果、補助記憶装置104に蓄積される学習データの量が少なくなるから、補助記憶装置104の空き容量を節約することができる。
画像認識部12は、学習データを補正して画像認識に用いてもよい。ここでいう補正とは、例えば学習データにおける明度補正や彩度補正であってもよいし、撮像表示装置20の機種に応じた補正であってもよい。撮像表示装置20機種に応じた補正とは、撮像表示装置20の機種ごとに撮像した画像の特性(例えば明度や彩度など)が異なるから、この機種ごとの特性の違いを小さくするような明度補正や彩度補正などである。このようにすれば画像認識の精度が向上する。
図6のステップS21及びS22の処理を実行する時期はいつでもよい。例えばステップS13〜ステップS15の処理と平行して実行されてもよいし、また、所定のタイミングで過去の所定期間の分(例えば1日分)がバッチ処理として実行されてもよい。
実施形態では、画像認識部12による認識結果に応じた処理として、第1合成画像を合成していたが、画像認識部12による認識結果に応じた処理の内容はどのようなものであってもよい。例えば情報処理装置10が画像検索サイトを管理しており、画像認識部12による認識結果を撮像表示装置20に返すだけの処理を行うものであってもよい。
また、画像合成部30は、画像認識部12による認識結果に応じて外観が異なる第1合成画像を合成することに限らず、例えば大きさ、位置、動き又は数の少なくともいずれかが異なる第1合成画像を合成すればよい。また、第1合成画像は動画に限らず静止画であってもよい。また、画像合成部30は、画像認識部12による認識結果に加え、ユーザの属性又は撮像表示装置20の位置に応じて異なる第1合成画像を合成するようにしてもよい。また、画像合成部30は、画像認識部12による認識結果に応じて異なる第1合成画像を合成すればよく、例えば建物を撮像したときに、その建物が設置された地面の平面を認識し、その平面上に第1構成画像を合成してもよい。このように第1合成画像の様々な要素が画像認識結果に応じて異なるほうが、ユーザにとっての面白味が増す。
実施形態では、画像合成部30は、画像認識部12による認識結果に関わらず、ユーザによって撮像された顔の画像を常に第2合成画像としていたが、画像認識部12による認識結果に応じて異なる第2合成画像を合成するようにしてもよい。例えば事前にユーザが、様々に異なる表情又は向きの顔を自分で撮像して撮像表示装置20の補助記憶装置204に記憶させておき、さらに、その顔の表情又は向きから連想するユーザの様子(例えば楽しい、悲しい、笑い顔、泣き顔、知らんぷり、無表情など)を意味するタグを付与しておく。このタグの付与は、ユーザ自身が行ってもよいし、画像認識技術を用いて撮像表示装置20又は情報処理装置10が行ってもよい。画像合成部30は、画像認識部12による認識結果に対応するタグが付与された顔の画像を第2合成画像とする。この場合、画像認識部12による認識結果とユーザの様子を類型化したものとが対応付けられて補助記憶装置204に記憶されており、画像合成部30は、画像認識部12による認識結果に対応するタグを特定し、そのタグが付与された顔の画像データを補助記憶装置204から読み出す。
さらに、このような顔の表情の異同に限らず、画像合成部30は、画像認識部12による認識結果に応じて外観、大きさ、位置、動き又は数の少なくともいずれかが異なる第2合成画像を合成してもよい。なお、第2合成画像は撮像画像に限らず、例えばアバター又はアニメの画像など、どのような画像であってもよい。このように第2合成画像の様々な要素が画像認識結果に応じて異なるほうが、ユーザにとっての面白味が増す。
画像合成部30は、第1合成画像に応じて異なる第2合成画像を合成するようにしてもよい。例えば、撮像表示装置20により風景が撮像された場合、その風景に応じた第1合成画像G1が合成される。画像合成部30は、この第1合成画像G1に応じて例えば複数の第2合成画像の候補をユーザに提示し、ユーザがそのうちのいずれかを選択すると、その第2合成画像を合成する。また、複数の第2合成画像を選択的に第1合成画像に組み合わせる例として、例えば撮像された建築物を徐々に登っていく動きと位置変化をするような、人間の体を模した動画の第1合成画像に対し、その建築物の低層においては楽しそうな表情の顔の第2合成画像を組み合わせ、高層に進むにつれて苦しそうな表情の顔の第2合成画像を組み合わせるようにしてもよい。つまり、第1合成画像の動き又は位置の変化に応じて、第2合成画像を変化させてもよい。このように第2合成画像の様々な要素が第1合成画像に応じて異なるほうが、ユーザにとっての面白味が増す。
第1合成画像データを情報処理装置10が記憶するのではなく、撮像表示装置20が記憶しておき、情報処理装置10はどの第1合成画像データを用いるかを第1合成画像IDで撮像表示装置20に指示するだけでもよい。このようにすれば情報処理装置10及び撮像表示装置20間の通信データ量を削減することができる。
第1合成画像及び第2合成画像が合成される画像は、撮像部21によってリアルタイムに撮像された画像に限らず、例えば過去に撮像部21によって撮像された画像が補助記憶装置204に記憶されており、その中から選ばれたものであってもよいし、撮像表示装置20が他の装置から取得したものであってもよい。このようにすれば、ユーザにとって、第1合成画像及び第2合成画像が合成される対象となる画像の選択の余地が広がる。
第1合成画像又は第2合成画像を広告として利用してもよい。例えば第1合成画像として、或るキャラクタがそのメーカのペットボトル(広告宣伝対象物)を持っている画像とか、そのキャラクタの服の真ん中にそのペットボトル(広告宣伝対象物)の絵が記載されている画像というような例が考えられる。また、撮像表示装置20を或る飲料メーカのペットボトル(広告宣伝対象物)にかざすと、そのペットボトルの或る位置において第1合成画像として飲料メーカのキャラクタ画像が表示され、さらにそのキャラクタ画像に対して第2合成画像としてユーザの顔が配置されてもよい。また、例えば或る街の大規模交差点に撮像表示装置20をかざすと、その交差点に設置されたスクリーンパネルの領域に或る第1合成画像を合成し、その第1合成画像上に広告宣伝対象物の動画の第2合成画像として再生するようにしてもよい。このようにすれば、あたかも、その街で広告が再生されているように見える。これら第1合成画像及び第2合成画像の組み合わせは、ユーザの属性又は撮像表示装置20の位置によって変更してもよいし、広告主の支払う単価などにより変更してもよい。このようにすれば、本発明を広告に利用することが可能となる。
上記実施の形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェア及び/又はソフトウェアの任意の組み合わせによって実現される。また、各機能ブロックの実現手段は特に限定されない。すなわち、各機能ブロックは、物理的及び/又は論理的に結合した1つの装置により実現されてもよいし、物理的及び/又は論理的に分離した2つ以上の装置を直接的及び/又は間接的に(例えば、有線及び/又は無線)で接続し、これら複数の装置により実現されてもよい。
また、ソフトウェア、命令などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア及びデジタル加入者回線(DSL)などの有線技術及び/又は赤外線、無線及びマイクロ波などの無線技術を利用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び/又は無線技術は、伝送媒体の定義内に含まれる。
Claims (8)
- 撮像装置から撮像画像を取得する取得部と、
画像認識を行う画像認識部と、
前記画像認識部が前記撮像装置から取得された複数の撮像画像のうちのいずれかの画像認識に成功すると、前記複数の撮像画像のうち、画像認識された前記撮像画像の前又は後に撮像された他の撮像画像において、画像認識された前記撮像画像に含まれる物体と同一の物体が含まれているか否かを判断する判断部とを備え、
前記認識部は、画像認識された前記撮像画像に含まれる物体と同一の物体が含まれている他の撮像画像を、当該物体を含む撮像画像を画像認識するときの学習データとして用いる
ことを特徴とする情報処理装置。 - 前記判断部は、画像認識された前記撮像画像と、当該撮像画像の撮像時期の前又は後に撮像された他の撮像画像との類似度を用いて、前記判断を行う
ことを特徴とする請求項1記載の情報処理装置。 - 前記判断部は、前記類似度が上限及び下限の範囲に収まる場合に、画像認識された前記撮像画像に含まれる物体と同一の物体が他の撮像画像に含まれていると判断する
ことを特徴とする請求項2記載の情報処理装置。 - 前記判断部は、前記類似度の前記上限又は前記下限を変更する
ことを特徴とする請求項3記載の情報処理装置。 - 前記判断部は、前記学習データの量が閾値を超えている場合には、前記学習データの量が前記閾値を超えていない場合に比べて、前記類似度の上限を低くする又は前記類似度の下限を高くする
ことを特徴とする請求項4記載の情報処理装置。 - 前記判断部は、画像認識された前記撮像画像を撮像したときの前記撮像装置の姿勢と、当該撮像画像の撮像時期の前又は後に撮像された他の撮像画像を撮像したときの前記撮像装置の姿勢とに基づいて、前記判断を行う
ことを特徴とする請求項1〜5のいずれか1項に記載の情報処理装置。 - 前記判断部は、画像認識された前記撮像画像の撮像時期の前又は後の期間を変更する
ことを特徴とする請求項1〜6のいずれか1項に記載の情報処理装置。 - 前記画像認識部は、前記学習データを補正して前記画像認識に用いる
ことを特徴とする請求項1〜7のいずれか1項に記載の情報処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017078242A JP6857537B2 (ja) | 2017-04-11 | 2017-04-11 | 情報処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017078242A JP6857537B2 (ja) | 2017-04-11 | 2017-04-11 | 情報処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018180849A JP2018180849A (ja) | 2018-11-15 |
JP6857537B2 true JP6857537B2 (ja) | 2021-04-14 |
Family
ID=64276694
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017078242A Active JP6857537B2 (ja) | 2017-04-11 | 2017-04-11 | 情報処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6857537B2 (ja) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4995770B2 (ja) * | 2008-05-21 | 2012-08-08 | 日本電信電話株式会社 | 画像辞書生成装置,画像辞書生成方法,および画像辞書生成プログラム |
JP5385752B2 (ja) * | 2009-10-20 | 2014-01-08 | キヤノン株式会社 | 画像認識装置、その処理方法及びプログラム |
-
2017
- 2017-04-11 JP JP2017078242A patent/JP6857537B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018180849A (ja) | 2018-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6750046B2 (ja) | 情報処理装置及び情報処理方法 | |
CN109635621B (zh) | 用于第一人称视角中基于深度学习识别手势的系统和方法 | |
CN108525305B (zh) | 图像处理方法、装置、存储介质及电子设备 | |
JP6151323B2 (ja) | 動的テンプレート追跡 | |
JP6730461B2 (ja) | 情報処理システム及び情報処理装置 | |
CN109688451B (zh) | 摄像机效应的提供方法及系统 | |
US20170046568A1 (en) | Systems and methods of identifying a gesture using gesture data compressed by principal joint variable analysis | |
KR102106135B1 (ko) | 행동 인식 기반의 응용 서비스 제공 장치 및 그 방법 | |
CN110716645A (zh) | 一种增强现实数据呈现方法、装置、电子设备及存储介质 | |
US11836764B2 (en) | Media collection navigation with opt-out interstitial | |
CN111640202B (zh) | 一种ar场景特效生成的方法及装置 | |
CN112560605B (zh) | 交互方法、装置、终端、服务器和存储介质 | |
CN108491804B (zh) | 一种棋局展示的方法、相关装置及系统 | |
JP7068745B2 (ja) | 学習済モデル提案システム、学習済モデル提案方法、およびプログラム | |
CN113487709A (zh) | 一种特效展示方法、装置、计算机设备以及存储介质 | |
CN112308977B (zh) | 视频处理方法、视频处理装置和存储介质 | |
KR102476619B1 (ko) | 전자 장치 및 이의 제어 방법 | |
JP6857537B2 (ja) | 情報処理装置 | |
CN115393962A (zh) | 动作识别方法、头戴显示设备和存储介质 | |
CN111625101B (zh) | 一种展示控制方法及装置 | |
CN111510582A (zh) | 用于提供具有虚拟角色的图像的设备 | |
CN111627097B (zh) | 一种虚拟景物的展示方法及装置 | |
CN111625099B (zh) | 一种动画展示控制方法及装置 | |
JPWO2017149778A1 (ja) | 鏡、画像表示方法及びプログラム | |
CN112560556A (zh) | 动作行为图像生成方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200213 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210316 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210322 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6857537 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |