JP2015191358A - 中心人物判定システム、中心人物判定システムに利用される情報端末、中心人物判定方法、ならびに中心人物判定プログラムおよび記録媒体 - Google Patents

中心人物判定システム、中心人物判定システムに利用される情報端末、中心人物判定方法、ならびに中心人物判定プログラムおよび記録媒体 Download PDF

Info

Publication number
JP2015191358A
JP2015191358A JP2014066990A JP2014066990A JP2015191358A JP 2015191358 A JP2015191358 A JP 2015191358A JP 2014066990 A JP2014066990 A JP 2014066990A JP 2014066990 A JP2014066990 A JP 2014066990A JP 2015191358 A JP2015191358 A JP 2015191358A
Authority
JP
Japan
Prior art keywords
image data
central person
face image
person determination
determination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014066990A
Other languages
English (en)
Inventor
敏貢 福島
Toshitsugu Fukushima
敏貢 福島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Priority to JP2014066990A priority Critical patent/JP2015191358A/ja
Priority to US14/669,656 priority patent/US9721145B2/en
Publication of JP2015191358A publication Critical patent/JP2015191358A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/164Detection; Localisation; Normalisation using holistic features

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)

Abstract

【課題】低速な通信環境下において中心人物判定処理に係る判定処理時間を短縮することができ、また、情報端末およびサーバのそれぞれのデータ処理速度と、情報端末とサーバとの間の通信速度とに応じて最適な中心人物判定フローを選択することで中心人物判定処理に係る判定処理時間を短縮することができる中心人物判定システム、中心人物判定システムに利用される情報端末、中心人物判定方法、ならびに中心人物判定プログラムおよび記録媒体を提供する。
【解決手段】情報端末において、複数の画像データに基づく複数の画像について、顔検出処理を行って、顔検出結果を生成し、顔検出結果に基づいて複数の画像データに基づく複数の画像から、顔画像を切り抜いて複数の顔画像データを生成し、複数の顔画像データをサーバへ送信し、サーバにおいて、情報端末より受信した複数の顔画像データに基づいて中心人物判定処理を行い、中心人物判定結果を生成し、情報端末へ中心人物判定結果を送信する。
【選択図】図1

Description

本発明は、複数の画像データから、画像に写る中心人物を判定する中心人物判定システム、中心人物判定システムに利用される情報端末、中心人物判定方法、ならびに中心人物判定プログラムおよび記録媒体に関するものである。
昨今、スマートフォンやスマートタブレット等の携帯情報端末の普及率が急速に伸びており、携帯情報端末によって撮影された複数の画像データを用いたフォトブック等の画像商材の作成がなされている。
また、より魅力的な画像商材を作成するためには、例えば、画像商材に利用する複数の画像から複数の画像に写る中心人物を判定し、中心人物に基づいて画像商材を作成することなどが挙げられる。
例えば、特許文献1には、画像データから、顔検出、顔画像データの生成、および顔の特徴点の抽出を行って、顔の特徴点に基づく顔認識データを生成する画像処理装置が開示されている。
また、特許文献2には、映像出力装置において、映像中に顔が含まれることが認識された場合に、顔の領域を切り出した顔の映像を顔検索サーバへ送信し、また、顔検索サーバから映像出力装置へ顔の映像に対応する人物の関連情報(のリンク情報)を送信する映像出力装置が開示されている。
特開2007−148691号公報 特開2008−160354号公報
当業者であれば、特許文献1に記載の画像処理装置を利用して、複数の画像データから顔認識データを生成し、顔認識データを利用して中心人物を判定し、例えば、中心人物に基づくフォトブック等の画像商材を作成することができる。
しかし、中心人物の判定に関する一連の処理(中心人物判定処理)は、マシンパワーを必要とする負荷の高い処理であり、例えば、負荷の高い処理を想定していない携帯情報端末等で中心人物判定処理を行うと処理に長時間を要してしまう。
また、中心人物判定処理は、一般的に、入力された複数の画像データに対して、顔検出、顔特徴量の算出(顔パーツ検出)、顔モデルデータの生成、顔モデルデータに基づく中心人物の判定(または、同一人物の判定)というフローで行われるが、これらの一連の処理を携帯情報端末において行うかサーバにおいて行うかによって中心人物判定処理に掛かる処理時間が大きく異なる。例えば、所定の携帯情報端末(SAMSUNG社製Galaxy(登録商標) S4 SC-04Eを想定)および所定のサーバ(DELL社製PowerEdge(登録商標) R420を想定)における顔検出、顔特徴量の算出、顔モデルデータの生成および中心人物判定(400顔、1500顔)に係る処理時間は以下の表1のとおりとなる。
Figure 2015191358
すなわち、上述の表1に示すように、携帯情報端末の場合、中心人物の判定の前段階までで(画像枚数)×405msの処理時間が掛かり、また、サーバの場合、中心人物の判定の前段階までで(画像枚数)×81msの処理時間が掛かる。また、中心人物の判定では、顔モデルデータ同士の組み合わせ(例えば、Combination=(n×(n−1))/(2×1))で比較処理を行うため、顔モデルデータの数が増えると、例えば、計算量を削減する種々の公知のアルゴリズムによって処理時間の削減を図ったとしても比例関係以上の処理時間の増大が起こり得る。
そのため、上述のフローによって行われる中心人物判定処理に掛かる処理時間、つまり上述の一連の処理に掛かる処理時間の合計は、以下の表2のように、画像400枚(画像1枚に顔1つ)の場合、携帯情報端末では約207秒(405ms×400+45s)となり、サーバでは約36.4秒(81ms×400+4s)となる。また、画像1500枚(画像1枚に顔1つ)の場合、上述の一連の処理に掛かる処理時間の合計は、携帯情報端末では約777.5秒(405ms×1500+170s)となり、サーバでは、約136.5秒(81ms×1500+15s)となる。
Figure 2015191358
上述の表2は、携帯情報端末において中心人物判定処理を行った場合とサーバにおいて中心人物判定処理を行った場合とにおいて、中心人物判定処理に掛かる処理時間の単純な比較の一例であるが、実際のところ、携帯情報端末の有する複数の画像データについてサーバにおいて中心人物判定処理を行うためには、インターネット等の通信回線を通じて携帯情報端末からサーバへ複数の画像データを送信(アップロード)する必要があり、上述のようなデータ処理時間だけでなく、通信処理に掛かる時間(通信処理時間)も考慮する必要がある。
そのため、例えば、3Gと呼ばれる第3世代移動通信システム(以下、3G回線)を利用する場合等、低速な通信環境によっては携帯情報端末で中心人物判定処理を行うよりも処理時間が長く掛かってしまう。
また、特許文献2では、顔の領域を切り出した顔の映像を送信することで、映像出力装置から顔検索サーバへ送信されるデータ量を低減できる旨が開示されているが、携帯情報端末のように通信環境が大きく変化するような状況は考慮されていない。また、特許文献2において、顔検索サーバで顔の照合が行われるのは、セキュリティのためであり、映像出力装置と顔検索サーバとのデータ処理速度の違いを考慮して、顔検索サーバで顔の照合が行われているわけではない。
本発明の目的は、上記課題を解決し、低速な通信環境下において中心人物判定処理に係る判定処理時間を短縮することができる中心人物判定処理システム、中心人物判定システムに利用される情報端末、中心人物判定方法、ならびに中心人物判定プログラムおよび記録媒体を提供することにある。また、本発明の目的は、情報端末およびサーバのそれぞれのデータ処理速度と、情報端末とサーバとの間の通信速度とに応じて最適な中心人物判定フローを選択し、中心人物判定処理に係る判定処理時間を短縮することができる中心人物判定システム、中心人物判定システムに利用される情報端末、中心人物判定方法、ならびに中心人物判定プログラムおよび記録媒体を提供することにある。
上記課題を解決するために、本発明は、複数の画像データを有する情報端末とサーバとからなる中心人物判定システムであって、情報端末は、複数の画像データに基づく複数の画像について、それぞれ顔検出処理を行い、顔検出結果を生成する顔検出部と、顔検出結果に基づいて複数の画像データに基づく複数の画像から、顔画像を切り抜いて複数の顔画像データを生成する顔画像データ生成部と、複数の顔画像データをサーバへ送信し、サーバから中心人物判定結果を受信する端末データ送受信部とを備え、サーバは、情報端末より取得した複数の顔画像データに基づいて中心人物判定処理を行い、中心人物判定結果を生成する中心人物判定処理部と、情報端末より複数の顔画像データを受信し、情報端末へ中心人物判定結果を送信するサーバデータ送受信部とを備えることを特徴とする中心人物判定システムを提供する。
また、顔画像データ生成部は、顔検出結果に基づいて顔画像の中心位置と顔画像のサイズとを算出し、顔画像の中心位置と顔画像のサイズとに基づいて顔画像を切り抜いて顔画像データを生成することが好ましい。
また、顔画像データ生成部は、顔画像の切り抜かれた元画像のデータ名、顔画像の中心位置、顔画像のサイズおよび元画像データのチェックサムの少なくとも1つを顔画像データのデータ名として使用することが好ましい。
また、顔画像データ生成部は、顔画像データの大きさを一律に揃え、且つ顔画像データのデータ容量が所定値以下となるようにエンコードを行うことが好ましい。
また、本発明は、複数の画像データを有する情報端末、または情報端末とサーバとからなる中心人物判定システムであって、情報端末とサーバとの間の通信速度ならびに情報端末およびサーバのそれぞれのデータ処理速度に応じて、情報端末において複数の画像データから顔画像データを生成し、顔画像データをサーバに送信することで中心人物判定処理を行い、サーバから中心人物判定結果を受信する第1の判定フロー、情報端末から複数の画像データをサーバに送信することで中心人物判定処理を行い、サーバから中心人物判定結果を受信する第2の判定フロー、および情報端末において複数の画像データから中心人物判定処理を行って中心人物判定結果を生成する第3の判定フローのそれぞれにおいて、複数の画像データに基づく中心人物判定処理に掛かる判定処理時間を推定する判定処理時間推定部と、判定処理時間推定部において判定処理時間を推定された第1の判定フロー、第2の判定フローおよび第3の判定フローのうち、判定処理時間の最も短い中心人物判定フローを選択するフロー選択部と、フロー選択部によって選択された中心人物判定フローに基づいて複数の画像データの中心人物判定処理を行う判定フロー実行部を備え、判定フロー実行部は、複数の画像データに基づく複数の画像について、それぞれ顔検出処理を行い、顔検出結果を出力する顔検出部と、顔検出結果に基づいて生成された複数の顔画像データまたは顔検出結果および複数の画像データに基づいて中心人物判定処理を行って中心人物判定結果を生成する中心人物判定処理部とを有することを特徴とする中心人物判定システムを提供する。
また、判定処理時間推定部は、判定フロー実行部において、1つの画像データに対して第1の判定フロー、第2の判定フローおよび第3の判定フローのそれぞれを行って、それぞれの判定処理実時間を算出し、判定処理実時間に基づいてそれぞれの判定処理時間を推定することが好ましい。
また、本発明は、複数の画像データに基づく複数の画像について、それぞれ顔検出処理を行い、顔検出結果を生成する顔検出部と、顔検出結果に基づいて複数の画像データに基づく複数の画像から、顔画像を切り抜いて複数の顔画像データを生成する顔画像データ生成部と、複数の顔画像データをサーバへ送信し、サーバから複数の顔画像データに基づく中心人物判定処理によって得られた中心人物判定結果を受信する端末データ送受信部とを備えることを特徴とする情報端末を提供する。
また、顔画像データ生成部は、顔検出結果に基づいて顔画像の中心位置と顔画像のサイズとを算出し、顔画像の中心位置と顔画像のサイズとに基づいて顔画像を切り抜いて顔画像データを生成することが好ましい。
また、顔画像データ生成部は、顔画像の切り抜かれた元画像のデータ名、顔画像の中心位置、顔画像のサイズおよび元画像データのチェックサムの少なくとも1つを顔画像データのデータ名として使用することが好ましい。
また、顔画像データ生成部は、顔画像データの大きさを一律に揃え、且つ顔画像データのデータ容量が所定値以下となるようにエンコードを行うことが好ましい。
また、本発明は、複数の画像データを有する情報端末であって、情報端末とサーバとの間の通信速度ならびに情報端末およびサーバのそれぞれのデータ処理速度に応じて、情報端末において複数の画像データから顔画像データを生成し、顔画像データをサーバに送信することで中心人物判定処理を行い、サーバから中心人物判定結果を受信する第1の判定フロー、情報端末から複数の画像データをサーバに送信することで中心人物判定処理を行い、サーバから中心人物判定結果を受信する第2の判定フロー、および情報端末において複数の画像データから中心人物判定処理を行って中心人物判定結果を生成する第3の判定フローのそれぞれにおいて、複数の画像データに基づく中心人物判定処理に掛かる判定処理時間を推定する判定処理時間推定部と、判定処理時間推定部において判定処理時間を推定された第1の判定フロー、第2の判定フローおよび第3の判定フローのうち、判定処理時間の最も短い中心人物判定フローを選択するフロー選択部とを備えることを特徴とする情報端末を提供する。
また、本発明は、複数の画像データを有する情報端末とサーバとを利用した中心人物判定方法であって、情報端末において、複数の画像データに基づく複数の画像について、顔検出処理を行って、顔検出結果を生成する顔検出ステップと、顔検出結果に基づいて複数の画像データに基づく複数の画像から、顔画像を切り抜いて複数の顔画像データを生成する顔画像データ生成ステップと、複数の顔画像データをサーバへ送信する顔画像データ送信ステップと、サーバにおいて、情報端末より複数の顔画像データを受信する顔画像データ受信ステップと、情報端末より受信した複数の顔画像データに基づいて中心人物判定処理を行い、中心人物判定結果を生成する中心人物判定処理ステップと、情報端末へ中心人物判定結果を送信する中心人物判定結果送信ステップと、情報端末において、サーバから中心人物判定結果を受信する中心人物判定結果受信ステップを備えることを特徴とする中心人物判定方法を提供する。
また、顔画像データ生成ステップは、顔検出結果に基づいて顔画像の中心位置と顔画像のサイズとを算出し、顔画像の中心位置と顔画像のサイズとに基づいて顔画像を切り抜いて顔画像データを生成することが好ましい。
また、顔画像データ生成ステップは、顔画像の切り抜かれた元画像のデータ名、顔画像の中心位置、顔画像のサイズおよび元画像データのチェックサムの少なくとも1つを顔画像データのデータ名として使用することが好ましい。
また、顔画像データ生成ステップは、顔画像データの大きさを一律に揃え、且つ顔画像データのデータ容量が所定値以下となるようにエンコードを行うことが好ましい。
また、本発明は、複数の画像データを有する情報端末、または情報端末とサーバとを利用した中心人物判定方法であって、情報端末において、情報端末とサーバとの通信速度ならびに情報端末およびサーバのそれぞれのデータ処理速度に応じて、情報端末において複数の画像データから顔画像データを生成し、顔画像データをサーバに送信することで中心人物判定処理を行い、サーバから中心人物判定結果を受信する第1の判定フロー、情報端末から複数の画像データをサーバに送信することで中心人物判定処理を行い、サーバから中心人物判定結果を受信する第2の判定フロー、および情報端末において複数の画像データから中心人物判定処理を行って中心人物判定結果を生成する第3の判定フローのそれぞれにおいて、複数の画像データに基づく中心人物判定処理に掛かる判定処理時間を推定する判定処理時間推定ステップと、判定処理時間推定ステップにおいて判定処理時間を推定された第1の判定フロー、第2の判定フローおよび第3の判定フローのうち、判定処理時間の最も短い中心人物判定フローを選択するフロー選択ステップと、フロー選択ステップによって選択された中心人物判定フローに基づいて複数の画像データの中心人物判定処理を行って中心人物判定結果を生成する判定フロー実行ステップを備え、判定フロー実行ステップは、複数の画像データに基づく複数の画像について、それぞれ顔検出処理を行い、顔検出結果を出力する顔検出ステップと、顔検出結果に基づいて生成された複数の顔画像データまたは顔検出結果および複数の画像データに基づいて中心人物判定処理を行って中心人物判定結果を生成する中心人物判定処理ステップとを有することを特徴とする中心人物判定方法を提供する。
また、判定処理時間推定ステップは、1つの画像データに対して第1の判定フロー、第2の判定フローおよび第3の判定フローのそれぞれを行って、それぞれの判定処理実時間を算出し、判定処理実時間に基づいてそれぞれの判定処理時間を推定することが好ましい。
また、本発明は、情報端末または情報端末およびサーバに、上述のいずれかに記載の中心人物判定方法の各ステップを実行させるための中心人物判定プログラムを提供する。
また、本発明は、上述の中心人物判定処理プログラムが記録されたコンピュータ読取可能な記録媒体を提供する。
本発明によれば、低速な通信環境下において中心人物判定処理に係る判定処理時間を短縮することができる。また、本発明によれば、情報端末およびサーバのそれぞれのデータ処理速度と、情報端末とサーバとの間の通信速度とに応じて最適な中心人物判定フローを選択することができ、中心人物判定処理に係る判定処理時間を短縮することができる。
本発明の実施の形態1に係る中心人物判定システムの全体構成を示すブロック図である。 図1の中心人物判定システムにおける顔画像データ生成部の構成の一例を示すブロック図である。 図1の中心人物判定システムにおける中心人物判定処理部の構成の一例を示すブロック図である。 図1の中心人物判定システムの動作の一例を示すフローチャートである。 図2の顔画像データ生成部の顔画像クロップ部における顔画像のクロッピング(切り抜き)の一例を説明する図である。 本発明の実施の形態2に係る中心人物判定システムの全体構成を示すブロック図である。 本発明の実施の形態2に係る第1の判定フローを示すフローチャートである。 本発明の実施の形態2に係る第2の判定フローを示すフローチャートである。 本発明の実施の形態2に係る第3の判定フローを示すフローチャートである。 図6の中心人物判定システムの動作の一例を示すフローチャートである。
本発明に係る中心人物判定システム、中心人物判定システムに利用される情報端末、中心人物判定方法、ならびに中心人物判定プログラムおよび記録媒体を、添付の図面に示す好適実施形態に基づいて以下に詳細に説明する。
実施の形態1
図1は、本発明の実施の形態1に係る中心人物判定システムの全体構成を示すブロック図である。図1の中心人物判定システム10は、情報端末12とサーバ14とによって構成され、情報端末12とサーバ14とは、例えば、3G回線のような低速な通信回線によって相互に接続される。
情報端末12は、画像データ取得部16と、画像データ取得部16より順次接続される顔検出部18、顔画像データ生成部20、および端末データ送受信部22を備え、これらの各部に接続する端末格納部24を備える。また、情報端末12は、画像データ取得部16、顔検出部18、顔画像データ生成部20、端末データ送受信部22および端末格納部24のそれぞれに接続する端末制御部26と、端末制御部26に接続する操作部28および表示部30を備える。
また、例えば、情報端末12としては、携帯電話、PDA(Personal Digital Assistant)、ノートPC、タブレットPC、携帯ゲーム機など、インターネット等を介してサーバ14等と通信可能な端末が挙げられる。
サーバ14は、サーバデータ送受信部32と、サーバデータ送受信部32に接続する中心人物判定処理部34と、サーバデータ送受信部32および中心人物判定処理部34に接続するサーバ格納部36とを備え、また、サーバデータ送受信部32、中心人物判定処理部34、およびサーバ格納部36にそれぞれ接続するサーバ制御部38を備える。
また、図2に示すように、顔画像データ生成部20は、顔画像クロップ部40と顔画像クロップ部40に接続されるエンコード部42を備える。また、図3に示すように、中心人物判定処理部34は、サーバデータ送受信部32から順次接続される顔特徴量算出部44、顔モデルデータ生成部46、および中心人物判定部48を備え、中心人物判定部48は、サーバデータ送受信部32に接続する。
図1の情報端末12の画像データ取得部16は、外部の格納装置と接続し、また、記録媒体等が設置され、これら格納装置や記録媒体等から複数の画像データを取得し、取得された複数の画像データを出力するものである。
顔検出部18は、複数の画像データを画像データ取得部16または端末格納部24から取得し、それぞれの画像データに基づく画像から画像に写る顔画像(画像に写る顔の部分)を検出して、顔検出結果を出力するものである。顔画像の検出は、例えば、顔の輝度分布の情報が記録されているテンプレートを利用してマッチングを行い、画像の中から目、鼻、口および輪郭等に基づいて顔画像を検出することによって行われ、顔画像の検出によって、それぞれの顔画像の中心座標(例えば、ピクセル座標)と、顔画像のサイズとが顔検出結果として出力される。ここで、顔画像の中心座標とは、例えば、目、鼻、口、および輪郭等から算出される顔画像の中心位置であり、顔の向きによって異なるが、例えば、正面を向いている場合は鼻の中央付近の座標が顔画像の中心座標として算出され、また、例えば、横向きの場合等は、輪郭線の中央付近の座標が顔画像の中心座標として算出される。また、ここで顔画像のサイズとは、例えば、顔画像の中心座標と輪郭線の顎部(または頭頂部)との間の距離を2倍することで算出される。
顔画像データ生成部20は、それぞれの画像データに基づく画像から顔画像部分を抜き出して顔画像データを生成し、顔画像データを出力する。
図2の顔画像クロップ部40は、上述の顔画像の中心座標と顔画像のサイズとに基づいて、それぞれの顔画像をクロッピング(切り抜き)し、プレ顔画像データを生成する。また、エンコード部42は、プレ顔画像データを取得して、所定の規格に対応するようにエンコードすることで顔画像データを生成する。なお、クロッピングおよびエンコードの詳細については後述する。
図1の端末データ送受信部22は、所定のプロトコル、例えば、TCP/IP(Transmission Control Protocol/Internet Protocol)に基づいて、サーバ14等と各種データの送受信を行うものであり、顔画像データ等をサーバ14へ送信し、後述する中心人物判定結果等をサーバ14から受信する。
端末格納部24は、上述の複数の画像データ、顔検出結果、複数の顔画像データ等を格納するものであり、例えば、磁気テープ、磁気ディスク、光ディスク、光磁気ディスクおよびフラッシュメモリ等の記録媒体によって構成される。
端末制御部26は、情報端末12の各部に直接的または間接的に接続し、操作部28からのユーザの指示に基づいて、または、図示しない内部メモリ等に記憶された所定のプログラム等に基づいて、情報端末12の各部を制御するものである。また、例えば、画像データ取得部16による画像データの取得や、表示部30における画像の表示、中心人物判定結果の利用等は端末制御部26を通じて行われる。
操作部28は、ユーザから各種指示を受け、これらの指示を端末制御部26へ出力するものであり、例えば、各種ボタン、キーボード、マウス等、種々の公知の構成を利用することができる。なお、表示部30と一体としてタッチパネルディスプレイとして構成されてもよい。
表示部30は、端末制御部26の指示に基づいて、上述の画像データまたは顔画像データに基づく画像および操作用の画像等を表示するものであり、例えば、液晶ディスプレイ、有機ELディスプレイ等が挙げられる。
サーバ14のサーバデータ送受信部32は、上述の端末データ送受信部22と同様に、所定のプロトコル、例えば、TCP/IPに基づいて、情報端末12等と各種データの送受信を行うものであり、情報端末12から顔画像データ等を受信し、情報端末12へ同一人物判定結果等を送信する。
中心人物判定処理部34は、複数の顔画像データ等に基づいて中心人物判定処理を行って、中心人物判定結果を出力する。
図3の顔特徴量算出部44は、例えば、顔画像データに基づく顔画像から、顔画像における目、鼻、口および輪郭等の顔パーツを検出し、顔パーツの位置情報を顔特徴量として算出する。例えば、顔画像の鼻部分の特徴量としては、鼻部分の中心座標(画像データまたは顔画像データにおけるピクセル座標)(x、y)=(43px、122px)、鼻部分のサイズ(横、縦)=(6px、13px)のように算出される。
顔モデルデータ生成部46は、複数の顔特徴量に基づいて顔モデルデータを生成し、顔モデルデータを出力する。顔モデルデータとしては、例えば、上述の顔パーツの位置情報に基づいて算出された顔パーツの位置関係を表わすベクトル量等が挙げられる。
中心人物判定部48は、例えば、顔モデルデータ同士の差分に基づいて同一人物判定処理を行い、最も顔画像データの多い人物を中心人物として中心人物判定結果を出力する。なお、中心人物判定結果としては、中心人物の情報のみに限定されず、同一人物判定処理によって判定された中心人物以外の人物の情報を含んでもよく、例えば、中心人物を含むそれぞれの登場人物とその登場回数の一覧表等が挙げられる。
図1のサーバ格納部36は、上述の端末格納部24と同様に、上述の顔検出結果、複数の顔画像データ、中心人物判定結果等を格納するものであり、例えば、磁気テープ、磁気ディスク、光ディスク、光磁気ディスクおよびフラッシュメモリ等の記録媒体によって構成される。
サーバ制御部38は、上述の端末制御部26と同様に、サーバ14の各部に直接的または間接的に接続し、情報端末12からのユーザの指示に基づいて、または、図示しない内部メモリ等に記憶された所定のプログラム等に基づいて、サーバ14の各部を制御するものである。また、例えば、サーバデータ送受信部32によるデータの送受信、中心人物判定処理部34における中心人物判定処理、およびサーバ格納部36における格納データの検索等はサーバ制御部38を通じて行われる。
次に、図4のフローチャートに基づいて、図1の中心人物判定システム10の動作(本発明の中心人物判定方法)を説明する。なお、情報端末12およびサーバ14の各ステップの処理時間としては、上述の表1のとおりである。つまり、情報端末12として、SAMSUNG社製Galaxy S4 SC-04Eに相当する性能を有する情報端末が想定され、サーバ14として、DELL社製PowerEdge R420に相当する性能を有するサーバが想定される。
ステップS1に示すように、情報端末12の画像データ取得部16は、端末制御部26を介した操作部28からのユーザの指示に基づいて、画像データ取得部16に接続された外部の記録装置または画像データ取得部16に設置された記録媒体等から中心人物判定を行う複数の画像データを取得する。画像データ取得部16によって取得された複数の画像データは、顔検出部18に出力される。また、端末格納部24に出力されてもよい。なお、画像データ取得部16による複数の画像データの取得は必須ではなく、例えば、予め端末格納部24に格納された複数の画像データを利用してもよい。
次に、ステップS2として、複数の画像データのそれぞれの画像データに対して、顔検出部18において顔検出処理を行う。顔検出処理は、例えば、画像データに基づく画像から、公知の顔検出アルゴリズムによって顔画像を検出し、顔画像の中心座標と顔画像のサイズとを顔検出結果として出力するものである。顔検出結果は、顔検出を行った画像データとともに顔画像データ生成部20へ出力される。1枚の画像に複数人の顔が写る場合は、人数分の顔検出結果が出力される。
続くステップS3では、画像データとその画像データにおける顔検出結果とに基づいて顔画像データの生成を行う。まず、ステップS3−1として、図5に示すように、顔画像データ生成部20の顔画像クロップ部40は、図5に示すように、顔検出結果として出力された顔画像の中心座標と顔画像のサイズとに基づいて、顔画像の切り抜き範囲を決定し、決定された切り抜き範囲に基づいて顔画像を切り抜いてプレ顔画像データを生成する。顔画像クロップ部40で生成されたプレ顔画像データは、エンコード部42へ出力される。切り抜き範囲としては、例えば、顔画像の中心座標を中心として一辺の長さが顔画像のサイズの1.5倍となる正方形が挙げられる。顔画像の切り抜き範囲を検出された顔画像のサイズよりも多少広範囲とすることで、顔特徴量算出部44における顔特徴量の算出の精度を補償することができる。なお、切り抜き範囲としては上述のサイズの正方形に限定されず、例えば、顔画像の中心座標を中心とした円を切り抜き範囲としてもよく、また、顔の輪郭線に沿った顔の形を切り抜き範囲としてもよい。
ステップS3−2では、エンコード部42は、プレ顔画像データを取得して、プレ顔画像データを所定の規格に対応するようにエンコードして顔画像データを生成する。顔画像のサイズは、元画像データのサイズによってそれぞれ異なり、端末データ送受信部22によるデータの送信や顔特徴量算出部44における顔特徴量の算出に影響するため、各種処理および比較をしやすくするために、所定の規格に対応するようにエンコードすることで顔画像データを生成する。なお、複数の画像データ(元画像データ)のデータ容量は様々であるが、複数の画像データとしては、例えば、平均すると約80kB(JPEG形式のVGAサイズで一般的と考えられるデータ容量)となるものが想定される。
エンコード部42は、例えば、顔画像のサイズが100px×100pxとなるように顔画像のサイズを一律に揃え(リサイズ)、また、データ容量が5kB以下となるようにプレ画像データをエンコードする。
また、エンコード部42は、顔画像データを生成する際に、顔画像データの元画像データが分かるように、また、顔画像が元画像データに基づく画像(元画像)に写るどの顔画像か分かるように情報の紐付けを行う。情報の紐付けとしては、例えば、顔画像データの生成の際に、顔画像データのデータ名を「(元画像データのデータ名)_(顔画像の中心座標 x_y)_(顔のサイズ).jpg」という規則に基づいて命名することで行ってもよい。具体的には、「A.jpg」という元画像(元画像データ)から切り抜いた、「中心座標:(x、y)=(200px、150px)(元画像の左下端を原点とした。)、顔画像のサイズ:50px(元画像における顔画像のサイズ)」の顔画像であれば、「A_200_150_50.jpg」とすることで顔画像データと元画像データとを紐付けることができる。なお、紐付けは、上述の例に限定されず、顔画像データのデータ名として元画像データのチェックサムをファイル名に利用してもよく、また、チェックサムデータ自体を顔画像データと結合してもよい。エンコード部42で生成された顔画像データは、端末格納部24へ出力される。
ステップS4として、端末制御部26は、複数の画像データの全ての画像データに対して顔画像データが生成されるまでステップS2、ステップS3(ステップS3−1、S3−2)を繰り返して、全ての画像データに対して顔画像データが生成されたことを確認して、端末格納部24に格納された全ての顔画像データを端末データ送受信部22へ出力する。
例えば、情報端末12の顔検出部18において、1つの顔検出を行う場合には200msの処理時間が掛かるため、400枚の画像データ(1画像1顔)から顔検出を行う場合には、80秒(400×200ms)の処理時間が掛かり、1500枚の画像データ(1画像1顔)から顔検出を行う場合には、300秒(1500×200ms)の処理時間が掛かる。また、例えば、顔画像データ生成部20における顔画像データの生成は、1つの顔画像データあたり20ms掛かるため、400枚の画像データ(1画像1顔)から顔画像データを生成する場合には、8秒(400×20ms)の処理時間が掛かり、1500枚の画像データ(1画像1顔)から顔画像データを生成する場合には、30秒(1500×20ms)の処理時間が掛かる。つまり、400枚の画像データから400枚の顔画像データを生成するには、88秒掛かり、1500枚の画像データから1500枚の顔画像データを生成するには、330秒掛かる。
ステップS5として、端末データ送受信部22は、複数の顔画像データをサーバ14へ送信(アップロード)する。情報端末12とサーバ14とは、例えば、上述のとおり、低速な3G回線(例えば、上り実効値0.7Mbps)によって、インターネット回線を介して相互に接続される。
なお、顔画像データのデータ容量を上述のとおり、約5kBとすると、例えば、400枚の顔画像データ(約2MB:5kB×400)および1500枚の顔画像データ(約7.5MB:5kB×1500)を情報端末12からサーバ14へ送信するために掛かる時間は、以下の表3の通りとなる。
Figure 2015191358
サーバ14は、サーバデータ送受信部32において、情報端末12の端末データ送受信部22から送信された複数の画像データを受信し、ステップS6として、中心人物判定処理部34において、複数の顔画像データに基づいて中心人物判定処理を行って、中心人物判定結果を生成する。
まず、ステップS6−1として、中心人物判定処理部34の顔特徴量算出部44は、複数の顔画像データのそれぞれにおいて顔特徴量を算出し、顔モデルデータ生成部46へ顔特徴量を出力する。ここで、顔特徴量とは、例えば、目(目尻、目頭等)、鼻(大きさ、形状等)、口(口角等)、輪郭等の顔パーツの位置、サイズ、または形状等の情報をいう。
例えば、サーバ14の顔特徴量算出部44において、1つの顔画像データから顔特徴量の算出を行う場合には16msの処理時間が掛かるため、400枚の顔画像データからそれぞれの顔特徴量を算出する場合には、6.4秒(400×16ms)の処理時間が掛かり、また、1500枚の顔画像データからそれぞれの顔特徴量を算出する場合には、24秒(1500×16ms)の処理時間が掛かる。
次に、ステップS6−2として、顔モデルデータ生成部46は、それぞれの顔画像データに対応して、顔特徴量算出部44で算出された顔特徴量に基づいて顔モデルデータを生成し、顔モデルデータを中心人物判定部48へ出力する。なお、顔モデルデータとしては、例えば、顔パーツの位置関係を表わすベクトル量等が挙げられる。
なお、例えば、サーバ14の顔モデルデータ生成部46において、1つの顔特徴量から1つの顔モデルデータを生成する場合には0.4msの処理時間が掛かるため、400枚の顔画像データのそれぞれの顔特徴量からそれぞれの顔モデルデータを生成する場合には、0.16秒(400×0.4ms)の処理時間が掛かり、また、1500枚の顔画像データのそれぞれの顔特徴量からそれぞれの顔モデルデータを生成する場合には、0.6秒(1500×0.4ms)の処理時間が掛かる。
続くステップS6−3では、中心人物判定部48は、顔モデルデータ生成部46によって生成された顔モデルデータ同士を比較し、顔モデルデータ間の類似度を算出することで顔画像データを同一人物ごとに複数のグループに分類(同一人物判定)して、顔画像データの最も多い人物(つまり、登場回数の最も多い人物)を中心人物として判定するとともに、中心人物判定結果を生成する。中心人物判定部48によって生成された中心人物判定結果は、サーバデータ送受信部32へ出力される。なお、中心人物判定部48は、中心人物判定結果として、上述の中心人物として判定された顔画像データの情報のみならず、例えば、以下の表4に示すように顔画像データと対応する人物(分類されたグループ)の情報を、例えば、CVS形式のテキストデータとして出力してもよい。
Figure 2015191358
なお、サーバ14の中心人物判定部48において、複数の顔画像データのそれぞれの顔モデルデータに基づいて中心人物判定を行う場合、例えば、2000顔未満であれば1顔当たり0.01秒の処理時間が掛かるため、400枚の顔画像データのそれぞれの顔モデルデータに基づいて中心人物判定を行う場合には、4秒(0.01s×400)の処理時間が掛かり、また、1500枚の顔画像データのそれぞれの顔特徴量からそれぞれの顔モデルデータを生成する場合には、15秒(0.01s×1500)の処理時間が掛かる。
ステップS7として、サーバデータ送受信部32は、中心人物判定結果を情報端末12へ送信する。実際には、サーバデータ送受信部32が情報端末12から中心人物判定結果のリクエストを受け、リクエストに基づくサーバ制御部38の指示により中心人物判定結果を情報端末12へ送信する。また、中心人物判定結果は、顔画像データの数によってデータ容量が異なるが、上述のとおり、テキストデータであるため顔画像データや画像データと比較してデータ容量が小さく、400枚分で約5kBであり、1500枚分で約19kBである。よって、送信に掛かる時間は、例えば、3G回線(例えば、実効速度0.7Mbps)であっても400枚分で約0.06秒であり、1500枚分で約0.22秒であるため、画像データまたは顔画像データの送信と比較して非常に短時間である。また、一般的に、3G回線等の通信速度は、上り速度よりも下り速度の方が速く、上りの実効速度が0.7Mbpsであれば、下りはその倍以上の速度が出ると考えられる。そのため、実際に掛かる送信時間は、上述の例よりも更に短いと考えられる。
ステップS8として、情報端末12の端末データ送受信部22は、サーバ14から送信された中心人物判定結果を受信する。端末データ送受信部22において受信された中心人物判定結果は、例えば、端末格納部24へ出力され、端末格納部24で格納されてもよく、また、端末制御部26へ出力され、各種の画像処理や表示部30における画像表示等に利用されてもよい。また、中心人物判定結果は、上述の表4に示すように、元画像にどの人物が写っているかだけでなく、人物(顔画像)の配置の情報も含むため、画像商材等を作成する際の画像のレイアウトに利用することができる。
なお、以下の表5は、上述に示した本発明の実施の形態1の中心人物判定システム10による中心人物判定処理時間、情報端末の有する複数の画像データを全てサーバへ送信し、サーバにおいて中心人物判定処理を行った場合(従来技術1)の中心人物判定処理時間および情報端末において中心人物判定処理を行った場合(従来技術2)の中心人物判定処理時間のそれぞれをまとめたものである。なお、上述のとおり、中心人物判定結果の情報端末12への送信時間は非常に短いため省略している。
以下の表5に示すように、画像データの数が400枚の場合であっても、1500枚の場合であっても、本発明の中心人物判定処理時間が最も短いことが分かる。
以上より、本発明の実施の形態1に係る中心人物判定システム10によれば、例えば3G回線などの低速の通信環境下において中心人物判定処理に係る判定処理時間を短縮することができる。また、中心人物判定処理を行う画像データの数が多ければ多いほど、本発明による判定処理時間の短縮の効果は大きくなる。
Figure 2015191358
実施の形態2
また、本発明の中心人物判定システムは、上述の実施の形態1に限定されず、例えば、情報端末およびサーバのそれぞれのデータ処理速度(データ処理時間)と、情報端末とサーバとの間の通信速度(通信処理時間)と応じて、最適な中心人物判定フローを選択し、選択した中心人物判定フローに基づいて中心人物判定処理を行ってもよい。
図6は、本発明の実施の形態2に係る中心人物判定システムの全体構成を示すブロック図である。図6の中心人物判定システム50は、情報端末52とサーバ54とによって構成される。
情報端末52は、画像データ取得部16と、画像データ取得部16より順次接続される顔検出部18a、顔画像データ生成部20a、および中心人物判定処理部34aを備え、これらの各部に接続する端末格納部24を備える。また、情報端末12は、判定処理時間推定部56、判定処理時間推定部56に接続されるフロー選択部58、操作部28および表示部30を備え、これら各部に接続する端末制御部26を備える。
また、サーバ54は、サーバデータ送受信部32、サーバデータ送受信部32より順次接続される顔検出部18b、顔画像データ生成部20b、および中心人物判定処理部34bと、これらの各部に接続するサーバ格納部36とを備え、また、サーバデータ送受信部32、顔検出部18b、顔画像データ生成部20b、中心人物判定処理部34b、およびサーバ格納部36にそれぞれ接続するサーバ制御部38を備える。また、顔検出部18bは、中心人物判定処理部34bに接続する。
なお、情報端末52およびサーバ54において、図1の情報端末12およびサーバ14と同一の構成要素には同一の参照符号を付し、その説明を省略する。また、情報端末52およびサーバ54の顔検出部18a、18bは、図1の情報端末12の顔検出部18と同様の構成を有し、顔画像データ生成部20a、20bは、図1の情報端末12の顔検出部18と同様の構成を有し、中心人物判定処理部34a、34bは、図1のサーバ14の中心人物判定処理部34と同様の構成を備える。また、同一の構成要素であっても、取り扱うデータや処理の一部が異なる場合には、その旨を説明する。
情報端末52の画像データ取得部16、顔検出部18a、顔画像データ生成部20a、端末データ送受信部22、端末格納部24、操作部28および表示部30は、端末格納部24が中心人物判定処理部34aと接続する点を除いて、それぞれ実施の形態1の情報端末12の対応する各部と同様である。また、情報端末52の中心人物判定処理部34aは、実施の形態1のサーバ14の中心人物判定処理部34と同様の構成を備えるが、複数の画像データと顔検出部18aによる顔検出結果とに基づいて中心人物判定処理を行う点で、顔検出部18による顔検出結果と顔画像データ生成部20によって生成される顔画像データとに基づいて中心人物判定処理を行うサーバ14の中心人物判定処理部34と異なる。
また、判定処理時間推定部56は、情報端末52の通信環境と情報端末52およびサーバ54のデータ処理速度とに応じて後述する3種類の中心人物判定フローのそれぞれの中心人物判定フローに掛かる判定処理時間を推定する。また、判定処理時間の推定の詳細については後述する。なお、通信環境としては、例えば、上述の低速な3G回線と、高速なLTE(Long Term Evolution)と呼ばれる移動通信システム(以下LTE回線)を利用する場合(例えば、上り実効値8.4Mbps)とが考えられる。
フロー選択部58は、上述の判定処理時間に基づいて上述の3種類の中心人物判定フローのうち、いずれかの中心人物判定フローを選択する。具体的には、フロー選択部58は、3種類の中心人物判定フローのうち最も判定処理時間の短い中心人物判定フローを選択する。
また、サーバ54は、図1のサーバ14と同様に、サーバデータ送受信部32と中心人物判定処理部34bとを有し、サーバデータ送受信部32と中心人物判定処理部34bとの間に順次接続される顔検出部18bと顔画像データ生成部20bとを備える。サーバ54の顔検出部18bは顔画像データ生成部20bに接続するとともに、中心人物判定処理部34bに接続し、顔画像データ生成部20bは、中心人物判定処理部34bに接続する。また、顔検出部18bは、中心人物判定処理部34bに接続し、サーバ格納部36は、サーバデータ送受信部32、中心人物判定処理部34bの他に、顔検出部18bおよび顔画像データ生成部20bに接続する。また、サーバ制御部38は、サーバデータ送受信部32、顔検出部18b、顔画像データ生成部20b、中心人物判定処理部34bおよびサーバ格納部36のそれぞれに接続する。
(第1の判定フロー)
3種類の中心人物判定フローのうち、第1の判定フローは、図4のフローのステップS2以降と同じであり、図7に示すように、情報端末52における顔検出部18による顔検出(ステップS2)、顔画像データ生成部20による顔画像データの生成(ステップS3)、端末制御部26による顔画像データの生成の確認(ステップS4)、端末データ送受信部22による複数の顔画像データの送信(ステップS5)、サーバ54の中心人物判定処理部34による顔画像データに基づく中心人物判定処理(ステップS6)、サーバデータ送受信部32による中心人物判定結果の送信(ステップS7)、および情報端末52の端末データ送受信部22による中心人物判定結果の受信(ステップS8)からなる。
(第2の判定フロー)
また、第2の判定フローは、図8に示すように、情報端末52の端末データ送受信部による複数の画像データの送信(ステップS9)、サーバ54の顔検出部18による顔検出(ステップS2)、サーバ54の中心人物判定処理部34による顔検出結果と複数の画像データとに基づく中心人物判定処理(ステップS6)、サーバデータ送受信部32による中心人物判定結果の送信(ステップS7)、および情報端末52の端末データ送受信部22による中心人物判定結果の受信(ステップS8)からなる。
なお、第2の判定フローにおける中心人物判定処理は、第1の判定フローと異なり、顔画像データに基づく中心人物判定処理ではなく、画像データに基づく中心人物判定処理である。よって、第2の判定フローでは顔画像データの生成は不要である。
(第3の判定フロー)
また、第3の判定フローは、図9に示すように、情報端末52のみで行われるものであり、情報端末52における顔検出部18による顔検出(ステップS2)、および情報端末52の中心人物判定処理部34による顔検出結果と複数の画像データとに基づく中心人物判定処理(ステップS6)からなる。
なお、第2の判定フローと同様に、第3の判定フローにおける中心人物判定処理は、顔画像データに基づく中心人物判定処理ではなく、画像データに基づく中心人物判定処理である。よって、第3の判定フローでは顔画像データの生成は不要である。
次に、図10のフローチャートに基づいて、図6の中心人物判定システム50の動作(本発明の中心人物判定方法)を説明する。
実施の形態1と同じく、ステップS1に示すように、情報端末52の画像データ取得部16は、端末制御部26を介した操作部28からのユーザの指示に基づいて、画像データ取得部16に接続された外部の記録装置または画像データ取得部16に設置された記録媒体等から中心人物判定を行う複数の画像データを取得する。なお、画像データ取得部16による複数の画像データの取得は必須ではなく、例えば、予め端末格納部24に格納された複数の画像データを利用してもよい。
ここで画像データ取得部16は、複数の画像データとして、例えば、100枚の画像データ(VGAサイズ、平均80kB、1画像平均1.5顔)を取得する。また、情報端末52およびサーバ54の各ステップの処理時間としては、実施の形態1と同様に、上述の表1のとおりである。
続くステップS10では、端末制御部26は、判定処理時間推定部56を制御して、第1の判定フロー、第2の判定フローおよび第3の判定フローのそれぞれによって掛かる中心人物判定処理の判定処理時間をそれぞれ推定する。
判定処理時間は、情報端末52およびサーバ54のデータ処理速度、または、情報端末とサーバ54との間の通信速度(通信環境)によって異なるが、判定処理時間推定部56は、例えば、1つの画像データについて、第1の判定フロー、第2の判定フローおよび第3の判定フローによって中心人物判定処理をそれぞれ行って、判定処理実時間をそれぞれ算出し、1枚に掛かる判定処理時間と画像データの数とに基づいて判定処理時間を推定する。なお、中心人物判定結果の送信時間については実施の形態1と同様の理由により省略する。
なお、中心人物の判定は、処理時間と顔の数(顔モデルデータの数)とが比例関係に無いため、例えば、以下の表6に示すように、顔の数に対する処理時間の見込みを計算するためのテーブルを用意しておいてもよく、また、顔の数に対する処理時間の予測値を算出するための式を用意しておいてもよい。
また、顔の数も、実際に顔検出処理を行わなければ分からないものであるため、例えば、過去の統計から画像1枚当たりに含まれる顔の数を算出しておき、それを元に全体の顔の数を予測してもよく、また、平均して、画像に顔が1つ写っている場合、2つ写っている場合、3つ写っている場合等、複数のパターンを用意しておき、それぞれのパターンについて処理時間を算出してもよい。
Figure 2015191358
第1の判定フローの場合、判定処理時間は、以下の(1)式で表わされる。
(顔検出時間)×顔の数+(顔の数×顔画像平均ファイルサイズ)/(上り通信速度)+(顔特徴量算出時間+顔モデルデータ生成時間)×顔の数+(中心人物判定時間) ……(1)
ここで、顔の数を150個、顔画像のファイルサイズを5kB/1顔画像、サーバ54における中心人物判定時間を表6のとおり(0.01秒(10ms))×顔の数とすると、
200ms×150+(150×5kB)/上り通信速度+41ms×150+10ms×150
= 750kB/上り通信速度+37.7(s)
となる。
上り通信速度の実行値が、例えば、3G回線(0.7Mbps)の場合とLTE回線(8.4Mbps)の場合とをそれぞれ想定すると、3G回線の場合は、
750kB/0.7Mbps=750×8/0.7×1000
= 8.6(s)
となり、LTE回線の場合は、
750kB/8.4Mbps=750×8/8.4×1000
= 0.7(s)
となる。
以上より、判定処理時間推定部56は、第1の判定フローによる判定処理時間を、3G回線の場合に46.3秒と推定し、LTE回線の場合に38.4秒と推定する。
また、第2の判定フローの場合、判定処理時間は、以下の(2)式で表わされる。
(元画像枚数×平均データサイズ)/(上り通信速度)+(顔検出時間+顔特徴量算出時間+顔モデルデータ生成時間)×顔の数+(中心人物判定時間) ……(2)
ここで、画像データ(VGAサイズ、平均80kB)の枚数100枚、顔の数150個、サーバ54における中心人物判定時間を表6のとおりを(0.01秒)×顔の数とすると、
(100×80kB)/上り通信速度+81ms×150+10ms×150
= 8000kB/上り通信速度+13.7(s)
となる。
上り通信速度の実効値が、例えば、3G回線(0.7Mbps)の場合とLTE回線(8.4Mbps)の場合とをそれぞれ想定すると、3G回線の場合は、
8000kB/0.7Mbps=8000×8/0.7×1000
= 91.4(s)
となり、LTE回線の場合は、
8000kB/8.4Mbps=8000×8/8.4×1000
= 7.6(s)
となる。
以上より、判定処理時間推定部56は、第2の判定フローによる判定処理時間を、3G回線の場合に105.1秒と推定し、LTE回線の場合に21.3秒と推定する。
また、第3の判定フローの場合、判定処理時間は、以下の(3)式で表わされる。
(顔検出時間+顔特徴量算出時間+顔モデルデータ生成時間)×顔の数+(中心人物判定時間) ……(3)
ここで、顔の数150個、情報端末52における中心人物判定時間を表6のとおり(0.1秒(100ms))×顔の数とすると、
405ms×150+100ms×150 = 75.8(s)
となる。
以上より、判定処理時間推定部56は、第3の判定フローによる判定処理時間を75.8秒と推定する。
そして、ステップS11として、フロー選択部58は、判定処理時間推定部56によって推定されたそれぞれの判定処理時間のうち最も処理時間の短いフローを選択し、選択されたフローの情報を端末制御部26へ出力する。
上述のとおり、画像100枚、顔の数150個の場合、フロー選択部58は、情報端末52が3G回線に接続されている場合には第1の処理フローを選択し、また、情報端末52がLTE回線に接続されている場合には第2の処理フローを選択する。
最後に、ステップS12として、端末制御部26は、フロー選択部58によって選択された処理フローに基づいて、情報端末52およびサーバ54または情報端末52の各部を制御して、複数の画像データに対して中心人物判定処理を行い、中心人物判定結果を取得する。
上述のとおり、本発明の実施の形態2に係る中心人物判定システム50によれば、通信環境と情報端末およびサーバのデータ処理速度とに基づいて最適な中心人物判定処理フローを選択することができ、また、中心人物判定処理に係る判定処理時間を削減することができる。
また、本発明における中心人物判定処理は、上述の顔検出、顔特徴量の算出(顔パーツの検出)、顔モデルデータの生成、中心人物判定(同一人物判定)という一連のフローに限定されず、種々の公知の中心人物判定処理および同一人物判定処理を利用することができる。
なお、情報端末としては、データ処理速度が低速なもの、例えば、顔検出から顔モデルデータの生成までに掛かる時間が300ms以上となるもの(例えば、上述のSAMSUNG社製Galaxy S4 SC-04E)を想定しており、また、サーバとしては、データ処理速度が高速なもの、例えば、顔検出から顔モデルデータの生成までに掛かる時間が300ms未満となるもの(例えば、上述のDELL社製PowerEdge R420)を想定しているが、情報端末およびサーバにおけるデータ処理速度は技術の進歩に応じて向上するものであり、これらに限定されるものではない。
また、通信速度としては、3G回線以下の通信速度を低速とし、LTE回線以上の通信速度のものを高速としているが、通信環境によっては、LTE回線であっても通信速度の出ない場合が考えられるため、例えば、実効速度が上り3.6Mbps、下り7.2Mbps以下の場合を低速とし、これらを超える場合を高速としてもよい。なお、上述のデータ処理速度と同様に、通信速度は、技術の進歩に応じて向上するものであり、これらに限定されるものではない。
なお、上述の本発明の中心人物判定方法は、中心人物判定プログラムを実行することによって情報端末、または情報端末およびサーバにおいて処理され得る。例えば、本発明の中心人物判定プログラムは、上述した中心人物判定フローの各ステップを情報端末、または情報端末およびサーバ、具体的にはそれらのCPUに行わせる手順を有するものである。これらの手順からなるプログラムは、1つまたは複数のプログラムモジュールとして構成されていてもよい。
これらの情報端末、または情報端末およびサーバが実行する手順からなる中心人物判定プログラムは、情報端末、または情報端末およびサーバの図示しない内部メモリ等に記憶されるものであってもよく、記録媒体に記憶されるものであってもよく、実行時に、当該CPU等によって、内部メモリまたは記録媒体から読み出されて実行されるものである。
したがって、本発明は、上述の中心人物判定方法を情報端末、または情報端末およびサーバに実行させるための中心人物判定プログラムを記憶したコンピュータ読み取り可能なメモリもしくは記録媒体であってもよい。
以上、本発明の中心人物判定システム、中心人物判定方法、ならびに中心人物判定プログラムおよび記録媒体について詳細に説明したが、本発明は、上記実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において、各種の改良や変更を行ってもよい。
10、50 中心人物判定システム、 12、52 情報端末、 14、54 サーバ、 16 画像データ取得部、 18、18a、18b 顔検出部、 20、20a、20b 顔画像データ生成部、 22 端末データ送受信部、 24 端末格納部、 26 端末制御部、 28 操作部、 30 表示部、 32 サーバデータ送受信部、 34、34a、34b 中心人物判定処理部、 36 サーバ格納部、 38 サーバ制御部、 40 顔画像クロップ部、 42 エンコード部、 44 顔特徴量算出部、 46 顔モデルデータ生成部、 48 中心人物判定部、 56 判定処理時間推定部、 58 フロー選択部。

Claims (19)

  1. 複数の画像データを有する情報端末とサーバとからなる中心人物判定システムであって、
    前記情報端末は、
    前記複数の画像データに基づく複数の画像について、それぞれ顔検出処理を行い、顔検出結果を生成する顔検出部と、
    前記顔検出結果に基づいて前記複数の画像データに基づく前記複数の画像から、顔画像を切り抜いて複数の顔画像データを生成する顔画像データ生成部と、
    前記複数の顔画像データを前記サーバへ送信し、前記サーバから中心人物判定結果を受信する端末データ送受信部とを備え、
    前記サーバは、
    前記情報端末より取得した前記複数の顔画像データに基づいて中心人物判定処理を行い、前記中心人物判定結果を生成する中心人物判定処理部と、
    前記情報端末より前記複数の顔画像データを受信し、前記情報端末へ前記中心人物判定結果を送信するサーバデータ送受信部とを備えることを特徴とする中心人物判定システム。
  2. 前記顔画像データ生成部は、前記顔検出結果に基づいて前記顔画像の中心位置と前記顔画像のサイズとを算出し、前記顔画像の中心位置と前記顔画像のサイズとに基づいて前記顔画像を切り抜いて前記顔画像データを生成することを特徴とする請求項1に記載の中心人物判定システム。
  3. 前記顔画像データ生成部は、前記顔画像の切り抜かれた元画像のデータ名、前記顔画像の中心位置、前記顔画像のサイズおよび元画像データのチェックサムの少なくとも1つを前記顔画像データのデータ名として使用することを特徴とする請求項2に記載の中心人物判定システム。
  4. 前記顔画像データ生成部は、前記顔画像データの大きさを一律に揃え、且つ前記顔画像データのデータ容量が所定値以下となるようにエンコードを行うことを特徴とする請求項1〜3のいずれか一項に記載の中心人物判定システム。
  5. 複数の画像データを有する情報端末、または前記情報端末とサーバとからなる中心人物判定システムであって、
    前記情報端末と前記サーバとの間の通信速度ならびに前記情報端末および前記サーバのそれぞれのデータ処理速度に応じて、前記情報端末において前記複数の画像データから顔画像データを生成し、前記顔画像データを前記サーバに送信することで中心人物判定処理を行い、前記サーバから中心人物判定結果を受信する第1の判定フロー、前記情報端末から前記複数の画像データを前記サーバに送信することで中心人物判定処理を行い、前記サーバから中心人物判定結果を受信する第2の判定フロー、および前記情報端末において前記複数の画像データから中心人物判定処理を行って中心人物判定結果を生成する第3の判定フローのそれぞれにおいて、前記複数の画像データに基づく中心人物判定処理に掛かる判定処理時間を推定する判定処理時間推定部と、
    前記判定処理時間推定部において前記判定処理時間を推定された前記第1の判定フロー、前記第2の判定フローおよび前記第3の判定フローのうち、前記判定処理時間の最も短い中心人物判定フローを選択するフロー選択部と、
    前記フロー選択部によって選択された前記中心人物判定フローに基づいて前記複数の画像データの中心人物判定処理を行う判定フロー実行部を備え、
    前記判定フロー実行部は、
    前記複数の画像データに基づく複数の画像について、それぞれ顔検出処理を行い、顔検出結果を出力する顔検出部と、
    前記顔検出結果に基づいて生成された前記複数の顔画像データまたは前記顔検出結果および前記複数の画像データに基づいて中心人物判定処理を行って前記中心人物判定結果を生成する中心人物判定処理部とを有することを特徴とする中心人物判定システム。
  6. 前記判定処理時間推定部は、前記判定フロー実行部において、1つの画像データに対して前記第1の判定フロー、前記第2の判定フローおよび前記第3の判定フローのそれぞれを行って、それぞれの判定処理実時間を算出し、前記判定処理実時間に基づいてそれぞれの前記判定処理時間を推定することを特徴とする請求項5に記載の中心人物判定システム。
  7. 複数の画像データに基づく複数の画像について、それぞれ顔検出処理を行い、顔検出結果を生成する顔検出部と、
    前記顔検出結果に基づいて前記複数の画像データに基づく前記複数の画像から、顔画像を切り抜いて複数の顔画像データを生成する顔画像データ生成部と、
    前記複数の顔画像データを前記サーバへ送信し、前記サーバから前記複数の顔画像データに基づく中心人物判定処理によって得られた中心人物判定結果を受信する端末データ送受信部とを備えることを特徴とする情報端末。
  8. 前記顔画像データ生成部は、前記顔検出結果に基づいて前記顔画像の中心位置と前記顔画像のサイズとを算出し、前記顔画像の中心位置と前記顔画像のサイズとに基づいて前記顔画像を切り抜いて前記顔画像データを生成することを特徴とする請求項7に記載の情報端末。
  9. 前記顔画像データ生成部は、前記顔画像の切り抜かれた元画像のデータ名、前記顔画像の中心位置、前記顔画像のサイズおよび元画像データのチェックサムの少なくとも1つを前記顔画像データのデータ名として使用することを特徴とする請求項8に記載の情報端末。
  10. 前記顔画像データ生成部は、前記顔画像データの大きさを一律に揃え、且つ前記顔画像データのデータ容量が所定値以下となるようにエンコードを行うことを特徴とする請求項7〜9のいずれか一項に記載の情報端末。
  11. 複数の画像データを有する情報端末であって、
    前記情報端末とサーバとの間の通信速度ならびに前記情報端末および前記サーバのそれぞれのデータ処理速度に応じて、前記情報端末において前記複数の画像データから顔画像データを生成し、前記顔画像データを前記サーバに送信することで中心人物判定処理を行い、前記サーバから中心人物判定結果を受信する第1の判定フロー、前記情報端末から前記複数の画像データを前記サーバに送信することで中心人物判定処理を行い、前記サーバから中心人物判定結果を受信する第2の判定フロー、および前記情報端末において前記複数の画像データから中心人物判定処理を行って中心人物判定結果を生成する第3の判定フローのそれぞれにおいて、前記複数の画像データに基づく中心人物判定処理に掛かる判定処理時間を推定する判定処理時間推定部と、
    前記判定処理時間推定部において前記判定処理時間を推定された前記第1の判定フロー、前記第2の判定フローおよび前記第3の判定フローのうち、前記判定処理時間の最も短い中心人物判定フローを選択するフロー選択部とを備えることを特徴とする情報端末。
  12. 複数の画像データを有する情報端末とサーバとを利用した中心人物判定方法であって、
    前記情報端末において、前記複数の画像データに基づく複数の画像について、顔検出処理を行って、顔検出結果を生成する顔検出ステップと、
    前記顔検出結果に基づいて前記複数の画像データに基づく前記複数の画像から、顔画像を切り抜いて複数の顔画像データを生成する顔画像データ生成ステップと、
    前記複数の顔画像データを前記サーバへ送信する顔画像データ送信ステップと、
    前記サーバにおいて、前記情報端末より前記複数の顔画像データを受信する顔画像データ受信ステップと、
    前記情報端末より受信した前記複数の顔画像データに基づいて中心人物判定処理を行い、前記中心人物判定結果を生成する中心人物判定処理ステップと、
    前記情報端末へ前記中心人物判定結果を送信する中心人物判定結果送信ステップと、
    前記情報端末において、前記サーバから中心人物判定結果を受信する中心人物判定結果受信ステップを備えることを特徴とする中心人物判定方法。
  13. 前記顔画像データ生成ステップは、前記顔検出結果に基づいて前記顔画像の中心位置と前記顔画像のサイズとを算出し、前記顔画像の中心位置と前記顔画像のサイズとに基づいて前記顔画像を切り抜いて前記顔画像データを生成することを特徴とする請求項12に記載の中心人物判定方法。
  14. 前記顔画像データ生成ステップは、前記顔画像の切り抜かれた元画像のデータ名、前記顔画像の中心位置、前記顔画像のサイズおよび元画像データのチェックサムの少なくとも1つを前記顔画像データのデータ名として使用することを特徴とする請求項13に記載の中心人物判定方法。
  15. 前記顔画像データ生成ステップは、前記顔画像データの大きさを一律に揃え、且つ前記顔画像データのデータ容量が所定値以下となるようにエンコードを行うことを特徴とする請求項12〜14のいずれか一項に記載の中心人物判定方法。
  16. 複数の画像データを有する情報端末、または前記情報端末とサーバとを利用した中心人物判定方法であって、
    前記情報端末において、前記情報端末と前記サーバとの通信速度ならびに前記情報端末および前記サーバのそれぞれのデータ処理速度に応じて、前記情報端末において前記複数の画像データから顔画像データを生成し、前記顔画像データを前記サーバに送信することで中心人物判定処理を行い、前記サーバから中心人物判定結果を受信する第1の判定フロー、前記情報端末から前記複数の画像データを前記サーバに送信することで中心人物判定処理を行い、前記サーバから中心人物判定結果を受信する第2の判定フロー、および前記情報端末において前記複数の画像データから中心人物判定処理を行って中心人物判定結果を生成する第3の判定フローのそれぞれにおいて、前記複数の画像データに基づく中心人物判定処理に掛かる判定処理時間を推定する判定処理時間推定ステップと、
    前記判定処理時間推定ステップにおいて前記判定処理時間を推定された前記第1の判定フロー、前記第2の判定フローおよび前記第3の判定フローのうち、前記判定処理時間の最も短い中心人物判定フローを選択するフロー選択ステップと、
    前記フロー選択ステップによって選択された前記中心人物判定フローに基づいて前記複数の画像データの中心人物判定処理を行って前記中心人物判定結果を生成する判定フロー実行ステップを備え、
    前記判定フロー実行ステップは、
    前記複数の画像データに基づく複数の画像について、それぞれ顔検出処理を行い、顔検出結果を出力する顔検出ステップと、
    前記顔検出結果に基づいて生成された前記複数の顔画像データまたは前記顔検出結果および前記複数の画像データに基づいて中心人物判定処理を行って前記中心人物判定結果を生成する中心人物判定処理ステップとを有することを特徴とする中心人物判定方法。
  17. 前記判定処理時間推定ステップは、1つの画像データに対して前記第1の判定フロー、前記第2の判定フローおよび前記第3の判定フローのそれぞれを行って、それぞれの判定処理実時間を算出し、前記判定処理実時間に基づいてそれぞれの前記判定処理時間を推定することを特徴とする請求項16に記載の中心人物判定方法。
  18. 前記情報端末または前記情報端末および前記サーバに、請求項12〜17のいずれか一項に記載の中心人物判定方法の各ステップを実行させるための中心人物判定プログラム。
  19. 請求項18に記載の中心人物判定処理プログラムが記録されたコンピュータ読取可能な記録媒体。
JP2014066990A 2014-03-27 2014-03-27 中心人物判定システム、中心人物判定システムに利用される情報端末、中心人物判定方法、ならびに中心人物判定プログラムおよび記録媒体 Pending JP2015191358A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014066990A JP2015191358A (ja) 2014-03-27 2014-03-27 中心人物判定システム、中心人物判定システムに利用される情報端末、中心人物判定方法、ならびに中心人物判定プログラムおよび記録媒体
US14/669,656 US9721145B2 (en) 2014-03-27 2015-03-26 Central person determining system, information terminal used in the same, central person determining method, and recording medium for central person determining program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014066990A JP2015191358A (ja) 2014-03-27 2014-03-27 中心人物判定システム、中心人物判定システムに利用される情報端末、中心人物判定方法、ならびに中心人物判定プログラムおよび記録媒体

Publications (1)

Publication Number Publication Date
JP2015191358A true JP2015191358A (ja) 2015-11-02

Family

ID=54190822

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014066990A Pending JP2015191358A (ja) 2014-03-27 2014-03-27 中心人物判定システム、中心人物判定システムに利用される情報端末、中心人物判定方法、ならびに中心人物判定プログラムおよび記録媒体

Country Status (2)

Country Link
US (1) US9721145B2 (ja)
JP (1) JP2015191358A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150277550A1 (en) 2014-04-01 2015-10-01 Moju Labs, Inc. Face-Centered Motion-Based Content Navigation
JP7043255B2 (ja) 2017-12-28 2022-03-29 キヤノン株式会社 電子機器及びその制御方法
JP2019121857A (ja) * 2017-12-28 2019-07-22 キヤノン株式会社 電子機器及びその制御方法
JP7419723B2 (ja) * 2019-09-25 2024-01-23 株式会社リコー 画像処理システム、画像処理装置および方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001142819A (ja) * 1999-11-10 2001-05-25 Navitime Japan Co Ltd 地図描画方法および装置
JP2005012326A (ja) * 2003-06-17 2005-01-13 Konica Minolta Opto Inc 画像処理装置及び撮影装置
JP2006065613A (ja) * 2004-08-27 2006-03-09 Fuji Photo Film Co Ltd 特定画像領域区画装置および方法,ならびに特定画像領域区画処理をコンピュータに実行させるプログラム
JP2007140897A (ja) * 2005-11-18 2007-06-07 Fujifilm Corp 画像検索装置および方法並びにプログラム
JP2007226741A (ja) * 2006-02-27 2007-09-06 Mitsubishi Electric Corp 顔照合システム
US20080080743A1 (en) * 2006-09-29 2008-04-03 Pittsburgh Pattern Recognition, Inc. Video retrieval system for human face content
JP2011257799A (ja) * 2010-06-04 2011-12-22 Konica Minolta Business Technologies Inc プリントサーバ及び印刷制御システム並びに印刷制御方法
JP2013196174A (ja) * 2012-03-16 2013-09-30 Nec Corp 処理分担制御装置、演算装置、演算システム、処理分担制御方法、及び処理分担制御プログラム
JP2013225256A (ja) * 2012-04-23 2013-10-31 Konica Minolta Inc 画像形成システム、印刷ジョブ送信装置、印刷ジョブ送信方法および印刷ジョブ送信プログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7627148B2 (en) 2004-07-06 2009-12-01 Fujifilm Corporation Image data processing apparatus and method, and image data processing program
US8488847B2 (en) 2005-11-25 2013-07-16 Nikon Corporation Electronic camera and image processing device
JP2007148691A (ja) 2005-11-25 2007-06-14 Nikon Corp 画像処理装置
JP2008160354A (ja) 2006-12-22 2008-07-10 Matsushita Electric Ind Co Ltd 映像出力装置
KR100840021B1 (ko) * 2007-11-05 2008-06-20 (주)올라웍스 특성 데이터를 이용하여 디지털 데이터에 포함된 인물의얼굴에 대해 인식하는 방법 및 시스템
JP5127686B2 (ja) * 2008-12-11 2013-01-23 キヤノン株式会社 画像処理装置および画像処理方法、ならびに、撮像装置
JP5569269B2 (ja) * 2010-09-06 2014-08-13 ソニー株式会社 端末装置、情報処理システム、依頼先選択方法、及びプログラム
US9031531B2 (en) * 2012-11-20 2015-05-12 At&T Intellectual Property I, L.P. Distributed computing task costing with a mobile device

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001142819A (ja) * 1999-11-10 2001-05-25 Navitime Japan Co Ltd 地図描画方法および装置
JP2005012326A (ja) * 2003-06-17 2005-01-13 Konica Minolta Opto Inc 画像処理装置及び撮影装置
JP2006065613A (ja) * 2004-08-27 2006-03-09 Fuji Photo Film Co Ltd 特定画像領域区画装置および方法,ならびに特定画像領域区画処理をコンピュータに実行させるプログラム
JP2007140897A (ja) * 2005-11-18 2007-06-07 Fujifilm Corp 画像検索装置および方法並びにプログラム
JP2007226741A (ja) * 2006-02-27 2007-09-06 Mitsubishi Electric Corp 顔照合システム
US20080080743A1 (en) * 2006-09-29 2008-04-03 Pittsburgh Pattern Recognition, Inc. Video retrieval system for human face content
JP2011257799A (ja) * 2010-06-04 2011-12-22 Konica Minolta Business Technologies Inc プリントサーバ及び印刷制御システム並びに印刷制御方法
JP2013196174A (ja) * 2012-03-16 2013-09-30 Nec Corp 処理分担制御装置、演算装置、演算システム、処理分担制御方法、及び処理分担制御プログラム
JP2013225256A (ja) * 2012-04-23 2013-10-31 Konica Minolta Inc 画像形成システム、印刷ジョブ送信装置、印刷ジョブ送信方法および印刷ジョブ送信プログラム

Also Published As

Publication number Publication date
US9721145B2 (en) 2017-08-01
US20150278581A1 (en) 2015-10-01

Similar Documents

Publication Publication Date Title
WO2018219120A1 (zh) 图像显示方法、图像处理方法、装置、终端及服务器
US9710923B2 (en) Information processing system, information processing device, imaging device, and information processing method
CN110612531A (zh) 数字图像的智能自动裁剪
EP3308536B1 (en) Determination of exposure time for an image frame
US20170161553A1 (en) Method and electronic device for capturing photo
US9854174B2 (en) Shot image processing method and apparatus
US10084986B2 (en) System and method for video call using augmented reality
KR101620933B1 (ko) 제스쳐 인식 메커니즘을 제공하는 방법 및 장치
CN111353336B (zh) 图像处理方法、装置及设备
WO2016165614A1 (zh) 一种即时视频中的表情识别方法和电子设备
EP2709062A2 (en) Image processing device, image processing method, and computer readable medium
JP2015191358A (ja) 中心人物判定システム、中心人物判定システムに利用される情報端末、中心人物判定方法、ならびに中心人物判定プログラムおよび記録媒体
CN108234879A (zh) 一种获取滑动变焦视频的方法和装置
WO2023005813A1 (zh) 图像方向调整方法、装置、存储介质及电子设备
WO2018028253A1 (zh) 一种信息处理方法、装置及存储介质
CN111311733A (zh) 三维模型处理方法及装置、处理器、电子设备及存储介质
CN113362243A (zh) 模型训练方法、图像处理方法及装置、介质和电子设备
JP6290020B2 (ja) 画像処理装置、画像処理方法、およびプログラム
KR102389457B1 (ko) 이미지 변환 장치, 방법 및 컴퓨터 판독 가능한 기록매체
US10360943B2 (en) Method, device and system for editing video
EP4300446A1 (en) Methods and systems for detecting fraud during biometric identity verification
JP2016086245A (ja) 画像処理装置、画像処理システム、画像処理装置の制御方法およびプログラム
JP5451883B2 (ja) 頭部検出方法、頭部検出装置、属性判定方法、属性判定装置、プログラム、記録媒体および属性判定システム
US10354125B2 (en) Photograph processing method and system
CN114973347B (zh) 一种活体检测方法、装置及设备

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160308

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160502

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20160621