JP7148857B2 - 情報処理システム、情報処理方法及びプログラム - Google Patents

情報処理システム、情報処理方法及びプログラム Download PDF

Info

Publication number
JP7148857B2
JP7148857B2 JP2018108326A JP2018108326A JP7148857B2 JP 7148857 B2 JP7148857 B2 JP 7148857B2 JP 2018108326 A JP2018108326 A JP 2018108326A JP 2018108326 A JP2018108326 A JP 2018108326A JP 7148857 B2 JP7148857 B2 JP 7148857B2
Authority
JP
Japan
Prior art keywords
appearance
information processing
content
persons
processing system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018108326A
Other languages
English (en)
Other versions
JP2019213072A (ja
Inventor
典孝 志村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2018108326A priority Critical patent/JP7148857B2/ja
Publication of JP2019213072A publication Critical patent/JP2019213072A/ja
Application granted granted Critical
Publication of JP7148857B2 publication Critical patent/JP7148857B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、情報処理システム、情報処理方法及びプログラムに関する。
特許文献1には、入力映像に出現する対象物の登場率に基づいて入力映像を編集し、新規映像を生成する映像生成装置が開示されている。
国際公開第2007/077713号
特許文献1に例示されている映像生成装置は、入力映像に対象物が出現した比率を考慮して、新規映像の提示長を制御している。しかしながら、対象物と出現比率との関係のみを考慮するだけでは、動画等のコンテンツ(content)の編集支援に対する要求を十分に満足できない場合があった。
本発明は、上述の課題に鑑みてなされたものであって、好適にコンテンツの編集支援を行い得る情報処理システム、情報処理方法及びプログラムを提供することを目的とする。
本発明の一観点によれば、コンテンツに出現している複数の人物を生体照合により検出する照合部と、前記複数の人物の各々の属性を取得する属性取得部と、前記コンテンツへの前記複数の人物の出現の多さを示す出現量を前記属性ごとに取得する出現量取得部と、を備えることを特徴とする情報処理システムが提供される。
本発明の他の一観点によれば、コンテンツに出現している複数の人物を生体照合により検出するステップと、前記複数の人物の各々の属性を取得するステップと、前記コンテンツへの前記複数の人物の出現の多さを示す出現量を前記属性ごとに取得するステップと、を備えることを特徴とする情報処理方法が提供される。
本発明の他の一観点によれば、コンピュータに、コンテンツに出現している複数の人物を生体照合により検出するステップと、前記複数の人物の各々の属性を取得するステップと、前記コンテンツへの前記複数の人物の出現の多さを示す出現量を前記属性ごとに取得するステップと、を備えることを特徴とする情報処理方法を実行させるためのプログラムが提供される。
本発明によれば、好適にコンテンツの編集支援を行い得る情報処理システム、情報処理方法及びプログラムを提供することができる。
第1実施形態に係る情報処理システムのハードウェア構成例を示すブロック図である。 第1実施形態に係る情報処理システムの機能ブロック図である。 第1実施形態に係る情報処理システムにより行われる処理の概略を示すフローチャートである。 選挙演説動画からの人物の顔の検出例を模式的に示す図である。 候補者データベースの構成例を示す表である。 選挙演説動画に出現している各人物の出現時間の取得例を示す表である。 合算された出現時間の表示例を示す図である。 第1実施形態に係る情報処理システムの機能ブロック図である。 第2実施形態に係る情報処理システムにより行われる処理の概略を示すフローチャートである。 第3実施形態に係る情報処理システムの機能ブロック図である。
以下、図面を参照して、本発明の例示的な実施形態を説明する。図面において同様の要素又は対応する要素には同一の符号を付し、その説明を省略又は簡略化することがある。
[第1実施形態]
本実施形態に係る情報処理システムについて、図1乃至図7を参照しつつ説明する。本実施形態の情報処理システムは、動画編集支援に用いられるシステムであり、例えば、テレビジョン放送局、番組制作会社等の放送用動画編集を行う機関において編集者の業務支援のために用いられる。編集者は、あらかじめ撮影された動画の一部の削除、複数の動画の結合等の編集作業を行い、放送用動画を作成する。
ここで、放送の内容によっては、編集時に制約が生じる場合がある。例えば、インタビュー、選挙演説、政策討論等の、選挙の候補者が出現する動画を用いて選挙の報道番組を制作する場合には、放送局の政治的中立性の観点から、政党間で放送時間の差が少ないことが望まれる。そのため、編集者は、動画の作成時に政党間の放送時間を合致させる必要があり、目視による放送時間の測定等の手間のかかる作業を要していた。
また、例えば、複数のチームが参加するスポーツ大会の中継において、編集方針によりあらかじめチームごとの放送時間が決まっている場合には、チームごとの放送時間を考慮して動画の編集を行う必要があることから上述と同様の制約が生じ得る。
本実施形態の情報処理システムは、このような編集内容に制約のある動画編集の作業をより好適に支援するものである。
なお、以下に説明する実施形態では、人物の特定のために生体照合の一種である顔照合を用いる例を説明するが、動画等のコンテンツに含まれる情報から人物の特定が可能なものであれば、これ以外の生体照合を用いるものあってもよい。例えば、顔照合は、耳介、掌形等の顔以外の部位を用いた照合に置き換えられてもよい。また、コンテンツに演説等の人間の声の音声データが含まれる場合には、顔照合は、声紋の特徴等を用いて照合を行う音声照合に置き換えられてもよい。
ここで、コンテンツとは、複数のフレーム画像及び音声を含む動画コンテンツ、複数のフレーム画像のみを含む動画コンテンツ、音声のみを含む音声コンテンツ等を包括する概念である。典型的には、コンテンツとは、テレビジョン放送用動画、インターネット配信用動画、ラジオ放送用音声、インターネットラジオ配信用音声等であり得る。
図1は、情報処理システム100のハードウェア構成例を示すブロック図である。情報処理システム100は、例えば、デスクトップPC(Personal Computer)、ノートPC、タブレットPC等のコンピュータであり得る。
情報処理システム100は、演算、制御及び記憶を行うコンピュータとして、CPU(Central Processing Unit)151、RAM(Random Access Memory)152、ROM(Read Only Memory)153及びHDD(Hard Disk Drive)154を備える。また、情報処理システム100は、通信I/F(インターフェース)155、表示装置156及び入力装置157を備える。CPU151、RAM152、ROM153、HDD154、通信I/F155、表示装置156及び入力装置157は、バス158を介して相互に接続される。なお、表示装置156及び入力装置157は、これらの装置を駆動するための不図示の駆動装置を介してバス158に接続されてもよい。
図1では、情報処理システム100を構成する各部が一体の装置として図示されているが、これらの機能の一部は外付け装置により提供されるものであってもよい。例えば、表示装置156及び入力装置157は、CPU151等を含むコンピュータの機能を構成する部分とは別の外付け装置であってもよい。
CPU151は、ROM153、HDD154等に記憶されたプログラムに従って所定の動作を行うとともに、情報処理システム100の各部を制御する機能をも有するプロセッサである。RAM152は、揮発性記憶媒体から構成され、CPU151の動作に必要な一時的なメモリ領域を提供する。ROM153は、不揮発性記憶媒体から構成され、情報処理システム100の動作に用いられるプログラム等の必要な情報を記憶する。HDD154は、不揮発性記憶媒体から構成され、処理に必要なデータ、情報処理システム100の動作用プログラム等の記憶を行う記憶装置である。
通信I/F155は、イーサネット(登録商標)、Wi-Fi(登録商標)、4G等の規格に基づく通信インターフェースであり、他の装置との通信を行うためのモジュールである。表示装置156は、液晶ディスプレイ、OLEDディスプレイ等であって、画像、文字、インターフェース等の表示に用いられる。入力装置157は、キーボード、ポインティングデバイス等であって、ユーザが情報処理システム100を操作するために用いられる。ポインティングデバイスの例としては、マウス、トラックボール、タッチパネル、ペンタブレット等が挙げられる。表示装置156及び入力装置157は、タッチパネルとして一体に形成されていてもよい。
なお、図1に示されているハードウェア構成は例示であり、これら以外の装置が追加されていてもよく、一部の装置が設けられていなくてもよい。また、一部の装置が同様の機能を有する別の装置に置換されていてもよい。更に、本実施形態の一部の機能がネットワークを介して他の装置により提供されてもよく、本実施形態の機能が複数の装置に分散されて実現されるものであってもよい。例えば、HDD154は、半導体メモリを用いたSSD(Solid State Drive)に置換されていてもよく、クラウドストレージに置換されていてもよい。
図2は、本実施形態に係る情報処理システム100の機能ブロック図である。情報処理システム100は、動画取得部101、顔検出部102、特徴量抽出部103、照合部104、属性取得部105、出現量算出部106、出現量合算部107、表示情報生成部108、及び記憶部109を有する。
CPU151は、ROM153、HDD154等に記憶されたプログラムをRAM152にロードして実行する。これにより、CPU151は、動画取得部101、顔検出部102、特徴量抽出部103、照合部104、属性取得部105、出現量算出部106、出現量合算部107及び表示情報生成部108の機能を実現する。これらの各部で行われる処理については後述する。CPU151は、HDD154を制御することにより記憶部109の機能を実現する。
図3は、本実施形態に係る情報処理システム100により行われる処理の概略を示すフローチャートである。図3を参照しつつ、情報処理システム100により行われる動画編集支援処理を説明する。なお、以下の説明においては、情報処理システム100は、複数の候補者が順次演説を行う選挙演説動画の一部を削除することにより選挙の報道番組用の動画を制作するための支援を行うものとする。しかしながら、情報処理システム100が適用され得る動画編集はこれに限定されるものではなく、例えば複数の動画を切り貼りして1つの動画を生成するものであってもよい。
ステップS101において、動画取得部101は、複数の候補者の選挙演説の動画データを取得する。この動画データの取得は、例えば、記憶部109に記憶されている動画データベースから動画データを読み出すものであってもよく、データサーバ等の情報処理システム100の外部の装置から受信するものであってもよい。
ステップS102において、顔検出部102は、動画データに含まれるフレーム画像データ内から人物の顔が含まれる領域を検出する。図4は、選挙演説動画からの人物の顔の検出例を模式的に示す図である。フレーム画像データ301内には、選挙運動車の上に乗って演説を行う候補者302が表示されている。顔検出部102は、フレーム画像データ301内から自動的に人物の顔を探索して顔を検出する。これにより、図4に示されるように候補者の顔を含む矩形の顔領域R1が抽出される。
ステップS103において、特徴量抽出部103は、顔検出部102により抽出された顔領域R1内の画像から特徴量を抽出する。特徴量とは、例えば、瞳、鼻、口端といった特徴的なパーツの位置等の顔の特徴を示す量であり得る。
ステップS104において、照合部104は、ステップS103の処理で抽出された特徴量と、候補者データベース(候補者DB)に含まれる照合対象の特徴量とを照合し、一致する組み合わせがあるかどうかを判定する。候補者データベース内に特徴量抽出部103により抽出された特徴量と一致する特徴量がある場合(ステップS104においてYES)、検出された人物は選挙の候補者であると判定され、処理はステップS105に移行する。データベース内に特徴量抽出部103により抽出された特徴量と一致する特徴量がない場合(ステップS104においてNO)、検出された人物は選挙の候補者ではないと判定され、処理はステップS108に移行する。
ここで、図5を参照して、候補者データベースの構成について説明する。図5は、候補者データベースの構成例を示す表である。候補者データベースの項目には、図5に示されるように、ある選挙区に立候補している候補者の名前、候補者の顔画像の特徴量、及び候補者が所属する政党が含まれる。特徴量、候補者名、政党は相互に対応付けられている。なお、図5には、特徴量を識別するための特徴量ID(Identifier)のみが図示されているが、実際には特徴量IDに対応する特徴量が候補者データベースに含まれている。
なお、政党は、人物の属性の一例であり、これ以外の属性に対しても本実施形態の処理は適用され得る。例えば、属性は、人物の所属するグループ、スポーツチーム、企業等の人物の所属に関する情報、人物の年齢、性別、職業等の人物自体の分類に関する情報等、種々のものを含み得る。
図5に示されているものに加えて、候補者データベースは、特徴量だけでなく、特徴量の抽出に用いられた顔画像そのものを含んでいてもよい。また、特徴量と政党が対応付けられていれば本実施形態の処理が可能であるため、候補者名は省略されていてもよい。
図4のケースでは、照合部104は、顔領域R1内の画像から抽出された特徴量は、候補者Aの特徴量(特徴量ID:1001)と一致すると判定する。そのため、顔領域R1内の人物は候補者Aであると特定される。
なお、候補者データベースは、情報処理システム100内の記憶部109に記憶されたものであってもよく、データサーバ等の情報処理システム100の外部の装置に記憶されたものであってもよい。候補者データベースは、情報処理システム100のユーザが所属する放送局等が自社内に保有するものであり得る。しかしながら、選挙報道においては、複数の放送局が同じ選挙区の選挙情報を提供することが多いため、候補者データベースは、複数の放送局等が共同で利用できるようにクラウド環境で提供されるものであってもよい。
ステップS105において、属性取得部105は、候補者データベースを参照してステップS103の処理で抽出された特徴量に対応する人物が所属する政党を、候補者の属性を示す情報として取得する。図4の例では、検出された人物は候補者Aであり、候補者Aが所属する政党は図5に示されるようにX党であることから、本処理で取得される政党はX党である。
ステップS106において、出現量算出部106は、動画データを検索して、ステップS103の処理で抽出された特徴量と同じ特徴量を有する人物の出現時間を算出する。出現時間とは、動画の再生時に当該人物が出現していた時間である。なお、この処理で取得される量は出現時間でなくてもよく、当該人物の顔が含まれているフレームの数、出現時間比率(出現時間/動画の全再生時間)等の動画内における人物の出現の多さを示す量であればよい。本明細書では、これらを動画内における人物の出現の多さを示す量を出現量と呼称することがある。また、本明細書の説明において、特記した場合を除き、出現時間についての記述は出現量と読み替えることが可能である。
なお、出現量は、例えば、動画データに含まれるフレーム画像に対し、所定の時間(又はフレーム数)の間隔で顔照合を行うことにより算出され得る。また、動画データに人物の音声が含まれており、かつ、照合部104が音声照合の機能を備えている場合には、音声から話者、発声時間等を抽出することにより、出現量を算出してもよい。この場合において、出現量算出部106は、動画のフレームに人物の顔が含まれていない期間には、音声から話者を特定し、当該話者の発声時間に基づいて出現量を算出してもよい。これにより、人物の顔が映っている期間に加えて、人物の顔が映っていない状態で発声している期間も出現時間に合算されるように出現量を算出することができるので、出現量の算出精度が向上する。
また、出現量の算出において、出現時間等の人物が出現していた時間以外の要素を更に考慮してもよい。例えば、動画に出現する人物のサイズを出現時間に乗じることにより、大きく映っていた人物の出現量がより大きい値になるように補正してもよい。これにより、動画内で人物の大きさに差異がある場合にその影響を考慮した編集が可能となる。
ステップS107において、記憶部109は、属性取得部105により取得された政党、出現量算出部106により算出された出現時間及び照合部104により特定された人物を対応付けて記憶する。
ステップS108において、CPU151は、動画に出現するすべての顔に対してステップS103からステップS107の処理が完了したか否かを判定する。すべての顔に対する処理が完了している場合(ステップS108においてYES)、処理はステップS109に移行する。すべての顔に対する処理が完了していない場合(ステップS108においてNO)、処理はステップS103に戻り、動画に出現する別の顔に対して同様の処理が行われる。
図6は、すべての顔に対する処理が完了した後に、記憶部109に記憶されている出現時間データの例である。図6に示されるように、記憶部109には、特徴量、候補者名、政党及び出現時間が相互に対応づけられて記憶される。図6の表は、これらの情報を動画への出現順に示したものである。この表より、動画には、最初にX党の候補者Aが148秒出現し、次にY党の候補者Cが121秒出現し、以降、様々な候補者が順次出現していることがわかる。なお、図6の例では、人物を特定する情報として特徴量、候補者名の2つが挙げられているが、これらは必須ではない。
ステップS109において、出現量合算部107は、記憶部109に記憶されている出現時間データに対し、政党ごとに人物の出現時間の合算を行う。図6に示されている例では、X党の候補者の出現時間が578秒、Y党の候補者の出現時間が724秒、Z党の候補者の出現時間が315秒と算出される。
なお、政党ごとの出現時間の取得の処理はステップS107の時点で行われてもよい。この場合、出現量算出部106の機能と出現量合算部107の機能は統合され得る。すなわち、出現量算出部106及び出現量合算部107は、より一般的に出現量取得部とも呼称され得る。
ステップS110において、表示情報生成部108は、ステップS109において合算された政党ごとの出現時間を表示装置156に表示させるための表示情報を生成する。CPU151は、表示装置156を制御して、当該表示情報に基づく画像を表示装置156に表示させる。図7は、合算された出現時間の表示例を示す図である。
図7に示される例では、編集対象の選挙演説動画に対し、出現時間表示枠303が重畳されている。出現時間表示枠303内には、X党の候補者の出現時間が578秒、Y党の候補者の出現時間が724秒、Z党の候補者の出現時間が315秒である旨が表示されている。これらは、出現量合算部107により算出された出現時間である。ユーザ(動画編集者)は、出現時間表示枠303内の出現時間を参照しながら動画の編集を行うことにより、政党間の放送時間を合致させるような編集を容易に行うことができる。なお、出現時間表示枠303の表示内容は、出現時間そのものではなく、出現比率を表示するものであってもよい。例えば上述の例では、「X党:36%、Y党:45%、Z党:19%」というような表示であってもよい。
出現時間の表示を動画に重畳させることは必須ではなく、ユーザに出現時間の通知がなされれば、これ以外の態様であってもよい。例えば、動画の表示枠とは別の表示枠に出現時間を表示させてもよく、別の表示装置に出現時間を表示させてもよく、音声等によりユーザに現時間を通知してもよい。
上述のように、本実施形態によれば、属性ごとに出現量を取得することができ、更に出現量を表示させる等によりユーザに通知することができる。これにより、出現量に対して制約を設けた編集作業が必要な場合においても好適に動画等のコンテンツの編集支援を行い得る情報処理システム100が提供される。
[第2実施形態]
本実施形態に係る情報処理システムについて、図8及び図9を参照しつつ説明する。第1実施形態においては、属性ごとの出現量を表示装置156に表示させ、ユーザに通知することにより動画編集支援を行う情報処理システム100について説明したが、動画編集支援の提供手法はこれに限られない。本実施形態では、情報処理システム100が属性ごとの出現量を用いて自動的に動画編集を行うことにより、動画編集支援を行う例を説明する。なお、本実施形態の説明において、第1実施形態と同様の要素、処理等については省略又は簡略化することがある。
図8は、本実施形態に係る情報処理システム100の機能ブロック図である。第1実施形態との相違点は、表示情報生成部108に代えて編集部110が設けられている点である。CPU151は、ROM153、HDD154等に記憶された動画編集用のプログラムをRAM152にロードして実行することにより、編集部110の機能を実現する。
図9は、本実施形態に係る情報処理システム100により行われる処理の概略を示すフローチャートである。ステップS101からステップS109の処理は第1実施形態と同様であるため説明を省略する。
ステップS111において、編集部110は、ステップS109において合算された政党ごとの出現時間に基づいて、政党ごとの出現時間が所定の比率になるように自動的に動画の編集を行う。この所定の比率とは、例えば、政党ごとの出現時間が実質的に同一となる比率である。
編集部110により行われる処理の例を説明する。本例では、図6の例に示す出現時間の画像の一部を削除して、15分(900秒)に短縮する処理を行う場合を想定する。また、上述の所定の比率は政党ごとの出現時間が同一となる比率であるものとする。この場合、X党、Y党、Z党の候補者の出現時間をいずれも300秒にすれば上述の条件が満たされる。そこで、編集部110は、X党の候補者が出現している期間のうちの278秒分、Y党の候補者が出現している期間のうちの424秒分、及びZ党の候補者が出現している期間のうちの15秒分を削除する。これにより、X党、Y党、Z党の候補者の出現時間がいずれも同一となる動画編集が実現される。なお、編集後の動画の再生時間、出現時間の比率等のパラメータはあらかじめユーザが設定したものであってもよく、処理の開始時にユーザに入力させるものであってもよい。
なお、動画内の削除する範囲を選択するためのアルゴリズムは、例えば、視聴者に与えられる情報量が少ない期間を自動的に選択するというものであり得る。視聴者に与えられる情報量が少ない期間とは、例えば、動画中の演説を行っていない期間、候補者の顔が小さく映っている期間、候補者の顔が映っておらず声のみが含まれる期間である。一般的に、動画の編集においては、上述の例示のような視聴者に与えられる情報量が少ない期間を削除することにより、所定の長さの動画を生成することが多いためである。このアルゴリズムでは、編集部110は、上述のような情報量が少ない期間を削除候補として選択し、出現時間の比率が所定の比率になるように選択された削除候補の中の一部又は全部を削除することにより、自動編集を行う。また、当該アルゴリズムは、人間により編集された動画を学習データとして用いた機械学習により生成されたものであってもよい。
上述の説明では、編集部110の処理が自動であるものとしたが、ユーザが一部の指示を行う半自動の処理であってもよい。この半自動の処理は、例えば、編集部110がいくつかの編集候補を提示し、ユーザが編集候補の中からいずれかを選択するというものであり得る。
本実施形態によれば、第1の実施形態の場合と同様に、出現量に対して制約を設けた編集作業が必要な場合においても好適に動画等のコンテンツの編集支援を行い得る情報処理システム100が提供される。また、本実施形態では、編集作業の一部又は全部が自動化されるため、ユーザの作業工数を更に削減することができる。
なお、上述の削除候補の選択アルゴリズムは、自動編集を行わない場合にも適用可能である。例えば、第1実施形態のようにユーザが手動で編集を行う場合において、上述のような削除候補を表示装置156に表示させてもよい。これにより、ユーザは、動画全体の中からどの部分を削除すればよいかを容易に把握することができ、ユーザの作業工数を削減することができる。
上述の実施形態において説明したシステムは以下の第3実施形態のようにも構成することができる。
[第3実施形態]
図10は、第3実施形態に係る情報処理システム200の機能ブロック図である。情報処理システム200は、照合部201、属性取得部202及び出現量取得部203を備える。照合部201は、コンテンツに出現している複数の人物を生体照合により検出する。属性取得部202は、複数の人物の各々の属性を取得する。出現量取得部203は、コンテンツへの複数の人物の出現の多さを示す出現量を属性ごとに取得する。
本実施形態によれば、好適にコンテンツの編集支援を行い得る情報処理システム200が提供される。
[変形実施形態]
本発明は、上述の実施形態に限定されることなく、本発明の趣旨を逸脱しない範囲において適宜変更可能である。
図3及び図9に示したフローチャート内に更にステップが追加されてもよく、いずれかのステップが省略されてもよい。例えば、顔照合を補助するために、ユーザに対して目視による顔照合の結果の確認を行わせ、その結果の入力を受け付けるステップが追加されてもよい。
上述の実施形態のステップS104の顔照合において、顔照合により人物が特定できたフレームの前後のフレームに対しては顔照合を省略して人物を特定してもよい。例えば、同じ人物が演説を続けている場面では、同じ人物が写り続けるため、画像の輝度、色等の変化が小さい。このような人物が入れ替わっていないことが明らかな場面では、顔照合を行うまでもなく同じ人物であると判定できるため、顔照合を省略して処理を高速化してもよい。また、人物が横、後ろ等を向いていて顔照合ができない場合において、その前後のフレームの照合結果から人物を特定できれば、その照合結果を援用してもよい。
上述の実施形態では、主として生体照合の一種である顔照合を用いた例を説明したが、これ以外の生体照合であってもよく、例えば声紋の特徴等を用いて話者を特定する音声照合を用いることもできる。また、この話者の特定手法は、会話内容のテキスト分析を含んでもよい。例えば、動画に演説の音声データが含まれる場合には、上述の実施形態における顔照合は、演説の声に対する音声照合に置き換えられ得る。この場合、上述の実施形態は、ラジオ放送等の画像を含まないコンテンツにも適用可能である。
また、人物の特定において、顔照合と音声照合を併用してもよい。音声照合を併用することにより、例えば、人物の顔が映っていない場合、人物が横又は後ろを向いている場合、人物の顔が不鮮明である場合等の顔認証が難しい場面であっても適切に人物を特定することができる。
上述の実施形態の機能を実現するように該実施形態の構成を動作させるプログラムを記憶媒体に記録させ、記憶媒体に記録されたプログラムをコードとして読み出し、コンピュータにおいて実行する処理方法も各実施形態の範疇に含まれる。すなわち、コンピュータ読取可能な記憶媒体も各実施形態の範囲に含まれる。また、上述のプログラムが記録された記憶媒体だけでなく、そのプログラム自体も各実施形態に含まれる。また、上述の実施形態に含まれる1又は2以上の構成要素は、各構成要素の機能を実現するように構成されたASIC、FPGA等の回路であってもよい。
該記憶媒体としては例えばフロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD(Compact Disk)-ROM、磁気テープ、不揮発性メモリカード、ROMを用いることができる。また該記憶媒体に記録されたプログラム単体で処理を実行しているものに限らず、他のソフトウェア、拡張ボードの機能と共同して、OS(Operating System)上で動作して処理を実行するものも各実施形態の範疇に含まれる。
上述の各実施形態の機能により実現されるサービスは、SaaS(Software as a Service)の形態でユーザに対して提供することもできる。
なお、上述の実施形態は、いずれも本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
上述の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
コンテンツに出現している複数の人物を生体照合により検出する照合部と、
前記複数の人物の各々の属性を取得する属性取得部と、
前記コンテンツへの前記複数の人物の出現の多さを示す出現量を前記属性ごとに取得する出現量取得部と、
を備えることを特徴とする情報処理システム。
(付記2)
前記出現量取得部は、前記複数の人物の各々が前記コンテンツに出現した時間に基づく量を前記属性ごとに合算することにより前記出現量を取得する
ことを特徴とする付記1に記載の情報処理システム。
(付記3)
前記出現量取得部は、前記複数の人物の各々が前記コンテンツに出現した時間及び前記複数の人物の各々のサイズに基づく値を前記属性ごとに合算することにより前記出現量を取得する
ことを特徴とする付記1又は2に記載の情報処理システム。
(付記4)
前記出現量を前記属性ごとに表示装置に表示させるための表示情報を生成する表示情報生成部を更に備える
ことを特徴とする付記1乃至3のいずれか1項に記載の情報処理システム。
(付記5)
前記表示情報は、前記コンテンツの中の削除候補の期間を示す情報を含む
ことを特徴とする付記4に記載の情報処理システム。
(付記6)
前記属性ごとの前記出現量が所定の比率になるように前記コンテンツを自動的に編集する編集部を更に備える
ことを特徴とする付記1乃至5のいずれか1項に記載の情報処理システム。
(付記7)
前記編集部は、前記属性ごとの前記出現量が実質的に同一になるように前記コンテンツを自動的に編集する
ことを特徴とする付記6に記載の情報処理システム。
(付記8)
前記編集部は、前記コンテンツの中の削除候補の期間を選択し、前記削除候補の一部又は全部を削除することにより前記コンテンツを自動的に編集する
ことを特徴とする付記6又は7に記載の情報処理システム。
(付記9)
前記出現量は、前記複数の人物の出現時間又は出現比率である
ことを特徴とする付記1乃至8のいずれか1項に記載の情報処理システム。
(付記10)
前記コンテンツは動画を含み、
前記生体照合は、前記コンテンツに出現する前記複数の人物の顔画像から抽出された特徴量と、データベースに含まれる照合対象の特徴量とを照合する顔照合である
ことを特徴とする付記1乃至9のいずれか1項に記載の情報処理システム。
(付記11)
前記コンテンツは音声を含み、
前記生体照合は、前記コンテンツに出現する前記複数の人物が発した音声から抽出された特徴量と、データベースに含まれる照合対象の特徴量とを照合する音声照合である
ことを特徴とする付記1乃至9のいずれか1項に記載の情報処理システム。
(付記12)
前記コンテンツは、動画及び音声を含み、
前記生体照合は、前記コンテンツに出現する前記複数の人物の顔画像から抽出された特徴量と、データベースに含まれる照合対象の特徴量とを照合する顔照合と、前記コンテンツに出現する前記複数の人物が発した音声から抽出された特徴量と、データベースに含まれる照合対象の特徴量とを照合する音声照合とを含み、
前記出現量取得部は、前記複数の人物の顔が出現した期間と、前記複数の人物が音声を発した期間とに基づいて前記出現量を取得する
ことを特徴とする付記1乃至9のいずれか1項に記載の情報処理システム。
(付記13)
前記データベースは、前記照合対象の特徴量に対応付けられた前記属性を含み、
前記属性取得部は、前記データベースを参照することにより前記属性を取得する
ことを特徴とする付記10乃至12のいずれか1項に記載の情報処理システム。
(付記14)
前記複数の人物の各々は、選挙の候補者であり、
前記属性は、前記複数の人物の各々が所属する政党である
ことを特徴とする付記1乃至13のいずれか1項に記載の情報処理システム。
(付記15)
コンテンツに出現している複数の人物を生体照合により検出するステップと、
前記複数の人物の各々の属性を取得するステップと、
前記コンテンツへの前記複数の人物の出現の多さを示す出現量を前記属性ごとに取得するステップと、
を備えることを特徴とする情報処理方法。
(付記16)
コンピュータに、
コンテンツに出現している複数の人物を生体照合により検出するステップと、
前記複数の人物の各々の属性を取得するステップと、
前記コンテンツへの前記複数の人物の出現の多さを示す出現量を前記属性ごとに取得するステップと、
を備えることを特徴とする情報処理方法を実行させるためのプログラム。
100、200 情報処理システム
101 動画取得部
102 顔検出部
103 特徴量抽出部
104、201 照合部
105、202 属性取得部
106 出現量算出部
107 出現量合算部
108 表示情報生成部
109 記憶部
110 編集部
151 CPU
152 RAM
153 ROM
154 HDD
155 通信I/F
156 表示装置
157 入力装置
158 バス
203 出現量取得部
301 フレーム画像データ
302 候補者
303 出現時間表示枠
R1 顔領域

Claims (16)

  1. コンテンツに出現している複数の人物を生体照合により検出する照合部と、
    前記複数の人物の各々の属性を取得する属性取得部と、
    前記コンテンツへの前記複数の人物の出現の多さを示す出現量を前記属性ごとに取得する出現量取得部と、
    を備えることを特徴とする情報処理システム。
  2. 前記出現量取得部は、前記複数の人物の各々が前記コンテンツに出現した時間に基づく量を前記属性ごとに合算することにより前記出現量を取得する
    ことを特徴とする請求項1に記載の情報処理システム。
  3. 前記出現量取得部は、前記複数の人物の各々が前記コンテンツに出現した時間及び前記複数の人物の各々のサイズに基づく値を前記属性ごとに合算することにより前記出現量を取得する
    ことを特徴とする請求項1又は2に記載の情報処理システム。
  4. 前記出現量を前記属性ごとに表示装置に表示させるための表示情報を生成する表示情報生成部を更に備える
    ことを特徴とする請求項1乃至3のいずれか1項に記載の情報処理システム。
  5. 前記表示情報は、前記コンテンツの中の削除候補の期間を示す情報を含む
    ことを特徴とする請求項4に記載の情報処理システム。
  6. 前記属性ごとの前記出現量が所定の比率になるように前記コンテンツを自動的に編集する編集部を更に備える
    ことを特徴とする請求項1乃至5のいずれか1項に記載の情報処理システム。
  7. 前記編集部は、前記属性ごとの前記出現量が同一になるように前記コンテンツを自動的に編集する
    ことを特徴とする請求項6に記載の情報処理システム。
  8. 前記編集部は、前記コンテンツの中の削除候補の期間を選択し、前記削除候補の一部又は全部を削除することにより前記コンテンツを自動的に編集する
    ことを特徴とする請求項6又は7に記載の情報処理システム。
  9. 前記出現量は、前記複数の人物の出現時間又は出現比率である
    ことを特徴とする請求項1乃至8のいずれか1項に記載の情報処理システム。
  10. 前記コンテンツは動画を含み、
    前記生体照合は、前記コンテンツに出現する前記複数の人物の顔画像から抽出された特徴量と、データベースに含まれる照合対象の特徴量とを照合する顔照合である
    ことを特徴とする請求項1乃至9のいずれか1項に記載の情報処理システム。
  11. 前記コンテンツは音声を含み、
    前記生体照合は、前記コンテンツに出現する前記複数の人物が発した音声から抽出された特徴量と、データベースに含まれる照合対象の特徴量とを照合する音声照合である
    ことを特徴とする請求項1乃至9のいずれか1項に記載の情報処理システム。
  12. 前記コンテンツは、動画及び音声を含み、
    前記生体照合は、前記コンテンツに出現する前記複数の人物の顔画像から抽出された特徴量と、データベースに含まれる照合対象の特徴量とを照合する顔照合と、前記コンテンツに出現する前記複数の人物が発した音声から抽出された特徴量と、データベースに含まれる照合対象の特徴量とを照合する音声照合とを含み、
    前記出現量取得部は、前記複数の人物の顔が出現した期間と、前記複数の人物が音声を発した期間とに基づいて前記出現量を取得する
    ことを特徴とする請求項1乃至9のいずれか1項に記載の情報処理システム。
  13. 前記データベースは、前記照合対象の特徴量に対応付けられた前記属性を含み、
    前記属性取得部は、前記データベースを参照することにより前記属性を取得する
    ことを特徴とする請求項10乃至12のいずれか1項に記載の情報処理システム。
  14. 前記複数の人物の各々は、選挙の候補者であり、
    前記属性は、前記複数の人物の各々が所属する政党である
    ことを特徴とする請求項1乃至13のいずれか1項に記載の情報処理システム。
  15. コンテンツに出現している複数の人物を生体照合により検出するステップと、
    前記複数の人物の各々の属性を取得するステップと、
    前記コンテンツへの前記複数の人物の出現の多さを示す出現量を前記属性ごとに取得するステップと、
    を備えることを特徴とする情報処理方法。
  16. コンピュータに、
    コンテンツに出現している複数の人物を生体照合により検出するステップと、
    前記複数の人物の各々の属性を取得するステップと、
    前記コンテンツへの前記複数の人物の出現の多さを示す出現量を前記属性ごとに取得するステップと、
    を備えることを特徴とする情報処理方法を実行させるためのプログラム。
JP2018108326A 2018-06-06 2018-06-06 情報処理システム、情報処理方法及びプログラム Active JP7148857B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018108326A JP7148857B2 (ja) 2018-06-06 2018-06-06 情報処理システム、情報処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018108326A JP7148857B2 (ja) 2018-06-06 2018-06-06 情報処理システム、情報処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2019213072A JP2019213072A (ja) 2019-12-12
JP7148857B2 true JP7148857B2 (ja) 2022-10-06

Family

ID=68847019

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018108326A Active JP7148857B2 (ja) 2018-06-06 2018-06-06 情報処理システム、情報処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP7148857B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007077713A1 (ja) 2006-01-05 2007-07-12 Nec Corporation 映像生成装置、映像生成方法および映像生成プログラム
JP2014238712A (ja) 2013-06-07 2014-12-18 三菱電機株式会社 コンテンツ分析装置、コンテンツ分析方法及びコンテンツ分析プログラム
JP6161224B1 (ja) 2016-12-28 2017-07-12 アンバス株式会社 人物情報表示装置、人物情報表示方法及び人物情報表示プログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006161224A (ja) * 2004-12-09 2006-06-22 Tokushu Paper Mfg Co Ltd 偽造防止用紙、及び偽造防止印刷物

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007077713A1 (ja) 2006-01-05 2007-07-12 Nec Corporation 映像生成装置、映像生成方法および映像生成プログラム
JP2014238712A (ja) 2013-06-07 2014-12-18 三菱電機株式会社 コンテンツ分析装置、コンテンツ分析方法及びコンテンツ分析プログラム
JP6161224B1 (ja) 2016-12-28 2017-07-12 アンバス株式会社 人物情報表示装置、人物情報表示方法及び人物情報表示プログラム

Also Published As

Publication number Publication date
JP2019213072A (ja) 2019-12-12

Similar Documents

Publication Publication Date Title
US11955143B2 (en) Automatic video editing method and portable terminal
US11580290B2 (en) Text description generating method and device, mobile terminal and storage medium
US8818803B2 (en) Character-based automated text summarization
US7734996B2 (en) Documentation browsing method, documentation browsing apparatus, documentation browsing robot, and documentation browsing program
CN105446957B (zh) 相似性确定方法、装置及终端
JP4215792B2 (ja) 会議支援装置、会議支援方法および会議支援プログラム
CN112653902B (zh) 说话人识别方法、装置及电子设备
US20160189713A1 (en) Apparatus and method for automatically creating and recording minutes of meeting
CN101169955A (zh) 用于生成内容元数据的方法和设备
US8693842B2 (en) Systems and methods for enriching audio/video recordings
US20180204367A1 (en) Audio media mood visualization
CN110602516A (zh) 基于视频直播的信息交互方法、装置及电子设备
CN117668402A (zh) 用于将布局应用于文档的系统和方法
US20160189107A1 (en) Apparatus and method for automatically creating and recording minutes of meeting
CN102693088A (zh) 一种基于图片的智能交互方法
US11178356B2 (en) Media message creation with automatic titling
US20160189103A1 (en) Apparatus and method for automatically creating and recording minutes of meeting
CN112367551A (zh) 视频编辑的方法及装置、电子设备和可读存储介质
KR102144978B1 (ko) 영상의 쇼트 분류를 이용한 사용자 맞춤형 영상 추천 시스템
CN113923479A (zh) 音视频剪辑方法和装置
US20230092847A1 (en) Systems and Methods for Intelligent Media Content Segmentation and Analysis
JP7148857B2 (ja) 情報処理システム、情報処理方法及びプログラム
JP2002157592A (ja) 人物情報登録方法、装置、人物情報登録プログラムを記録した記録媒体
JP4270117B2 (ja) 視聴者間コミュニケーション方法及び装置及びプログラム
KR101576094B1 (ko) 애니메이션을 이용한 자막 삽입 시스템 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210507

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220317

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220329

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220511

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220825

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220907

R151 Written notification of patent or utility model registration

Ref document number: 7148857

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151