JP2006050091A

JP2006050091A - 映像記録装置

Info

Publication number: JP2006050091A
Application number: JP2004225732A
Authority: JP
Inventors: Yoji Yasuda; 陽治安田
Original assignee: Toa Corp
Current assignee: Toa Corp
Priority date: 2004-08-02
Filing date: 2004-08-02
Publication date: 2006-02-16

Abstract

【課題】ある発話内容が発せられた場面に対応する映像の検索を容易にする。
【解決手段】映像記録装置１は、映像入力部１０と、音声入力部２０と、入力された音声信号から発話内容に含まれる文節やキーワードを抽出する文節キーワード抽出部５１と、タイマー部４０の時間情報を識別子とし、文節やキーワードを検索データとしてこれらを対応づけて識別データを作成する識別データ作成部５５と、音声信号と時間情報とを対応づけた音声データを記憶する音声データＤＢ６３と、映像信号と時間情報とを対応づけた映像データを記憶する映像データＤＢ７３とを含む。識別データ検索部８３は、入力受付部８１が受け付けた検索条件に基づいて識別データを検索・抽出する。そして、抽出された識別データの識別子に基づいて音声データ及び映像データを検索し、再生させる。
【選択図】図１

Description

本発明は、映像記録装置に関する。

コンビニエンスストアや銀行などに設置され、音声と映像とを同期して記録する監視カメラなどの映像記録装置が普及している。このような映像記録装置により撮影された映像を再生すれば、映っている人物など、撮影時の状況を視覚的に把握することができる。あるいは、人物などが映っていない場合であっても、記録された音声から撮影時の状況を聴覚的に把握することもできる。このように、映像記録装置で記録された映像及び音声は、保安警備、犯罪捜査などにおいて、非常に重要な情報となる。従って、映像及び音声の記録後、特定の内容の映像や音声を迅速に検索できるようにすることが求められている。

しかし、従来の映像記録装置において所望の映像を検索する場合、映像を早送りや巻き戻したりしながら映像を逐一肉眼で確認する必要がある。特に、ある発話内容が発せられた場面に対応する映像を検索する場合、等倍速で音声を再生しなければ音声内容を把握できない。従って、この場合は検索にさらに時間がかかる。
本発明の目的は、ある発話内容が発せられた場面に対応する映像の検索を容易にすることにある。

本願第１発明は、上記の課題を解決するために、音声を入力する音声入力部と、映像を入力する映像入力部と、前記音声に基づいて前記映像を検索するための検索データを作成する検索データ作成部と、前記検索データの各々を識別する識別子と前記検索データとを対応づけて記録する識別データ記録部と、前記識別子と前記映像とを対応づけて記録する映像記録部とを備えている映像記録装置を提供する。
ここでは、発話内容と映像とを識別子を介して対応づけて記録することにより、ある発話内容に対応する映像を特定できる。従って、発話内容に基づき、映像を容易に検索することが可能である。

本願第２発明は、本願第１発明において、前記映像記録部に記録された映像を特定するための入力データの入力を受け付ける入力受付部と、前記入力データと前記識別データ記録部に記録された識別データとを比較することにより、前記入力データを含む識別データを抽出し、抽出された識別データの識別子に基づいて前記映像を検索する検索部をさらに備えている映像記録装置を提供する。
映像を特定するための入力データと識別データ記録部内の識別データとを比較する。識別データを構成する検索データと入力データとを比較して、例えば入力データと一致する、入力データを含む検索データを抽出する。そして、抽出された検索データを含む識別データの識別子に基づいて映像記録部内の映像を検索する。よって、特定の音声内容に対応する映像を検索することができる。

本願第３発明は、本願第１発明において、前記識別子は時間情報を含み、前記映像記録部は、前記時間情報と前記映像とを対応づけて記憶する映像記録装置を提供する。
検索データと時間情報とを対応づけた識別データを記憶し、かつ時間情報と映像とを対応づけて記録することで、時間情報を介して識別データと映像とを対応づけることができる。よって、時間情報に基づいて識別データに対応する映像を特定することができる。
本願第４発明は、本願第１発明において、検索データは音声を文字に変換した文字データを含む映像記録装置を提供する。

ここでは、音声を文字に変換した文字データを検索データとして記録することができる。
本願第５発明は、本願第１発明において、検索データは音声を発声した人物の性別を示す性別データを含む。
ここでは、音声を発声した人物の性別を示す性別データを検索データとして記録する映像記録装置を提供する。
本願第６発明は、本願第１発明において、検索データは音声の音源の到来方向を示す方向データを含む映像記録装置を提供する。

ここでは、音声の音源の到来方向を示す方向データを検索データとして記録することができる。
本願第７発明は、本願第６発明において、記録された映像を再生表示する表示部と、音声の音源の位置を示す位置データに基づいて音源の位置を表示する音源位置表示部をさらに備えている映像記録装置を提供する。
ここでは、音声の音源の到来方向を表示することができる。
本願第８発明は、本願第１発明において、前記映像と前記音声を再生し、前記映像に前記音声を文字に変換した文字データを重畳して再生する再生部をさらに備えた映像記録装置を提供する。

本発明の映像記録装置を用いれば、ある発話内容が発せられた場面に対応する映像の検索を容易にすることができる。

＜第１実施形態＞
（１）構成
図１は、第１実施形態に係る映像記録装置１の全体構成図である。この装置は、映像入力部１０、音声入力部２０、検索条件入力部３０、タイマー部４０、識別データ部５０、音声データ部６０、映像データ部７０、検索部８０及び再生部９０を含む。以下に、各部の構成を説明する。
＜映像入力部＞
映像入力部１０は、監視カメラなどの映像撮影装置１０ａから所定時間ΔＴごと（例えば１／３０秒ごと）に送信された映像信号を入力する端子であり、映像データ部７０に接続されている。本実施形態では、所定時間ΔＴごとに送信される映像信号は静止画像を示すものであるとするが、動画であってもよい。映像入力部１０は、さらに映像データバッファと接続され、映像信号が映像データ部７０に出力されるまで映像信号を一時的に記録するようにしても良い。
＜音声入力部＞
音声入力部２０は、各々空間的あるいは平面的に異なる位置に設置されたマイクロホンなどの複数の集音部２０ａ、ｂ、ｃ、ｄ・・からの音声信号を入力する端子であり、識別データ部５０及び音声データ部６０に接続されている。
＜検索条件入力部＞
検索条件入力部３０は、パソコン等の入力機器３０ａと接続されており、所望の音声データ及び映像データを取得するための検索条件の入力を受け付ける。検索条件としては、例えばキーワード等が挙げられる。
＜タイマー部＞
タイマー部４０は、現在の時刻を識別データ部５０、音声データ部６０及び映像データ部７０に出力する。タイマー部４０の出力は現在の時刻に限定されず、例えば経過時間などの時間情報を出力すれば良い。
＜識別データ部＞
識別データ部５０は、文節キーワード抽出部５１、性別判定部５２、方向抽出部５３、識別データ作成部５５及び識別データＤＢ５７を有している。また、識別データＤＢ５７は、識別テーブル５９を有している。

文節キーワード抽出部５１は、音声入力部２０及びタイマー部４０に接続されており、音声入力部２０から音声信号が入力される。文節キーワード抽出部５１は、後述の登録処理において、入力された音声信号から発話内容に含まれる文節やキーワードを抽出する。そして、抽出した文節やキーワードを文字情報化したテキストデータとして識別データ作成部５５に出力する。文節やキーワードの抽出は、例えば公知の音声認識システムにより音声を文字に変換し（例えば特開平１１−１７５０９２号公報を参照）、その文字で構成される文節やキーワードに相当する語彙を、システムが有する語彙データベースから抽出することで行うことができる。このとき、文節キーワード抽出部５１には、タイマー部４０から現在の時刻が入力されており、抽出した文節やキーワードを含む音声信号の開始時刻を取得する。そして、抽出した文節やキーワードとともに開始時刻を識別データ作成部５５に出力する。

性別判定部５２は、音声入力部２０及びタイマー部４０に接続されており、音声入力部２０から音声信号が入力される。性別判定部５２は、入力された音声信号の音源である人物の性別を判定し、判定結果を性別データとして識別データ作成部５５へ出力する。性別データは、音声信号の音源である人物の性別を示すデータである。発話者の性別の判定は、公知の性別判定手段により行うことができる（例えば、特開２０００−２００２７６号公報を参照）。このとき、性別判定部５２には、タイマー部４０から現在の時刻が入力されており、性別が判定された音声信号の開始時刻を取得する。そして、性別データとともに開始時刻を識別データ作成部５５に出力する。

方向抽出部５３は、音声入力部２０及びタイマー部４０に接続されており、音声入力部２０から音声信号が入力される。方向抽出部５３は、入力された音声信号の音源の方向を判定し、判定結果として方向データを識別データ作成部５５へ出力する。例えば、音声の到来方向の決定は、集音部２０ａ、ｂ・・から入力される音声の音量の比を算出し、最も比の値が大きい音量の音声信号を出力した集音部２０ａ、ｂ・・の位置を到来方向とする。なお、到来方向の決定は、公知の音源方向検出装置により行うこともできる（特開平１０−３３２８０７号公報を参照）。このとき、方向抽出部５３には、タイマー部４０から現在の時刻が入力されており、到来方向が判定された音声信号の開始時刻を取得する。そして、到来方向を示す方向データとともに開始時刻を識別データ作成部５５に出力する。

識別データ作成部５５は、文節キーワード抽出部５１、性別判定部５２及び方向抽出部５３と接続されており、それぞれから文節やキーワード、性別データ及び方向データが入力される。識別データ作成部５５は、入力された文節やキーワード、性別データ及び方向データとともに開始時刻を受け取る。さらに、識別データ作成部５５は、文節やキーワードを含む発話が発声された時間に相当する秒数をタイマー部４０が出力する時刻に基づいて算出する。そして、文節やキーワード、性別データ、方向データ及び秒数と開始時刻とを対応づけ、これに発話ＩＤを付与した識別データを作成する。よって、識別データは、文節キーワード、性別データ及び方向データが、開始時刻を基準に対応づけて作成される。ここで、文節やキーワード、性別データ、方向データ及び秒数等が、後述する入力受付部に入力される検索条件と比較される検索データに相当する。識別データ作成部５５は、作成された識別データを識別データＤＢ５７に出力する。なお、文節やキーワードを含む音声信号の開始時刻を時間情報としているが、時間情報としては開始時刻に限定されず終了時刻、経過時間であっても良い。
＜音声データ部＞
音声データ部６０は、音声入力部２０及びタイマー部４０に接続されており、音声データ作成部６１及び音声データＤＢ６３を有している。音声データ作成部６１は、後述の登録処理において、音声入力部２０から入力された音声信号と音声信号の開始時刻とを対応づけて、後述する音声データを作成する。音声データＤＢ６３は、作成された音声データを記憶する。
＜映像データ部＞
映像データ部７０は、映像入力部１０及びタイマー部４０に接続されており、映像データ作成部７１及び映像データＤＢ７３を有している。映像データ作成部７１は、後述の登録処理において、映像入力部１０から入力された映像信号と映像信号の開始時刻とを対応づけて、後述する映像データを作成する。映像データＤＢ７３は、作成された映像データを記憶する。
＜検索部＞
検索部８０は、入力受付部８１、識別データ検索部８３、音声データ検索部８５及び映像データ検索部８７を有している。入力受付部８１は、音声データＤＢ６３及び映像データＤＢ７３内に記録されている音声データ及び／または映像データから所望の音声データ及び／又は映像データを取得するための検索条件の指定を受け付ける。入力受付部８１は、受け付けた検索条件を識別データ検索部８３に出力する。識別データ検索部８３は、検索条件に基づいて、識別データＤＢ５７内の識別データとを比較し、検索条件に該当する識別データを抽出する。このとき、識別データ検索部８３は、識別データを構成する検索データと検索条件とを比較する。つまり、検索データである文節やキーワード、性別データ、方向データ及び秒数と検索条件とを比較し、例えば検索条件と一致する、あるいは検索条件を含む検索データを抽出する。そして、識別データ検索部８３は、その抽出された検索データを含む識別データから識別子である時間情報を取り出し、音声データ検索部８５及び映像データ検索部８７に出力する。音声データ検索部８５及び映像データ検索部８７は、入力された時間情報に基づいて、例えば同一の時間情報を有する音声データＤＢ６３及び映像データＤＢ７３内を検索し、音声データ及び映像データを抽出する。抽出された音声データ及び映像データは、それぞれ音声再生部９１及び映像再生部９３において再生される。

例えば、検索条件として入力受付部８１が “あぶない”を受け付けた場合、識別データ検索部８３は、検索条件“あぶない”に基づいて、識別データＤＢ５７内を検索する。ここで、識別子である時間情報が“８：００”であり、検索データが”あぶない”から構成されている識別子が識別データＤＢ５７内に記録されているとする。識別データ検索部８３は、検索条件“あぶない”と一致する検索データを有する前述の識別データを識別データＤＢ５７内から抽出する。そして、抽出された識別データ内から識別子である時間情報を取り出し、音声データ検索部８５及び映像データ検索部８７に出力する。よって、音声データ検索部８５及び映像データ検索部８７は、それぞれ識別子である時間情報“８：００”を有する音声データ及び映像データを抽出する。

さらに、識別データ検索部８３は、検索画面において、指定された文節やキーワード等の検索条件を検索結果画面に一覧表示するようにしても良い。そして、ユーザに一覧表示の中から所望の検索条件を選択させるようにしても良い。図２は、検索画面の表示例である。この画面では、識別テーブル５９の「文節・キーワード」に記憶される全てのキーワードの先頭の文字、例えば「あ」、「か」「さ」・・・に対応するタブが表示されている。このタブ内には、その先頭の文字を有するキーワードの一覧、例えば「あ」のタブには「あたま」、「あたる」、などが表示される。ユーザは、所望の検索条件を表示されたキーワードの中から選択する。このとき、一覧内の所望のキーワードが選択されると、選択されたキーワードが強調表示されると選択状態の有無を確認でき好ましい。図２では、例えば、「あぶない」が選択された場合の強調表示例を示している。

図３は、検索結果画面の表示例である。この画面は、図２の検索画面で選択されたキーワードを含む検索条件を一覧表示する。図２の検索画面で「あぶない」が選択された場合、「あぶない」をキーワードとして記憶する検索条件に含まれる文節、性別、開始時刻を表示している。この画面では、文節、キーワード、性別、開始時刻を参照しながら所望の検索条件を選択することができる。よって、例えば図３の検索結果画面において最上位に表示されている検索情報を選択すれば、例えば図４の映像が再生される。従って、文節、キーワード、性別、開始時刻を参照しながら所望の映像を簡単に検索・再生することができる。
＜再生部＞
再生部９０は、音声再生部９１及び映像再生部９３を有している。音声再生部９１は、音声データ検索部８５において音声データＤＢ６３から抽出された音声データ内の音声信号に基づいて音声を再生する。映像再生部９３は、映像データ検索部８７において映像データＤＢ７３から抽出された映像データ内の映像信号に基づいて映像を再生し、前述の映像表示画面上に表示する。なお、音声再生部９１及び映像再生部９３は、映像記録装置１の外部に設けてもよい。

図４の画面では、映像データＤＢ７３に記録された映像が再生表示されている。また、音声データＤＢ６３に記録された音声が再生される。さらに、この画面には、集音部２０ａ、ｂ、ｃ、ｄ・・から入力された音源の到来方向を示す方向マーカー（図中、音符記号）が、音源の到来方向に対応する画面上の位置に表示される。さらに、この画面には、音声を発声した人物の性別と、音声に含まれる文節やキーワードとが文字情報として画面下の所定の位置に表示される。このように方向マーカーや文字により音源の到来方向や発声内容を示すことで、発話者などによる音源が撮影されていない場合であっても音源の到来方向や移動方向などを視覚的に認識することができる。また、音声に含まれる文節やキーワード、音声を発声した人物の性別を文字情報として視覚的に認識することができる。さらに、文字の表示位置を音の到来方向に応じて変化させても良い。
（２）識別データ
図５は、識別テーブル５９に記録される識別データの一例である。識別テーブル５９には、「発話ＩＤ」、「開始時刻」、「到来方向」、「秒数」、「性別」及び「文節・キーワード」を１レコードに含む識別データが記録されている。「発話ＩＤ」は、識別テーブル５９におけるレコードの識別子である。「開始時刻」は、「文節・キーワード」が含まれる音声の記録が開始された時刻である。この時刻は、タイマー部４０から取得される。「文節・キーワード」は、文節キーワード抽出部５１により発話内容から抽出された文節やキーワードをテキストデータなどの文字情報である。「秒数」は、「文節・キーワード」に記憶された文節やキーワードが発話された長さである。この秒数は、タイマー部４０から得られる現在の時刻を計測することで算出される。「性別」は、発話者の性別である。「到来方向」は、音声の到来方向を示す情報である。ここでは簡便のため、音声の到来方向を集音部２０ａの設置されている位置である「Ａ」、集音部２０ｂの設置されている位置である「Ｂ」などで表す。ただし、各集音部２０ａ、ｂ・・から集音された音声の大きさの相関から算出される音声の到来方向を記録してもよい。

例えば図５を参照すると、発話ＩＤが“１”の識別データについては、２００２年９月２５日の９時３８分に発話が開始される識別データが登録されている。この発話の到来方向は“Ａ”であり、２秒間発話がされている。また、発話者の性別は男であり、その発話の中に含まれる文節・キーワードは「おい」、「あぶない」、「何を」である。このように、１レコードの記録される識別データを構成する「発話ＩＤ」、「開始時刻」、「秒数」、「性別」、「到来方向」及び「文節・キーワード」等は、互いに対応づけられている。

上記では、識別データは、「発話ＩＤ」、「開始時刻」、「秒数」、「性別」、「到来方向」及び「文節・キーワード」から構成されるが、この構成に限られない。
また、識別テーブル５９に記録される識別データは、例えば開始時刻の早いレコードからソートされて記録されている。
（３）音声データ、映像データ
図６は、音声データまたは映像データの一例である。音声データまたは映像データは、複数のフレームデータＦ１、Ｆ２、Ｆ３・・・から構成される。１つのフレームデータは、例えば音声信号または映像信号（Ｖ１、Ｖ２、Ｖ３・・・）と、音声信号または映像信号の開始時刻（Ｔ１、Ｔ２、Ｔ３・・・）とにより作成されている。音声データまたは映像データが時間情報として開始時刻を含んでいるため、識別データとのリンクを開始時刻を介して行うことができる。よって、所望の検索条件に基づいて識別データを検索し、その識別データの時間情報に基づいて音声データ及び／または映像データを抽出することができる。時間情報をリンクとして用いるため、音声データや映像データなどの容量を少なくすることができる。そのため、検索時間のスピードアップを図ることができる。

図７は、音声データまたは映像データの別の一例である。図７に示す音声データまたは映像データのフレームデータは、例えば静止画像の映像信号と、到来方向に基づき音源の位置を画面上で示す方向マーカーのデータと、音声信号の音源である人物の性別を示す性別データと、発話内容に含まれる文節・キーワードを表すテキストデータとを有するファイルを作成する。このテキストデータを検索すれば、そのテキストデータと対応づけられた音声データまたは映像データを検索できる。例えば、図７に示すフレームデータＦ１は、フレームＦ１のＩＤ番号ＩＤ＝１と、撮影が開始された開始時刻Ｔ１と、文節・キーワードＳ１と、方向マーカーＭ１と、性別Ｇ１と、音声信号または映像信号Ｖ１のデータから構成される。これらの文節・キーワードＳ１、方向マーカーＭ１、性別Ｇ１及び音声信号または映像信号Ｖ１は、次のように対応づけられている。文節・キーワードＳ１で示される音声または映像が開始時刻Ｔ１から開始し、その開始時刻Ｔ１から音声信号または映像信号Ｖ１の録音・撮影が開始されている。その音声の発声源が方向マーカーＭ１で、その音声を発声した人物の性別が性別Ｇ１で表されている。これらのデータは、上述のようにファイルにより作成することができる。例えば、図４に示す画面中央の静止画像、画面周縁部の方向マーカー、画面下部の発声した人物の性別及び文節・キーワードである「男：おいあぶない何を」を配置したファイルを作成する。なお、音声信号または映像信号Ｖ１、Ｖ２、Ｖ３・・の録音・撮影時に無音声である場合は、性別データ、文節キーワード、方向マーカー等のデータをフレームデータに含めないようにしても良い。

（４）映像記録装置で行われる処理
次に、映像記録装置１で行われる識別データ、音声データ及び映像データの登録処理の流れを、図８に例示するフローチャートに基づいて説明する。なお、以下では、識別データ、音声データ及び映像データの識別子が開始時刻である場合を例に挙げて説明する。
この処理は、音声及び映像がそれぞれ音声入力部１０、映像入力部１６に入力されたときに開始する。
ステップＳ１１：文節キーワード抽出部５１は、音声入力部２０から入力された音声信号から文節と、文節に含まれるキーワードとを抽出する。そして、抽出された文節やキーワードを識別データ作成部５５に出力する。このとき、文節キーワード抽出部５１は、抽出された文節やキーワードとともに開始時刻を識別データ作成部５５に出力する。

ステップＳ１２：性別判定部５２は、音声信号の音源である発話者の性別を判定し、判定結果を示す性別データを識別データ作成部５５に出力する。このとき、性別判定部５２は、性別データとともに開始時刻を識別データ作成部５５に出力する。
ステップＳ１３：方向抽出部５３は、現在の音声の到来方向を決定し、音声の到来方向を示す情報である方向データを識別データ作成部５５に出力する。このとき、方向データとともに開始時刻を識別データ作成部５５に出力する。
ステップＳ１４：識別データ作成部５５は、抽出された文節やキーワードが発声された時間に相当する秒数をタイマー部４０が出力する時刻に基づいて算出する。そして、識別データ作成部５５は、入力された文節やキーワード、性別データ、方向データ及び秒数を、開始時刻を基準に対応づけ、これに発話ＩＤを付与した識別データを作成する。識別データ作成部５５は、作成された識別データを識別データＤＢ５７に出力し、識別データＤＢ５７は識別データを記録する。ここで、文節やキーワード、性別データ、方向データ及び秒数が検索条件と比較される検索データであり、開始時刻が識別子である。

ステップＳ１６：音声データ作成部６１は、音声入力部２０から入力された音声信号と音声信号の開始時刻とを対応づけて、音声データを作成し、音声データＤＢ６３に出力する。そして、音声データＤＢ６３は音声データを記録する。
ステップＳ１７：映像データ作成部７１は、映像入力部１０から入力された映像信号と映像信号の開始時刻とを対応づけて、映像データを作成し、映像データＤＢ６３に出力する。そして、映像データＤＢ６３は映像データを記録する。
以上の処理により、識別データ、音声データ及び映像データの登録処理が行われる。そして、前述のように所望の検索条件を入力することにより、検索条件と識別データの比較をまず行い、検索条件に該当する識別データの抽出を行う。そして、抽出された識別データの識別子に基づいて音声データ及び映像データを抽出し、抽出された音声データ及び映像データに基づいて音声及び映像を再生する。このように、発話内容を含む識別データと音声データまたは映像データとを、識別子である開始時刻を介して対応づけて記録することにより、所定の発話内容に対応する音声または映像を容易に特定することができる。識別子が、時刻データなどであると識別子のデータ量が小さくなり検索を容易に行うことができる。

＜その他の実施形態＞
（Ａ）上記第１実施形態では、識別データ、音声データ及び映像データを識別する識別子として開始時刻を用い、開始時刻を介して識別データ、音声データ及び映像データを対応づけている。つまり、検索条件を入力した場合に、検索条件に該当する識別データが抽出される。そして、その識別データに含まれる開始時刻に基づいて対応する音声データ及び映像データを抽出する。しかし、識別子は終了時刻であっても良く、開始時刻に限定されない。また、時刻に限定されず、例えばＩＤ、アドレス、文節やキーワード、開始時刻、秒数、性別、到来方向等の多様のデータが識別子として使用することができる。

同様に、検索データとして文節やキーワード、性別データ、方向データ及び秒数等を用いているが、検索データはこれらに限定されない。
（Ｂ）上記第１実施形態の検索部８０の入力受付部８１は、検索条件として、文節やキーワードの他、開始時刻、秒数、性別、到来方向の指定を受け付け、指定された検索条件に合致する映像データまたは音声データを抽出するようにしてもよい。例えば、検索条件として、「男性」の指定を受け付けた場合、識別テーブル５９の「性別」が「男」である識別データを抽出する。そして、抽出された識別データが有する識別子に基づいて、映像データを抽出し、再生するようにしてもよい。

また、複数の検索条件を組み合わせて入力しても良い。
（Ｃ）上記第１実施形態のフレームデータには、文節データの他、開始時刻、秒数、性別、到来方向などを含めてもよい。
（Ｄ）上記第１実施形態では、入力された検索条件に対応する識別データに基づいて音声データまたは映像データのいずれかが抽出できればよい。そして、音声または映像のいずれかが再生できれば良い

本発明を用いれば、音声に基づいて作成された映像特定情報を用いて所望の映像を容易に検索することができる。

第１実施形態に係る映像記録装置の構成図。検索画面の表示例。検索結果画面の表示例。映像表示画面の表示例。識別テーブルに記録される識別データの一例。音声データまたは映像データの一例。音声データまたは映像データの別の一例。登録処理の流れを示すフローチャート。

符号の説明

１：映像記録装置
１５：検索部
２１：登録部
２３：映像記録部

Claims

音声を入力する音声入力部と、
映像を入力する映像入力部と、
前記音声に基づいて前記映像を検索するための検索データを作成する検索データ作成部と、
前記検索データの各々を識別する識別子と前記検索データとを対応づけて記録する識別データ記録部と、
前記識別子と前記映像とを対応づけて記録する映像記録部と、
を備えた映像記録装置。
前記映像記録部に記録された映像を特定するための入力データの入力を受け付ける入力受付部と、
前記入力データと前記識別データ記録部に記録された識別データとを比較することにより、前記入力データを含む識別データを抽出し、抽出された識別データの識別子に基づいて前記映像を検索する検索部をさらに備えた、請求項１に記載の映像記録装置。
前記識別子は時間情報を含み、
前記映像記録部は、前記時間情報と前記映像とを対応づけて記憶する、請求項１に記載の映像記録装置。
前記検索データは前記音声を文字に変換した文字データを含む、請求項１に記載の映像記録装置。
前記検索データは前記音声を発声した人物の性別を示す性別データを含む、請求項１に記載の映像記録装置。
前記検索データは前記音声の音源の到来方向を示す方向データを含む、請求項１に記載の映像記録装置。
前記記録された映像を再生表示する表示部と、
前記音声の音源の位置を示す位置データに基づいて前記音源の位置を表示する音源位置表示部をさらに備えた、請求項６に記載の映像記録装置。
前記映像と前記音声を再生し、前記映像に前記音声を文字に変換した文字データを重畳して再生する再生部をさらに備えた、請求項１に記載の映像記録装置。