JP4804417B2 - 動画撮像装置及び動画撮像方法 - Google Patents

動画撮像装置及び動画撮像方法 Download PDF

Info

Publication number
JP4804417B2
JP4804417B2 JP2007132087A JP2007132087A JP4804417B2 JP 4804417 B2 JP4804417 B2 JP 4804417B2 JP 2007132087 A JP2007132087 A JP 2007132087A JP 2007132087 A JP2007132087 A JP 2007132087A JP 4804417 B2 JP4804417 B2 JP 4804417B2
Authority
JP
Japan
Prior art keywords
file
parameter value
file name
character
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007132087A
Other languages
English (en)
Other versions
JP2008288898A (ja
JP2008288898A5 (ja
Inventor
裕也 藤原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2007132087A priority Critical patent/JP4804417B2/ja
Priority to US12/106,019 priority patent/US8094202B2/en
Priority to CN2008100818787A priority patent/CN101309383B/zh
Publication of JP2008288898A publication Critical patent/JP2008288898A/ja
Publication of JP2008288898A5 publication Critical patent/JP2008288898A5/ja
Application granted granted Critical
Publication of JP4804417B2 publication Critical patent/JP4804417B2/ja
Priority to US13/325,802 priority patent/US8842189B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Studio Devices (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は動画撮像装置及び動画撮像方法に関し、特に、複数のファイルのそれぞれに、内容を容易に把握できるようなファイル名を付けるために用いて好適な技術に関する。
ビデオカメラなどの動画撮像装置は、CCD(charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)などの電子デバイスを備えている。そして、これらの電子デバイスで構成されたイメージセンサにより取り込まれた視覚情報を、画像信号として出力する。更に、この出力された画像ファイルを所定のデータファイルにしてテープ、HDD(Hard Disk Drive)、DVD(Digital Versatile Disk)、半導体メモリ等の記録部に記録する。
前記イメージセンサにより取り込まれた視覚情報は、一般に静止画像であるが、イメージセンサの多くは毎秒数十フレームの周期で静止画像を生成できる点に注目し、静止画像信号の記録動作を連続して行なう。これにより、前述のイメージセンサを用いて動画像記録を行なうことを可能にしている。
記録部の記録容量は、メモリ容量の増加により膨大になりつつある。また、記録部にファイル形式で記録されているデータを確認するためには、動画ファイルの識別名(以下、ファイル名とする)の一覧を動画撮像装置に設けられた画像表示部に表示する。そして、操作部をユーザーが操作することにより、目的のファイル名を見つけ出して選択する必要がある。
一般の動画撮像装置では、ファイル名として、撮影日時や一連番号などから機械的に生成した文字列のみを使用している。例えば、特許文献1に記載されているように、画像信号中から文字情報を抽出して文字認識を行ない、認識された文字列をファイル名として設定することで、画像ファイルの整理整頓を容易にした動画撮像装置が提案されている。
また、イメージセンサにより取り込まれた視覚情報から得られたカラーの画像信号から、文字領域を自動抽出する技術が知られている。例えば、特許文献2においては、背景色が均一か否かを判定するための判定手段を用いて、文字列を精度よく抽出できるようにしたパターン抽出装置が提案されている。
また、文書のように複数の文字列が存在する中から、1つのファイル名を選別して抽出する技術が、例えば、特許文献3において提案されている。特許文献3において提案された技術は、文字列の位置と、文字列のサイズと、文字列に付加された下線の有無と、文字列に付加された枠の有無と、他の文字との位置関係と、の内少なくとも1つを用いる。そして、各文字列の存在する文字領域にポイントを与え、高ポイントの文字領域に関して文字認識を行ない、ファイル名とするファイル名抽出手段を設けている。
特開2003ー037770号公報 特開2001−283153号公報 特開平9−134406号公報
しかしながら、前記特許文献1に記載された技術を含む従来の動画撮像装置では、複数の文字列の中からでは、ファイル名とするべき1つの文字列を選別することができない問題点があった。
また、特許文献2に記載の「パターン抽出装置」は、静止画におけるファイル名を抽出する方法である。このため、時間軸に関係する要素への考慮がなく、動画撮影時にユーザーが意図して撮影を行った文字列を適切に、ファイル名として設定できないという問題があった。
また、特許文献3などに記載の「電子カメラ」などにおいては、動画撮影において、撮影開始から終了までの一連のシーンを単一のファイルとして撮影し、撮影終了後に分割を行って、分割したファイルの順番を入れ替えるなどの編集を行なう。この場合、従来の技術では、単一のファイルを分割した際に、分割前のファイル名に一連番号を付加した機械的なファイル名としていた。このため、順番を入れ替えた場合にファイル名から内容が把握することができず、画像ファイルの中身をいちいち確認しなければならないという問題があった。
本発明は前述の問題点に鑑み、複数シーンの動画を撮像する際に、内容を容易に把握できるようなファイル名を付けることができるようにすることを目的としている。
本発明の動画撮像装置は、視覚情報を取り込んで画像信号を出力する撮像手段と、前記撮像手段から出力される画像信号を記録媒体に記録するために所定のデータファイルを生成するデータファイル生成手段と、前記記録媒体に記録される画像信号から文字情報を抽出する文字認識手段と、前記文字認識手段によって抽出されたファイル内における文字情報出現の特徴に応じて、ファイル名として選択する際に用いられる時間軸に関連したパラメータ値を設定するパラメータ値設定手段と、前記パラメータ値設定手段によって設定されたパラメータ値から評価値を演算する評価値演算手段と、前記演算された評価値の高い文字情報を、前記画像信号のファイル名として設定するファイル名設定手段とを有することを特徴とする。
本発明の動画撮像方法は、視覚情報を取り込んで画像信号を出力する撮像工程と、前記撮像工程において出力される画像信号を記録媒体に記録するために所定のデータファイルを生成するデータファイル生成工程と、前記記録媒体に記録される画像信号から文字情報を抽出する文字認識工程と、前記文字認識工程において抽出されたファイル内における文字情報出現の特徴に応じて、ファイル名として選択する際に用いられる時間軸に関連したパラメータ値を設定するパラメータ値設定工程と、前記パラメータ値設定工程によって設定されたパラメータ値から評価値を演算する評価値演算工程と、前記演算された評価値の高い文字情報を、前記画像信号のファイル名として設定するファイル名設定工程とを有することを特徴とする。
本発明によれば、抽出された文字情報出現の特徴に応じて、ファイル名として選抜する際に用いられるパラメータ値を設定するとともに、前記文字情報と前記パラメータ値とを組にして記録するようにした。これにより、動画撮影中に次々現れる複数の文字列の中から1つの文字列を選抜し、ファイル名とすることができる。
また、本発明のその他の特徴によれば、ファイル名らしさを表す定義を、ユーザーにより変更することができるようにした。これにより、ユーザーがファイル名にしようと意図して撮影を行った文字列を、より正確にファイル名して設定することができる。
また、本発明のその他の特徴とするところは、撮影開始から終了までの一連のシーンを単一のファイルとして撮影し、撮影終了後に分割を行った場合にも、分割したファイルに文字認識により得られた新しいファイル名を付加することができる。このため、順番を入れ替えた場合でもファイルの中身をいちいち確認せずとも内容を把握することが可能となる。
以下、図面を参照しながら本発明の実施の形態を説明する。
図1は、本発明の実施形態に係わるビデオカメラの構成例を説明するブロック図である。
本実施形態のビデオカメラは撮像部11と、画像処理部12と、制御部13と、メモリ部14と、文字列変換処理部15と、表示部16と、操作部17と、バッファ部18と記録再生部19とで構成されている。そして、撮像部11で撮像した画像データ及び図示しない音声系回路で生成した音声データを光ディスク(optical disk)20に記録する。
撮像部11は、撮影レンズ群やメカニカルシャッタ機構などを収めたレンズ鏡筒と、レンズ鏡筒の後方に配置されたイメージセンサからなり、イメージセンサの受光面に被写体の像を、視覚情報として結像させるものである。撮像部11は、制御部13からの制御信号に基づいて、シャッター速度や露出値などを可変的に設定し、イメージセンサで生成した画像信号を画像処理部に出力するものである。
画像処理部12は、イメージセンサから入力された画像信号を、輝度成分と色成分とに分離し、制御部13からの制御信号とやりとりを行なうことで、輝度成分と色成分の補正を施した後、補正した画像信号をメモリ部14に出力するものである。
制御部13は、図示しないCPU(Central Processing Unit)と、プログラムメモリとワークメモリとを備えていて、プログラムメモリに格納された所定の制御プログラムをワークメモリにロードして実行する。これにより、画像処理部12から出力される画像信号の取り込みや、撮像部11の制御や、表示部16への出力などを実行する。また、メモリ部14へのデータ書き出しや、文字列変換処理部15の制御を行ない、ビデオカメラ全体の動作を制御する。また、データファイル生成手段、パラメータ値設定手段、評価値演算手段、ファイル名設定手段、映像信号検索手段などとして機能する。
表示部16は、ビューファインダーとして設けられた3インチ程度の液晶表示器(LCD)を備え、表示部16の表示形式に変換されて制御部13から出力される画像信号を表示する。
メモリ部14は、所定のデータファイルとして纏められて画像処理部12から出力される画像ファイルや、各種設定のデータを不揮発的に記録できる記録媒体で構成されている。記録媒体として、テープ、HDD、DVD、半導体メモリ等を記録媒体として用いることができる。メモリ部14は、取り外し可能な状態でビデオカメラに実装されていてもよい。また、メモリ部14を複数用意し、各種設定のデータと画像ファイルを別々の記録媒体に記録してもよい。
操作部17は、動画像の撮影開始、終了操作を行なうトリガーキーや、撮像レンズ群の操作を行なうズームボタンや、メニュー操作ボタンや、ビデオカメラの動作モードを記録モードと再生モードに切り替える、記録/再生切り替えボタンを備える。また、撮像部により撮影されている文字列を優先的にサムネイルにするサムネイルボタンなどを備え、各種操作部からの操作信号は制御部13に出力される。
文字列変換処理部15は、制御部13の制御により、撮像部11より出力される画像信号の輝度成分を、所定のしきい値で、文字部分に対応する値と、背景部分に対応する値と、の2値化したデータとする。該2値化データを制御部13のプログラムメモリに記録している文字認識パターンと照合することにより文字列を抽出し、抽出した文字列データを制御部13に出力するものである。
バッファ部18は、画像処理部12において多重化されたストリームデータを保持するためのものである。画像処理部12は圧縮符合化された映像・音声データを多重化してストリームデータを生成するほか、ストリームデータを多重分離して映像・音声データを生成するものである。光ディスク20はDVD−RやDVD−RW等の記録可能なメディアであり、このメディアに対して映像や静止画が記録・再生される。
記録時、撮像部11で得られた電気信号は、画像処理部12においてデジタルデータに変換される。また、図示しないマイクより取得した音声信号も音声信号処理部(図示せず)においてデジタルデータに変換される。そして、これらの映像・音声データは、データ圧縮部(図示せず)によってそれぞれ圧縮され、画像処理部12において多重化処理を施された後、バッファ部18に保持される。
バッファ部18は、1記録単位のストリームデータを保持できるだけの容量を有している。そして、ストリームデータが1記録単位分だけ蓄積されると、記録再生部19を通してストリームデータを光ディスク20へ書き込む。また、光ディスク20に書き込んだストリームデータに関する情報を制御部13のメモリへ書き込む。また、再生時には、光ディスク20に記録された画像データが記録再生部19によって読み出される。また、バッファ部18を介して画像処理部12に出力される。本実施形態の記録再生部19は、光ディスク20に対して光ビームを照射することによりデータの書き込み、読み出しを行なうピックアップを有する。また、光ディスク20からのビーム反射光を受光するセンサを有する。更に、記録再生部19は、ピックアップをディスクの半径方向に移動するシークモータや光ディスク20を回転させるスピンドルモータ等のメカニズムを有する。
次に、本実施形態のビデオカメラによる撮影時の動作について説明する。
ビデオカメラの撮影時、ユーザーは操作部17を操作し、ビデオカメラを起動し表示部16に画像データをリアルタイムで表示し、プレビューモードにする。ユーザーはプレビュー状態で、構図を確認後、操作部17のトリガーキーを操作し、撮影を開始する。撮影終了時、ユーザーは操作部17のトリガーキーを再度操作し、撮影を終了する。
ビデオカメラによって撮像された画像は、ビデオカメラ内の画像処理部12で画像データに変換されるが、画像データ内の文字列は、撮影中、もしくは撮影終了後、文字列変換処理部15で文字列として認識されテキストデータとして出力される。出力された該文字列のテキストデータは、文字情報出現の特徴によって決まるパラメータ値と組(ペア)でメモリ部14に記録される。
本実施形態の動画撮像装置は撮像中、画像データ中で抽出された文字列に、パラメータ値を設定し、抽出された文字列の中からファイル名を選抜するものである。このため、次に『パラメータ値を設定』と『ファイル名選抜処理』の動作について説明する。
最初に、パラメータ値を設定する動作について説明する。
本実施形態ではパラメータとして、検出のタイミング、ファイル名ボタン操作のタイミング、検出時間の長さ、抽出頻度、文字列の大きさ、画面内の位置、認識の精度などのうち、何れか1つ以上(少なくとも1つ)を用いる。
本実施形態において検出のタイミングとは、認識された文字列の、ファイル内における時間軸上の位置である。また、フファイル名ボタン操作のタイミングとは、動画撮影中に、ユーザーがファイル名にしたい文字列が登場したタイミングで、ユーザーが操作部17の、ファイル名ボタンを操作することで、文字列への意図的な重み付けを変更可能にするものである。なお、ここでのファイル名ボタンは、写真撮影用のフォトボタンと兼用してもよい。検出時間の長さとは、連続して検出されたことを表すパラメータである。抽出頻度とは、ファイル内で検出される頻度を表すパラメータである。
文字列の大きさとは、文字列の内、先頭の文字列の大きさを表すパラメータである。また、動画撮影中に検出される文字列の大きさとは、イメージセンサの受光面に結像する文字列の大きさであるため、ユーザーによる、ズームボタン操作によって行われる撮影レンズ群の移動や、被写体の移動により時間軸上で刻々と変化する。そこで、本実施形態における文字列の大きさを表すパラメータは、検出時間内で平均化した大きさの文字列で定義する。
画面内の位置とは、文字列の画面内の位置を表すパラメータである。動画撮影中に検出される文字列の位置は、イメージセンサの受光面に結像する文字列の位置であるため、前述の文字列の大きさ同様、ユーザーによる、ズームボタン操作や、被写体の移動により時間軸上で刻々と変化する。そこで、本実施形態における文字列の位置を表すパラメータは、あらかじめ表示画面内の領域を分割してそれぞれの領域を定義し、文字列領域の重心が、前記どの領域で最も長時間検出されたかによって定義する。
認識の精度とは、文字列認識の正確性を表すパラメータである。認識の精度は、背景色が均一か否か、背景と文字列の輝度差がどの程度あるかによって決定される。そのため、動画撮影中のズームボタン操作や、被写体の移動によって、認識の精度は刻々と変化する。本実施形態における、文字列の認識の精度は、検出時間内における最大の精度で定義する。
次に、前述のパラメータ値について説明する。
検出のタイミングのパラメータ値は、ファイルの開始を「0」とした経過時間で表す。検出時間の長さを表すパラメータ値は、連続して撮影されている秒数で表す。ファイル名ボタン操作のタイミングを表すパラメータ値は、ボタン操作の有無を表す値で表す。抽出頻度を表すパラメータ値は、ファイル内での同じテキストデータの検出の回数で表す。
また、文字列の大きさを表すパラメータ値は、平均化された大きさの文字列における先頭の文字列が、あらかじめ規定された各種ピクセルサイズの四角形で隠れる大きさであり、あらかじめ規定された四角形に与えられている値で表す。例えば、図4のようにAの四角サイズより小さければ「0」とする。また、Aの四角サイズより大きくBの四角サイズより小さければ「1」とする。また、Bの四角サイズより大きくCの四角サイズより小さければ「2」とする。また、Cの四角サイズより大きければ「5」と表す。
画面内の位置を表すパラメータ値は、図3のように表示画面をA、B、C、Dの領域に分割し、最も長時間検出された位置が、どの領域にあるかによって、それぞれ「0」、「1」、「2」、「5」と表す。認識の精度を表すパラメータ値は、検出時間内における最大の精度で表す。
図2は、撮影した画像データの1シーンで、表示部16の様子を示している。図2のシーンは、撮影開始5秒後のものである。また、図2のシーンを含む画像データによるファイルには60分の連続記録がされている。ここで、文字列の大きさは、便宜上既に検出時間内で平均化されているものとする。また、文字列の位置は最も長時間検出された位置を示しているものとする。さらに認識の精度は検出時間内における最大の精度を表しているものとする。該シーンからは『中区』と『市民大運動会』の2つの文字列が認識されている。認識したそれぞれの文字列のパラメータ値は、以下のようになっている。
『中区』については、「検出するタイミング/00:00:05」、「検出時間の長さ/5」、「文字列の検出頻度/1」である。また、「文字の大きさ/1」、「文字列の画面内の位置/5」、「サムネイルボタン押し圧/0」、「認識の精度/80%」である。
『市民大運動会』については、「検出するタイミング/00:00:01」、「検出時間の長さ/20」、「文字列の検出頻度/1」、「文字の大きさ/2」、「文字列の画面内の位置/2」である。また、「サムネイルボタン押し圧/0」、「認識の精度/90%」である。
次に、フローチャートを参照しながら、検出された文字列のテキストデータと、前記文字列とペアで記録されているパラメータ値を用いて、複数の文字列の中からファイル名を選抜する方法を説明する。
図5は、画像データの取り込みからファイル名選抜動作の制御手順の一例を表したフローチャートである。
図5のフローチャートに示すように、処理が開始されると、ステップS101においてファイルの先頭から順に画像を取り込み撮影したシーンに文字列があるかどうかの判断を行なう。次に、ステップS102において、撮影したシーンに文字列の有無を判断する。この判別の結果、撮影したシーンに文字列がない場合にはステップS112に進んでファイルエンドであるか否かを判断する。この判断の結果、ファイルエンドではない場合にはステップS101に戻り、文字列があるシーンまで次々と画像の読み込みを行なう。そして、ステップS112の判断の結果、ファイル内の全てに文字列がないことを判断するとステップS113に進み、撮影日時をファイル名として設定し終了する。
一方、ステップS102の判断の結果、撮影したシーンに文字列が存在する場合にはステップS103に進む。ステップS103においては、文字列認識部による文字認識を行なう。次に、ステップS104において文字認識が成功したか否かを判断する。この判断の結果、文字認識が成功した場合にはステップS105に進み、成功しなかった場合にはステップS101に戻って前述した処理を繰り返し行なう。
ステップS105においては、文字情報出現の特徴を表すパラメータ値を設定する。次に、ステップS106に進み、文字列のテキストデータと、文字情報出現の特徴を表すパラメータ値をペアでメモリ部14に保存する。
次に、ステップS107に進んで、パラメータ値を次のように変換し、変換されたパラメータ値を用いて評価値の演算を行なう。
先ず、検出するタイミングを表わすパラメータ値である撮影開始からの経過時間は、ファイルの先頭に近いことを表わす重み付けとして、「開始10秒までを5ポイント」、「開始30秒までを2ポイント」と変換する。また、「開始1分までを1ポイント」、「その後0ポイント」と変換する。
また、ファイルの終了に近いことを表す重み付けとして、「終了10秒前までを5ポイント」、「終了30秒前までを2ポイント」、「終了1分前までを1ポイント」、「その前を0ポイント」と変換する。検出時間の長さを表すパラメータ値は、パラメータ値である秒数に、「1/10」をかけた数値として変換する。
ファイル名ボタン操作のタイミングを表すパラメータ値は、ボタン操作有りを1ポイント」、「ボタン操作無しを0ポイント」と変換する。抽出頻度を表わすパラメータ値は、抽出回数をポイントと変換する。文字列の大きさを表わすパラメータ値は、各種四角形の大きさによって与えられた数値をポイントとして変換する。画面内の位置を表わすパラメータ値も、数値をポイントとして変換する。認識の精度を表わすパラメータ値は、文字認識の正確性の割合をそのまま用いる。
評価値Hを求める計算式Hは、「H=検出回数×{(ファイル名ボタン操作+1)×文字認識の正確性×(先頭からのタイミング+検出時間の長さ+終了からのタイミング+文字列の大きさ+画面内の位置)}」で計算される。
次に、ステップS108において、演算された評価値がメモリ部14に保存される。次に、ステップS109で、保存されている評価値同士の大きさの比較を行ない、最もファイル内で最も大きい評価値Xの選抜を行なう(ここでは、初期の評価値X=0と定義されている)。ステップS109の比較の結果、「Xi+1>Xi」でなかった場合には、「i=i+1」してステップS101に戻る。
ステップS109において、最も大きい評価値Xを選抜したら、次に、ステップS110において、ファイル内の文字列全てについて比較を行った(ファイルエンド)か否かを判断する。この判断の結果、ファイルエンドではない場合にはステップS101に戻って前述した処理を繰り返し行なう。また、ステップS110の判断の結果、ファイルエンドであった場合にはステップS111に進む。
ステップS111においては、最も大きい評価値Xiを持つ文字列を動画ファイルのファイル名として設定する。例えばファイル内の全ての文字列が、図2の条件で抽出された、『中区』と『市民大運動会』の2つの文字列のみである場合、『中区』が9.2ポイント、『市民大運動会』が11.7ポイントである。したがって、『市民大運動会』の文字列の方が評価値の高い文字列と判断され、このファイルのファイル名(データファイル名)は『市民大運動会』と決定される。
設定されたファイル名は表示部16に表示される。なお、自動的に設定されたサムネイルがユーザーの意図と異なった場合、評価値の大きい順に、表示部16にリスト表示された文字列の映っている画像の中から、ユーザーが別の画像を選択してサムネイルとすることができる。
このように、文字情報出現の特徴で定義されるパラメータとして、時間軸に関係するパラメータを加えることで、動画撮影中に次々現れる複数の文字列の中から1つの文字列を選抜し、ファイル名とすることができる。
また、本実施形態では、評価値Hを求める計算式を、下記のようにすることで、ユーザーがサムネイルにしようと意図して撮影を行った文字列の映っている画像をサムネイルとして選択することが可能となり、より正確にサムネイルを設定することができる。
「H=h×検出回数×{(n×サムネイルボタン操作+1)×l×文字認識の正確性×(x×先頭からのタイミング+y×終了からのタイミング+q×検出時間の長さ+p×文字列の大きさ+z×画面内の位置)}」で計算する。
ここで、抽出頻度の優先度を表わす係数h、n、文字認識の正確性の優先度を表わす係数l、先頭からのタイミングの優先度を表わす係数x、終了からのタイミングの優先度を表わす係数y、検出時間の長さの優先度を表わす係数qとする。また、文字列の大きさの優先度を表わす係数p、画面内の位置の優先度を表わす係数zとし、前述の係数l、x、y、q、p、zを『ファイル名らしさの重み』を表す値とする。
すなわち、ユーザーが前述のパラメータのうちどれを、どの程度優先するかを、操作部17のメニュー操作ボタンで操作することで、ファイル名らしさの重みを表す値を変化させることができる。
このように、ファイル名らしさの重みを表す値を変更することで、ユーザーがファイル名にしようと意図して撮影を行った文字列を、ファイル名としてより正確に選抜することができる。
前述のファイル名らしさの重みを表す値は、画像信号のデータファイルと同じ記録媒体(本実施形態においては光ディスク20)に記録することによって、1つの記録媒体内でのファイル名に一貫性を持たせることができる。また、ファイル名らしさの重みを表す値を、前記画像信号のデータファイルと異なる記録手段であって、例えば、ビデオカメラ本体内部の不揮発メモリ部(本実施形態においてはメモリ部14)に記録するようにしてもよい。このようにすると、同一のビデオカメラを用いた撮影において、ファイル名に一貫性を持たせることができる。
また、ファイル名として使われなかった文字列を検索する場合、例えば、表示部16に抽出頻度順や文字列の大きさ順に文字列をリストアップすることにより、文字列を含んだ多くのシーンの中から、意図したシーンを検索することが容易となる。また、例えば表示部16に、評価値順にリストアップすることによって、多くの文字列を含んだ大きなファイルの中からでも、意図して文字列を撮影したシーンの検索を容易に行なうことが可能となる。
図6−1は、1つの動画ファイルであるファイル1を模式的に表したものである。図示されるシーン6−1、シーン6−2、シーン6−3、シーン6−4の部分に、それぞれ図6−2のシーン6−1、シーン6−2、シーン6−3、シーン6−4に示すようなシーンが撮影されている。この動画ファイルの中で、最も評価値が高い文字列は、シーン6−1の「1.時代劇の起」の文字列である。そのため、ファイル1のファイル名は「1.時代劇の起」と決定されている。
また、ユーザーは、シーン6−1、シーン6−2、シーン6−3、シーン6−4の部分で文字列の入ったシーンの撮影を行っているため、この動画ファイルの検索時には、図7に示したように、文字列がリストアップされる。このように、ファイル名として用いられなかった文字列を検索時にリストアップすることによって、意図して文字列を撮影したシーンの検索を容易に行なうことが可能となる。
また、動画撮影において、撮影開始から終了までの一連のシーンを単一のファイルとして撮影し、撮影終了後に分割を行って、分割したファイルの順番を入れ替えるなどの編集を行なう場合がある。
次に、単一のファイルから、複数のファイルに分割した際の、ファイル名選抜方法について説明する。
図8は、本実施の形態における、ファイル名選抜方法についての処理手順の一例を説明するフローチャートであり、図9に示すように、一つの動画ファイル1をファイル2とファイル3に分割した場合のファイル名選抜の処理を示すものである。
処理が開始されると、最初のステップS801においてファイル1が分割されたか否か判断し、分割を認識するまで待機する。そして、ステップS801の判断の結果、ファイル1がファイル2とファイル3に分割されたことを認識するとステップS802に進む。ステップS802においては、分割されたファイル3に含まれる文字列とパラメータ値を読み出す。この時、ファイル2のファイル名は、ファイル1のファイル名を引き継ぐ。
次に、ステップS803において、分割されたファイル3中に文字列が存在するかどうかの判断を行なう。この判断の結果、ファイル3中に文字列が存在しなければ、ステップS804に進み、分割前のファイルに一連番号を付加する処理を行ない、作業を終了する。
一方、ステップS803の判断の結果、分割されたファイル3中に文字列が存在する場合にはステップS805に進み、ファイル3について前述の方法で、評価値の大きさの比較を行なう。この比較の結果、ファイル3内で最も大きい評価値を持つ文字列を、ファイル3のファイル名として設定する(ステップS806)。
前述のように、自動的に設定されたファイル3のファイル名は表示部16に表示される。そして、ファイル名がユーザーの意図と異なった場合、表示部16に評価値の大きい順にリストアップされた文字列の中から、ユーザーが別の文字列を選択し、ファイル3のファイル名とすることができる。
例えば、図6−1の動画ファイル1を図9のようにファイル2とファイル3に分割した場合、分割後のファイル3において評価値の演算が再度なされる。この時、ファイル3中で最も評価値が高い文字列が、図6−2のシーンから抽出された文字列である「4.時代劇の結」であるとすると、ファイル3のファイル名は、「4. 時代劇の結」と決定される。またこのとき、ファイル2においても再度評価値の演算を行ない、ファイル2のファイル名を新たに設定できるようにしてもよい。
このように、本実施形態においては、撮影開始から終了までの一連のシーンを単一のファイルとして撮影して、撮影終了後に分割を行った場合にも、分割したファイルに文字認識により得られた新しいファイル名を付加することができる。このため、順番を入れ替えた場合でもファイルの中身をいちいち確認しなくても内容の把握が可能となる。
(本発明に係る他の実施の形態)
前述した本発明の実施の形態における動画撮像装置を構成する各手段は、コンピュータのRAMやROMなどに記憶されたプログラムが動作することによって実現できる。このプログラム及び前記プログラムを記録したコンピュータ読み取り可能な記録媒体は本発明に含まれる。
また、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施の形態も可能であり、具体的には、複数の機器から構成されるシステムに適用してもよいし、また、一つの機器からなる装置に適用してもよい。
なお、本発明は、前述した動画撮像方法における各工程を実行するソフトウェアのプログラム(実施の形態では図5、図8に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接、あるいは遠隔から供給する。そして、そのシステムあるいは装置のコンピュータが前記供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
したがって、本発明の機能処理をコンピュータで実現するために、前記コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であってもよい。
プログラムを供給するための記録媒体としては種々の記録媒体を使用することができる。例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などがある。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続する。そして、前記ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。
また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザーに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザーに配布し、所定の条件をクリアしたユーザーに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施の形態の機能が実現される他、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行なうことによっても前述した実施の形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によっても前述した実施の形態の機能が実現される。
さらに、記憶媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。そして、その後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現される。
本発明の実施形態を示し、ビデオカメラの構成例を説明するブロック図である。 本発明の実施形態を示し、表示部に文字列が映っているデータファイル中の1シーンの一例を表わす図である。 本発明の実施形態を示し、画面内の位置を表わすパラメータ値を説明する図である。 本発明の実施形態を示し、規定された文字列の大きさを表わすパラメータ値を説明する図である。 本発明の実施形態を示し、画像データの取り込みからファイル名選抜動作の制御手順の一例を説明するフローチャートである。 本発明の実施形態を示し、1つの動画ファイルを模式的に表わした図である。 本発明の実施形態を示し、シーン6-1〜シーン6-4のそれぞれに文字列を含んだ画像が表示部に表示される例を説明する図である。 本発明の実施形態を示し、1つのファイル内のキャプチャ画像を検索する際に、抽出された文字列が表示部にリストアップされる例を表わす図である。 本発明の実施形態を示し、ファイル分割の際のファイル名選抜方法についての処理手順の一例を示すフローチャートである。 本発明の実施形態を示し、分割された動画ファイルを模式的に表した図である。
符号の説明
11 撮像部
12 画像処理部
13 制御部
14 メモリ部
15 文字列変換処理部
16 表示部
17 操作部
18 バッファ部
19 記録再生部
20 光ディスク

Claims (10)

  1. 視覚情報を取り込んで画像信号を出力する撮像手段と、
    前記撮像手段から出力される画像信号を記録媒体に記録するために所定のデータファイルを生成するデータファイル生成手段と、
    前記記録媒体に記録される画像信号から文字情報を抽出する文字認識手段と、
    前記文字認識手段によって抽出されたファイル内における文字情報出現の特徴に応じて、ファイル名として選択する際に用いられる時間軸に関連したパラメータ値を設定するパラメータ値設定手段と、
    前記パラメータ値設定手段によって設定されたパラメータ値から評価値を演算する評価値演算手段と、
    前記演算された評価値の高い文字情報を、前記画像信号のファイル名として設定するファイル名設定手段とを有することを特徴とする動画撮像装置。
  2. 前記パラメータ値は、文字情報の検出のタイミング、検出時間の長さ、検出頻度、文字の大きさ、文字列の画面内の位置、認識の精度の中から少なくとも1つ以上を用いて設定することを特徴とする請求項1に記載の動画撮像装置。
  3. 前記パラメータ値から評価値を演算する定義は、ユーザーにより変更可能であることを特徴とする請求項1または2に記載の動画撮像装置。
  4. 前記抽出した文字情報と、前記パラメータ値とを用いて前記画像信号の検索を行なう画像信号検索手段を有することを特徴とする請求項1〜3の何れか1項に記載の動画撮像装置。
  5. 前記ファイル名設定手段は、前記ファイル名が付加されたデータファイルが複数のデータファイルに分割されると、分割された後のファイルに、前記パラメータ値から演算した評価値を用いて新たなファイル名を付加することを特徴とする請求項1に記載の動画撮像装置。
  6. 視覚情報を取り込んで画像信号を出力する撮像工程と、
    前記撮像工程において出力される画像信号を記録媒体に記録するために所定のデータファイルを生成するデータファイル生成工程と、
    前記記録媒体に記録される画像信号から文字情報を抽出する文字認識工程と、
    前記文字認識工程において抽出されたファイル内における文字情報出現の特徴に応じて、ファイル名として選択する際に用いられる時間軸に関連したパラメータ値を設定するパラメータ値設定工程と、
    前記パラメータ値設定工程によって設定されたパラメータ値から評価値を演算する評価値演算工程と、
    前記演算された評価値の高い文字情報を、前記画像信号のファイル名として設定するファイル名設定工程とを有することを特徴とする動画撮像方法。
  7. 前記パラメータ値は、文字情報の検出のタイミング、検出時間の長さ、検出頻度、文字の大きさ、文字列の画面内の位置、認識の精度の中から少なくとも1つ以上を用いて設定することを特徴とする請求項6に記載の動画撮像方法。
  8. 前記パラメータ値から評価値を演算する定義は、ユーザーにより変更可能であることを特徴とする請求項6または7に記載の動画撮像方法。
  9. 前記抽出した文字情報と、前記パラメータ値とを用いて前記画像信号の検索を行なう画像信号検索工程を有することを特徴とする請求項6〜8の何れか1項に記載の動画撮像方法。
  10. 前記ファイル名設定工程は、前記ファイル名が付加されたデータファイルが複数のデータファイルに分割されると、分割された後のファイルに、前記パラメータ値から演算した評価値を用いて新たなファイル名を付加することを特徴とする請求項6に記載の動画撮像方法。
JP2007132087A 2007-05-17 2007-05-17 動画撮像装置及び動画撮像方法 Expired - Fee Related JP4804417B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2007132087A JP4804417B2 (ja) 2007-05-17 2007-05-17 動画撮像装置及び動画撮像方法
US12/106,019 US8094202B2 (en) 2007-05-17 2008-04-18 Moving image capture apparatus and moving image capture method
CN2008100818787A CN101309383B (zh) 2007-05-17 2008-05-16 运动图像拍摄设备和运动图像拍摄方法
US13/325,802 US8842189B2 (en) 2007-05-17 2011-12-14 Moving image capture apparatus and moving image capture method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007132087A JP4804417B2 (ja) 2007-05-17 2007-05-17 動画撮像装置及び動画撮像方法

Publications (3)

Publication Number Publication Date
JP2008288898A JP2008288898A (ja) 2008-11-27
JP2008288898A5 JP2008288898A5 (ja) 2010-07-01
JP4804417B2 true JP4804417B2 (ja) 2011-11-02

Family

ID=40125567

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007132087A Expired - Fee Related JP4804417B2 (ja) 2007-05-17 2007-05-17 動画撮像装置及び動画撮像方法

Country Status (2)

Country Link
JP (1) JP4804417B2 (ja)
CN (1) CN101309383B (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102782680B (zh) * 2010-02-26 2016-01-20 乐天株式会社 信息处理装置、信息处理方法、记录了信息处理程序的记录介质
JP7333761B2 (ja) 2020-01-30 2023-08-25 シャープ株式会社 システム及び画像形成システム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3425834B2 (ja) * 1995-09-06 2003-07-14 富士通株式会社 文書画像からのタイトル抽出装置および方法
JP4275866B2 (ja) * 2000-01-27 2009-06-10 富士通株式会社 カラー画像から文字列パターンを抽出する装置および方法
JP2002374481A (ja) * 2001-06-18 2002-12-26 Matsushita Electric Ind Co Ltd ファイル名設定システム
JP4239442B2 (ja) * 2001-07-24 2009-03-18 カシオ計算機株式会社 電子カメラ、及びそのプログラム
JP2004005314A (ja) * 2002-06-03 2004-01-08 Matsushita Electric Ind Co Ltd データ検索システム及び、それに関する、装置または方法または記録媒体またはプログラム
JP2005056315A (ja) * 2003-08-07 2005-03-03 Ricoh Co Ltd 情報処理装置、プログラム及び記憶媒体
JP2005057360A (ja) * 2003-08-07 2005-03-03 Hitachi Ltd 画像撮影装置およびプログラム
JP4276042B2 (ja) * 2003-10-07 2009-06-10 パイオニア株式会社 索引データ生成装置、索引データ生成方法、索引データ生成プログラムおよびそれを記録した情報記録媒体、並びに、コンテンツデータ再生装置、コンテンツデータ再生方法、コンテンツデータ再生プログラムおよびそれを記録した情報記録媒体
JP3912423B2 (ja) * 2006-01-06 2007-05-09 三菱電機株式会社 推奨番組抽出装置、推奨番組抽出方法

Also Published As

Publication number Publication date
JP2008288898A (ja) 2008-11-27
CN101309383B (zh) 2010-07-21
CN101309383A (zh) 2008-11-19

Similar Documents

Publication Publication Date Title
US9013604B2 (en) Video summary including a particular person
EP2710594B1 (en) Video summary including a feature of interest
KR101532294B1 (ko) 자동 태깅 장치 및 방법
US20100066847A1 (en) Imaging apparatus and program
JP2007110193A (ja) 画像処理装置
JP2008084213A (ja) 画像処理装置、撮像装置、画像処理方法およびプログラム
US8842189B2 (en) Moving image capture apparatus and moving image capture method
JP5213503B2 (ja) 記憶再生装置
JP6081788B2 (ja) 動画像処理装置及び動画像処理方法
JP5112901B2 (ja) 画像再生装置、画像再生方法、画像再生用サーバー、および画像再生システム
JP4804417B2 (ja) 動画撮像装置及び動画撮像方法
JP5369776B2 (ja) 撮像装置、撮像方法、及び撮像プログラム
JP2008199330A (ja) 動画像管理装置
JP2009088944A (ja) 文字認識装置、撮像装置及び映像再生装置
JP5153584B2 (ja) 撮像装置及び撮像方法
JP5020705B2 (ja) 動画撮像装置及び動画撮像方法
JP2010237911A (ja) 電子機器
JP2012010133A (ja) 画像処理装置および画像処理プログラム
JP2009212935A (ja) 画像処理装置および方法、並びにプログラム
JP2008154099A (ja) カメラ装置およびカメラ装置における静止画生成方法
JP2007267308A (ja) 画像再生装置
JP5359334B2 (ja) 画像処理装置および画像処理プログラム、撮像装置
KR101499552B1 (ko) 디지털 영상 처리장치
JP5386915B2 (ja) 動画撮像装置、動画撮像方法、及びプログラム
JP2010004433A (ja) 動画検索システムおよび動画検索方法、動画検索プログラム並びにそのプログラムを記憶するコンピュータ読み取り可能な記憶媒体

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100517

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100517

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110610

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110712

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110809

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140819

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees