JP5091708B2 - 検索用情報作成装置、検索用情報作成方法、検索用情報作成プログラム - Google Patents

検索用情報作成装置、検索用情報作成方法、検索用情報作成プログラム Download PDF

Info

Publication number
JP5091708B2
JP5091708B2 JP2008033910A JP2008033910A JP5091708B2 JP 5091708 B2 JP5091708 B2 JP 5091708B2 JP 2008033910 A JP2008033910 A JP 2008033910A JP 2008033910 A JP2008033910 A JP 2008033910A JP 5091708 B2 JP5091708 B2 JP 5091708B2
Authority
JP
Japan
Prior art keywords
program
information
time
program information
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008033910A
Other languages
English (en)
Other versions
JP2009194665A (ja
Inventor
章 中村
健二 寺田
博登 井手口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2008033910A priority Critical patent/JP5091708B2/ja
Publication of JP2009194665A publication Critical patent/JP2009194665A/ja
Application granted granted Critical
Publication of JP5091708B2 publication Critical patent/JP5091708B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Description

本発明は、録画された大量のテレビ番組から所望のテレビ番組を検索するための検索用情報を作成する技術に関し、特に、画面に表示される文字に基づいてテレビ番組を検索するための検索用情報を作成する技術に関する。
従来、ハードディスクレコーダは、テレビ番組(以下、単に番組という)を録画するときに、電子番組ガイドを利用して、その番組タイトルを自動的に記録することができる。したがって、ユーザは、番組タイトルを検索することにより、録画番組の中から所望の番組を選択して視聴することができる。また、このような番組単位の検索とは異なり、番組内の特定の部分をユーザが指定して検索する技術も知られている(例えば、特許文献1参照)。
特許文献1に記載された字幕付き番組記録・再生装置は、放送局からの字幕付き番組(字幕放送)を記録するハードディスクと、字幕放送を表示するTV受像機と、字幕抜き取り手段と、字幕位置記録手段と、切換えスイッチと、検索手段とで構成されている。字幕位置記録手段は、字幕抜き取り手段で抜き取った字幕の内容を文字情報として、当該字幕が表示されている番組の位置情報(フレーム情報)と共に記録する。切換えスイッチは、字幕付き番組又は抜き取った字幕(文字)を選択的にTV受像機に表示させる。検索手段は、字幕つき番組の再生時に、ユーザによって指定された文字情報を検索する機能と、字幕位置記録手段内から得た番組内における画面の位置情報(フレーム情報)から、ハードディスクに録画された字幕付き番組を再生可能にする機能を有する。したがって、この字幕付き番組記録・再生装置は、ユーザの所望の番組の再生時に番組内の特定の部分をユーザが指定して検索するために、字幕が表示されている番組の画面の位置情報(フレーム情報)を記録する。これにより、録画された所望の1つの番組から字幕のキーワードを頼りに所望のシーンを個人で私的に視聴することを可能とする。
特開2006−279312号公報(段落0021−0022、図3)
しかしながら、特許文献1に記載された字幕付き番組記録・再生装置は、大量の番組の中から、ユーザが指定した文字が表示された番組が放送された日時や、番組内の特定のシーンが画面表示された時刻等を高速に検索することはできない。例えば、放送局では、複数局の番組の同時録画に対応するために複数のハードディスクレコーダ等の機材を用意し、自局だけではなく複数の放送局の数か月分の番組を録画蓄積しておき、必要に応じて、特定の番組が放送された日時や番組内の特定のシーンを検索する場合がある。したがって、このような検索業務を高速に行うことが要望されている。
本発明は、以上のような問題点に鑑みてなされたものであり、録画された番組の中から画面表示される文字に基づいて、特定の番組が放送された日時や番組内の特定のシーンを高速に検索するための検索用情報を作成する技術を提供することを目的とする。
本発明は、前記目的を達成するために創案されたものであり、まず、請求項1に記載の検索用情報作成装置は、通信ネットワークから取得したテレビの番組情報に基づいて番組の放送開始時刻に当該番組の録画を開始すると共に当該番組についての公開用の番組情報を生成するテレビ放送同時録画装置と通信可能に接続され、前記テレビ放送同時録画装置で記録される動画において画面に表示される文字に基づいて録画番組を検索するための検索用情報を作成する検索用情報作成装置であって、番組情報取得手段と、動画取得手段と、文字検出処理手段とを備えることとした。
かかる構成によれば、検索用情報作成装置は、番組情報取得手段によって、前記テレビ放送同時録画装置から前記公開用の番組情報を取得し、前記公開用の番組情報を取得した時刻を、番組ごとの開始時刻として前記公開用の番組情報に加えた新たな番組情報を生成し、前記新たな番組情報を番組情報データベースに登録する。そして、検索用情報作成装置は、動画取得手段によって、前記テレビ放送同時録画装置から、記録される前記動画を取得し、取得した動画をファイルとして動画蓄積手段に格納する。そして、検索用情報作成装置は、文字検出処理手段によって、前記ファイルから、動画を構成するフレーム毎の静止画を抽出し、抽出した静止画から文字列を検出し、当該文字列が検出された画面が表示された番組内での時刻情報に基づいて、前記登録された番組情報における開始時刻に同期させた時刻情報として文字列の検出時刻を生成し、この生成した検出時刻および検出した文字列を前記検索用情報として検索用情報データベースに登録する。ここで、文字列が検出された画面が表示された番組内での時刻情報は、その番組の番組尺におけるフレーム番号等の情報を示し、登録された開始時刻は、番組が放送された日時を示している。したがって、生成された文字の検出時刻は、番組が放送された日時に同期したものとなる。
また、請求項2に記載の検索用情報作成装置は、請求項1に記載の検索用情報作成装置であって、前記文字検出処理手段が、文字認識処理手段と、開始時刻読出手段と、タイムコード取得手段と、検出時刻生成手段と、検出文字列登録手段とを備えることとした。
かかる構成によれば、検索用情報作成装置において、前記文字検出処理手段は、文字認識処理手段によって、前記ファイルから、動画を構成する静止画を抽出し、抽出した静止画を文字認識用辞書と照合する。そして、文字検出処理手段は、開始時刻読出手段によって、前記照合により文字列が認識された場合に、前記番組情報データベースから、文字列が認識された番組に対応した番組情報の前記開始時刻を読み出す。そして、文字検出処理手段は、タイムコード取得手段によって、前記文字列が認識されたファイルにおいて先頭画面から文字列が認識された画面の位置までの経過時間を示すタイムコードを取得する。そして、文字検出処理手段は、検出時刻生成手段によって、前記読み出した開始時刻に、前記取得したタイムコードの時間を加算することで、前記検出時刻を生成する。そして、文字検出処理手段は、検出文字列登録手段によって、前記認識した文字列を前記検出時刻に対応させて前記検索用情報データベースに登録する。
また、請求項3に記載の検索用情報作成方法は、通信ネットワークから取得したテレビの番組情報に基づいて番組の放送開始時刻に当該番組の録画を開始すると共に当該番組についての公開用の番組情報を生成するテレビ放送同時録画装置で記録される動画において画面に表示される文字に基づいて録画番組を検索するための検索用情報を作成するために、番組情報取得手段と、動画取得手段と、文字検出処理手段とを備えた検索用情報作成装置における検索用情報作成方法であって、番組情報取得ステップと、動画取得ステップと、文字検出処理ステップとを有することとした。
かかる手順によれば、検索用情報作成装置は、番組情報取得ステップにて、前記番組情報取得手段によって、前記テレビ放送同時録画装置から前記公開用の番組情報を取得し、前記公開用の番組情報を取得した時刻を、番組ごとの開始時刻として前記公開用の番組情報に加えた新たな番組情報を生成し、前記新たな番組情報を番組情報データベースに登録する。そして、検索用情報作成装置は、動画取得ステップにて、前記動画取得手段によって、前記テレビ放送同時録画装置から、記録される前記動画を取得し、取得した動画をファイルとして動画蓄積手段に格納する。そして、検索用情報作成装置は、文字検出処理ステップにて、前記文字検出処理手段によって、前記ファイルから、動画を構成するフレーム毎の静止画を抽出し、抽出した静止画から文字列を検出し、当該文字列が検出された画面が表示された番組内での時刻情報に基づいて、前記登録された番組情報における開始時刻に同期させた時刻情報として文字列の検出時刻を生成し、この生成した検出時刻および検出した文字列を前記検索用情報として検索用情報データベースに登録する。
また、請求項4に記載の検索用情報作成プログラムは、通信ネットワークから取得したテレビの番組情報に基づいて番組の放送開始時刻に当該番組の録画を開始すると共に当該番組についての公開用の番組情報を生成するテレビ放送同時録画装置で記録される動画において画面に表示される文字に基づいて録画番組を検索するための検索用情報を作成するために、コンピュータを、番組情報取得手段、動画取得手段、文字検出処理手段として機能させることとした。
かかる構成によれば、検索用情報作成プログラムは、番組情報取得手段によって、前記テレビ放送同時録画装置から前記公開用の番組情報を取得し、前記公開用の番組情報を取得した時刻を、番組ごとの開始時刻として前記公開用の番組情報に番組ごとに加えた新たな番組情報を生成し、前記新たな番組情報を番組情報データベースに登録する。そして、検索用情報作成プログラムは、動画取得手段によって、前記テレビ放送同時録画装置から、記録される前記動画を取得し、取得した動画をファイルとして動画蓄積手段に格納する。そして、検索用情報作成プログラムは、文字検出処理手段によって、前記ファイルから、動画を構成するフレーム毎の静止画を抽出し、抽出した静止画から文字列を検出し、当該文字列が検出された画面が表示された番組内での時刻情報に基づいて、前記登録された番組情報における開始時刻に同期させた時刻情報として文字列の検出時刻を生成し、この生成した検出時刻および検出した文字列を前記検索用情報として検索用情報データベースに登録する。
請求項1、請求項3または請求項4に記載の発明によれば、検索用情報作成装置は、番組において画面に表示された文字列を検出した時刻を、番組が放送された日時に同期させた検索用情報を作成する。これにより、作成された検索用情報と、指定された文字とを利用することで、録画された番組の中から放送された日時や番組内の特定のシーンを高速に検索することができる。
請求項2に記載の発明によれば、検索用情報作成装置は、動画を蓄積する処理と、動画において画面に表示される文字を検出する処理と、画面に表示された文字列を検出した時刻を生成する処理とを並行して行うことができるので、検索用情報を高速に作成できる。これにより、番組の放送が開始してから検索を開始するまでの準備に必要な時間を低減できる。
以下、図面を参照して本発明の検索用情報作成装置を実施するための最良の形態(以下「実施形態」という)について詳細に説明する。
[検索システムの構成]
図1は、本発明の実施形態に係る検索用情報作成装置を含む検索システムの構成を模式的に示すブロック図である。検索システム1は、図1に示すように、番組検索装置10と、テレビ放送同時録画装置20と、検索用情報作成装置100とを備えている。本実施形態では、検索システム1は、番組検索装置10と検索用情報作成装置100とが常時接続されていて、録画されたテレビ番組(以下、単に番組という)の中から、操作者(ユーザ)により指定されたキーワード(文字列)に基づいて、番組を検索するものとする。
番組検索装置10、テレビ放送同時録画装置20および検索用情報作成装置100は、例えば、CPU(Central Processing Unit)と、RAM(Random Access Memory)と、ROM(Read Only Memory)と、HDD(Hard Disk Drive)と、通信を行うためのNIC(Network Interface Card)等を備えている。また、番組検索装置10、テレビ放送同時録画装置20および検索用情報作成装置100は、LAN(Local Area Network)で接続されている。各装置には、例えば、UPnP AV(Universal Plug and Play Audio and Video)やDLNA(Digital Living Network Alliance)ガイドラインに準拠した既存ネットワーク家電で用いられている公知技術を用いることができる。
(番組検索装置)
番組検索装置10は、入力装置Mから入力された情報に基づいて、検索用情報作成装置100から番組を検索するものであり、例えば、一般的なパーソナルコンピュータから構成される。なお、番組検索装置10の台数は、複数でもよい。ここで、入力装置Mは、ユーザから各種情報を入力することのできるデバイスであり、例えば、キーボード、マウス、押し釦スイッチ、リモコン等から構成される。
(テレビ放送同時録画装置)
テレビ放送同時録画装置20は、通信ネットワークNWから取得したテレビの番組情報に基づいて番組の放送開始時刻に当該番組の録画を開始すると共に当該番組についての公開用の番組情報を生成するものである。テレビ放送同時録画装置20は、図1に示すように、番組情報取得手段21と、番組情報記憶手段22と、公開用番組情報生成手段23と、チューナ24と、録画手段25と、動画蓄積手段26と、再生手段27とを備えている。なお、テレビ放送同時録画装置20としては、市販されているものを利用することができる。また、テレビ放送同時録画装置20の台数は、複数でもよい。
番組情報取得手段21は、例えば、インターネット等の通信ネットワークNWを介してテレビ番組ガイド(電子番組表:Electric Program Guide)を番組情報として取得し、番組情報記憶手段22に格納するものである。番組情報記憶手段22は、例えば、一般的なメモリやハードディスク等から構成される。公開用番組情報生成手段23は、番組情報記憶手段22に記憶された番組情報から、番組の放送開始時刻に当該番組についての公開用の番組情報を生成するものである。この公開用の番組情報は、例えば、チャネルや番組タイトル等に関する情報を示す。録画手段25は、アンテナATNを介してチューナ24で受信した放送局からの放送波(番組)を録画してハードディスク等の動画蓄積手段26に格納する。チューナ24は、例えば、MPEG−2 TS(Moving Picture Expert Group-2 Transport Stream)を受信する。再生手段27は、チューナ24で受信した番組または動画蓄積手段26に蓄積された番組を示す動画を出力装置Dに出力可能に再生するものである。ここで、出力装置Dは、番組の映像を表示する表示手段と、音声を出力する音声出力手段(スピーカ)等を備える。このうち表示手段は、例えば、CRT(Cathode Ray Tube)、液晶ディスプレイ(LCD:Liquid Crystal Display)、PDP(Plasma Display Panel)、EL(Electronic Luminescence)等から構成される。
(検索用情報作成装置)
検索用情報作成装置100は、テレビ放送同時録画装置20と通信可能に接続され、テレビ放送同時録画装置20で記録される動画において画面に表示される文字に基づいて録画番組を検索するための検索用情報を作成するものである。検索用情報作成装置100は、図1に示すように、記憶手段110と、動画蓄積手段120と、番組情報取得手段130と、動画取得手段150と、文字検出処理手段170とを備えている。
記憶手段110は、例えば、演算処理等に利用されるRAMと、所定のプログラム等を記憶するROMと、番組情報データベース111(番組情報DB111、図2(b)参照)や検索用情報データベース112(検索用情報DB112、図3参照)を格納するハードディスク等を備えている。
動画蓄積手段120は、テレビ放送同時録画装置20から取得する動画を番組毎のファイルFとして蓄積するものであり、一般的なハードディスク等から構成される。
番組情報取得手段130は、テレビ放送同時録画装置20から公開用の番組情報を取得し、公開用の番組情報を取得した時刻を、番組ごとの開始時刻として公開用の番組情報に加えた新たな番組情報を生成し、この新たな番組情報を番組情報データベース111に登録するものである。番組情報取得手段130は、テレビ放送同時録画装置20に対してUPnP AVのコントロールポイントとして機能し、テレビ放送同時録画装置20において公開用の番組情報が存在するときにそれを取得して新たな番組情報を生成する。なお、公開用の番組情報は、次々に生成されるので番組情報取得手段130は、新たな公開用の番組情報を取得し続ける。ここで、図2を参照して、番組情報取得手段130で取得する公開用の番組情報の一例と、生成する番組情報の一例とを説明する。
番組情報取得手段130で取得する番組情報を図2(a)に示す。例えば、公開用の番組情報201は、IDが「1」であり、チャネルが「01」であり、タイトルが「A」である。また、公開用の番組情報202は、IDが「2」であり、チャネルが「02」であり、タイトルが「B」である。
図2(b)に示すように、番組情報取得手段130が作成する番組情報DB(番組情報データベース)112は、8個の情報項目として、ID211、チャネル212、タイトル213、開始時刻214、番組のアドレス(RES)215、状態216、ファイル名217、読み込み位置218を有している。このうち、ID211、チャネル212およびタイトル213の項目は、図2(a)に示した公開用の番組情報201,202と同じである。残りの項目については、新たに生成した情報である。
開始時刻214は、番組情報取得手段130が、テレビ放送同時録画装置20から公開用の番組情報を取得した時刻を示す。例えば「01:00:00」のように記述される。
番組のアドレス(RES)215は、番組をダウンロードするアドレス(URL)を示し、「http://192.168.1.113:15000/stream/04/b9/004b9ZZ」のように記述される。
状態216は、各IDで識別されるそれぞれの番組について、テレビ放送同時録画装置20からの取得状態を示すものである。例えば、「番組情報取得済み」、「ダウンロード中」、「ダウンロード済み」、「文字認識終了」のように記述される。番組情報取得手段130は、テレビ放送同時録画装置20から公開用の番組情報を取得したときに、状態216を「番組情報取得済み」に設定する。
ファイル名217は、各IDで識別されるそれぞれの番組について、ダウンロードした動画を書き込むファイル(書き出しファイル)を識別するものである。
読み込み位置218は、各IDで識別されるそれぞれの番組について、動画を所定容量ずつダウンロードするときにそれぞれのフレーム位置を識別するものである。
図1に戻って、検索用情報作成装置100の構成の説明を続ける。
動画取得手段150は、テレビ放送同時録画装置20から、記録される動画を取得し、取得した動画をファイル(書き出しファイル)として動画蓄積手段120に格納するものである。具体的には、動画取得手段150は、記憶手段110に記憶された番組情報DB111(図2参照)において、状態216が「番組情報取得済み」または「ダウンロード中」である場合に、番組のアドレス215および読み込み位置218を取得し、これらの情報を用いて、テレビ放送同時録画装置20から動画をダウンロードする。この際に、動画取得手段150は、状況に応じて、番組情報DB111(図2参照)の状態216を、「ダウンロード中」または「ダウンロード済み」に設定する。
本実施形態では、動画取得手段150は、チャネル毎に動画を取得するように構成されている。つまり、複数チャネルから動画を取得する際に、1つのチャネルについて書き出しファイルを閉じてから(クローズしてから)、別のチャネルについて書き出しファイルを開く(オープンする)といったような無駄な動作を行う必要がない。そのため、書き出しファイルを再び開いたとき(再オープンしたとき)、書き込むべき読み出し位置のフレームまで移動させる手間を省くことで複数チャネルから動画を高速に取得することができる。なお、複数チャネルに対応してテレビ放送同時録画装置20の台数を複数とすることが好ましい。
文字検出処理手段170は、ファイルから、動画を構成するフレーム毎の静止画を抽出し、抽出した静止画から文字列を検出し、当該文字列が検出された画面が表示された番組内での時刻情報に基づいて、登録された番組情報における開始時刻に同期させた時刻情報として文字列の検出時刻を生成し、この生成した検出時刻および検出した文字列を検索用情報として検索用情報データベース112に登録するものである。文字検出処理手段170は、図1に示すように、文字認識処理手段171と、開始時刻読出手段172と、タイムコード取得手段173と、検出時刻生成手段174と、検出文字列登録手段175とを備えている。
文字認識処理手段171は、ファイルから、動画を構成する静止画を抽出し、抽出した静止画を文字認識用辞書と照合するものである。具体的には、文字認識処理手段171は、記憶手段110に記憶された番組情報DB111(図2参照)において、状態216が「ダウンロード中」または「ダウンロード済み」である番組について、書き出しファイルを開き、動画よりI−Frameを所定間隔でビットマップとして抜き出し、文字認識を行う。文字認識が終了した際に、文字認識処理手段171は、番組情報DB111(図2参照)の状態216を、「文字認識終了」に設定する。文字認識処理手段171は、文字列を検出したことを示す情報を開始時刻読出手段172およびタイムコード取得手段173に出力すると共に、検出した文字列を検出文字列登録手段175に出力する。
文字認識処理手段171は、文字認識用辞書との照合については、一般的なOCR(Optical Character Reader)ライブラリの機能を用いることができる。この際に、文字認識処理手段171は、文字列を高い精度で読み取るために、OCRライブラリ機能を実行する前に、文字強調の処理を行うことができる。文字強調の処理としては、例えば、「平滑化」や「文字色の指定」を挙げることができる。ここで、「平滑化」とは、対象とするピクセルと、その周囲を取り囲む8ピクセルとを合わせた3×3のピクセルの色が一様になるようにする処理を示す。また、「文字色の指定」とは、対象とするピクセルのRGBの値によって、そのピクセルに黒色または白色を割り当てる処理を示す。
本実施形態では、文字認識処理手段171は、チャネル毎に文字認識を実行するように構成されている。つまり、複数チャネルの動画から文字認識を実行する際に、1つのチャネルについて書き出しファイルを閉じてから(クローズしてから)、別のチャネルについて書き出しファイルを開く(オープンする)ような無駄な動作を行う必要がない。そのため、書き出しファイルを再び開いたとき(再オープンしたとき)、読み出し位置のフレームまで移動させる手間を省くことで複数チャネルの動画から文字認識を高速に実行することができる。
開始時刻読出手段172は、文字認識処理手段171において照合により文字列が認識された場合に、番組情報データベース111から、文字列が認識された番組に対応した番組情報の開始時刻を読み出すものである。
タイムコード取得手段173は、文字列が認識されたファイルにおいて先頭画面から文字列が認識された画面の位置までの経過時間を示すタイムコードを取得するものである。本実施形態では、タイムコード取得手段173は、文字認識処理手段171で文字を検出した画像に対応するMPEG−2 TSのタイムコードを用いる。なお、タイムコードはフレーム番号に対応しており、任意の位置を初期値に定めることができるが、本実施形態では、先頭タイムを「00:00:00.000」とする。
検出時刻生成手段174は、開始時刻読出手段172で読み出した開始時刻に、タイムコード取得手段173で取得したタイムコードの時間を加算することで、検出時刻を生成するものである。
検出文字列登録手段175は、文字認識処理手段171で認識した文字列を、検出時刻生成手段174で生成した検出時刻に対応させて検索用情報データベース112に登録するものである。ここで、図3を参照して、検索用情報データベース112の一例を説明する。
図3に示すように、検索用情報DB(検索用情報データベース)112は、8個の情報項目として、ID221、チャネル222、タイトル223、開始時刻224、番組のアドレス(RES)225、ファイル名226、検出文字列227、検出時刻228を有している。このうち、221〜226で示す項目は、図2(b)に示した番組情報DB111の項目211〜215,217で示す項目と同様なものである。
検出文字列227は、文字認識処理手段171で認識した文字列を示す。図3に示した例では、ID「1」の番組において、文字列“1:00”、“特集”、“天気”が検出されたことを示している。
検出時刻228は、検出時刻生成手段174で検出時刻が生成された時刻を示す。例えば文字列“天気”に対応する開始時刻は“01:00:00”であり、取得されたタイムコードが“00:24:12.000”であったため、検出時刻として“01:24:12”が生成されたことを示している。
[検索用情報作成装置の動作]
次に、図1に示した検索用情報作成装置100の動作について、「番組情報取得処理(番組情報取得ステップ)」、「動画取得処理(動画取得ステップ)」、「文字検出処理(文字検出処理ステップ)」、「文字列登録処理」に分けて、図4ないし図8を参照(適宜図1ないし図3参照)して説明する。
<番組情報取得処理(番組情報取得ステップ)>
図4は、本発明の実施形態に係る検索用情報作成装置による番組情報取得処理を示すフローチャートである。図4に示すように、検索用情報作成装置100の番組情報取得手段130は、テレビ放送同時録画装置20に新たな公開用の番組情報があるか否かを判別する(ステップS1)。新たな公開用の番組情報がある場合(ステップS1:Yes)、番組情報取得手段130は、その公開用の番組情報を取得する(ステップS2)。そして、番組情報取得手段130は、取得時刻を開始時刻として新たな番組情報を生成し、番組情報DB111に登録する(ステップS3)。そして、番組情報取得手段130は、番組情報DB111において、当該番組の「状態」を「番組情報取得済み」に設定し(ステップS4)、ステップS1に戻る。一方、ステップS1において、新たな公開用の番組情報がない場合(ステップS1:No)、番組情報取得手段130は、新たな公開用の番組情報が生成されるまで待機する。
<動画取得処理(動画取得ステップ)>
図5Aおよび図5Bは、本発明の実施形態に係る検索用情報作成装置による動画取得処理を示すフローチャートである。図5Aに示すように、検索用情報作成装置100の動画取得手段150は、ダウンロードすべき番組があるか否かを判別する(ステップS11)。ここで、動画取得手段150は、番組情報DB111において、状態216が「番組情報取得済み」または「ダウンロード中」である場合に、ダウンロードすべき番組があると判定する。ダウンロードすべき番組がない場合(ステップS11:No)、動画取得手段150は、ダウンロードすべきタイミングになるまで待機する。
一方、ダウンロードすべき番組がある場合(ステップS11:Yes)、動画取得手段150は、番組情報DB111から「番組のアドレス」を取得し(ステップS12)、書き出しファイルをオープンする(ステップS13)。ここで、書き出しファイルのオープンが初回である場合(ステップS14:Yes)、動画取得手段150は、その書き出しファイルのファイル名を保存する(ステップS15)。なお、ファイル名は、タイトルやIDに基づいて生成することができる。
ここで、書き出しファイルのオープンが初回であるか否かについては、番組情報DB111における状態216により判別することができる。例えば、図6(a)に示すように、ID「1」の番組は、状態が「ダウンロード中」であるので、書き出しファイルのオープンは初回ではない。また、ファイル名「FA」も保存されている。一方、ID「2」の番組は、状態が「番組情報取得済み」であるので、書き出しファイルのオープンは初回である。この場合には、ファイル名も保存されていない。
一方、初回ではない場合(ステップS14:No)、動画取得手段150は、ステップS15をスキップする。そして、動画取得手段150は、書き出しファイルの書き出し位置を最後尾に移動し(ステップS16)、番組情報DB111から「読み込み位置」を取得する(ステップS17)。
続いて、図5Bに示すように、動画取得手段150は、番組情報DB111において、「状態」を「ダウンロード中」に設定する(ステップS18)。例えば、図6(b)に示すように、ID「1」の番組は、状態が「ダウンロード中」であったので、そのまま維持する。一方、ID「2」の番組は、状態が「番組情報取得済み」であったので、「ダウンロード中」に書き換える。
そして、動画取得手段150は、対象とする番組内容を示す動画から所定容量のデータをメモリ上にダウンロードする(ステップS19)。そして、対象とする動画についての未取得データがある場合(ステップS20:Yes)、動画取得手段150は、番組情報DB111において、「読み込み位置」に次回位置を設定し(ステップS21)、メモリ上のデータを、書き出しファイルに書き込む(ステップS22)。そして、動画取得手段150は、所定時間が経過した場合(ステップS23:Yes)、番組情報DB111において、「読み込み位置」に次回位置を設定し(ステップS24)、書き出しファイルをクローズし(ステップS25)、ステップS11に戻る。一方、前記したステップS23において、所定時間が経過していない場合(ステップS23:No)、動画取得手段150は、ステップS19に戻る。
また、前記したステップS20において、対象とする動画についての未取得データがない場合(ステップS20:No)、動画取得手段150は、書き出しファイルをクローズし(ステップS26)、番組情報DB111において、「状態」を「ダウンロード済み」に設定し(ステップS27)、ステップS11に戻る。例えば、図6(c)に示すように、ID「1」,「2」の番組は、状態が「ダウンロード済み」に設定される。ここで、複数のチャネル「01」,「02」については独立に動画が取得される。なお、番組情報DB111において、状態が「ダウンロード済み」となった後には、「読み込み位置」の情報は書き込まれない。
<文字検出処理(文字検出処理ステップ)>
図7は、本発明の実施形態に係る検索用情報作成装置による文字検出処理を示すフローチャートである。図7に示すように、検索用情報作成装置100の文字検出処理手段170は、文字認識処理手段171によって、文字認識すべき番組があるか否かを判別する(ステップS31)。ここで、文字認識処理手段171は、番組情報DB111において、状態216が「ダウンロード中」または「ダウンロード済み」である場合に、文字認識すべき番組があると判定する。文字認識すべき番組がない場合(ステップS31:No)、文字認識処理手段171は、文字認識すべきタイミングになるまで待機する。一方、文字認識すべき番組がある場合(ステップS31:Yes)、文字認識処理手段171は、書き出しファイルをオープンする(ステップS32)。
続いて、文字認識処理手段171は、書き出しファイルを示す動画において読み出すべきフレーム位置の静止画を取得する(ステップS33)。取得した静止画が最終フレームではない場合(ステップS34:No)、文字認識処理手段171は、そのフレーム位置の静止画を抽出し(ステップS35)、抽出した静止画に文字強調の処理を行い(ステップS36)、その後、OCRライブラリにて文字認識を行う(ステップS37)。認識結果に文字列が存在する場合(ステップS38:Yes)、文字検出処理手段170は、後記する文字列登録処理を実行し(ステップS39)、ステップS33に戻る。一方、認識結果に文字列が存在しない場合(ステップS38:No)、文字認識処理手段171は、ステップS39をスキップしてステップS33に戻る。
また、前記したステップS34において、取得した静止画が最終フレームである場合(ステップS34:Yes)、文字認識処理手段171は、書き出しファイルをクローズし(ステップS40)、番組情報DB111において、「状態」を「文字認識終了」に設定し(ステップS41)、ステップS31に戻る。例えば、図6(d)に示すように、ID「1」,「2」の番組は、状態が「文字認識終了」に設定される。ここで、複数のチャネル「01」,「02」については独立に文字認識が実行される。
<文字列登録処理>
図8は、図7に示したステップS39の文字列登録処理の詳細を示すフローチャートである。図8に示すように、文字検出処理手段170は、開始時刻読出手段172によって、番組情報DB111から、「開始時刻」を読み出す(ステップS51)。また、文字検出処理手段170は、タイムコード取得手段173によって、書き出しファイルからタイムコードを取得する(ステップS52)。続いて、文字検出処理手段170は、検出時刻生成手段174によって、「開始時刻」にタイムコードの時間を加算し、検出時刻を生成する(ステップS53)。そして、文字検出処理手段170は、検出文字列登録手段175によって、検出した文字列を、検出時刻に対応させて検索用情報DB112に登録する(ステップS54)。なお、ステップS51の処理と、ステップS52の処理との順番は任意であり、並列に行うこともできる。
本実施形態の検索用情報作成装置100によれば、テレビ放送同時録画装置20から取得した動画において画面に表示される文字列を検出し、当該文字列が検出された画面が表示された番組内の時刻情報に基づいて、番組が放送された日時に同期させて文字列の検出時刻を生成し、認識した文字列と共に検索用情報として登録することができる。これにより、作成された検索用情報と、ユーザに指定された文字列とを利用することで、録画された番組の中から、放送日時や番組内の特定のシーンを含んだ番組を高速に検索することが可能となる。
また、本実施形態の検索用情報作成装置100によれば、動画を蓄積する処理と、動画において画面に表示される文字列を検出する処理と、画面に表示された文字列の検出時刻を生成する処理とを並行して行うことができるので、検索用情報を高速に作成できる。そのため、番組の放送が開始してから検索を開始するまでの準備に必要な時間を低減できる。これにより、番組放映中に(例えば、番組が開始してから数分後に)キーワード検索を行うことができる。
以上、本発明の実施形態について説明したが、本発明はこれに限定されるものではなく、その趣旨を変えない範囲でさまざまに実施することができる。例えば、本実施形態では、検索システム1は、番組検索装置10と検索用情報作成装置100とが常時接続されているものとしたが、必要なときにだけ検索用情報作成装置100を起動して番組検索装置10と接続するように構成してもよい。この場合には、ユーザは、例えば、AND条件として、「開始時刻」、「終了時刻」、「キーワード(文字列)」および「チャネル」を指定することで、録画された番組の中から、ユーザにより指定されたキーワード(文字列)に合致する検出時刻を検索することができる。また、検索結果を検索用情報作成装置100等に保存するようにしてもよい。
また、検索用情報作成装置100は、一般的なコンピュータを、前記した各手段として機能させるプログラム(検索用情報作成プログラム)により動作させることで実現することができる。このプログラムは、通信回線を介して配布することも可能であるし、CD−ROM等の記録媒体に書き込んで配布することも可能である。このプログラムをインストールされたコンピュータは、CPUが、ROM等に格納されたこのプログラムをRAMに展開することにより、検索用情報作成装置100と同等の効果を奏することができる。
また、本実施形態では、文字認識処理手段171は、文字認識用辞書との照合については、一般的なOCRライブラリの機能を用いるものとしたが、これに限定されるものではなく、文字認識精度を向上させるために、誤認識した文字列について正解をユーザの操作で登録できるような学習機能を設けることができる。
また、本実施形態では、テレビ放送同時録画装置20は、MPEG−2 TSを受信するものとしたが、MPEG−4やH.264/AVCで符号化した映像を受信するようにしてもよい。
また、本実施形態では、文字列を検出した場合に、検出した文字列を検出時刻と共に登録するものとしたが、特定の文字列が検出された場合にだけ登録を行ってもよい。例えば、“出演者”、“声の出演”といった文字列が検出された後で、所定時間内の文字列だけを登録することで、「出演者」や「声優」の名前をキーワードにした番組検索を可能とすることができる。また、逆に特定の文字列が検出された場合にその特定の文字列だけは登録を行わないようにすることもできる。例えば、「ハイフンを含む8桁の数字」が検出されたならば電話番号の可能性が高いので登録を行わないようにしてもよい。また、「:」が1分以上検出された場合には、現在時刻表示の可能性が高いので登録を行わないようにしてもよい。同様に、「http」が検出されたならば問い合わせ先のURLなので登録を行わないようにしてもよい。このようにすることで、検索用情報DB112として必要な記憶領域を有効に活用し、検索処理を高速に行うことが可能となる。
本発明の実施形態に係る検索用情報作成装置を含む検索システムの構成を模式的に示すブロック図である。 本発明の実施形態に係る検索用情報作成装置が取得する番組情報と生成する番組情報とを示す説明図である。 本発明の実施形態に係る検索用情報作成装置が生成する検索用情報を示す説明図である。 本発明の実施形態に係る検索用情報作成装置による番組情報取得処理を示すフローチャートである。 本発明の実施形態に係る検索用情報作成装置による動画取得処理を示すフローチャート(その1)である。 本発明の実施形態に係る検索用情報作成装置による動画取得処理を示すフローチャート(その2)である。 本発明の実施形態に係る検索用情報作成装置が構築する番組情報データベースの状態項目の遷移の一例を示す説明図である。 本発明の実施形態に係る検索用情報作成装置による文字検出処理を示すフローチャートである。 本発明の実施形態に係る検索用情報作成装置による文字列登録処理を示すフローチャートである。
符号の説明
1 検索システム
10 番組検索装置
20 テレビ放送同時録画装置
21 番組情報取得手段
22 番組情報記憶手段
23 公開用番組情報生成手段
24 チューナ
25 録画手段
26 動画蓄積手段
27 再生手段
100 検索用情報作成装置
110 記憶手段
111 番組情報DB(番組情報データベース)
112 検索用情報DB(検索用情報データベース)
120 動画蓄積手段
130 番組情報取得手段
150 動画取得手段
170 文字検出処理手段
171 文字認識処理手段
172 開始時刻読出手段
173 タイムコード取得手段
174 検出時刻生成手段
175 検出文字列登録手段
M 入力装置
D 出力装置
NW 通信ネットワーク
ATN アンテナ

Claims (4)

  1. 通信ネットワークから取得したテレビの番組情報に基づいて番組の放送開始時刻に当該番組の録画を開始すると共に当該番組についての公開用の番組情報を生成するテレビ放送同時録画装置と通信可能に接続され、前記テレビ放送同時録画装置で記録される動画において画面に表示される文字に基づいて録画番組を検索するための検索用情報を作成する検索用情報作成装置であって、
    前記テレビ放送同時録画装置から前記公開用の番組情報を取得し、前記公開用の番組情報を取得した時刻を、番組ごとの開始時刻として前記公開用の番組情報に加えた新たな番組情報を生成し、前記新たな番組情報を番組情報データベースに登録する番組情報取得手段と、
    前記テレビ放送同時録画装置から、記録される前記動画を取得し、取得した動画をファイルとして動画蓄積手段に格納する動画取得手段と、
    前記ファイルから、動画を構成するフレーム毎の静止画を抽出し、抽出した静止画から文字列を検出し、当該文字列が検出された画面が表示された番組内での時刻情報に基づいて、前記登録された番組情報における開始時刻に同期させた時刻情報として文字列の検出時刻を生成し、この生成した検出時刻および検出した文字列を前記検索用情報として検索用情報データベースに登録する文字検出処理手段とを備えることを特徴とする検索用情報作成装置。
  2. 前記文字検出処理手段は、
    前記ファイルから、動画を構成する静止画を抽出し、抽出した静止画を文字認識用辞書と照合する文字認識処理手段と、
    前記照合により文字列が認識された場合に、前記番組情報データベースから、文字列が認識された番組に対応した番組情報の前記開始時刻を読み出す開始時刻読出手段と、
    前記文字列が認識されたファイルにおいて先頭画面から文字列が認識された画面の位置までの経過時間を示すタイムコードを取得するタイムコード取得手段と、
    前記読み出した開始時刻に、前記取得したタイムコードの時間を加算することで、前記検出時刻を生成する検出時刻生成手段と、
    前記認識した文字列を前記検出時刻に対応させて前記検索用情報データベースに登録する検出文字列登録手段とを備えることを特徴とする請求項1に記載の検索用情報作成装置。
  3. 通信ネットワークから取得したテレビの番組情報に基づいて番組の放送開始時刻に当該番組の録画を開始すると共に当該番組についての公開用の番組情報を生成するテレビ放送同時録画装置で記録される動画において画面に表示される文字に基づいて録画番組を検索するための検索用情報を作成するために、番組情報取得手段と、動画取得手段と、文字検出処理手段とを備えた検索用情報作成装置における検索用情報作成方法であって、
    前記番組情報取得手段によって、前記テレビ放送同時録画装置から前記公開用の番組情報を取得し、前記公開用の番組情報を取得した時刻を、番組ごとの開始時刻として前記公開用の番組情報に加えた新たな番組情報を生成し、前記新たな番組情報を番組情報データベースに登録する番組情報取得ステップと、
    前記動画取得手段によって、前記テレビ放送同時録画装置から、記録される前記動画を取得し、取得した動画をファイルとして動画蓄積手段に格納する動画取得ステップと、
    前記文字検出処理手段によって、前記ファイルから、動画を構成するフレーム毎の静止画を抽出し、抽出した静止画から文字列を検出し、当該文字列が検出された画面が表示された番組内での時刻情報に基づいて、前記登録された番組情報における開始時刻に同期させた時刻情報として文字列の検出時刻を生成し、この生成した検出時刻および検出した文字列を前記検索用情報として検索用情報データベースに登録する文字検出処理ステップとを有することを特徴とする検索用情報作成方法。
  4. 通信ネットワークから取得したテレビの番組情報に基づいて番組の放送開始時刻に当該番組の録画を開始すると共に当該番組についての公開用の番組情報を生成するテレビ放送同時録画装置で記録される動画において画面に表示される文字に基づいて録画番組を検索するための検索用情報を作成するために、コンピュータを、
    前記テレビ放送同時録画装置から前記公開用の番組情報を取得し、前記公開用の番組情報を取得した時刻を、番組ごとの開始時刻として前記公開用の番組情報に番組ごとに加えた新たな番組情報を生成し、前記新たな番組情報を番組情報データベースに登録する番組情報取得手段、
    前記テレビ放送同時録画装置から、記録される前記動画を取得し、取得した動画をファイルとして動画蓄積手段に格納する動画取得手段、
    前記ファイルから、動画を構成するフレーム毎の静止画を抽出し、抽出した静止画から文字列を検出し、当該文字列が検出された画面が表示された番組内での時刻情報に基づいて、前記登録された番組情報における開始時刻に同期させた時刻情報として文字列の検出時刻を生成し、この生成した検出時刻および検出した文字列を前記検索用情報として検索用情報データベースに登録する文字検出処理手段、
    として機能させることを特徴とする検索用情報作成プログラム。
JP2008033910A 2008-02-15 2008-02-15 検索用情報作成装置、検索用情報作成方法、検索用情報作成プログラム Active JP5091708B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008033910A JP5091708B2 (ja) 2008-02-15 2008-02-15 検索用情報作成装置、検索用情報作成方法、検索用情報作成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008033910A JP5091708B2 (ja) 2008-02-15 2008-02-15 検索用情報作成装置、検索用情報作成方法、検索用情報作成プログラム

Publications (2)

Publication Number Publication Date
JP2009194665A JP2009194665A (ja) 2009-08-27
JP5091708B2 true JP5091708B2 (ja) 2012-12-05

Family

ID=41076276

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008033910A Active JP5091708B2 (ja) 2008-02-15 2008-02-15 検索用情報作成装置、検索用情報作成方法、検索用情報作成プログラム

Country Status (1)

Country Link
JP (1) JP5091708B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6091552B2 (ja) * 2015-06-24 2017-03-08 株式会社Jストリーム 動画処理装置及び動画処理システム
JP6857983B2 (ja) * 2016-08-25 2021-04-14 Jcc株式会社 メタデータ生成システム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004080476A (ja) * 2002-08-20 2004-03-11 Sanyo Electric Co Ltd ディジタル映像再生装置
JP2006140603A (ja) * 2004-11-10 2006-06-01 Pioneer Electronic Corp 情報処理装置、その方法、そのプログラム、およびそのプログラムを記録した記録媒体、および表示制御装置

Also Published As

Publication number Publication date
JP2009194665A (ja) 2009-08-27

Similar Documents

Publication Publication Date Title
US11825144B2 (en) In-band data recognition and synchronization system
EP2036344B1 (en) Method and apparatus for creating and viewing customized multimedia segments
KR20080042027A (ko) 기호 추출 장치, 기호 추출 방법 및 기호 추출 프로그램
JP2007524321A (ja) ビデオトレーラ
US10104418B2 (en) Apparatus, systems and methods for control of media content event recording
JP5091708B2 (ja) 検索用情報作成装置、検索用情報作成方法、検索用情報作成プログラム
JP2009159437A (ja) 情報処理装置、情報処理方法及びプログラム
JP4881459B2 (ja) 録画再生装置及び方法
JP2014207619A (ja) 録画再生装置、及び録画再生装置の制御方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100707

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120815

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120821

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120914

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150921

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5091708

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250