JP2013243597A

JP2013243597A - デジタル放送受信装置及びデータ処理方法

Info

Publication number: JP2013243597A
Application number: JP2012116658A
Authority: JP
Inventors: Masashi Kamiya; 雅志神谷; Kensuke Ueda; 健介上田; Tomoko Miki; 智子三木
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2012-05-22
Filing date: 2012-05-22
Publication date: 2013-12-05

Abstract

【課題】複数の文字データを確実に連結することができる状態にし、複数の文字データの切れ目を適切に特定できるようにすること。
【解決手段】デジタル放送受信装置１００は、番組データから文字データを順次取得する文字データ取得部１１４と、文字データ取得部１１４で取得された文字データを含み、かつ、当該含まれている文字データの連結順が分かるようにされた検索対象文字データを生成する文字データ連結部１１５と、文字データ連結部１１５で生成された検索対象文字データから語頭を検出して、当該検索対象文字データの先頭の文字から当該検出された語頭の前の文字までの文字データを、キーワード抽出対象文字データとして抽出する文字データ抽出部１１６とを備える。
【選択図】図１

Description

本発明は、デジタル放送受信装置及びデータ処理方法に関する。

デジタル放送では、映像や音声に加え、番組関連情報及び天気予報等のデータ放送が送信されている。また、近年は番組内の出演者又はナレーションの音声を文字に置き換えて字幕として送信したり、テロップを利用して速報を送信したりすることが多くなっている。

更に、近年は字幕及びテロップ等の文字データからキーワードを抽出し、そのキーワードに関連する情報を表示することが考えられている。

ところで文字データは、放送局側で任意に分割されて送られてくるという特徴がある。ここで、放送局側がどのようにして文字データを作成し、送信しているのかを、字幕を例に挙げて説明する。

字幕は生放送番組又は録画放送番組の放送時に作成されて送信される場合（以下、生字幕という）と、番組の放送前に予め作成されて送信される場合（以下、通常字幕という）とがある。生字幕と通常字幕とを区別しない場合は、単に字幕という。生字幕は、番組の音声に音声認識処理を施すことによって作成される（音声認識方式）か、番組の音声を表記する文字をオペレータが入力することによって作成される（ワープロ方式）。

音声認識方式及びワープロ方式を用いた場合、デジタル放送受信装置で生字幕が表示されるタイミングは、対応する音声がデジタル放送受信装置から出力されるタイミングよりも遅延する。そこで、生字幕を送信する際における表示までの遅延時間を少しでも短縮するために、放送局側は、文字数及び意味等に拘らず、作成し終えた部分から即座に送信することがある。言い換えると、生字幕は、意味を成す文字列（単語又は文節等）毎に分割されて送られてくるとは限らない。例えば、「環太平洋経済連携協定」という文字列が、「環太」という文字列と、「平洋経済連携協定」という文字列とに分割されて送られてくる場合がある。

従って、放送局側で任意に分割されて送られてきた字幕からキーワードを抽出する際は、字幕を受信する度にキーワードを抽出してしまうと、分断されたままの単語からキーワードが抽出されてしまい、正しい単語からキーワードを抽出することができないという問題が発生する。

このような、放送局側で字幕が分割されて送られるという問題に対応するため、従来、受信した字幕を２つ連結してから表示を行ったり、句読点等の文字で分割して表示を行ったりする装置及び方法がある（例えば、特許文献１参照）。

特開２０１０−２６８０７６号公報

特許文献１に記載された装置及び方法は、字幕を表示する際、ある時間に送られてきた字幕（以下、第１の字幕という）と、その次に送られてきた字幕（以下、第２の字幕という）とについて、第１の字幕が所定の文字数以下であった場合に、２つの字幕を連結させて表示するものである。しかしながら、第１の字幕が所定の文字数を超える場合は、このような連結処理は行われない。言い換えると、ある単語が複数の字幕に跨って送られてきた場合でも、第１の字幕が所定の文字数を超える場合には連結処理は行われないので、このような場合に、キーワードの抽出を行ったとしても、その単語は分断されたままでキーワードの抽出が行われてしまう。

また、特許文献１に記載された装置及び方法は、字幕の句読点及び改行位置を検出して、その位置で分割し、その前半について表示する。例えば、「今日の、株式市」というような字幕が送られてきた場合は、「今日の、」と「株式市」とに分割し、単語が分断されていない前半のみを表示し、後半の「株式市」については後ほど送られてくる字幕と連結してから表示する。しかしながら、「今日の株式市」というように句読点を含んでいない場合は、分割して表示することができない。このように、文字データには句読点及び改行コード等が含まれていない場合も多いため、特許文献１に記載された装置及び方法では、全ての文字データに対して分割を行うことができない。よって、特許文献１に記載された装置及び方法でキーワードの抽出を行ったとしても、単語が分断されたまま抽出されてしまうことがある。

そこで、本発明は、複数の文字データを確実に連結することができる状態にし、複数の文字データの切れ目を適切に特定できるようにすることを目的とする。

本発明の一態様に係るデジタル放送受信装置は、番組データから文字データを順次取得する文字データ取得部と、前記文字データ取得部で取得された文字データを含み、かつ、当該含まれている文字データの連結順が分かるようにされた検索対象文字データを生成する文字データ連結部と、前記文字データ連結部で生成された検索対象文字データから語頭を検出して、前記文字データ連結部で生成された検索対象文字データの先頭の文字から当該検出された語頭の前の文字までの文字データを、キーワード抽出対象文字データとして抽出する文字データ抽出部と、を備えることを特徴とする。

本発明の一態様によれば、複数の文字データを確実に連結することができる状態にし、複数の文字データの切れ目を適切に特定できる。

実施の形態１に係るデジタル放送受信装置の構成を概略的に示すブロック図である。文字データ連結部が文字データ取得部から文字データを受け取った場合の処理を示すフローチャートである。キーワード抽出制御部がメイン処理部からキーワード抽出を開始する通知を受け取った場合の処理を示すフローチャートである。文字データ抽出部がキーワード抽出制御部から文字データの抽出開始の通知を受け取った場合の第１の処理例を示すフローチャートである。文字データ抽出部がキーワード抽出制御部から文字データの抽出開始の通知を受け取った場合の第２の処理例を示すフローチャートである。検索対象文字データを、キーワード抽出対象文字データと連結対象文字データとに分割する例を示す概略図である。文字データ抽出部がキーワード抽出制御部から文字データの抽出開始の通知を受け取った場合の第３の処理例を示すフローチャートである。実施の形態２に係るデジタル放送受信装置の構成を概略的に示すブロック図である。実施の形態３に係るデジタル放送受信装置の構成を概略的に示すブロック図である。キーワード抽出部が文字データ抽出部からキーワード判定開始の通知を受けた場合の処理を示すフローチャートである。

実施の形態１．
図１は、実施の形態１に係るデジタル放送受信装置１００の構成を概略的に示すブロック図である。デジタル放送受信装置１００は、チューナ部１０１と、ユーザインタフェース部（以下、ＵＩ部という）１０２と、通信部１０３と、制御部１１０とを備える。なお、デジタル放送受信装置１００は、ネットワーク１５０に接続されている。また、ネットワーク１５０には、キーワードの抽出を行うキーワード抽出サーバ１４０、動画の配信を行う動画配信サーバ１４１、及び、Ｗｅｂサイトの提供を行うＷｅｂサーバ１４２が接続されている。

チューナ部１０１は、アンテナ１３０を介して、放送信号を受信して、当該受信された放送信号を復調することで、番組データを生成する。そして、チューナ部１０１は、生成された番組データを制御部１１０に与える。
ＵＩ部１０２は、ユーザとの間のインターフェースである。例えば、ＵＩ部１０２は、ユーザからイベントの入力を受け付ける入力部と、画面を表示する表示部とを備える。
通信部１０３は、ネットワークとの間で通信を行う。

制御部１１０は、チューナ部１０１、ＵＩ部１０２及び通信部１０３を制御して、放送の視聴に関する処理を制御する。制御部１１０は、メイン処理部１１１と、ユーザインタフェース制御部（以下、ＵＩ制御部という）１１２と、視聴処理部１１３と、文字データ取得部１１４と、文字データ連結部１１５と、文字データ抽出部１１６と、キーワード抽出制御部１１７と、キーワードリスト作成部１１８と、情報取得処理部１１９とを備える。

メイン処理部１１１は、制御部１１０内の各部を制御する。例えば、メイン処理部１１１は、チューナ部１０１から受け取った番組データを視聴処理部１１３に与えて、視聴処理部１１３に映像信号及び音声信号を生成させる。そして、メイン処理部１１１は、生成された映像信号及び音声信号を、ＵＩ制御部１１２を介して、ＵＩ部１０２に与える。
ＵＩ制御部１１２は、ＵＩ部１０２を制御する。
視聴処理部１１３は、放送の視聴に関する処理を行う。例えば、視聴処理部１１３は、チューナ部１０１で生成された番組データをメイン処理部１１１から受け取り、この番組データから映像信号及び音声信号を生成する。また、視聴処理部１１３は、制御部１１０内の各部から与えられたデータについても処理する。例えば、視聴処理部１１３は、情報取得処理部１１９からキーワード関連情報を取得して、このキーワード関連情報を含む画面の画面データを生成する。そして、視聴処理部１１３は、このような画面データを、ＵＩ制御部１１２を介してＵＩ部１０２に送り、このような画面データに基づく画面（例えば、キーワード関連情報表示画面）をＵＩ部１０２に表示させる。なお、視聴処理部１１３は、このようなキーワード関連情報表示画面等を、メイン処理部１１１から与えられた番組データの映像に合成してから、映像信号を生成してもよい。

文字データ取得部１１４は、チューナ部１０１が生成した番組データから、字幕及びテロップ等の文字データを順次取得する。そして、文字データ取得部１１４は、取得した文字データを文字データ連結部１１５に与える。
文字データ連結部１１５は、文字データ取得部１１４から与えられた文字データを含み、かつ、その連結順が分かるようにされた検索対象文字データを生成する。例えば、文字データ連結部１１５は、文字データ取得部１１４から与えられた文字データを、その連結順に従って連結することで、連結対象文字データを生成する。そして、文字データ連結部１１５は、文字データ抽出部１１６からの要求に応じて、その時点における連結対象文字データを検索対象文字データとして文字データ抽出部１１６に与える。
文字データ抽出部１１６は、文字データ連結部１１５から与えられた検索対象文字データから、キーワード抽出対象文字データを抽出する。例えば、文字データ抽出部１１６は、検索対象文字データに含まれている、予め定められた記号及び語頭の少なくとも何れか一方を検出し、その検出結果により検索対象文字データを分割し、分割された検索対象文字データの先頭側のデータをキーワード抽出対象文字データとして抽出する。そして、文字データ抽出部１１６は、抽出されたキーワード抽出対象文字データをキーワード抽出制御部１１７に与える。なお、語頭は、言葉又は単語の最初の部分の文字又は音である。

キーワード抽出制御部１１７は、文字データ抽出部１１６から与えられたキーワード抽出対象文字データからキーワードを抽出する処理を制御する。例えば、キーワード抽出制御部１１７は、通信部１０３を介して、文字データ抽出部１１６から与えられたキーワード抽出対象文字データをキーワード抽出サーバ１４０に送信する処理を行う。そして、キーワード抽出制御部１１７は、通信部１０３を介して、キーワード抽出サーバ１４０より、送信されたキーワード抽出対象文字データから抽出されたキーワードを示すキーワード情報を受信する処理を行う。キーワード抽出制御部１１７は、このようなキーワード情報をキーワードリスト作成部１１８に与える。
キーワードリスト作成部１１８は、キーワード抽出制御部１１７から与えられたキーワード情報で示されるキーワードをリスト化したキーワードリスト画面の画面データを生成する。そして、キーワードリスト作成部１１８は、生成されたキーワードリスト画面の画面データを、ＵＩ制御部１１２を介して、ＵＩ部１０２に与える。ユーザは、ＵＩ部１０２（例えば、リモコン等の入力装置）を利用して、キーワードリスト画面において表示されたキーワードの中から１つ以上のキーワードを選択する。
情報取得処理部１１９は、ＵＩ制御部１１２から、ＵＩ部１０２を介してユーザが選択したキーワードを示す選択キーワード情報を取得する。そして、情報取得処理部１１９は、通信部１０３を介して、選択キーワード情報で示されるキーワードに関連する情報（キーワード関連情報）をＷｅｂサーバ１４２から取得する。情報取得処理部１１９は、取得されたキーワード関連情報を、メイン処理部１１１を介して視聴処理部１１３に与える。このようなキーワード関連情報を取得した視聴処理部１１３は、キーワード関連情報に含まれている情報を出力する処理を行う。例えば、視聴処理部１１３は、取得したキーワード関連情報を含む画面の画面データを生成する。このようにして生成された画面データは、メイン処理部１１１及びＵＩ制御部１１２を介して、ＵＩ部１０２に与えられる。このような画面データを受け取ったＵＩ部１０２は、受け取った画面データに基づいて、画面の表示を行う。

以下では、文字データを含む番組データを受け取ってキーワードを抽出する際における、文字データ取得部１１４、文字データ連結部１１５、文字データ抽出部１１６及びキーワード抽出制御部１１７の各部の動作について、図２〜図５のフローチャートを用いて説明する。

図２は、文字データ連結部１１５が文字データ取得部１１４から文字データを受け取った場合の処理を示すフローチャートである。

文字データ連結部１１５は、文字データ取得部１１４から文字データを受け取ると（Ｓ１０）、既に連結処理を進めている途中のデータである連結対象文字データが存在するか否かを確認する（Ｓ１１）。そして、文字データ連結部１１５は、連結対象文字データが存在する場合（Ｓ１１：Ｙｅｓ）には、ステップＳ１２に処理を進め、連結対象文字データが存在しない場合（Ｓ１１：Ｎｏ）には、ステップＳ１３に処理を進める。

ステップＳ１２では、文字データ連結部１１５は、新たに受け取った文字データを、連結対象文字データの後ろに連結する。

一方、ステップＳ１３では、文字データ連結部１１５は、新しく受け取った文字データを連結対象文字データの最初の要素とする。以降、文字データを受け取った際には、文字データ連結部１１５は、受け取った文字データをこの連結対象文字データに連結する。

図３は、キーワード抽出制御部１１７がメイン処理部１１１からキーワード抽出を開始する通知を受け取った場合の処理を示すフローチャートである。例えば、メイン処理部１１１は、ＵＩ部１０２を介して、ユーザがキーワード抽出のイベントを入力した場合に、キーワード抽出制御部１１７にキーワード抽出の開始を通知する。また、メイン処理部１１１は、予め定められた時、例えば、定期的にキーワード抽出制御部１１７にキーワード抽出の開始を通知する。

キーワード抽出制御部１１７は、メイン処理部１１１からキーワード抽出の開始の通知を受け取ると（Ｓ２０）、文字データ抽出部１１６に文字データの抽出開始を通知する（Ｓ２１）。

そして、キーワード抽出制御部１１７は、文字データ抽出部１１６からキーワード抽出対象文字データを受け取ると、インターネットに接続されているキーワード抽出サーバ１４０を利用してキーワードを抽出するよう制御する（Ｓ２２）。キーワード抽出制御部１１７は、このようにして抽出されたキーワードをキーワードリスト作成部１１８に通知する。

図４は、文字データ抽出部１１６がキーワード抽出制御部１１７から文字データの抽出開始の通知を受け取った場合の第１の処理例を示すフローチャートである。図４に示されているフローでは、文字データ抽出部１１６は、検索対象文字データにおいて所定の記号を検出して、その検出結果に基づいて、キーワード抽出対象文字データを抽出する。

文字データ抽出部１１６は、キーワード抽出制御部１１７から文字データの抽出開始の通知を受け取ると（Ｓ３０）、文字データ連結部１１５に対して、検索対象文字データを送るように要求する。そして、文字データ抽出部１１６は、文字データ連結部１１５から検索対象文字データを受け取る（Ｓ３１）。ここで受け取った検索対象文字データの文字数を値Ｌとする。

次に、文字データ抽出部１１６は、ある変数Ｋを作成し、変数Ｋに値Ｌを代入する（Ｓ３２）。これは、所定の記号、例えば、句読点、疑問符又は感嘆符を検索対象文字データの最後尾から順に探索するためである。

次に、文字データ抽出部１１６は、検索対象文字データのＫ文字目が所定の記号、例えば、句読点、疑問符又は感嘆符かどうかを、文字コード等によって検出する（Ｓ３３）。そして、文字データ抽出部１１６は、検索対象文字データのＫ文字目が所定の記号である場合（Ｓ３３：Ｙｅｓ）には、ステップＳ３４に処理を進め、検索対象文字データのＫ文字目が所定の記号ではない場合（Ｓ３３：Ｎｏ）には、ステップＳ３５に処理を進める。

ステップＳ３４では、文字データ抽出部１１６は、検索対象文字データを、先頭からＫ文字目までの文字データと、Ｋ＋１文字目からＬ文字目までの文字データとの２つに分離する。そして、文字データ抽出部１１６は、先頭からＫ文字目までの文字データをキーワード抽出対象文字データとしてキーワード抽出制御部１１７に与える。また、文字データ抽出部１１６は、Ｋ＋１文字目からＬ文字目までの文字データを連結対象文字データとして文字データ連結部１１５に与える。
なお、文字データ抽出部１１６は、連結中の文字データの最後の文字が所定の記号であった場合は、検索対象文字データの全てをキーワード抽出対象文字データとして抽出する。この場合、文字データ抽出部１１６は、連結対象文字データを文字データ連結部１１５に与えない。

一方、ステップＳ３５では、文字データ抽出部１１６は、変数Ｋの値を１つ減らし、次に探索する文字を１つ前の文字に設定する。

次に、文字データ抽出部１１６は、変数Ｋの値が１未満であるか確認する（Ｓ３６）。そして、文字データ抽出部１１６は、変数Ｋの値が１未満である場合（Ｓ３６：Ｙｅｓ）には、ステップＳ３７に処理を進め、変数Ｋの値が１以上である場合（Ｓ３６：Ｎｏ）には、ステップＳ３３に処理を進める。

ステップＳ３７では、文字データ抽出部１１６は、検索対象文字データの全てをキーワード抽出対象文字データとしてキーワード抽出制御部１１７に与える。ステップＳ３６において変数Ｋの値が１未満である場合（Ｓ３６：Ｙｅｓ）は、出力する検索対象文字データの先頭まで探索が終了したことを示す。言い換えると、検索対象文字データには所定の記号が含まれていないことになる。この場合、文字データ抽出部１１６は、検索対象文字データの全てをキーワード抽出対象文字データとして抽出する。

ここで、ステップＳ３７では、文字データ抽出部１１６は、検索対象文字データの全てをキーワード抽出対象文字データとして抽出しているが、このような例に限定されるものではない。このような場合でも、文字データ抽出部１１６は、検索対象文字データの一部をキーワード抽出対象文字データとして抽出し、その残りを連結対象文字データとしてもよい。
また、文字データ抽出部１１６は、検索対象文字データに所定の記号が含まれない場合には、検索対象文字データの全てを連結対象文字データとしてもよい。このような場合には、文字データ抽出部１１６は、キーワード抽出制御部１１７にキーワード抽出対象文字データが出力されない旨を通知する。このような通知を受けたキーワード抽出制御部１１７は、文字データ抽出部１１６からキーワード抽出対象文字データを受け取るまで、図３のステップＳ２１の処理を繰り返せばよい。

図５は、文字データ抽出部１１６がキーワード抽出制御部１１７から文字データの抽出開始の通知を受け取った場合の第２の処理例を示すフローチャートである。図５に示されているフローでは、文字データ抽出部１１６は、検索対象文字データにおいて語頭を検出して、その検出結果に基づいて、キーワード抽出対象文字データを抽出する。

文字データ抽出部１１６は、キーワード抽出制御部１１７から文字データの抽出開始の通知を受け取ると（Ｓ４０）、文字データ連結部１１５に対して、検索対象文字データを送るように要求する。そして、文字データ抽出部１１６は、文字データ連結部１１５から検索対象文字データを受け取る（Ｓ４１）。ここで受け取った検索対象文字データの文字数を値Ｌとする。

次に、文字データ抽出部１１６は、ある変数Ｋを作成し、変数Ｋに値Ｌを代入する（Ｓ４２）。これは、文字体系が変化する位置を検索対象文字データの最後尾から順に探索するためである。

次に、文字データ抽出部１１６は、検索対象文字データのＫ文字目が、所定の文字体系、例えば、漢字又はカタカナかどうかを文字コード等によって判定する（Ｓ４３）。そして、文字データ抽出部１１６は、検索対象文字データのＫ文字目が所定の文字体系である場合（Ｓ４３：Ｙｅｓ）には、ステップＳ４４に処理を進め、検索対象文字データのＫ文字目が所定の文字体系ではない場合（Ｓ４３：Ｎｏ）には、ステップＳ４９に処理を進める。

ステップＳ４４では、文字データ抽出部１１６は、検索対象文字データのＫ文字目の文字体系を記憶する。例えば、文字データ抽出部１１６は、文字体系フラグという変数を用意しておき、その文字体系フラグを漢字又はカタカナに設定する。

次に、文字データ抽出部１１６は、変数Ｋの値を１つ減らし、次に調べる文字を１つ前の文字に設定する（Ｓ４５）。

次に、文字データ抽出部１１６は、変数Ｋの値が１未満であるか確認する（Ｓ４６）。そして、文字データ抽出部１１６は、変数Ｋの値が１未満である場合（Ｓ４６：Ｙｅｓ）には、ステップＳ５１に処理を進め、変数Ｋの値が１以上である場合（Ｓ４６：Ｎｏ）には、ステップＳ４７に処理を進める。

ステップＳ４７では、文字データ抽出部１１６は、Ｋ文字目の文字体系を文字コード等によって判定し、その文字体系がステップＳ４４で記憶しておいた文字体系と一致しているかを比較する。そして、文字データ抽出部１１６は、Ｋ文字目の文字体系がステップＳ４４で記憶しておいた文字体系と一致している場合（Ｓ４７：Ｙｅｓ）には、ステップＳ４５に処理を進め、これらが一致していない場合（Ｓ４７：Ｎｏ）には、ステップＳ４８に処理を進める。

ステップＳ４８では、文字データ抽出部１１６は、文字体系に変化があったと判断して（変化している部分の後ろの文字が語頭であると判断して）、検索対象文字データを、先頭からＫ文字目までの文字データと、Ｋ＋１文字目からＬ文字目までの文字データとの２つに分離する。そして、文字データ抽出部１１６は、先頭からＫ文字目までの文字データをキーワード抽出対象文字データとしてキーワード抽出制御部１１７に与える。また、文字データ抽出部１１６は、Ｋ＋１文字目からＬ文字目までの文字データを連結対象文字データとして文字データ連結部１１５に与える。

一方、文字データ抽出部１１６は、ステップＳ４３において検索対象文字データのＫ文字目が所定の文字体系ではないと判断した場合（Ｓ４３：Ｎｏ）には、ステップＳ４９に処理を進める。ステップＳ４９では、文字データ抽出部１１６は、変数Ｋの値を１つ減らし、次に調べる文字を１つ前の文字に設定する。

次に、文字データ抽出部１１６は、変数Ｋの値が１未満であるか確認する（Ｓ５０）。そして、文字データ抽出部１１６は、変数Ｋの値が１未満である場合（Ｓ５０：Ｙｅｓ）には、ステップＳ５１に処理を進め、変数Ｋの値が１以上である場合（Ｓ５０：Ｎｏ）には、ステップＳ４３に処理を進める。

ステップＳ５１では、文字データ抽出部１１６は、検索対象文字データの全てをキーワード抽出対象文字データとしてキーワード抽出制御部１１７に与える。ステップＳ５０において変数Ｋの値が１未満である場合（Ｓ５０：Ｙｅｓ）は、出力する検索対象文字データの先頭まで探索が終了したことを示す。言い換えると、検索対象文字データには文字体系の変化が含まれていないことになる。この場合、文字データ抽出部１１６は、検索対象文字データの全てをキーワード抽出対象文字データとして抽出する。

ここで、ステップＳ５１では、文字データ抽出部１１６は、検索対象文字データの全てをキーワード抽出対象文字データとして抽出しているが、このような例に限定されるものではない。例えば、文字データ抽出部１１６は、このような場合に、検索対象文字データの全てを連結対象文字データとしてもよい。そして、文字データ抽出部１１６は、キーワード抽出制御部１１７にキーワード抽出対象文字データが出力されない旨を通知する。このような通知を受けたキーワード抽出制御部１１７は、文字データ抽出部１１６からキーワード抽出対象文字データを受け取るまで、図３のステップＳ２１の処理を繰り返せばよい。

図５に示されているフローにより、文字データ抽出部１１６が、検索対象文字データの語頭を検出して、この検索対象文字データを、キーワード抽出対象文字データと連結対象文字データとに分割する例を、図６を用いて説明する。
文字データ抽出部１１６が文字データ連結部１１５から受け取った検索対象文字データが、図６に示されているように、「今日は株式市場の平均株」であった場合、文字データ抽出部１１６は、図５に示されているフローにより、「今日は株式市場の平均株」の最後尾の文字「株」から語頭の検出を開始する。そして、文字データ抽出部１１６は、文字「の」と、文字「平」との間で文字体系が変化するため、文字「平」を語頭と判断する。この場合、文字データ抽出部１１６は、文字「の」と文字「平」との間で検索対象文字データを分割して、「今日は株式市場の」の部分をキーワード抽出対象文字データとし、「平均株」の部分を連結対象文字データとする。

図７は、文字データ抽出部１１６がキーワード抽出制御部１１７から文字データの抽出開始の通知を受け取った場合の第３の処理例を示すフローチャートである。図６に示されているフローでは、文字データ抽出部１１６は、検索対象文字データにおいて所定の記号又は語頭を検出して、その検出結果に基づいて、キーワード抽出対象文字データを抽出する。

文字データ抽出部１１６は、キーワード抽出制御部１１７から文字データの抽出開始の通知を受け取ると（Ｓ６０）、文字データ連結部１１５に対して、検索対象文字データを送るように要求する。そして、文字データ抽出部１１６は、文字データ連結部１１５から検索対象文字データを受け取る（Ｓ６１）。ここで受け取った検索対象文字データの文字数を値Ｌとする。

次に、文字データ抽出部１１６は、ある変数Ｋを作成し、変数Ｋに値Ｌを代入する（Ｓ６２）。これは、所定の記号又は語頭を検索対象文字データの最後尾から順に探索するためである。

次に、文字データ抽出部１１６は、検索対象文字データのＫ文字目が所定の記号、例えば、句読点、疑問符又は感嘆符かどうかを、文字コード等によって検出する（Ｓ６３）。そして、文字データ抽出部１１６は、検索対象文字データのＫ文字目が所定の記号である場合（Ｓ６３：Ｙｅｓ）には、ステップＳ６９に処理を進め、検索対象文字データのＫ文字目が所定の記号ではない場合（Ｓ６３：Ｎｏ）には、ステップＳ６４に処理を進める。

ステップＳ６４では、文字データ抽出部１１６は、検索対象文字データのＫ文字目が、所定の文字体系、例えば、漢字又はカタカナかどうかを文字コード等によって判定する。そして、文字データ抽出部１１６は、検索対象文字データのＫ文字目が所定の文字体系である場合（Ｓ６４：Ｙｅｓ）には、ステップＳ６５に処理を進め、検索対象文字データのＫ文字目が所定の文字体系ではない場合（Ｓ６４：Ｎｏ）には、ステップＳ７０に処理を進める。

ステップＳ６５では、文字データ抽出部１１６は、検索対象文字データのＫ文字目の文字体系を記憶する。例えば、文字データ抽出部１１６は、文字体系フラグという変数を用意しておき、その文字体系フラグを漢字又はカタカナに設定する。

次に、文字データ抽出部１１６は、変数Ｋの値を１つ減らし、次に調べる文字を１つ前の文字に設定する（Ｓ６６）。

次に、文字データ抽出部１１６は、変数Ｋの値が１未満であるか確認する（Ｓ６７）。そして、文字データ抽出部１１６は、変数Ｋの値が１未満である場合（Ｓ６７：Ｙｅｓ）には、ステップＳ７２に処理を進め、変数Ｋの値が１以上である場合（Ｓ６７：Ｎｏ）には、ステップＳ６８に処理を進める。

ステップＳ６８では、文字データ抽出部１１６は、Ｋ文字目の文字体系を文字コード等によって判定し、その文字体系がステップＳ６５で記憶しておいた文字体系と一致しているかを比較する。そして、文字データ抽出部１１６は、Ｋ文字目の文字体系がステップＳ６５で記憶しておいた文字体系と一致している場合（Ｓ６８：Ｙｅｓ）には、ステップＳ６６に処理を進め、これらが一致していない場合（Ｓ６８：Ｎｏ）には、ステップＳ６９に処理を進める。

ステップＳ６９では、文字データ抽出部１１６は、所定の記号又は語頭が検出されたと判断して、検索対象文字データを、先頭からＫ文字目までの文字データと、Ｋ＋１文字目からＬ文字目までの文字データとの２つに分離する。そして、文字データ抽出部１１６は、先頭からＫ文字目までの文字データをキーワード抽出対象文字データとしてキーワード抽出制御部１１７に与える。また、文字データ抽出部１１６は、Ｋ＋１文字目からＬ文字目までの文字データを連結対象文字データとして文字データ連結部１１５に与える。

一方、文字データ抽出部１１６は、ステップＳ６４において検索対象文字データのＫ文字目が所定の文字体系ではないと判断した場合（Ｓ６４：Ｎｏ）には、ステップＳ７０に処理を進める。ステップＳ７０では、文字データ抽出部１１６は、変数Ｋの値を１つ減らし、次に調べる文字を１つ前の文字に設定する。

次に、文字データ抽出部１１６は、変数Ｋの値が１未満であるか確認する（Ｓ７１）。そして、文字データ抽出部１１６は、変数Ｋの値が１未満である場合（Ｓ７１：Ｙｅｓ）には、ステップＳ７２に処理を進め、変数Ｋの値が１以上である場合（Ｓ７１：Ｎｏ）には、ステップＳ６３に処理を進める。

ステップＳ７２では、文字データ抽出部１１６は、検索対象文字データの全てをキーワード抽出対象文字データとしてキーワード抽出制御部１１７に与える。ステップＳ７１において変数Ｋの値が１未満である場合（Ｓ７１：Ｙｅｓ）は、出力する検索対象文字データの先頭まで探索が終了したことを示す。言い換えると、検索対象文字データには、所定の記号及び語頭が含まれていないことになる。この場合、文字データ抽出部１１６は、検索対象文字データの全てをキーワード抽出対象文字データとして抽出する。

ここで、ステップＳ７２では、文字データ抽出部１１６は、検索対象文字データの全てをキーワード抽出対象文字データとして抽出しているが、このような例に限定されるものではない。例えば、文字データ抽出部１１６は、このような場合に、検索対象文字データの全てを連結対象文字データとしてもよい。そして、文字データ抽出部１１６は、キーワード抽出制御部１１７にキーワード抽出対象文字データが出力されない旨を通知する。このような通知を受けたキーワード抽出制御部１１７は、文字データ抽出部１１６からキーワード抽出対象文字データを受け取るまで、図３のステップＳ２１の処理を繰り返せばよい。

文字データ抽出部１１６は、図４に示されている、記号の検出結果により検索対象文字データを抽出する記号検出機能、図５に示されている、語頭の検出結果により検索対象文字データを抽出する語頭検出機能、及び、図７に示されている記号又は語頭により検索対象文字データを抽出する記号又は語頭検出機能の少なくとも何れか１つを利用して、キーワード抽出対象文字データを抽出すればよい。
例えば、文字データ抽出部１１６は、番組の視聴開始（特定のチャンネルへの選局開始）から所定の期間が経過するまでは、記号又は語頭検出機能を利用してキーワード抽出対象文字データを抽出する。そして、文字データ抽出部１１６は、この期間において、所定の記号が検出されない場合には、語頭検出機能を用いてキーワード抽出対象文字データを抽出するようにすることで、演算負荷を軽減することができる。なお、文字データ抽出部１１６は、この期間において、所定の記号が検出されない場合でも、記号又は語頭検出機能を継続して利用するように構成されていてもよく、また、この期間において、所定の記号が検出された場合には、記号検出機能を利用するように構成されていてもよい。

以上のように、実施の形態１に係るデジタル放送受信装置１００においては、文字データを付加情報として持つ番組の視聴時に、受信された文字データを連結し、連結された文字データから意味を成す文字データを各々分離することが可能となる。

また、実施の形態１に係るデジタル放送受信装置１００は、句読点、疑問符及び感嘆符等の記号、又は、語頭を検出することで、検索対象文字データを、意味を成す文字データ毎に分離することができる。

さらに、実施の形態１に係るデジタル放送受信装置１００は、検索対象文字データから分離された２つの文字データを、キーワード抽出対象文字データ及び連結対象文字データとすることができる。そして、実施の形態１に係るデジタル放送受信装置１００は、キーワード抽出対象文字データに対してはキーワード抽出を行い、連結対象文字データに対しては文字データの連結を継続させることができる。
これによって、実施の形態１に係るデジタル放送受信装置１００は、複数の文字データに跨って、ある単語が送られてきた場合でも、その単語が分断されたままキーワードとして抽出されることがなくなる。このため、実在しない単語又は放送内容に沿わない単語がキーワードとして誤って表示されることがなくなり、このキーワードを利用する際に、ユーザが感じる不便さを軽減することができる。
例えば、「環太平洋経済連携協定」という文字データが、「環太」という文字データと、「平洋経済連携協定」という文字データとに分断されて送られてきた場合に、「環太」及び「平洋経済連携協定」等の実在しない語をキーワードとして抽出してしまうことがなくなる。また、「環太平洋経済連携協定」という文字データが、「環太平洋」という文字データと「経済連携協定」という文字データとに分断されて送られてきた場合に、放送内容としては「環太平洋経済連携協定」で１語であるにも拘らず、「環太平洋」と「経済連携協定」というように２つの別の語をキーワードとして抽出してしまうことがなくなる。

実施の形態１では、文字データ連結部１１５は、文字データの連結によって検索対象文字データを生成している。言い換えると、文字データ連結部１１５は、文字データ取得部１１４から受け取った文字データを順番に配列することで、検索対象文字データを生成している。しかし、文字データ連結部１１５は、必ずしも文字データを順番に連結する必要はなく、文字データを連結する順番（受信した順序）が分かるようにした文字データ群を、検索対象文字データとして文字データ抽出部１１６に与えてもよい。例えば、文字データ連結部１１５は、リスト構造等その他の形式により文字データの受信した順番を特定して、文字データ取得部１１４から与えられた複数の文字データ（文字データ群）を、検索対象文字データとして文字データ抽出部１１６に与えてもよい。

番組データは、表示する際の色が指定された文字データを含む場合もある。この場合には、文字データ連結部１１５は、同じ色の文字データ同士を連結して連結対象文字データを生成してもよい。
色が指定される理由としては、例えば、会話をしている話者によって色を変えることで、誰の発言かを分かりやすく提示することが挙げられる。従って、同じ色の文字データを連結することで、違う人の会話に対応する文字データを連結してしまうことを防止できる。これによって、ある人物の発言を示す複数の文字データに跨って、ある単語が送られてきた場合に、分割されていた単語を正しく連結できなくなる、といった問題が発生しなくなる。

実施の形態１では、文字データ抽出部１１６は、漢字及びカタカナに着目して語頭を検出しているが、アルファベット及び数字の少なくとも何れか一方にも着目して語頭を検出してもよい。こうすることによって、文字体系の変化を検出する分解能が高くなるため、語頭の検出が速くなることが期待できる。また「約１万人」のように、漢字の間に数字が含まれる場合等もあるが、この場合には「約」を語頭と判断するように構成しても構わない。例えば、漢字と数字との間で文字体系が変化した場合には、語頭と判断しないように構成すればよい。このことにより、より正確に語頭を検出することができる。

実施の形態１では、文字データ抽出部１１６は、文字体系に着目して語頭を検出しているが、このような例に限定されない。例えば、文字データ抽出部１１６は、形態素解析ツール等を利用して語頭を検出してもよい。形態素解析ツールは既に多く存在しており、これを利用すれば簡単に語頭の検出が可能である。

実施の形態１に係るデジタル放送受信装置１００は、映像とは別に、付属データとして送られる字幕等の文字データに対して処理を行っているが、これに限らず、映像データとして送られる文字データに対して同様の処理を行ってもよい。これを実現するには、文字データ抽出部１１６が、文字認識等を利用して映像から文字データを抽出することが考えられる。これによって、字幕等の文字データが含まれていない場合にもこの実施の形態によりキーワードを抽出することができる。

実施の形態１では、キーワードリスト作成部１１８は必須ではない。キーワードリスト作成部１１８が備えられていない場合には、情報取得処理部１１９は、キーワード抽出制御部１１７によりキーワードが抽出される度に、そのキーワードを受け取り、受け取ったキーワードに関連する情報を取得して、視聴処理部１１３に与えることで、キーワードに関連する情報がＵＩ部１０２に表示される。

実施の形態１では、情報取得処理部１１９は、Ｗｅｂサーバ１４２からキーワード関連情報を取得しているが、このような例に限定されるものではない。例えば、デジタル放送受信装置１００の内部に辞書を記憶する辞書記憶部を備えておき、この辞書記憶部からキーワードを取得するように構成することもできる。また、辞書を記憶する辞書記憶部を備える装置（例えば、記憶装置）をネットワーク１５０又は他のネットワークに接続し、その装置からキーワードを取得するように構成することもできる。これによって、デジタル放送受信装置１００の開発時等に予め定めておいた情報を表示するように設計することができ、ネットワーク１５０上の不適切な情報をフィルタリングする必要がなくなる。また、ネットワーク接続やデータ送受信に要する処理を省くことができ、処理負荷及び処理時間を削減することができる。

実施の形態２．
図８は、実施の形態２に係るデジタル放送受信装置２００の構成を概略的に示すブロック図である。デジタル放送受信装置２００は、チューナ部１０１と、ＵＩ部１０２と、通信部１０３と、制御部２１０と、インターフェース部（以下、ＩＦ部という）２２０とを備える。実施の形態２に係るデジタル放送受信装置２００は、ＩＦ部２２０をさらに備える点、及び、制御部２１０での処理の点において、実施の形態１に係るデジタル放送受信装置１００と異なっている。

ＩＦ部２２０は、デジタル放送受信装置２００に他の装置を接続するためのインターフェースである。実施の形態２においては、ＩＦ部２２０を介して、録画及び再生の処理を行う録画再生装置２３１が、デジタル放送受信装置２００に接続されている。録画再生装置２３１は、ＩＦ部２２０を介して、映像及び音声の少なくとも何れか一方と文字データとを含む番組データをメイン処理部２１１に与える。

制御部２１０は、メイン処理部２１１と、ＵＩ制御部１１２と、視聴処理部２１３と、文字データ取得部２１４と、文字データ連結部１１５と、文字データ抽出部１１６と、キーワード抽出制御部１１７と、キーワードリスト作成部１１８と、情報取得処理部１１９とを備える。実施の形態２における制御部２１０は、メイン処理部２１１、視聴処理部２１３及び文字データ取得部２１４での処理において、実施の形態１における制御部１１０と異なっている。

メイン処理部２１１は、実施の形態１におけるメイン処理部１１１と同様の処理を行う他、ＩＦ部２２０を介して入力された番組データの処理を制御する。例えば、メイン処理部２１１は、ＩＦ部２２０から受け取った番組データを視聴処理部１１３に与えて、視聴処理部１１３に映像信号及び音声信号を生成させる。そして、メイン処理部２１１は、生成された映像信号及び音声信号を、ＵＩ制御部１１２を介して、ＵＩ部１０２に与える。
視聴処理部２１３は、実施の形態１における視聴処理部１１３と同様の処理を行う他、ＩＦ部２２０を介して入力された番組データをメイン処理部２１１から受け取り、このコンテンツデータから映像信号及び音声信号を生成する。

文字データ取得部２１４は、実施の形態１における文字データ取得部１１４と同様の処理を行う他、ＩＦ部２２０を介して入力された番組データから字幕及びテロップ等の文字データを取得する。そして、文字データ取得部２１４は、取得した文字データを文字データ連結部１１５に与える。

実施の形態２に係るデジタル放送受信装置２００が、取得された文字データからキーワードを抽出する際の処理の流れは、実施の形態１に係るデジタル放送受信装置１００と同様である。言い換えると、実施の形態２に係るデジタル放送受信装置２００は、実施の形態１と異なり、文字データ取得部２１４が録画再生装置２３１に予め録画された番組の番組データから文字データを取得し、取得された文字データを文字データ連結部１１５に与える。

以上のように構成することで、実施の形態２に係るデジタル放送受信装置２００は、実施の形態１に係るデジタル放送受信装置１００のようにチューナ部１０１で受信した現在放送中の番組に限らず、録画された番組に対してもキーワード抽出を行えるようになる。これによって、実施の形態２に係るデジタル放送受信装置２００は、より多くの番組に対してもキーワード抽出を行えるようになり、ユーザは、現在放送中の番組か録画番組かを意識することなく、キーワードを抽出させることができる。

なお、実施の形態２においては、録画再生装置２３１が、デジタル放送受信装置２００の外部に存在し、デジタル放送受信装置２００に接続されているが、このような例に限定されるものではない。例えば、デジタル放送受信装置２００内に、録画再生装置２３１と同様の機能を発揮する機能部が備えられていてもよい。これにより、ユーザは、録画再生装置２３１の接続場所に影響されることなく、キーワードの抽出を実行させることができる。

なお、実施の形態２に係るデジタル放送受信装置２００は、録画再生装置２３１から取得された番組データからキーワード抽出をする処理と同様の処理を、ネットワーク１５０上の動画配信サーバ１４１から配信される番組データに対して行うこともできる。この場合、番組データは、通信部１０３を介してメイン処理部２１１に与えられる。このようにすることで、ユーザは、更に多くの番組データに対してキーワードを抽出させることができる。

実施の形態３．
図９は、実施の形態３に係るデジタル放送受信装置３００の構成を概略的に示すブロック図である。デジタル放送受信装置３００は、チューナ部１０１と、ＵＩ部１０２と、通信部１０３と、制御部３１０とを備える。実施の形態３に係るデジタル放送受信装置３００は、制御部３１０での処理において、実施の形態１に係るデジタル放送受信装置１００と異なっている。

制御部３１０は、メイン処理部１１１と、ＵＩ制御部１１２と、視聴処理部１１３と、文字データ取得部１１４と、文字データ連結部１１５と、文字データ抽出部１１６と、キーワード抽出制御部３１７と、キーワードリスト作成部１１８と、情報取得処理部１１９と、キーワード抽出部３２１とを備える。実施の形態３における制御部３１０は、キーワード抽出制御部３１７での処理の点、及び、キーワード抽出部３２１がさらに備えられている点において、実施の形態１における制御部１１０と異なっている。

キーワード抽出制御部３１７は、文字データ抽出部１１６から与えられたキーワード抽出対象文字データからキーワードを抽出する処理を行う。例えば、キーワード抽出制御部３１７は、文字データ抽出部１１６から与えられたキーワード抽出対象文字データをキーワード抽出部３２１に与えて、キーワード抽出部３２１にキーワードの判定を行わせる。そして、キーワード抽出制御部３１７は、キーワード抽出部３２１より、与えられたキーワード抽出対象文字データから判定されたキーワードを示すキーワード情報を受け取る。キーワード抽出制御部３１７は、このようなキーワード情報をキーワードリスト作成部１１８に与える。

キーワード抽出部３２１は、キーワード抽出制御部３１７より与えられたキーワード抽出対象文字データからキーワードを判定し、判定されたキーワードを示すキーワード情報を生成する。そして、キーワード抽出部３２１は、生成されたキーワード情報をキーワード抽出制御部３１７に与える。

図１０は、キーワード抽出部３２１が、文字データ抽出部１１６からキーワード判定開始の通知を受けた場合の処理を示すフローチャートである。

キーワード抽出部３２１は、キーワード抽出制御部３１７からキーワード判定開始の通知を受け取ると（Ｓ８０）、キーワード抽出制御部３１７からキーワード抽出対象文字データを受け取る（Ｓ８１）。

キーワード抽出部３２１は、受け取ったキーワード抽出対象文字データから、形態素解析等の方法で単語を分解する（Ｓ８２）。

キーワード抽出部３２１は、分解された各単語に基づいてキーワードを判定する（Ｓ８３）。例えば、キーワード抽出部３２１は、分解された単語の分類が、場所又は人名等の予め定められた分類である場合に、このような単語をキーワードと判定する。

キーワード抽出部３２１は、キーワードと判定した単語を示すキーワード情報を生成し、このキーワード情報をキーワード抽出制御部３１７に与える（Ｓ８４）。

このように構成することで、実施の形態３に係るデジタル放送受信装置３００は、実施の形態１又は２のようにキーワード抽出サーバ１４０の基準でキーワードが決定されるのではなく、自装置の設定によってキーワードを定めることができる。更に、キーワード抽出のためにインターネットに接続する必要がなくなる。
そのため、ユーザ個々人で欲しいと思うキーワードの分類（場所、人名等）が違う場合にも、ユーザ毎にどのような語をキーワードとするのかを定めることができる。従って、実施の形態３に係るデジタル放送受信装置３００によれば、そのユーザに合ったキーワードの抽出が簡単にできる。また、実施の形態３に係るデジタル放送受信装置３００は、実施の形態１又は２と異なり、キーワードを抽出する際にネットワーク１５０に接続する必要がないため、ネットワーク接続及びデータ送受信に要する処理を省くことができ、処理負荷や処理時間を削減することができる。

上記では、キーワード抽出部３２１は、各単語の分類（場所、人名等）からキーワードを判定したが、各単語の出現頻度が高いものをキーワードと判定する等、その他の方法でキーワードを判定してもよい。

１００，２００，３００：デジタル放送受信装置、１０１：チューナ部、１０２：ＵＩ部、１０３：通信部、１１０，２１０，３１０：制御部、１１１，２１１：メイン処理部、１１２：ＵＩ制御部、１１３，２１３：視聴処理部、１１４，２１４：文字データ取得部、１１５：文字データ連結部、１１６：文字データ抽出部、１１７，３１７：キーワード抽出制御部、１１８：キーワードリスト作成部、１１９：情報取得処理部、２２０：ＩＦ部、３２１：キーワード抽出部、１５０：ネットワーク、１４０：キーワード抽出サーバ、１４１：動画配信サーバ、１４２：Ｗｅｂサーバ。

Claims

番組データから文字データを順次取得する文字データ取得部と、
前記文字データ取得部で取得された文字データを含み、かつ、当該含まれている文字データの連結順が分かるようにされた検索対象文字データを生成する文字データ連結部と、
前記文字データ連結部で生成された検索対象文字データから語頭を検出して、前記文字データ連結部で生成された検索対象文字データの先頭の文字から当該検出された語頭の前の文字までの文字データを、キーワード抽出対象文字データとして抽出する文字データ抽出部と、を備えること
を特徴とするデジタル放送受信装置。
番組データから文字データを順次取得する文字データ取得部と、
前記文字データ取得部で取得された文字データを含み、かつ、当該含まれている文字データの連結順が分かるようにされた検索対象文字データを生成する文字データ連結部と、
前記文字データ連結部で生成された検索対象文字データから語頭又は所定の記号を検出して、前記文字データ連結部で生成された検索対象文字データの先頭の文字から当該検出された語頭の前の文字までの文字データ、又は、前記文字データ連結部で生成された検索対象文字データの先頭の文字から当該検出された所定の記号までの文字データを、キーワード抽出対象文字データとして抽出する文字データ抽出部と、を備えること
を特徴とするデジタル放送受信装置。
前記文字データ抽出部は、前記文字データ連結部で生成された検索対象文字データにおいて、文字体系の変化が検出された場合に、前記語頭が検出されたと判断すること
を特徴とする請求項１又は２に記載のデジタル放送受信装置。
前記文字データ抽出部により抽出されたキーワード抽出対象文字データからキーワードを抽出する処理を制御するキーワード抽出制御部をさらに備えること
を特徴とする請求項１から３の何れか一項に記載のデジタル放送受信装置。
ネットワークに接続する通信部をさらに備え、
前記キーワード抽出制御部は、前記通信部を介して、前記ネットワークに接続されているキーワード抽出サーバに、前記文字データ抽出部により抽出されたキーワード抽出対象文字データを送り、その応答として、前記通信部を介して、当該送られたキーワード抽出対象文字データから抽出されたキーワードを示すキーワード情報を取得すること
を特徴とする請求項４に記載のデジタル放送受信装置。
キーワードを抽出するキーワード抽出部をさらに備え、
前記キーワード抽出制御部は、前記キーワード抽出部に、前記文字データ抽出部により抽出されたキーワード抽出対象文字データから前記キーワードを抽出させること
を特徴とする請求項４に記載のデジタル放送受信装置。
前記キーワード抽出部は、前記文字データ抽出部により抽出されたキーワード抽出対象文字データを、形態素解析により単語に分割し、当該分割された単語が前記キーワードであるか否かを判定することで、前記キーワードを抽出すること
を特徴とする請求項６に記載のデジタル放送受信装置。
前記キーワード抽出部は、前記分割された単語が予め定められた分類に含まれるか否かを判断し、当該予め定められた分類に含まれると判断された単語を前記キーワードと判定すること
を特徴とする請求項７に記載のデジタル放送受信装置。
前記キーワード抽出制御部による制御で抽出されたキーワードを含むキーワードリスト画面を作成するキーワードリスト作成部と、
前記キーワードリスト作成部により作成されたキーワードリスト画面を表示して、当該表示されたキーワード画面に含まれているキーワードから、選択するキーワードの入力を受け付けるユーザインタフェース部と、
前記ユーザインタフェース部を介して選択されたキーワードに関連する情報を取得する情報取得処理部と、をさらに備えること
を特徴とする請求項１から８の何れか一項に記載のデジタル放送受信装置。
放送信号を受信し、当該放送信号を復調して前記番組データを生成するチューナ部をさらに備えること
を特徴とする請求項１から９の何れか一項に記載のデジタル放送受信装置。
録画再生装置から前記番組データを取得するインターフェース部をさらに備えること
を特徴とする請求項１から９の何れか一項に記載のデジタル放送受信装置。
番組データから文字データを順次取得する文字データ取得過程と、
前記文字データ取得過程で取得された文字データを含み、かつ、当該含まれている文字データの連結順が分かるようにされた検索対象文字データを生成する文字データ連結過程と、
前記文字データ連結過程で生成された検索対象文字データから語頭を検出して、前記文字データ連結過程で生成された検索対象文字データの先頭の文字から当該検出された語頭の前の文字までの文字データを、キーワード抽出対象文字データとして抽出する文字データ抽出過程と、を備えること
を特徴とするデータ処理方法。
番組データから文字データを順次取得する文字データ取得過程と、
前記文字データ取得過程で取得された文字データを含み、かつ、当該含まれている文字データの連結順が分かるようにされた検索対象文字データを生成する文字データ連結過程と、
前記文字データ連結過程で生成された検索対象文字データから語頭又は所定の記号を検出して、前記文字データ連結過程で生成された検索対象文字データの先頭の文字から当該検出された語頭の前の文字までの文字データ、又は、前記文字データ連結過程で生成された検索対象文字データの先頭の文字から当該検出された所定の記号までの文字データを、キーワード抽出対象文字データとして抽出する文字データ抽出過程と、を備えること
を特徴とするデータ処理方法。