JP2013243597A - デジタル放送受信装置及びデータ処理方法 - Google Patents
デジタル放送受信装置及びデータ処理方法 Download PDFInfo
- Publication number
- JP2013243597A JP2013243597A JP2012116658A JP2012116658A JP2013243597A JP 2013243597 A JP2013243597 A JP 2013243597A JP 2012116658 A JP2012116658 A JP 2012116658A JP 2012116658 A JP2012116658 A JP 2012116658A JP 2013243597 A JP2013243597 A JP 2013243597A
- Authority
- JP
- Japan
- Prior art keywords
- character data
- unit
- keyword
- character
- extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】複数の文字データを確実に連結することができる状態にし、複数の文字データの切れ目を適切に特定できるようにすること。
【解決手段】デジタル放送受信装置100は、番組データから文字データを順次取得する文字データ取得部114と、文字データ取得部114で取得された文字データを含み、かつ、当該含まれている文字データの連結順が分かるようにされた検索対象文字データを生成する文字データ連結部115と、文字データ連結部115で生成された検索対象文字データから語頭を検出して、当該検索対象文字データの先頭の文字から当該検出された語頭の前の文字までの文字データを、キーワード抽出対象文字データとして抽出する文字データ抽出部116とを備える。
【選択図】図1
【解決手段】デジタル放送受信装置100は、番組データから文字データを順次取得する文字データ取得部114と、文字データ取得部114で取得された文字データを含み、かつ、当該含まれている文字データの連結順が分かるようにされた検索対象文字データを生成する文字データ連結部115と、文字データ連結部115で生成された検索対象文字データから語頭を検出して、当該検索対象文字データの先頭の文字から当該検出された語頭の前の文字までの文字データを、キーワード抽出対象文字データとして抽出する文字データ抽出部116とを備える。
【選択図】図1
Description
本発明は、デジタル放送受信装置及びデータ処理方法に関する。
デジタル放送では、映像や音声に加え、番組関連情報及び天気予報等のデータ放送が送信されている。また、近年は番組内の出演者又はナレーションの音声を文字に置き換えて字幕として送信したり、テロップを利用して速報を送信したりすることが多くなっている。
更に、近年は字幕及びテロップ等の文字データからキーワードを抽出し、そのキーワードに関連する情報を表示することが考えられている。
ところで文字データは、放送局側で任意に分割されて送られてくるという特徴がある。ここで、放送局側がどのようにして文字データを作成し、送信しているのかを、字幕を例に挙げて説明する。
字幕は生放送番組又は録画放送番組の放送時に作成されて送信される場合(以下、生字幕という)と、番組の放送前に予め作成されて送信される場合(以下、通常字幕という)とがある。生字幕と通常字幕とを区別しない場合は、単に字幕という。生字幕は、番組の音声に音声認識処理を施すことによって作成される(音声認識方式)か、番組の音声を表記する文字をオペレータが入力することによって作成される(ワープロ方式)。
音声認識方式及びワープロ方式を用いた場合、デジタル放送受信装置で生字幕が表示されるタイミングは、対応する音声がデジタル放送受信装置から出力されるタイミングよりも遅延する。そこで、生字幕を送信する際における表示までの遅延時間を少しでも短縮するために、放送局側は、文字数及び意味等に拘らず、作成し終えた部分から即座に送信することがある。言い換えると、生字幕は、意味を成す文字列(単語又は文節等)毎に分割されて送られてくるとは限らない。例えば、「環太平洋経済連携協定」という文字列が、「環太」という文字列と、「平洋経済連携協定」という文字列とに分割されて送られてくる場合がある。
従って、放送局側で任意に分割されて送られてきた字幕からキーワードを抽出する際は、字幕を受信する度にキーワードを抽出してしまうと、分断されたままの単語からキーワードが抽出されてしまい、正しい単語からキーワードを抽出することができないという問題が発生する。
このような、放送局側で字幕が分割されて送られるという問題に対応するため、従来、受信した字幕を2つ連結してから表示を行ったり、句読点等の文字で分割して表示を行ったりする装置及び方法がある(例えば、特許文献1参照)。
特許文献1に記載された装置及び方法は、字幕を表示する際、ある時間に送られてきた字幕(以下、第1の字幕という)と、その次に送られてきた字幕(以下、第2の字幕という)とについて、第1の字幕が所定の文字数以下であった場合に、2つの字幕を連結させて表示するものである。しかしながら、第1の字幕が所定の文字数を超える場合は、このような連結処理は行われない。言い換えると、ある単語が複数の字幕に跨って送られてきた場合でも、第1の字幕が所定の文字数を超える場合には連結処理は行われないので、このような場合に、キーワードの抽出を行ったとしても、その単語は分断されたままでキーワードの抽出が行われてしまう。
また、特許文献1に記載された装置及び方法は、字幕の句読点及び改行位置を検出して、その位置で分割し、その前半について表示する。例えば、「今日の、株式市」というような字幕が送られてきた場合は、「今日の、」と「株式市」とに分割し、単語が分断されていない前半のみを表示し、後半の「株式市」については後ほど送られてくる字幕と連結してから表示する。しかしながら、「今日の株式市」というように句読点を含んでいない場合は、分割して表示することができない。このように、文字データには句読点及び改行コード等が含まれていない場合も多いため、特許文献1に記載された装置及び方法では、全ての文字データに対して分割を行うことができない。よって、特許文献1に記載された装置及び方法でキーワードの抽出を行ったとしても、単語が分断されたまま抽出されてしまうことがある。
そこで、本発明は、複数の文字データを確実に連結することができる状態にし、複数の文字データの切れ目を適切に特定できるようにすることを目的とする。
本発明の一態様に係るデジタル放送受信装置は、番組データから文字データを順次取得する文字データ取得部と、前記文字データ取得部で取得された文字データを含み、かつ、当該含まれている文字データの連結順が分かるようにされた検索対象文字データを生成する文字データ連結部と、前記文字データ連結部で生成された検索対象文字データから語頭を検出して、前記文字データ連結部で生成された検索対象文字データの先頭の文字から当該検出された語頭の前の文字までの文字データを、キーワード抽出対象文字データとして抽出する文字データ抽出部と、を備えることを特徴とする。
本発明の一態様によれば、複数の文字データを確実に連結することができる状態にし、複数の文字データの切れ目を適切に特定できる。
実施の形態1.
図1は、実施の形態1に係るデジタル放送受信装置100の構成を概略的に示すブロック図である。デジタル放送受信装置100は、チューナ部101と、ユーザインタフェース部(以下、UI部という)102と、通信部103と、制御部110とを備える。なお、デジタル放送受信装置100は、ネットワーク150に接続されている。また、ネットワーク150には、キーワードの抽出を行うキーワード抽出サーバ140、動画の配信を行う動画配信サーバ141、及び、Webサイトの提供を行うWebサーバ142が接続されている。
図1は、実施の形態1に係るデジタル放送受信装置100の構成を概略的に示すブロック図である。デジタル放送受信装置100は、チューナ部101と、ユーザインタフェース部(以下、UI部という)102と、通信部103と、制御部110とを備える。なお、デジタル放送受信装置100は、ネットワーク150に接続されている。また、ネットワーク150には、キーワードの抽出を行うキーワード抽出サーバ140、動画の配信を行う動画配信サーバ141、及び、Webサイトの提供を行うWebサーバ142が接続されている。
チューナ部101は、アンテナ130を介して、放送信号を受信して、当該受信された放送信号を復調することで、番組データを生成する。そして、チューナ部101は、生成された番組データを制御部110に与える。
UI部102は、ユーザとの間のインターフェースである。例えば、UI部102は、ユーザからイベントの入力を受け付ける入力部と、画面を表示する表示部とを備える。
通信部103は、ネットワークとの間で通信を行う。
UI部102は、ユーザとの間のインターフェースである。例えば、UI部102は、ユーザからイベントの入力を受け付ける入力部と、画面を表示する表示部とを備える。
通信部103は、ネットワークとの間で通信を行う。
制御部110は、チューナ部101、UI部102及び通信部103を制御して、放送の視聴に関する処理を制御する。制御部110は、メイン処理部111と、ユーザインタフェース制御部(以下、UI制御部という)112と、視聴処理部113と、文字データ取得部114と、文字データ連結部115と、文字データ抽出部116と、キーワード抽出制御部117と、キーワードリスト作成部118と、情報取得処理部119とを備える。
メイン処理部111は、制御部110内の各部を制御する。例えば、メイン処理部111は、チューナ部101から受け取った番組データを視聴処理部113に与えて、視聴処理部113に映像信号及び音声信号を生成させる。そして、メイン処理部111は、生成された映像信号及び音声信号を、UI制御部112を介して、UI部102に与える。
UI制御部112は、UI部102を制御する。
視聴処理部113は、放送の視聴に関する処理を行う。例えば、視聴処理部113は、チューナ部101で生成された番組データをメイン処理部111から受け取り、この番組データから映像信号及び音声信号を生成する。また、視聴処理部113は、制御部110内の各部から与えられたデータについても処理する。例えば、視聴処理部113は、情報取得処理部119からキーワード関連情報を取得して、このキーワード関連情報を含む画面の画面データを生成する。そして、視聴処理部113は、このような画面データを、UI制御部112を介してUI部102に送り、このような画面データに基づく画面(例えば、キーワード関連情報表示画面)をUI部102に表示させる。なお、視聴処理部113は、このようなキーワード関連情報表示画面等を、メイン処理部111から与えられた番組データの映像に合成してから、映像信号を生成してもよい。
UI制御部112は、UI部102を制御する。
視聴処理部113は、放送の視聴に関する処理を行う。例えば、視聴処理部113は、チューナ部101で生成された番組データをメイン処理部111から受け取り、この番組データから映像信号及び音声信号を生成する。また、視聴処理部113は、制御部110内の各部から与えられたデータについても処理する。例えば、視聴処理部113は、情報取得処理部119からキーワード関連情報を取得して、このキーワード関連情報を含む画面の画面データを生成する。そして、視聴処理部113は、このような画面データを、UI制御部112を介してUI部102に送り、このような画面データに基づく画面(例えば、キーワード関連情報表示画面)をUI部102に表示させる。なお、視聴処理部113は、このようなキーワード関連情報表示画面等を、メイン処理部111から与えられた番組データの映像に合成してから、映像信号を生成してもよい。
文字データ取得部114は、チューナ部101が生成した番組データから、字幕及びテロップ等の文字データを順次取得する。そして、文字データ取得部114は、取得した文字データを文字データ連結部115に与える。
文字データ連結部115は、文字データ取得部114から与えられた文字データを含み、かつ、その連結順が分かるようにされた検索対象文字データを生成する。例えば、文字データ連結部115は、文字データ取得部114から与えられた文字データを、その連結順に従って連結することで、連結対象文字データを生成する。そして、文字データ連結部115は、文字データ抽出部116からの要求に応じて、その時点における連結対象文字データを検索対象文字データとして文字データ抽出部116に与える。
文字データ抽出部116は、文字データ連結部115から与えられた検索対象文字データから、キーワード抽出対象文字データを抽出する。例えば、文字データ抽出部116は、検索対象文字データに含まれている、予め定められた記号及び語頭の少なくとも何れか一方を検出し、その検出結果により検索対象文字データを分割し、分割された検索対象文字データの先頭側のデータをキーワード抽出対象文字データとして抽出する。そして、文字データ抽出部116は、抽出されたキーワード抽出対象文字データをキーワード抽出制御部117に与える。なお、語頭は、言葉又は単語の最初の部分の文字又は音である。
文字データ連結部115は、文字データ取得部114から与えられた文字データを含み、かつ、その連結順が分かるようにされた検索対象文字データを生成する。例えば、文字データ連結部115は、文字データ取得部114から与えられた文字データを、その連結順に従って連結することで、連結対象文字データを生成する。そして、文字データ連結部115は、文字データ抽出部116からの要求に応じて、その時点における連結対象文字データを検索対象文字データとして文字データ抽出部116に与える。
文字データ抽出部116は、文字データ連結部115から与えられた検索対象文字データから、キーワード抽出対象文字データを抽出する。例えば、文字データ抽出部116は、検索対象文字データに含まれている、予め定められた記号及び語頭の少なくとも何れか一方を検出し、その検出結果により検索対象文字データを分割し、分割された検索対象文字データの先頭側のデータをキーワード抽出対象文字データとして抽出する。そして、文字データ抽出部116は、抽出されたキーワード抽出対象文字データをキーワード抽出制御部117に与える。なお、語頭は、言葉又は単語の最初の部分の文字又は音である。
キーワード抽出制御部117は、文字データ抽出部116から与えられたキーワード抽出対象文字データからキーワードを抽出する処理を制御する。例えば、キーワード抽出制御部117は、通信部103を介して、文字データ抽出部116から与えられたキーワード抽出対象文字データをキーワード抽出サーバ140に送信する処理を行う。そして、キーワード抽出制御部117は、通信部103を介して、キーワード抽出サーバ140より、送信されたキーワード抽出対象文字データから抽出されたキーワードを示すキーワード情報を受信する処理を行う。キーワード抽出制御部117は、このようなキーワード情報をキーワードリスト作成部118に与える。
キーワードリスト作成部118は、キーワード抽出制御部117から与えられたキーワード情報で示されるキーワードをリスト化したキーワードリスト画面の画面データを生成する。そして、キーワードリスト作成部118は、生成されたキーワードリスト画面の画面データを、UI制御部112を介して、UI部102に与える。ユーザは、UI部102(例えば、リモコン等の入力装置)を利用して、キーワードリスト画面において表示されたキーワードの中から1つ以上のキーワードを選択する。
情報取得処理部119は、UI制御部112から、UI部102を介してユーザが選択したキーワードを示す選択キーワード情報を取得する。そして、情報取得処理部119は、通信部103を介して、選択キーワード情報で示されるキーワードに関連する情報(キーワード関連情報)をWebサーバ142から取得する。情報取得処理部119は、取得されたキーワード関連情報を、メイン処理部111を介して視聴処理部113に与える。このようなキーワード関連情報を取得した視聴処理部113は、キーワード関連情報に含まれている情報を出力する処理を行う。例えば、視聴処理部113は、取得したキーワード関連情報を含む画面の画面データを生成する。このようにして生成された画面データは、メイン処理部111及びUI制御部112を介して、UI部102に与えられる。このような画面データを受け取ったUI部102は、受け取った画面データに基づいて、画面の表示を行う。
キーワードリスト作成部118は、キーワード抽出制御部117から与えられたキーワード情報で示されるキーワードをリスト化したキーワードリスト画面の画面データを生成する。そして、キーワードリスト作成部118は、生成されたキーワードリスト画面の画面データを、UI制御部112を介して、UI部102に与える。ユーザは、UI部102(例えば、リモコン等の入力装置)を利用して、キーワードリスト画面において表示されたキーワードの中から1つ以上のキーワードを選択する。
情報取得処理部119は、UI制御部112から、UI部102を介してユーザが選択したキーワードを示す選択キーワード情報を取得する。そして、情報取得処理部119は、通信部103を介して、選択キーワード情報で示されるキーワードに関連する情報(キーワード関連情報)をWebサーバ142から取得する。情報取得処理部119は、取得されたキーワード関連情報を、メイン処理部111を介して視聴処理部113に与える。このようなキーワード関連情報を取得した視聴処理部113は、キーワード関連情報に含まれている情報を出力する処理を行う。例えば、視聴処理部113は、取得したキーワード関連情報を含む画面の画面データを生成する。このようにして生成された画面データは、メイン処理部111及びUI制御部112を介して、UI部102に与えられる。このような画面データを受け取ったUI部102は、受け取った画面データに基づいて、画面の表示を行う。
以下では、文字データを含む番組データを受け取ってキーワードを抽出する際における、文字データ取得部114、文字データ連結部115、文字データ抽出部116及びキーワード抽出制御部117の各部の動作について、図2〜図5のフローチャートを用いて説明する。
図2は、文字データ連結部115が文字データ取得部114から文字データを受け取った場合の処理を示すフローチャートである。
文字データ連結部115は、文字データ取得部114から文字データを受け取ると(S10)、既に連結処理を進めている途中のデータである連結対象文字データが存在するか否かを確認する(S11)。そして、文字データ連結部115は、連結対象文字データが存在する場合(S11:Yes)には、ステップS12に処理を進め、連結対象文字データが存在しない場合(S11:No)には、ステップS13に処理を進める。
ステップS12では、文字データ連結部115は、新たに受け取った文字データを、連結対象文字データの後ろに連結する。
一方、ステップS13では、文字データ連結部115は、新しく受け取った文字データを連結対象文字データの最初の要素とする。以降、文字データを受け取った際には、文字データ連結部115は、受け取った文字データをこの連結対象文字データに連結する。
図3は、キーワード抽出制御部117がメイン処理部111からキーワード抽出を開始する通知を受け取った場合の処理を示すフローチャートである。例えば、メイン処理部111は、UI部102を介して、ユーザがキーワード抽出のイベントを入力した場合に、キーワード抽出制御部117にキーワード抽出の開始を通知する。また、メイン処理部111は、予め定められた時、例えば、定期的にキーワード抽出制御部117にキーワード抽出の開始を通知する。
キーワード抽出制御部117は、メイン処理部111からキーワード抽出の開始の通知を受け取ると(S20)、文字データ抽出部116に文字データの抽出開始を通知する(S21)。
そして、キーワード抽出制御部117は、文字データ抽出部116からキーワード抽出対象文字データを受け取ると、インターネットに接続されているキーワード抽出サーバ140を利用してキーワードを抽出するよう制御する(S22)。キーワード抽出制御部117は、このようにして抽出されたキーワードをキーワードリスト作成部118に通知する。
図4は、文字データ抽出部116がキーワード抽出制御部117から文字データの抽出開始の通知を受け取った場合の第1の処理例を示すフローチャートである。図4に示されているフローでは、文字データ抽出部116は、検索対象文字データにおいて所定の記号を検出して、その検出結果に基づいて、キーワード抽出対象文字データを抽出する。
文字データ抽出部116は、キーワード抽出制御部117から文字データの抽出開始の通知を受け取ると(S30)、文字データ連結部115に対して、検索対象文字データを送るように要求する。そして、文字データ抽出部116は、文字データ連結部115から検索対象文字データを受け取る(S31)。ここで受け取った検索対象文字データの文字数を値Lとする。
次に、文字データ抽出部116は、ある変数Kを作成し、変数Kに値Lを代入する(S32)。これは、所定の記号、例えば、句読点、疑問符又は感嘆符を検索対象文字データの最後尾から順に探索するためである。
次に、文字データ抽出部116は、検索対象文字データのK文字目が所定の記号、例えば、句読点、疑問符又は感嘆符かどうかを、文字コード等によって検出する(S33)。そして、文字データ抽出部116は、検索対象文字データのK文字目が所定の記号である場合(S33:Yes)には、ステップS34に処理を進め、検索対象文字データのK文字目が所定の記号ではない場合(S33:No)には、ステップS35に処理を進める。
ステップS34では、文字データ抽出部116は、検索対象文字データを、先頭からK文字目までの文字データと、K+1文字目からL文字目までの文字データとの2つに分離する。そして、文字データ抽出部116は、先頭からK文字目までの文字データをキーワード抽出対象文字データとしてキーワード抽出制御部117に与える。また、文字データ抽出部116は、K+1文字目からL文字目までの文字データを連結対象文字データとして文字データ連結部115に与える。
なお、文字データ抽出部116は、連結中の文字データの最後の文字が所定の記号であった場合は、検索対象文字データの全てをキーワード抽出対象文字データとして抽出する。この場合、文字データ抽出部116は、連結対象文字データを文字データ連結部115に与えない。
なお、文字データ抽出部116は、連結中の文字データの最後の文字が所定の記号であった場合は、検索対象文字データの全てをキーワード抽出対象文字データとして抽出する。この場合、文字データ抽出部116は、連結対象文字データを文字データ連結部115に与えない。
一方、ステップS35では、文字データ抽出部116は、変数Kの値を1つ減らし、次に探索する文字を1つ前の文字に設定する。
次に、文字データ抽出部116は、変数Kの値が1未満であるか確認する(S36)。そして、文字データ抽出部116は、変数Kの値が1未満である場合(S36:Yes)には、ステップS37に処理を進め、変数Kの値が1以上である場合(S36:No)には、ステップS33に処理を進める。
ステップS37では、文字データ抽出部116は、検索対象文字データの全てをキーワード抽出対象文字データとしてキーワード抽出制御部117に与える。ステップS36において変数Kの値が1未満である場合(S36:Yes)は、出力する検索対象文字データの先頭まで探索が終了したことを示す。言い換えると、検索対象文字データには所定の記号が含まれていないことになる。この場合、文字データ抽出部116は、検索対象文字データの全てをキーワード抽出対象文字データとして抽出する。
ここで、ステップS37では、文字データ抽出部116は、検索対象文字データの全てをキーワード抽出対象文字データとして抽出しているが、このような例に限定されるものではない。このような場合でも、文字データ抽出部116は、検索対象文字データの一部をキーワード抽出対象文字データとして抽出し、その残りを連結対象文字データとしてもよい。
また、文字データ抽出部116は、検索対象文字データに所定の記号が含まれない場合には、検索対象文字データの全てを連結対象文字データとしてもよい。このような場合には、文字データ抽出部116は、キーワード抽出制御部117にキーワード抽出対象文字データが出力されない旨を通知する。このような通知を受けたキーワード抽出制御部117は、文字データ抽出部116からキーワード抽出対象文字データを受け取るまで、図3のステップS21の処理を繰り返せばよい。
また、文字データ抽出部116は、検索対象文字データに所定の記号が含まれない場合には、検索対象文字データの全てを連結対象文字データとしてもよい。このような場合には、文字データ抽出部116は、キーワード抽出制御部117にキーワード抽出対象文字データが出力されない旨を通知する。このような通知を受けたキーワード抽出制御部117は、文字データ抽出部116からキーワード抽出対象文字データを受け取るまで、図3のステップS21の処理を繰り返せばよい。
図5は、文字データ抽出部116がキーワード抽出制御部117から文字データの抽出開始の通知を受け取った場合の第2の処理例を示すフローチャートである。図5に示されているフローでは、文字データ抽出部116は、検索対象文字データにおいて語頭を検出して、その検出結果に基づいて、キーワード抽出対象文字データを抽出する。
文字データ抽出部116は、キーワード抽出制御部117から文字データの抽出開始の通知を受け取ると(S40)、文字データ連結部115に対して、検索対象文字データを送るように要求する。そして、文字データ抽出部116は、文字データ連結部115から検索対象文字データを受け取る(S41)。ここで受け取った検索対象文字データの文字数を値Lとする。
次に、文字データ抽出部116は、ある変数Kを作成し、変数Kに値Lを代入する(S42)。これは、文字体系が変化する位置を検索対象文字データの最後尾から順に探索するためである。
次に、文字データ抽出部116は、検索対象文字データのK文字目が、所定の文字体系、例えば、漢字又はカタカナかどうかを文字コード等によって判定する(S43)。そして、文字データ抽出部116は、検索対象文字データのK文字目が所定の文字体系である場合(S43:Yes)には、ステップS44に処理を進め、検索対象文字データのK文字目が所定の文字体系ではない場合(S43:No)には、ステップS49に処理を進める。
ステップS44では、文字データ抽出部116は、検索対象文字データのK文字目の文字体系を記憶する。例えば、文字データ抽出部116は、文字体系フラグという変数を用意しておき、その文字体系フラグを漢字又はカタカナに設定する。
次に、文字データ抽出部116は、変数Kの値を1つ減らし、次に調べる文字を1つ前の文字に設定する(S45)。
次に、文字データ抽出部116は、変数Kの値が1未満であるか確認する(S46)。そして、文字データ抽出部116は、変数Kの値が1未満である場合(S46:Yes)には、ステップS51に処理を進め、変数Kの値が1以上である場合(S46:No)には、ステップS47に処理を進める。
ステップS47では、文字データ抽出部116は、K文字目の文字体系を文字コード等によって判定し、その文字体系がステップS44で記憶しておいた文字体系と一致しているかを比較する。そして、文字データ抽出部116は、K文字目の文字体系がステップS44で記憶しておいた文字体系と一致している場合(S47:Yes)には、ステップS45に処理を進め、これらが一致していない場合(S47:No)には、ステップS48に処理を進める。
ステップS48では、文字データ抽出部116は、文字体系に変化があったと判断して(変化している部分の後ろの文字が語頭であると判断して)、検索対象文字データを、先頭からK文字目までの文字データと、K+1文字目からL文字目までの文字データとの2つに分離する。そして、文字データ抽出部116は、先頭からK文字目までの文字データをキーワード抽出対象文字データとしてキーワード抽出制御部117に与える。また、文字データ抽出部116は、K+1文字目からL文字目までの文字データを連結対象文字データとして文字データ連結部115に与える。
一方、文字データ抽出部116は、ステップS43において検索対象文字データのK文字目が所定の文字体系ではないと判断した場合(S43:No)には、ステップS49に処理を進める。ステップS49では、文字データ抽出部116は、変数Kの値を1つ減らし、次に調べる文字を1つ前の文字に設定する。
次に、文字データ抽出部116は、変数Kの値が1未満であるか確認する(S50)。そして、文字データ抽出部116は、変数Kの値が1未満である場合(S50:Yes)には、ステップS51に処理を進め、変数Kの値が1以上である場合(S50:No)には、ステップS43に処理を進める。
ステップS51では、文字データ抽出部116は、検索対象文字データの全てをキーワード抽出対象文字データとしてキーワード抽出制御部117に与える。ステップS50において変数Kの値が1未満である場合(S50:Yes)は、出力する検索対象文字データの先頭まで探索が終了したことを示す。言い換えると、検索対象文字データには文字体系の変化が含まれていないことになる。この場合、文字データ抽出部116は、検索対象文字データの全てをキーワード抽出対象文字データとして抽出する。
ここで、ステップS51では、文字データ抽出部116は、検索対象文字データの全てをキーワード抽出対象文字データとして抽出しているが、このような例に限定されるものではない。例えば、文字データ抽出部116は、このような場合に、検索対象文字データの全てを連結対象文字データとしてもよい。そして、文字データ抽出部116は、キーワード抽出制御部117にキーワード抽出対象文字データが出力されない旨を通知する。このような通知を受けたキーワード抽出制御部117は、文字データ抽出部116からキーワード抽出対象文字データを受け取るまで、図3のステップS21の処理を繰り返せばよい。
図5に示されているフローにより、文字データ抽出部116が、検索対象文字データの語頭を検出して、この検索対象文字データを、キーワード抽出対象文字データと連結対象文字データとに分割する例を、図6を用いて説明する。
文字データ抽出部116が文字データ連結部115から受け取った検索対象文字データが、図6に示されているように、「今日は株式市場の平均株」であった場合、文字データ抽出部116は、図5に示されているフローにより、「今日は株式市場の平均株」の最後尾の文字「株」から語頭の検出を開始する。そして、文字データ抽出部116は、文字「の」と、文字「平」との間で文字体系が変化するため、文字「平」を語頭と判断する。この場合、文字データ抽出部116は、文字「の」と文字「平」との間で検索対象文字データを分割して、「今日は株式市場の」の部分をキーワード抽出対象文字データとし、「平均株」の部分を連結対象文字データとする。
文字データ抽出部116が文字データ連結部115から受け取った検索対象文字データが、図6に示されているように、「今日は株式市場の平均株」であった場合、文字データ抽出部116は、図5に示されているフローにより、「今日は株式市場の平均株」の最後尾の文字「株」から語頭の検出を開始する。そして、文字データ抽出部116は、文字「の」と、文字「平」との間で文字体系が変化するため、文字「平」を語頭と判断する。この場合、文字データ抽出部116は、文字「の」と文字「平」との間で検索対象文字データを分割して、「今日は株式市場の」の部分をキーワード抽出対象文字データとし、「平均株」の部分を連結対象文字データとする。
図7は、文字データ抽出部116がキーワード抽出制御部117から文字データの抽出開始の通知を受け取った場合の第3の処理例を示すフローチャートである。図6に示されているフローでは、文字データ抽出部116は、検索対象文字データにおいて所定の記号又は語頭を検出して、その検出結果に基づいて、キーワード抽出対象文字データを抽出する。
文字データ抽出部116は、キーワード抽出制御部117から文字データの抽出開始の通知を受け取ると(S60)、文字データ連結部115に対して、検索対象文字データを送るように要求する。そして、文字データ抽出部116は、文字データ連結部115から検索対象文字データを受け取る(S61)。ここで受け取った検索対象文字データの文字数を値Lとする。
次に、文字データ抽出部116は、ある変数Kを作成し、変数Kに値Lを代入する(S62)。これは、所定の記号又は語頭を検索対象文字データの最後尾から順に探索するためである。
次に、文字データ抽出部116は、検索対象文字データのK文字目が所定の記号、例えば、句読点、疑問符又は感嘆符かどうかを、文字コード等によって検出する(S63)。そして、文字データ抽出部116は、検索対象文字データのK文字目が所定の記号である場合(S63:Yes)には、ステップS69に処理を進め、検索対象文字データのK文字目が所定の記号ではない場合(S63:No)には、ステップS64に処理を進める。
ステップS64では、文字データ抽出部116は、検索対象文字データのK文字目が、所定の文字体系、例えば、漢字又はカタカナかどうかを文字コード等によって判定する。そして、文字データ抽出部116は、検索対象文字データのK文字目が所定の文字体系である場合(S64:Yes)には、ステップS65に処理を進め、検索対象文字データのK文字目が所定の文字体系ではない場合(S64:No)には、ステップS70に処理を進める。
ステップS65では、文字データ抽出部116は、検索対象文字データのK文字目の文字体系を記憶する。例えば、文字データ抽出部116は、文字体系フラグという変数を用意しておき、その文字体系フラグを漢字又はカタカナに設定する。
次に、文字データ抽出部116は、変数Kの値を1つ減らし、次に調べる文字を1つ前の文字に設定する(S66)。
次に、文字データ抽出部116は、変数Kの値が1未満であるか確認する(S67)。そして、文字データ抽出部116は、変数Kの値が1未満である場合(S67:Yes)には、ステップS72に処理を進め、変数Kの値が1以上である場合(S67:No)には、ステップS68に処理を進める。
ステップS68では、文字データ抽出部116は、K文字目の文字体系を文字コード等によって判定し、その文字体系がステップS65で記憶しておいた文字体系と一致しているかを比較する。そして、文字データ抽出部116は、K文字目の文字体系がステップS65で記憶しておいた文字体系と一致している場合(S68:Yes)には、ステップS66に処理を進め、これらが一致していない場合(S68:No)には、ステップS69に処理を進める。
ステップS69では、文字データ抽出部116は、所定の記号又は語頭が検出されたと判断して、検索対象文字データを、先頭からK文字目までの文字データと、K+1文字目からL文字目までの文字データとの2つに分離する。そして、文字データ抽出部116は、先頭からK文字目までの文字データをキーワード抽出対象文字データとしてキーワード抽出制御部117に与える。また、文字データ抽出部116は、K+1文字目からL文字目までの文字データを連結対象文字データとして文字データ連結部115に与える。
一方、文字データ抽出部116は、ステップS64において検索対象文字データのK文字目が所定の文字体系ではないと判断した場合(S64:No)には、ステップS70に処理を進める。ステップS70では、文字データ抽出部116は、変数Kの値を1つ減らし、次に調べる文字を1つ前の文字に設定する。
次に、文字データ抽出部116は、変数Kの値が1未満であるか確認する(S71)。そして、文字データ抽出部116は、変数Kの値が1未満である場合(S71:Yes)には、ステップS72に処理を進め、変数Kの値が1以上である場合(S71:No)には、ステップS63に処理を進める。
ステップS72では、文字データ抽出部116は、検索対象文字データの全てをキーワード抽出対象文字データとしてキーワード抽出制御部117に与える。ステップS71において変数Kの値が1未満である場合(S71:Yes)は、出力する検索対象文字データの先頭まで探索が終了したことを示す。言い換えると、検索対象文字データには、所定の記号及び語頭が含まれていないことになる。この場合、文字データ抽出部116は、検索対象文字データの全てをキーワード抽出対象文字データとして抽出する。
ここで、ステップS72では、文字データ抽出部116は、検索対象文字データの全てをキーワード抽出対象文字データとして抽出しているが、このような例に限定されるものではない。例えば、文字データ抽出部116は、このような場合に、検索対象文字データの全てを連結対象文字データとしてもよい。そして、文字データ抽出部116は、キーワード抽出制御部117にキーワード抽出対象文字データが出力されない旨を通知する。このような通知を受けたキーワード抽出制御部117は、文字データ抽出部116からキーワード抽出対象文字データを受け取るまで、図3のステップS21の処理を繰り返せばよい。
文字データ抽出部116は、図4に示されている、記号の検出結果により検索対象文字データを抽出する記号検出機能、図5に示されている、語頭の検出結果により検索対象文字データを抽出する語頭検出機能、及び、図7に示されている記号又は語頭により検索対象文字データを抽出する記号又は語頭検出機能の少なくとも何れか1つを利用して、キーワード抽出対象文字データを抽出すればよい。
例えば、文字データ抽出部116は、番組の視聴開始(特定のチャンネルへの選局開始)から所定の期間が経過するまでは、記号又は語頭検出機能を利用してキーワード抽出対象文字データを抽出する。そして、文字データ抽出部116は、この期間において、所定の記号が検出されない場合には、語頭検出機能を用いてキーワード抽出対象文字データを抽出するようにすることで、演算負荷を軽減することができる。なお、文字データ抽出部116は、この期間において、所定の記号が検出されない場合でも、記号又は語頭検出機能を継続して利用するように構成されていてもよく、また、この期間において、所定の記号が検出された場合には、記号検出機能を利用するように構成されていてもよい。
例えば、文字データ抽出部116は、番組の視聴開始(特定のチャンネルへの選局開始)から所定の期間が経過するまでは、記号又は語頭検出機能を利用してキーワード抽出対象文字データを抽出する。そして、文字データ抽出部116は、この期間において、所定の記号が検出されない場合には、語頭検出機能を用いてキーワード抽出対象文字データを抽出するようにすることで、演算負荷を軽減することができる。なお、文字データ抽出部116は、この期間において、所定の記号が検出されない場合でも、記号又は語頭検出機能を継続して利用するように構成されていてもよく、また、この期間において、所定の記号が検出された場合には、記号検出機能を利用するように構成されていてもよい。
以上のように、実施の形態1に係るデジタル放送受信装置100においては、文字データを付加情報として持つ番組の視聴時に、受信された文字データを連結し、連結された文字データから意味を成す文字データを各々分離することが可能となる。
また、実施の形態1に係るデジタル放送受信装置100は、句読点、疑問符及び感嘆符等の記号、又は、語頭を検出することで、検索対象文字データを、意味を成す文字データ毎に分離することができる。
さらに、実施の形態1に係るデジタル放送受信装置100は、検索対象文字データから分離された2つの文字データを、キーワード抽出対象文字データ及び連結対象文字データとすることができる。そして、実施の形態1に係るデジタル放送受信装置100は、キーワード抽出対象文字データに対してはキーワード抽出を行い、連結対象文字データに対しては文字データの連結を継続させることができる。
これによって、実施の形態1に係るデジタル放送受信装置100は、複数の文字データに跨って、ある単語が送られてきた場合でも、その単語が分断されたままキーワードとして抽出されることがなくなる。このため、実在しない単語又は放送内容に沿わない単語がキーワードとして誤って表示されることがなくなり、このキーワードを利用する際に、ユーザが感じる不便さを軽減することができる。
例えば、「環太平洋経済連携協定」という文字データが、「環太」という文字データと、「平洋経済連携協定」という文字データとに分断されて送られてきた場合に、「環太」及び「平洋経済連携協定」等の実在しない語をキーワードとして抽出してしまうことがなくなる。また、「環太平洋経済連携協定」という文字データが、「環太平洋」という文字データと「経済連携協定」という文字データとに分断されて送られてきた場合に、放送内容としては「環太平洋経済連携協定」で1語であるにも拘らず、「環太平洋」と「経済連携協定」というように2つの別の語をキーワードとして抽出してしまうことがなくなる。
これによって、実施の形態1に係るデジタル放送受信装置100は、複数の文字データに跨って、ある単語が送られてきた場合でも、その単語が分断されたままキーワードとして抽出されることがなくなる。このため、実在しない単語又は放送内容に沿わない単語がキーワードとして誤って表示されることがなくなり、このキーワードを利用する際に、ユーザが感じる不便さを軽減することができる。
例えば、「環太平洋経済連携協定」という文字データが、「環太」という文字データと、「平洋経済連携協定」という文字データとに分断されて送られてきた場合に、「環太」及び「平洋経済連携協定」等の実在しない語をキーワードとして抽出してしまうことがなくなる。また、「環太平洋経済連携協定」という文字データが、「環太平洋」という文字データと「経済連携協定」という文字データとに分断されて送られてきた場合に、放送内容としては「環太平洋経済連携協定」で1語であるにも拘らず、「環太平洋」と「経済連携協定」というように2つの別の語をキーワードとして抽出してしまうことがなくなる。
実施の形態1では、文字データ連結部115は、文字データの連結によって検索対象文字データを生成している。言い換えると、文字データ連結部115は、文字データ取得部114から受け取った文字データを順番に配列することで、検索対象文字データを生成している。しかし、文字データ連結部115は、必ずしも文字データを順番に連結する必要はなく、文字データを連結する順番(受信した順序)が分かるようにした文字データ群を、検索対象文字データとして文字データ抽出部116に与えてもよい。例えば、文字データ連結部115は、リスト構造等その他の形式により文字データの受信した順番を特定して、文字データ取得部114から与えられた複数の文字データ(文字データ群)を、検索対象文字データとして文字データ抽出部116に与えてもよい。
番組データは、表示する際の色が指定された文字データを含む場合もある。この場合には、文字データ連結部115は、同じ色の文字データ同士を連結して連結対象文字データを生成してもよい。
色が指定される理由としては、例えば、会話をしている話者によって色を変えることで、誰の発言かを分かりやすく提示することが挙げられる。従って、同じ色の文字データを連結することで、違う人の会話に対応する文字データを連結してしまうことを防止できる。これによって、ある人物の発言を示す複数の文字データに跨って、ある単語が送られてきた場合に、分割されていた単語を正しく連結できなくなる、といった問題が発生しなくなる。
色が指定される理由としては、例えば、会話をしている話者によって色を変えることで、誰の発言かを分かりやすく提示することが挙げられる。従って、同じ色の文字データを連結することで、違う人の会話に対応する文字データを連結してしまうことを防止できる。これによって、ある人物の発言を示す複数の文字データに跨って、ある単語が送られてきた場合に、分割されていた単語を正しく連結できなくなる、といった問題が発生しなくなる。
実施の形態1では、文字データ抽出部116は、漢字及びカタカナに着目して語頭を検出しているが、アルファベット及び数字の少なくとも何れか一方にも着目して語頭を検出してもよい。こうすることによって、文字体系の変化を検出する分解能が高くなるため、語頭の検出が速くなることが期待できる。また「約1万人」のように、漢字の間に数字が含まれる場合等もあるが、この場合には「約」を語頭と判断するように構成しても構わない。例えば、漢字と数字との間で文字体系が変化した場合には、語頭と判断しないように構成すればよい。このことにより、より正確に語頭を検出することができる。
実施の形態1では、文字データ抽出部116は、文字体系に着目して語頭を検出しているが、このような例に限定されない。例えば、文字データ抽出部116は、形態素解析ツール等を利用して語頭を検出してもよい。形態素解析ツールは既に多く存在しており、これを利用すれば簡単に語頭の検出が可能である。
実施の形態1に係るデジタル放送受信装置100は、映像とは別に、付属データとして送られる字幕等の文字データに対して処理を行っているが、これに限らず、映像データとして送られる文字データに対して同様の処理を行ってもよい。これを実現するには、文字データ抽出部116が、文字認識等を利用して映像から文字データを抽出することが考えられる。これによって、字幕等の文字データが含まれていない場合にもこの実施の形態によりキーワードを抽出することができる。
実施の形態1では、キーワードリスト作成部118は必須ではない。キーワードリスト作成部118が備えられていない場合には、情報取得処理部119は、キーワード抽出制御部117によりキーワードが抽出される度に、そのキーワードを受け取り、受け取ったキーワードに関連する情報を取得して、視聴処理部113に与えることで、キーワードに関連する情報がUI部102に表示される。
実施の形態1では、情報取得処理部119は、Webサーバ142からキーワード関連情報を取得しているが、このような例に限定されるものではない。例えば、デジタル放送受信装置100の内部に辞書を記憶する辞書記憶部を備えておき、この辞書記憶部からキーワードを取得するように構成することもできる。また、辞書を記憶する辞書記憶部を備える装置(例えば、記憶装置)をネットワーク150又は他のネットワークに接続し、その装置からキーワードを取得するように構成することもできる。これによって、デジタル放送受信装置100の開発時等に予め定めておいた情報を表示するように設計することができ、ネットワーク150上の不適切な情報をフィルタリングする必要がなくなる。また、ネットワーク接続やデータ送受信に要する処理を省くことができ、処理負荷及び処理時間を削減することができる。
実施の形態2.
図8は、実施の形態2に係るデジタル放送受信装置200の構成を概略的に示すブロック図である。デジタル放送受信装置200は、チューナ部101と、UI部102と、通信部103と、制御部210と、インターフェース部(以下、IF部という)220とを備える。実施の形態2に係るデジタル放送受信装置200は、IF部220をさらに備える点、及び、制御部210での処理の点において、実施の形態1に係るデジタル放送受信装置100と異なっている。
図8は、実施の形態2に係るデジタル放送受信装置200の構成を概略的に示すブロック図である。デジタル放送受信装置200は、チューナ部101と、UI部102と、通信部103と、制御部210と、インターフェース部(以下、IF部という)220とを備える。実施の形態2に係るデジタル放送受信装置200は、IF部220をさらに備える点、及び、制御部210での処理の点において、実施の形態1に係るデジタル放送受信装置100と異なっている。
IF部220は、デジタル放送受信装置200に他の装置を接続するためのインターフェースである。実施の形態2においては、IF部220を介して、録画及び再生の処理を行う録画再生装置231が、デジタル放送受信装置200に接続されている。録画再生装置231は、IF部220を介して、映像及び音声の少なくとも何れか一方と文字データとを含む番組データをメイン処理部211に与える。
制御部210は、メイン処理部211と、UI制御部112と、視聴処理部213と、文字データ取得部214と、文字データ連結部115と、文字データ抽出部116と、キーワード抽出制御部117と、キーワードリスト作成部118と、情報取得処理部119とを備える。実施の形態2における制御部210は、メイン処理部211、視聴処理部213及び文字データ取得部214での処理において、実施の形態1における制御部110と異なっている。
メイン処理部211は、実施の形態1におけるメイン処理部111と同様の処理を行う他、IF部220を介して入力された番組データの処理を制御する。例えば、メイン処理部211は、IF部220から受け取った番組データを視聴処理部113に与えて、視聴処理部113に映像信号及び音声信号を生成させる。そして、メイン処理部211は、生成された映像信号及び音声信号を、UI制御部112を介して、UI部102に与える。
視聴処理部213は、実施の形態1における視聴処理部113と同様の処理を行う他、IF部220を介して入力された番組データをメイン処理部211から受け取り、このコンテンツデータから映像信号及び音声信号を生成する。
視聴処理部213は、実施の形態1における視聴処理部113と同様の処理を行う他、IF部220を介して入力された番組データをメイン処理部211から受け取り、このコンテンツデータから映像信号及び音声信号を生成する。
文字データ取得部214は、実施の形態1における文字データ取得部114と同様の処理を行う他、IF部220を介して入力された番組データから字幕及びテロップ等の文字データを取得する。そして、文字データ取得部214は、取得した文字データを文字データ連結部115に与える。
実施の形態2に係るデジタル放送受信装置200が、取得された文字データからキーワードを抽出する際の処理の流れは、実施の形態1に係るデジタル放送受信装置100と同様である。言い換えると、実施の形態2に係るデジタル放送受信装置200は、実施の形態1と異なり、文字データ取得部214が録画再生装置231に予め録画された番組の番組データから文字データを取得し、取得された文字データを文字データ連結部115に与える。
以上のように構成することで、実施の形態2に係るデジタル放送受信装置200は、実施の形態1に係るデジタル放送受信装置100のようにチューナ部101で受信した現在放送中の番組に限らず、録画された番組に対してもキーワード抽出を行えるようになる。これによって、実施の形態2に係るデジタル放送受信装置200は、より多くの番組に対してもキーワード抽出を行えるようになり、ユーザは、現在放送中の番組か録画番組かを意識することなく、キーワードを抽出させることができる。
なお、実施の形態2においては、録画再生装置231が、デジタル放送受信装置200の外部に存在し、デジタル放送受信装置200に接続されているが、このような例に限定されるものではない。例えば、デジタル放送受信装置200内に、録画再生装置231と同様の機能を発揮する機能部が備えられていてもよい。これにより、ユーザは、録画再生装置231の接続場所に影響されることなく、キーワードの抽出を実行させることができる。
なお、実施の形態2に係るデジタル放送受信装置200は、録画再生装置231から取得された番組データからキーワード抽出をする処理と同様の処理を、ネットワーク150上の動画配信サーバ141から配信される番組データに対して行うこともできる。この場合、番組データは、通信部103を介してメイン処理部211に与えられる。このようにすることで、ユーザは、更に多くの番組データに対してキーワードを抽出させることができる。
実施の形態3.
図9は、実施の形態3に係るデジタル放送受信装置300の構成を概略的に示すブロック図である。デジタル放送受信装置300は、チューナ部101と、UI部102と、通信部103と、制御部310とを備える。実施の形態3に係るデジタル放送受信装置300は、制御部310での処理において、実施の形態1に係るデジタル放送受信装置100と異なっている。
図9は、実施の形態3に係るデジタル放送受信装置300の構成を概略的に示すブロック図である。デジタル放送受信装置300は、チューナ部101と、UI部102と、通信部103と、制御部310とを備える。実施の形態3に係るデジタル放送受信装置300は、制御部310での処理において、実施の形態1に係るデジタル放送受信装置100と異なっている。
制御部310は、メイン処理部111と、UI制御部112と、視聴処理部113と、文字データ取得部114と、文字データ連結部115と、文字データ抽出部116と、キーワード抽出制御部317と、キーワードリスト作成部118と、情報取得処理部119と、キーワード抽出部321とを備える。実施の形態3における制御部310は、キーワード抽出制御部317での処理の点、及び、キーワード抽出部321がさらに備えられている点において、実施の形態1における制御部110と異なっている。
キーワード抽出制御部317は、文字データ抽出部116から与えられたキーワード抽出対象文字データからキーワードを抽出する処理を行う。例えば、キーワード抽出制御部317は、文字データ抽出部116から与えられたキーワード抽出対象文字データをキーワード抽出部321に与えて、キーワード抽出部321にキーワードの判定を行わせる。そして、キーワード抽出制御部317は、キーワード抽出部321より、与えられたキーワード抽出対象文字データから判定されたキーワードを示すキーワード情報を受け取る。キーワード抽出制御部317は、このようなキーワード情報をキーワードリスト作成部118に与える。
キーワード抽出部321は、キーワード抽出制御部317より与えられたキーワード抽出対象文字データからキーワードを判定し、判定されたキーワードを示すキーワード情報を生成する。そして、キーワード抽出部321は、生成されたキーワード情報をキーワード抽出制御部317に与える。
図10は、キーワード抽出部321が、文字データ抽出部116からキーワード判定開始の通知を受けた場合の処理を示すフローチャートである。
キーワード抽出部321は、キーワード抽出制御部317からキーワード判定開始の通知を受け取ると(S80)、キーワード抽出制御部317からキーワード抽出対象文字データを受け取る(S81)。
キーワード抽出部321は、受け取ったキーワード抽出対象文字データから、形態素解析等の方法で単語を分解する(S82)。
キーワード抽出部321は、分解された各単語に基づいてキーワードを判定する(S83)。例えば、キーワード抽出部321は、分解された単語の分類が、場所又は人名等の予め定められた分類である場合に、このような単語をキーワードと判定する。
キーワード抽出部321は、キーワードと判定した単語を示すキーワード情報を生成し、このキーワード情報をキーワード抽出制御部317に与える(S84)。
このように構成することで、実施の形態3に係るデジタル放送受信装置300は、実施の形態1又は2のようにキーワード抽出サーバ140の基準でキーワードが決定されるのではなく、自装置の設定によってキーワードを定めることができる。更に、キーワード抽出のためにインターネットに接続する必要がなくなる。
そのため、ユーザ個々人で欲しいと思うキーワードの分類(場所、人名等)が違う場合にも、ユーザ毎にどのような語をキーワードとするのかを定めることができる。従って、実施の形態3に係るデジタル放送受信装置300によれば、そのユーザに合ったキーワードの抽出が簡単にできる。また、実施の形態3に係るデジタル放送受信装置300は、実施の形態1又は2と異なり、キーワードを抽出する際にネットワーク150に接続する必要がないため、ネットワーク接続及びデータ送受信に要する処理を省くことができ、処理負荷や処理時間を削減することができる。
そのため、ユーザ個々人で欲しいと思うキーワードの分類(場所、人名等)が違う場合にも、ユーザ毎にどのような語をキーワードとするのかを定めることができる。従って、実施の形態3に係るデジタル放送受信装置300によれば、そのユーザに合ったキーワードの抽出が簡単にできる。また、実施の形態3に係るデジタル放送受信装置300は、実施の形態1又は2と異なり、キーワードを抽出する際にネットワーク150に接続する必要がないため、ネットワーク接続及びデータ送受信に要する処理を省くことができ、処理負荷や処理時間を削減することができる。
上記では、キーワード抽出部321は、各単語の分類(場所、人名等)からキーワードを判定したが、各単語の出現頻度が高いものをキーワードと判定する等、その他の方法でキーワードを判定してもよい。
100,200,300:デジタル放送受信装置、 101:チューナ部、 102:UI部、 103:通信部、 110,210,310:制御部、 111,211:メイン処理部、 112:UI制御部、 113,213:視聴処理部、 114,214:文字データ取得部、 115:文字データ連結部、 116:文字データ抽出部、 117,317:キーワード抽出制御部、 118:キーワードリスト作成部、 119:情報取得処理部、 220:IF部、 321:キーワード抽出部、 150:ネットワーク、 140:キーワード抽出サーバ、 141:動画配信サーバ、 142:Webサーバ。
Claims (13)
- 番組データから文字データを順次取得する文字データ取得部と、
前記文字データ取得部で取得された文字データを含み、かつ、当該含まれている文字データの連結順が分かるようにされた検索対象文字データを生成する文字データ連結部と、
前記文字データ連結部で生成された検索対象文字データから語頭を検出して、前記文字データ連結部で生成された検索対象文字データの先頭の文字から当該検出された語頭の前の文字までの文字データを、キーワード抽出対象文字データとして抽出する文字データ抽出部と、を備えること
を特徴とするデジタル放送受信装置。 - 番組データから文字データを順次取得する文字データ取得部と、
前記文字データ取得部で取得された文字データを含み、かつ、当該含まれている文字データの連結順が分かるようにされた検索対象文字データを生成する文字データ連結部と、
前記文字データ連結部で生成された検索対象文字データから語頭又は所定の記号を検出して、前記文字データ連結部で生成された検索対象文字データの先頭の文字から当該検出された語頭の前の文字までの文字データ、又は、前記文字データ連結部で生成された検索対象文字データの先頭の文字から当該検出された所定の記号までの文字データを、キーワード抽出対象文字データとして抽出する文字データ抽出部と、を備えること
を特徴とするデジタル放送受信装置。 - 前記文字データ抽出部は、前記文字データ連結部で生成された検索対象文字データにおいて、文字体系の変化が検出された場合に、前記語頭が検出されたと判断すること
を特徴とする請求項1又は2に記載のデジタル放送受信装置。 - 前記文字データ抽出部により抽出されたキーワード抽出対象文字データからキーワードを抽出する処理を制御するキーワード抽出制御部をさらに備えること
を特徴とする請求項1から3の何れか一項に記載のデジタル放送受信装置。 - ネットワークに接続する通信部をさらに備え、
前記キーワード抽出制御部は、前記通信部を介して、前記ネットワークに接続されているキーワード抽出サーバに、前記文字データ抽出部により抽出されたキーワード抽出対象文字データを送り、その応答として、前記通信部を介して、当該送られたキーワード抽出対象文字データから抽出されたキーワードを示すキーワード情報を取得すること
を特徴とする請求項4に記載のデジタル放送受信装置。 - キーワードを抽出するキーワード抽出部をさらに備え、
前記キーワード抽出制御部は、前記キーワード抽出部に、前記文字データ抽出部により抽出されたキーワード抽出対象文字データから前記キーワードを抽出させること
を特徴とする請求項4に記載のデジタル放送受信装置。 - 前記キーワード抽出部は、前記文字データ抽出部により抽出されたキーワード抽出対象文字データを、形態素解析により単語に分割し、当該分割された単語が前記キーワードであるか否かを判定することで、前記キーワードを抽出すること
を特徴とする請求項6に記載のデジタル放送受信装置。 - 前記キーワード抽出部は、前記分割された単語が予め定められた分類に含まれるか否かを判断し、当該予め定められた分類に含まれると判断された単語を前記キーワードと判定すること
を特徴とする請求項7に記載のデジタル放送受信装置。 - 前記キーワード抽出制御部による制御で抽出されたキーワードを含むキーワードリスト画面を作成するキーワードリスト作成部と、
前記キーワードリスト作成部により作成されたキーワードリスト画面を表示して、当該表示されたキーワード画面に含まれているキーワードから、選択するキーワードの入力を受け付けるユーザインタフェース部と、
前記ユーザインタフェース部を介して選択されたキーワードに関連する情報を取得する情報取得処理部と、をさらに備えること
を特徴とする請求項1から8の何れか一項に記載のデジタル放送受信装置。 - 放送信号を受信し、当該放送信号を復調して前記番組データを生成するチューナ部をさらに備えること
を特徴とする請求項1から9の何れか一項に記載のデジタル放送受信装置。 - 録画再生装置から前記番組データを取得するインターフェース部をさらに備えること
を特徴とする請求項1から9の何れか一項に記載のデジタル放送受信装置。 - 番組データから文字データを順次取得する文字データ取得過程と、
前記文字データ取得過程で取得された文字データを含み、かつ、当該含まれている文字データの連結順が分かるようにされた検索対象文字データを生成する文字データ連結過程と、
前記文字データ連結過程で生成された検索対象文字データから語頭を検出して、前記文字データ連結過程で生成された検索対象文字データの先頭の文字から当該検出された語頭の前の文字までの文字データを、キーワード抽出対象文字データとして抽出する文字データ抽出過程と、を備えること
を特徴とするデータ処理方法。 - 番組データから文字データを順次取得する文字データ取得過程と、
前記文字データ取得過程で取得された文字データを含み、かつ、当該含まれている文字データの連結順が分かるようにされた検索対象文字データを生成する文字データ連結過程と、
前記文字データ連結過程で生成された検索対象文字データから語頭又は所定の記号を検出して、前記文字データ連結過程で生成された検索対象文字データの先頭の文字から当該検出された語頭の前の文字までの文字データ、又は、前記文字データ連結過程で生成された検索対象文字データの先頭の文字から当該検出された所定の記号までの文字データを、キーワード抽出対象文字データとして抽出する文字データ抽出過程と、を備えること
を特徴とするデータ処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012116658A JP2013243597A (ja) | 2012-05-22 | 2012-05-22 | デジタル放送受信装置及びデータ処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012116658A JP2013243597A (ja) | 2012-05-22 | 2012-05-22 | デジタル放送受信装置及びデータ処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013243597A true JP2013243597A (ja) | 2013-12-05 |
Family
ID=49844060
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012116658A Pending JP2013243597A (ja) | 2012-05-22 | 2012-05-22 | デジタル放送受信装置及びデータ処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2013243597A (ja) |
-
2012
- 2012-05-22 JP JP2012116658A patent/JP2013243597A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3953886B2 (ja) | 字幕抽出装置 | |
US20170263265A1 (en) | Conference support apparatus, conference support method, and computer program product | |
CN102280104B (zh) | 一种基于智能标引的文件语音化处理方法和系统 | |
US8130320B2 (en) | Method and system for identifying addressing data within a television presentation | |
JP2003333445A5 (ja) | 字幕抽出装置及びシステム | |
CN104796584A (zh) | 具有语音识别功能的提词装置 | |
JP2002112186A (ja) | 電子番組ガイド受信装置 | |
JP6601944B2 (ja) | コンテンツ生成装置およびプログラム | |
US10891489B2 (en) | Identifying and tracking words in a video recording of captioning session | |
JPWO2014103568A1 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2009239729A (ja) | コンテンツのシーン出現を通知する装置、方法およびプログラム | |
US9008492B2 (en) | Image processing apparatus method and computer program product | |
JPWO2015033500A1 (ja) | 映像受信装置、映像認識方法および付加情報表示システム | |
US20130163948A1 (en) | Video playback apparatus and video playback method | |
WO2015033501A1 (ja) | 映像受信装置、映像認識方法および付加情報表示システム | |
JP2013016030A (ja) | 番組再生装置および番組再生方法 | |
JP2008046729A (ja) | 動画像話題分割装置 | |
US8863193B2 (en) | Information processing apparatus, broadcast receiving apparatus and information processing method | |
JP2006319680A (ja) | テレビシステム、携帯端末、tvチューナー、携帯端末で動作するプログラム、及びtvチューナーで動作するプログラム | |
JP2013243597A (ja) | デジタル放送受信装置及びデータ処理方法 | |
CA2469645A1 (en) | Method and apparatus for displaying definitions of selected words in a television program | |
CN104602099A (zh) | 一种字幕显示的方法及装置 | |
JP2004343352A (ja) | 電子機器装置及びテロップ情報処理方法 | |
JPH08205043A (ja) | 映像監視機能付きテレビ受像機 | |
JP2004253923A (ja) | 情報受信装置 |