JP4784450B2 - 情報処理装置、情報処理方法、およびプログラム - Google Patents

情報処理装置、情報処理方法、およびプログラム Download PDF

Info

Publication number
JP4784450B2
JP4784450B2 JP2006246146A JP2006246146A JP4784450B2 JP 4784450 B2 JP4784450 B2 JP 4784450B2 JP 2006246146 A JP2006246146 A JP 2006246146A JP 2006246146 A JP2006246146 A JP 2006246146A JP 4784450 B2 JP4784450 B2 JP 4784450B2
Authority
JP
Japan
Prior art keywords
recording reservation
content
name
reservation information
program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006246146A
Other languages
English (en)
Other versions
JP2008067332A (ja
Inventor
賢司 花川
顕介 大沼
英樹 浅津
健史 北山
一仁 住吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2006246146A priority Critical patent/JP4784450B2/ja
Publication of JP2008067332A publication Critical patent/JP2008067332A/ja
Application granted granted Critical
Publication of JP4784450B2 publication Critical patent/JP4784450B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、情報処理装置、情報処理方法、およびプログラムに関し、例えば、設定済みの録画予約情報に基づき、当該録画予約情報に対応する番組と同じ番組を検出するようにした情報処理装置、情報処理方法、およびプログラムに関する。
テレビジョン番組を録画する従来のビデオレコーダには、設定された録画予約に従って録画を自動的に実行する機能が備えられている。この録画予約は、ユーザが指定した日時や放送チャンネルに基づいて設定される他、ユーザが指定した条件に合致する番組が自動的に検索されて録画予約が設定されるものもある。
例えば特許文献1には、録画予約済みの番組の番組名とEPG(Electronic Program Guide)データ上の番組名とを比較することにより、録画予約された番組と同じシリーズに属する番組を検出し、検出した番組の録画予約を自動的に設定する技術が公開されている。
また例えば特許文献2には、録画予約済みの番組の番組名と、随時更新される最新のEPGデータ上の番組名とを比較することにより、録画予約済みの番組の放送時刻の突然の変更を検知して、放送時刻の変更に対応して録画予約を更新する技術が公開されている。
特開2002−27416号公報 特開2006−50302号公報
ところで、一般にEPGデータ上の番組名は、修飾語が付加されて冗長となっていたり、反対に略記されたりすることがある。
したがって、上述した特許文献1および2に記載の技術のいずれにおいても、録画予約済みの番組の番組名とEPGデータ上の番組名とを比較しているが、特許文献1に記載の技術の場合、録画予約済みの番組の番組名とEPGデータ上の番組名が完全一致することに基づいて同一シリーズに属する番組であるか否かを判断しているので、録画予約またはEPGデータのいずれか一方において番組名が略記されたり修飾語が付与されたりして両者の番組名に表記揺れがある場合、該当する番組を適切に検出することができなかった。
特許文献2に記載の技術の場合、録画予約済みの番組の番組名とEPGデータ上の番組名のそれぞれを所定のアルゴリズムに基づいて縮約した後、両者の類似度をLCS(Longest Common Subsequence)に基づいて算出し、算出した類似度を所定の閾値と比較することによって、録画予約済みの番組に対応するEPGデータの番組情報を特定していた。
特許文献2においては、録画予約済みの番組の放送時刻の変更を検知することが目的であり、EPGデータの検索範囲もある程度限定されるので上述した方法によって目的を達成できる。しかしながら、特許文献1の目的と同様に、録画予約済みの番組と同一のシリーズに属する番組を検出することに特許文献2の技術を適用した場合、単に番組名が類似しているだけの無関係の番組を過度に検出してしまうことが考えられる。
本発明はこのような状況に鑑みてなされたものであり、記録予約済みのコンテンツと同一のシリーズに属するコンテンツをその名称に基づいて適切に検索できるようにするものである。
本発明の一側面である情報処理装置は、検索条件に合致するコンテンツを検索する情報処理装置において、ユーザの操作に基づいて設定されたコンテンツの記録予約の内容を示す指定記録予約情報を管理する管理手段と、検索対象となる複数のコンテンツにそれぞれ対応する複数の属性情報を取得する取得手段と、前記指定記録予約情報から前記コンテンツの名称を取得するとともに、前記属性情報からコンテンツの名称を取得し、前記指定記録予約情報から取得した前記名称と、前記属性情報から取得した前記名称との類似度を演算する類似度演算手段と、前記指定記録予約情報から前記コンテンツの名称を取得し、取得した前記名称に基づいて閾値を算出する閾値算出手段と、前記類似度と前記閾値とを比較した結果に基づき、前記指定記録予約情報に対応するコンテンツとに関連するコンテンツを検出する検出手段とを含む。
本発明の一側面である情報処理装置は、前記検出手段によって検出された、前記指定記録予約情報に対応するコンテンツと同じシリーズに属する前記コンテンツを記録するように、前記指定記録予約情報を更新する更新手段をさらに含むことができる。
前記類似度演算手段は、前記指定記録予約情報および前記属性情報から取得した名称をそれぞれ縮約し、縮約した名称間のLCSに基づいて前記類似度を演算するようにすることができる。
前記類似度演算手段は、前記指定記録予約情報および前記属性情報から取得した名称をそれぞれ縮約し、縮約した名称間のLCS長の2乗和を前記類似度として演算するようにすることができる。
前記閾値算出手段は、前記指定記録予約情報から取得した前記名称を縮約し、縮約した名称をタイトル文字列に分離し、複数の前記タイトル文字列のうちの1つを基準文字列に指定して、前記基準文字列の文字数に基づいて前記閾値を算出するようにすることができる。
前記閾値算出手段は、前記基準文字列に高頻度文字列が含まれている場合、算出した前記閾値を補正するようにすることができる。
本発明の一側面である情報処理方法は、検索条件に合致するコンテンツを検索する情報処理装置の情報処理方法において、ユーザの操作に基づいて設定されたコンテンツの記録予約の内容を示す指定記録予約情報を管理する管理ステップと、検索対象となる複数のコンテンツにそれぞれ対応する複数の属性情報を取得する取得ステップと、前記指定記録予約情報から前記コンテンツの名称を取得するとともに、前記属性情報からコンテンツの名称を取得し、前記指定記録予約情報から取得した前記名称と、前記属性情報から取得した前記名称との類似度を演算する類似度演算ステップと、前記指定記録予約情報から前記コンテンツの名称を取得し、取得した前記名称に基づいて閾値を算出する閾値算出ステップと、前記類似度と前記閾値とを比較した結果に基づき、前記指定記録予約情報に対応するコンテンツとに関連するコンテンツを検出する検出ステップとを含む。
本発明の一側面であるプログラムは、検索条件に合致するコンテンツを検索する情報処理装置の制御用のプログラムであって、ユーザの操作に基づいて設定されたコンテンツの記録予約の内容を示す指定記録予約情報を管理する管理ステップと、検索対象となる複数のコンテンツにそれぞれ対応する複数の属性情報を取得する取得ステップと、前記指定記録予約情報から前記コンテンツの名称を取得するとともに、前記属性情報からコンテンツの名称を取得し、前記指定記録予約情報から取得した前記名称と、前記属性情報から取得した前記名称との類似度を演算する類似度演算ステップと、前記指定記録予約情報から前記コンテンツの名称を取得し、取得した前記名称に基づいて閾値を算出する閾値算出ステップと、前記類似度と前記閾値とを比較した結果に基づき、前記指定記録予約情報に対応するコンテンツとに関連するコンテンツを検出する検出ステップとを含む処理をコンピュータに実行させる。
本発明の一側面においては、検索対象となる複数のコンテンツにそれぞれ対応する複数の属性情報が取得され、指定記録予約情報からコンテンツの名称が取得されるとともに、属性情報からコンテンツの名称が取得され、指定記録予約情報から取得された名称と、属性情報から取得された名称との類似度が演算される。また、指定記録予約情報から取得された名称に基づいて閾値が算出され、類似度と閾値とを比較した結果に基づき、指定記録予約情報に対応するコンテンツとに関連するコンテンツが検出される。
本発明の一側面によれば、記録予約済みのコンテンツと同一のシリーズに属するコンテンツをその名称に基づいて適切に検索することが可能となる。
以下に本発明の実施の形態を説明するが、本発明の構成要件と、明細書または図面に記載の実施の形態との対応関係を例示すると、次のようになる。この記載は、本発明をサポートする実施の形態が、明細書または図面に記載されていることを確認するためのものである。従って、明細書または図面中には記載されているが、本発明の構成要件に対応する実施の形態として、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その構成要件に対応するものではないことを意味するものではない。逆に、実施の形態が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。
本発明の一側面である情報処理装置(例えば、図1の記録装置1)は、検索条件に合致するコンテンツを検索する情報処理装置において、ユーザの操作に基づいて設定されたコンテンツの記録予約の内容を示す指定記録予約情報を管理する管理手段(例えば、図3の録画予約情報生成管理部32)と、検索対象となる複数のコンテンツにそれぞれ対応する複数の属性情報を取得する取得手段(例えば、図3のEPGデータ取得部31)と、前記指定記録予約情報から前記コンテンツの名称を取得するとともに、前記属性情報からコンテンツの名称を取得し、前記指定記録予約情報から取得した前記名称と、前記属性情報から取得した前記名称との類似度を演算する類似度演算手段(例えば、図3の類似度演算部35)と、前記指定記録予約情報から前記コンテンツの名称を取得し、取得した前記名称に基づいて閾値を算出する閾値算出手段(例えば、図3の閾値決定部36)と、前記類似度と前記閾値とを比較した結果に基づき、前記指定記録予約情報に対応するコンテンツとに関連するコンテンツを検出する検出手段(例えば、図3のシリーズ番組判定部37)とを含む。
本発明の一側面である情報処理装置は、前記検出手段によって検出された、前記指定記録予約情報に対応するコンテンツと同じシリーズに属する前記コンテンツを記録するように、前記指定記録予約情報を更新する更新手段(例えば、図3の録画予約情報変更部38)をさらに含むことができる。
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。
図1は、本発明の一実施の形態である記録装置の使用環境を示している。この記録装置1は、アンテナ2を介してテレビジョン放送信号を受信し、テレビジョン放送番組を録画したり、インタネットに代表されるネットワーク4を介して所定のサーバから映像、音声などのAVデータやプログラムを取得して記録したりし、さらに、録画した番組や記録したAVデータなどを再生し、その結果得られる映像信号および音声信号をテレビジョン受像機などからなるモニタ5に出力して、対応する画面を表示させたり、音声を出力させたりするものである。
なお、例えばCATV網のケーブルを介して入力されるテレビジョン放送信号を受信して録画することも可能である。以下、テレビジョン放送番組の録画について言及するが、ネットワーク4を介して取得するAVデータについても、テレビジョン放送番組と同様の処理を実行できるものとする。
本明細書においては、録画されるテレビジョン番組の映像および音声信号、記録されるAVデータ、静止画データ、音声データ、プログラムデータなどをコンテンツと称し、EPGデータに含まれる番組情報のようにコンテンツに関する情報を属性情報と定義する。
この記録装置1は、予め設定されている録画予約に従って自動的に録画を行う他、既に録画予約されている番組と同じシリーズに属する番組(番組名が類似している番組)を検索し、検索した番組の録画予約を自動的に設定することができる。
次に、記録装置1の構成例について、図2のブロック図を参照して説明する。
記録装置1は、記録装置1の全体を制御するCPU11、バス12を介してCPU11に接続されたROM13、筐体側面などに設けられたボタン、スイッチ、リモートコントローラとそのレシーバなどからなる操作入力部14、ハードディスクドライブ、着脱可能な半導体メモリ、DVD-Rなどのディスク媒体などからなる記憶部15、テレビジョン放送信号を受信するチューナ16、受信された番組の映像信号および音声信号をAV符号化データに符号化するエンコーダ17、AV符号化データを復号するデコーダ18、デコード結果の映像信号および音声信号をモニタ5に出力する出力部19、および、Ethernet(登録商標)、i.LINK(商標)、USBなどを介して外部機器やネットワーク4と接続するネットワークI/F(インタフェース)20から構成される。
CPU11は、ROM13に保持されているプログラムを実行することにより、図3に示す各機能ブロック(詳細は後述する)を実現し、各機能ブロックが相互に作用して、録画予約の設定や、番組の検索、録画予約に基づく録画などを実行する。
操作入力部14には、例えばモニタ5に表示される画面上において、カーソルを移動させて選択対象を指示するときに操作されるカーソルボタン、決定操作を行うときに操作される決定ボタンなど(いずれも不図示)が含まれる。
記憶部15には、録画された番組のAV符号化データ、設定された録画予約の内容を示す録画予約情報、取得されたEPG(Electronic Program Guide)データから取得される各番組の番組情報などが記録される。
チューナ16は、アンテナあるいはCATV網などを介して入力されるテレビジョン放送信号から、録画する番組の映像信号および音声信号を抽出してエンコーダ17に出力する。また、チューナ16は、テレビジョン放送信号からEPGデータを抽出し、バス12を介して記憶部15に出力する。なお、例えばインタネット上の所定のサーバでEPGデータを配信している場合、そのサーバからEPGデータを取得するようにしてもよい。
エンコーダ17は、チューナ16から入力される番組の映像信号および音声信号を、例えばMPEG2方式やH.246/AVC方式などの符号化方式を用いて符号化し、符号化結果のAV符号化データを、バス12を介して記憶部15に出力する。デコーダ18は、記憶部15から読み出されてバス12を介して入力されるAV符号化データを復号し、復号結果の映像信号および音声信号を出力部19に出力する。なお、エンコーダ17およびデコーダ18は、ソフトウェアにより実現するようにしてもよい。
また、例えば地上デジタル放送やBSデジタル放送などのようにテレビジョン放送信号が既に符号化されている場合、符号化された状態で録画するようにしてもよいし、デコーダ18により復号した後、エンコーダ17により再度符号化して録画するようにしてもよい。
出力部19は、映像信号および音声信号をモニタ5に適したフォーマットに変換して出力する。ネットワークI/F20は、ネットワーク4を介して所定のサーバに接続し、AVデータなどを取得する他、そのAVデータの配信スケジュール情報(テレビジョン番組のEPGデータに相当する)やそのAVデータに関する情報(テレビジョン番組の番組情報に相当する)などを取得する。
図3は、CPU11がプログラムを実行することにより実現する機能ブロックの構成例を示している。なお、図示する各部は、それぞれ異なるプログラムによって実現してもよいし、単一のプログラムによって実現してもよい。また、ハードウェアとして実現してもよい。
EPGデータ取得部31は、テレビジョン放送信号あるいは所定のサーバからEPGデータを取得する処理を制御するとともに、取得したEPGデータを流動編成監視部34および類似度演算部35に供給する。なお、EPGデータには、各番組の番組情報が含まれているものとする。
番組情報には、番組名、放送開始時刻および終了時刻チャンネル情報、ジャンル情報、番組詳細情報、拡張番組詳細情報、番組を識別するためのイベントID、イベントリレー実行情報、イベントリレー先情報などが含まれている。
録画予約情報生成管理部32は、例えば、モニタ5に電子番組表を表示させ、その電子番組表に対するユーザの操作に対応して録画予約を設定し、その内容を示す録画予約情報を生成して記憶部15に記憶させて管理する。
録画予約情報には、番組名、放送開始時刻および終了時刻、放送チャンネル、放送終了時刻後の録画時間の延長量を示す終了時刻延長量、この録画予約情報に基づいて新たな録画予約情報を生成させるための繰り返し録画情報、録画先メディア、同じ時刻に複数の録画予約が重複したときに参照される優先度、画質を示す録画モードなどの各項目に対応する設定値が含まれている。
録画予約情報に含まれる繰り返し録画情報の項目では、毎日同じ時刻に同じチャンネルの録画を行う設定(設定値を「毎日」と称する)、毎週同じ曜日の同じ時刻に同じチャンネルの録画を行う設定(設定値を「毎週」と称する)、または、同じシリーズに属する番組を検索して録画する設定(設定値を「シリーズ」と称する)が可能である。本願発明は、繰り返し録画情報の項目が「シリーズ」に設定されている場合に関するものである。
録画予約情報生成管理部32はまた、流動編成監視部34からの通知に対応し、録画予約情報のうち、繰り返し録画情報の項目が「シリーズ」に設定されているものを類似度演算部35および閾値決定部36に出力する。
予約録画実行部33は、録画予約情報生成管理部32によって管理される録画予約情報に基づき、チューナ16、エンコーダ17、および記憶部15を制御して、対応する番組の録画を実行させる。
流動編成監視部34は、EPGデータ取得部31から供給されたEPGデータを監視することにより、新たなEPGデータの取得やEPGデータの内容変更(放送時刻の変更など)を検出して検出結果を録画予約情報生成管理部32に通知する。
類似度演算部35は、録画予約情報生成管理部32から入力される録画予約情報に含まれる番組名と、EPGデータに含まれる各番組情報の番組名との類似度を演算して、演算結果をシリーズ番組判定部37に通知する。
閾値決定部36は、録画予約情報生成管理部32から入力される録画予約情報に含まれる番組名に基づき、番組名の類似度に基づいてシリーズ番組であるか否かを判定するときの閾値を決定してシリーズ番組判定部37に通知する。
シリーズ番組判定部37は、類似度演算部35から入力される類似度と、閾値決定部36から通知される閾値を比較することによって、録画予約情報に対応する番組と同じシリーズに属する番組を判定し、判定結果を録画予約情報変更部38に通知する。
録画予約情報変更部38は、シリーズ番組判定部37から通知される判定結果を保持し、当該録画予約情報に対応する番組が録画された後、録画された番組と同じシリーズに属する番組を録画するように、録画予約情報生成管理部32によって管理されている、録画された番組の当該録画予約情報を更新する。
次に、設定済みの録画予約情報のうち、繰り返し録画情報の項目が「シリーズ」に設定されているものに対する処理(以下、シリーズ番組検索処理と称する)について、図4のフローチャートを参照して説明する。
このシリーズ番組検索処理は、例えば所定の間隔で周期的に実行したり、EPGデータが更新されたときに実行したり、あるいは、予約情報がユーザによって変更されたときに実行したりする。
ステップS1において、録画予約情報生成管理部32は、記憶部15に記憶されている設定済みの録画予約情報を全て取得する。ステップS2において、録画予約情報生成管理部32は、取得した全ての録画予約情報に注目したか否かを判定し、注目していない録画予約情報が残っている場合、処理をステップS3に進める。
ステップS3において、録画予約情報生成管理部32は、未注目の録画予約情報のうちの1つに注目し、ステップS4において、注目している録画予約情報の繰り返し録画情報の項目が「シリーズ」に設定されているか否かを判定する。ここで、繰り返し録画情報の項目が「シリーズ」に設定されていないと判定された場合、ステップS2に戻り、それ以降の処理が繰り返される。
ステップS4において、繰り返し録画情報の項目が「シリーズ」に設定されていると判定された場合、処理はステップS5に進められる。ステップS5において、録画予約情報生成管理部32は、注目している録画予約情報を類似度演算部35および閾値決定部36に出力する。類似度演算部35は、入力された録画予約情報のチャンネル情報を参照し、同じチャンネルの番組情報をEPGデータ取得部31から取得する。
ステップS6において、類似度演算部35は、録画予約情報から番組名を読み出し、番組にクリーニング処理を施して番組名を縮約する。以下、録画予約情報から読み出された番組名を「[デ]MHK興味津々□はじめるぞ!Theブログ2006第1回[ハイビジョン]スペシャル「きょうこそブログ」」(両端の「」は番組名の範囲を示しているので番組名には含まれない、以降においても同様とする)と仮定して以降の説明に用いる。ただし、番組名における「□」はスペースを意味するものとする。
番組名のクリーニング処理について、図5のフローチャートを参照して詳述する。
ステップS21において、サブタイトルを除去する。具体的には、デジタルEPGデータの場合、「」、『』、または()とこれらで囲まれた文字を除去する。アナログEPGデータの場合、「」とこれで囲まれた文字を除去する。ただし、番組名の先頭にある場合は除去しない。いまの場合、「「きょうこそブログ」」が除去される。
ステップS22において、シリーズ種を示す文字列を除去する。具体的には、新番組文字列「[新]、(新)、<新>、[新]」、編文字列「前編、中篇、後編」、最終回文字列「[終]、(終)、<終>、[終]」、スペシャル番組文字列「スペシャル、SPECIAL」などを除去する。いまの場合、「スペシャル」が除去される。
ステップS23において、今年および前年の年号を示す文字列が除去される。具体的には、例えば「2006、2006−9、06−9」などを除去する。いまの場合、「2006」が除去される。
ステップS24において、外字の文字列を除去する。具体的には、データ放送を示す[デ]、ステレオ放送を示す[ス]、再放送を示す[再]などのように、[]などの中に文字があって[]などを含めて1文字として扱われる文字を除去する。いまの場合、「[デ]」が除去される。
ステップS25において、放送属性を示す文字列を除去する。具体的には、「ハイビジョン、HI-VISION、レターボックスサイズ、アンコール放送、字幕スーパー、字幕、生中継、録画放送、<無料>、劇場版、再放送、新作、R-15指定、5.1サラウンド」などの文字列を除去する。いまの場合、「[ハイビジョン]」が除去される。
ステップS26において、放送局名を示す文字列を除去する。いまの場合、「MHK」が除去される。
ステップS27において、放送回数を示す文字列を除去する。具体的には、先頭文字「第、全」と末尾文字「話、回、週、節、部」に挟まれた数を、先頭文字と末尾文字とともに除去する。また、先頭文字「エピソード、Episode」に続く数を、先頭文字とともに除去する。いまの場合、「第1回」が除去される。
ステップS28において、番組内容に関わらない文字列を除去する。具体的には、「THE、VS、このあと、直前情報、SUPER」などの文字列を除去する。いまの場合、「The」が除去される。
ステップS29において、特殊記号文字を除去する。具体的には、「□(スペース)、?、!、〜、&」などの文字を除去する。いまの場合、「!」が除去される。以上でクリーニング処理は終了される。
このクリーニング処理により、当初の番組名「[デ]MHK興味津々□はじめるぞ!Theブログ2006第1回[ハイビジョン]スペシャル「きょうこそブログ」」は、「興味津々はじめるぞブログ」に縮約される。
図4に戻る。ステップS7において、類似度演算部35は、EPGデータ取得部31から取得した全ての番組情報からそれぞれ番組名を読み出し、読み出した番組名についてもクリーニング処理を施して縮約する。以下、番組情報から読み出した縮約済みの番組名として「趣味口座はじめてのプログラミング」を例に説明する。
ステップS8において、類似度演算部35は、録画予約情報から読み出して縮約した番組名と、各番組情報から読み出して縮約した番組名との類似を演算する。
具体的には、録画予約情報から読み出して縮約した番組名と、各番組情報から読み出して縮約した番組名とのLCS(Longest Common Subsequence)の長さに基づき、LCS長が長いものほど類似度が高くなるように演算が行われる。ここで、LCSとは、2つの番組タイトル間で1文字以上の文字列が同じ順序で出現した共通部分列をさす。
例えば、図6に示すように、録画予約情報から読み出して縮約した番組名「ABB」と、番組情報から読み出して縮約した番組名「AAB」とのLCS長を算出する場合、2つの番組名を対応付けるパターンは図示するように4通り存在する。
左側の第1のパターンでは、共通部分列Aと共通部分列Bが存在すると見なして、LCS長は2(=1+1)となる。その右隣の第2のパターンでも、共通部分列Aと共通部分列Bが存在すると見なして、LCS長は2(=1+1)となる。その右隣の第3のパターンでは、共通部分列ABが存在するとみなして、LCS長は2となる。その右隣の第4のパターンでは、共通部分列Aと共通部分列Bが存在すると見なして、LCS長は2(=1+1)となる。
類似度演算部35は、共通部分列が長いほど類似度が大きくなるように、類似度として共通部分列の長さの2乗和を採用することにする。以下、類似度を類似度LCS_sqとも記述する。この算出方法によれば、図7に示された、録画予約情報から読み出して縮約した番組名「興味津々はじめるぞブログ」と、番組情報から読み出して縮約した番組名「趣味口座はじめてのプログラミング」の共通部分列は「味」と「はじめ」と「ログ」であるので、類似度LCS_sqは14(=1+3+2)となる。
ただし、単に、類似度として共通部分列の長さの2乗和を採用してしまうと、番組タイトル中のどこを共通部分列と見なすかによって類似度の値が変換してしまうので、類似度が一意に定まるように、番組タイトルの先頭側の共通部分列が最長となるパターンを採用し、類似度LCS_sqを算出することにする。
あるいは、2つの番組名の共通部分列の組み合わせの全てのパターンについて、共通部分列の長さの2乗和を算出し、その最大値を当該2つの番組名の類似度LCS_sqとするようにしてもよい。以上で、類似度LCS_sqの演算方法の説明を終了する。
このようにして演算された、録画予約情報から読み出して縮約した番組名と、各番組情報から読み出して縮約した番組名との類似度LCS_sqは、類似度演算部35からシリーズ番組判定部37に通知される。
図4に戻る。ステップS9において、閾値決定部36は、注目されている録画予約情報から番組名に基づいて閾値を決定する。ステップS9の閾値決定処理について、図8のフローチャートを参照して詳述する。この閾値決定処理のうち、前半のステップS51乃至S58は、上述したクリーニング処理と同様である。
すなわち、ステップS51において、サブタイトルを除去し、ステップS52において、シリーズ種を示す文字列を除去し、ステップS53において、今年および前年の年号を示す文字列が除去し、ステップS54において、外字の文字列を除去する。さらに、ステップS55において、放送属性を示す文字列を除去し、ステップS56において、放送局名を示す文字列を除去し、ステップS57において、放送回数を示す文字列を除去し、ステップS58において、番組内容に関わらない文字列を除去する。
ステップS51乃至S58の処理により、当初の番組名「[デ]MHK興味津々□はじめるぞ!Theブログ2006第1回[ハイビジョン]スペシャル「きょうこそブログ」」は、「興味津々□はじめるぞ!ブログ」に縮約される。
ステップS59において、閾値決定部36は、残った文字列を切り出しルールに従ってタイトル文字列に分離する。切り出しルールとは、以下の(1)乃至(4)からなる。
(1)以下の区切り文字(’:・、。&?!<>−〜「」『』[]「」□(スペース))などで区切る。
(2)クリーニング処理により削除された文字の位置で区切る。
(3)全角スペース、または「.」の両側が英字である場合には区切らない。
(4)半角スペースの両側が英字ではない場合には区切る。
いまの場合、3つのタイトル文字列「興味津々□」、「はじめるぞ!」、「ブログ」に分離される。
ステップS60において、各タイトル文字列から特殊記号文字を除去する。いまの場合、3つのタイトル文字列は「興味津々」、「はじめるぞ」、「ブログ」となる。
ステップS61において、閾値決定部36は、タイトル文字列の中から1つを基準文字列に選択する。ステップS61の基準文字列選択処理について、図9のフローチャートを参照して詳述する。
ステップS71において、閾値決定部36は、分離したタイトル文字列の先頭側から2つのタイトル文字列を抽出する。いまの場合、タイトル文字列「興味津々」、および「はじめるぞ」が抽出される。ステップS72において、2つのタイトル文字列を抽出できたか否かを判定し、2つのタイトル文字列を抽出できた場合、処理をステップS73に進める。
いまの場合、2つのタイトル文字列を抽出できたので、処理はステップS73に進められる。これ以降、先頭側のタイトル文字列から順に第1のタイトル文字列、第2のタイトル文字列を称する。
ステップS73において、閾値決定部36は、第1のタイトル文字列と第2のタイトル文字列にそれぞれ高頻度文字列が含まれているか否かを判定する。高頻度文字列とは、番組名の中に高い頻度で用いられる比較的長い文字列であり、例えば「オープニングショー、チャンピオンシップ、バスケットボール、アメリカ大リーグ、FOOTBALL、ワールドカップ、チャンピオン、コレクション、セレクション、ショッピング、アフタヌーン、ダイジェスト、ステーション、ミュージック、プロジェクト、モンスター、モーニング、イブニング、ダイレクト、TOKYO、ハイライト、世界選手権、アメリカ、ワールド、Jリーグ」などを指す。
ステップS74において、閾値決定部36は、第1のタイトル文字列と第2のタイトル文字列にそれぞれ高頻度文字列が含まれているか否かの組み合わせに基づいて基準文字列を選択する。すなわち、第1および第2のタイトル文字列の両方に高頻度文字列が含まれている場合、文字数の少ない方を基準文字列に選択する。第1のタイトル文字列に高頻度文字列が含まれ、第2のタイトル文字列に高頻度文字列が含まれていない場合、第2のタイトル文字列を基準文字列に選択する。第2のタイトル文字列に高頻度文字列が含まれ、第1のタイトル文字列に高頻度文字列が含まれていない場合、第1のタイトル文字列を基準文字列に選択する。第1および第2のタイトル文字列の両方に高頻度文字列が含まれていない場合、文字数の少ない方を基準文字列に選択する。
いまの場合、第1のタイトル文字列「興味津々」、および第2のタイトル文字列「はじめるぞ」のいずれにも高頻度文字列は含まれていないので、文字数の少ない「興味津々」が基準文字列に選択される。
ステップS75において、閾値決定部36は、選択した基準文字列に高頻度文字列を含むか否かを示すフラグを付与して、この基準文字列選択処理を終了する。
なお、ステップS72において、2つのタイトル文字列を抽出できず、1つのタイトル文字列した抽出できなかった場合、処理はステップS76に進められ、そのタイトル文字列を基準文字列に決定して、高頻度文字列を含むか否かを判定する。この後、処理はステップS75に進められ、基準文字列に高頻度文字列がを含むか否かを示すフラグが付与される。
図8に戻る。ステップS62において、閾値決定部36は、基準文字列の文字数に基づいて閾値を演算する。具体的には、基準文字列の文字数が5文字未満である場合、閾値として基準文字列の文字数の2乗を演算する。基準文字列の文字数が5文字以上9文字以下である場合、閾値として基準文字列の文字数の90%の2乗を演算する。基準文字列の文字数が10文字以上である場合、閾値として基準文字列の文字数の70%の2乗を演算する。いまの場合、基準文字列「興味津々」は4文字であるので、16(=4)が閾値として演算される。
ステップS63において、閾値決定部36は、基準文字列に付与されているフラグを参照することにより、基準文字列に高頻度文字列が含まれているか否かを判定し、含まれていると判定した場合のみ、処理をステップS64に進めて、閾値を補正する。具体的には、含まれている高頻度文字列の文字数の2乗を閾値に加算する。いまの場合、基準文字列「興味津々」に高頻度文字列は含まれていないので、閾値=16は補正されない。
ステップS64において、閾値決定部36は、補正後の閾値(補正が必要なかった場合も含む)と、予め設定されている閾値の初期値(例えば13)を比較し、補正後の閾値が初期値よりも小さい場合のみ、処理をステップS66に進めて、閾値を初期値に変更する。いまの場合、閾値=16は初期値=13よりも大きいので変更されない。
以上説明した閾値決定処理によって決定された閾値は、閾値決定部36からシリーズ番組判定部37に通知される。
図4に戻る。ステップS10において、シリーズ番組判定部37は、類似度演算部35から通知された、録画予約情報から読み出して縮約した番組名と、各番組情報から読み出して縮約した番組名との類似度LCS_sqと、閾値決定部36から通知された閾値を比較して、類似度LCS_sqが閾値よりも大きい番組情報を特定する。ここで特定された番組情報対応する番組が、録画予約情報に対応する番組と同じシリーズに属する番組と判断される。
ステップS11において、シリーズ番組判定部37は、録画予約情報に対応する番組と同じシリーズに属する番組を示す検索結果を録画予約情報変更部38に通知する。録画予約情報変更部38は、シリーズ番組判定部37から通知された検索結果を保持する。
以上で注目されている録画予約情報は処理の対象から解除され、次の録画予約を注目するために、ステップS2に戻り、それ以降の処理が繰り返される。そして、ステップS2において、取得した全ての録画予約情報に注目したと判定された場合、このシリーズ番組検索処理は終了される。
なお、録画予約情報変更部38は、注目している録画予約情報に対応する番組が録画された後、検索結果の中で放送順序が速い番組から順に、その番組を録画するよう、録画予約情報生成管理部32によって管理されている、録画された番組の当該録画予約情報を更新することになる。
ただし、録画予約情報変更部38によって、録画予約情報を自動的に更新するのではなく、シリーズ番組に属するとして検索された番組をユーザに提示してユーザの指示を仰ぎ、ユーザによって選択されたものについてのみ、録画予約情報を更新したり、新たに生成したりするようにしてもよい。
以上で、シリーズ番組検索処理の説明を終了する。
このシリーズ番組検索処理によれば、ユーザが録画予約を設定した番組と同じシリーズに属すると判別される番組をEPGデータから検索して、自動的に録画予約したり、あるいは、検索結果をユーザに提示したりすることが可能となる。
なお、本発明に適用した類似度LCS_sqと閾値の演算手法は、例えば、録画済番組と同じシリーズに属すると判別される番組をEPGデータから検索したり、複数の録画済番組を同じシリーズに属するタイトル群にグループ分けしたりする場合にも適用することが可能である。
本明細書において、プログラムに基づいて実行されるステップは、記載された順序に従って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
本発明を適用した記録装置の使用環境を示す図である。 図1の記録装置の構成例を示すブロック図である。 図2のCPUによる機能ブロックを示す図である。 シリーズ番組検索処理を説明するフローチャートである。 クリーニング処理を説明するフローチャートである。 類似度の演算に関わるLCSを説明する図である。 類似度の演算の一例を示す図である。 閾値決定処理を説明するフローチャートである。 基準文字列選択処理を説明するフローチャートである。
符号の説明
1 記録装置, 11 CPU, 14 操作入力部, 15 記憶部, 16 チューナ, 17 エンコーダ, 18 デコーダ, 20 ネットワークI/F, 31 EPGデータ取得部, 32 録画予約情報生成管理部, 33 予約録画実行部, 34 流動編成監視部, 35 類似度演算部, 36 閾値決定部, 37 シリーズ番組判定部, 38 録画予約情報変更部

Claims (8)

  1. 検索条件に合致するコンテンツを検索する情報処理装置において、
    ユーザの操作に基づいて設定されたコンテンツの記録予約の内容を示す指定記録予約情報を管理する管理手段と、
    検索対象となる複数のコンテンツにそれぞれ対応する複数の属性情報を取得する取得手段と、
    前記指定記録予約情報から前記コンテンツの名称を取得するとともに、前記属性情報からコンテンツの名称を取得し、前記指定記録予約情報から取得した前記名称と、前記属性情報から取得した前記名称との類似度を演算する類似度演算手段と、
    前記指定記録予約情報から前記コンテンツの名称を取得し、取得した前記名称に基づいて閾値を算出する閾値算出手段と、
    前記類似度と前記閾値とを比較した結果に基づき、前記指定記録予約情報に対応するコンテンツとに関連するコンテンツを検出する検出手段と
    を含む情報処理装置。
  2. 前記検出手段によって検出された、前記指定記録予約情報に対応するコンテンツと同じシリーズに属する前記コンテンツを記録するように、前記指定記録予約情報を更新する更新手段を
    さらに含む請求項1に記載の情報処理装置。
  3. 前記類似度演算手段は、前記指定記録予約情報および前記属性情報から取得した名称をそれぞれ縮約し、縮約した名称間のLCS(Longest Common Subsequence)に基づいて前記類似度を演算する
    請求項1に記載の記録装置。
  4. 前記類似度演算手段は、前記指定記録予約情報および前記属性情報から取得した名称をそれぞれ縮約し、縮約した名称間のLCS長の2乗和を前記類似度として演算する
    請求項3に記載の記録装置。
  5. 前記閾値算出手段は、前記指定記録予約情報から取得した前記名称を縮約し、縮約した名称をタイトル文字列に分離し、複数の前記タイトル文字列のうちの1つを基準文字列に指定して、前記基準文字列の文字数に基づいて前記閾値を算出する
    請求項1に記載の記録装置。
  6. 前記閾値算出手段は、前記基準文字列に高頻度文字列が含まれている場合、算出した前記閾値を補正する
    請求項5に記載の記録装置。
  7. 検索条件に合致するコンテンツを検索する情報処理装置の情報処理方法において、
    ユーザの操作に基づいて設定されたコンテンツの記録予約の内容を示す指定記録予約情報を管理する管理ステップと、
    検索対象となる複数のコンテンツにそれぞれ対応する複数の属性情報を取得する取得ステップと、
    前記指定記録予約情報から前記コンテンツの名称を取得するとともに、前記属性情報からコンテンツの名称を取得し、前記指定記録予約情報から取得した前記名称と、前記属性情報から取得した前記名称との類似度を演算する類似度演算ステップと、
    前記指定記録予約情報から前記コンテンツの名称を取得し、取得した前記名称に基づいて閾値を算出する閾値算出ステップと、
    前記類似度と前記閾値とを比較した結果に基づき、前記指定記録予約情報に対応するコンテンツとに関連するコンテンツを検出する検出ステップと
    を含む情報処理方法。
  8. 検索条件に合致するコンテンツを検索する情報処理装置の制御用のプログラムであって、
    ユーザの操作に基づいて設定されたコンテンツの記録予約の内容を示す指定記録予約情報を管理する管理ステップと、
    検索対象となる複数のコンテンツにそれぞれ対応する複数の属性情報を取得する取得ステップと、
    前記指定記録予約情報から前記コンテンツの名称を取得するとともに、前記属性情報からコンテンツの名称を取得し、前記指定記録予約情報から取得した前記名称と、前記属性情報から取得した前記名称との類似度を演算する類似度演算ステップと、
    前記指定記録予約情報から前記コンテンツの名称を取得し、取得した前記名称に基づいて閾値を算出する閾値算出ステップと、
    前記類似度と前記閾値とを比較した結果に基づき、前記指定記録予約情報に対応するコンテンツとに関連するコンテンツを検出する検出ステップと
    を含む処理をコンピュータに実行させるプログラム。
JP2006246146A 2006-09-11 2006-09-11 情報処理装置、情報処理方法、およびプログラム Expired - Fee Related JP4784450B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006246146A JP4784450B2 (ja) 2006-09-11 2006-09-11 情報処理装置、情報処理方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006246146A JP4784450B2 (ja) 2006-09-11 2006-09-11 情報処理装置、情報処理方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2008067332A JP2008067332A (ja) 2008-03-21
JP4784450B2 true JP4784450B2 (ja) 2011-10-05

Family

ID=39289581

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006246146A Expired - Fee Related JP4784450B2 (ja) 2006-09-11 2006-09-11 情報処理装置、情報処理方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP4784450B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101769802B1 (ko) * 2010-02-19 2017-08-21 톰슨 라이센싱 매체 컨텐츠 보기를 위한 스마트 캐치-업
JP5434726B2 (ja) * 2010-03-19 2014-03-05 富士通株式会社 番組データ記憶装置、番組データ記憶方法、及びプログラム
JP2012151686A (ja) * 2011-01-19 2012-08-09 Sharp Corp 番組記録装置、テレビジョン受像機、番組記録装置の制御方法、制御プログラム、および、記録媒体
JP5318160B2 (ja) 2011-06-29 2013-10-16 株式会社ソニー・コンピュータエンタテインメント 情報処理装置および情報処理方法
JP5783886B2 (ja) * 2011-11-18 2015-09-24 三菱電機株式会社 番組予約装置及び番組処理方法
JP6340922B2 (ja) * 2014-06-02 2018-06-13 船井電機株式会社 録画装置および録画装置の番組予約方法
JP6209492B2 (ja) * 2014-06-11 2017-10-04 日本電信電話株式会社 イベント同一性判定方法、イベント同一性判定装置、イベント同一性判定プログラム
JP6575819B2 (ja) * 2016-03-31 2019-09-18 パナソニックIpマネジメント株式会社 録画再生装置
CN107155137B (zh) * 2017-05-10 2019-11-05 深圳市茁壮网络股份有限公司 视频处理方法及视频回看系统

Also Published As

Publication number Publication date
JP2008067332A (ja) 2008-03-21

Similar Documents

Publication Publication Date Title
JP4784450B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2006526337A (ja) 再生装置及びダイジェスト再生方法
JP4556752B2 (ja) コマーシャル視聴制御機能を有する録画再生装置
JP2008178037A (ja) 情報処理装置、情報処理方法及び情報処理プログラム
KR101434782B1 (ko) 신 세그먼트 플레이 시스템 및 방법, 그리고 그 기록매체
JP2006279241A (ja) 番組記録装置
JP2008084115A (ja) 情報処理装置、情報処理プログラムおよび情報処理システム
US9147434B2 (en) Information processing apparatus and information processing method
US8374487B2 (en) Information processing for generating an information list of video contents
US20210044859A1 (en) Systems and methods for recording media assets
CN1143536C (zh) 接收终端装置及其使用和控制方法
JP2008022351A (ja) ダイジェスト作成装置及びダイジェスト作成方法
JP2009004994A (ja) ダイジェスト映像情報作成方法、ダイジェスト映像情報作成プログラム、および、映像装置
CN1993989A (zh) 内容处理设备、处理内容的方法及计算机程序
JP2007088760A (ja) 番組録画予約装置及び番組録画予約方法
JP5399211B2 (ja) 情報処理システム、サーバ装置、情報処理方法、およびプログラム
JP4632451B2 (ja) 放送受信装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP4891585B2 (ja) シリーズ番組検索装置及びシリーズ番組検索方法
JP4275635B2 (ja) 嗜好度算出装置、コンテンツ推薦装置、コンテンツ記録出力装置、嗜好度算出サーバ、嗜好度算出方法、嗜好度算出プログラム及びこれを記録したコンピュータ読み取り可能な記録媒体
JP6266271B2 (ja) 電子機器、電子機器の制御方法及びコンピュータプログラム
JP4424273B2 (ja) 情報処理装置および方法、並びにプログラム
JP2008020767A (ja) 記録再生装置および方法、プログラム、並びに記録媒体
WO2014002728A1 (ja) 録画装置、テレビジョン受信機及び録画方法
JP4725554B2 (ja) 番組記録再生システム及び番組記録再生方法
JP2007336086A (ja) コンテンツ記録装置、コンテンツ再生装置、及びコンテンツネットワークシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090901

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110511

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110614

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110627

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140722

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees