JP2009059335A - 情報処理装置および方法、並びにプログラム - Google Patents

情報処理装置および方法、並びにプログラム Download PDF

Info

Publication number
JP2009059335A
JP2009059335A JP2007303992A JP2007303992A JP2009059335A JP 2009059335 A JP2009059335 A JP 2009059335A JP 2007303992 A JP2007303992 A JP 2007303992A JP 2007303992 A JP2007303992 A JP 2007303992A JP 2009059335 A JP2009059335 A JP 2009059335A
Authority
JP
Japan
Prior art keywords
genre
content
keyword
metadata
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007303992A
Other languages
English (en)
Inventor
Takeshi Takagi
剛 高木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2007303992A priority Critical patent/JP2009059335A/ja
Priority to US12/072,840 priority patent/US20080215577A1/en
Priority to EP08152077A priority patent/EP1965312A3/en
Publication of JP2009059335A publication Critical patent/JP2009059335A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】電子番組表(EPG)に含まれる情報のうち、番組の特徴を表現するのに最適なキーワードを効率良く抽出する。
【解決手段】EPG取得部12または14は、電子番組表を取得し、形態素解析部15は、電子番組表のテキスト情報を形態素解析し、ジャンル抽出部19は、電子番組表における番組ごとのジャンル情報を抽出し、キーワード抽出部18は、電子番組表における所定の番組のジャンルと関連性のある属性の単語を、形態素解析結果バッファ17より抽出する。本発明は、コンテンツ管理システムに適用することができる。
【選択図】図1

Description

本発明は、情報処理装置および方法、並びにプログラムに関し、特に、コンテンツのメタデータに含まれる情報のうち、コンテンツの特徴を表現するのに最適なキーワードを効率良く抽出できるようにした情報処理装置および方法、並びにプログラムに関する。
EPG(Electric Program Guide)と呼ばれるコンテンツのメタデータより構成される電子番組表を用いてコンテンツである番組を選択したり、EPG上で選択した番組を予約する技術が一般に普及しつつある。
自動録画のために用いるキーワードを情報として、より適切なものを確実かつ簡単に抽出できるようにする技術が提案されている(特許文献1参照)。
また、番組の時間の経過と共にEPGに含まれている番組名が省略された場合にでも確実に所望とする番組を検索する技術が提案されている(特許文献2参照)。
特開2006−339947号公報 特開2004−134858号公報
しかしながら、従来において、EPGなどのコンテンツメタデータよりコンテンツである番組の特徴を表現するのに最適なキーワードを効率良く抽出しようとすると、形態素解析により地名や人物名などを探し出すことはできても、それらが番組の特徴を表現するのに最適なキーワードであるのかを識別することはできないため、番組の特徴を表現するのに最適であるか否かとは無関係にEPGからキーワードが抽出されることがあり、抽出されたキーワードのみを見ても番組の特徴を認識することができないことがあった。
本発明はこのような状況に鑑みてなされたものであり、特に、電子番組表(EPG)などのコンテンツのメタデータに含まれる情報のうち、番組であるコンテンツの特徴を表現するのに最適なキーワードを効率良く抽出できるようにするものである。
本発明の情報処理装置は、コンテンツのメタデータを取得する取得手段と、前記コンテンツのメタデータに含まれるテキスト情報を形態素解析する形態素解析手段と、前記コンテンツのメタデータにおけるコンテンツごとのジャンル情報を抽出するジャンル抽出手段と、前記コンテンツのメタデータにおける所定のコンテンツの前記ジャンルと関連性のある属性の単語を、前記形態素解析手段の形態素解析結果より抽出するキーワード抽出手段とを含む。
前記形態素解析手段には、前記形態素解析結果より、人名および前記コンテンツの説明内容の主旨と関連性の薄い単語を除外する除外手段をさらに含ませるようにすることができ、前記キーワード抽出手段には、前記コンテンツのメタデータにおける所定のコンテンツの前記ジャンルと関連性のある属性の単語を、前記除外手段により前記人名および前記コンテンツの説明内容の主旨と関連性の薄い単語が除外されている、前記形態素解析手段の形態素解析結果より抽出させるようにすることができる。
前記キーワード抽出手段には、前記形態素解析手段の形態素解析結果より抽出した、前記コンテンツのメタデータにおける所定のコンテンツの前記ジャンルと関連性のある属性の単語が、所定数よりも多くない場合、前記形態素解析結果より、前記所定のコンテンツのジャンルと関連性のある属性以外の属性の単語および固有名詞を抽出する固有名詞抽出手段をさらに含ませるようにすることができる。
前記コンテンツのメタデータにおける前記ジャンルと、前記ジャンルと関連性のある属性との対応関係を記憶する記憶手段をさらに含ませるようにすることができ、前記キーワード抽出手段には、前記コンテンツのメタデータにおける所定のコンテンツの前記ジャンルと関連性のある属性を、前記記憶手段に記憶されている前記ジャンルと、前記ジャンルと関連性のある属性との対応関係に基づいて決定し、決定した単語を、前記形態素解析手段の形態素解析結果より抽出させるようにすることができる。
前記形態素解析手段の形態素解析結果における、同一単語の出現頻度を計数する計数手段をさらに含ませるようにすることができ、前記キーワード抽出手段には、前記コンテンツのメタデータにおける所定のコンテンツの前記ジャンルと関連性のある属性の単語を、前記形態素解析手段の形態素解析結果より、計数手段により計数された出現頻度の高い順に前記抽出させるようにすることができる。
前記ジャンルには、大ジャンルおよび小ジャンルを含ませるようにすることができる。
前記コンテンツには、テレビジョン番組を含ませるようにすることができ、前記メタデータは、前記テレビジョン番組に関する情報を含ませるようにすることができる。
本発明の一側面の情報処理方法は、コンテンツのメタデータを取得する取得ステップと、前記コンテンツのメタデータに含まれるテキスト情報を形態素解析する形態素解析ステップと、前記コンテンツのメタデータにおけるコンテンツごとのジャンル情報を抽出するジャンル抽出ステップと、前記コンテンツのメタデータにおける所定のコンテンツの前記ジャンルと関連性のある属性の単語を、前記形態素解析ステップの処理による形態素解析結果より抽出するキーワード抽出ステップとを含む。
本発明の一側面のプログラムは、コンテンツのメタデータを取得する取得ステップと、前記コンテンツのメタデータに含まれるテキスト情報を形態素解析する形態素解析ステップと、前記コンテンツのメタデータにおけるコンテンツごとのジャンル情報を抽出するジャンル抽出ステップと、前記コンテンツのメタデータにおける所定のコンテンツの前記ジャンルと関連性のある属性単語を、前記形態素解析ステップの処理による形態素解析結果より抽出するキーワード抽出ステップとを含む処理をコンピュータに実行させる。
プログラム格納媒体には、請求項8に記載のプログラムを格納させるようにすることができる。
本発明の情報処理装置および方法、並びにプログラムにおいては、コンテンツのメタデータが取得され、前記コンテンツのメタデータに含まれるテキスト情報が形態素解析され、前記コンテンツのメタデータにおけるコンテンツごとのジャンル情報が抽出され、前記コンテンツのメタデータにおける所定のコンテンツの前記ジャンルと関連性のある属性の単語が、形態素解析結果より抽出される。
本発明の情報処理装置は、独立した装置であっても良いし、情報処理を行うブロックであっても良い。
本発明の一側面によれば、コンテンツのメタデータに含まれる情報のうち、コンテンツの特徴を表現する最適なキーワードを効率良く抽出することが可能となる。
以下に本発明の実施の形態を説明するが、本明細書に記載の発明と、発明の実施の形態との対応関係を例示すると、次のようになる。この記載は、本明細書に記載されている発明をサポートする実施の形態が本明細書に記載されていることを確認するためのものである。従って、発明の実施の形態中には記載11されているが、発明に対応するものとして、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その発明に対応するものではないことを意味するものではない。逆に、実施の形態が発明に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その発明以外の発明には対応しないものであることを意味するものでもない。
さらに、この記載は、本明細書に記載されている発明の全てを意味するものではない。換言すれば、この記載は、本明細書に記載されている発明であって、この出願では請求されていない発明の存在、すなわち、将来、分割出願されたり、補正により出現、追加される発明の存在を否定するものではない。
即ち、本発明の情報処理装置は、コンテンツのメタデータを取得する取得手段(例えば、図1のEPG取得部12またはiEPG取得部14)と、前記コンテンツのメタデータに含まれるテキスト情報を形態素解析する形態素解析手段(例えば、図1の形態素解析部15)と、前記コンテンツのメタデータにおけるコンテンツごとのジャンル情報を抽出するジャンル抽出手段(例えば、図1のジャンル抽出部19)と、前記コンテンツのメタデータにおける所定のコンテンツの前記ジャンルと関連性のある属性の単語を、前記形態素解析手段の形態素解析結果より抽出するキーワード抽出手段(例えば、図1のジャンルキーワード抽出部18a)とを含む。
前記形態素解析手段には、前記形態素解析結果より、人名および前記コンテンツの説明内容の主旨と関連性の薄い単語を除外する除外手段(例えば、図1の除外処理部15a)をさらに含ませるようにすることができ、前記キーワード抽出手段には、前記コンテンツのメタデータにおける所定のコンテンツの前記ジャンルと関連性のある属性の単語を、前記除外手段により前記人名および前記コンテンツの説明内容の主旨と関連性の薄い単語が除外されている、前記形態素解析手段の形態素解析結果より抽出させるようにすることができる。
前記キーワード抽出手段には、前記形態素解析手段の形態素解析結果より抽出した、前記コンテンツのメタデータにおける所定のコンテンツの前記ジャンルと関連性のある属性の単語が、所定数よりも多くない場合、前記形態素解析結果より、前記所定のコンテンツのジャンルと関連性のある属性以外の属性の単語および固有名詞を抽出する固有名詞抽出手段(例えば、図1の固有名詞抽出部18b)をさらに含ませるようにすることができる。
前記コンテンツのメタデータにおける前記ジャンルと、前記ジャンルと関連性のある属性との対応関係を記憶する記憶手段(例えば、図1の属性記憶部20)をさらに含ませるようにすることができ、前記キーワード抽出手段(例えば、図1のジャンルキーワード抽出部18a)には、前記コンテンツのメタデータにおける所定のコンテンツの前記ジャンルと関連性のある属性を、前記記憶手段に記憶されている前記ジャンルと、前記ジャンルと関連性のある属性との対応関係に基づいて決定し、決定した単語を、前記形態素解析手段の形態素解析結果より抽出させるようにすることができる。
前記形態素解析手段の形態素解析結果における、同一単語の出現頻度を計数する計数手段(例えば、図1の出現頻度カウント部23)をさらに含ませるようにすることができ、前記キーワード抽出手段(例えば、図1のジャンルキーワード抽出部18a)には、前記コンテンツのメタデータにおける所定のコンテンツの前記ジャンルと関連性のある属性の単語を、前記形態素解析手段の形態素解析結果より、計数手段により計数された出現頻度の高い順に前記抽出させるようにすることができる。
本発明の一側面の情報処理方法は、コンテンツのメタデータを取得する取得ステップ(例えば、図5のステップS2)と、前記コンテンツのメタデータに含まれるテキスト情報を形態素解析する形態素解析ステップ(例えば、図5のステップS4)と、前記コンテンツのメタデータにおけるコンテンツごとのジャンル情報を抽出するジャンル抽出ステップ(例えば、図5のステップS7)と、前記コンテンツのメタデータにおける所定のコンテンツの前記ジャンルと関連性のある属性の単語を、前記形態素解析ステップの処理による形態素解析結果より抽出するキーワード抽出ステップ(例えば、図5のステップS11)とを含む。
図1は、本発明を適用した一実施の形態の構成を示す情報処理装置である。
図1の情報処理装置1は、インターネットなどに代表されるネットワークや、放送波などにより配信されるコンテンツのメタデータから構成されたEPG(電子番組表)を取得し、電子番組表の中に含まれる番組(コンテンツ)の情報より、番組の特徴を表現する最適なキーワードを抽出し、抽出されたキーワードのうち、操作ボタン、またはキーボードなどからなるリモートコントローラなどの操作部5により選択されたキーワードに対応する番組を表示する。
受信部11は、アンテナ2を介して放送波を受信して、EPG取得部12およびチューナ24に供給する。EPG取得部12は、受信部11より供給されてきた信号のうち、EPG(電子番組表)情報を取得してEPGテキストデータ抽出部13、ジャンル抽出部19、および番組検索部25に供給する。
iEPG取得部14は、インターネットに代表されるネットワーク3を介して、所定のURL(Uniform Resource Locator)などにより指定されるEPG配信サーバ4にアクセスし、EPG情報を取得し、EPGテキストデータ抽出部13、ジャンル抽出部19、および番組検索部25に供給する。
EPGテキストデータ抽出部13は、EPG取得部12より供給されてくるEPG情報、または、iEPG取得部14より供給されてくるEPG情報のそれぞれよりテキストデータを抽出して形態素解析部15に供給する。
形態素解析部15は、EPG情報のテキストデータを、言葉の最小単位(以降においては、これを単語と称するものとする)に分割し、それぞれの単語について、辞書記憶部16に登録されている情報と照合して、品詞を特定することにより、形態素解析処理を実行し、その結果を形態素解析結果バッファ17に記憶させる。さらに、形態素解析部15は、除外処理部15aを制御して、形態素解析結果バッファ17に記憶したテキストデータのうち、除外対象となる人名および明らかに番組の説明内容の特徴を表さない単語を除外(削除)させ、それ以外の単語を形態素解析部15に供給する。明らかに番組の説明内容の特徴を表さないとは、例えば、中断、休止、録画、または、URL(Uniform Resource Locator)もしくはWWW(World Wide Web)などを含むものである。形態素解析部15は、形態素解析処理により分類された品詞のうち、一般名詞、および固有名詞などの、いわゆる名詞として分類された単語を、後述するさらに細かいキーワード属性に分類する。
ジャンル抽出部19は、EPG情報に含まれる各番組毎に設定されるジャンルの情報を抽出してキーワード抽出部18に供給する。より詳細には、図2乃至図4で示されるように、EPG情報に含まれるジャンルは、大ジャンルと小ジャンルに分けられており、ジャンル抽出部19は、EPG情報に含まれる大ジャンルと小ジャンルの情報をそれぞれ抽出してキーワード抽出部18に供給する。
大ジャンルには、図2乃至図4で示されるように、例えば、スポーツ、音楽、映画、情報/ワイドショー、バラエティ、ドキュメンタリ/教養、演劇/公演、趣味/教育が含まれている。
また、小ジャンルは、大ジャンルに含まれるジャンルであり、例えば、大ジャンルが情報/ワイドショーの場合、健康・医療、グルメ・料理、およびイベントの小ジャンルが含まれている。また、大ジャンルがバラエティの場合、音楽バラエティ、旅バラエティ、および料理バラエティの小ジャンルが含まれている。さらに、大ジャンルが、ドキュメンタリ/教養の場合、歴史・紀行、自然・動物・環境、宇宙・科学・医学、カルチャ・伝統文化、文学・文芸、および、スポーツの小ジャンルが含まれている。また、劇場/公演には、ダンス・バレエの小ジャンルが含まれている。さらに、大ジャンルが趣味/教育の場合、旅・釣り・アウトドア、園芸・ペット・手芸、音楽・美術・工芸、車・オートバイ、および大学生・受験の小ジャンルが含まれている。
出現頻度カウント部23は、形態素解析結果バッファ17に記憶されている形態素解析結果の各単語の出現頻度をカウントしており、出現頻度の高い順に並べ替える。
キーワード抽出部18は、ジャンルキーワード抽出部18a、固有名詞抽出部18b、および名詞抽出部18cから構成されている。ジャンルキーワード抽出部18aは、属性記憶部20にアクセスし、ジャンル抽出部19より供給されてくる大ジャンルと小ジャンルとで予め設定されてるキーワード属性を読み出し、出現頻度カウント部23からの情報に基づいて、出現頻度が上位となるキーワードから順に、対象となるキーワード属性であるか否かを判定し、対象となるキーワード属性のキーワードのみをキーワード抽出結果記憶部21に記憶させる。
より具体的には、番組の大ジャンルがスポーツである場合、抽出する対象となるキーワード属性は、競技場、スポーツメーカ、チーム名、スポーツ団体、大会、タイトル、および、スポーツ用語である。ここで、スポーツ団体とは、例えば、高校野球連盟等であり、タイトルとは、ゴールデンクラブ賞等である。また、番組の大ジャンルが音楽である場合、抽出する対象となるキーワード属性は、音楽ジャンルおよび音楽関連である。ここで、音楽関連とは、楽器や音符名等である。
さらに、番組の大ジャンルが情報/ワイドショーである場合、小ジャンルが健康・医療であるとき、抽出する対象となるキーワード属性は、病名および薬品名である。また、番組の大ジャンルの情報/ワイドショーである場合、小ジャンルがグルメ・料理であるとき、抽出する対象となるキーワード属性は、料理、食材、菓子、飲料、調理器具、および飲料である。さらに、番組の大ジャンルが情報/ワイドショーである場合、小ジャンルがイベントであるとき、抽出する対象となるキーワード属性は、行事およびお祭りである。
また、番組の大ジャンルがバラエティである場合、小ジャンルが音楽バラエティであるとき、抽出する対象となるキーワード属性は、音楽ジャンルおよび音楽関連である。また、番組の大ジャンルのバラエティである場合、小ジャンルが旅バラエティであるとき、抽出する対象となるキーワード属性は、国、地方、都道府県、市町村区、町字、支庁、海外地名、美術館・博物館、動物園・植物園・水族館、行事、お祭り、駅、鉄道路線、道路施設、陸海空路、乗り物、遊覧、自然地形、および温泉である。さらに、番組の大ジャンルがバラエティである場合、小ジャンルが料理バラエティであるとき、抽出する対象となるキーワード属性は、料理、食材、菓子、飲料、調理器具、および飲料である。
さらに、番組の大ジャンルがドキュメンタリ/教養である場合、小ジャンルが歴史・紀行であるとき、抽出する対象となるキーワード属性は、時代、元号、思想・運動、文化・文明、史実である。ここで、元号とは、例えば、安政または応仁等であり、思想とは、例えば、マルクス、レーニン主義などであり、文化・文明とは、例えば、インダス文明などである。
また、番組の大ジャンルがドキュメンタリ/教養である場合、小ジャンルが自然・動物・環境であるとき、抽出する対象となるキーワード属性は、動物、および動物園・植物園・水族館である。さらに、番組の大ジャンルがドキュメンタリ/教養である場合、小ジャンルが宇宙・科学・医学であるとき、抽出する対象となるキーワード属性は、天体、病名、および薬品名である。ここで、天体とは、例えば、星座名や星名である。
さらに、番組の大ジャンルがドキュメンタリ/教養である場合、小ジャンルがカルチャー・伝統文化であるとき、抽出する対象となるキーワード属性は、思想・運動、宗教・宗派、史実、および伝統工芸である。ここで、伝統工芸とは、例えば、九谷焼、輪島塗などである。さらに、番組の大ジャンルがドキュメンタリ/教養である場合、小ジャンルが文学・文芸であるとき、抽出する対象となるキーワード属性は、思想・運動、宗教・宗派、史実、作品名である。
また、番組の大ジャンルがドキュメンタリ/教養である場合、小ジャンルがスポーツであるとき、抽出する対象となるキーワード属性は、競技場、スポーツメーカー、チーム名、スポーツ団体、大会、タイトル、およびスポーツ用語である。
さらに、番組の大ジャンルが劇場/公演である場合、抽出する対象となるキーワード属性は、作品名である。番組の大ジャンルが劇場/公演である場合、小ジャンルがダンス・バレエのとき、抽出する対象となるキーワード属性は、ダンスである。ここで、ダンスとは、例えば、クイックステップ、またはモダンダンスなどである。
また、番組の大ジャンルが趣味/教育である場合、小ジャンルが旅・釣り・アウトドアであるとき、抽出する対象となるキーワード属性は、国、地方、都道府県、市町村区、町字、支庁、海外地名、美術館・博物館、動物園・植物園・水族館、行事、お祭り、駅、鉄道路線、道路施設、陸海空路、乗り物、遊覧、自然地形、温泉、および動物である。
さらに、番組の大ジャンルが趣味/教育である場合、小ジャンルが園芸・ペット・手芸であるとき、抽出する対象となるキーワード属性は、動物である。また、番組の大ジャンルが趣味/教育である場合、小ジャンルが音楽・美術・工芸であるとき、抽出する対象となるキーワード属性は、音楽ジャンル、音楽関連、伝統工芸、および美術館・博物館である。
また、番組の大ジャンルが趣味/教育である場合、小ジャンルが車・オートバイであるとき、抽出する対象となるキーワード属性は、自動車メーカである。また、番組の大ジャンルが趣味/教育である場合、小ジャンルが大学生・受験であるとき、抽出する対象となるキーワード属性は、大学である。
固有名詞抽出部18bは、対象となるジャンルのキーワード属性により抽出されたキーワードが所定数より少ない場合、対象となるジャンルとマッチしない(関連性のない)属性、および、固有名詞のキーワード属性を備えた単語をさらにキーワードとして抽出する。
名詞抽出部18cは、対象となるジャンルのキーワード属性により抽出されたキーワードが所定数より少ない場合で、かつ、固有名詞抽出部18bによりジャンルとはマッチしない(関連性のない)属性および固有名詞のキーワード属性によりキーワードを抽出しても、抽出されたキーワードが所定数よりも少ないとき、対象となるジャンル、および固有名詞以外のキーワード属性に属する単語のうち、名詞のキーワード属性を備えた単語をさらにキーワードとして抽出する。
次に、図5を参照して、キーワード抽出処理について説明する。
ステップS1において、EPG取得部12またはiEPG取得部14は、操作部5が操作されて、キーワードの表示が指示されたか否かを判定し、指示されたと判定されるまで同様の処理を繰り返す。例えば、図6で示されるようなオプションタブ101が表示され、キーワード抽出処理を示すボタン117が操作された場合、キーワードの表示が指示されたものとみなし、処理は、ステップS2に進む。
尚、図6は、表示部6に表示されている画像例を示しており、チューナ24により選局されている通常の放送番組の表示欄102がオプションタブ101の左側に設けられており、オプションタブ101には、上から「HDD情報」、「DVD情報」、「画音質設定」、「番組録画」、「番組説明」、「人名」、および「キーワード」と表示されたボタン111乃至117が表示されている。ボタン111は、図示せぬHDD(Hard Disk Drive)に記録されている番組の情報を表示するとき操作される。ボタン112は、図示せぬDVD(Digital Versatile Disk)ドライブに挿入されているDVDに記録されている番組情報を表示するとき操作される。ボタン113は、画音質設定を実行するとき操作される。ボタン114は、番組録画を実行するとき操作される。ボタン115は、EPGに含まれている表示欄102で表示されている番組の番組説明を表示させるとき操作される。ボタン116は、EPGに含まれている表示欄102で表示されている番組の出演者名を人名として表示させるとき操作される。ボタン117は、EPGに含まれている表示欄102で表示されている番組のキーワードを表示させるとき操作される。
ステップS2において、EPG取得部12は、受信部11を介してアンテナ2により受信される放送波に含まれるEPG情報を取得してEPGテキストデータ抽出部13に供給する。または、iEPG取得部14は、所定のURLで指定されるネットワーク3上のEPG配信サーバ4にアクセスして、EPG情報を取得してEPGテキストデータ抽出部13およびジャンル抽出部19に供給する。
ステップS3において、EPGテキストデータ抽出部13は、供給されてきたEPG情報よりテキストデータを抽出して形態素解析部15に供給する。
ステップS4において、形態素解析部15は、辞書記憶部16に記憶されている情報に基づいて、供給されてきたEPG情報のテキストデータを単語に分割して、それぞれの単語の品詞を特定し、形態素解析結果バッファ17に記憶させる。
ステップS5において、形態素解析部15は、除外処理部15aを制御して、形態素解析結果バッファ17に記憶されている単語のうち、キーワード属性として人名および明らかに番組の説明内容の特徴を表さない単語を削除させ、抽出される単語より除外させる。
単語は、図7で示されるように分類される。すなわち、形態素解析により名詞キーワード群W1が構成される。名詞キーワード群W1には、人名および明らかに番組の説明内容の特徴を表さない(番組の説明内容の主旨と関連性の薄い)キーワード群W11、キーワードW12、それ以外の属性を持たないキーワード群W14、並びに、それらの区分とは異なる固有名詞キーワード群W13からなる。さらに、属性を持つキーワード群W12は、特定ジャンルのキーワード属性を備えた特定ジャンルキーワード群W21、およびそれら以外の非特定ジャンルキーワード群W22を含む。
除外処理部15aは、形態素解析処理で分類されたキーワードの品詞を特定することにより、人名および明らかに番組の説明内容の特徴を表さないキーワード群W11を認識することができるので、それらの単語を形態素解析結果バッファ17から除外する。
ステップS6において、出現頻度カウント部23は、形態素解析結果バッファ17に蓄積されている単語を順次読み出し、同一の単語の出現頻度をカウントし、出現頻度に基づいて、上位から並べ替える。
ステップS7において、ジャンル抽出部19は、EPG情報より所定の番組のジャンルの情報を抽出してキーワード抽出部18に供給する。所定の番組のジャンルとは、表示欄102で表示されている番組のジャンルである。
ステップS8において、キーワード抽出部18のジャンルキーワード抽出部18aは、属性記憶部20にアクセスし、ジャンル抽出部19より供給されてきたジャンル情報に基づいて、抽出する対象となるキーワード属性を特定する。
ステップS9において、ジャンルキーワード抽出部18aは、出現頻度の順位を示す図示せぬカウンタiを1に初期化する。
ステップS10において、ジャンルキーワード抽出部18aは、出現頻度カウント部23に問合せて、出現頻度i位の単語を、形態素解析結果バッファ17より抽出して、抽出すべきジャンルのキーワード属性であるか否か、すなわち、例えば、図7におけるジャンルキーワード群W21−1乃至21−nのいずれかの特定のジャンルのキーワード群、すなわち、番組のジャンルとマッチするキーワード属性に属するか否かを判定する。ステップS10において、例えば、抽出すべきジャンルのキーワード属性である場合、ステップS11において、出現頻度が第i位の単語をキーワード抽出結果記憶部21に記憶させ、処理は、ステップS12に進む。
一方、ステップS10において、抽出すべきキーワード属性ではないと判定された場合、ステップS11の処理がスキップされて、処理は、ステップS12に進む。
ステップS12において、ジャンルキーワード抽出部18aは、キーワード抽出結果記憶部21に記憶されている単語数が、所定の単語数以上であるか否かを判定し、所定の単語数ではない場合、処理は、ステップS13に進む。
ステップS13において、ジャンルキーワード抽出部18aは、形態素解析結果バッファ17にアクセスし、全ての単語について処理が終了したか否かを判定し、全ての単語について処理が終了していない場合、処理は、ステップS14に進む。
ステップS14において、ジャンルキーワード抽出部18aは、カウンタiを1インクリメントし、処理は、ステップS10に戻る。
すなわち、ステップS12において、抽出すべきキーワードとなる単語が所定の単語数だけキーワード抽出結果記憶部21に記憶されるか、または全ての単語について、抽出すべきキーワード属性であるか否かが判定されるまで、ステップS10乃至S14の処理が繰り返される。
そして、ステップS12において、抽出すべきキーワードとなる単語が所定の単語数だけキーワード抽出結果記憶部21に記憶されたと判定された場合、ステップS16において、出力部22は、キーワード抽出結果記憶部21に記憶されている、抽出された単語を表示部6に出力すると共に、表示部6に表示させる。
すなわち、例えば、ステップS3の処理により、図8で示されるようなテキストデータが抽出された場合、以下のような処理がなされる。ここで、図8には、「今回は日本一の源泉数を誇る、温泉の都・大分県別府温泉郷に田崎滋さんと白田福美さんが訪れます。20年ぶりに出会った先輩・後輩のお二人が、一泊デートに出かけてドキドキの混浴体験・・。ヒラシは山奥で幻の国産キャビアの探す旅へ。氷田きよしの出会いふれあいお国自慢。」と抽出されている。
例えば、この場合、ステップS4の処理により、形態素解析されると、名詞としては、「日本一、源泉、温泉、大分県、別府温泉、田崎滋、白田福美、先輩、後輩、・・・」が順次抽出される。
ステップS7の処理により、番組の大ジャンルがバラエティで、かつ、小バラエティが旅バラエティであった場合、抽出対象となるキーワード属性は、国、地方、都道府県、市町村区、町字、支庁、海外地名、美術館・博物館、動物園・植物園・水族館、行事、お祭り、駅、鉄道路線、道路施設、陸海空路、乗り物、遊覧、自然地形、および温泉であるので、「大分県、別府温泉、キャビア・・・」が順次抽出されることになる。
このため、抽出される単語のみでも、番組が、大分県の別府温泉に関連した内容であり、しかも、キャビアの話題が存在することを認識することができるため、番組が、旅番組であって、別府温泉が話題であることを認識することができる。また、抽出されるキーワードは、際限なく抽出されるのではなく、出現頻度の高い単語を、所定数だけ抽出することができるので、出現頻度の高い、特徴的な単語を効率良く抽出することができるので、番組の特徴を、より認識しやすくさせることが可能となる。
一方、ステップS13において、特定のジャンルのキーワード属性を備えた全ての単語について、抽出すべきキーワード属性であるか否かが判定された場合、すなわち、抽出すべきキーワード属性であるか否かが、全てのキーワードについて判定されたにもかかわらず、抽出されたキーワード数が所定数ではない場合、ステップS15において、固有名詞抽出部18bは、ジャンル外キーワード抽出処理を実行する。
ここで、図9のフローチャートを参照して、ジャンル外キーワード抽出処理について説明する。
ステップS31において、キーワード抽出部18の固有名詞抽出部18bは、属性記憶部20にアクセスし、抽出する対象となるキーワード属性を、表示欄102で表示されている番組以外の特定のジャンルのキーワード属性、すなわち、番組のジャンルとはマッチしない属性(ジャンルと関連性のある属性以外の属性)および固有名詞に特定する。
ステップS32において、固有名詞抽出部18bは、出現頻度の順位を示す図示せぬカウンタiを1に初期化する。
ステップS33において、固有名詞抽出部18bは、出現頻度カウント部23に問合せて、出現頻度i位の単語を、形態素解析結果バッファ17より抽出して、抽出すべき表示欄102で表示されている番組とマッチしない特定のジャンルのキーワード属性、すなわち、非特定ジャンルキーワード属性または固有名詞のキーワード属性であるか否か、すなわち、例えば、図7の属性を持つキーワード群W12のうちの、表示部102に表示されている番組とマッチしない非特定ジャンルキーワード群W22であるか、または、固有名詞キーワード群W13に属する固有名詞のキーワードであるか否かを判定する。ステップS33において、例えば、抽出すべき表示欄102で表示されている番組とマッチしないジャンルの非特定ジャンルキーワード属性または固有名詞キーワード属性である場合、ステップS34において、出現頻度が第i位の単語をキーワード抽出結果記憶部21に記憶させ、処理は、ステップS35に進む。
一方、ステップS33において、抽出すべき表示欄102で表示されている番組とマッチしない、非特定ジャンルのキーワード属性または固有名詞のキーワード属性ではないと判定された場合、ステップS34の処理がスキップされて、処理は、ステップS35に進む。
ステップS35において、固有名詞抽出部18bは、キーワード抽出結果記憶部21に記憶されている単語数が、所定の単語数以上であるか否かを判定し、所定の単語数ではない場合、処理は、ステップS36に進む。
ステップS36において、固有名詞抽出部18bは、形態素解析結果バッファ17にアクセスし、全ての単語について処理が終了したか否かを判定し、全ての単語について処理が終了していない場合、処理は、ステップS37に進む。
ステップS37において、固有名詞抽出部18bは、カウンタiを1インクリメントし、処理は、ステップS33に戻る。
すなわち、ステップS35において、抽出すべき表示欄102で表示されている番組のジャンルのキーワード、並びに、表示欄102で表示されている番組とマッチしない非特定ジャンルの属性の単語、および固有名詞のキーワード属性を備えるキーワードが所定の単語数だけキーワード抽出結果記憶部21に記憶されるか、または、全ての単語について、抽出すべきキーワード属性である表示欄102で表示されている番組とマッチしない非特定ジャンルのキーワード属性を備える単語、または固有名詞であるか否かが判定されるまで、ステップS33乃至S37の処理が繰り返される。
そして、ステップS35において、抽出すべき表示欄102で表示されている番組のジャンルのキーワード、並びに、表示欄102で表示されている番組とマッチしなし非特定ジャンルの属性の単語、および固有名詞のキーワード属性を備えるキーワードとなる単語が所定の単語数だけキーワード抽出結果記憶部21に記憶されたと判定された場合、ジャンル外キーワード抽出処理が終了し、図5のフローチャートの処理に戻り、ステップS16において、出力部22は、キーワード抽出結果記憶部21に記憶されている、抽出された単語を表示部6に出力すると共に、表示部6に表示させる。
一方、ステップS36において、全ての単語について、抽出すべきキーワード属性である表示欄102で表示されている番組とマッチしない非特定ジャンルの属性の単語、または固有名詞であるか否かが判定された場合、すなわち、抽出すべきキーワード属性である表示欄102で表示されている番組とマッチしない非特定ジャンルの属性の単語か、または固有名詞であるか否かが、全てのキーワードについて判定されたにもかかわらず、抽出されたキーワード数が所定数ではない場合、ステップS38において、名詞抽出部18cは、名詞抽出処理を実行する。
ここで、図10のフローチャートを参照して、名詞抽出処理について説明する。
ステップS41において、キーワード抽出部18の名詞抽出部18cは、属性記憶部20にアクセスし、抽出する対象となるキーワード属性を名詞に特定する。
ステップS42において、名詞抽出部18cは、出現頻度の順位を示す図示せぬカウンタiを1に初期化する。
ステップS43において、名詞抽出部18cは、出現頻度カウント部23に問合せて、出現頻度i位の単語を、形態素解析結果バッファ17より抽出して、抽出すべき名詞のキーワード属性であるか否か、すなわち、例えば、図7の名詞キーワード群W1に属する単語であるか否かを判定する。尚、ここでは、既に、属性を持つキーワード群W12に属する特定ジャンルキーワード群W21および非特定ジャンルキーワード群W22、並びに固有名詞キーワード群W13内における抽出は終了しているため、実質的に、名詞キーワード群W1のうち、人名、明らかに番組の説明内容の特徴を表さないキーワード群W11、属性を持つキーワード群W12、および固有名詞キーワード群W13が除去された、名詞キーワード群W1における属性を持たないキーワード属性W14に属する単語が抽出すべき単語となる。
ステップS43において、例えば、抽出すべき名詞のキーワード属性である場合、ステップS44において、出現頻度が第i位の単語をキーワード抽出結果記憶部21に記憶させ、処理は、ステップS45に進む。
一方、ステップS43において、抽出すべき名詞のキーワード属性ではないと判定された場合、ステップS44の処理がスキップされて、処理は、ステップS45に進む。
ステップS45において、名詞抽出部18cは、キーワード抽出結果記憶部21に記憶されている単語数が、所定の単語数以上であるか否かを判定し、所定の単語数ではない場合、処理は、ステップS46に進む。
ステップS46において、名詞抽出部18cは、形態素解析結果バッファ17にアクセスし、全ての単語について処理が終了したか否かを判定し、全ての単語について処理が終了していない場合、処理は、ステップS47に進む。
ステップS47において、名詞抽出部18cは、カウンタiを1インクリメントし、処理は、ステップS43に戻る。
すなわち、ステップS45において、抽出すべき属性を持つキーワード群W12、固有名詞キーワード群W13、および属性を持たないキーワード群W14よりキーワードが所定の単語数だけキーワード抽出結果記憶部21に記憶されるか、または、全ての単語について処理が終了するまで、ステップS43乃至S47の処理が繰り返される。
そして、ステップS45において、抽出すべき属性を持たないキーワード群W12、固有名詞キーワード群W13、および属性を持たないキーワード群W14より単語が所定の単語数だけキーワード抽出結果記憶部21に記憶されたと判定された場合、または、ステップS46において、全ての単語について処理が終了したと判定された場合、名詞抽出処理が終了すると共に、ジャンル外キーワード抽出処理が終了し、図5のフローチャートの処理に戻り、ステップS16において、出力部22は、キーワード抽出結果記憶部21に記憶されている、抽出された単語を表示部6に出力すると共に、表示部6に表示させる。
すなわち、以上の処理を纏めると、図5のステップS10乃至S14の処理において、特定ジャンル(表示欄102で表示されている番組のジャンル)の特定ジャンルキーワード群に属する単語がキーワードとして抽出され、所定数が満たされない場合、図9のステップS33乃至S38の処理により、表示欄102で表示されている番組とマッチしない非特定ジャンルのキーワード群に属する単語、または固有名詞キーワード群の単語がキーワードとして抽出され、それでも所定数が満たされないとき、図10のステップS43乃至S47の処理により属性を持たないキーワード群に属する単語がキーワードとして抽出される。
このため、表示欄102で表示されている番組のキーワードが少ない場合でも、表示欄102で表示されている番組とマッチしない非特定ジャンルキーワード群に属する単語、または固有名詞キーワード群に属するキーワードが抽出され、さらに、表示欄102で表示されている番組とマッチしない非特定ジャンルキーワード群に属する単語、または固有名詞キーワード群に属するキーワードを加えても少ない場合、属性を持たないキーワード群からキーワードが抽出されることになるため、所定数のキーワードを抽出できる可能性を高めることが可能となる。
ここで、図5のフローチャートの説明に戻る。
ステップS16において、表示部6は、例えば、図11で示されるような画面によりキーワードを表示する。図11においては、通常の放送番組の表示欄102の右側にキーワード表示欄121が設けられ、抽出されたキーワードを選択するとき操作されるボタン131乃至134が、キーワードに対応して設けられている。図11においては、「大分県」のキーワードに対してボタン131が設けられており、「別府温泉」のキーワードに対してボタン132が設けられており、「キャビア」のキーワードに対してボタン133が設けられている。
ステップS17において、番組検索部25は、操作部5が操作されて、いずれかのボタン131乃至133のいずれかが操作されて、キーワードが選択されたか否かを判定する。例えば、図11において、ボタン131が操作部5により操作されて、「大分県」のキーワードが選択された場合、ステップS18において、番組検索部25は、EPG取得部12またはiEPG取得部14より供給されてくるEPG情報に基づいて、「大分県」のキーワードにより番組を検索し(EPG情報の番組情報に「大分県」のキーワードを含む番組を検索し)、検索結果を、ステップS19において、例えば、図12で示されるように表示部6に表示させる。また、ステップS17において、選択されなかった場合、ステップS20において、終了が指示されたか否かが判定され、終了が指示されていない場合、処理は、ステップS17に戻り、終了が指示された場合、処理は、終了する。
図12においては、選択キーワードタブ151が設けられており、選択されたキーワードが示されており、図12においては、選択されたキーワードである「大分県」が示されている。その下には、検索結果表示欄152が設けられており、選択されたキーワードで検索された番組が表示されている。図12においては、最上段に、「明日 1:05 AM 映画劇場「台の向こうに」」が表示され、第2段目には、「2:30 AM Howbiz Extra #201」が表示され、第3段目には、「9:30 PM 木曜洋画劇場 「インディアン・ゲーム」が表示され、第4段目には、「0:00 AM インディーズムービーフェスティバル〜自主制作」が表示され、第5段目には、「050 AM 映画劇場「マイ・ホーム」」が表示され、第6段目には、「2:30 AM ビリーさん自らを語る」が表示され、第7段目には、「11:00 PM 映画『お墓と結婚』(無料放送)」が表示されており、それぞれの番組名と放送時間が表示される。これらの番組の表示欄は選択することにより、例えば、録画予約ができるようにしてもよい。検索結果表示欄の下には、右側に「戻る」と表示されたボタン153が設けられている。ボタン153は、選択キーワードタブ151による表示を終了して元に戻すとき操作される。また、ボタン153の左側には「オプション」と表示されたボタン154が設けられている。ボタン154は、オプション操作を実行させるとき操作される。
以上の処理によれば、電子番組表(EPG)に含まれる情報のうち、ジャンルにより特定されるキーワード属性に基づいて、出現頻度の高い順番に、対応する単語をキーワードとして抽出することが可能になる。また、キーワードの数が所定数よりも少ない場合、ジャンル外の固有名詞のキーワード属性を備えた単語が、キーワードとして抽出され、さらに、キーワードの数が所定数よりも少ないとき、ジャンル外の名詞のキーワード属性を備えた単語が、ジャンルにより特定されるキーワード属性を備えるキーワードおよび固有名詞のキーワードに加えて抽出される。
結果として、EPG情報に含まれるテキスト情報のうち、出現頻度の高いキーワードを所定数だけ抽出できる可能性を高くすることができるので、キーワードの選択肢の数を所定数だけ確保しやすくなり、使用者は様々なバリエーションで番組のキーワードを検索することが可能になる共に、番組の特徴を表現するのに最適なキーワードを効率良く抽出するできるようになる。
尚、以上においては、大ジャンルおよび小ジャンルにより、現在表示している番組のジャンルに基づいたキーワードの抽出処理について説明してきたが、その他のキーワードを選択するようにしてもよく、例えば、大ジャンルなどに季節のキーワード属性として「クリスマス」、「お正月」、「お雛様」、または、「端午の節句」などを設定し、番組のジャンルとは別に、そのときの日時の情報に基づいて、最も季節にふさわしいキーワード属性を備えた単語をキーワードとして抽出するようにしてもよい。
また、以上においては、コンテンツのメタデータがEPGである例について説明してきたが、コンテンツの付加情報としてのメタデータであれば、EPG以外のものであってもよく、例えば、ECG(Electronic Contents Guide)などであってもよい。
さらに、以上においては、コンテンツがテレビジョン番組である例について説明してきたが、メタデータを備えたコンテンツであれば、テレビジョン番組以外であってもよく、例えば、ネットワークを介してダウンロードされる動画像コンテンツや音楽コンテンツであってもよいし、DVD(Digital Versatile Disc)やBD(Blu-Ray Disc)などのデータ格納媒体に格納された動画像コンテンツや音楽コンテンツであってもよい。
以上によれば、コンテンツのメタデータに含まれる情報をキーワード属性に基づいて、出現頻度の高い順番に抽出するようにしたので、コンテンツの特徴を表現するのに最適なキーワードを所定数だけ効率良く抽出することが可能となる。
ところで、上述した一連のテキスト処理は、ハードウェアにより実行させることもできるが、ソフトウェアにより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、記録媒体からインストールされる。
図13は、汎用のパーソナルコンピュータの構成例を示している。このパーソナルコンピュータは、CPU(Central Processing Unit)1001を内蔵している。CPU1001にはバス1004を介して、入出力インタフェース1005が接続されている。バス1004には、ROM(Read Only Memory)1002およびRAM(Random Access Memory)1003が接続されている。
入出力インタフェース1005には、ユーザが操作コマンドを入力するキーボード、マウスなどの入力デバイスよりなる入力部1006、処理操作画面や処理結果の画像を表示デバイスに出力する出力部1007、プログラムや各種データを格納するハードディスクドライブなどよりなる記憶部1008、LAN(Local Area Network)アダプタなどよりなり、インターネットに代表されるネットワークを介した通信処理を実行する通信部1009が接続されている。また、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory)、DVD(Digital Versatile Disc)を含む)、光磁気ディスク(MD(Mini Disc)を含む)、もしくは半導体メモリなどのリムーバブルメディア1011に対してデータを読み書きするドライブ1010が接続されている。
CPU1001は、ROM1002に記憶されているプログラム、または磁気ディスク、光ディスク、光磁気ディスク、もしくは半導体メモリ等のリムーバブルメディア1011から読み出されて記憶部1008にインストールされ、記憶部1008からRAM1003にロードされたプログラムに従って各種の処理を実行する。RAM1003にはまた、CPU1001が各種の処理を実行する上において必要なデータなども適宜記憶される。
尚、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理は、もちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理を含むものである。
本発明を適用した情報処理装置の構成例を示すブロック図である。 ジャンルとキーワード属性との関係を説明する図である。 ジャンルとキーワード属性との関係を説明する図である。 ジャンルとキーワード属性との関係を説明する図である。 キーワード抽出処理を説明するフローチャートである。 表示画面の表示例を説明する図である。 キーワード属性を説明する図である。 キーワード抽出処理を説明する図である。 ジャンル外キーワード抽出処理を説明するフローチャートである。 名詞抽出処理を説明するフローチャートである。 キーワードの表示画面の表示例を説明する図である。 キーワードを選択したときの表示画面の表示例を説明する図である。 パーソナルコンピュータの構成例を説明する図である。
符号の説明
1 情報処理装置, 13 EPGテキストデータ抽出部, 15 形態素解析部, 15a 除外処理部, 16 辞書記憶部, 17 形態素解析結果バッファ, 18 キーワード抽出部, 18a ジャンルキーワード抽出部, 18b 固有名詞抽出部, 18c 名詞抽出部, 19 ジャンル抽出部, 20 属性記憶部, 21 キーワード抽出結果記憶部, 22 出力部, 23 出現頻度カウント部

Claims (10)

  1. コンテンツのメタデータを取得する取得手段と、
    前記コンテンツのメタデータに含まれるテキスト情報を形態素解析する形態素解析手段と、
    前記コンテンツのメタデータにおけるコンテンツごとのジャンル情報を抽出するジャンル抽出手段と、
    前記コンテンツのメタデータにおける所定のコンテンツの前記ジャンルと関連性のある属性の単語を、前記形態素解析手段の形態素解析結果より抽出するキーワード抽出手段と
    を含む情報処理装置。
  2. 前記形態素解析手段は、
    前記形態素解析結果より、人名および前記コンテンツの説明内容の主旨と関連性の薄い単語を除外する除外手段をさらに含み、
    前記キーワード抽出手段は、前記コンテンツのメタデータにおける所定のコンテンツの前記ジャンルと関連性のある属性の単語を、前記除外手段により前記人名および前記コンテンツの説明内容の主旨と関連性の薄い単語が除外されている、前記形態素解析手段の形態素解析結果より抽出する
    請求項1に記載の情報処理装置。
  3. 前記キーワード抽出手段は、
    前記形態素解析手段の形態素解析結果より抽出した、前記コンテンツのメタデータにおける所定のコンテンツの前記ジャンルと関連性のある属性の単語が、所定数よりも多くない場合、前記形態素解析結果より、前記所定のコンテンツのジャンルと関連性のある属性以外の属性の単語および固有名詞を抽出する固有名詞抽出手段をさらに含む
    請求項1に記載の情報処理装置。
  4. 前記コンテンツのメタデータにおける前記ジャンルと、前記ジャンルと関連性のある属性との対応関係を記憶する記憶手段をさらに含み、
    前記キーワード抽出手段は、前記コンテンツのメタデータにおける所定のコンテンツのジャンルと関連性のある属性を、前記記憶手段に記憶されている前記ジャンルと、前記ジャンルと関連性のある属性との対応関係に基づいて決定し、決定した単語を、前記形態素解析手段の形態素解析結果より抽出する
    請求項1に記載の情報処理装置。
  5. 前記形態素解析手段の形態素解析結果における、同一単語の出現頻度を計数する計数手段をさらに含み、
    前記キーワード抽出手段は、前記コンテンツのメタデータにおける所定のコンテンツの前記ジャンルと関連性のある属性の単語を、前記形態素解析手段の形態素解析結果より、計数手段により計数された出現頻度の高い順に前記抽出する
    請求項1に記載の情報処理装置。
  6. 前記ジャンルは、大ジャンルおよび小ジャンルを含む
    請求項1に記載の情報処理装置。
  7. 前記コンテンツは、テレビジョン番組を含み、前記メタデータは、前記テレビジョン番組に関する情報を含む
    請求項1に記載の情報処理装置。
  8. コンテンツのメタデータを取得する取得ステップと、
    前記コンテンツのメタデータに含まれるテキスト情報を形態素解析する形態素解析ステップと、
    前記コンテンツのメタデータにおけるコンテンツごとのジャンル情報を抽出するジャンル抽出ステップと、
    前記コンテンツのメタデータにおける所定のコンテンツの前記ジャンルと関連性のある属性の単語を、前記形態素解析ステップの処理による形態素解析結果より抽出するキーワード抽出ステップと
    を含む情報処理方法。
  9. コンテンツのメタデータを取得する得ステップと、
    前記コンテンツのメタデータのテキスト情報を形態素解析する形態素解析ステップと、
    前記コンテンツのメタデータにおけるコンテンツごとのジャンル情報を抽出するジャンル抽出ステップと、
    前記コンテンツのメタデータにおける所定のコンテンツの前記ジャンルと関連性のある属性の単語を、前記形態素解析ステップの処理による形態素解析結果より抽出するキーワード抽出ステップと
    を含む処理をコンピュータに実行させるプログラム。
  10. 請求項9に記載のプログラムが格納されているプログラム格納媒体。
JP2007303992A 2007-03-01 2007-11-26 情報処理装置および方法、並びにプログラム Pending JP2009059335A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2007303992A JP2009059335A (ja) 2007-08-07 2007-11-26 情報処理装置および方法、並びにプログラム
US12/072,840 US20080215577A1 (en) 2007-03-01 2008-02-28 Information processing apparatus and method, program, and storage medium
EP08152077A EP1965312A3 (en) 2007-03-01 2008-02-28 Information processing apparatus and method, program, and storage medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2007205082 2007-08-07
JP2007303992A JP2009059335A (ja) 2007-08-07 2007-11-26 情報処理装置および方法、並びにプログラム

Publications (1)

Publication Number Publication Date
JP2009059335A true JP2009059335A (ja) 2009-03-19

Family

ID=40554977

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007303992A Pending JP2009059335A (ja) 2007-03-01 2007-11-26 情報処理装置および方法、並びにプログラム

Country Status (1)

Country Link
JP (1) JP2009059335A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100113020A (ko) * 2009-04-10 2010-10-20 삼성전자주식회사 방송 프로그램 연관 정보 제공 장치 및 방법
JP2011229087A (ja) * 2010-04-22 2011-11-10 Jvc Kenwood Corp テレビ放送受信装置、検索制御方法、及び、プログラム
JP2012178001A (ja) * 2011-02-25 2012-09-13 Ntt Communications Kk 候補提示装置、方法及びプログラム
KR101285721B1 (ko) 2010-12-22 2013-07-18 주식회사 케이티 웹 마이닝을 이용한 콘텐츠 태그 생성 시스템 및 방법
JP2015050729A (ja) * 2013-09-04 2015-03-16 株式会社東芝 電子機器、電子機器の制御方法及びコンピュータプログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100113020A (ko) * 2009-04-10 2010-10-20 삼성전자주식회사 방송 프로그램 연관 정보 제공 장치 및 방법
JP2012523607A (ja) * 2009-04-10 2012-10-04 サムスン エレクトロニクス カンパニー リミテッド 放送プログラム関連情報提供装置および方法
US9202523B2 (en) 2009-04-10 2015-12-01 Samsung Electronics Co., Ltd. Method and apparatus for providing information related to broadcast programs
KR101644789B1 (ko) * 2009-04-10 2016-08-04 삼성전자주식회사 방송 프로그램 연관 정보 제공 장치 및 방법
JP2011229087A (ja) * 2010-04-22 2011-11-10 Jvc Kenwood Corp テレビ放送受信装置、検索制御方法、及び、プログラム
KR101285721B1 (ko) 2010-12-22 2013-07-18 주식회사 케이티 웹 마이닝을 이용한 콘텐츠 태그 생성 시스템 및 방법
JP2012178001A (ja) * 2011-02-25 2012-09-13 Ntt Communications Kk 候補提示装置、方法及びプログラム
JP2015050729A (ja) * 2013-09-04 2015-03-16 株式会社東芝 電子機器、電子機器の制御方法及びコンピュータプログラム

Similar Documents

Publication Publication Date Title
JP4284097B2 (ja) メディアコンテンツ記述をサポートする方法およびシステム
US20090094189A1 (en) Methods, systems, and computer program products for managing tags added by users engaged in social tagging of content
JP5171718B2 (ja) コンテンツ推薦装置、方法、及びプログラム
US20100332497A1 (en) Presenting an assembled sequence of preview videos
US8463596B2 (en) Selecting an optimal property of a keyword associated with program guide content for keyword retrieval
CN104503975B (zh) 推荐卡片的定制方法及装置
JP2008070959A (ja) 情報処理装置および方法、並びに、プログラム
KR20150118523A (ko) 검색 추천 방법 및 장치
JP2005056361A (ja) 情報処理装置および方法、プログラム、並びに記録媒体
US20100057721A1 (en) Information Providing Server, Information Providing Method, and Information Providing System
CN1620122A (zh) 内容提取方法和内容提取装置、内容信息显示方法和显示装置
KR101593991B1 (ko) 컨텐트 추천 방법 및 그 장치
EP1965312A2 (en) Information processing apparatus and method, program, and storage medium
JP2005057713A (ja) 情報処理装置および方法、プログラム、並びに記録媒体
JP2009059335A (ja) 情報処理装置および方法、並びにプログラム
CN108604250B (zh) 识别内容项的类别并按照类别组织内容项以呈现的方法、系统和介质
Kristensen et al. Cultural mediators seduced by Mad Men: How cultural journalists legitimized a quality TV series in the Nordic region
US8352985B2 (en) Method of storing and displaying broadcast contents and apparatus therefor
Scuglia The last days of gay porn
CN101256583A (zh) 信息处理设备和方法、程序和存储介质
Muñoz-Valdivieso ‘All the World’sa Stage’: William Shakespeare’s Cultural Capital 400 Years after his Death
JP4477931B2 (ja) 検索リクエスト装置、検索リクエスト方法、検索リクエストプログラムおよび検索リクエストプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2005202485A (ja) 映像提示装置
AU2012320783B2 (en) Method and apparatus for providing information for a multimedia content item
JP2001101195A (ja) テレビ番組検索装置および自動番組選択装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090402

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090528

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090618