JP2007213497A - 情報処理装置および方法、並びにプログラム - Google Patents

情報処理装置および方法、並びにプログラム Download PDF

Info

Publication number
JP2007213497A
JP2007213497A JP2006035312A JP2006035312A JP2007213497A JP 2007213497 A JP2007213497 A JP 2007213497A JP 2006035312 A JP2006035312 A JP 2006035312A JP 2006035312 A JP2006035312 A JP 2006035312A JP 2007213497 A JP2007213497 A JP 2007213497A
Authority
JP
Japan
Prior art keywords
content
keyword
score
extracted
text data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006035312A
Other languages
English (en)
Other versions
JP4923604B2 (ja
Inventor
Takeshi Takagi
剛 高木
Mototeru Kadokawa
元輝 角川
Riyouyu Watanabe
亮裕 渡辺
Toshiharu Yabe
俊治 矢部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2006035312A priority Critical patent/JP4923604B2/ja
Priority to US11/673,252 priority patent/US8041718B2/en
Publication of JP2007213497A publication Critical patent/JP2007213497A/ja
Application granted granted Critical
Publication of JP4923604B2 publication Critical patent/JP4923604B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/732Query formulation
    • G06F16/7343Query language or query format
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】共通するキーワードのスコアに基づいてコンテンツ同士の適合度を算出することができるようにする。
【解決手段】検索の基点となる基点コンテンツがクライアントPC2のユーザにより選択されたとき、サーバ1においては、基点コンテンツの内容を表すテキストデータである元データからキーワードが抽出されるとともに、抽出されたキーワードのスコアが算出される。また、元データから抽出されたキーワードと同じキーワードが抽出されたコンテンツが検索され、検索されたそれぞれのコンテンツについて、基点コンテンツとの適合度が算出される。適合度は、検索されたコンテンツから抽出されたキーワードと基点コンテンツの元データから抽出されたキーワードのうちの、共通するキーワードのスコアに基づいて算出される。本発明は、コンテンツの情報を管理する装置に適用することができる。
【選択図】図1

Description

本発明は、情報処理装置および方法、並びにプログラムに関し、特に、共通するキーワードのスコアに基づいて、コンテンツ同士の適合度を算出することができるようにした情報処理装置および方法、並びにプログラムに関する。
従来より、コンテンツを入力として、そのコンテンツと関連のあるコンテンツを検索する技術がある。
例えば、特許文献1には、番組を表示するとともに、表示している番組に関連したキーワードを抽出して、抽出したキーワードの一覧の中からユーザにより選択されたキーワードを元にWebページなどのコンテンツの検索を行い、検索結果として得られた所定のコンテンツを表示する技術が開示されている。すなわち、この技術においては、番組というコンテンツを入力として、Webページなどのコンテンツの検索が行われている。
特開2005−115790号公報
ところで、このようなコンテンツの検索において、例えば、検索の基点になるコンテンツから抽出されたキーワードと、検索先のコンテンツ(検索結果として選択される候補のコンテンツ)から抽出されたキーワードの双方に設定されているスコアにも基づいて、検索結果として出力するコンテンツを選択する基準となる適合度を算出する場合、単に、基点のコンテンツから抽出されたキーワードと同じキーワードが抽出されたコンテンツを検索結果のコンテンツとして選択したり、基点のコンテンツから抽出されたキーワードと同じキーワードがより多く抽出されたコンテンツを検索結果のコンテンツとして選択したりする場合に較べて、キーワードのスコアをも考慮した、検索結果のコンテンツを選択する基準としてより好ましい適合度を算出することができるものと考えられる。
本発明はこのような状況に鑑みてなされたものであり、共通するキーワードのスコアに基づいて、コンテンツ同士の適合度を算出することができるようにするものである。
本発明の一側面の情報処理装置は、検索の基点となる第1のコンテンツの内容を表すテキストデータから抽出されたキーワードとそれぞれのキーワードのスコアと、前記第1のコンテンツとの適合度を算出する第2のコンテンツの内容を表すテキストデータから抽出されたキーワードとそれぞれのキーワードのスコアを取得する取得手段と、前記第1と第2のコンテンツの適合度を、前記取得手段により取得された前記第1のコンテンツの内容を表すテキストデータから抽出されたキーワードと、前記第2のコンテンツの内容を表すテキストデータから抽出されたキーワードに共通して含まれるキーワードのスコアに基づいて算出する適合度算出手段と、前記適合度算出手段による算出結果に基づいて、前記第1のコンテンツとの適合度が高い所定の数の前記第2のコンテンツの情報を検索結果として出力する出力手段とを備える。
前記適合度算出手段には、前記第1のコンテンツの内容を表すテキストデータから抽出されたキーワードと、前記第2のコンテンツの内容を表すテキストデータから抽出されたキーワードに共通して含まれるキーワードのスコアを乗算し、共通して含まれるそれぞれのキーワードのスコアの乗算結果を加算して得られた値を、前記第1と第2のコンテンツの適合度として算出させることができる。
テキストデータからキーワードを抽出するとともに、抽出したそれぞれのキーワードのスコアを算出するキーワード抽出手段をさらに設けることができる。この場合、前記取得手段には、前記キーワード抽出手段による処理結果から、前記第1と第2のコンテンツの内容を表すテキストデータから抽出されたキーワードとそれぞれのキーワードのスコアを取得させることができる。
前記キーワード抽出手段には、テキストデータにおけるキーワードの出現頻度、テキストデータにおけるキーワードの出現位置、キーワードの属性のうちの少なくともいずれかに基づいて、それぞれのキーワードのスコアを算出させることができる。
前記取得手段には、さらに、前記第1のコンテンツとの適合度が算出された前記第2のコンテンのうちの所定のコンテンツを検索の基点となる前記第1のコンテンツとして、前記第1のコンテンツの内容を表すテキストデータから抽出されたキーワードとそれぞれのキーワードのスコアと、前記第2のコンテンツの内容を表すテキストデータから抽出されたキーワードとそれぞれのキーワードのスコアを取得させ、前記適合度算出手段には、前記第1と第2のコンテンツの適合度を、前記取得手段により取得された前記第1のコンテンツの内容を表すテキストデータから抽出されたキーワードと、前記第2のコンテンツの内容を表すテキストデータから抽出されたキーワードに共通して含まれるキーワードのスコアに基づいて算出させ、前記出力手段には、前記適合度算出手段による算出結果に基づいて、前記所定のコンテンツである前記第1のコンテンツとの適合度が高い所定の数の前記第2のコンテンツの情報を検索結果として出力させることができる。
本発明の一側面の情報処理方法またはプログラムは、検索の基点となる第1のコンテンツの内容を表すテキストデータから抽出されたキーワードとそれぞれのキーワードのスコアと、前記第1のコンテンツとの適合度を算出する第2のコンテンツの内容を表すテキストデータから抽出されたキーワードとそれぞれのキーワードのスコアを取得し、前記第1と第2のコンテンツの適合度を、取得した前記第1のコンテンツの内容を表すテキストデータから抽出されたキーワードと、前記第2のコンテンツの内容を表すテキストデータから抽出されたキーワードに共通して含まれるキーワードのスコアに基づいて算出し、算出結果に基づいて、前記第1のコンテンツとの適合度が高い所定の数の前記第2のコンテンツの情報を検索結果として出力するステップを含む。
本発明の一側面においては、検索の基点となる第1のコンテンツの内容を表すテキストデータから抽出されたキーワードとそれぞれのキーワードのスコアと、前記第1のコンテンツとの適合度を算出する第2のコンテンツの内容を表すテキストデータから抽出されたキーワードとそれぞれのキーワードのスコアが取得され、前記第1と第2のコンテンツの適合度が、取得された前記第1のコンテンツの内容を表すテキストデータから抽出されたキーワードと、前記第2のコンテンツの内容を表すテキストデータから抽出されたキーワードに共通して含まれるキーワードのスコアに基づいて算出される。また、適合度の算出結果に基づいて、前記第1のコンテンツとの適合度が高い所定の数の前記第2のコンテンツの情報が検索結果として出力される。
本発明の一側面によれば、共通するキーワードのスコアに基づいて、コンテンツ同士の適合度を算出することができる。
以下に本発明の実施の形態を説明するが、本発明の構成要件と、明細書又は図面に記載の実施の形態との対応関係を例示すると、次のようになる。この記載は、本発明をサポートする実施の形態が、明細書又は図面に記載されていることを確認するためのものである。従って、明細書又は図面中には記載されているが、本発明の構成要件に対応する実施の形態として、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その構成要件に対応するものではないことを意味するものではない。逆に、実施の形態が発明に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その構成要件以外には対応しないものであることを意味するものでもない。
本発明の一側面の情報処理装置(例えば、図1のサーバ1)は、検索の基点となる第1のコンテンツの内容を表すテキストデータから抽出されたキーワードとそれぞれのキーワードのスコアと、前記第1のコンテンツとの適合度を算出する第2のコンテンツの内容を表すテキストデータから抽出されたキーワードとそれぞれのキーワードのスコアを取得する取得手段(例えば、図11のキーワード抽出部102)と、前記第1と第2のコンテンツの適合度を、前記取得手段により取得された前記第1のコンテンツの内容を表すテキストデータから抽出されたキーワードと、前記第2のコンテンツの内容を表すテキストデータから抽出されたキーワードに共通して含まれるキーワードのスコアに基づいて算出する適合度算出手段(例えば、図11の適合度算出部105)と、前記適合度算出手段による算出結果に基づいて、前記第1のコンテンツとの適合度が高い所定の数の前記第2のコンテンツの情報を検索結果として出力する出力手段(例えば、図11の出力部106)とを備える。
この情報処理装置には、テキストデータからキーワードを抽出するとともに、抽出したそれぞれのキーワードのスコアを算出するキーワード抽出手段(例えば、図8のキーワード抽出エンジン73)をさらに設けることができる。
本発明の一側面の情報処理方法またはプログラムは、検索の基点となる第1のコンテンツの内容を表すテキストデータから抽出されたキーワードとそれぞれのキーワードのスコアと、前記第1のコンテンツとの適合度を算出する第2のコンテンツの内容を表すテキストデータから抽出されたキーワードとそれぞれのキーワードのスコアを取得し、前記第1と第2のコンテンツの適合度を、取得した前記第1のコンテンツの内容を表すテキストデータから抽出されたキーワードと、前記第2のコンテンツの内容を表すテキストデータから抽出されたキーワードに共通して含まれるキーワードのスコアに基づいて算出し、算出結果に基づいて、前記第1のコンテンツとの適合度が高い所定の数の前記第2のコンテンツの情報を検索結果として出力するステップ(例えば、図14のステップS47)を含む。
以下、本発明の実施の形態について図を参照して説明する。
図1は、本発明の一実施形態に係るコンテンツ検索システムの構成例を示す図である。
図1に示されるように、コンテンツ検索システムは、サーバ1とクライアントPC(Personal Computer)2が、インターネットなどよりなるネットワーク3を介して接続されることによって構成される。
後に詳述するように、サーバ1は、様々なコンテンツの内容を表すテキストデータに基づいて生成した、コンテンツのインデックスとなるインデックスデータを管理しており、その管理しているインデックスデータを参照して、クライアントPC2のユーザにより選択されたコンテンツに関連するコンテンツを検索し、検索結果をクライアントPC2に提供する。
インデックスデータは、コンテンツの内容を表すテキストデータから抽出された複数のキーワードと、それぞれのキーワードのスコアを対応付けたデータを含み、コンテンツ毎に生成される。スコアは、例えば、テキストデータ中のキーワードの出現頻度、テキストデータ中の出現位置、品詞などのキーワードの属性のうちの少なくともいずれかに基づいて算出される。
このようなデータからなるインデックスデータは、地上波放送やBS(Broadcasting Satellite)/CS(Communications Satellite)放送などによって放送されるテレビジョン番組、各種のポータルサイトなどから配信される、ニュースや解説などのRSS(Resource Description Framework Site Summary)形式の情報(以下、適宜、RSS記事という)、CD(Compact Disk)によってパッケージ販売されている音楽、DVD(Digital Versatile Disc)によってパッケージ販売されている映画などのコンテンツについて生成される。
例えば、テレビジョン番組の内容を表すテキストデータとしては、番組のタイトル、出演者、ジャンル、番組の概要などが記述されるEPG(Electronic Program Guide)が用いられ、それに基づいてテレビジョン番組のインデックスデータが生成される。
RSS記事の内容を表すテキストデータとしては、サーバから配信される、記事を構成するデータ(テキストデータ)が用いられ、それに基づいてRSS記事のインデックスデータが生成される。
音楽の内容を表すテキストデータとしては、音楽コンテンツの属性情報に記述されていたり、ネットワーク3上の所定のサーバに用意される、音楽のタイトル、アーティスト名、ジャンルなどの情報が用いられ、それに基づいて音楽のインデックスデータが生成される。
映画の内容を表すテキストデータとしては、映画コンテンツの属性情報に記述されていたり、ネットワーク3上の所定のサーバに用意される、映画のタイトル、出演者名、ジャンルなどの情報が用いられ、それに基づいて映画のインデックスデータが生成される。
また、クローズドキャプションデータ(映像の表示にあわせて画面上に表示される字幕のデータ)もテレビジョン番組や映画の内容を表すデータであるから、テレビジョン番組や映画のインデックスデータを生成する元になるデータとして用いられる。
サーバ1においては、コンテンツの内容を表す以上のようなテキストデータ自体も管理されている。以下、適宜、インデックスデータを生成する元になる、コンテンツの内容を表す以上のようなテキストデータを元データという。
以上のようにして管理されるインデックスデータを用いて、サーバ1においては例えば図2に示されるようにしてコンテンツの検索が行われる。
図2の左端に示されるように、検索の基点となるコンテンツ(基点コンテンツ)がクライアントPC2のユーザにより選択されたとき、サーバ1においては、実線矢印A1の先に示されるように、基点コンテンツの元データからキーワードが抽出されるとともに、抽出されたそれぞれのキーワードのスコアが算出される。上述したように、サーバ1には様々なコンテンツの元データが管理されており、管理されている元データには、クライアントPC2のユーザにより選択された基点コンテンツの元データも含まれている。
キーワードが抽出されるとともにそれぞれのキーワードのスコアが算出されたとき、サーバ1においては、実線矢印A2の先に示されるように、キーワードとそのスコアに基づくコンテンツの検索が行われる。
例えば、インデックスデータを管理しているコンテンツのうち、基点コンテンツの元データから抽出されたキーワードと同じキーワードがインデックスデータに含まれるコンテンツが検索され、検索されたコンテンツのそれぞれについて、基点コンテンツとの適合度が算出される。適合度の算出は、注目されたコンテンツ(基点コンテンツの元データから抽出されたキーワードと同じキーワードがインデックスデータに含まれるコンテンツのうちの注目された1つのコンテンツ)のインデックスデータに含まれるキーワードと、基点コンテンツの元データから抽出されたキーワードのうちの、共通するキーワードのスコアに基づいて行われる。
検索されたコンテンツとの適合度が算出されたとき、基点コンテンツとの適合度の高い所定の数のコンテンツが、実線矢印A3の先に示されるように、関連コンテンツとしてクライアントPC2に提示される。
なお、図2に示されるように、キーワードの抽出とスコアの算出は、サーバ1に用意されるソフトウエアのうちのキーワード抽出エンジンによって行われ、キーワード抽出エンジンによる処理結果に基づいて行われる関連コンテンツの検索は検索アプリケーションによって行われる。
以上のように、クライアントPC2のユーザは、検索の基点となるコンテンツを選択するだけで、そのコンテンツの元データに含まれるキーワードのスコアと、検索先となるコンテンツ(サーバ1にインデックスデータが管理されているコンテンツ)の元データに含まれるキーワードのスコアとを考慮した、好適なコンテンツの検索をサーバ1に行わせることができる。
図1の説明に戻り、以上のような処理をサーバ1に行わせるクライアントPC2にはブラウザが搭載されている。クライアントPC2のユーザは、ブラウザ画面上で、上述した基点コンテンツを選択したり、検索結果として提供された関連コンテンツの一覧を確認したりすることができる。
ここで、クライアントPC2のディスプレイに表示される画面の例について説明する。
図3は、基点コンテンツの選択画面の例を示す図である。
基点コンテンツの選択画面は、例えば、基点コンテンツのカテゴリを選択するときに用いられる情報が表示される表示領域11と、基点コンテンツを選択するためのさらに詳細な選択を行うときに用いられる情報が表示される表示領域12から構成される。
図3の例において、表示領域11には「CCデータ」(Closed Captionデータ)、「EPGデータ」、「RSSデータ」、「CDデータ」、「DVDデータ」の文字が表示され、クライアントPC2のユーザが、マウスなどでカーソルを移動させて所定の項目を選択することによって、クローズドキャプションデータ、EPGに情報が掲載されるテレビジョン番組、RSS記事、音楽、映画の中から基点コンテンツのカテゴリを選択することができるようになされている。
クローズドキャプションデータをも基点コンテンツとして選択することができるように、テキストデータによって内容が表されたり、テキストデータそのものを含むものであれば、どのようなデータが基点コンテンツや検索先のコンテンツとして扱われるようにしてもよい。
図3の表示領域12には、「EPGデータ選択」の文字が左上に表示されている。すなわち、図3の画面は、表示領域11に表示されるカテゴリの中から、基点コンテンツのカテゴリとして「EPGデータ」が選択された場合の例を示している。ユーザは、図3の表示領域12の表示から、複数の放送(サービス)の中から所定の放送を選択したり、番組表を表示させる日にちを選択したりすることができる。
例えば、所定の放送と日にちが選択されたとき、表示領域12には、選択された放送で、選択された日にちに放送される番組の番組表が表示される。ユーザは、その番組表から、基点コンテンツとなるテレビジョン番組を選択することができる。
図4は、検索の設定画面の例を示す図である。この設定画面は、例えば、基点コンテンツが選択されたときに図3の画面に替えて表示される。
図4に示されるように、検索の設定画面は、例えば、ユーザにより選択された基点コンテンツに関する情報が表示される表示領域21、関連コンテンツの検索に用いられるキーワードの設定に関する情報が表示される表示領域22、および、検索結果が表示される表示領域23から構成される。
表示領域21には、基点コンテンツのカテゴリが表示されるカテゴリ表示欄21Aが表示され、その右隣には、基点コンテンツのタイトルが表示されるタイトル表示欄21Bが表示されている。図4の例においては、カテゴリ表示欄21Aには「EPG」が表示され、タイトル表示欄21Bには「[字]魚釣り番組「にっぽん編」」が表示されている。すなわち、図4の画面は、番組表に掲載されている番組の中から、「[字]魚釣り番組「にっぽん編」」のタイトルのテレビジョン番組が基点コンテンツとして選択された場合の例を示している。
カテゴリ表示欄21Aとタイトル表示欄21Bの下には、基点コンテンツの内容を表すテキストデータ(元データ)が表示される対象文表示欄21Cが表示されている。図4の例においては、その対象文表示欄21Cには放送日時、放送開始時刻、タイトル、概要などの、EPGに記述されているテキストデータが表示されている。ユーザは、タイトル表示欄21Bの右隣に表示されているボタン21Dを押すことによって、この対象文表示欄21Cに表示されているテキストデータを対象としたキーワードの抽出とスコアの算出をサーバ1に行わせることができる。
対象文表示欄21Cの右隣にはスコア値計算設定欄21Eが表示され、スコア値計算設定欄21Eの表示から、ユーザがスコアの算出に関する設定を行うことができるようになされている。図4の例においては、スコアの算出を、出現頻度(TF(Task Frequency))を考慮して行うこと、同義語を考慮して行うこと、出現位置を考慮して行うこと、キーワードの属性を考慮して行うこと、がユーザにより設定されている。設定の内容については適宜後述する。
また、スコア値計算設定欄21Eの右隣にはキーワード抽出設定欄21Fが表示され、キーワード抽出設定欄21Fの表示から、ユーザがキーワードの抽出に関する設定を行うことができるようになされている。図4の例においては、キーワードの抽出を、抽出するキーワードの個数の閾値を設けないで行うこと、スコアを考慮しないで行うこと、複合語を考慮しないで行うこと、がユーザにより設定されている。
表示領域22には、適合度を算出するアルゴリズムに関する情報が表示される適合度アルゴリズム欄22Aが表示され、その下には、キーワードの展開に関する情報が表示される展開対応欄22Bが表示されている。図4の例においては、適合度アルゴリズム欄22Aには「B」(「B」によって識別されるアルゴリズムによって適合度を算出すること)が表示され、展開対応欄22Bにはキーワードの展開を行うこと(「する」)が表示されている。
展開対応欄22Bの下には、適合度を計算するときに用いられる係数に関する情報が表示される適合度計算レート欄22Cが表示され、適合度計算レート欄22Cの下には、検索の対象とするコンテンツ(検索先のコンテンツ)の範囲に関する情報が表示される検索対象欄22Dが表示されている。図4の例においては、適合度計算レート欄22Cには、それぞれの係数が「1.0」として表示され、検索対象欄22Dには、テレビジョン番組(EPG)、RSS記事(RSS)、音楽(CD)、映画(DVD)、クローズドキャプションデータ(CC)、Webコンテンツ(Web)のうち、テレビジョン番組とRSS記事を対象として検索を行うことが表示されている。
検索対象欄22Dの下には、検索結果の表示順に関する情報が表示される表示順序欄22Eが表示され、表示順序欄22Eの下には、検索結果の表示件数に関する情報が表示される表示件数欄22Fが表示されている。図4の例においては、表示順序欄22Eには、コンテンツ単位で検索結果を表示することが表示され、表示件数欄22Fには、10件までのコンテンツを検索結果として表示することが表示されている。
表示領域21に表示されているボタン21Dが押されたとき、以上のような各欄から設定された内容にしたがってサーバ1によりキーワードの抽出とスコアの算出が行われる。キーワードの抽出とスコアの算出が行われたとき、その結果が、サーバ1からクライアントPC2に対して送信される。
図5は、キーワードの抽出結果の表示画面の例を示す図である。この表示画面は、ボタン21Dが押されたときに図4の画面に替えて表示される。
図5に示される画面は、その表示領域22に、基点コンテンツの元データから抽出されたキーワードの一覧22Gが表示されている点を除いて図4の画面と同様のものである。
図5の例においては、基点コンテンツとして選択された「[字]魚釣り番組「にっぽん編」」のテレビジョン番組の元データ(対象文表示欄21Cに表示されているテキストデータ)から「吉岡」、「にっぽん」、「鳥羽」、「マハタ」、・・・などのキーワードが抽出され、一覧表示されている。
また、それぞれのキーワードの隣にはスコアや属性などが表示されている。例えば、図5の例においては、「吉岡」のスコアは「13.00」とされ、「にっぽん」のスコアは「12.00」とされている。また、「鳥羽」のスコアは「6.00」とされ、「マハタ」のスコアは「4.00」とされている。適合度の算出に際しては、このスコアが考慮される。
さらに、それぞれのキーワードの左隣にはチェックボックスが表示されており、ユーザは、チェックボックスにチェックをつけたりチェックを外したりして、関連コンテンツの検索に用いるキーワードを選択することができる。
図5に示されるような画面が表示されている状態で表示領域22の右上に表示されているボタン22Hがユーザにより押されたとき、検索に用いるものとしてチェックがつけられたキーワードやそのスコアが参照されて、サーバ1により関連コンテンツの検索が行われる。関連コンテンツの検索が行われたとき、その結果がサーバ1からクライアントPC2に対して送信される。
図6は、関連コンテンツの検索結果の表示画面の例を示す図である。この表示画面は、ボタン22Hが押され、関連コンテンツの検索結果がサーバ1から送信されてきたときに図5の画面に替えて表示される。
関連コンテンツの検索結果がサーバ1から送信されてきたとき、図6に示されるように、表示領域23には関連コンテンツの一覧が表示される。表示領域22の表示は図4の表示領域22の表示と同じであり、表示領域21の表示はそれまでの表示と同じである。
図6の例においては、「[字][デ]魚釣り番組「アメリカ編」」のタイトルのテレビジョン番組と、「[字][デ]魚釣り番組「南米編」」のタイトルのテレビジョン番組が関連コンテンツの検索結果として表示されている。また、関連コンテンツの情報として、適合度、Network、放送局、放送開始日、放送開始時刻、放送時間、タイトル、詳細がそれぞれ表示されている。基点コンテンツと前者の番組との適合度は「35.11」とされ、後者の番組との適合度は「13.98」とされている。」
このようにして表示される検索結果から、ユーザは、基点コンテンツとして選択したコンテンツとそれぞれの関連コンテンツとの適合具合などを確認することができる。
以上のような画面表示によってクライアントPC2のユーザに関連コンテンツの検索結果を提示するサーバ1の処理についてはフローチャートを参照して後述する。
図7は、サーバ1のハードウエア構成の例を示すブロック図である。
CPU(Central Processing Unit)51は、ROM(Read Only Memory)52、または記憶部58に記憶されているプログラムに従って各種の処理を実行する。RAM(Random Access Memory)53には、CPU51が実行するプログラムやデータなどが適宜記憶される。これらのCPU51、ROM52、およびRAM53は、バス54により相互に接続されている。
CPU51にはまた、バス54を介して入出力インターフェース55が接続されている。入出力インターフェース55には、キーボード、マウス、マイクロホンなどよりなる入力部56、ディスプレイ、スピーカなどよりなる出力部57が接続されている。CPU51は、入力部56から入力される指令に対応して各種の処理を実行する。
入出力インターフェース55に接続されている記憶部58は、例えばハードディスクからなり、CPU51が実行するプログラムや各種のデータを記憶する。通信部59は、ネットワーク3を介してクライアントPC2などの外部の装置と通信を行う。
入出力インターフェース55に接続されているドライブ60は、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア61が装着されたとき、それらを駆動し、そこに記録されているプログラムやデータなどを取得する。取得されたプログラムやデータは、必要に応じて記憶部58に転送され、記憶される。
図8は、サーバ1のソフトウエア構成の例を示す図である。
図8に示されるように、サーバ1には検索アプリケーション72とキーワード抽出エンジン73が用意され、基本的にこの2つのソフトウエアによって、クライアントPC2のユーザにより選択されたコンテンツを基点とした関連コンテンツの検索が実現される。関連コンテンツの検索に用いられるデータのデータベースとしてデータベース71もサーバ1には用意される。
データベース71には、クローズドキャプションデータ、テレビジョン番組、RSS記事、音楽、映画の内容を表すテキストデータである元データと、元データに基づいて生成された、それらのコンテンツのインデックスデータが記憶される。元データに基づくインデックスデータの生成は、例えば、関連コンテンツの検索がクライアントPC2から要求される前にキーワード抽出エンジン73によってあらかじめ行われる。
検索アプリケーション72は、ネットワーク3を介してクライアントPC2との間で通信を行い、検索の基点となるコンテンツがクライアントPC2のユーザにより選択されたとき、選択された基点コンテンツの元データをデータベース71から読み出してそれをキーワード抽出エンジン73に出力し、キーワードの抽出とスコアの算出をキーワード抽出エンジン73に行わせる。基点コンテンツの元データがクライアントPC2から提供される場合、それがキーワード抽出エンジン73に供給されるようにしてもよい。
キーワードの抽出の際、検索アプリケーション72は、適宜、基点コンテンツの元データから抽出されたキーワードの展開を、API(Application Programming Interface)75を介して展開モジュールに行わせ、展開したキーワードのスコアもキーワード抽出エンジン73に算出させる。展開したキーワードとは、基点コンテンツの元データから抽出されたキーワードと同義語、上位語、下位語、関連語の関係にあるキーワードである。例えば、あるアイドルグループのグループ名が基点コンテンツの元データからキーワードとして抽出された場合、そのアイドルグループのメンバーの名前も、基点コンテンツの元データから抽出されたグループ名に対して下位語の関係にあるキーワードとしてコンテンツの検索に用いられる。
ある単語と同義語の関係にある単語(同じ意味の単語)、ある単語と上位語の関係にある単語(上位の概念の単語)、ある単語と下位語の関係にある単語(下位の概念の単語)、ある単語と関連語の関係にある単語(関連のある単語)が、展開モジュールが管理する展開辞書において対応付けられている。
このようにして展開されたキーワード対しては、図4の画面の適合度計算レート欄22Cにおいて設定された係数を考慮してスコアが算出される。例えば、展開元(上述した例の場合グループ名)のキーワードに設定されたスコアに係数を乗算した値が、展開先(上述した例の場合メンバーの名前)のキーワードのスコアとして設定される。
検索アプリケーション72は、処理結果のキーワードとスコアがキーワード抽出エンジン73から供給されたとき、ユーザにより選択された範囲のコンテンツを対象として、基点コンテンツの元データから抽出されたキーワードと同じキーワードをインデックスデータに含むコンテンツの検索を行う。
また、検索アプリケーション72は、検索により得られた、基点コンテンツの元データから抽出されたキーワードと同じキーワードをインデックスデータに含むコンテンツに順次注目し、注目したコンテンツと基点コンテンツとの適合度を、キーワード抽出エンジン73の処理結果と注目コンテンツのインデックスデータに基づいて算出する。
図9は、適合度の算出の例を示す図である。
図9の左側には、基点コンテンツの元データに基づいてキーワード抽出エンジン73により取得されたキーワードとそれぞれのスコア、および、データベース71に記憶されている、注目コンテンツのインデックスデータに含まれるキーワードとそれぞれのスコアが示されている。
図9の例においては、基点コンテンツのキーワードとして「吉岡」、「にっぽん」、「鳥羽」、「マハタ」、・・・が示されており、それぞれのスコアは「13.00」、「12.00」、「6.00」、「4.00」、・・・とされている。また、注目コンテンツのキーワードとして「名倉」、「渡部」、「にっぽん」、「吉岡」、・・・が示されており、それぞれのスコアは「14.00」、「11.00」、「10.00」、「9.00」、・・・とされている。
このようなキーワードとスコアが取得された場合、適合度は、例えば、共通するキーワード同士のスコアを乗算し、共通して含まれるそれぞれのキーワードのスコアの乗算結果を加算することによって求められるから、図9の右側に示されるように、共通のキーワードである「吉岡」、「にっぽん」、・・・のそれぞれのキーワードについて、基点コンテンツの元データにおけるスコアと注目コンテンツの元データ(インデックスデータ)におけるスコアの乗算結果を加算することが検索アプリケーション72において行われ、適合度が算出される。
図8の説明に戻り、検索アプリケーション72は、検索によって得られた全てのコンテンツについて基点コンテンツとの適合度を求めたとき、基点コンテンツとの適合度の高い順に例えば10個などの所定の数のコンテンツを選択し、選択したコンテンツの一覧を検索結果としてクライアントPC2のディスプレイに表示させる。
キーワード抽出エンジン73は、基点コンテンツの元データが検索アプリケーション72から供給されたとき、供給された元データ(テキストデータ)の表記を統一する処理を、形態素解析の前処理として行う。例えば、RSS記事のテキストデータが元データとして供給された場合、見出しの部分と本文の部分とではフォントの種類やサイズが異なることがあり、それが同じフォント、同じサイズのものに統一される。
また、キーワード抽出エンジン73は、前処理を行ったテキストデータを対象としてAPI74を活用した形態素解析を行い、基点コンテンツの内容を表すテキストデータを形態素(意味のある言語の最小単位(単語))に分割する。
キーワード抽出エンジン73は、形態素解析の結果に基づいて、複合処理、属性付与処理、除外処理、キーワード集約処理、スコア算出処理、キーワード出力処理を、形態素解析の後処理として順に行う。
ここで、複合処理は、ある人の性と名がそれぞれ別々の形態素として分割されている場合にそれらを1つの形態素にまとめたり、「会社」などのように、その前にある形態素とまとめた方がコンテンツの検索に用いるときに意味があると考えられる形態素を他の形態素とともに1つの形態素にまとめたりするように、複数の形態素を1つの形態素に複合させる処理である。
属性付与処理は、品詞などの属性をそれぞれの形態素に付与する処理である。ここで付与された属性をも考慮して形態素(単語)にスコアが設定される。
除外処理は、除外品詞リストに登録されている品詞の形態素と、除外単語リストに登録されている形態素(単語)がキーワードとして選択されないように除外するとともに、除外品詞リストに登録されている品詞の形態素であるとして除外された形態素の中から、追加単語リストに登録されている形態素を、キーワードとして選択される候補の単語として追加する処理である。
キーワード集約処理は、同じ形態素を1つに集約させる処理である。
スコア算出処理は、上述したように、出現頻度、出現位置、属性などに基づいて、それぞれの形態素にスコアを設定する処理である。
出現頻度に基づくスコアの設定においては、例えば、元データ中に同じ形態素が3回出現する場合、1回出現する毎に与えられるスコアが3倍されて、その形態素に与えられる。
出現位置に基づくスコアの設定においては、例えば、RSS記事のタイトル部分に出現する形態素に対して本文中に出現する形態素よりも高いスコアが与えられたり、高いスコアが与えられる位置、中程度のスコアが与えられる位置、低いスコアが与えられる位置にテキストデータ中の位置が分類され、番組表のタイトル部分に出現する形態素に対しては高いスコア、詳細情報(概要)の部分に出現する形態素に対しては中程度のスコア、詳細情報(拡張情報)の部分に出現する形態素に対しては低いスコアが与えられる。
属性に基づくスコアの設定においては、例えば、固有名詞や人物名の形態素には高いスコアが与えられ、普通名詞や動詞の形態素には、それよりも低いスコアが与えられる。
出現頻度、出現位置、属性のうちのどれを考慮してスコアを算出するのかは、クライアントPC2のユーザにより、図4の画面のスコア値計算設定欄21Eにおいて選択される。
なお、クライアントPC2のユーザは、同義語を考慮してスコアを算出させることもできる。同義語を考慮したスコアの算出とは、展開辞書を利用して、実質的に同じ語であると考えられる形態素は1つにまとめ、そのまとめた形態素に1つのスコアを設定することである。
以上のようなそれぞれの要素を考慮して、それぞれの形態素、すなわちキーワードにスコアが設定される。
キーワード出力処理は、キーワードとスコアを対応付けて処理結果を検索アプリケーション72に出力する処理である。
なお、このようなキーワード抽出エンジン73による処理は、検索アプリケーション72から供給された基点コンテンツの元データを対象として行われるだけでなく、データベース71に記憶されている元データをも対象として所定のタイミングで行われる。データベース71に記憶されている元データを対象として処理が行われることによってキーワード抽出エンジン73により得られたインデックスデータはデータベース71に記憶され、関連コンテンツの検索に用いられる。
図10は、検索アプリケーション72とキーワード抽出エンジン73により行われる処理の流れを示す図であり、図2に示されるものをより詳細に示したものである。
状態S1として、基点コンテンツの元データが検索アプリケーション72により読み込まれ、状態S2として、基点コンテンツの元データに基づくキーワードの抽出とスコアの算出がキーワード抽出エンジン73により行われる。また、状態S3として、キーワードの展開が展開モジュールにより行われ、状態S4として、コンテンツの検索がインデックスデータを参照して検索アプリケーション72により行われる。状態S5として適合度の算出が行われ、状態S6として検索結果が表示される。
図11は、サーバ1の機能構成例を示すブロック図である。図11に示す機能部のうちの少なくとも一部は、図8の検索アプリケーション72とキーワード抽出エンジン73によって実現される。
図11に示されるように、サーバ1においては、コンテンツ選択部101、キーワード抽出部102、展開部103、検索部104、適合度算出部105、および出力部106が実現される。
コンテンツ選択部101は、検索の基点となるコンテンツがクライアントPC2により選択されたとき、選択された基点コンテンツの元データをデータベース71から読み出してキーワード抽出部102に出力する。
キーワード抽出部102は、基点コンテンツの元データがコンテンツ選択部101から供給されたとき、図8を参照して説明したような前処理、形態素解析、後処理を行い、元データからキーワードを抽出するとともに、抽出したキーワードのスコアを算出する。キーワード抽出部102は、それらの処理によって得られたキーワードとスコアを展開部103に出力する。
展開部103は、キーワード抽出部102により抽出されたキーワードを展開し、展開したキーワードについてもスコアを算出する。展開されたキーワードのスコアは、展開元のキーワードのスコアに、クライアントPC2のユーザにより設定された所定の係数を乗算することによって算出される。展開部103は、展開したキーワードとそのスコアを、キーワード抽出部102から供給されたキーワードとスコアとともに検索部104に出力する。
検索部104は、キーワードとスコアが展開部103から供給されたとき、クライアントPC2のユーザにより指定された範囲のコンテンツを対象として、基点コンテンツの元データから抽出されたキーワードと同じキーワードをインデックスデータに含むコンテンツを検索し、検索して得られたコンテンツのインデックスデータ(キーワードとスコア)をデータベース71から読み出して、基点コンテンツのキーワード、スコアとともに適合度算出部105に出力する。
適合度算出部105は、検索部104により検索されたコンテンツに順次注目し、注目したコンテンツと基点コンテンツとの適合度を、検索部104から供給されたデータに基づいて図9を参照して説明したようにして算出する。適合度算出部105は、基点コンテンツと、注目したそれぞれのコンテンツとの適合度を出力部106に出力する。
出力部106は、適合度算出部105から供給されたデータに基づいて基点コンテンツとの適合度が高い所定の数のコンテンツを選択し、選択したコンテンツの一覧をクライアントPC2のディスプレイに表示させる。関連コンテンツの検索結果を表示させるとき、適宜、データベース71に記憶されている関連コンテンツの元データ(関連コンテンツがテレビジョン番組である場合、タイトル、放送日、放送開始時刻などの、図6の表示欄23に表示されている情報)も参照される。
次に、以上のような構成を有するサーバ1の動作について説明する。
はじめに、図12のフローチャートを参照して、サーバ1のインデックスデータ生成処理について説明する。この処理は、例えば、クライアントPC2から関連コンテンツの検索が要求される前に行われる。
ステップS11において、コンテンツ選択部101は、インデックスデータを生成する対象のコンテンツを選択し、ステップS12に進み、インデックスデータを生成する元になる元データを取得する。例えば、対象のコンテンツの元データがデータベース71に記憶されている場合、データベース71から読み出されることによって取得される。対象のコンテンツの元データがデータベース71に記憶されていない場合、元データを管理する所定のサーバからネットワーク3を介して取得されるようにしてもよい。コンテンツ選択部101により取得された元データはキーワード抽出部102に出力される。
ステップS13において、キーワード抽出部102はキーワード抽出/スコア算出処理を行う。この処理により、元データからキーワードが抽出されるとともに、抽出されたそれぞれのキーワードのスコアが算出される。キーワード抽出/スコア算出処理の詳細については図13のフローチャートを参照して後述する。
ステップS14において、キーワード抽出部102は、キーワード抽出/スコア算出処理により取得されたキーワードとスコアを含むデータを、インデックスデータとしてデータベース71に登録する。
以上の処理が様々なコンテンツを対象として繰り返されることによって、データベース71には、関連コンテンツの検索に用いることが可能なインデックスデータが用意される。
次に、図13のフローチャートを参照して、図12のステップS13において行われるキーワード抽出/スコア算出処理について説明する。
ステップS21において、キーワード抽出部102は、コンテンツ選択部101から元データが供給されたとき、供給された元データの表記を統一する処理を形態素解析の前処理として行う。
キーワード抽出部102は、ステップS22において、ステップS21において表記を統一したテキストデータを対象として形態素解析を行い、テキストデータを形態素に分割する。
ステップS23において、キーワード抽出部102は、複数の形態素を1つの形態素に複合させる複合処理を行い、ステップS24に進み、複合処理により得られた形態素に対して属性を付与する。
ステップS25において、キーワード抽出部102は、除外品詞リストに登録されている品詞の形態素と、除外単語リストに登録されている形態素(単語)を除外するなどの除外処理を行い、ステップS26に進み、残った形態素を対象としてキーワード集約処理を行う。
ステップS27において、キーワード抽出部102は、キーワードのそれぞれのスコアを算出し、ステップS28に進み、キーワードとスコアを対応付けて出力する。その後、図12のステップS13に戻り、出力されたキーワードとスコアがインデックスデータに含められてデータベース71に登録される。
次に、図14のフローチャートを参照して、サーバ1の関連コンテンツ検索処理について説明する。この処理は、図3に示されるような画面を用いてクライアントPC2のユーザにより基点コンテンツが選択されたときに開始される。
ステップS41において、コンテンツ選択部101は、クライアントPC2のユーザによる指示にしたがって基点コンテンツを選択し、選択した基点コンテンツの元データをデータベース71から読み出してキーワード抽出部102に出力する。
ステップS42において、キーワード抽出部102は、コンテンツ選択部101から供給された元データに基づいてキーワード抽出/スコア算出処理を行う。この処理により、基点コンテンツの元データからキーワードが抽出されるとともに、抽出されたそれぞれのキーワードのスコアが算出される。得られたキーワードとスコアは展開部103に出力される。ここで行われるキーワード抽出/スコア算出処理も、図13のフローチャートを参照して説明した処理と同様の処理である。
ステップS43において、展開部103は、キーワード抽出部102から供給されたキーワードを展開して、展開したキーワードについてもスコアを算出する。展開部103は、展開したキーワードとそのスコアを、キーワード抽出部102から供給されたキーワードとスコアとともに検索部104に出力する。
ステップS44において、検索部104は、クライアントPC2のユーザにより指定された範囲のコンテンツを対象として、基点コンテンツの元データから抽出されたキーワードと同じキーワードをインデックスデータに含むコンテンツを検索し、検索して得られたコンテンツの中から1つのコンテンツに注目して、注目したコンテンツのインデックスデータを、基点コンテンツのキーワード、スコアとともに適合度算出部105に出力する。
適合度算出部105は、ステップS45において、注目したコンテンツと基点コンテンツとの適合度を、検索部104から供給されたデータに基づいて算出し、ステップS46に進み、検索された全てのコンテンツとの適合度を算出したか否かを判定する。
適合度算出部105は、ステップS46において、全てのコンテンツとの適合度を算出していないと判定した場合、ステップS44に戻り、それ以降の処理を繰り返し実行する。適合度算出部105は、ステップS46において、全てのコンテンツとの適合度を算出したと判定した場合、基点コンテンツとそれぞれのコンテンツとの適合度を出力部106に出力し、ステップS47に進む。
ステップS47において、出力部106は、適合度算出部105から供給されたデータに基づいて、基点コンテンツとの適合度の高い所定の数のコンテンツを選択し、選択したコンテンツの一覧をクライアントPC2のディスプレイに表示させる。
以上の処理により、基点コンテンツとの適合度を含む、関連コンテンツの検索結果が図6に示されるようにして表示される。
以上においては、クライアントPC2のユーザにより基点コンテンツが選択されたとき、選択された基点コンテンツの元データに基づいてキーワード抽出エンジン73によりキーワードの抽出とスコアの算出が行われるものとしたが、選択された基点コンテンツの元データから抽出されたキーワードとスコアがインデックスデータに含められてデータベース71にあらかじめ記憶されている場合、キーワード抽出エンジン73による処理は行われずに、データベース71に記憶されているインデックスデータに含まれるキーワードとスコアが用いられてコンテンツの検索が行われるようにしてもよい。
また、以上においては、基点コンテンツとの適合度の高い所定の数の関連コンテンツが検索結果としてクライアントPC2のユーザに提示されるものとしたが、検索結果として得られた関連コンテンツのうちの所定のコンテンツを基点コンテンツとして、さらに、関連コンテンツの検索(関連検索)が繰り返され、その所定のコンテンツとの適合度の高い所定の数のコンテンツが検索結果として提示されるようにしてもよい。
図15は、このように、関連検索が繰り返される処理について説明する図である。
図15の例においては、その上方に示されるように、例えば、「イ・ビュンハン×長谷川東子が出演。・・・」のタイトルのRSS記事を基点コンテンツとして関連検索が行われ、その基点コンテンツとの適合度が「14.83」である「ビュン様の新作映画・・・」のタイトルのRSS記事、適合度が「14.73」である「こんにちはイ・ビュンハン・・・」のタイトルのRSS記事、適合度が「10.33」である「イ・ビュンハンが語ったり・・・」のタイトルのテレビジョン番組が検索結果の関連コンテンツとされている。
この場合、例えば、図16に示されるように、基点コンテンツとの適合度が最も高い「ビュン様の新作映画・・・」のタイトルのRSS記事が基点コンテンツとされて、「イ・ビュンハン×長谷川東子が出演。・・・」のタイトルのRSS記事を基点コンテンツとしたときと同様に、さらに、関連検索が行われる。
これにより、クライアントPC2のユーザは、最初の基点コンテンツである「イ・ビュンハン×長谷川東子が出演。・・・」のタイトルのRSS記事に対して対象を広げた形で検索を行うことができ、間接的に関連のあるコンテンツの検索結果を得ることができる。図15に示されるような、ユーザが選択したコンテンツを基点とした関連検索は、基点コンテンツに直接的に関連のあるコンテンツを検索するものであるのに対し、図16に示されるような、関連コンテンツのうちの所定のものを基点コンテンツとした関連検索は、基点コンテンツ(最初の基点コンテンツ)に間接的に関連のあるコンテンツを検索する、いわば先取り的な検索ということができる。
図17は、関連検索を繰り返し行い、その過程で検索結果として得られた関連コンテンツのうちの基点コンテンツとの適合度が最も高い関連コンテンツだけを最終的な検索結果とする処理の例を示す図である。
図17の例においては、「イ・ビュンハン×長谷川東子が出演。・・・」のタイトルのRSS記事を基点コンテンツとしてキーワード抽出が行われ、「日本」、「韓国」、「イ・ビュンハン」、「長谷川東子」、「香港」のキーワードが得られている。また、そのキーワードとスコアに基づいて1回目の関連検索が行われ、検索結果として得られた関連コンテンツのうちの、基点コンテンツとの適合度が最も高い「ビュン様の新作映画・・・」のタイトルのRSS記事が最終的な検索結果の1つとして保存されている。
また、1回目の関連検索により基点コンテンツとの適合度が最も高いコンテンツとして検索された「ビュン様の新作映画・・・」のタイトルのRSS記事を基点コンテンツとしてキーワード抽出が行われ、「日本」、「韓国」、「イ・ビュンハン」、「映画」、「キム」のキーワードが得られている。また、そのキーワードとスコアに基づいて2回目の関連検索が行われ、検索結果として得られた関連コンテンツのうちの、基点コンテンツ(「ビュン様の新作映画・・・」のタイトルのRSS記事)との適合度が最も高い「イ・ビュンハン、キム、ギャンサンウ、ヨンジュン独占インタビュー・・・」のタイトルのテレビジョン番組が最終的な検索結果の1つとして保存されている。
「ビュン様の新作映画・・・」のタイトルのRSS記事から抽出されたキーワードのうちの「映画」と「キム」は、最初の基点コンテンツからは抽出されていないキーワードであり、このように、最初の基点コンテンツからは抽出されないキーワードに基づいて検索が行われることにより、最初の基点コンテンツと間接的に関連のあるコンテンツの検索が可能となる。
さらに、図17の例においては、2回目の関連検索により基点コンテンツとの適合度が最も高いコンテンツとされた「イ・ビュンハン、キム、ギャンサンウ、ヨンジュン独占インタビュー・・・」のタイトルのテレビジョン番組を基点コンテンツとしてキーワード抽出が行われ、「日本」、「イ・ビュンハン」、「キム」、「ギャン・サンウ」、「ヨンジュン」のキーワードが得られている。また、そのキーワードとスコアに基づいて3回目の関連検索が行われ、検索結果として得られた関連コンテンツのうちの、基点コンテンツ(「イ・ビュンハン、キム、ギャンサンウ、ヨンジュン独占インタビュー・・・」のタイトルのテレビジョン番組)との適合度が最も高い「土曜ワイド・韓流韓流・・・」のタイトルのテレビジョン番組が最終的な検索結果の1つとして保存されている。
以上のような関連検索が繰り返されることによって得られた最終的な検索結果の関連コンテンツを検索された順に並べた場合、図18に示されるように、最初は、韓流ドラマ系のコンテンツが関連コンテンツとして得られていたのに対し、ピアニスト系のコンテンツ、語学系のコンテンツといったように、検索により得られる関連コンテンツの内容が次第に変わっていくことになる。
これにより、ユーザは、内容が極端に変わらない範囲で、最初に選択した基点コンテンツと関連のあるコンテンツを検索結果として得ることができる。
また、図19に示されるように、それぞれのキーワードに品詞やカテゴリなどの属性が細かく設定されている場合、例えばユーザにより指定された属性のキーワードだけが検索に用いられるようにしてもよい。例えば、ユーザは、「料理」の属性が付与されたキーワードだけを用いた検索を行わせることによって、料理系のコンテンツの中から検索されたコンテンツだけを検索結果として得ることができる。
以上においては、図1に示されるように、ネットワーク3に接続されるサーバ1によって関連コンテンツの検索が行われるものとしたが、関連コンテンツの検索が行われる機器はネットワーク3に接続されるものに限られず、例えば、ホームサーバなどの1つの機器に様々なコンテンツのインデックスデータが用意されている場合、そのホームサーバによって関連コンテンツの検索が行われるようにしてもよい。
また、以上においては、単に、関連コンテンツの一覧が検索結果として提示されるものとしたが、スコア順に、関連コンテンツがそれぞれ出力されるようにしてもよい。ユーザは、例えば、あるテレビジョン番組を選択することによって、選択したテレビジョン番組との適合度の高い順に、関連コンテンツとして検索された録画済みのテレビジョン番組などを視聴することができる。
上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、専用のハードウエアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。
コンピュータにインストールされ、コンピュータによって実行可能な状態とされるプログラムを格納するプログラム記録媒体は、図7に示すように、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)を含む)、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア61、または、プログラムが一時的もしくは永続的に格納されるROM52や、記憶部58を構成するハードディスクなどにより構成される。
なお、本明細書において、プログラム記録媒体に格納されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
また、本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。
本発明の一実施形態に係るコンテンツ検索システムの構成例を示す図である。 コンテンツの検索の流れの例を示す図である。 基点コンテンツの選択画面の例を示す図である。 検索の設定画面の例を示す図である。 キーワードの抽出結果の表示画面の例を示す図である。 関連コンテンツの検索結果の表示画面の例を示す図である。 サーバのハードウエア構成の例を示すブロック図である。 サーバのソフトウエア構成の例を示す図である。 適合度の算出の例を示す図である。 コンテンツの検索の流れの例を示す他の図である。 サーバの機能構成例を示すブロック図である。 サーバのインデックスデータ生成処理について説明するフローチャートである。 図12のステップS13において行われるキーワード抽出/スコア算出処理について説明するフローチャートである。 サーバの関連コンテンツ検索処理について説明するフローチャートである。 関連検索が繰り返される処理について説明する図である。 関連検索が繰り返される処理について説明する他の図である。 関連検索が繰り返される処理について説明するさらに他の図である。 関連コンテンツの検索結果の例を示す図である。 キーワードの属性の例を示す図である。
符号の説明
1 サーバ, 2 クライアントPC, 3 ネットワーク, 71 データベース, 72 検索アプリケーション, 73 キーワード抽出エンジン, 101 コンテンツ選択部, 102 キーワード抽出部, 103 展開部, 104 検索部, 105 適合度算出部, 106 出力部

Claims (7)

  1. 検索の基点となる第1のコンテンツの内容を表すテキストデータから抽出されたキーワードとそれぞれのキーワードのスコアと、前記第1のコンテンツとの適合度を算出する第2のコンテンツの内容を表すテキストデータから抽出されたキーワードとそれぞれのキーワードのスコアを取得する取得手段と、
    前記第1と第2のコンテンツの適合度を、前記取得手段により取得された前記第1のコンテンツの内容を表すテキストデータから抽出されたキーワードと、前記第2のコンテンツの内容を表すテキストデータから抽出されたキーワードに共通して含まれるキーワードのスコアに基づいて算出する適合度算出手段と、
    前記適合度算出手段による算出結果に基づいて、前記第1のコンテンツとの適合度が高い所定の数の前記第2のコンテンツの情報を検索結果として出力する出力手段と
    を備える情報処理装置。
  2. 前記適合度算出手段は、前記第1のコンテンツの内容を表すテキストデータから抽出されたキーワードと、前記第2のコンテンツの内容を表すテキストデータから抽出されたキーワードに共通して含まれるキーワードのスコアを乗算し、共通して含まれるそれぞれのキーワードのスコアの乗算結果を加算して得られた値を、前記第1と第2のコンテンツの適合度として算出する
    請求項1に記載の情報処理装置。
  3. テキストデータからキーワードを抽出するとともに、抽出したそれぞれのキーワードのスコアを算出するキーワード抽出手段をさらに備え、
    前記取得手段は、前記キーワード抽出手段による処理結果から、前記第1と第2のコンテンツの内容を表すテキストデータから抽出されたキーワードとそれぞれのキーワードのスコアを取得する
    請求項1に記載の情報処理装置。
  4. 前記キーワード抽出手段は、テキストデータにおけるキーワードの出現頻度、テキストデータにおけるキーワードの出現位置、キーワードの属性のうちの少なくともいずれかに基づいて、それぞれのキーワードのスコアを算出する
    請求項3に記載の情報処理装置。
  5. 前記取得手段は、さらに、前記第1のコンテンツとの適合度が算出された前記第2のコンテンのうちの所定のコンテンツを検索の基点となる前記第1のコンテンツとして、前記第1のコンテンツの内容を表すテキストデータから抽出されたキーワードとそれぞれのキーワードのスコアと、前記第2のコンテンツの内容を表すテキストデータから抽出されたキーワードとそれぞれのキーワードのスコアを取得し、
    前記適合度算出手段は、前記第1と第2のコンテンツの適合度を、前記取得手段により取得された前記第1のコンテンツの内容を表すテキストデータから抽出されたキーワードと、前記第2のコンテンツの内容を表すテキストデータから抽出されたキーワードに共通して含まれるキーワードのスコアに基づいて算出し、
    前記出力手段は、前記適合度算出手段による算出結果に基づいて、前記所定のコンテンツである前記第1のコンテンツとの適合度が高い所定の数の前記第2のコンテンツの情報を検索結果として出力する
    請求項1に記載の情報処理装置。
  6. 検索の基点となる第1のコンテンツの内容を表すテキストデータから抽出されたキーワードとそれぞれのキーワードのスコアと、前記第1のコンテンツとの適合度を算出する第2のコンテンツの内容を表すテキストデータから抽出されたキーワードとそれぞれのキーワードのスコアを取得し、
    前記第1と第2のコンテンツの適合度を、取得した前記第1のコンテンツの内容を表すテキストデータから抽出されたキーワードと、前記第2のコンテンツの内容を表すテキストデータから抽出されたキーワードに共通して含まれるキーワードのスコアに基づいて算出し、
    算出結果に基づいて、前記第1のコンテンツとの適合度が高い所定の数の前記第2のコンテンツの情報を検索結果として出力する
    ステップを含む情報処理方法。
  7. 検索の基点となる第1のコンテンツの内容を表すテキストデータから抽出されたキーワードとそれぞれのキーワードのスコアと、前記第1のコンテンツとの適合度を算出する第2のコンテンツの内容を表すテキストデータから抽出されたキーワードとそれぞれのキーワードのスコアを取得し、
    前記第1と第2のコンテンツの適合度を、取得した前記第1のコンテンツの内容を表すテキストデータから抽出されたキーワードと、前記第2のコンテンツの内容を表すテキストデータから抽出されたキーワードに共通して含まれるキーワードのスコアに基づいて算出し、
    算出結果に基づいて、前記第1のコンテンツとの適合度が高い所定の数の前記第2のコンテンツの情報を検索結果として出力する
    ステップを含むプログラム。
JP2006035312A 2006-02-13 2006-02-13 情報処理装置および方法、並びにプログラム Expired - Fee Related JP4923604B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006035312A JP4923604B2 (ja) 2006-02-13 2006-02-13 情報処理装置および方法、並びにプログラム
US11/673,252 US8041718B2 (en) 2006-02-13 2007-02-09 Processing apparatus and associated methodology for keyword extraction and matching

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006035312A JP4923604B2 (ja) 2006-02-13 2006-02-13 情報処理装置および方法、並びにプログラム

Publications (2)

Publication Number Publication Date
JP2007213497A true JP2007213497A (ja) 2007-08-23
JP4923604B2 JP4923604B2 (ja) 2012-04-25

Family

ID=38369957

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006035312A Expired - Fee Related JP4923604B2 (ja) 2006-02-13 2006-02-13 情報処理装置および方法、並びにプログラム

Country Status (2)

Country Link
US (1) US8041718B2 (ja)
JP (1) JP4923604B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009212858A (ja) * 2008-03-04 2009-09-17 Sharp Corp コンテンツ処理装置、コンテンツ処理方法、コンテンツ再生装置、プログラム、および記録媒体
JP2011128737A (ja) * 2009-12-16 2011-06-30 Nifty Corp 辞書生成処理方法、プログラム及び装置

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080091672A1 (en) * 2006-10-17 2008-04-17 Gloor Peter A Process for analyzing interrelationships between internet web sited based on an analysis of their relative centrality
US9411903B2 (en) * 2007-03-05 2016-08-09 Oracle International Corporation Generalized faceted browser decision support tool
US8176055B1 (en) 2007-03-27 2012-05-08 Google Inc. Content entity management
JP2008257655A (ja) * 2007-04-09 2008-10-23 Sony Corp 情報処理装置及び方法、並びにプログラム
US20090144241A1 (en) * 2007-12-03 2009-06-04 Chartsource, Inc., A Delaware Corporation Search term parser for searching research data
JP4879930B2 (ja) 2008-03-27 2012-02-22 ブラザー工業株式会社 コンテンツ管理装置、コンテンツ管理システム及びコンテンツ管理方法
JP4892601B2 (ja) * 2009-10-30 2012-03-07 株式会社ソニー・コンピュータエンタテインメント 情報処理装置、チューナーおよび情報処理方法
JP2012003407A (ja) * 2010-06-15 2012-01-05 Sony Corp 情報処理装置、同一性判定システム、同一性判定方法およびコンピュータプログラム
KR101775027B1 (ko) * 2010-07-21 2017-09-06 삼성전자주식회사 컨텐트 공유 방법 및 장치
JP2012027723A (ja) * 2010-07-23 2012-02-09 Sony Corp 情報処理装置、情報処理方法及び情報処理プログラム
JP5092038B1 (ja) * 2011-05-18 2012-12-05 株式会社東芝 情報処理装置の情報処理方法、情報処理装置およびプログラム。
US9106957B2 (en) 2012-08-16 2015-08-11 Nuance Communications, Inc. Method and apparatus for searching data sources for entertainment systems
KR20150045404A (ko) * 2012-08-16 2015-04-28 뉘앙스 커뮤니케이션즈, 인코포레이티드 엔터테인먼트 시스템을 위한 사용자 인터페이스
US9497515B2 (en) 2012-08-16 2016-11-15 Nuance Communications, Inc. User interface for entertainment systems
US8799959B2 (en) 2012-08-16 2014-08-05 Hoi L. Young User interface for entertainment systems
US9026448B2 (en) 2012-08-16 2015-05-05 Nuance Communications, Inc. User interface for entertainment systems
US9031848B2 (en) 2012-08-16 2015-05-12 Nuance Communications, Inc. User interface for searching a bundled service content data source
US20140109137A1 (en) * 2012-10-11 2014-04-17 Faisal Mushtaq Method and apparatus for user interaction with programs utilizing closed captioning data content
CN103634420B (zh) * 2013-11-22 2017-07-28 谢小雪 简历邮件筛选系统及方法
GB2520993A (en) 2013-12-06 2015-06-10 Ibm Indexing presentation slides
US10033775B2 (en) 2014-04-17 2018-07-24 Oath Inc. System and method for providing users feedback regarding their reading habits
US9703868B2 (en) * 2014-06-23 2017-07-11 Microsoft Technology Licensing, Llc Reconciling query results associated with multiple indices
US9426518B2 (en) * 2014-08-19 2016-08-23 International Business Machines Corporation Recording video content in relevant segments of a television program based on identifying keywords in on-screen text, closed captioning text and/or program audio
US10289734B2 (en) * 2015-09-18 2019-05-14 Samsung Electronics Co., Ltd. Entity-type search system
TW201832105A (zh) * 2017-02-17 2018-09-01 雲拓科技有限公司 專利檢索之檢索關鍵字建議方法
WO2018225576A1 (ja) * 2017-06-06 2018-12-13 オムロン株式会社 スコア算出ユニット、検索装置、スコア算出方法、およびスコア算出プログラム
CN109388740A (zh) * 2017-08-06 2019-02-26 北京国双科技有限公司 一种网络信息传播效果的监测方法及装置
CN108334533B (zh) * 2017-10-20 2021-12-24 腾讯科技(深圳)有限公司 关键词提取方法和装置、存储介质及电子装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06350546A (ja) * 1993-06-04 1994-12-22 Nippon Hoso Kyokai <Nhk> 関連番組判定装置
JP2002269106A (ja) * 2001-03-08 2002-09-20 Dainippon Printing Co Ltd 書籍紹介装置
JP2005115790A (ja) * 2003-10-09 2005-04-28 Sony Corp 情報検索方法、情報表示装置及びプログラム
JP2006013708A (ja) * 2004-06-23 2006-01-12 Matsushita Electric Ind Co Ltd デジタル信号受信装置

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4849898A (en) * 1988-05-18 1989-07-18 Management Information Technologies, Inc. Method and apparatus to identify the relation of meaning between words in text expressions
US5291592A (en) * 1989-05-15 1994-03-01 Sharp Kabushiki Kaisha System having document scanner for optically scanning information whereby a first information contains control information indicating a number of sheets to be scanned
US6038561A (en) * 1996-10-15 2000-03-14 Manning & Napier Information Services Management and analysis of document information text
JP3598742B2 (ja) * 1996-11-25 2004-12-08 富士ゼロックス株式会社 文書検索装置及び文書検索方法
GB9701866D0 (en) * 1997-01-30 1997-03-19 British Telecomm Information retrieval
US6167397A (en) * 1997-09-23 2000-12-26 At&T Corporation Method of clustering electronic documents in response to a search query
JP3181548B2 (ja) * 1998-02-03 2001-07-03 富士通株式会社 情報検索装置及び情報検索方法
US6263121B1 (en) * 1998-09-16 2001-07-17 Canon Kabushiki Kaisha Archival and retrieval of similar documents
US6189002B1 (en) * 1998-12-14 2001-02-13 Dolphin Search Process and system for retrieval of documents using context-relevant semantic profiles
US6618727B1 (en) * 1999-09-22 2003-09-09 Infoglide Corporation System and method for performing similarity searching
US6691108B2 (en) * 1999-12-14 2004-02-10 Nec Corporation Focused search engine and method
JP3573688B2 (ja) * 2000-06-28 2004-10-06 松下電器産業株式会社 類似文書検索装置及び関連キーワード抽出装置
US7113943B2 (en) * 2000-12-06 2006-09-26 Content Analyst Company, Llc Method for document comparison and selection
CA2373568C (en) * 2001-04-26 2008-06-17 Hitachi, Ltd. Method of searching similar document, system for performing the same and program for processing the same
US7028024B1 (en) * 2001-07-20 2006-04-11 Vignette Corporation Information retrieval from a collection of information objects tagged with hierarchical keywords
JP3918531B2 (ja) * 2001-11-29 2007-05-23 株式会社日立製作所 類似文書検索方法およびシステム
JP2003203088A (ja) 2002-01-08 2003-07-18 Nippon Telegr & Teleph Corp <Ntt> プログラマブルコンテンツ提供方法および提供システム、送信端末、プログラム、記録媒体
JP2003208442A (ja) 2002-01-15 2003-07-25 Ricoh Co Ltd 情報提供装置、情報提供方法及びプログラム
JP2004023345A (ja) 2002-06-14 2004-01-22 Sony Corp 情報検索方法、情報検索システム、受信装置、情報処理装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06350546A (ja) * 1993-06-04 1994-12-22 Nippon Hoso Kyokai <Nhk> 関連番組判定装置
JP2002269106A (ja) * 2001-03-08 2002-09-20 Dainippon Printing Co Ltd 書籍紹介装置
JP2005115790A (ja) * 2003-10-09 2005-04-28 Sony Corp 情報検索方法、情報表示装置及びプログラム
JP2006013708A (ja) * 2004-06-23 2006-01-12 Matsushita Electric Ind Co Ltd デジタル信号受信装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009212858A (ja) * 2008-03-04 2009-09-17 Sharp Corp コンテンツ処理装置、コンテンツ処理方法、コンテンツ再生装置、プログラム、および記録媒体
JP2011128737A (ja) * 2009-12-16 2011-06-30 Nifty Corp 辞書生成処理方法、プログラム及び装置

Also Published As

Publication number Publication date
US20070192310A1 (en) 2007-08-16
US8041718B2 (en) 2011-10-18
JP4923604B2 (ja) 2012-04-25

Similar Documents

Publication Publication Date Title
JP4923604B2 (ja) 情報処理装置および方法、並びにプログラム
JP6838098B2 (ja) 知識パネルのコンテキスチャライジング
US7856358B2 (en) Method and apparatus for providing search capability and targeted advertising for audio, image, and video content over the Internet
JP5798814B2 (ja) リアルタイム人気キーワードに対する代表フレーズを提供する方法およびシステム
US9213704B2 (en) Dictionary service
KR101715971B1 (ko) 키워드 및 스트링 입력에 기초한 애니메이트된 미디어를 어셈블링하는 방법 및 시스템
JP5171718B2 (ja) コンテンツ推薦装置、方法、及びプログラム
JP2011529600A (ja) 意味ベクトルおよびキーワード解析を使用することによるデータセットを関係付けるための方法および装置
JP2018032213A (ja) 情報処理装置、情報処理システム、情報処理方法及びプログラム
JP2007241888A (ja) 情報処理装置および方法、並びにプログラム
JP4734048B2 (ja) 情報検索装置、情報検索方法および情報検索プログラム
JP4883644B2 (ja) リコメンド装置、リコメンドシステム、リコメンド装置の制御方法、およびリコメンドシステムの制御方法
JP2004118716A (ja) 個人化広告の提供方法及び個人化広告提供プログラム及び個人化広告提供プログラムを格納した記憶媒体
US11475080B2 (en) Natural language-based search and discovery of content service
CN107180058B (zh) 一种用于基于字幕信息进行查询的方法和装置
JP2007199315A (ja) コンテンツ提供装置
Lin et al. Chinese tag analysis for foreign movie contents
JP2011085993A (ja) 情報分析装置、情報分析方法および情報分析プログラム
JP5533377B2 (ja) 音声合成装置、音声合成プログラムおよび音声合成方法
JP2004362121A (ja) 情報検索装置、携帯情報端末装置、情報検索方法、情報検索プログラム及び記録媒体
KR101220080B1 (ko) 실시간 인기 키워드에 대한 대표 문구 제공 방법 및 시스템
JP5294294B2 (ja) コンテンツ選択支援装置、コンテンツ選択支援方法及びそのプログラム
JP2001101195A (ja) テレビ番組検索装置および自動番組選択装置
JP5127751B2 (ja) 情報検索装置及び方法
JP2005275505A (ja) 情報処理装置および方法、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090120

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110215

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110408

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110830

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111130

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20111208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120110

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120123

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150217

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4923604

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150217

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees