JP5494493B2 - 情報検索装置、情報検索方法、及びプログラム - Google Patents

情報検索装置、情報検索方法、及びプログラム Download PDF

Info

Publication number
JP5494493B2
JP5494493B2 JP2010540324A JP2010540324A JP5494493B2 JP 5494493 B2 JP5494493 B2 JP 5494493B2 JP 2010540324 A JP2010540324 A JP 2010540324A JP 2010540324 A JP2010540324 A JP 2010540324A JP 5494493 B2 JP5494493 B2 JP 5494493B2
Authority
JP
Japan
Prior art keywords
keyword
search
common
keywords
contents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010540324A
Other languages
English (en)
Other versions
JPWO2010061538A1 (ja
Inventor
泉 渚
陽司 宮崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2010540324A priority Critical patent/JP5494493B2/ja
Publication of JPWO2010061538A1 publication Critical patent/JPWO2010061538A1/ja
Application granted granted Critical
Publication of JP5494493B2 publication Critical patent/JP5494493B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Description

本発明は、階層管理されたコンテンツを効率良く検索するための情報検索装置、情報検索方法、及びプログラムに関する。
従来から、FAQや商品情報などのコンテンツの管理には、階層構造が採用されており、各階層はカテゴリに基づいて分類されている。この場合、ユーザは、カテゴリの名称が表示されたメニューを上層から下層へと辿ることで、目的のコンテンツを探し出すことができる。但し、カテゴリ分類や階層構造のイメージが、ユーザと管理者との間で異なると、ユーザは、どのカテゴリを選択して良いかわからず、目的のコンテンツを効率良く探せないという問題が発生する。
図15は、階層構造を用いたカテゴリ分類によって管理されているコンテンツの例を示す図である。図15において、C1〜C6それぞれは、コンテンツを示している。図15に示すように階層構造で管理されているコンテンツの場合、ユーザは、商品(第1階層)の選択後に機種(第2階層)のカテゴリを選択し、更に機能(第3階層)のカテゴリを選択し、それから部品(第4階層)のカテゴリを選択する必要がある。よって、例えば、ユーザが、機種や機能のカテゴリに関して確かな情報を持っておらず、そのため、初めに機種αを選択して辿り着いたコンテンツが、望みのものでない場合が考えられる。この場合、ユーザは、再度、上位の階層に遡って別の機種や別の機能といった別のカテゴリを選択し直す必要があり、ユーザにとっては手間がかかってしまう。
特に、図15における第4階層に示された「HDD」や「チューナー」は、複数の機種や機能のカテゴリに含まれて管理されている。よって、これらに紐づけられたコンテンツが検索対象となる場合に、カテゴリ分類や階層構造のイメージが、ユーザと管理者との間で異なると、ユーザは、何度も階層を遡ったり、カテゴリ選択をやり直したりしなければならず、検索効率が悪いという問題が顕著に現れる。
このため、ユーザが選択できるメニューの階層数や項目数(カテゴリ数)が増えて、ユーザが目的のコンテンツを探しにくいという問題を解決するため、種々の技術が、提案されている(例えば、特許文献1〜特許文献3参照。)。
例えば、特許文献1は、入力されたキーワードと一致するメニューを検索する技術を開示している。特許文献1に開示にされた、この技術によれば、ユーザは、階層構造を認識する必要はなく、必要とするメニュー項目を入力するだけで良い。更に、特許文献1は、メニュー操作ログデータから、メニュー項目の使用頻度、及び使用時間を解析して、その解析結果を基にメニュー定義を自動生成し、重要な項目をメニューとする技術も開示している。
また、特許文献2は、入力されたキーワードに対応するメニューを検索し、検索によって得られたメニューのうち、現在閲覧されているメニューとの距離が近いものを優先的に表示する技術を開示している。特許文献2に開示の技術によれば、メニュー自体を探し出すことが容易になる。
更に、特許文献3は、保証された最大AND検索回数以内で、保証された最大検索結果数にデータベースを絞り込める、キーワードの組み合わせを見付け出し、この組み合わせ用いて検索メニューを生成する技術を開示している。特許文献3に開示された技術を用いれば、管理者が作成したメニューとは別のメニューが自動生成され、ユーザのメニュー選択(カテゴリ選択)が支援される。
その他、大量に蓄えられたキーワードの組で構成された情報を分類・整理する技術が提案されている(例えば、特許文献4参照)。特許文献4に開示の技術は、階層構造をとる情報に対して適用される技術ではないが、複数のキーワードの組により特徴付けされている情報をユーザに分かりやすく表示することを目的とする。特許文献4に開示の技術では、大量のキーワードの組から、共通するキーワードが代表キーワードとして抽出され、抽出された代表キーワードを用いて、階層構造を持つメニューが生成される。ユーザは、この階層を見ることにより、大量のキーワードの組が与えられても、概要を簡単に把握することができる。
特開平9−244850号公報 特開2005−115753号公報 特開2000−311179号公報 特開平10−124519号公報
ところで、特許文献1や特許文献2に開示された技術は、検索機能を使ってメニューの中のカテゴリを検索する技術であり、ユーザが自分自身の探したいコンテンツを把握しており、適切なキーワードを入力できる場合は有効である。しかしながら、ユーザ自身の欲しいコンテンツが曖昧だったり、どういうキーワードが適切か分からなかったりする場合は、ユーザは、結局、管理者が作成したメニューを辿ることになる。つまり、特許文献1及び特許文献2に開示の技術を用いても、階層を遡ったり、カテゴリ選択をやり直したりしなければならないという問題は、以前として解決されていないと言える。
また、特許文献3に開示された技術では、上述したように、一定の操作回数で、絞り込み結果を一定数まで絞り込むことができる検索メニューが自動生成される。しかしながら、特許文献3に開示された技術によって自動生成されたメニューが、ユーザがイメージしているメニューと一致するとは限らず、一致しない場合は、ユーザがメニューの選択を迷うという問題が発生する。そして、このような問題が発生した場合は、ユーザは、結局のところ、元のメニューを用いて、何度も階層を遡ったり、カテゴリ選択をやり直したりする必要がある。よって、特許文献3を用いた場合も、ユーザが階層を遡ったり、カテゴリ選択をやり直したりしなければならないという問題は、以前として解決されていないと言える。
更に、特許文献4に開示された技術は、階層構造を有していない情報の集合から、階層構造を有するメニューを自動生成する技術であり、メニューを作成する管理者を支援することはできる。よって、特許文献1〜特許文献3に開示された技術に、特許文献4に記載された技術を適用しても、上記問題の解決は困難である。
本発明の目的は、上記問題を解消し、階層化されたカテゴリで分類されている複数のコンテンツから目的のコンテンツを検索する際の検索効率の向上を図り得る、情報検索装置、情報検索方法、及びプログラムを提供する。
上記目的を達成するために本発明における情報検索装置は、階層化された複数のカテゴリで分類されている複数のコンテンツを検索対象とする、情報検索装置であって、
前記複数のコンテンツと、前記複数のコンテンツいずれかの属性を表現する複数のキーワードと、前記階層化された複数のカテゴリとを記憶するコンテンツ記憶部と、
外部からの検索キーワードの入力を受け付け、前記コンテンツ記憶部に記憶されている前記複数のコンテンツから、前記検索キーワードを含むコンテンツを検索する検索部と、
前記コンテンツ記憶部に記憶されている前記複数のキーワードから、前記検索部によって検索されたコンテンツの属性を表現するキーワードを抽出し、抽出された前記キーワードが属するカテゴリとその階層とを少なくとも調査するキーワード調査部と、
前記キーワード調査部による調査の結果に基づいて、前記キーワード調査部によって抽出された前記キーワードの中から、同一階層にある複数のカテゴリに属するキーワードを、共通キーワードとして抽出する共通キーワード抽出部とを備える、ことを特徴とする。
また、上記目的を達成するため本発明における情報検索方法は、階層化された複数のカテゴリで分類されている複数のコンテンツを検索対象とする、情報検索方法であって、
(a)前記複数のコンテンツと、前記複数のコンテンツいずれかの属性を表現する複数のキーワードと、前記階層化された複数のカテゴリとを予め記憶するステップと、
(b)外部からの検索キーワードの入力を受け付け、前記(a)のステップで記憶されている前記複数のコンテンツから、前記検索キーワードを含むコンテンツを検索するステップと、
(c)前記(a)のステップで記憶されている前記複数のキーワードから、前記(b)のステップで検索されたコンテンツの属性を表現するキーワードを抽出し、抽出された前記キーワードが属するカテゴリとその階層とを少なくとも調査するステップと、
(d)前記(b)のステップでの調査の結果に基づいて、前記(c)のステップで抽出された前記キーワードの中から、同一階層にある複数のカテゴリに属するキーワードを、共通キーワードとして抽出するステップとを有する、ことを特徴とする。
更に、上記目的を達成するため本発明におけるプログラムは、階層化された複数のカテゴリで分類されている複数のコンテンツを検索対象として、コンピュータに情報検索を行わせるプログラムであって、
前記コンピュータに、
(a)前記複数のコンテンツと、前記複数のコンテンツいずれかの属性を表現する複数のキーワードと、前記階層化された複数のカテゴリとを予め記憶するステップと、
(b)外部からの検索キーワードの入力を受け付け、前記(a)のステップで記憶されている前記複数のコンテンツから、前記検索キーワードを含むコンテンツを検索するステップと、
(c)前記(a)のステップで記憶されている前記複数のキーワードから、前記(b)のステップで検索されたコンテンツの属性を表現するキーワードを抽出し、抽出された前記キーワードが属するカテゴリとその階層とを少なくとも調査するステップと、
(d)前記(c)のステップでの調査の結果に基づいて、前記(c)のステップで抽出された前記キーワードの中から、同一階層にある複数のカテゴリに属するキーワードを、共通キーワードとして抽出するステップとを実行させる、ことを特徴とする。
以上の特徴により、本発明における情報検索装置、情報検索方法、及びプログラムによれば、階層化されたカテゴリで分類されている複数のコンテンツから目的のコンテンツを検索する際において、検索効率の向上を図ることができる。
本発明の実施の形態1における情報検索装置の概略構成を示すブロック図である。 図1に示したコンテンツ記憶部に記憶されているコンテンツとキーワードとの一例を示す図である。 図1に示したキーワード抽出部によるキーワードの抽出処理を説明する図である。 図1に示したコンテンツ記憶部に記憶されているコンテンツとキーワードとの他の例を示す図である。 検索対象となるコンテンツ集合の一例を示す図である。 図1に示したキーワード調査部の調査結果の一例を示す図である。 図1に示したキーワード調査部の調査結果の一例を示す図である。 図1に示したキーワード調査部の調査結果の一例を示す図である。 本発明の実施の形態1における共通キーワードが表示されている表示画面の一例を示す図である。 図8は、本発明の実施の形態1における情報検索方法を示すフロー図である。 図9は、本発明の実施の形態2における情報検索装置の概略構成を示すブロック図である。 本発明の実施の形態2における共通キーワードが表示されている表示画面の一例におけるランキングが上位の共通キーワードを示す図である。 本発明の実施の形態2における共通キーワードが表示されている表示画面の一例におけるランキングが下位の共通キーワードを示す図である。 本発明の実施の形態2における情報検索方法を示すフロー図である。 本発明の実施の形態4における情報検索装置の概略構成を示すブロック図である。 本発明の実施の形態5における情報検索装置の概略構成を示すブロック図である。 図13に示された検索履歴管理部によって記憶されている情報の一例を示す図である。 階層構造を用いたカテゴリ分類によって管理されているコンテンツの例を示す図である。
(実施の形態1)
以下、本発明の実施の形態1における情報検索装置、情報検索方法及びプログラムについて、図1〜図8を参照しながら説明する。最初に、本実施の形態1における情報検索装置の概略構成について図1を用いて説明する。図1は、本発明の実施の形態1における情報検索装置の概略構成を示すブロック図である。
図1に示す本実施の形態1における情報検索装置1は、階層化された複数のカテゴリで分類されている複数のコンテンツ(コンテンツ集合)を検索対象として、情報の検索を行う装置である。図1に示すように、本実施の形態1における情報検索装置1は、コンテンツ記憶部10と、検索部20と、共通キーワード生成部30とを備えている。本実施の形態1において、階層化された複数のカテゴリで分類されている複数のコンテンツとしては、例えば背景技術の欄で図15に示したコンテンツ集合が挙げられる。
コンテンツ記憶部10は、複数のコンテンツと、複数のキーワードと、階層化された複数のカテゴリとを記憶している。複数のキーワードは、それぞれ、複数のコンテンツいずれかの属性を表現している。つまり、各キーワードは、いずれかのコンテンツに対応している。コンテンツ記憶部10は、例えば、図15に示されたコンテンツ集合と、コンテンツ集合のカテゴリ分類と、カテゴリ分類の階層構造と、各コンテンツに対応するキーワードの集合とを記憶している。
検索部20は、外部からの検索キーワードの入力を受け付け、コンテンツ記憶部10に記憶されている複数のコンテンツから、検索キーワードを含むコンテンツを検索する。また、検索部20は、検索結果をキーワード生成部30に入力する。例えば、図15に示されたコンテンツ集合がコンテンツ記憶部10によって記憶されている場合に、検索キーワードとして「DVDレコーダ」が入力されると、検索部20は、コンテンツC1〜C6を検索する。
共通キーワード生成部30は、キーワード調査部31と、共通キーワード抽出部32とを備えている。このうち、キーワード調査部31は、コンテンツ記憶部10に記憶されている複数のキーワードから、検索部20によって検索されたコンテンツの属性を表現するキーワードを抽出する。また、キーワード調査部31は、抽出されたキーワードが属するカテゴリと、このカテゴリの階層とを調査する。共通キーワード抽出部32は、キーワード調査部31による調査の結果に基づいて、キーワード調査部31によって抽出されたキーワードの中から、同一階層にある複数のカテゴリに属するキーワードを、共通キーワードとして抽出する。なお、共通キーワード生成部30における具体的な動作については後述する。
このように、本実施の形態1における情報検索装置1は、ユーザが入力した検索キーワードに基づき、検索対象となるコンテンツ集合から目的のコンテンツを効率良く検索可能なキーワード(共通キーワード)を生成する。よって、ユーザは、この共通キーワードを用いて検索を行えば、カテゴリ選択に迷ったり、カテゴリ選択を間違って何度も階層をさかのぼったりする事態を回避でき、その結果、検索効率の向上が図られる。
ここで、本実施の形態1における情報検索装置1について図2〜図6を用いて具体的に説明する。図2は、図1に示したコンテンツ記憶部に記憶されているコンテンツとキーワードとの一例を示す図である。図3Aは、図1に示したキーワード抽出部によるキーワードの抽出処理を説明する図であり、図3Bは、図1に示したコンテンツ記憶部に記憶されているコンテンツとキーワードとの他の例を示す図である。図4は、検索対象となるコンテンツ集合の一例を示す図である。図5A及び図5Bそれぞれは、図1に示したキーワード調査部の調査結果の一例を示す図である。図6も、図1に示したキーワード調査部の調査結果の一例を示す図である。図7は、本発明の実施の形態1における共通キーワードが表示されている表示画面の一例を示す図である。
本実施の形態1では、図1に示すように、情報検索装置1は、更に、キーワード抽出部40を備えている。また、キーワード抽出部40は、データベース70に接続され、検索部20は、入力装置50と表示装置60とに接続されている。なお、共通キーワード抽出部32も表示装置60に接続されている。
データベース70は、検索対象となる複数のコンテンツ(コンテンツ集合)が、階層化された複数のカテゴリで分類された状態で格納されているデータベースである。データベース70に格納されているコンテンツ集合の例としては、例えば、FAQ、商品カタログ、各種の文書集合が挙げられる。また、各種の文書集合としては、企業内部で作成された文書の集合や、電子メールソフトウェアで管理されている大量の電子メールが挙げられる。その他のコンテンツ集合としては、写真管理ソフトウェアによって管理されている画像集合や、音楽管理ソフトウェアによって管理されている音楽データ集合等も挙げられる。なお、コンテンツ集合における階層の数は、特に限定されるものではなく、例えば、一層しかないものであっても良い。
キーワード抽出部40は、この外部のデータベース70から、コンテンツ記憶部10に記憶させることが必要なキーワードを抽出し、抽出したキーワードをコンテンツ記憶部10に記憶させる。記憶させることが必要なキーワードとは、上述した、複数のコンテンツそれぞれの属性を表現するキーワードである。
また、キーワード抽出部40は、コンテンツの属性を表現するキーワードに加え、データベース70に元々記憶されていた、複数のコンテンツ自体と、階層化された複数のカテゴリ(カテゴリ分類とカテゴリ分類の階層構造)もコンテンツ記憶部10に記憶させる。本実施の形態1では、コンテンツ記憶部10における情報の記憶は、キーワード抽出部40によって行われる。なお、コンテンツ記憶部10における情報の記憶は、ユーザが手作業によって行うこともできる。
更に、キーワード抽出部40が実行するキーワードの抽出方法は、特に限定されるものではないが、例えば、テータベース70に記憶されている階層とカテゴリ分類とを利用する方法や、コンテンツから単語を抽出してキーワードとする方法などがある。
例えば、前者の場合、キーワード抽出部40は、データベース70に格納されている階層構造を持つコンテンツ集合から、各コンテンツが直接関連付けられている最下層のカテゴリを求め、これらを各コンテンツの属性を表現するキーワードとして抽出できる。具体的には、図15に示す階層構造をもったコンテンツ集合の場合、最下層の部品カテゴリがキーワードとして抽出される。
この場合、図2に示すように、コンテンツC1に対してキーワード「HDD」が、コンテンツC2に対してキーワード「チューナー」が抽出される。また、コンテンツC3に対しては、キーワード「HDD」とキーワード「DVD−R」とが抽出される。更に、コンテンツC4に対してキーワード「DVD−R」が、コンテンツC5に対してキーワード「チューナー」が、コンテンツC6に対してキーワード「HDD」が抽出される。そして、キーワード抽出部40は、図2に示すように、抽出されたキーワードを、各コンテンツC1〜C6に対応付けた状態で、コンテンツ記憶部10に記憶させる。
後者の場合は、キーワード抽出部40は、データベース70に格納されているコンテンツ毎に、各コンテンツに含まれる文章を単語に分割し、分割によって得られた各単語を、各コンテンツの属性を表すキーワードとして抽出できる。例えば、図3Aに示すように、コンテンツ10に「HDDへの保存はできますか?」が含まれている場合は、キーワード抽出部40は、この文章を単語に分割し、予め用意されている品詞情報を使って名詞のみ抽出する。具体的には、キーワード抽出部40は、コンテンツ10から、キーワードとして、「HDD」と「保存」とを抽出する。なお、キーワード抽出部40は、名詞以外の動詞等を抽出することもでき、図3Aは、あくまでも一例を示している。
図3Aに示された処理は、図3Bに示すように、データベース70に格納されている他のコンテンツに対しても行われる。図3Bの例では、抽出されたキーワードは、各コンテンツ10、11、12、13・・・に対応付けられた状態で、コンテンツ記憶部10によって記憶される。また、図3Aに示された処理は、図4に示すように、カテゴリ分類の層が一層であっても、更に、二層以上であっても、各コンテンツがいずれかのカテゴリに関連付けられている場合に適用できる。
入力装置50は、ユーザがコンテンツを検索するための検索キーワードを入力するために利用する装置である。具体的には、入力装置50は、キーボードや、マウス等の入力装置によって実現される。本実施の形態1では、検索キーワードの入力は、ユーザが、キーボードから自由にテキストデータを入力することによって行うことができる。また、検索キーワードの入力は、表示装置60の表示画面に表示されているカテゴリやキーワード等の検索キーワード候補の中から、ユーザが、マウスを用いて検索キーワードを選択することによって行うこともできる。
また、表示装置60は、情報を表示画面に表示するための装置であり、具体的には、液晶表示装置等の表示画面を備えたディスプレイ装置や、媒体に情報を印刷する印刷装置等によって実現できる。本実施の形態1では、表示装置60としては、ディスプレイ装置が用いられている。表示装置60の表示画面には、例えば、共通キーワード生成部30が生成した共通キーワードや、検索部20が検索したコンテンツ等が表示される。
本実施の形態1において、検索部20は、検索キーワードの入力の受け付けや、検索キーワードを含むコンテンツの検索を行った後、検索結果を表示装置60に入力し、検索されたコンテンツを表示装置60の表示画面に表示させる。これにより、ユーザにおける利便性の向上が図られる。更に、検索部20は、共通キーワード生成部30にも検索結果を入力する。
また、本実施の形態1において、キーワード調査部31は、コンテンツ記憶部10に記憶されている、コンテンツ集合のカテゴリ分類及びカテゴリ分類の階層構造と、各コンテンツに対応するキーワードとを参酌する。そして、キーワード調査部31は、この参酌により、検索されたコンテンツそれぞれの属性を表現するキーワードを抽出するが、このとき、本実施の形態1では、抽出されたキーワードが、どの階層のどのカテゴリに関係しているかも調査している。また、キーワード調査部31は、調査結果を共通キーワード抽出部32に入力する。
例えば、図15に示されたコンテンツ集合がコンテンツ記憶部10によって記憶され、検索キーワードとして「DVDレコーダ」が入力され、そして、コンテンツC1〜C6が検索された場合を考える。この場合、キーワード調査部31は、コンテンツ記憶部10に記憶されている、図2に示すコンテンツとキーワードとの関係を使って、コンテンツC1〜C6に含まれるキーワードとして、「HDD」、「チューナー」及び「DVD−R」を抽出する。
更に、キーワード調査部31は、コンテンツ記憶部10に記憶されているカテゴリ分類とカテゴリ分類の階層構造と(図15参照)を参酌し、抽出された「HDD」、「チューナー」及び「DVD−R」が、各階層で、どのカテゴリに関係しているかを調査する。図2及び図15に示したように、この場合、最下層である第4階層のカテゴリがキーワードとなっている。よって、キーワード調査部31は、第3階層のカテゴリ又は第2階層のカテゴリを用いて調査結果を作成する。
具体的には、図5Aに示すように、第3階層については、「HDD」は「録画」「EPG」「ダビング」に、「チューナー」はカテゴリ「EPG」「ダビング」に、キーワード「DVD−R」は「ダビング」に関係することを示す、調査結果が作成される。また、第2階層については、図5Bに示すように、「HDD」は「機種α」「機種β」に、「チューナー」は「機種β」に、「DVD−R」は「機種β」に関係することを示す調査結果が作成される。
また、別の例として、図4に示されたコンテンツ集合(コンテンツ10、11、12、13、・・・)がコンテンツ記憶部10によって記憶されている場合について説明する。この場合、キーワード調査部31は、コンテンツ記憶部10に記憶されている、図3Bに示したコンテンツとキーワードとの関係を使って、各コンテンツに含まれるキーワードとして、「保存」、「HDD」、「チューナー」及び「DVD−R」抽出する。
そして、キーワード調査部31は、コンテンツ記憶部10に記憶されている、カテゴリ分類とカテゴリ分類の階層構造と(図4参照)を参酌し、抽出された「保存」「HDD」「チューナー」「DVD−R」が、各階層で、どのカテゴリに関係しているかを調査する。この場合は、図6に示すように、「保存」及び「HDD」は、カテゴリ「EPG」及び「ダビング」に、「チューナー」はカテゴリ「EPG」のみに、「DVD−R」はカテゴリ「ダビング」のみに関係することを示す、調査結果が作成される。
また、本実施の形態1では、共通キーワード抽出部52は、キーワード調査部31の調査結果が図5Aに示す例である場合は、キーワード「HDD」と「チューナー」とが複数のカテゴリに属しているので、これらを共通キーワードとして抽出する。この場合における表示装置60の表示画面の例を図7に示す。図7に示すように、表示装置の表示画面には、共通キーワードが表示される。
更に、共通キーワード抽出部52は、キーワード調査部31の結果が図5Bに示す例である場合は、キーワード「HDD」のみが複数のカテゴリに属しているので、これを共通キーワードとして抽出する。更に、共通キーワード抽出部52は、キーワード調査部31の結果が図6に示す例である場合は、キーワード「保存」と「HDD」とが複数のカテゴリに属しているので、これらを共通キーワードとして抽出する。
次に、本発明の実施の形態1における情報検索方法について図8を用いて説明する。図8は、本発明の実施の形態1における情報検索方法を示すフロー図である。本実施の形態1における情報検索方法は、図1に示した本実施の形態1における情報検索装置1を動作させることによって実施される。このため、本実施の形態1における情報検索方法は、適宜、図1〜図6を参酌しながら、図1に示した情報検索装置1の動作と共に説明する。
図8に示すように、先ず、キーワード抽出部40は、データベース70に記憶されているコンテンツ集合から、各コンテンツの属性を表現する(各コンテンツに対応する)キーワードを抽出すると、これをコンテンツ記憶部10に記憶させる(ステップS501)。
次に、キーワード抽出部40は、データベース70に元々記憶されている、複数のコンテンツ自体と、階層化された複数のカテゴリ(カテゴリ分類とカテゴリ分類の階層構造)とを更に抽出し、これらもコンテンツ記憶部10に記憶させる(ステップS502)。
次に、検索部20は、コンテンツ記憶部10が記憶している複数のコンテンツの中から、入力装置50を介してユーザが入力した検索キーワードを含むコンテンツを検索し、検索結果を表示装置60に表示させる(ステップS503)。ステップS503により、検索結果がユーザに提示される。また、検索部20は、ステップS503によって検索されたコンテンツ集合を、共通キーワード調査部31に入力する(ステップ504)。
具体的には、例えば、ユーザが、図15に示された例において、「DVDレコーダ」を検索キーワードとして入力した場合、ステップS503では、検索部20は、コンテンツC1からコンテンツC6を検索する。そして、ステップS504では、検索部20は、コンテンツC1〜C6を特定する情報を、キーワード調査部31に入力する。
次に、キーワード調査部31は、コンテンツ記憶部10が記憶する複数のキーワードから、ステップS504で検索されたコンテンツの属性を表現するキーワードを抽出し、更に、抽出されたキーワードが属するカテゴリと、このカテゴリの階層とを調査する(ステップS505)。
ステップS505では、キーワード調査部31は、コンテンツ記憶手段40に記憶されているカテゴリ分類とカテゴリ分類の階層構造とを参酌し、抽出されたキーワードが、どの階層のどのカテゴリに関係しているかについても調査を実行する。これにより、上述した図5A、図5Bまたは図6に示した調査結果が得られる。
次に、共通キーワード抽出部32は、キーワード調査部31による調査結果から、同一階層にある複数のカテゴリに属するキーワードを、共通キーワードとして抽出する(ステップS506)。続いて、ステップS506の実行後、共通キーワード抽出部32は、表示装置60の表示画面に、例えば、図7に示すように共通キーワードを表示する(ステップS507)。また、本実施の形態1では、表示画面に表示された共通キーワードは、ユーザが入力装置50によって選択可能となっている。
次に、ステップS507の実行後、検索部20は、表示装置60の表示画面に表示された共通キーワードの一つが選択されているかどうかを判定する(ステップS508)。ステップS508の判定の結果、共通キーワードの一つが選択されている場合は、検索部20は、選択された共通キーワードを検索キーワードとしてその入力を受け付ける。そして、検索部20は、コンテンツ記憶部10が記憶している複数のコンテンツの中から、入力を受け付けた共通キーワードに対応するコンテンツを検索する(ステップS510)。ステップS510の実行後は、再度、検索部20は、ステップS504を実行する。
一方、ステップS508の判定の結果、共通キーワードの一つが選択されていない場合は、検索部20は、処理の終了が指示されているかどうかを判定する(ステップS509)。ステップS509の判定の結果、処理の終了が指示されていない場合は、検索部20は、再度、ステップS503を実行する。一方、ステップS509の判定の結果、処理の終了が指示されている場合は、情報検索装置1における処理は終了する。
このように、本実施の形態1では、共通キーワードが生成された後は、共通キーワードを検索キーワードとして新たに処理が行われる。そして、このような処理が繰り返される度に、共通キーワードが、ユーザの望むコンテンツを検索できる可能性が高められていくことになる。
また、本実施の形態1における情報検索方法を実施した場合も、本実施の形態1における情報検索装置1を動作させた場合と同様に、目的のコンテンツを効率良く検索可能なキーワードが生成され、ユーザにおける検索効率の向上が図られる。なお、上述したステップのうち、ステップS501及びS502は、他のステップと連続して行われている必要はなく、他のステップの実行前であれば何時でも実行できる。
本実施の形態1におけるプログラムは、コンピュータに、図8に示すステップS501〜S510を実行させるプログラムであれば良い。また、本実施の形態1におけるプログラムをコンピュータにインストールし、これを実行すれば、本実施の形態1における情報処理装置1が実現される。
この場合、コンピュータのCPU(central processing unit)は、検索部20、キーワード調査部31、共通キーワード抽出部32及びキーワード抽出部40として機能し、処理を行なう。また、コンピュータに備えられたハードディスク等の記憶装置やメモリ装置は、コンテンツ記憶部10として機能する。
(実施の形態2)
次に、本発明の実施の形態2における情報検索装置、情報検索方法及びプログラムについて、図9〜図11を参照しながら説明する。最初に、本実施の形態2における情報検索装置の概略構成について図9及び図10A、図10Bを用いて説明する。
図9は、本発明の実施の形態2における情報検索装置の概略構成を示すブロック図である。図10Aと図10Bは、本発明の実施の形態2における共通キーワードが表示されている表示画面の一例におけるランキングが上位の共通キーワードと下位の共通キーワードをそれぞれ示している。
本実施の形態2における情報処理装置2は、共通キーワードランキング部33を備えており、この点で、実施の形態1における情報処理装置1(図1参照)と異なっている。なお、共通キーワードランキング部33が備えられている点以外においては、本実施の形態2における情報処理装置2は、実施の形態1における情報処理装置1と同様に構成されている。以下、相違点について説明する。
本実施の形態2においては、共通キーワード生成部30は、キーワード調査部31と共通キーワード抽出部32とに加え、共通キーワードランキング33を備えている。このため、共通キーワード生成部30は、複数のカテゴリに属する共通キーワードに対してランキング行うことができ、階層化された複数のカテゴリで分類されている複数のコンテンツから目的のコンテンツを検索する際に、より効率的に検索を行うことができる。
共通キーワード抽出部32は、本実施の形態2では、キーワード調査部31の調査結果に基づいて、複数のカテゴリに属するキーワードを共通キーワードとして抽出すると、共通キーワードを共通キーワードランキング部33に入力する。共通キーワードランキング部33は、共通キーワード抽出部32によって複数の共通キーワードが抽出されると、抽出された複数の共通キーワードそれぞれに、共通度合いに応じてランキングを付与する。また、ランキングが付与された(順位付けされた)複数の共通キーワードは、表示装置60に入力され、ランキングと共に表示画面に表示される。
ここで、「共通度合いに応じてランキングを付与する」とは、より多くのカテゴリに結び付けられる共通キーワード程、ランキングが高くなることを意味する。具体的には、本実施の形態2では、共通キーワードランキング部33は、コンテンツ記憶部10に記憶されている階層化された複数のカテゴリに基づいて、複数の共通キーワードそれぞれ毎に、共通キーワードが属する複数のカテゴリの階層を求める。そして、共通キーワードランキング33は、求めた階層に応じてランキングを付与する。
例えば、共通キーワードランキング部33は、階層の浅いカテゴリ(上層)で重複しているキーワードを、階層の深いカテゴリ(下層)で重複しているキーワードよりも重要度(ランキング)が高いと判定することができる。図5A及び図5Bの例を用いて説明すると、図5A及び図5Bに示すように、共通キーワード「HDD」は第2階層と第3階層で重複している。一方、共通キーワード「チューナー」は第3階層でのみ重複している。
この場合、共通キーワード「HDD」の重要度は、共通キーワード「チューナー」の重要度よりも高くに設定され、「HDD」のランキングは「チューナー」のランキングよりも高くに設定される。そして、表示装置60の表示画面には、図10A又は図10Bに示すように、ランキングが付与された共通キーワードが表示される。なお、図10A及び図10Bは、共通キーワードの個数が多く、全ての共通キーワードが表示領域内に収まらない場合を示している。図10Aと図10Bとは、ページが切り替えられた関係にある。また、ページを切り替える代わりに、全ての共通キーワードがスクロール表示される態様であっても良い。
次に、本発明の実施の形態2における情報検索方法について図11を用いて説明する。図11は、本発明の実施の形態2における情報検索方法を示すフロー図である。本実施の形態2における情報検索方法は、図9に示した本実施の形態2における情報検索装置2を動作させることによって実施される。このため、本実施の形態2における情報検索方法は、適宜、図9及び図10A、図10Bを参酌しながら、図9に示した情報検索装置2の動作と共に説明する。
図11に示すように、本実施の形態2における情報検索方法においては、ステップS506とステップS507との間に、ステップS511が実行される以外は、図8に示した実施の形態1における情報検索方法と同様である。よって、先ず、ステップS501〜S506が、実施の形態1と同様に実行される。但し、本実施の形態2のステップS506においては、共通キーワード抽出部32は、抽出した共通キーワードを表示装置60ではなく、共通キーワードランキング部53に入力する。
次に、ステップS506の実行後、共通キーワードランキング部33は、入力された複数の共通キーワードにランキングを付与する(ステップS511)。具体的には、共通キーワードランキング部33は、階層の浅いカテゴリ(上層)で重複しているキーワードを、階層の深いカテゴリ(下層)で重複しているキーワードよりも重要度(ランキング)が高いと判定し、ランキングを付与する。
次に、表示装置60の表示画面に、共通キーワードが表示される(ステップS507)。但し、本実施の形態2では、図10A及び図10Bに示すように、共通キーワードは、共通キーワードランキング部33により、ランキングが付与された状態で表示される。また、本実施の形態2においても、実施の形態1と同様に、表示画面に表示された共通キーワードは、ユーザが入力装置50によって選択可能となっている。その後、実施の形態1と同様に、ステップS508〜ステップS510が実行され、処理の終了が指示されるまで、ステップS503以降の処理が繰り返し行われる。
このように、本実施の形態2では、上位階層のカテゴリ分類で重複しているキーワードが、優先して共通キーワードとして表示される。このため、本実施の形態2によれば、実施の形態1に比べて、よりいっそうの検索効率の向上が図られる。
本実施の形態2におけるプログラムは、コンピュータに、図11に示すステップS501〜S511を実行させるプログラムであれば良い。また、本実施の形態2におけるプログラムをコンピュータにインストールし、これを実行すれば、本実施の形態2における情報処理装置2が実現される。
この場合、コンピュータのCPU(central processing unit)は、検索部20、キーワード調査部31、共通キーワード抽出部32、共通キーワードランキング部33及びキーワード抽出部40として機能し、処理を行なう。また、コンピュータに備えられたハードディスク等の記憶装置やメモリ装置は、コンテンツ記憶部10として機能する。
(実施の形態3)
次に、本発明の実施の形態3における情報検索装置、情報検索方法及びプログラムについて説明する。本実施の形態3における情報検索装置は、図9に示した実施の形態2における情報検索装置2と同様に構成されている。また、本実施の形態3における情報検索方法は、実施の形態2における情報検索方法と同様に、図11に示したフロー図に沿って実行される。但し、本実施の形態3は、共通キーワードランキング部33の動作(図11に示したステップS511における処理)の点で、実施の形態2と異なっている。この点について以下に説明する。なお、以下の説明においては、適宜図9〜図11を参酌する。
本実施の形態3においては、共通キーワードランキング部33は、実施の形態2と異なり、共通キーワードが属するカテゴリの数によって、共通キーワードの重要度(ランキング)を決定する。例えば、共通キーワードランキング部33は、カテゴリの重複数が多いキーワードを、カテゴリの重複数が少ないキーワードよりも重要度が高いと判定することができる。
図5A及び図5Bに示すように、共通キーワード抽出部32が、共通キーワードとして「HDD」と「チューナー」とを抽出している場合について説明する。図5Aに示すように、共通キーワード「HDD」は第3階層で、「録画」、「EPG」、及び「ダビング」の3つのカテゴリに属している。一方、共通キーワード「チューナー」は第3階層で、「EPG」と「ダビング」との2つのカテゴリに属している。この場合、共通キーワードランキング部33は、共通キーワード「HDD」の重要度を、共通キーワード「チューナー」よりも重要度も高くに設定する。
このように、本実施の形態3では、検索部20によって検索されたコンテンツ集合(対象コンテンツ集合)の中で、より多くのカテゴリに属する共通キーワードが、共通キーワードとして優先して表示される。そして、この場合の共通キーワードは、一般的な概念に近いと考えられるため、ユーザは、管理者のカテゴリ分類にかかわらず、一般的な概念を示す共通キーワードを使ってコンテンツを検索することができる。この結果、本実施の形態3を用いた場合も、実施の形態2と同様に、検索効率のよりいっそうの向上が図られると考えられる。
また、本実施の形態3では、例えば、図15に示されたカテゴリが選択メニューとして表示され、ユーザがこの選択メニューからカテゴリの一つを選択すると、共通キーワード抽出部32は、選択されたカテゴリに応じて共通キーワードを抽出する。そして、この場合、共通キーワードランキング部33は、選択された階層に応じて、例えば、選択された階層の一つ下の階層を用いてランキングを行うことができる。この場合は、ユーザの選択操作の支援が図られる。
具体的には、ユーザが図15のメニューの中で機種βを選択すると、検索部20は、対象コンテンツ集合として、コンテンツC1、C2、C3、C4、及びC5を検索する。そして、キーワード調査部31は、コンテンツC1からC5に含まれるキーワードとして「HDD」「チューナー」「DVD−R」を抽出する。更に、キーワード調査部31は、コンテンツ記憶部10が記憶するカテゴリ分類とカテゴリ分類の階層構造と(図15参照)を利用し、「HDD」「チューナー」「DVD−R」が、選択された「機種β」の階層の一つ下の階層のどのカテゴリと関係しているかを調査する。
この場合、第3階層のカテゴリから、キーワード「HDD」はカテゴリ「EPG」「ダビング」に関係し、キーワード「チューナー」はカテゴリ「EPG」「ダビング」に関係し、キーワード「DVD−R」はカテゴリ「ダビング」のみに関係していることが分かる。
共通キーワード抽出部32は、キーワード調査部31の結果から、選択された「機種β」の階層の一つ下の階層(第3階層)の複数のカテゴリに属するキーワード、つまり、「HDD」と「チューナー」とを、共通キーワードとして抽出する。また、共通キーワード抽出部32は、これら共通キーワードを共通キーワードランキング部33に入力する。
そして、この場合、共通キーワードランキング部33は、選択された「機種β」の階層の一つ下の階層(第3階層)におけるカテゴリの重複数によってランキングを決定する。具体的には、共通キーワード「HDD」は第3階層で、「EPG」と「ダビング」との2つのカテゴリに重複して属し、共通キーワード「チューナー」も「EPG」と「ダビング」との2つのカテゴリに重複して属している。このため、共通キーワードランキング部33は、共通キーワード「HDD」と「チューナー」との重要度を同等と判定し、同位とする。
(実施の形態4)
次に、本発明の実施の形態4における情報検索装置、情報検索方法及びプログラムについて説明する。最初に、本実施の形態4における情報検索装置の概略構成について、図12を参酌しながら説明する。図12は、本発明の実施の形態4における情報検索装置の概略構成を示すブロック図である。
図12に示すように、本実施の形態4における情報検索装置3は、共通キーワードランキング部33が、コンテンツ記憶部10に記憶されている情報を参照することができる。つまり、本実施の形態4における情報検索装置3は、共通キーワードランキング部33における処理の点で、実施の形態2における情報検索装置2と異なっている。
なお、これ以外の点では、本実施の形態4における情報検索装置3は、実施の形態2における情報検索装置2と同様に構成されている。また、本実施の形態4における情報検索方法は、実施の形態2における情報検索方法と同様に、図11に示したフロー図に沿って実行される。以下、相違点について説明する。
本実施の形態4においては、共通キーワードランキング部33は、コンテンツ記憶部10に記憶されている、複数のコンテンツ及び複数のキーワードに基づいて、共通キーワード毎に対応するコンテンツの数を求め、コンテンツの数に応じてランキングを付与する。例えば、共通キーワードランキング部33は、抽出されているコンテンツの数が多い共通キーワードは、抽出されているコンテンツの数が少ない共通キーワードよりも重要度(ランキング)が高いと判定する。
ここで、図15に示したコンテンツ集合が検索対象であり、ユーザが検索キーワードとして「DVDレコーダ」を入力した例について説明する。この場合、検索部20によって、図15に示すコンテンツC1〜C6が検索される。キーワード調査部31は、コンテンツ記憶部10に記憶されている、図2に示すコンテンツとキーワードとの関係を利用して、コンテンツC1〜C6に含まれるキーワード「HDD」、「チューナー」及び「DVD−R」を抽出する。
そして、共通キーワードランキング部33は、コンテンツ記憶部10に記憶されている、図2に示すコンテンツとキーワードとの関係を参照し、「HDD」「チューナー」「DVD−R」それぞれが抽出されているコンテンツ数を算出する。具体的には、この場合、共通キーワード「HDD」は、コンテンツ「C1」「C3」「C6」の3件に対応し、共通キーワード「チューナー」は、コンテンツ「C2」「C5」の2件に対応する。そのため、共通キーワードランキング部33は、「HDD」の重要度を、共通キーワード「チューナー」の重要度よりも高いと判定する。
このように、実施の形態4による場合は、複数のカテゴリに重複して現れる共通キーワードのうち、抽出されるコンテンツ数が多い共通キーワード程、ランキングが高い共通キーワードとして優先して表示される。また、本実施の形態4においても、実施の形態3と同様に、優先して表示される共通キーワード程、対象コンテンツ集合の中で良く現れる、一般的な概念に近いと考えられ、ユーザは、管理者のカテゴリ分類にかかわらず、一般的な概念を示す共通キーワードを使ってコンテンツを検索することができる。この結果、本実施の形態4を用いた場合も、実施の形態2及び3と同様に、検索効率のよりいっそうの向上が図られると考えられる。
(実施の形態5)
次に、本発明の実施の形態5における情報検索装置、情報検索方法及びプログラムについて説明する。最初に、本実施の形態5における情報検索装置の概略構成について、図13及び図14を参酌しながら説明する。図13は、本発明の実施の形態5における情報検索装置の概略構成を示すブロック図である。図14は、図13に示された検索履歴管理部によって記憶されている情報の一例を示す図である。
図13に示すように、本実施の形態5における情報検索装置4は、共通キーワード生成部30が検索履歴管理部34を備えており、この点で、図12に示した実施の形態4における情報検索装置3と異なっている。また、本実施の形態5における情報検索装置4は、共通キーワードランキング部33が検索履歴管理部に対応して動作する点でも、実施の形態4における情報検索装置3と異なっている。
なお、これら以外の点では、本実施の形態5における情報検索装置4は、実施の形態4における情報検索装置3と同様に構成されている。また、本実施の形態5における情報検索方法は、実施の形態2における情報検索方法と同様に、図11に示したフロー図に沿って実行される。以下、相違点について説明する。
本実施の形態5において、検索履歴管理部34は、図14に示すように、検索部20が入力を受け付けた検索キーワードと、検索キーワード毎の入力回数とを記憶する。また、本実施の形態5では、共通キーワードランキング部33は、複数の共通キーワードそれぞれが、検索履歴管理部34に記憶されている検索キーワード(図14参照)と、一致するかどうかを判定する。更に、共通キーワードランキング部33は、検索履歴管理部34に記憶されている入力回数に基づいて、検索キーワードと一致する共通キーワードの入力回数を求め、求めた入力回数に応じてランキングを決定する。
例えば、共通キーワードランキング部33は、同一のキーワードが検索キーワードとして入力されている回数の多い共通キーワードを、同一のキーワードが検索キーワードとして入力されている回数の少ないキーワードよりも重要度が高いと判定する。
図14の例では、共通キーワードランキング部33は、検索履歴管理部34に記憶された情報から、キーワード「チューナー」の入力回数が20回、「HDD」の入力回数が10回であることを取得する。そして、共通キーワードとして、「チューナー」と「HDD」とが抽出されている場合は、共通キーワードランキング部33は、「チューナー」の重要度を、「HDD」の重要度よりも高いと判定する。
このように、本実施の形態5によれば、ユーザによる利用頻度の高いキーワードと同一の共通キーワードのランキングは高く設定され、この共通キーワードは優先して表示される。また、本実施の形態5においても、実施の形態3と同様に、優先して表示される共通キーワード程、対象コンテンツ集合の中で良く現れる、一般的な概念に近いと考えられ、ユーザは、管理者のカテゴリ分類にかかわらず、一般的な概念を示す共通キーワードを使ってコンテンツを検索することができる。この結果、本実施の形態5を用いた場合も、実施の形態2〜4と同様に、検索効率のよりいっそうの向上が図られると考えられる。
また、上記実施の形態1〜5では、情報検索装置は、更に、カテゴリ分類されたコンテンツ集合に対して検索を行う際に、対象となるカテゴリにおいて他のカテゴリよりも頻繁に出現するキーワード(特徴キーワード)を特定する機能を備えているのが好ましい。
上記の場合は、情報検索装置は、複数のカテゴリに重複して現れる共通キーワードと、カテゴリ毎の特徴を示す特徴キーワードとの2種類のキーワードを抽出し、ユーザに表示できる。このため、ユーザは、一般的な概念でコンテンツを探したい場合は共通キーワードを利用でき、各カテゴリにおける代表的な内容でコンテンツを探したい場合は特徴キーワードを利用でき、目的に応じてコンテンツを絞り込むことができる。
なお、特徴キーワードの特定は、カテゴリ毎に、重要度や出現数等に応じて、出現するキーワードにランキングを付与する技術を用いることによって行うことができる。また、アルファベット順にランキングを付与する技術を用いることもできる。このような技術としては、特開2004−139401号公報や、特開2003−99445号公報等に開示された技術が挙げられる。
以上、実施の形態を参照して本願発明を説明したが、本願発明は上記によって限定されるものではない。本願発明の構成や詳細には、発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
上述の実施の形態では、本発明をハードウェアの構成として説明したが、本発明は、これに限定されるものではない。本発明は、任意の処理を、CPU(Central Processing Unit)にコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンピュータプログラムは、記録媒体に記録して提供することも可能であり、また、インターネットその他の通信媒体を介して伝送することにより提供することも可能である。また、記憶媒体には、例えば、フレキシブルディスク、ハードディスク、磁気ディスク、光磁気ディスク、CD−ROM、DVD、ROMカートリッジ、バッテリバックアップ付きRAMメモリカートリッジ、フラッシュメモリカートリッジ、不揮発性RAMカートリッジ等が含まれる。また、通信媒体には、電話回線等の有線通信媒体、マイクロ波回線等の無線通信媒体等が含まれる。
この出願は、2008年11月28日に出願された日本出願特願2008−305551を基礎とする優先権を主張し、その開示の全てをここに取り込む。
以上のように、本発明によれば、階層化された複数のカテゴリで分類された、FAQや商品情報などのコンテンツ集合を管理している、ポータルサイトや、受付業務部門において、効率の良い検索が可能となる。本発明は、特に、検索支援という用途等に適用でき、産業上の利用可能性を有するものである。
10 コンテンツ記憶部
20 検索部
30 共通キーワード生成部
31 キーワード調査部
32 共通キーワード抽出部
33 共通キーワードランキング部
34 検索履歴管理部
40 キーワード抽出部
50 入力部
60 表示装置
70 データベース

Claims (27)

  1. 階層化された複数のカテゴリで分類されている複数のコンテンツを検索対象とする、情報検索装置であって、
    前記複数のコンテンツと、前記複数のコンテンツいずれかの属性を表現する複数のキーワードと、前記階層化された複数のカテゴリとを記憶するコンテンツ記憶手段と、
    外部からの検索キーワードの入力を受け付け、前記コンテンツ記憶手段に記憶されている前記複数のコンテンツから、前記検索キーワードを含むコンテンツを検索する検索手段と、
    前記コンテンツ記憶手段に記憶されている前記複数のキーワードから、前記検索手段によって検索されたコンテンツの属性を表現するキーワードを抽出し、抽出された前記キーワードが属するカテゴリとその階層とを少なくとも調査するキーワード調査手段と、
    前記キーワード調査手段による調査の結果に基づいて、前記キーワード調査手段によって抽出された前記キーワードの中から、同一階層にある複数のカテゴリに属するキーワードを、共通キーワードとして抽出する共通キーワード抽出手段とを備え、
    前記共通キーワード抽出手段による前記共通キーワードの抽出が行われた後に、前記共通キーワードが、前記検索キーワードとして、前記検索手段に入力されると、
    前記検索手段は、前記検索キーワードを含むコンテンツの代わりに、前記検索キーワードとして入力された共通キーワードが属性を表現するコンテンツを検索する
    とを特徴とする、情報検索装置。
  2. 前記共通キーワード抽出手段によって複数の共通キーワードが抽出されている場合に、抽出された前記複数の共通キーワードそれぞれに、共通度合いに応じてランキングを付与する、共通キーワードランキング手段を、更に備える、請求項1に記載の情報検索装置。
  3. 前記共通キーワードランキング手段は、
    前記コンテンツ記憶手段に記憶されている、前記複数のコンテンツ及び前記複数のキーワードに基づいて、前記複数の共通キーワードそれぞれ毎に、それによって属性が表現されたコンテンツの数を求め、求められた前記コンテンツの数に応じて前記ランキングを付与する、請求項2に記載の情報検索装置。
  4. 前記共通キーワードランキング手段は、
    前記コンテンツ記憶手段に記憶されている、前記階層化された複数のカテゴリに基づいて、前記複数の共通キーワードそれぞれ毎に、当該共通キーワードが属する複数のカテゴリの階層を求め、求めた前記階層に応じて前記ランキングを付与する、請求項2に記載の情報検索装置。
  5. 前記共通キーワードランキング手段は、
    前記コンテンツ記憶手段に記憶されている、前記階層化された複数のカテゴリに基づいて、前記複数の共通キーワードそれぞれ毎に、当該共通キーワードが属するカテゴリの数を求め、求めたカテゴリの数に応じて前記ランキングを付与する、請求項2に記載の情報検索装置。
  6. 前記検索手段が入力を受け付けた前記検索キーワードと、検索キーワード毎の入力回数とを記憶する検索履歴管理手段を、更に備え、
    前記共通キーワードランキング手段は、前記複数の共通キーワードそれぞれが、前記検索履歴管理手段に記憶されている前記検索キーワードと、一致するかどうかを判定し、更に、前記検索履歴管理手段に記憶されている前記入力回数に基づいて、前記検索キーワードと一致する共通キーワードの前記入力回数を求め、求めた前記入力回数に応じて前記ランキングを決定する、請求項2に記載の情報検索装置。
  7. キーワード抽出手段を、更に備え、
    前記キーワード抽出手段は、検索対象となる前記複数のコンテンツが格納されている外部のデータベースから、前記複数のコンテンツそれぞれの属性を表現するキーワードを抽出し、抽出した前記キーワードを前記コンテンツ記憶手段に記憶させる、請求項1〜6のいずれかに記載の情報検索装置。
  8. 前記キーワード抽出手段は、前記データベースに格納されている前記複数のコンテンツそれぞれ毎に、当該コンテンツに含まれる文章を単語に分割し、分割によって得られた各単語を前記キーワードとして抽出する、請求項7に記載の情報検索装置。
  9. 前記キーワード抽出手段は、前記データベースに格納されている前記複数のコンテンツそれぞれについて、当該コンテンツに関連付けられている最下層のカテゴリを求め、求めた前記カテゴリを前記キーワードとして抽出する、請求項7に記載の情報検索装置。
  10. 階層化された複数のカテゴリで分類されている複数のコンテンツを検索対象とし、コンピュータにより実行される情報検索方法であって、
    (a)前記複数のコンテンツと、前記複数のコンテンツいずれかの属性を表現する複数のキーワードと、前記階層化された複数のカテゴリとを予め記憶するステップと、
    (b)外部からの検索キーワードの入力を受け付け、前記(a)のステップで記憶されている前記複数のコンテンツから、前記検索キーワードを含むコンテンツを検索するステップと、
    (c)前記(a)のステップで記憶されている前記複数のキーワードから、前記(b)のステップで検索されたコンテンツの属性を表現するキーワードを抽出し、抽出された前記キーワードが属するカテゴリとその階層とを少なくとも調査するステップと、
    (d)前記(b)のステップでの調査の結果に基づいて、前記(c)のステップで抽出された前記キーワードの中から、同一階層にある複数のカテゴリに属するキーワードを、共通キーワードとして抽出するステップとを有し、
    前記(d)のステップによる前記共通キーワードの抽出が行われた後に、少なくとも前記(b)〜前記(d)のステップが実行され、
    その際、前記(b)のステップにおいて、前記共通キーワードが、前記検索キーワードとして入力され、前記検索キーワードを含むコンテンツの代わりに、前記検索キーワードとして入力された共通キーワードが属性を表現するコンテンツを検索する
    ことを特徴とする、情報検索方法。
  11. (e)前記(d)のステップで複数の共通キーワードが抽出されている場合に、抽出された前記複数の共通キーワードそれぞれに、共通度合いに応じてランキングを付与する、ステップを、更に有する、請求項10に記載の情報検索方法。
  12. 前記(e)のステップにおいて、
    前記(a)のステップで記憶されている、前記複数のコンテンツ及び前記複数のキーワードに基づいて、前記複数の共通キーワードそれぞれ毎に、それによって属性が表現されたコンテンツの数を求め、求められた前記コンテンツの数に応じて前記ランキングを付与する、請求項11に記載の情報検索方法。
  13. 前記(e)のステップにおいて、
    前記(a)のステップで記憶されている、前記階層化された複数のカテゴリに基づいて、前記複数の共通キーワードそれぞれ毎に、当該共通キーワードが属する複数のカテゴリの階層を求め、求めた前記階層に応じて前記ランキングを付与する、請求項11に記載の情報検索方法。
  14. 前記(e)のステップにおいて、
    前記(a)のステップで記憶されている、前記階層化された複数のカテゴリに基づいて、前記複数の共通キーワードそれぞれ毎に、当該共通キーワードが属するカテゴリの数を求め、求めたカテゴリの数に応じて前記ランキングを付与する、請求項11に記載の情報検索方法。
  15. (f)前記(b)のステップで入力が受け付けられた前記検索キーワードと、検索キーワード毎の入力回数とを記憶するステップを、更に有し、
    前記(e)のステップにおいて、前記複数の共通キーワードそれぞれが、前記(f)のステップで記憶された前記検索キーワードと、一致するかどうかを判定し、更に、前記(f)のステップで記憶された前記入力回数に基づいて、前記検索キーワードと一致する共通キーワードの前記入力回数を求め、求めた前記入力回数に応じて前記ランキングを決定する、請求項11に記載の情報検索方法。
  16. (g)検索対象となる前記複数のコンテンツが格納されている外部のデータベースから、前記複数のコンテンツそれぞれの属性を表現するキーワードを、前記(a)のステップで記憶させるために、抽出するステップを、更に有する、請求項10〜15のいずれかに記載の情報検索方法。
  17. 前記(g)のステップで、前記データベースに格納されている前記複数のコンテンツそれぞれ毎に、当該コンテンツに含まれる文章を単語に分割し、分割によって得られた各単語を前記キーワードとして抽出する、請求項16に記載の情報検索方法。
  18. 前記(g)のステップで、前記データベースに格納されている前記複数のコンテンツそれぞれについて、当該コンテンツに関連付けられている最下層のカテゴリを求め、求めた前記カテゴリを前記キーワードとして抽出する、請求項16に記載の情報検索方法。
  19. 階層化された複数のカテゴリで分類されている複数のコンテンツを検索対象として、コンピュータに情報検索を行わせるプログラムであって、
    コンピュータに、
    (a)前記複数のコンテンツと、前記複数のコンテンツいずれかの属性を表現する複数のキーワードと、前記階層化された複数のカテゴリとを予め記憶するステップと、
    (b)外部からの検索キーワードの入力を受け付け、前記(a)のステップで記憶されている前記複数のコンテンツから、前記検索キーワードを含むコンテンツを検索するステップと、
    (c)前記(a)のステップで記憶されている前記複数のキーワードから、前記(b)のステップで検索されたコンテンツの属性を表現するキーワードを抽出し、抽出された前記キーワードが属するカテゴリとその階層とを少なくとも調査するステップと、
    (d)前記(c)のステップでの調査の結果に基づいて、前記(c)のステップで抽出された前記キーワードの中から、同一階層にある複数のカテゴリに属するキーワードを、共通キーワードとして抽出するステップとを実行させ、
    前記(d)のステップによる前記共通キーワードの抽出が行われた後に、少なくとも前記(b)〜前記(d)のステップが実行され、
    その際、前記(b)のステップにおいて、前記共通キーワードが、前記検索キーワードとして入力され、前記検索キーワードを含むコンテンツの代わりに、前記検索キーワードとして入力された共通キーワードが属性を表現するコンテンツを検索する
    ことを特徴とする、プログラム。
  20. (e)前記(c)のステップで複数の共通キーワードが抽出されている場合に、抽出された前記複数の共通キーワードそれぞれに、共通度合いに応じてランキングを付与する、ステップを、前記コンピュータに更に実行させる、請求項19に記載のプログラム。
  21. 前記(e)のステップにおいて、
    前記(a)のステップで記憶されている、前記複数のコンテンツ及び前記複数のキーワードに基づいて、前記複数の共通キーワードそれぞれ毎に、それによって属性が表現されたコンテンツの数を求め、求められた前記コンテンツの数に応じて前記ランキングを付与する、請求項20に記載のプログラム。
  22. 前記(e)のステップにおいて、
    前記(a)のステップで記憶されている、前記階層化された複数のカテゴリに基づいて、前記複数の共通キーワードそれぞれ毎に、当該共通キーワードが属する複数のカテゴリの階層を求め、求めた前記階層に応じて前記ランキングを付与する、請求項20に記載のプログラム。
  23. 前記(e)のステップにおいて、
    前記(a)のステップで記憶されている、前記階層化された複数のカテゴリに基づいて、前記複数の共通キーワードそれぞれ毎に、当該共通キーワードが属するカテゴリの数を求め、求めたカテゴリの数に応じて前記ランキングを付与する、請求項20に記載のプログラム。
  24. (f)前記(b)のステップで入力が受け付けられた前記検索キーワードと、検索キーワード毎の入力回数とを記憶するステップを、前記コンピュータに更に実行させ、
    前記(e)のステップにおいて、前記複数の共通キーワードそれぞれが、前記(f)のステップで記憶された前記検索キーワードと、一致するかどうかを判定し、更に、
    前記(f)のステップで記憶された前記入力回数に基づいて、前記検索キーワードと一致する共通キーワードの前記入力回数を求め、求めた前記入力回数に応じて前記ランキングを決定する、請求項20に記載のプログラム。
  25. (g)検索対象となる前記複数のコンテンツが格納されている外部のデータベースから、前記複数のコンテンツそれぞれの属性を表現するキーワードを、前記(a)のステップで記憶させるため、抽出するステップを、前記コンピュータに更に実行させる、請求項19〜24のいずれかに記載のプログラム。
  26. 前記プログラムは、前記(g)のステップで、前記データベースに格納されている前記複数のコンテンツそれぞれ毎に、当該コンテンツに含まれる文章を単語に分割し、分割によって得られた各単語を前記キーワードとして抽出する、請求項25に記載のプログラム。
  27. 前記(g)のステップで、前記データベースに格納されている前記複数のコンテンツそれぞれについて、当該コンテンツに関連付けられている最下層のカテゴリを求め、求めた前記カテゴリを前記キーワードとして抽出する、請求項25に記載のプログラム。
JP2010540324A 2008-11-28 2009-11-06 情報検索装置、情報検索方法、及びプログラム Active JP5494493B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010540324A JP5494493B2 (ja) 2008-11-28 2009-11-06 情報検索装置、情報検索方法、及びプログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2008305551 2008-11-28
JP2008305551 2008-11-28
PCT/JP2009/005923 WO2010061538A1 (ja) 2008-11-28 2009-11-06 情報検索装置、情報検索方法、及び記録媒体
JP2010540324A JP5494493B2 (ja) 2008-11-28 2009-11-06 情報検索装置、情報検索方法、及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2010061538A1 JPWO2010061538A1 (ja) 2012-04-19
JP5494493B2 true JP5494493B2 (ja) 2014-05-14

Family

ID=42225428

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010540324A Active JP5494493B2 (ja) 2008-11-28 2009-11-06 情報検索装置、情報検索方法、及びプログラム

Country Status (2)

Country Link
JP (1) JP5494493B2 (ja)
WO (1) WO2010061538A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015225497A (ja) * 2014-05-28 2015-12-14 日本電信電話株式会社 情報検索装置

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5256273B2 (ja) * 2010-11-24 2013-08-07 ヤフー株式会社 意図抽出装置、方法及びプログラム
JP5994974B2 (ja) * 2012-05-31 2016-09-21 サターン ライセンシング エルエルシーSaturn Licensing LLC 情報処理装置、プログラム及び情報処理方法
CN103914492B (zh) * 2013-01-09 2018-02-27 阿里巴巴集团控股有限公司 查询词融合方法、商品信息发布方法和搜索方法及系统
JP2014238618A (ja) * 2013-06-06 2014-12-18 日本電気株式会社 検索方法、検索システム、検索装置、及びそのプログラム
CN103353899B (zh) * 2013-07-25 2016-02-03 刘莎 一种综合信息精准搜索方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002189738A (ja) * 2000-12-21 2002-07-05 Inpatekku Kk 特許情報等のキーワード分析方法及びキーワード分析装置
JP2004348554A (ja) * 2003-05-23 2004-12-09 Nippon Telegr & Teleph Corp <Ntt> 検索キーワード情報提供装置、検索キーワード情報提供方法、及び検索キーワード情報提供プログラム
JP2006004283A (ja) * 2004-06-18 2006-01-05 Nippon Telegr & Teleph Corp <Ntt> テキスト情報源からのキーワード抽出・絞り込み方法およびシステム
JP2008278400A (ja) * 2007-05-07 2008-11-13 Sharp Corp キーワード設定方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002189738A (ja) * 2000-12-21 2002-07-05 Inpatekku Kk 特許情報等のキーワード分析方法及びキーワード分析装置
JP2004348554A (ja) * 2003-05-23 2004-12-09 Nippon Telegr & Teleph Corp <Ntt> 検索キーワード情報提供装置、検索キーワード情報提供方法、及び検索キーワード情報提供プログラム
JP2006004283A (ja) * 2004-06-18 2006-01-05 Nippon Telegr & Teleph Corp <Ntt> テキスト情報源からのキーワード抽出・絞り込み方法およびシステム
JP2008278400A (ja) * 2007-05-07 2008-11-13 Sharp Corp キーワード設定方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200400012009; 杉山 達彦 他: '参加者活動特性を反映したディレクトリ型Web情報検索サービスの構成方法' 電子情報通信学会論文誌 第J84-B巻 第9号, 20010901, pp.1643-1653, 社団法人電子情報通信学会 *
JPN6013033280; 杉山 達彦 他: '参加者活動特性を反映したディレクトリ型Web情報検索サービスの構成方法' 電子情報通信学会論文誌 第J84-B巻 第9号, 20010901, pp.1643-1653, 社団法人電子情報通信学会 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015225497A (ja) * 2014-05-28 2015-12-14 日本電信電話株式会社 情報検索装置

Also Published As

Publication number Publication date
JPWO2010061538A1 (ja) 2012-04-19
WO2010061538A1 (ja) 2010-06-03

Similar Documents

Publication Publication Date Title
US8131779B2 (en) System and method for interactive multi-dimensional visual representation of information content and properties
US8572074B2 (en) Identifying task groups for organizing search results
US10795883B2 (en) Method and system for enterprise search navigation
US9690875B2 (en) Providing search results for mobile computing devices
US7769771B2 (en) Searching a document using relevance feedback
JP2006209743A (ja) ドキュメントセントリックソフトウェアアプリケーションに対するタスク指向ユーザインターフェースモデル
WO2009154153A1 (ja) 文書検索システム
KR101502671B1 (ko) 상관된 정보의 온라인 분석 및 디스플레이
KR20050004703A (ko) 이상적인 정보 추상화, 숨기기, 및 순서화를 통해, 시각적복잡성 및 탐색 노력을 경감시키기 위한 모델 및 방법
JP5494493B2 (ja) 情報検索装置、情報検索方法、及びプログラム
JP5539127B2 (ja) 文書管理システム、検索指定方法、プログラム
KR101441219B1 (ko) 정보 엔터티들의 자동 연관
JP4745726B2 (ja) ファイル管理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP5516416B2 (ja) 情報検索装置、情報検索方法、及びプログラム
JP2011145901A (ja) ファイル管理システム、方法、及びプログラム
JP5302529B2 (ja) 情報処理装置及び情報処理方法、プログラム、記録媒体
JP2010102503A (ja) 情報検索システム、情報検索方法、プログラム、及び記録媒体
JP2007080205A (ja) 検索装置及び検索方法
Vergoulis et al. Pub Finder: Assisting the discovery of qualitative research
JP2007219876A (ja) 閲覧画面再利用装置、閲覧画面再利用プログラム、及び記録媒体
JP2004302601A (ja) 検索結果表示方法、検索装置、及びコンピュータプログラム
WO2017212269A1 (en) Data processing system and data processing method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121010

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130709

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130814

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140217

R150 Certificate of patent or registration of utility model

Ref document number: 5494493

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150