JP4810469B2 - 検索支援装置、プログラム及び検索支援システム - Google Patents

検索支援装置、プログラム及び検索支援システム Download PDF

Info

Publication number
JP4810469B2
JP4810469B2 JP2007052843A JP2007052843A JP4810469B2 JP 4810469 B2 JP4810469 B2 JP 4810469B2 JP 2007052843 A JP2007052843 A JP 2007052843A JP 2007052843 A JP2007052843 A JP 2007052843A JP 4810469 B2 JP4810469 B2 JP 4810469B2
Authority
JP
Japan
Prior art keywords
document
keyword
search
theme
morpheme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007052843A
Other languages
English (en)
Other versions
JP2008217333A (ja
Inventor
光生 布目
康人 石谷
優 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2007052843A priority Critical patent/JP4810469B2/ja
Priority to US12/038,573 priority patent/US8001135B2/en
Publication of JP2008217333A publication Critical patent/JP2008217333A/ja
Application granted granted Critical
Publication of JP4810469B2 publication Critical patent/JP4810469B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、Webサイトの検索を支援する検索支援装置、プログラム及び検索支援システムに関する。
近年、携帯電話の著しい普及と技術革新に伴う性能向上によって、その用途は音声通話に留まらず、電子メールの送受信や携帯電話向けサイトの閲覧に利用されることが一般的となっている。また、機種によっては、Webブラウザの搭載により、一般のWebコンテンツの閲覧も可能となってきており、携帯電話はPC(Personal Computer)やPDA(Personal Digital Assistance)に類する高機能な情報端末としての役割を担ってきている。
上記のように携帯電話が情報端末としての役割を拡大し、PCと同様に膨大なコンテンツにアクセスが可能となるに伴い、携帯電話のような限られた入力インターフェースと画面の上でも、膨大な情報の中から所望する情報を簡単に検索でき、目的の情報へ容易にたどり着くことが要求されている。
こうした背景の下で、従来、携帯電話を用いて検索を行い、目的のサイトや情報にたどり着く手段には、大きく分けて次の二つの手法がある。一つは、コンテンツサービスで用意されている階層メニューをたどることにより目的のサイトを探すディレクトリ型の探索方法であり、もう一つは、検索エンジンに対してキーワードを入力することで、検索結果の要約リストを獲得し、それを参照して目的の情報にたどり着くキーワード検索型の検索方法である。
また、従来、検索方法に関し、種々の技術が提案されている。例えば、特許文献1には、検索対象の利用目的を記述したフレーズを用いて検索対象実態へのポインタ情報を検索することで、ユーザの希望する情報の検索の効率化を図った技術が開示されている。また、特許文献2には、指定されたハイパーテキストファイルからキーワードを抽出し、抽出された前記キーワードを用いてコンテンツの登録場所の検索を行うことで、類似したサイトを容易に見つけることが可能な技術が開示されている。また、特許文献3には、検索入力文と予め用意された事例文とをマッチングし、マッチングした事例文に関連付けられた検索エンジンに、検索入力文から抽出したキーワードの検索を依頼し、検索結果をユーザに提示することで、検索エンジン選択の負担を軽減した技術が開示されている。
特許第3759700号明細書 特開2003−208434号公報 特開2003−132060号公報
しかしながら、上記したディレクトリ型の検索方法では、事前に定義されている分類(階層カテゴリ)の粒度が細かすぎると、目的のサイトに到達するまでの操作量が増大し、操作が煩雑になるという問題がある。また、階層カテゴリの粒度が粗い場合には、特定のカテゴリに属するサイトの数が多くなるため、上記同様目的のサイトを探索するまでの操作量が増大し、操作が煩雑になるという問題がある。
一方、キーワード検索型の検索方法では、検索の結果、大量の結果がリスト表示された場合、携帯電話の限られた表示領域では、多くの画面スクロール操作等が必要となるため、操作性が悪く、また、検索結果を絞り込むために検索用語を追加するには、携帯電話の限られた入力手段で多数の操作が必要となるため、操作が煩雑になるという問題がある。
また、特許文献1に記載の技術では、検索精度を上げるため、多種多様なユーザの嗜好を表したフレーズを、網羅的に登録しておく必要があるため、現実的でなく、実用性に欠けるという問題がある。さらに、検索条件となるフレーズを作成する際の操作が煩雑となるという問題がある。また、特許文献2に記載の技術では、ユーザからの操作は特段必要とされていないが、指定されたハイパーテキストファイルのサイトに類似したサイトしか検索することができないため、ユーザが所望するサイトを提示できない可能性がある。また、特許文献3に記載の技術では、予め用意された事例文に基づいて、特定の分野に一義的に分別してしまうため、自由度が低く、ユーザの所望する分野に分別されない可能性がある。
本発明は、上記に鑑みてなされたものであって、検索する際の操作にかかる負荷を減少させるとともに、ユーザが所望する情報に容易に到達させることが可能な検索支援装置、プログラム及び検索支援システムを提供することである。
上述した課題を解決し、目的を達成するために、本発明は、文書及び当該文書中の特定の文字列が指示されたキーワードを取得する文書取得手段と、前記文書に含まれた形態素のうち、特定の属性を有した形態素を抽出し、当該文書中の形態素の出現状況に関する統計情報を生成する統計情報生成手段と、各形態素と、当該形態素の属性とを対応付けた語句属性テーブルを記憶する第1の記憶手段と、前記語句属性テーブルに基づいて、前記文書中に含まれた各形態素の属性を判別する属性判別手段と、前記キーワードに含まれた形態素毎に当該形態素の属性を対応付けたキーワード情報を生成するキーワード情報生成手段と、各分野を表すテーマと、当該テーマに関連する用語とを対応付けた文書テーマ推定テーブルを記憶する第2の記憶手段と、前記各分野を表すテーマと、当該テーマに関係する検索条件とを対応付けた検索条件テーブルを記憶する第3の記憶手段と、前記文書テーマ推定テーブルに基づいて、前記統計情報及びキーワード情報に含まれる形態素から、前記文書のテーマを推定する文書テーマ推定手段と、前記推定された文書のテーマに関係する検索条件を、前記検索条件テーブルから選定する検索条件選定手段と、を備える。
また、本発明は、コンピュータに、文書及び当該文書中の特定の文字列が指示されたキーワードを取得する文書取得機能と、前記文書に含まれた形態素のうち、特定の属性を有した形態素を抽出し、当該文書中の形態素の出現状況に関する統計情報を生成する統計情報生成機能と、各形態素と、当該形態素の属性とを対応付けた語句属性テーブルに基づいて、前記文書中に含まれた各形態素の属性を判別する属性判別機能と、前記キーワードに含まれた形態素毎に当該形態素の属性を対応付けたキーワード情報を生成するキーワード情報生成機能と、各分野を表すテーマと、当該テーマに関連する用語とを対応付けた文書テーマ推定テーブルに基づいて、前記統計情報及びキーワード情報に含まれる形態素から、前記文書のテーマを推定する文書テーマ推定機能と、前記推定された文書のテーマに関係する検索条件を、前記各分野を表すテーマと、当該テーマに関係する検索条件とを対応付けた検索条件テーブルから選定する検索条件選定機能と、を実現させる。
また、本発明は、情報通信端末と、検索支援装置とが通信可能に接続された検索支援システムであって、前記情報通信端末は、外部装置が提供する文書を取得するコンテンツ閲覧手段と、前記文書中の特定の文字列をキーワードとして指示可能なキーワード指定手段と、前記文書及びキーワードを前記検索支援装置に送信する閲覧リソース送信手段と、表示手段と、を備え、前記検索支援装置は、前記文書及びキーワードを取得する文書取得手段と、前記文書に含まれた形態素のうち、特定の属性を有した形態素を抽出し、当該文書中の形態素の出現状況に関する統計情報を生成する統計情報生成手段と、各形態素と、当該形態素の属性とを対応付けた語句属性テーブルを記憶する第1の記憶手段と、前記語句属性テーブルに基づいて、前記文書中に含まれた各形態素の属性を判別する属性判別手段と、前記キーワードに含まれた形態素毎に当該形態素の属性を対応付けたキーワード情報を生成するキーワード情報生成手段と、各分野を表すテーマと、当該テーマに関連する用語とを対応付けた文書テーマ推定テーブルを記憶する第2の記憶手段と、前記各分野を表すテーマと、当該テーマに関係する検索条件とを対応付けた検索条件テーブルを記憶する第3の記憶手段と、前記文書テーマ推定テーブルに基づいて、前記統計情報及びキーワード情報に含まれる形態素から、前記文書のテーマを推定する文書テーマ推定手段と、前記推定された文書のテーマに関係する検索条件を、前記検索条件テーブルから選定する検索条件選定手段と、を備える。
本発明によれば、文書及び当該文書に含まれた特定の文字列から、当該文書のテーマを推定し、このテーマに基づいて当該文書の特性に応じた検索条件を選定することで、ユーザは、関心のある文書中から特定の文字列を指示するのみで、当該文書のテーマに関係した検索条件を享受することができるため、検索の操作にかかる負荷を減少させるとともに、ユーザが所望する情報に容易に到達させることができる。
以下に添付図面を参照して、検索支援装置、プログラム及び検索支援システムの最良な実施形態を詳細に説明する。
[第1の実施形態]
図1は、本実施形態の検索支援システム1の構成を示した概略図である。図1に示すように、検索支援システム1は、情報通信端末10と、検索支援サーバ(検索支援装置)20と、検索エンジン30、Webサーバ40とを有している。各機器はインターネット等のネットワークを介して相互に通信可能に接続されている。
まず、情報通信端末10について説明する。情報通信端末10は、携帯電話等の情報通信端末装置であって、後述する通信部16を介してネットワークに接続することで、検索支援サーバ20、検索エンジン30及びWebサーバ40との間で情報の授受を行う。
図2は、情報通信端末10のハードウェア構成を示した図である。図2に示すとおり、情報通信端末10は、CPU(Central Processing Unit)11、操作部12、表示部13、ROM(Read Only Memory)14、RAM(Random Access Memory)15、通信部16等を備える。
CPU11は、RAM15の所定領域を作業領域として、ROM14に予め記憶された各種制御プログラムとの協働により各種処理を実行し、情報通信端末10を構成する各部の動作を統括的に制御する。
また、CPU11は、ROM14に予め記憶された所定のプログラムとの協働により、図1に示したコンテンツ閲覧部101、キーワード指定部102、閲覧リソース送信部103、検索方法提示選択部104、検索クエリ送信部105及び検索結果表示部106の各機能部を実現させる。なお、各機能部の動作については後述する。
操作部12は、各種入力キー等を備え、ユーザから操作入力された情報を入力信号として受け付け、その入力信号をCPU11に出力する。
表示部13は、LCD(Liquid Crystal Display)等により構成され、CPU11からの表示信号に基づいて、各種情報を表示する。なお、表示部13は、操作部12と一体的にタッチパネルを構成する態様としてもよい。
ROM14は、情報通信端末10の制御にかかるプログラムや各種設定情報等を書き換え不可能に記憶する。
RAM15は、SDRAM(Synchronous DRAM)等の記憶手段であって、各種データを書換え可能に記憶する性質を有していることから、CPU11の作業エリアとして機能し、バッファ等の役割を果たす。
通信部16は、ネットワークを通じ外部の機器(検索支援サーバ20、検索エンジン30、Webサーバ40)との間で通信を行うインターフェースであって、外部機器から送信された各種情報をCPU11に出力し、また、CPU11から出力される各種情報を外部機器に送信する。
次に、検索支援サーバ20について説明する。検索支援サーバ20は、情報通信端末10から送信された後述する閲覧リソースに基づき、当該閲覧リソースに応じた検索方法の候補を情報通信端末10に提供する検索支援装置である。図3は、検索支援サーバ20のハードウェア構成を示した図である。図3に示すとおり、情報通信端末10は、CPU21、操作部22、表示部23、ROM24、RAM25、記憶部26、通信部27等を備える。
CPU21は、RAM25の所定領域を作業領域として、ROM24又は記憶部26に予め記憶された各種制御プログラムとの協働により各種処理を実行し、検索支援サーバ20を構成する各部の動作を統括的に制御する。
また、CPU21は、ROM24又は記憶部26に予め記憶された所定のプログラムとの協働により、図1に示した入力文書リソース取得部201、キーワード候補選定部202、文書語句属性抽出部203、キーワード意味推定部204、入力文書テーマ推定部205、サイト種別推定部206、コンテンツタイプ推定部207、検索方法候補選定部208、検索方法候補検証部209及び検索方法候補メニュー生成部210の各機能部を実現させる。なお、各機能部の動作については後述する。
操作部22は、各種入力キー等を備え、ユーザから操作入力された情報を入力信号として受け付け、その入力信号をCPU21に出力する。
表示部23は、LCD等により構成され、CPU21からの表示信号に基づいて、各種情報を表示する。なお、表示部23は、操作部22と一体的にタッチパネルを構成する態様としてもよい。
ROM24は、検索支援サーバ20の制御にかかるプログラムや各種設定情報等を書き換え不可能に記憶する。
RAM25は、SDRAM等の記憶手段であって、各種データを書換え可能に記憶する性質を有していることから、CPU21の作業エリアとして機能し、バッファ等の役割を果たす。
記憶部26は、等の記憶手段であって、磁気的又は光学的に記録可能な記録媒体を有し、検索支援サーバ20の制御にかかるプログラムや各種設定情報等を記憶する。
また、記憶部26は、図1に示した形態素解析辞書261、キーワード意味推定ルール262、語句属性データベース263、文書テーマ推定ルール264、サイト種別推定ルール265、コンテンツタイプ推定ルール266、検索方法モデル267を所定の領域に記憶する。これら記憶部26に記憶された各情報については後述する。なお、本実施形態では、各情報を記憶部26に記憶する態様としたが、これに限らず、複数の記憶装置に分散して記憶する態様としてもよいし、検索支援サーバ20外の外部記憶装置に記憶する態様としてもよい。
通信部27は、ネットワークを通じ外部の機器(情報通信端末10、検索エンジン30、Webサーバ40)との間で通信を行うインターフェースであって、外部機器から送信された各種情報をCPU21に出力し、また、CPU21から出力される各種情報を外部機器に送信する。
検索エンジン30は、図示しないネットワーク上に存在するコンテンツを検索する機能を、情報通信端末10や検索支援サーバ20等に提供するサーバ装置又はシステムである。検索エンジン30は、情報通信端末10や検索支援サーバ20等から後述する検索条件(一又は複数の語句を“OR”、“AND”等の論理条件で組み合わせた文字列)を受信すると、この検索条件に対応するWebサーバ40(Webサイト)を検索し、この検索条件に合致したWebサイトの総数(検索件数)や、検索条件に合致したWebサイトの一覧、各Webサイトから提供されるコンテンツの要約等を返信する。
Webサーバ40は、HTML文書や画像等のコンテンツをHDD(Hard Disk Drive)等の記憶装置に格納し、これらコンテンツを情報通信端末10等が閲覧(参照)可能に提供するWebサイトである。なお、ネットワークに接続されるWebサーバ40の数量は、特に問わないものとする。
以下、本実施形態の検索支援システム1で行われる動作を説明する。図4は、情報通信端末10と検索支援サーバ20との間で行われる連動型検索処理の動作を示したラダーチャートである。なお、ステップS11〜S18は、情報通信端末10で行われる処理を示しており、ステップS21〜S31は、検索支援サーバ20で行われる処理を示している。
まず、情報通信端末10では、Webサーバ40の宛先を示したURL等のアドレス情報が操作部12等を介して入力されると、コンテンツ閲覧部101は、このアドレス情報に対応したWebサーバ40からコンテンツを取得し、表示部13に表示させる(ステップS11)。ステップS11で、表示部13に表示されたコンテンツの一例を図5−1に示す。
次いで、本連動型検索処理を実行する旨の指示信号が操作部12等を介して入力されると、キーワード指定部102は、表示部13に表示されたコンテンツ中の特定の語句(文字列)をキーワードとして選択させるための入力支援手段を提供し(ステップS12)、当該キーワードが入力されるまで待機する(ステップS13;No)。
図5−2から図5−5は、ステップS12からステップS13にかけて表示部13に表示される画面の一例を示した図である。まず、図5−1に示した「ブラウザメニュー」から、図5−2に示すように、連動型検索処理の実行を指示する「連動型検索」が選択され、この指示信号がCPU21に入力されると、キーワード指定部102は、ユーザに対して、現在閲覧中のコンテンツに含まれる文字列から、任意の文字列を選択可能なインターフェース(入力支援手段)を提供する。ここで、ユーザが選択可能なキーワードとしては、特に制限はなく、例えば、語句中の部分的な文字列等であってもよい。
図5−3から図5−4では、上記インターフェースとして、選択したいキーワードを、その始点及び終点をカーソルにより指定した場合の態様を示しており、このインターフェースにより、「田中」という文字列がキーワードとして選択されている(図5−5参照)。なお、キーワード指定部102が提供する入力支援手段は、この態様に限らないものとする。
図4に戻り、表示部13に表示されたコンテンツに基づき、ユーザから操作部12を介して特定のキーワード(文字列)が入力されると(ステップS13;Yes)、閲覧リソース送信部103は、ステップS13で入力されたキーワードと、現在閲覧中のコンテンツのURL又はコンテンツのHTML文書を、閲覧リソースとして検索支援サーバ20に送信する(ステップS14)。
一方、検索支援サーバ20では、情報通信端末10から送信された閲覧リソースを受信すると、入力文書リソース取得部201は、当該閲覧ソースに含まれたキーワードとHTML文書とを取得し(ステップS21)、後段のキーワード候補選定部202に出力する。なお、閲覧リソースにHTML文書が含まれておらず、代わりにコンテンツのURLが含まれていた場合には、入力文書リソース取得部201は、ステップS21において、このURLに対応するWebサーバ40からコンテンツを取得し、このコンテンツからHTML文書を取得する。
続いてキーワード候補選定部202は、入力文書リソース取得部201からキーワード及びHTML文書を受け取ると、ステップS22のキーワード候補選定処理を実行する。以下、図6を参照して、ステップS22のキーワード候補選定処理について説明する。
図6は、キーワード候補選定部202により実行されるキーワード候補選定処理の手順を示したフローチャートである。まず、キーワード候補選定部202は、入力されたHTML文書を入力文書とし、この入力文書に含まれた文字列を、形態素解析辞書261に基づいて形態素単位で分割する(ステップS221)。
ここで、形態素解析辞書261は、種々の形態素と、当該形態素の属性とが予め対応付けられたテーブルであって、形態素解析辞書261に含まれた形態素と、入力文書に含まれた文字列とを比較し、一致した文字列毎に分割することで、形態素単位で分割が行われる。なお、ここで形態素の属性とは、当該形態素の品詞や活用型、付加情報(例えば、国名、人名等)、読み、発音等であって、形態素毎に予め定義されている。
次に、キーワード候補選定部202は、入力されたキーワードが、入力文書中の何文字目から何文字目に出現するかを特定し(ステップS222)、この出現位置の始点をi、終点をjとした後、これら位置情報をRAM25等に保持する(ステップS223)。
続いて、キーワード候補選定部202は、キーワードの始点iから、当該キーワードに先行する形態素に対応する語の文字列長分だけ減算、又は、キーワードの終点jから、当該キーワードに後続する形態素に対応する語の文字列長分だけ加算することで、キーワードの選択範囲を形態素単位で拡張し(ステップS224)、選択範囲が拡張されたキーワードをキーワード候補としてRAM25等に保持する(ステップS225)。
例えば、図5−5を例にとると、キーワード「田中」を基準とし、上記選択範囲の拡張処理(ステップS224)を文書の前方(キーワードに先行する方向)へ1回適用した場合には、キーワード候補は「MF田中」となる。また、同様にキーワード「田中」を基準として、上記選択範囲の拡張処理(ステップS224)を文書の後方(キーワードに後続する方向)に1回適用した場合には、キーワード候補は「田中寿英」となる。なお、本実施形態では、キーワードに先行又は後続する形態素について行うこととしたが、キーワードに先行及び後続する形態素について行うこととしてもよい。
次いで、キーワード候補選定部202は、キーワード候補となった文字列の長さが、キーワードが存在する一文の長さと同等か、又は、選択範囲の拡張を予め定められた回数分実行したか否かを判定し、何れにも該当しない場合には(ステップS226;No)、ステップS224に再び戻り、先の選択範囲の拡張処理で求められたキーワード候補を基準に、キーワードの選択範囲をさらに拡張する。
一方、ステップS226において、キーワード候補となった文字列の長さが、キーワードが存在する一文の長さと同等であると判定した場合、又は、選択範囲の拡張を予め定められた回数分実行したと判定した場合には(ステップS226;Yes)、キーワード候補選定部202は、これまでにキーワード候補として得られた各文字列を、検索エンジン30に夫々送信し(ステップS227)、各文字列に応じた検索結果を、検索エンジン30から夫々取得する(ステップS228)。
そして、キーワード候補選定部202は、取得した検索結果のうち、検索件数が多く得られた上位のキーワード候補を、入力されたキーワードとともに、キーワード拡張結果として、文書語句属性抽出部203に出力し(ステップS229)、図4のステップS23へと移行する。なお、文書語句属性抽出部203に出力するキーワード候補の個数は特に問わず、例えば、最上位のものをキーワード候補としてもよいし、上位3つをキーワード候補としてもよい。また、ステップS227、228を行わず、ステップS229では、ステップS226までに得られたキーワード候補とキーワードとをキーワード拡張結果として文書語句属性抽出部203に出力する態様としてもよい。
図4に戻り、文書語句属性抽出部203は、キーワード候補選定部202からキーワード拡張結果を受け取ると、ステップS23の語句属性解析処理を実行する。以下、図7、図8を参照して、ステップS23の語句属性解析処理について説明する。
図7は、文書語句属性抽出部203により実行される語句属性解析処理の手順を示したフローチャートである。まず、文書語句属性抽出部203は、形態素解析辞書261に基づいて、入力文書に対し形態素解析を適用することで、文書を形態素毎に分割し(ステップS231)、各形態素の属性を判別することで、各形態素とその属性とを対応付けたテーブルを生成し、形態素解析結果としてRAM25等に保持する(ステップS232)。
次いで、文書語句属性抽出部203は、形態素解析結果から、入力文書全体に含まれた属性が名詞の形態素を抽出し、その出現頻度を対応付けた統計情報を生成する(ステップS233)。また、文書語句属性抽出部203は、形態素解析辞書261に基づいて、キーワード拡張結果に対し形態素解析を適用することで、キーワード及び当該キーワード候補に含まれた文字列を形態素毎に分割し、各形態素の属性を判別することで、各形態素とその属性とを対応付けたキーワード情報を生成する(ステップS234)。そして、文書語句属性抽出部203は、統計情報とキーワード情報とを語句属性データベース263として、記憶部26に保持する(ステップS235)。
なお、本実施形態では、ステップS231において、入力文書の形態素解析を行うこととしたが、上述したキーワード候補選定処理(図6参照)のステップS221で、ステップS231と同様の形態素解析を行った場合には、ステップS221の形態素解析結果を用いる態様としてもよい。
図8は、語句属性データベース263を説明するための図である。なお、入力文書として、A11に示した文字列が入力されたものとする。
ステップS231において、文書語句属性抽出部203は、入力文書に対し形態素解析を適用することで、文書を形態素毎に分割し、各形態素に属性を対応付けた形態素解析結果を生成する。A12には、A11の形態素解析結果を示しており、A11の文字列に含まれた形態素(ワールドカップ等)毎に、当該形態素の属性(名詞−固有名詞−一般等)が対応付けられている。
A13は、A12の形態素解析結果に基づいて導出された統計情報の一例を示している。このA13の例では、まず入力文書全体の形態素解析結果から固有名詞(名詞−固有名詞)が抽出された例が示されている。
具体的に、文書語句属性抽出部203は、形態素解析結果(A12参照)から、属性が一般固有名詞(名詞−固有名詞−一般)に該当する形態素として、まず「ワールドカップ」を選択し、この品詞の入力文書中における出現位置を入力文書から特定する。そして、文書語句属性抽出部203は、品詞種別と、当該品詞種別に該当する品詞と、出現位置とを対応付ける。なお、A13では、入力文書の1文字目から7文字目(1、7)に「ワールドカップ」が出現することを意味している。
また、文書語句属性抽出部203は、上記と同様形態素解析結果から、属性が固有名詞に形態素「W杯(名詞−固有名詞−一般)」、「ドイツ(名詞−固有名詞−国名)」、「田中寿英(名詞−固有名詞−人名−性、名詞−固有名詞−人名−名)」を選択し、各形態素について品詞種別と、出現位置とを対応付ける。そして、文書語句属性抽出部203は、属性の種別(一般固有名詞、国名、人名等)毎に選定した形態素の個数を算出し、属性の種別毎に対応する形態素と出現位置とを関係付け、統計情報として生成する(A13参照)。なお、A13において、属性の種別に付加された数値(例えば“2”)は、その属性に属する形態素の個数を示している。
A14は、キーワード情報の一例を示している。このA14の例では、キーワードとしてA11に含まれた「田中」がキーワードとして指定された場合の例を示しており、また、キーワード候補として「たMF田中寿英選手」等が入力された場合の例を示している。なお、A14において、基準となるキーワード(基準キーワード)「田中」には、その旨を示す出現位置情報「0(該当文字)」が付加されている。
具体的に、文書語句属性抽出部203は、形態素解析結果(A12参照)に基づいて、キーワード及びキーワード候補に含まれた文字列を、A14に示したように、「た」、「MF」、「田中」、「寿英」、「選手」の形態素毎に分割する。そして、文書語句属性抽出部203は、分割した形態素毎に、その属性を対応付けたキーワード情報を生成する。
なお、キーワード情報に記録される各形態素には、基準キーワードに対する出現位置に応じた出現位置情報が付与されるものとする。本実施形態では、A14に示したように、基準キーワードの前方に出現する品詞については、その形態素分の個数を0から減算した出現位置情報(−1(1品詞前)等)が付与され、また、基準キーワードの後方に出現する形態素については、その形態素分の個数を0に加算した出現位置情報(+1(1品詞後)等)が付与されるものとする。
図4に戻り、続くステップS24では、キーワード意味推定部204により、キーワード意味推定処理が実行される。以下、図9、図10を参照して、ステップS24のキーワード意味推定処理について説明する。
図9は、キーワード意味推定部204により実行されるキーワード意味推定処理の手順を示したフローチャートである。まず、キーワード意味推定部204は、文書語句属性抽出部203で取得された形態素解析結果を、RAM25等から読み出す(ステップS241)。
次いで、キーワード意味推定部204は、形態素解析結果に基づいて、入力文書に含まれた各形態素から、国名や人名等の付加情報を有する形態素を特定する(ステップS242)。
続いてキーワード意味推定部204は、記憶部26に記憶されたキーワード意味推定ルール262を読み出し(ステップS243)、このキーワード意味推定ルールに基づいて、入力文書に含まれた文字列(属性が名詞又は記号の形態素等)が意味する事象を判別する(ステップS244)。
ここで、キーワード意味推定ルール262とは、特定の文字列と、当該文字列意味する事象とを予め対応付けたテーブルであって、キーワード意味推定部204は、このキーワード意味推定ルール262に定義された文字列と、入力文書中の文字列とを比較することで、一致した文字列が意味する事象を判別する。なお、ここで「意味する事象」とは、所定の文字列から想起可能な事柄を意味し、例えば、文字列「ワールドカップ」、「W杯」の場合には、事象として「イベント」が対応付けられている。
次いで、キーワード意味推定部204は、入力文書に含まれた文字列(形態素)のうち、ステップS242で特定した形態素及びステップS243で判別した文字列について、対応する付加情報及び事象(以下、意味情報という)を対応付け、キーワード意味推定結果としてRMA25等に保持した後(ステップS245)、図4のステップS25に移行する。
図10は、キーワード意味推定処理を説明するための図である。図10において、上段のA21は、入力文書に含まれた各形態素から、国名や人名等の付加情報を有する形態素を特定した状態を模式的に示している。この例では、形態素「ドイツ」が国名(COUNTRY)の付加情報を有しており、同様に形態素「田中」が人名−姓(PERSON_sei)が、形態素「寿英」が人名−名(PERSON_mei)が、形態素「ボトルン」が都市名(CITY、TEAM)の付加情報を有している。
また、中段のA22は、入力文書にキーワード意味推定ルール262を適用し、特定の文字列が意味する事象を判別した結果を模式的に示している。なお、キーワード意味推定ルール262には、文字列「ワールドカップ」及び「W杯」について、事象「イベント(EVENT)」が対応付けられているものとする。また、属性が人名(PERSON)の文字列+文字列「選手」の組み合わせについて、事象「運動選手(ATHLETE)」が対応付けられているものとする。
また、キーワード意味推定ルール262には、属性が人名(PERSON)の文字列+任意の文字列「*(ワイルドカード)」+用語「()+属性が数(numeral)の文字列+文字列「」」の組み合わせについては、属性が数(numeral)の文字列に対し、事象「年齢(AGE)」が対応付けられているものとする。さらに、属性が数(numeral)の文字列+文字列「日」の組み合わせについては、事象「日付(DATE)」が対応付けられているものとする。
下段のA23は、意味解析結果の一例を示している。この例では、A23に示したように、該当する文字列(形態素)の前後に、タグ(「<」と「>」で囲まれた文字列)形式で表した意味情報を埋め込むことで、対応する文字列に対応付けられている。なお、本実施形態では、意味情報をタブ形式で対応付ける態様としたが、これに限らず、他の方法を用いることとしてもよい。
図4に戻り、続くステップS25では、入力文書テーマ推定部205により、文書テーマ推定処理が実行される。以下、図11、図12を参照して、ステップS25の文書テーマ推定処理について説明する。
図11は、入力文書テーマ推定部205により実行される文書テーマ推定処理の手順を示したフローチャートである。まず、入力文書テーマ推定部205は、記憶部26に保持された語句属性データベース263を読み出すとともに(ステップS251)、RAM25等に記憶された意味解析結果を読み出す(ステップS252)。
次いで、入力文書テーマ推定部205は、記憶部26に記憶された文書テーマ推定ルール264を読み出し(ステップS253)、語句属性データベース263に含まれた語(形態素)と、文書テーマ推定ルール264に定義された用語とを比較する(ステップS254)。
ここで、図12のA33を参照して、文書テーマ推定ルール264について説明する。文書テーマ推定ルール264には、各分野を表すテーマと、当該テーマに関連する用語とが対応付けて定義されている。A33の例においては、文書テーマ推定ルール264は階層構造で表され、各分野のテーマを表す上位概念語と、各上位概念語に関連する用語として下位概念語とが関連付けて定義されている。A33に示すように、例えば、上位概念語「スポーツ」の下位概念語として、「ゴルフ、サッカー、野球」が関連付けられている。
また、各概念語には、当該概念語に関連する語が、語彙リストとして定義されている。例えば、上位概念語「スポーツ」に対しては、スポーツに関連する語彙リストとして「選手、競技、試合、・・・」が定義されている。また、「ゴルフ」に関連する語彙リストとしては「ホール、打差、パー」が定義されており、同様に、「サッカー」に対しては「得点、W杯、キーパー」が、「野球」に対しては「球場、ホームラン、・・・」が定義されている。ステップS254において、入力文書テーマ推定部205は、この語彙リストに含まれた用語と適合する語が、語句属性データベース263に存在するか否かを判定する。
図11に戻り、ステップS254の比較の結果、語句属性データベース263中に、文書テーマ推定ルール264に定義された語と適合する語がないと判定した場合には(ステップS255;No)、図4のステップS26に直ちに移行する。
また、ステップS254の比較の結果、語句属性データベース263中に、文書テーマ推定ルール264に定義された用語と適合する語があると判定した場合には(ステップS255;Yes)、入力文書テーマ推定部205は、その適合した用語に係るテーマに対し、所定のスコアを付与する(ステップS256)。ここでスコアとは、統計情報及びキーワード情報に含まれた特定の形態素に対して予め付与された数値であって、特定のテーマに特有の用語(形態素)であるほど、高い値が付与されているものとする。
続いて、入力文書テーマ推定部205は、適合した用語に係るテーマと、そのスコアとを対応付け、入力文書推定結果としてRAM25等に格納した後(ステップS257)、図4のステップS26に直ちに移行する。
図12は、文書テーマ推定処理を説明するための図である。図12において、A31は、語句属性データベース263に含まれた統計情報を示しており、A32は、キーワード情報を示している。また、A33は、文書テーマ推定ルール264の一例を示している。
以下、A31〜A34を参照して、文書テーマ推定処理の一例を説明する。なお、統計情報に含まれた「W杯」に対しスコア“1”が、キーワード情報に含まれた「選手」に対しスコア“10”が付与されているものとする。
まず、入力文書テーマ推定部205は、A31、A32で示した語句属性データベース263に対して、A33の文書テーマ推定ルール264を適用することで、キーワード情報の「+2(2品詞語)」に定義された「選手」が、文書テーマ推定ルール264の上位概念語「スポーツ」に適合すると判断する。この場合、入力文書テーマ推定部205は、上位概念語「スポーツ」について、「選手」に割り振られたスコア“10”を加算する。
次に、入力文書テーマ推定部205は、統計情報の「W杯」が、文書テーマ推定ルール264の下位概念語「スポーツ−サッカー」に適合すると判断する。この場合、入力文書テーマ推定部205は、下位概念語「スポーツ−サッカー」について「W杯」に割り振られたスコア“1”を加算する。
このように、入力文書テーマ推定部205は、A34に示したように、「スポーツ」がスコア“10”、「スポーツ−サッカー」がスコア“1”と最終的に導出し、これらを入力文書推定結果としてRAM25等に格納する。
図4に戻り、続くステップS26では、サイト種別推定部206により、サイト種別推定処理が実行される。以下、図13、図14を参照して、ステップS26のサイト種別推定処理について説明する。
図13は、サイト種別推定部206により実行されるサイト種別推定処理の手順を示したフローチャートである。まず、サイト種別推定部206は、RAM25に格納されたキーワード意味推定結果を読み出すとともに(ステップS261)、入力文書推定結果を読み出す(ステップS262)。
次に、サイト種別推定部206は、記憶部26に予め記憶されたサイト種別推定ルール265を読み出し(ステップS263)、このサイト種別推定ルール265をキーワード意味推定結果及び入力文書推定結果に対して適用することで、後述するサイト種別とサイト関連度とを取得する(ステップS264)。そして、サイト種別推定部206は、取得したサイト種別とサイト関連度とを対応付け、サイト種別推定結果としてRAM25等に格納した後(ステップS265)、図4のステップS27に移行する。
図14は、サイト種別推定処理を説明するための図である。図14において、A41は、入力文書推定結果の一例を示しており、A42は、キーワード意味推定結果の一例を示している。また、A43は、サイト種別推定ルール265の一例を示しており、A44は、サイト種別推定結果の一例を示している。なお、A42のキーワード意味推定結果は、上述した図10のA23とは表現が異なるが、同様の意味を有するものである。
まず、図14のA43を参照して、サイト種別推定ルール265について説明する。サイト種別推定ルール265には、各分野を表すテーマと、意味情報と、サイト種別とが対応付けて定義されている。A43の例では、まずサイト種別として「ショッピングサイト」、「Blog」、「ニュースサイト」、「トラベルサイト」等の名称が定義されている。そして、これらのサイト種別に対して、各分野を表す「テーマ」及び意味情報に対応する「キーワード」が夫々定義されている。また、「テーマ」及び「キーワード」に含まれた各語については、夫々の語の重み付けとして所定の数値が定義されている。
例えば、サイト種別が「ショッピングサイト」であれば、関連するテーマとして「コンピュータ、書籍、チケット…」が定義されており、夫々の語の重み付けとして、“0.3”、“0.1”、“0.1”が定義されていることを示している。また、「ショッピングサイト」に関連するキーワードも同様に定義されている。ここでは、「MONEY」等が関連付けられており、その重み付けは“0.8”と定義されている。
同様に、サイト種別「Blog」では、関連するテーマとして「スポーツ、芸能、コンピュータ」等が夫々“0.1”の重み付けで定義されており、キーワードとして「PERSON」、「EVENT」等が夫々“0.3”の重み付けで定義されている。
また、サイト種別「ニュースサイト」では、関連するテーマとして「政治、経済、スポーツ、芸能…」等が夫々“0.8”の重み付けで定義されており、キーワードとして「PERSON」が“0.3”、「COUNTRY」が“0.1”、「ATHLETE」が“0.3”の重み付けで定義されている。
さらに、サイト種別「トラベルサイト」では、関連するテーマとして「旅行」が“0.8”、「乗り物」が“0.4”で定義されており、キーワードとして「COMPANY」、「CITY」が夫々“0.7”、「MONEY」が“0.2”の重み付けで定義されている。
サイト種別推定部206は、上記したサイト種別推定ルール265を、前段の処理までに得られた入力文書推定結果と、キーワード意味推定結果とに対して適用することで、まず入力文書推定結果に含まれた「スポーツ」が、サイト種別「Blog」並びに「ニュースサイト」のテーマ「スポーツ」に適合すると判断する。
ここで、「スポーツ」について割り当てられた重み付けは「Blog」で“0.1”、「ニュースサイト」で“0.8”と定義されているため、サイト種別推定部206は、これらの値を読み出し、夫々の重み付け値と入力文書推定結果の「スポーツ」に付与されたスコア“10”とを乗算する。具体的には、サイト種別「Blog」について、0.1×10=1.0、サイト種別「ニュースサイト」について、0.8×10=8.0と算出する。
次に、サイト種別推定部206は、キーワード意味推定結果を参照し、当該キーワード意味推定結果に含まれた「PERSON」が、サイト種別「Blog」の関連キーワードに重み付け値“0.3”で定義された「PERSON」に適合すると判定するとともに、サイト種別「ニュースサイト」の関連キーワードに重み付け値“0.3”で定義された「PERSON」に適合すると判定する。また、サイト種別推定部206は、キーワード意味推定結果に含まれた「ATHLETE」が、サイト種別「ニュースサイト」の関連キーワードに重み付け値“0.3”で定義された「ATHLETE」に適合すると判断する。
サイト種別推定部206は、これらの重み付け値を、先に導出したサイト種別の重み付け値とスコアとの乗算結果に加算することで、各サイト種別との関連度(サイト関連度)を導出する。具体的には、サイト種別「Blog」とのサイト関連度が、1.0+0.3=1.3、サイト種別「ニュースサイト」とのサイト関連度が、8.0+0.3+0.3=8.6と算出する。そして、サイト種別推定部206は、A44に示したように、サイト種別と関連度との組をサイト種別推定結果として取得する。ここで、サイト種別推定結果に含まれたサイト種別は、情報通信端末10のユーザが閲覧した可能性のあるWebサイトのサイト種別を推定したものとなっており、サイト関連度は、その推定の確かさ(可能性)を数値の大小により表している。
図4に戻り、続くステップS27では、コンテンツタイプ推定部207により、コンテンツタイプ推定処理が実行される。以下、図15、図16を参照して、ステップS27のコンテンツタイプ推定処理について説明する。
図15は、コンテンツタイプ推定部207により実行されるコンテンツタイプ推定処理の手順を示したフローチャートである。まず、コンテンツタイプ推定部207は、RAM25に格納されたキーワード意味推定結果を読み出すとともに(ステップS271)、入力文書推定結果を読み出す(ステップS272)。
次に、コンテンツタイプ推定部207は、記憶部26に予め記憶されたコンテンツタイプ推定ルール266を読み出し(ステップS273)、このコンテンツタイプ推定ルール266をキーワード意味推定結果及び入力文書推定結果に対して適用することで、後述するコンテンツタイプとコンテンツ関連度とを取得する(ステップS274)。そして、コンテンツタイプ推定部207は、取得したコンテンツタイプとコンテンツ関連度とを対応付け、コンテンツタイプ推定結果としてRAM25等に格納した後(ステップS275)、図4のステップS28に移行する。
図16は、コンテンツタイプ推定処理を説明するための図である。図16において、A51は、入力文書推定結果の一例を示しており、A52は、キーワード意味推定結果の一例を示している。また、A53は、コンテンツタイプ推定ルール266の一例を示しており、A54は、コンテンツタイプ推定結果の一例を示している。
まず、図16のA53を参照して、コンテンツタイプ推定ルール266について説明する。コンテンツタイプ推定ルール266には、各分野を表すテーマと、意味情報と、コンテンツタイプとが対応付けて定義されている。A53の例では、まずコンテンツタイプとして「カタログ」、「レビュー」、「記事」、「プレスリリース」等の名称が定義されている。そして、これらのコンテンツタイプに対して、分野を表すテーマ「テーマ」及び意味情報に対応する「キーワード」が夫々定義されている。また、「テーマ」及び「キーワード」に含まれた各語については、夫々の語の重み付けとして所定の数値が定義されている。
例えば、コンテンツタイプが「カタログ」であれば、関連するテーマとして「コンピュータ…」が定義されており、夫々の語の重み付けとして、“0.3”が定義されていることを示している。また、「カタログ」に関連するキーワードも同様に定義されている。ここでは、「COMPANY」が関連付けられており、その重み付けは“0.6”と定義されている。
同様に、コンテンツタイプ「レビュー」では、関連するテーマとして「レストラン、旅行、書籍、コンピュータ」等が夫々“0.2”の重み付けで定義されており、キーワードとして「EVENT」、「CITY」等が夫々“0.2”、“0.1”の重み付けで定義されている。
また、コンテンツタイプ「記事」では、関連するテーマとして「政治、経済、スポーツ、芸能…」等が夫々“0.8”の重み付けで定義されており、キーワードとして「PERSON」が“0.3”、「COUNTRY」が“0.1”、「ATHLETE」が“0.3”の重み付けで定義されている。
さらに、コンテンツタイプ「プレスリリース」では、関連するテーマとして「コンピュータ、芸能」が夫々“0.3”で定義されており、キーワードとして「COMPANY」、「DATE」が夫々“0.7”、また「PERSON」が“0.1”の重み付けで定義されている。
コンテンツタイプ推定部207は、上記したコンテンツタイプ推定ルール266を、前段の処理までに得られた入力文書推定結果と、キーワード意味推定結果とに対して適用することで、まず入力文書推定結果に含まれた「スポーツ」が、コンテンツタイプ「記事」に適合すると判定する。
ここで、「スポーツ」について割り当てられた重み付けは“0.8”と定義されているため、コンテンツタイプ推定部207は、この値を読み出し、この重み付け値と入力文書推定結果の「スポーツ」に付与されたスコア“10”とを乗算する。具体的には、コンテンツタイプ「記事」について、0.8×10=8.0と算出する。
次に、コンテンツタイプ推定部207は、キーワード意味推定結果を参照し、当該キーワード意味推定結果に含まれた「PERSON」が、コンテンツタイプ「記事」の関連キーワードに重み付け値“0.3”で定義された「PERSON」に適合すると判定するとともに、コンテンツタイプ「プレスリリース」の関連キーワードに重み付け値“0.1”で定義された「PERSON」に適合すると判定する。
コンテンツタイプ推定部207は、これらの重み付け値を、先に導出したコンテンツタイプの重み付け値とスコアとの乗算結果に加算することで、各コンテンツタイプとの関連度(コンテンツ関連度)を導出する。具体的には、コンテンツタイプ「記事」とのコンテンツ関連度が、8.0+0.3+0.3=8.6、コンテンツタイプ「プレスリリース」とのコンテンツ関連度が、0.0+0,1=0.1と算出する。そして、コンテンツタイプ推定部207は、A54に示したように、コンテンツとコンテンツ関連度との組をコンテンツタイプ推定結果として取得する。ここで、コンテンツタイプ推定結果に含まれたコンテンツタイプは、情報通信端末10のユーザが閲覧した可能性のあるコンテンツの種別を推定したものとなっており、コンテンツ関連度は、その推定の確かさ(可能性)を数値の大小により表している。
図4に戻り、続くステップS28では、検索方法候補選定部208により、検索方法候補選定処理が実行される。以下、図17〜図21を参照して、ステップS28の検索方法候補選定処理について説明する。
図17は、検索方法候補選定部208により実行される検索方法候補選定処理の手順を示したフローチャートである。まず、検索方法候補選定部208は、前段の処理までに取得された入力文書推定結果、サイト種別推定結果、コンテンツタイプ推定結果を、RAM25から読み出す(ステップS281)。
次いで、検索方法候補選定部208は、記憶部26に予め記憶された検索方法モデル267を読み出す(ステップS282)。以下、図18を参照して、検索方法モデル267について説明する。
図18は、検索方法モデル267の例を示した図である。検索方法モデル267には、入力文書推定結果、サイト種別推定結果及びコンテンツタイプ推定結果の夫々に含まれる各項目として「テーマ」、「サイト種別」、「コンテンツタイプ」と、検索対象を表す「ラベル」とが対応付けて定義されている。
図18−1に示した検索方法モデル267には、「テーマ」に対応付けられた検索の「ラベル」が定義されている。例えば、「コンピュータ」であれば、「スペックを調べる、発売時期を調べる、評価を見る」といったラベルが定義されている。同様に「スポーツ」であれば、「試合結果を見る、プロフィールを見る」といったラベルが定義されており、「政治」であれば、「プロフィールを見る、意味を調べる、組織を調べる」といったラベルが定義されており、「旅行」であれば、「地図を見る、価値を調べる、ツアーを探す」といったラベルが定義されている。なお、「ID」は、各テーマ名を一意に識別するためのID番号である。
また、図18−2に示した検索方法モデル267には、「サイト種別」に対応付けられた検索の「ラベル」が定義されている。例えば、「ショッピングサイト」であれば、「価格を調べる、評判を調べる、販売店を調べる」といったラベルが定義されている。同様に「ニュースサイト」であれば、「ニュースを見る、プロフィールを見る、写真を見る」といったラベルが定義されており、「Blog」であれば、「評価を見る、プロフィールを見る」といったラベルが定義されており、「トラベルサイト」であれば、「ツアーを探す、地図を見る、地名を調べる、感想を見る」といったラベルが定義されている。なお、「ID」は、各サイト種別名を一意に識別するためのID番号である。
さらに、図18−3に示した検索方法モデル267には、「コンテンツタイプ」に対応付けられた検索の「ラベル」が定義されている。例えば、「カタログ」であれば、「用語の意味を調べる、価格を調べる」といったラベルが定義されている。同様に「レビュー」であれば、「スペックを調べる、評価を見る」といったラベルが定義されており、「記事」であれば、「ニュースを見る、プロフィールを見る、地名を調べる」といったラベルが定義されており、「プレスリリース」であれば、「用語の意味を調べる、会社を調べる、価格を調べる」といったラベルが定義されている。なお、「ID」は、各コンテンツタイプ名を一意に識別するためのID番号である。
また、各ラベルには、その検索対象に応じた検索キーワード群が、「検索クエリ」として予め対応付けて定義されている。図19は、ラベルに対応付けられた「検索クエリ」の例を示した図である。
例えば、ラベル名が「価格を調べる」であれば、「価格、値段、実売価格、プライス、特価」といった語群が、“OR”で連結された検索クエリ(検索条件)として定義されている。同様に、ラベル名が「試合結果を見る」であれば、「得点、試合結果、勝利、点差」といった語群が、ラベル名が「ニュースを見る」であれば、「ニュース、記事」といった語が、ラベル名「プロフィールを見るであれば、「profile、プロフィール、自己紹介」といった語群が、ラベル名が「写真を見る」であれば、「画像、イメージ、jpg、jpeg」といた語群が、夫々“OR”で連結された検索クエリとして定義されている。
図17に戻り、検索方法候補選定部208は、検索方法モデル267を、入力文書推定結果、サイト種別推定結果及びコンテンツタイプ推定結果の各項目に適用することで、各項目に応じたラベルを夫々決定する(ステップS283)。そして、検索方法候補選定部208は、決定したラベルを検索方法候補としてRAM25等に保持し(ステップS284)、図4のステップS29へと移行する。
ここで、図20、図21を参照して、ステップS283の処理について説明する。入力文書推定結果(図12、A34参照)、サイト種別推定結果(図14、A44参照)及びコンテンツタイプ推定結果(図16、A54参照)に対し、図18で示した検索方法モデルを適用すると、検索方法候補選定部208は、各項目(テーマ、サイト種別、コンテンツタイプ)について、図20に示した検索方法モデル(ID200、ID020、ID003)が適合すると判断することになる。
上各検索方法モデルの判断は、例えば、以下の方法で決定することができる。まず、検索方法候補選定部208は、図21に示したように、テーマ、サイト種別、コンテンツタイプ毎に、その内容をノードとして表記し、これら異なる3つの項目から、各々一つのノードを選択する。その際選択されるのは、スコア及び関連度に、より大きな値が付与されたテーマ名、サイト種別名及びコンテンツタイプ名に対応するノードが選択されるものとする。この結果、検索方法候補選定部208は、テーマ名「スポーツ」、サイト種別名「ニュース」、コンテンツタイプ名「記事」の各ノードを選択する。
次に、検索方法候補選定部208は、これまでに選択した各ノードに対応する「ラベル」を枚挙することで、検索方法候補として「試合結果を見る、プロフィールを見る、ニュースを見る、写真を見る、地名を調べる…」を取得し、後段の検索方法候補検証部209に出力する。
図4に戻り、続くステップS29では、検索方法候補検証部209により、検索方法検証処理(ステップS29)が実行される。以下、図22を参照して、ステップS29の検索方法検証処理の動作について説明する。
図22は、検索方法候補検証部209により実行される検索方法検証処理の手順を示したフローチャートである。まず、検索方法候補検証部209は、検索方法候補に含まれた各ラベルを参照し、各ラベルに対応する「検索クエリ」を、記憶部26に記憶された検索方法モデル267から読み出す(ステップS291)。
次いで、検索方法候補検証部209は、読み出した「検索クエリ」毎に、当該「検索クエリ」を「キーワード」とともに検索エンジン30に送信することで、当該検索エンジン30に「検索クエリ」及び「キーワード」に関する文書の検索を依頼する(ステップS292)。ここで「キーワード」とは、閲覧リソースに含まれたキーワード、即ち情報通信端末10のユーザが指定したキーワードであるものとする。なお、「検索クエリ」と「キーワード」とは“AND”で連結する態様としてもよいし、“OR”で連結する態様としてもよい。
続いて検索方法候補検証部209は、各検索クエリについて、検索エンジン30から得られた検索件数の多い順に、各ラベルをソートし(ステップS293)、ソートしたラベルと、検索クエリとを対応付けて後段の検索方法候補メニュー生成部210に出力した後(ステップS294)、図4のステップS30に移行する。
図4に戻り、検索方法候補メニュー生成部210は、検索方法検証処理でソートされたラベル名を、情報通信端末10の表示部13で表示可能なメニューとして生成し(ステップS30)、このメニューを各ラベルに対応する「検索クエリ」とともに、情報通信端末10に送信した後(ステップS31)、検索支援サーバ20側の処理を終了する。
なお、生成される「メニュー」には、ソートされた全てのラベル名が表示される態様としてもよいし、例えば、ソートされたラベルのうち、上位に位置するラベル(例えば、上位4つのラベル名)のみが表示される態様としてもよい。
一方、情報通信端末10では、検索支援サーバ20から「メニュー」及び「検索クエリ」を受け取ると、検索方法提示選択部104は、この「メニュー」により表される画面(メニュー画面)を表示部13に表示させた後(ステップS15)、操作部12を介してユーザから特定のラベルが指示されるまで待機を行う(ステップS16;No)。
図23は、ステップS15で表示部13に表示されたメニュー画面の一例を示した図である。情報通信端末10のユーザは、このメニュー画面に提示された各項目(ラベル)から、特定のラベルを、操作部12を介して選択することが可能となっている。ユーザから操作部12を介して特定のラベル(例えば、「試合結果を見る」)が指定されると、当該ラベル名に応じた指示信号が検索方法提示選択部104に入力される。
ステップS16において、検索方法提示選択部104により、特定のラベルを指示する指示信号の入力が確認されると(ステップS16;Yes)、検索クエリ送信部105は、この指示されたラベルに対応する「検索クエリ」と、ステップS13で入力された「キーワード」とを、検索エンジン30に送信することで、当該検索エンジン30に「検索クエリ」及び「キーワード」に関する文書の検索を依頼する(ステップS17)。なお、「検索クエリ」と「キーワード」とは“AND”で連結して検索させる態様としてもよいし、“OR”で連結して検索させる態様としてもよい。
例えば、図23に示したメニュー画面に基づき、ラベル「試合結果を見る」が選択されたとすると、対応する「検索クエリ」は、「得点、試合結果、勝利、点差」(図19参照)を“OR”で連結した文字列であるため、検索クエリ送信部105は、この「検索クエリ」をユーザが指定した「キーワード」(例えば、「田中」)とともに検索エンジン30に送信することになる。
続いて検索結果表示部106は、検索エンジン30から送信された検索結果を受け取ると、この検索結果を表示部13に表示させ(ステップS18)、情報通信端末10での処理を終了する。
図24は、ステップS18で表示部13に表示された検索結果の一例を示した図である。情報通信端末10のユーザは、この検索結果に基づき、所望するWebサーバ40を、操作部12を介して選択することで、当該Webサーバ40のコンテンツを閲覧することができる。なお、ここで閲覧したコンテンツから再度キーワードを選択し、上述したブラウザ連動型検索処理を行うこととしてもよい。
以上のように、本実施形態によれば、文書及び当該文書に含まれた特定の語句(キーワード)から、当該文書のテーマ、当該文書を提供したWebサーバ40のサイト種別、当該文書のコンテンツタイプを推定し、これらテーマ、サイト種別及びコンテンツタイプに応じた検索条件を選定することで、ユーザは、関心のある文書中から特定の語句を指示するのみで、当該文書のテーマ、当該文書を提供したWebサーバ40のサイト種別、当該文書のコンテンツタイプに応じた検索条件を享受することができるため、検索の操作にかかる負荷を減少させるとともに、ユーザが所望する情報に容易に到達させることができる。
なお、本実施形態の検索支援サーバ20で実行されるプログラムは、ROM24等に予め組み込まれて提供するものとするが、これに限らず、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。また、このプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよく、インターネット等のネットワーク経由で提供または配布するように構成してもよい。
また、本実施形態では、文書のテーマ、サイト種別及びコンテンツタイプに基づいて、検索条件を選定することとしたが、これに限らず、文書のテーマ、サイト種別及びコンテンツタイプのうち、何れかの特性に基づいて、検索条件を選定することとしてもよい。
[第2の実施形態]
次に、検索支援装置、プログラム及び検索支援システムの第2の実施形態について説明する。なお、上述した第1の実施形態と同様の要素については、同一の符号を用いて示し、その説明は適宜省略する。
図25は、本実施形態の検索支援システム2の構成を示した概略図である。図25に示すように、検索支援システム2は、情報通信端末50と、検索支援サーバ60と、検索エンジン30、Webサーバ40とを有し、各機器はインターネット等のネットワークを介して相互に通信可能に接続されている。
図25に示すとおり、本実施形態の情報通信端末50は、第1の実施形態で説明した情報通信端末10の機能構成(図1参照)から、キーワード指定部102を取り除き、キーワードリスト提示選択部501を新たに加えた構成となっている。即ち、本実施形態では、コンテンツ中の特定のキーワードが検索支援サーバ60に送信されるのではなく、コンテンツの閲覧を実施中に、ブラウザ連動型検索処理を実行する旨の指示信号が入力されると、この現在閲覧中のコンテンツのURL又はコンテンツのHTML文書が、閲覧リソースとして検索支援サーバ60に送信されるようになっている。
ここで、図26−1〜図26−3を参照して、本実施形態の情報通信端末10から、閲覧リソースが送信されるまでの手順を説明する。図26−1に示すように、コンテンツが表示部13に表示された状態で、「ブラウザメニュー」から、図5−2に示すように、ブラウザ連動型検索処理の実行を指示する「連動検索」が選択され、この指示信号が入力されると、閲覧リソース送信部103は、図5−3で示したように、表示部13に表示されたコンテンツのURL又はコンテンツのHTML文書を、閲覧リソースとして検索支援サーバ60に送信する。
また、本実施形態の検索支援サーバ60は、第1の実施形態で説明した検索支援サーバ20の機能構成(図1参照)に、キーワード切り出し部601、キーワード候補選定部602を加えた構成となっている。
ここで、キーワード切り出し部601は、入力文書リソース取得部201から入力されたHTML文書を入力文書とし、この入力文書に形態素解析を適用し、当該入力文書を形態素毎に分割し、RAM25等に保持する。
また、本実施形態のキーワード候補選定部602は、キーワード切り出し部601により分割された形態素毎に、第1の実施形態と同様、各品詞(キーワード)の選択範囲を拡張する。そして、602は、キーワード候補として得られた各文字列を、検索エンジン30に夫々送信することで取得した検索結果のうち、検索結果が多く得られた上位のキーワードを選定し、選定したキーワードをキーワード候補として情報通信端末50に送信する。なお、選定するキーワードの個数は特に問わないものとする。
また、キーワード候補選定部602は、情報通信端末50のキーワードリスト提示選択部501からキーワードを受信すると、このキーワード及び入力文書に基づいて、キーワード候補選定処理(図6参照)を実行する。なお、移行の処理は、上述した第1の実施形態と同様であるため、説明は省略する。
一方、情報通信端末50では、検索支援サーバ60から送信されたキーワード候補が受信されると、キーワードリスト提示選択部501は、このキーワード候補を表示部13に表示させることでユーザに提示する。
図27−1は、キーワードリスト提示選択部501により表示部13に表示されたキーワード候補の一例を示した図である。情報通信端末10のユーザは、図27−2に示すように、表示部13に提示されたキーワード候補から、特定のキーワード名を、操作部12を介して選択することが可能となっている。そして、特定のキーワード名(例えば、「田中寿英」)が選択されると、当該キーワード名に応じた指示信号がキーワードリスト提示選択部501に入力される。
キーワードリスト提示選択部501は、特定のキーワード名を指示する指示信号の入力を確認すると、この指示信号で指示されたキーワード名に対応するキーワードを、検索支援サーバ60のキーワード候補選定部602に送信する。
以上のように、本実施形態によれば、ユーザは、閲覧中の文書から選出された複数のキーワード候補から、特定のキーワードを選択するのみで、当該文書のテーマ、当該文書を提供したWebサーバ40のサイト種別及び当該文書のコンテンツタイプに応じた検索条件を享受することができるため、検索の操作にかかる負荷を減少させるとともに、ユーザが所望する情報に容易に到達させることができる。
[第3の実施形態]
次に、検索支援装置、プログラム及び検索支援システムの第3の実施形態について説明する。なお、上述した第1の実施形態と同様の要素については、同一の符号を用いて示し、その説明は適宜省略する。
図28は、本実施形態の検索支援システム3の構成を示した概略図である。図28に示すように、検索支援システム3は、情報通信端末70と、検索支援サーバ80と、検索エンジン30、Webサーバ40とを有し、各機器はインターネット等のネットワークを介して相互に通信可能に接続されている。
図28に示すとおり、本実施形態の情報通信端末70は、第1の実施形態で説明した情報通信端末10の機能構成(図1参照)から、コンテンツ閲覧部101、キーワード指定部102及び閲覧リソース送信部103を取り除き、キーワード入力部701及びキーワード送信部702を新たに加えた構成となっている。
キーワード入力部701は、連携検索の対象となるキーワードを、操作部12を介して直接入力することが可能な入力支援手段を情報通信端末10のユーザに提供する。ここで、入力支援手段とは、例えば、図29に示したような、表示部13に表示されるインターフェース等であって、ユーザはこの入力支援手段を介して連携検索の対象とするキーワードを入力することが可能となっている。キーワード入力部701は、この入力支援画面に基づいて入力されたキーワードを、キーワード送信部702に出力する。
キーワード送信部702は、キーワード入力部701から入力されたキーワードを、検索支援サーバ80に送信する。
本実施形態の検索支援サーバ80は、第1の実施形態で説明した検索支援サーバ20の機能構成(図1参照)から、入力文書リソース取得部201を取り除き、予備検索実行部801を新たに加えた構成となっている。
予備検索実行部801は、情報通信端末70のキーワード送信部702から送信されたキーワードを、検索エンジン30に送信することで、当該キーワードに関する文書の検索を依頼する。そして、予備検索実行部801は、キーワードについて、検索エンジン30から検索結果として得られたコンテンツのHTML文書を、上位のWebサーバ(Webサイト)から所定数分取得し、この取得したHTML文書と、情報通信端末70から送信されたキーワードとを、キーワード候補選定部202に出力する。なお、移行の処理は、上述した第1の実施形態と同様であるため、説明は省略する。なお、取得するHTML文書の個数は、任意に設定可能であるものとする。
以上のように、本実施形態によれば、情報通信端末10のユーザは、連携検索対象としたキーワードを入力するのみで、このキーワードに関連する文書から、当該文書のテーマ、当該文書を提供したWebサーバ40のサイト種別及び当該文書のコンテンツタイプに応じた検索条件を享受することができるため、検索の操作にかかる負荷を減少させるとともに、ユーザが所望する情報に容易に到達させることができる。
第1の実施形態における検索支援システムの構成を示した概略図である。 端末のハードウェア構成を示した図である。 検索支援サーバのハードウェア構成を示した図である。 ブラウザ連動型検索処理の動作を示したラダーチャートである。 端末の表示部に表示された画面の一例を示した図である。 端末の表示部に表示された画面の一例を示した図である。 端末の表示部に表示された画面の一例を示した図である。 端末の表示部に表示された画面の一例を示した図である。 端末の表示部に表示された画面の一例を示した図である。 キーワード候補選定処理の流れを示したフローチャートである。 語句属性解析処理の流れを示したフローチャートである。 語句属性解析処理を説明するための図である。 キーワード意味推定処理の流れを示したフローチャートである。 キーワード意味推定処理を説明するための図である。 文書テーマ推定処理の流れを示したフローチャートである。 文書テーマ推定処理を説明するための図である。 サイト種別推定処理の流れを示したフローチャートである。 サイト種別推定処理を説明するための図である。 コンテンツタイプ推定処理の流れを示したフローチャートである。 コンテンツタイプ推定処理を説明するための図である。 検索方法候補選定処理の流れを示したフローチャートである。 検索方法モデルの一例を示した図である。 検索方法モデルの一例を示した図である。 検索方法モデルの一例を示した図である。 検索方法モデルの一例を示した図である。 コンテンツタイプ推定処理を説明するための図である。 コンテンツタイプ推定処理を説明するための図である。 検索方法検証処理の流れを示したフローチャートである。 端末の表示部に表示された画面の一例を示した図である。 端末の表示部に表示された画面の一例を示した図である。 第2の実施形態における検索支援システムの構成を示した概略図である。 端末の表示部に表示された画面の一例を示した図である。 端末の表示部に表示された画面の一例を示した図である。 端末の表示部に表示された画面の一例を示した図である。 端末の表示部に表示された画面の一例を示した図である。 端末の表示部に表示された画面の一例を示した図である。 第3の実施形態における検索支援システムの構成を示した概略図である。 端末の表示部に表示された画面の一例を示した図である。
符号の説明
1 検索支援システム
2 検索支援システム
3 検索支援システム
10 情報通信端末
11 CPU
12 操作部
13 表示部
14 ROM
15 RAM
16 通信部
101 コンテンツ閲覧部
102 キーワード指定部
103 閲覧リソース送信部
104 検索方法提示選択部
105 検索クエリ送信部
106 検索結果表示部
20 検索支援サーバ
21 CPU
22 操作部
23 表示部
24 ROM
25 RAM
26 記憶部
261 形態素解析辞書
262 キーワード意味推定ルール
263 語句属性データベース
264 文書テーマ推定ルール
265 サイト種別推定ルール
266 コンテンツタイプ推定ルール
267 検索方法モデル
27 通信部
201 入力文書リソース取得部
202 キーワード候補選定部
203 文書語句属性抽出部
204 キーワード意味推定部
205 入力文書テーマ推定部
206 サイト種別推定部
207 コンテンツタイプ推定部
208 検索方法候補選定部
209 検索方法候補検証部
210 検索方法候補メニュー生成部
30 検索エンジン
40 Webサーバ
50 情報通信端末
501 キーワードリスト提示選択部
60 検索支援サーバ
601 キーワード切り出し部
602 キーワード候補選定部
70 情報通信端末
701 キーワード入力部
702 キーワード送信部
80 検索支援サーバ
801 予備検索実行部

Claims (11)

  1. 文書及び当該文書中の特定の文字列が指示されたキーワードを取得する文書取得手段と、
    前記文書に含まれた形態素のうち、特定の属性を有した形態素を抽出し、当該文書中の形態素の出現状況に関する統計情報を生成する統計情報生成手段と、
    各形態素と、当該形態素の属性とを対応付けた語句属性テーブルを記憶する第1の記憶手段と、
    前記語句属性テーブルに基づいて、前記文書中に含まれた各形態素の属性を判別する属性判別手段と、
    前記キーワードに含まれた形態素毎に当該形態素の属性を対応付けたキーワード情報を生成するキーワード情報生成手段と、
    各分野を表すテーマと、当該テーマに関連する用語とを対応付けた文書テーマ推定テーブルを記憶する第2の記憶手段と、
    前記各分野を表すテーマと、当該テーマに関係する検索条件とを対応付けた検索条件テーブルを記憶する第3の記憶手段と、
    前記文書テーマ推定テーブルに基づいて、前記統計情報及びキーワード情報に含まれる形態素から、前記文書のテーマを推定する文書テーマ推定手段と、
    前記推定された文書のテーマに関係する検索条件を、前記検索条件テーブルから選定する検索条件選定手段と、
    を備えたことを特徴とする検索支援装置。
  2. 所定の文字列と、当該文字列が意味する事象とを対応付けた意味推定テーブルを記憶する第4の記憶手段と、
    前記意味推定テーブルに基づいて、前記文書中に含まれた文字列が意味する事象を判別する意味判別手段と、
    Webサイトのサイト種別と、当該サイト種別に関連する前記テーマ及び事象とを対応付けたサイト種別推定テーブルを記憶する第5の記憶手段と、
    前記Webサイトのサイト種別と、当該サイト種別に関係する検索条件とを対応付けた第2の検索条件テーブルを記憶する第6の記憶手段と、
    前記サイト種別推定テーブルに基づいて、前記文書のテーマ及び当該文書中の文字列が意味する事象から、当該文書を提供したWebサイトのサイト種別を推定するサイト種別推定手段と、
    を更に備え、
    前記検索条件選定手段は、前記推定されたサイト種別に関係する検索条件を、前記第2の検索条件テーブルから選定することを特徴とする請求項1に記載の検索支援装置。
  3. コンテンツの種別を示したコンテンツタイプと、当該コンテンツタイプに関連する前記テーマ及び事象とを対応付けたコンテンツタイプ推定テーブルを記憶する第7の記憶手段と、
    前記コンテンツタイプと、当該コンテンツタイプに関係する検索条件を対応付けた第3の検索方法テーブルを記憶する第8の記憶手段と、
    前記コンテンツタイプ推定テーブルに基づいて、前記文書のテーマ及び当該文書中の文字列が意味する事象から、当該文書のコンテンツタイプを推定するコンテンツタイプ推定手段と、
    を更に備え、
    前記検索条件選定手段は、前記推定されたコンテンツタイプに関係する検索条件を、前記第3の検索方法テーブルから選定することを特徴とする請求項2に記載の検索支援装置。
  4. 前記キーワードの前後に出現する前記文書中の形態素に基づいて、当該キーワードの文字列の範囲を形態素単位で拡張し、キーワード候補として取得するキーワード候補取得手段を更に備え、
    前記キーワード情報生成手段は、前記キーワード及びキーワード候補に含まれた形態素と、当該形態素の属性とを対応付け、前記キーワード情報として生成することを特徴とする請求項1に記載の検索支援装置。
  5. 前記キーワード候補毎に、当該キーワード候補に関する文書の検索を外部の検索エンジンに依頼する検索依頼手段と、
    前記検索エンジンの検索結果に基づき、前記キーワード候補から検索件数が所定値以上のキーワード候補を選定するキーワード候補選定手段と、
    を更に備え、
    前記キーワード情報生成手段は、前記選定されたキーワード候補に基づいて、前記キーワード情報を生成することを特徴とする請求項4に記載の検索支援装置。
  6. 前記検索条件選定手段により選定された検索条件を提示する提示手段を更に備えたことを特徴とする請求項1〜3の何れか一項に記載の検索支援装置。
  7. 前記選定された検索条件に該当する文書の検索を外部の検索エンジンに依頼する検索依頼手段を更に備え、
    前記提示手段は、前記検索エンジンの検索結果に基づき、検索件数に応じた順序で、前記選定された検索条件を提示することを特徴とする請求項6に記載の検索支援装置。
  8. 前記文書に含まれた各語句を形態素毎に切り出す語句切り出し手段と、
    前記形態素毎の語句のうち、特定の語句を指定可能な語句指定手段と、
    を更に備え、
    前記文書取得手段は、前記語句指定手段により指定された語句を前記キーワードとして取得することを特徴とする請求項1に記載の検索支援装置。
  9. 前記キーワードの入力を受け付ける入力手段と、
    前記入力手段で受け付けたキーワードに関する文書の検索を、外部の検索エンジンに依頼する検索依頼手段と、
    を更に備え、
    前記文書取得手段は、前記検索エンジンにより検索された文書を取得することを特徴とする請求項1に記載の検索支援装置。
  10. コンピュータに、
    文書及び当該文書中の特定の文字列が指示されたキーワードを取得する文書取得機能と、
    前記文書に含まれた形態素のうち、特定の属性を有した形態素を抽出し、当該文書中の形態素の出現状況に関する統計情報を生成する統計情報生成機能と、
    各形態素と、当該形態素の属性とを対応付けた語句属性テーブルに基づいて、前記文書中に含まれた各形態素の属性を判別する属性判別機能と、
    前記キーワードに含まれた形態素毎に当該形態素の属性を対応付けたキーワード情報を生成するキーワード情報生成機能と、
    各分野を表すテーマと、当該テーマに関連する用語とを対応付けた文書テーマ推定テーブルに基づいて、前記統計情報及びキーワード情報に含まれる形態素から、前記文書のテーマを推定する文書テーマ推定機能と、
    前記推定された文書のテーマに関係する検索条件を、前記各分野を表すテーマと、当該テーマに関係する検索条件とを対応付けた検索条件テーブルから選定する検索条件選定機能と、
    を実現させることを特徴とするプログラム。
  11. 情報通信端末と、検索支援装置とが通信可能に接続された検索支援システムであって、
    前記情報通信端末は、
    外部装置が提供する文書を取得するコンテンツ閲覧手段と、
    前記文書中の特定の文字列をキーワードとして指示可能なキーワード指定手段と、
    前記文書及びキーワードを前記検索支援装置に送信する閲覧リソース送信手段と、
    表示手段と、
    を備え、
    前記検索支援装置は、
    前記文書及びキーワードを取得する文書取得手段と、
    前記文書に含まれた形態素のうち、特定の属性を有した形態素を抽出し、当該文書中の形態素の出現状況に関する統計情報を生成する統計情報生成手段と、
    各形態素と、当該形態素の属性とを対応付けた語句属性テーブルを記憶する第1の記憶手段と、
    前記語句属性テーブルに基づいて、前記文書中に含まれた各形態素の属性を判別する属性判別手段と、
    前記キーワードに含まれた形態素毎に当該形態素の属性を対応付けたキーワード情報を生成するキーワード情報生成手段と、
    各分野を表すテーマと、当該テーマに関連する用語とを対応付けた文書テーマ推定テーブルを記憶する第2の記憶手段と、
    前記各分野を表すテーマと、当該テーマに関係する検索条件とを対応付けた検索条件テーブルを記憶する第3の記憶手段と、
    前記文書テーマ推定テーブルに基づいて、前記統計情報及びキーワード情報に含まれる形態素から、前記文書のテーマを推定する文書テーマ推定手段と、
    前記推定された文書のテーマに関係する検索条件を、前記検索条件テーブルから選定する検索条件選定手段と、
    を備えたことを特徴とする検索支援システム。
JP2007052843A 2007-03-02 2007-03-02 検索支援装置、プログラム及び検索支援システム Expired - Fee Related JP4810469B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007052843A JP4810469B2 (ja) 2007-03-02 2007-03-02 検索支援装置、プログラム及び検索支援システム
US12/038,573 US8001135B2 (en) 2007-03-02 2008-02-27 Search support apparatus, computer program product, and search support system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007052843A JP4810469B2 (ja) 2007-03-02 2007-03-02 検索支援装置、プログラム及び検索支援システム

Publications (2)

Publication Number Publication Date
JP2008217333A JP2008217333A (ja) 2008-09-18
JP4810469B2 true JP4810469B2 (ja) 2011-11-09

Family

ID=39733862

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007052843A Expired - Fee Related JP4810469B2 (ja) 2007-03-02 2007-03-02 検索支援装置、プログラム及び検索支援システム

Country Status (2)

Country Link
US (1) US8001135B2 (ja)
JP (1) JP4810469B2 (ja)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009075733A (ja) * 2007-09-19 2009-04-09 Toshiba Corp 候補表示装置及び方法
JP5310250B2 (ja) * 2009-05-14 2013-10-09 ソニー株式会社 情報処理装置および情報処理方法
WO2011036755A1 (ja) 2009-09-24 2011-03-31 株式会社 東芝 キーワード抽出装置、およびプログラム
WO2011090036A1 (ja) * 2010-01-19 2011-07-28 日本電気株式会社 動向情報検索装置、動向情報検索方法および記録媒体
JP5106608B2 (ja) 2010-09-29 2012-12-26 株式会社東芝 読み上げ支援装置、方法、およびプログラム
US8909851B2 (en) 2011-02-08 2014-12-09 SMART Storage Systems, Inc. Storage control system with change logging mechanism and method of operation thereof
US8935466B2 (en) 2011-03-28 2015-01-13 SMART Storage Systems, Inc. Data storage system with non-volatile memory and method of operation thereof
JP5248655B2 (ja) * 2011-05-18 2013-07-31 株式会社東芝 情報処理装置およびプログラム
US9098399B2 (en) 2011-08-31 2015-08-04 SMART Storage Systems, Inc. Electronic system with storage management mechanism and method of operation thereof
US9021319B2 (en) 2011-09-02 2015-04-28 SMART Storage Systems, Inc. Non-volatile memory management system with load leveling and method of operation thereof
US9021231B2 (en) 2011-09-02 2015-04-28 SMART Storage Systems, Inc. Storage control system with write amplification control mechanism and method of operation thereof
US9239781B2 (en) 2012-02-07 2016-01-19 SMART Storage Systems, Inc. Storage control system with erase block mechanism and method of operation thereof
US9298252B2 (en) 2012-04-17 2016-03-29 SMART Storage Systems, Inc. Storage control system with power down mechanism and method of operation thereof
US8949689B2 (en) 2012-06-11 2015-02-03 SMART Storage Systems, Inc. Storage control system with data management mechanism and method of operation thereof
US9671962B2 (en) 2012-11-30 2017-06-06 Sandisk Technologies Llc Storage control system with data management mechanism of parity and method of operation thereof
CN103853757B (zh) * 2012-12-03 2018-07-27 腾讯科技(北京)有限公司 网络的信息展示方法和系统、终端和信息展示处理装置
US9123445B2 (en) 2013-01-22 2015-09-01 SMART Storage Systems, Inc. Storage control system with data management mechanism and method of operation thereof
US9214965B2 (en) 2013-02-20 2015-12-15 Sandisk Enterprise Ip Llc Method and system for improving data integrity in non-volatile storage
US9329928B2 (en) 2013-02-20 2016-05-03 Sandisk Enterprise IP LLC. Bandwidth optimization in a non-volatile memory system
US9183137B2 (en) 2013-02-27 2015-11-10 SMART Storage Systems, Inc. Storage control system with data management mechanism and method of operation thereof
US9043780B2 (en) 2013-03-27 2015-05-26 SMART Storage Systems, Inc. Electronic system with system modification control mechanism and method of operation thereof
US10049037B2 (en) 2013-04-05 2018-08-14 Sandisk Enterprise Ip Llc Data management in a storage system
US9170941B2 (en) 2013-04-05 2015-10-27 Sandisk Enterprises IP LLC Data hardening in a storage system
US9543025B2 (en) 2013-04-11 2017-01-10 Sandisk Technologies Llc Storage control system with power-off time estimation mechanism and method of operation thereof
US10546648B2 (en) 2013-04-12 2020-01-28 Sandisk Technologies Llc Storage control system with data management mechanism and method of operation thereof
US9313874B2 (en) 2013-06-19 2016-04-12 SMART Storage Systems, Inc. Electronic system with heat extraction and method of manufacture thereof
US9898056B2 (en) 2013-06-19 2018-02-20 Sandisk Technologies Llc Electronic assembly with thermal channel and method of manufacture thereof
US9244519B1 (en) 2013-06-25 2016-01-26 Smart Storage Systems. Inc. Storage system with data transfer rate adjustment for power throttling
US9367353B1 (en) 2013-06-25 2016-06-14 Sandisk Technologies Inc. Storage control system with power throttling mechanism and method of operation thereof
US9448946B2 (en) 2013-08-07 2016-09-20 Sandisk Technologies Llc Data storage system with stale data mechanism and method of operation thereof
US9431113B2 (en) 2013-08-07 2016-08-30 Sandisk Technologies Llc Data storage system with dynamic erase block grouping mechanism and method of operation thereof
US9361222B2 (en) 2013-08-07 2016-06-07 SMART Storage Systems, Inc. Electronic system with storage drive life estimation mechanism and method of operation thereof
CN104216934B (zh) * 2013-09-29 2018-02-13 北大方正集团有限公司 一种知识抽取方法及系统
US20150222958A1 (en) * 2014-01-31 2015-08-06 Kabushiki Kaisha Toshiba Data display apparatus and data display method
JP6549441B2 (ja) * 2015-08-04 2019-07-24 Kddi株式会社 入力支援装置、プログラムおよび入力支援方法
JP6600229B2 (ja) * 2015-10-30 2019-10-30 株式会社インタラクティブソリューションズ スライド検索装置、スライド検索システム、スライド検索方法及びスライド検索プログラム
WO2018074895A1 (en) 2016-10-21 2018-04-26 Samsung Electronics Co., Ltd. Device and method for providing recommended words for character input
JP7117632B2 (ja) * 2017-04-25 2022-08-15 パナソニックIpマネジメント株式会社 単語拡張方法、単語拡張装置及びプログラム
JP7098579B2 (ja) * 2019-06-28 2022-07-11 富士フイルム株式会社 情報処理装置及び方法並びにプログラム
US12093292B2 (en) * 2020-09-16 2024-09-17 Resonac Corporation Document retrieval device

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10162011A (ja) * 1996-11-27 1998-06-19 Toshiba Corp 情報検索方法、情報検索システム、情報検索端末装置および情報検索装置
US6401061B1 (en) * 1999-05-13 2002-06-04 Yuri L. Zieman Combinatorial computational technique for transformation phrase text-phrase meaning
JP2001022788A (ja) * 1999-07-13 2001-01-26 Nec Corp 情報検索装置および情報検索プログラムを記録した記録媒体
JP2002222210A (ja) * 2001-01-25 2002-08-09 Hitachi Ltd 文書検索システム、文書検索方法及び検索サーバ
JP3759700B2 (ja) 2001-03-01 2006-03-29 日本電信電話株式会社 利用者嗜好反映型検索方法及びその実施装置並びにその処理プログラムと記録媒体
US6584470B2 (en) * 2001-03-01 2003-06-24 Intelliseek, Inc. Multi-layered semiotic mechanism for answering natural language questions using document retrieval combined with information extraction
JP4421134B2 (ja) * 2001-04-18 2010-02-24 富士通株式会社 文書画像検索装置
JP2003132060A (ja) 2001-10-23 2003-05-09 Just Syst Corp 検索支援装置、検索支援方法、及び検索支援プログラム
JP2003208434A (ja) 2001-11-07 2003-07-25 Nec Corp 情報検索システム及びそれに用いる情報検索方法
US20040162724A1 (en) * 2003-02-11 2004-08-19 Jeffrey Hill Management of conversations
US20050187913A1 (en) * 2003-05-06 2005-08-25 Yoram Nelken Web-based customer service interface
JP4081056B2 (ja) * 2004-08-30 2008-04-23 株式会社東芝 情報処理装置、情報処理方法及びプログラム
US20070130112A1 (en) * 2005-06-30 2007-06-07 Intelligentek Corp. Multimedia conceptual search system and associated search method
US20080005194A1 (en) * 2006-05-05 2008-01-03 Lockheed Martin Corporation System and method for immutably cataloging and storing electronic assets in a large scale computer system
JP2008083856A (ja) * 2006-09-26 2008-04-10 Toshiba Corp 情報処理装置、情報処理方法及び情報処理プログラム
JP4247284B2 (ja) * 2007-03-28 2009-04-02 株式会社東芝 情報検索装置、情報検索方法及び情報検索プログラム
JP4398992B2 (ja) * 2007-03-29 2010-01-13 株式会社東芝 情報検索装置、情報検索方法及び情報検索プログラム

Also Published As

Publication number Publication date
US8001135B2 (en) 2011-08-16
US20080215550A1 (en) 2008-09-04
JP2008217333A (ja) 2008-09-18

Similar Documents

Publication Publication Date Title
JP4810469B2 (ja) 検索支援装置、プログラム及び検索支援システム
JP5603337B2 (ja) バーティカル提案により検索要求を支援するためのシステム及び方法
US8275759B2 (en) Contextual query suggestion in result pages
JP4638439B2 (ja) ウェブ検索の個人化
CN101495955B (zh) 移动设备检索与导航
US7769771B2 (en) Searching a document using relevance feedback
KR101506380B1 (ko) 무한 브라우즈
AU2009337678B2 (en) Visualizing site structure and enabling site navigation for a search result or linked page
US7606794B2 (en) Active Abstracts
JP5444115B2 (ja) データ検索装置、データ検索方法及びプログラム
US8332208B2 (en) Information processing apparatus, information processing method, and program
US20100145934A1 (en) On-demand search result details
US20120036144A1 (en) Information and recommendation device, method, and program
TW201626266A (zh) 於搜尋結果頁內提供已標定應用程式之系統與方法
JP2008547119A (ja) サーチ結果を提供するためのシステムおよび方法
JP2003208434A (ja) 情報検索システム及びそれに用いる情報検索方法
RU2698405C2 (ru) Способ поиска в базе данных
JP2009009461A (ja) キーワードの入力支援システム、コンテンツ検索システム、コンテンツ登録システム、コンテンツ検索・登録システム、およびこれらの方法、並びにプログラム
US20210406268A1 (en) Search result annotations
JP5056133B2 (ja) 情報抽出システム、情報抽出方法および情報抽出用プログラム
JP2007193697A (ja) 情報収集装置,情報収集方法およびプログラム
TWI507902B (zh) A retrieval system, a retrieval condition setting device, a control method of a search condition setting device, a computer program product, and an information memory medium
JPWO2012023541A1 (ja) 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体
JP4477931B2 (ja) 検索リクエスト装置、検索リクエスト方法、検索リクエストプログラムおよび検索リクエストプログラムを記録したコンピュータ読み取り可能な記録媒体
KR101421819B1 (ko) 온라인 환경에서의 벌룬을 이용한 키워드 검색 결과 제공 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090326

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110721

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110726

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110822

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140826

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees