JP5640833B2

JP5640833B2 - 検索方法、検索プログラム及び検索装置

Info

Publication number: JP5640833B2
Application number: JP2011053336A
Authority: JP
Inventors: 貴興達野
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2011-03-10
Filing date: 2011-03-10
Publication date: 2014-12-17
Anticipated expiration: 2031-03-10
Also published as: JP2012190266A

Description

本発明は、情報検索を行い、検索結果を表示させる検索方法、検索プログラム及び検索装置に関する。

近年の情報処理技術の発展に伴い、利用者は情報処理装置を操作することによりデータベース等に格納された様々な情報を検索することができる。情報の検索を行う場合には、情報処理装置において検索文字列を入力してデータベースを検索し、その結果を情報処理装置の表示装置へ表示させる。

従来では、選択した情報のユーザ登録ＩＤからユーザの好む集合を作成し、検索結果を呈示する際にユーザの好む集合に属する情報のみを表示する技術が知られている。また利用者が入力した検索条件に類似する他の使用者の検索履歴を、利用者が所望する検索目的との適合性の判断が可能な形態で提供し、他の使用者の検索履歴を利用して再度検索すること等が提案されている。

特開２００５−３５３０８３号公報特開２００５−７８３３４号公報

しかしながら従来の検索技術は、利用者の好みや検索履歴等に基づき検索を行って検索結果を表示するものであり、利用者が読み易いと感じる文章構成の嗜好性については考慮されていない。このため、利用者の文章構成の嗜好性を考慮した検索結果の表示が行われていなかった。

本発明の一実施形態では、情報検索において利用者の文章構成の嗜好性を考慮した検索結果の表示を行う検索方法、検索プログラム及び検索装置を提供することである。

上記課題を解決するため、コンピュータが、情報検索を行い、検索結果を表示させる検索方法であって、該コンピュータが、利用者から文字列の入力を受付け、文章を含む検索対象情報を記憶する検索対象情報記憶部から、前記文字列に関する検索対象情報を表示候補情報として取得し、前記検索対象情報に対して前記利用者により付加された評価に基づいて生成された前記利用者の嗜好性の判定に用いる嗜好文体判定データが格納された嗜好情報記憶部から、前記嗜好文体判定データを抽出し、前記表示候補情報を分析して算出した文体傾向と、抽出した前記嗜好文体判定データとを比較し、前記比較の結果に基づき前記表示候補情報の少なくとも一部の表示順を決定する。

上記各手順を機能としてコンピュータに実行させるためのプログラム、そのプログラムを実行する装置、そのプログラムを記憶したコンピュータ読み取り可能な記憶媒体とすることもできる。

情報検索において利用者の文章構成の嗜好性を考慮した検索結果の表示を行うことができる。

検索システムの一例の構成図である。コンピュータの一例のハードウェア構成図である。検索装置の機能構成例を示すブロック図である。検索システムの処理の概略を説明する図である。情報登録部による有用情報の分析を説明するフローチャートである。分析項目テーブルの一例を示す図である。文体傾向データの第一の例を示す図である。文体傾向データの第二の例を示す図である。文体傾向データの第三の例を示す図である。全体傾向データの例を示す図である。情報登録部による利用者毎の嗜好傾向の分析を説明するフローチャートである。嗜好情報データベースを説明する第一の図である。嗜好情報データベースを説明する第二の図である。嗜好文体判定データの別の例を示す図である。検索処理部による検索及び表示制御を説明するフローチャートである。検索処理部による表示候補情報の文体傾向の算出を説明する図である。検索処理部による重み付けと表示順の決定を説明する図である。

本実施例の検索システムは、情報検索の際に、利用者の嗜好性を示すデータが格納された記憶部を参照し、検索対象情報から抽出された表示候補情報の文体傾向と利用者の嗜好性とを比較して表示順を決定することで利用者毎にとって読み易い情報を優先させた検索結果の表示を行う。

以下、本発明の実施形態を図面に基づいて説明する。図１は検索システムの一例の構成図である。図１の検索システム１００は、サーバ２００、クライアント３００Ａ〜３００Ｎが、インターネットやＬＡＮ（Local Area Network）等のネットワーク４０を介してデータ通信可能に接続されている。以下の説明では、クライアント３００Ａ〜３００Ｎの何れでもよい場合はクライアント３００と呼ぶ。また、図１はネットワーク４０を利用する例を示しているが、ネットワーク４０を利用せず、一台のコンピュータで実現してもよい。

サーバ２００は、クライアント３００において入力された検索文字列に基づき検索を行い、その結果をクライアント３００の表示装置に表示させる。クライアント３００は利用者により操作される。利用者はクライアント３００の表示装置に表示された入力画面に検索文字列を入力することで、サーバ２００の有するデータベース内の情報を検索できる。

サーバ２００では、例えば特定の機能を実行させる操作画面の操作を助けるヘルプ情報が格納されたデータベースを有しており、検索システム１００では、このヘルプ情報に係る検索が行われても良い。またデータベースに格納される情報は、ヘルプ情報以外の情報であっても良い。

検索プログラムがインストールされているサーバ２００は、コンピュータであり、検索装置の一例である。以下に検索プログラムがインストールされているコンピュータのハードウェア構成を説明する。

コンピュータは、検索装置と同様の機能を有する検索プログラムを実行する。図２はコンピュータの一例のハードウェア構成図である。コンピュータ２０は入力装置２１、表示装置２２、コンピュータ本体２３を有する。コンピュータ本体２３はバス２４で相互に接続されている主記憶装置３１、演算処理装置３２、インターフェース装置３３、記録媒体読取装置３４及び補助記憶装置３５を有する。また、バス２４には入力装置２１及び表示装置２２が接続されている。

バス２４で相互に接続されている入力装置２１、表示装置２２、主記憶装置３１、演算処理装置３２、インターフェース装置３３、記録媒体読取装置３４及び補助記憶装置３５は、演算処理装置３２による管理下で相互にデータの送受を行うことができる。演算処理装置３２は、コンピュータ２０全体の動作制御を司る中央処理装置である。

インターフェース装置３３は他のコンピュータからのデータを受信し、そのデータの内容を演算処理装置３２に渡す。さらに、インターフェース装置３３は演算処理装置３２からの指示に応じて他のコンピュータにデータを送信する。

補助記憶装置３５には、検索装置と同様の機能をコンピュータ２０に発揮させるプログラムの一部として、少なくとも検索装置における検索処理をコンピュータ２０に実行させる検索プログラムが記憶されている。

そして、コンピュータ２０は、演算処理装置３２が検索プログラムを補助記憶装置３５から読み出して実行することで、検索装置として機能する。検索プログラムは演算処理装置３２とアクセス可能な主記憶装置３１に格納されていても良い。入力装置２１は演算処理装置３２の管理下でデータの入力を受付ける。検索プログラムはコンピュータ２０が読み取り可能な記録媒体３６に記録しておくことができる。

コンピュータ２０で読み取り可能な記録媒体３６には、磁気記録媒体、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記録媒体には、ＨＤＤ、フレキシブルディスク（ＦＤ）、磁気テープ（ＭＴ）などがある。光ディスクには、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｃ）、ＤＶＤ−ＲＡＭ、ＣＤ−ＲＯＭ（ＣｏｍｐａｃｔＤｉｓｃ − ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＣＤ−Ｒ（Ｒｅｃｏｒｄａｂｌｅ）／ＲＷ（ＲｅＷｒｉｔａｂｌｅ）などがある。また、光磁気記録媒体には、ＭＯ（Ｍａｇｎｅｔｏ − Ｏｐｔｉｃａｌｄｉｓｋ）などがある。検索プログラムを流通させる場合には、例えば検索プログラムが記録されたＤＶＤ、ＣＤ−ＲＯＭ等の可搬型の記録媒体３６を販売することが考えられる。

そして、検索プログラムを実行するコンピュータ２０は、例えば記録媒体読取装置３４が検索プログラムを記録した記録媒体３６から、検索プログラムを読み出す。演算処理装置３２は、読み出された検索プログラムを主記憶装置３１若しくは補助記憶装置３５に格納する。

そして、コンピュータ２０は、自己の記憶装置である主記憶装置３１若しくは補助記憶装置３５から検索プログラムを読み取り、検索プログラムに従った処理を実行する。

尚本実施例のクライアント３００も、コンピュータであり、コンピュータ２０と同様のハードウェア構成を有する。

図３は、検索装置の機能構成例を示すブロック図である。

検索装置４００は、情報登録部４１０、検索処理部４２０、記憶領域５００を有する。演算処理装置３２が対応するプログラムを実行することによって、情報登録部４１０及び検索処理部４２０が実現される。記憶領域５００は、例えば主記憶装置３１又は／及び補助記憶装置３５の領域であり、登録情報データベース４３０、有用情報データベース４４０、分析項目テーブル４５０、文体傾向データベース４６０、嗜好情報データベース４７０が記憶されている。各データベース４３０〜４７０は、それぞれ対象となるデータを記憶する記憶部に相当する。また本実施例では、登録情報データベース４３０と、有用情報データベース４４０とで検索対象情報記憶部４４１を構成しても良い。

検索装置４００において、情報登録部４１０は、例えば登録情報データベース４３０
から有用な情報を抽出し、有用情報データベース４４０へ登録する。さらに情報登録部４１０は、有用情報データベース４４０に登録された有用情報を分析して分析結果のデータを該当するデータベースへ登録する。検索処理部４２０は、利用者によりクライアント３００を介して入力された検索文字列に基づき有用情報データベース４４０を検索する。そして検索処理部４２０は、検索結果を嗜好情報データベース４７０に格納された嗜好情報に従った順にクライアント３００の表示装置へ表示させる。

以下に検索装置４００の詳細について説明する。

本実施例の登録情報データベース４３０には、検索対象となる情報が格納されている。具体的には例えば、特定の機能を実行させる操作画面の操作を助けるヘルプ情報であっても良い。また本実施例の登録情報データベース４３０に登録された情報は、例えば複数の文章を含む文例集等である。

本実施例の有用情報データベース４４０は、登録情報データベース４３０に格納された情報から、後述する方法により抽出された有用情報が格納されている。

情報登録部４１０は、情報入力部４１１、有用情報抽出部４１２、文体傾向分析部４１３、全体分析部４１４、利用者毎情報管理部４１５、嗜好文体分析部４１６、苦手文体分析部４１７、嗜好判定部４１８、分析結果更新部４１９を有する。

情報入力部４１１は、利用者の操作するクライアント３００からの情報の登録、更新要求を受け付け、登録情報データベース４３０への情報の登録、更新を行う。情報入力部４１１により登録される情報は、クライアント３００による検索対象となる情報であっても良い。

有用情報抽出部４１２は、登録情報データベース４３０に登録された情報から、利用者にとって有用な情報を抽出し、有用情報データベース４４０へ登録する。以下に本実施例の有用情報抽出部４１２による有用な情報の抽出について説明する。

有用情報抽出部４１２は、登録情報データベース４３０に登録された情報毎の重要度及び鮮度を算出し、重要度と鮮度の高い順に登録情報データベース４３０から情報を抽出する。そして有用情報抽出部４１２は、抽出した情報を有用情報として有用情報データベース４４０へ格納する。本実施例の有用情報抽出部４１２は、情報に対して利用者から入力された評価値と、情報の参照回数と登録日又は更新日に基づき情報の重要度及び鮮度を算出しても良い。尚重要度及び鮮度の算出の方法は、上記の方法に限定されない。例えば重要度は、情報に含まれるキーワード等により算出されても良い。

また本実施例の有用情報抽出部４１２は、例えば登録情報データベース４３０から重要度と鮮度が高い順に所定個数の情報を抽出し、有用情報としても良い。また本実施例の有用情報は、登録情報データベース４３０から抽出された情報に、利用者から入力された評価値が付加された情報であることが好ましい。

文体傾向分析部４１３は、後述する分析項目テーブル４５０を参照し、有用情報データベース４３０に格納された有用情報の文体の傾向を分析する。そして文体傾向分析部４１３は、分析結果を分析対象の有用情報と対応付けた文体傾向データ４６１とし、文体傾向データベース４６０へ格納する。すなわち文体傾向データベース４６０には、有用情報毎の文体傾向データ４６１が格納されている。

全体分析部４１４は、全ての文体傾向データ４６１から平均のデータを算出し、全体傾向データ４６２として文体傾向データベース４６０へ格納する。文体傾向データ４６１及び全体傾向データ４６２の詳細は後述する。

利用者毎情報管理部４１６は、後述する高評価データ４８１、低評価データ４８２、嗜好文体データ４７１、嗜好文体傾向データ４７２、苦手文体データ４７３、苦手文体傾向データ４７４、嗜好文体判定データ４７５、重視項目４７６を含む利用者毎の嗜好情報を利用者毎嗜好データ４８０として嗜好情報データベース４７０に格納する。上記各データの詳細、重視項目４７６の詳細及び嗜好情報データベース４７０の詳細は後述する。

嗜好文体分析部４１６は、利用者により高い評価が付与された有用情報である高評価データ４８１の文体を分析し、分析結果を嗜好文体データ４７１、嗜好文体傾向データ４７２として嗜好情報データベース４７０へ蓄積する。苦手文体分析部４１７は、利用者により低い評価が付与された有用情報である低評価データ４８２の文体を分析し、分析結果を苦手文体データ４７３、苦手文体傾向データ４７４として嗜好情報データベース４７０へ蓄積する。

嗜好判定部４１８は、嗜好文体傾向データ４７２と苦手文体傾向データ４７４とに基づき利用者毎の文体の嗜好の傾向を判定し、判定結果から嗜好文体判定データ４７５と重視項目４７６とを算出する。嗜好文体判定データ４７５と重視項目４７６とは、嗜好情報データベース４７０へ格納される。

分析結果更新部４１９は、定期的に嗜好情報データベース４７０の更新処理を行う。

検索処理部４２０は、検索要求受付部４２１、表示候補情報取得部４２２、文体傾向算出部４２３、文体傾向比較部４２４、重み付け処理部４２５、表示順決定部４２６、表示制御部４２７を有する。

検索要求受付部４２１は、利用者がクライアント３００において検索文字列を入力し、検索処理の実行を指示すると、この指示と検索文字列を検索要求として受け付ける。表示候補情報取得部４２２は、検索文字列により有用情報データベース４４０を検索し、表示候補となる表示候補情報を取得する。尚本実施例の検索処理部４２０は、有用情報データベース４４０を検索した結果、該当する表示候補情報が見つからなかった場合に、登録情報データベース４３０を検出しても良い。

文体傾向算出部４２３は、表示候補情報取得部４２２により取得された表示候補情報の文体の傾向を後述する方法で取得する。文体傾向比較部４２４は、文体傾向算出部４２３により取得された表示候補情報の文体の傾向と、嗜好情報データベース４７０の嗜好文体判定データ４７５とを後述する方法により比較する。

重み付け処理部４２５は、文体傾向比較部４２４の比較結果にしたがって、表示候補情報に重み付けを行う。重み付けの詳細は後述する。表示順決定部４２６は、重み付け処理部４２５により付加された重みにしたがって、表示候補情報の表示順を決定する。表示制御部４２７は、表示順決定部４２６により決定された順にしたがって、表示候補情報をクライアント３００の表示装置等に表示させる。

以下に図４を参照して検索システム１００の処理の概略について説明する。図４は、検索システムの処理の概略を説明する図である。

図４（Ａ）は情報登録部４１０の処理の概略を説明する図であり、図４（Ｂ）は検索処理部４２０の処理の概略を説明する図である。

情報登録部４１０は、登録情報データベース４３０から利用者に参照された情報を抽出する。そして情報登録部４１０は、利用者により付加されたこの情報に対する評価値等から算出された重要度と鮮度等に基づき、参照された情報からさらに有用な情報を抽出し、有用情報として有用情報データベース４４０に格納する（ステップＳ４１）。

次に情報登録部４１０は、有用情報において利用者の評価が高い有用情報と、利用者の評価が低い有用情報とを嗜好情報データベース４７０へ利用者毎に蓄積し、蓄積された有用情報から利用者毎の嗜好傾向を分析する（ステップＳ４２）。そして情報登録部４１０は、分析結果を利用者毎の嗜好情報として嗜好情報データベース４７０へ格納する（ステップＳ４３）。

検索処理部４２０は、クライアント３００を介して検索要求を受けると、有用情報データベース４４０から検索結果の有用情報群を抽出する（ステップＳ４４）。次に検索処理部４２０は、利用者の嗜好情報を参照して、抽出した有用情報群から優先して表示させる利用者の嗜好にあった情報を取得する（ステップＳ４５）。そして検索処理部４２０は、利用者の嗜好にあった情報を、嗜好に合っている度合いが高い順に並べ替えてクライアント３００の表示装置に表示させる（ステップＳ４６）。

以下に、情報登録部４１０の処理の詳細を説明する。本実施例の情報登録部４１０は、利用者毎の嗜好傾向を分析するために、まず有用情報データベース４４０内の有用情報の文体の分析を行う。続いて情報登録部４１０は、有用情報の分析結果と、有用情報に付加された利用者の評価とに基づき、利用者毎の嗜好傾向を分析し、その結果を嗜好情報データベース４７０へ登録する。

図５は、情報登録部による有用情報の分析を説明するフローチャートである。

本実施例の情報登録部４１０において、文体傾向分析部４１３は、有用情報データベース４４０の有用情報が新たに登録された場合又は更新された場合、登録又は更新された有用情報の分析を行う。具体的には文体傾向分析部４１３は、分析項目テーブル４５０に設定された分析項目にしたがって有用情報を分析する（ステップＳ５１）。本実施例の分析項目とは、例えば有用情報である文例に含まれる漢字の比率、ひらがなの比率、カタカナの比率、専門用語の比率、注目語の比率等である。分析項目テーブル４５０の詳細は後述する。

また有用情報を分析する際の手法としては、例えば統計的文章解析を基にした文体分析、形態素解析を基にした文体分析、構文解析を基にした文体分析等が挙げられる。

続いて文体傾向分析部４１３は、分析対象の有用情報と分析結果とを紐付けて、文体傾向データ４６１として文体傾向データベース４６０へ格納する（ステップＳ５２）。文体傾向データ４６１の詳細は後述する。

続いて情報登録部４１０の全体分析部４１４は、新たに登録又は更新された有用情報に対応した文体傾向データを含む全ての文体傾向データ４６１を集める（ステップＳ５３）。続いて全体分析部４１４は、集めた文体傾向データ４６１から、分析項目毎の平均値を算出する（ステップＳ５４）。続いて全体分析部４１４は、分析項目毎の平均値を、全体傾向データ４６２として文体傾向データベース４６０へ格納する（ステップＳ５５）。

本実施例では、この全体傾向データ４６２が、利用者毎の嗜好傾向を分析するための基準値となる。全体傾向データ４６２の詳細は後述する。

以下に、本実施例の分析項目テーブル４５０、文体傾向データベース４６０について説明する。

図６は、分析項目テーブルの一例を示す図である。分析項目テーブル４５０は、有用情報データベース４４０に格納された有用情報を分析する際の項目と、各項目の定義とが対応付けられたテーブルである。本実施例では、分析項目として漢字比率、ひらがな比率、カタカナ比率、数字・記号比率、空白比率、英語比率、専門用語比率、句読点比率、改行比率、注目語の利用、一文の文字量、全体文書量、情報種別の有無が設定されている。

漢字比率は情報全体の文字数における漢字の割合であり、ひらがな比率は情報全体の文字数におけるひらがなの割合であり、カタカナ比率は情報全体の文字数におけるカタカナの割合である。数字・記号比率は情報全体の文字数における数字・記号の割合であり、空白比率は情報全体の文字数における空白の割合であり、英語比率は情報全体の文字数における英語の割合である。

専門用語比率は、情報内で予め設定された単位文字数当たりに専門用語が登場する割合である。尚専門用語は、専門分野毎の単語辞書内に登録された文字又は文字列である。句読点比率は、情報全体の文字数における句読点の割合である。改行比率は、情報全体の文字数における改行の割合である。

注目語の利用は、注目語に該当する文字数を示す。注目語とは、注目語を示す文字列が登録された単語辞書内に当てはまるものを言う。

一文文字量は、情報内で句読点までの平均文字数であり、全体文書量は情報全体の文字量である。情報種別の有無は情報内で扱う情報の種類である。情報の種類とは、例えば動画、静止画、リンク、操作ログ等である。

本実施例の文体傾向分析部４１３は、分析項目テーブル４５０に設定された項目について有用情報の分析を行い、分析結果を分析対象の有用情報と対応付けた文体傾向データ４６１として文体傾向データベース４６０へ格納する。

次に、図７乃至図１０を参照して、文体傾向データベース４６０について説明する。文体傾向データベース４６０には、有用情報毎の文体傾向データ４６１と、全体傾向データ４６２とが格納されている。

図７は、文体傾向データの第一の例を示す図である。図７に示す文体傾向データ４６１Ａは、有用情報データベース４４０に格納された有用情報のひとつである文例１に対応した文体傾向データであり、文体傾向データ４６１に含まれるデータである。

文体傾向データ４６１Ａは、文例１と、結果ファイル１と、情報テーブル１とが対応付けられたデータである。文体傾向データ４６１Ａでは、文例１が有用情報に該当し、結果ファイル１と情報テーブル１とが、文例１を分析項目テーブル４５０に設定された項目について分析した分析結果に該当する。

結果ファイル１には、文例１に含まれる文章毎の分析結果が含まれる。すなわち結果ファイル１には、文例１に含まれる文章７１の分析結果７２が含まれる。分析結果７２には、文章７１に含まれる英字の文字数、漢字の文字数、空白の数、数字・記号の数等が格納されている。また結果ファイル１には、文例１に含まれる文章７３の分析結果７４、文例１に含まれる文章７５の分析結果７６が含まれる。さらに結果ファイル１には、分析結果７２、７４、７６の項目毎に値を合計した合計値と、文例１に含まれる３つの文章の文字数の平均値とが含まれる分析結果７７が含まれる。

情報テーブル１には、結果ファイル１を用いて文例１の分析項目毎に算出された分析値が格納されている。また情報テーブル１には、文例１を識別するための情報ＩＤとして、対象種別ＩＤと連番とが含まれる。対象種別ＩＤとは、有用情報データベース４４０において文例１が含まれる有用情報の種別を識別するための識別子である。本実施例の種別には、例えば特定のアプリケーションのヘルプ情報を示す種別や、有用情報のジャンルを示す種別等があっても良い。連番は同一の識別子で登録された文例の連番である。情報テーブル１では、文例１が含まれる種別の識別子はＳＥ００１であり、識別子ＳＥ００１で識別される種別における文例１の連番が００１である。

図８は、文体傾向データの第二の例を示す図である。図８に示す文体傾向データ４６１Ｂは、有用情報データベース４４０に格納された有用情報である文例２に対応した文体傾向データであり、文体傾向データ４６１に含まれるデータである。文体傾向データ４６１Ｂには、文例２、結果ファイル２、情報テーブル２が含まれる。

文体傾向データ４６１Ｂでは、文例２が有用情報に該当し、結果ファイル２と、情報テーブル２とが、文例２を分析項目テーブル４５０に設定された項目について分析した分析結果に該当する。結果ファイル２には、文例２に含まれる文章８１の分析結果８２が含まれる。情報テーブル２には、結果ファイル２を用いて分析項目毎に算出された分析値が格納されている。

分析傾向データ４６１Ｂの情報テーブル２では、文例２が含まれる種別の識別子はＳＥ００１であり、識別子ＳＥ００１で識別される種別における文例２の連番が００２である。したがって文例１と文例２とは、同じ種別に含まれる情報であることがわかる。

図９は、文体傾向データの第三の例を示す図である。図９に示す文体傾向データ４６１Ｃは、有用情報データベース４４０に格納された有用情報である文例３に対応した文体傾向データであり、文体傾向データ４６１に含まれるデータである。文体傾向データ４６１Ｃには、文例３、結果ファイル３、情報テーブル３が含まれる。

文体傾向データ４６１Ｃでは、文例３が有用情報に該当し、結果ファイル３と、情報テーブル３とが、文例３を分析項目テーブル４５０に設定された項目について分析した分析結果に該当する。結果ファイル３には、文例３に含まれる文章９１の分析結果９２、文章９３の分析結果９４、分析結果９２、９４の項目毎に合計した合計値と、文例３に含まれる２つ文章の文字数の平均値とが含まれる分析結果９５が含まれる。情報テーブル３には、結果ファイル３を用いて分析項目毎に算出された分析値が格納されている。

分析傾向データ４６１Ｃの情報テーブル３では、文例３が含まれる種別の識別子はＳＥ００１であり、識別子ＳＥ００１で識別される種別における文例３の連番が００３である。したがって文例３は、文例１、文例２と同じ種別に含まれる情報であることがわかる。

図１０は、全体傾向データの例を示す図である。図１０に示す全体傾向データ４６２は、分析傾向データ４６１に含まれる全ての情報テーブルに格納された分析値の分析項目毎の平均値を示すデータである。

図１０の全体傾向データ４６２は、例えば文体傾向データ４６１に含まれる情報テーブル１〜Ｎの各分析値を分析項目毎に平均した値を有する。この全体傾向データ４６２に含まれる値が、後の利用者の嗜好傾向を判定する際に基準値となる。

図１１は、情報登録部による利用者毎の嗜好傾向の分析を説明するフローチャートである。

本実施例の情報登録部４１０は、有用情報に付与された利用者からの評価に基づき、利用者毎の好みの文体と苦手な文体とを蓄積する（ステップＳ１１１）。続いて情報登録部４１０は、利用者の好みの文体と苦手な文体とをそれぞれ分析する（ステップＳ１１２）。続いて情報登録部４１０は、ステップＳ１１２の分析結果から利用者の嗜好の傾向を分析する（ステップＳ１１３）。そして情報登録部４１０は、ステップＳ１１１からステップＳ１１３までの処理を定期的に更新する（ステップＳ１１４）。

以下に、ステップＳ１１１乃至ステップＳ１１３の処理の詳細を説明する。まず、ステップＳ１１１の詳細を説明する。

本実施例では、利用者に参照されたり利用された有用情報には、その都度利用者の好みを示す評価が付与される。利用者毎情報管理部４１５は、個々の有用情報に対する評価結果を利用者毎に記録する（ステップＳ１１１１）。

続いて利用者毎情報管理部４１５は、後述する嗜好判定の実施日から所定期間内の利用者の評価結果を元に、利用者毎に評価の高い文例集と評価の低い文例集とを管理する（ステップＳ１１１２）。本実施例の利用者毎情報管理部４１５は、評価の高い文例集を高評価データ４８１とし、評価の低い文例集を低評価データ４８２とし、嗜好情報データベース４７０に蓄積する。本実施例では、高評価データ４８１と低評価データ４８２は、利用者毎のデータである利用者毎嗜好データ４８０の一部として管理される。

次にステップＳ１１２の詳細を説明する。

情報登録部４１０において、嗜好文体分析部４１６は、高評価データ４８１の分析を行い、分析結果の平均値を算出する（ステップＳ１１２１）。嗜好文体分析部４１６は、この平均値である嗜好文体データ４７１を、利用者毎嗜好データ４８０に含めて嗜好情報データベース４７０に格納する。

次に嗜好文体分析部４１６は、算出した平均値（嗜好文体データ４７１）と、有用情報全体の平均値である全体傾向データ４６２との差分を算出する（ステップＳ１１２２）。続いて嗜好文体分析部４１６は、算出した差分を利用者の嗜好文体傾向を示す嗜好文体傾向データ４７２を嗜好情報データベース４７０へ格納する（ステップＳ１１２３）。

次に情報登録部４１０において、苦手文体分析部４１７は、低評価データ４８２の分析を行い、分析結果の平均値を算出する（ステップＳ１１２４）。苦手文体分析部４１７は、この平均値である苦手文体データ４７３を、利用者毎嗜好データ４８０に含めて嗜好情報データベース４７０に格納する。

次に苦手文体分析部４１７は、算出した平均値（苦手文体データ４７３）と、有用情報全体の平均値である全体傾向データ４６２との差分を算出する（ステップＳ１１２５）。続いて苦手文体分析部４１７は、算出した差分を利用者の苦手文体傾向を示す苦手文体傾向データ４７４を嗜好情報データベース４７０へ格納する（ステップＳ１１２６）。

次にステップＳ１１３の詳細を説明する。

情報登録部４１０において、嗜好判定部４１８は、算出した嗜好文体傾向データ４７２と苦手文体傾向データ４７４とを加算する（ステップＳ１１３１）。次に嗜好判定部４１８は、加算結果を嗜好文体判定データ４７５として、嗜好情報データベース４７０に格納する（ステップＳ１１３２）。

続いて嗜好判定部４１８は、嗜好文体判定データ４７５に含まれる項目のうち、絶対値が所定の閾値以上の項目を、嗜好傾向の重視項目４７６として嗜好情報データベース４７０に格納する（ステップＳ１１３３）。本実施例の重視項目４７６とは、利用者の嗜好の傾向に影響する主要な項目である。

本実施例の情報登録部４１０において、分析結果更新部４１９は、上記のステップＳ１１１１からステップＳ１１３３までの処理を定期的に行い、嗜好情報データベース４７０の利用者毎嗜好データ４８０を更新する。

以下に、図１２乃至１４を参照して嗜好情報データベース４７０について説明する。本実施例の嗜好情報データベース４７０に格納された利用者毎嗜好データ４８０には、高評価データ４８１、嗜好文体データ４７１、嗜好文体傾向データ４７２、低評価データ４８２、苦手分析データ４７３、苦手文体傾向データ４７４、嗜好文体判定データ４７５、重視項目４７６が含まれる。尚利用者毎嗜好データ４８０には、図示されていないが、利用者を特定するための識別情報等が含まれる。

図１２は、嗜好情報データベースを説明する第一の図である。図１２（Ａ）では、高評価データ４８１、嗜好文体データ４７１の例を示し、図１２（Ｂ）では低評価データ４８２、苦手文体データ４７２の例を示している。

本実施例の高評価データ４８１は、利用者に付加された評価値が高い有用情報に対応した情報テーブルと、利用者に付与された評価値４８３とが含まれる。本実施例では、評価値は５段階の数値で付与されるものとした。また高評価データ４８１は、評価値５が付与された有用情報の情報テーブルが含まれるものとした。

嗜好文体データ４７１は、高評価データ４８１に含まれる全ての情報テーブルの分析項目毎の平均値を求めたデータである。例えば図１２の嗜好文体データ４７１によれば、利用者はひらがな比率が５０．００％、英語比率が２．００％の有用情報に高評価を付与している。したがってこの利用者は、全体の文字数に対し、ひらがなが半数程度であり、英語が少ない文体を好む傾向があることがわかる。

本実施例の低評価データ４８２は、利用者に付加された評価値が低い有用情報に対応した情報テーブルと、利用者に付与された評価値４８３とが含まれる。低評価データ４８２は、評価値１が付与された有用情報の情報テーブルが含まれる。

苦手文体データ４７３は、低評価データ４８２に含まれる全ての情報テーブルの分析項目毎の平均値を求めたデータである。例えば図１２の苦手文体データ４７３によれば、利用者は漢字比率が６０．００％、専門用語比率が５６．００％の有用情報に低評価を付与している。したがってこの利用者は、全体の文字数に対し、漢字が半分以上であり、専門用語が半数程度を占める文体を苦手とする傾向があることがわかる。

尚本実施例では、評価値５の有用情報を高評価データ４８１とし、評価値１の有用情報を低評価データ４８２としたが、高評価データ４８１と低評価データ４８２の分類の仕方はこれに限定されない。例えば有用情報を高評価データ４８１と低評価データ４８２とに分類するための評価値の閾値を設け、この閾値と有用情報に付与された評価値とにより有用情報の分類を行っても良い。

図１３は、嗜好情報データベースを説明する第二の図である。図１３（Ａ）は、嗜好文体傾向データ４７２、苦手文体傾向データ４７４、嗜好文体判定データ４７５を示す図であり、図１３（Ｂ）は重視項目４７６を説明する図である。

嗜好文体傾向データ４７２は、分析項目毎に嗜好文体データ４７１の各分析項目の値から全体傾向データ４６２の各分析項目の値を減算したデータである。嗜好文体傾向データ４７２において、正の差分値は平均以上に好む傾向であること示し、負の差分値は平均程には嗜好傾向にないことを示している。尚本実施例では、嗜好文体傾向データ４７２に含まれる分析項目は、値が比率で示される項目のみとする。よって、例えば一文の文字量等のように値が比率以外の数値で示される項目は含まれていない。

苦手文体傾向データ４７４は、分析項目毎に全体傾向データ４６２の各分析項目の値から苦手文体データ４７３の各分析項目の値を減算したデータである。苦手文体傾向データ４７４において、正の差分値は平均程に苦手傾向ではないこと示し、負の差分値は平均以上に苦手傾向であることを示している。尚苦手文体傾向データ４７４に含まれる分析項目は、嗜好文体傾向データ４７２と同様である。

嗜好文体判定データ４７５は、嗜好文体傾向データ４７２の各分析項目の値と、苦手文体傾向データ４７４の各分析項目の値と合算したデータである。合算することにより、平均に対してどれだけ嗜好傾向にあるのか、又は苦手傾向にあるのかを客観的に表すことができる。

このように嗜好文体判定データ４７５を構成することで、より嗜好傾向又はより苦手傾向にあるかを判断することができる。

本実施例では、嗜好文体判定データ４７５に含まれる分析項目において、絶対値が、予め設定された所定値以上の項目を重視項目４７６とする。本実施例では、所定値を１０とする。

図１３（Ｂ）では、嗜好文体判定データ４７５の分析項目毎の値を棒グラフとしている。図１３（Ｂ）に示す嗜好文体判定データ４７５では、分析項目の絶対値が１０以上の項目は、漢字比率、ひらがな比率、カタカナ比率、英語比率、専門用語率である。よって、嗜好文体判定データ４７５に対応した利用者の嗜好の傾向は、有用情報に含まれる漢字比率、ひらがな比率、カタカナ比率等によって変化しやすいことがわかる。

本実施例では、以上のように全体傾向データ４６２を基準として、利用者個人の主観による嗜好文体傾向データ４７２と苦手文体傾向データ４７４とを比較することにより、客観的な傾向を知ることが可能となる。また上述したように合算することで、利用者毎の嗜好の傾向に影響する重視項目４７６を把握することができる。

図１４は、嗜好文体判定データの別の例を示す図である。図１４（Ａ）は、嗜好文体傾向データ４７２Ａ、苦手文体傾向データ４７４Ａから求められた嗜好文体判定データ４７５Ａを示している。

図１４（Ｂ）は、嗜好文体判定データ４７５Ａの分析項目毎の値を棒グラフとした図である。図１４（Ｂ）の例では、絶対値が１０以上の分析項目は、専門用語比率のみである。よって嗜好文体判定データ４７５Ａに対応した利用者の嗜好の傾向は、有用情報に含まれる専門用語比率に影響されることがわかる。

次に、本実施例の検索処理部４２０の処理について説明する。本実施例の検索処理部４２０は、利用者の嗜好文体判定データ４７５を参照して、検索文字列にしたがって抽出した有用情報を利用者の嗜好にあった順にクライアント３００の表示装置へ表示させる。図１５は、検索処理部による検索及び表示制御を説明するフローチャートである。

本実施例の検索処理部４２０において、検索要求受付部４２１は、利用者によりクライアント３００から検索文字列が入力されると、検索要求として受け付ける（ステップＳ１５１）。尚検索要求には、検索要求を行った利用者を識別できるように利用者ＩＤ等が含まれるものとした。続いて検索処理部４２０は、表示候補情報取得部４２２により、検索文字列で有用情報データベース４３０を検索し、表示候補情報を取得する（ステップＳ１５２）。

続いて検索処理部４２０は、表示候補情報毎の文体傾向データ４６１から算出した表示候補情報毎の分析結果と、検索要求を行った利用者と対応した嗜好文体判定データ４７５と、を比較する。そして検索処理部４２０は、比較の結果に基づき表示候補情報に重み付けを行う（ステップＳ１５３）。本実施例の検索処理部４２０は、ステップＳ１５３の処理をステップＳ１５２で取得した全ての表示候補情報に対して行う。続いて検索処理部４２０は、重み付けの結果にしたがって表示候補情報の表示順を決定し、クライアント３００の表示装置に表示候補情報を表示させる（ステップＳ１５４）。

以下に、ステップＳ１５３とステップＳ１５４の詳細を説明する。

検索処理部４２０において、文体傾向算出部４２２は、各表示候補情報の文体傾向を算出する。具体的には文体傾向算出部４２２は、表示候補情報として取得された有用情報に対応する文体傾向データ４６１を文体傾向データベース４６０から取得する。文体傾向算出部４２２は、全体傾向データ４６２の分析項目毎の値から、取得した文体傾向データ４６１の分析項目毎の値を減算した値を表示候補情報の文体傾向とし、記憶領域５００へ記録する（ステップＳ１５３１）。

続いて文体傾向比較部４２４は、算出した文体傾向と、嗜好文体判定データ４７５とを比較し、比較結果に基づき重み付け処理部４２５により後述する手法により重み付けを行う（ステップＳ１５３２）。

続いて検索処理部４２０は、表示順決定部４２６により、表示候補情報を偏り判定かが大きい順にソートする（ステップＳ１５４１）。続いて検索処理部４２０は、表示制御部４２７により、表示順決定部４２６により決定された順にしたがって、表示候補情報をクライアント３００の表示装置等に表示させる（ステップＳ１５４２）。

図１６は、検索処理部による表示候補情報の文体傾向の算出を説明する図である。図１６では、表示候補情報１６１の文体傾向の算出を示している。図１６（Ａ）は表示候補情報１６１と対応した文体傾向データ１６０を示す図であり、図１６（Ｂ）は、表示候補情報１６１の文体傾向を示す図である。

文体傾向データ１６０には、表示候補情報１６１と、結果ファイル１６２と、情報テーブル１６３とが含まれる。表示候補情報１６１は、検索結果として抽出された有用情報である。結果ファイル１６２、情報テーブル１６２は、表示候補情報１６１を分析した結果である。

本実施例の文体傾向算出部４２３は、全体傾向データ４６２の各分析項目の値から情報テーブル１６２に含まれる各分析項目の値を減算し、文体傾向１６４を算出する。

図１７は、検索処理部による重み付けと表示順の決定を説明する図である。図１７（Ａ）は重み付けを説明する図であり、図１７（Ｂ）は偏り判定を説明する図である。図１７（Ｃ）は表示順を説明する図であり、図１７（Ｄ）は表示例を示す図である。

図１７（Ａ）において、重み付け処理部４２５は、表示候補情報１６１の文体傾向１６４と、嗜好文体判定データ４７５とを比較し、比較結果を偏り判定値１６５として算出する。本実施例の偏り判定値１６５は、文体傾向１６４が嗜好文体判定データ４７５と合致している度合いを示す値である。本実施例の重み付け処理部４２５は、例えば、ｔ検定により２つの母集団がいずれも正規分布に従うと仮定した上での、平均が等しいかどうかの検定を行うようにして、偏り判定値１６５を求めても良い。

図１７（Ｂ）に示すように、重み付け処理部４２５は、表示候補情報毎に偏り判定値１６５を求める。尚本実施例において表示候補情報は、表示候補情報毎の文体傾向データ４６１に含まれる対象種別ＩＤと連番に基づき管理される。図１７（Ｂ）では、表示候補情報１６１以外に、表示候補情報１７１〜１７９について偏り判定値１６５が算出された例を示している。表示候補情報１７１〜１７９は、表示候補情報１６１が抽出された検索処理により、表示候補情報１６１と一緒に抽出された情報であっても良い。

抽出された表示候補情報毎に偏り判定値１６５が算出されると、図１７（Ｃ）に示すように、表示順決定部４２６により表示候補情報の表示順が決定される。本実施例では、偏り判定値１６５の値が大きいほど利用者の嗜好に合致しているものとした。したがって表示順決定部４２６は、偏り判定αの値が大きい順に表示候補情報の表示順を決定する。

表示順が決定されると、表示制御部４２７は、表示順が上位の表示候補情報が画面上一上にくるように、クライアント３００の表示装置へ画面を表示させる。図１７（Ｄ）の画面７０は、表示候補情報の一覧が表示された例である。画面７０では、偏り判定αの値が大きい順に、表示候補情報が画面７０の上から表示されている。また表示制御部４２７は、画面７１のように、表示候補情報を個別に表示させても良い。

また本実施例では、画面７０のように、表示候補情報と共に、各表示候補情報の偏り判定値１６５の値を表示させても良い。偏り判定値１６５を表示させることで、利用者は表示候補情報と利用者の嗜好との合致の度合いを知ることができ、適切な情報選択により表示させることができる。また、好みの文体の情報を表示させるための繰り返し操作を軽減させることができ、利便性を向上させることができる。

また本実施例の表示制御部４２７は、表示候補情報と共に、表示候補情報の種別を表示させても良い。この場合表示候補情報の種別は、表示候補情報に対応した対象種別ＩＤに基づき表示される。種別を表示させることで、利用者の好む情報の種別と苦手な情報の種別とを利用者に把握させることができる。例えば対象種別ＩＤが有用情報のジャンルを示す場合は、対象種別ＩＤに基づき、利用者が好むジャンルと苦手なジャンルとを把握することができる。したがって本実施例は、音楽、動画、ニュース等の種々の情報検索に適用することが可能である。

以上に説明したように、本実施例の検索装置４００では、検索対象となる有用情報データベース４４０に格納された有用について、有用情報毎に文体の傾向を分析する。また本実施例の検索装置４００は、検索システム１００の利用者毎に利用者の好みの文体と苦手な文体とを分析し、利用者の嗜好を判定する。そして検索装置４００は、利用者が有用情報データベース４４０の検索を行ったとき、検索結果として抽出された有用情報の文体の傾向と利用者の嗜好とに基づき、利用者の嗜好にあった有用情報をクライアント３００に表示させる。本実施例では、これにより、クライアント３００へ利用者にとっての読みやすさを考慮した表示を行うことができる。

本発明の実施形態は、以下に記載する付記のような構成が考えられる。
（付記１）
コンピュータが、情報検索を行い、検索結果を表示させる検索方法であって、該コンピュータが、
利用者から文字列の入力を受付け、
文章を含む検索対象情報を記憶する検索対象情報記憶部から、前記文字列に関する検索対象情報を表示候補情報として取得し、
前記検索対象情報に対して前記利用者により付加された評価に基づいて生成された前記利用者の嗜好性の判定に用いる嗜好文体判定データが格納された嗜好情報記憶部から、前記嗜好文体判定データを抽出し、
前記表示候補情報を分析して算出した文体傾向と、抽出した前記嗜好文体判定データとを比較し、
前記比較の結果に基づき前記表示候補情報の少なくとも一部の表示順を決定する検索方法。
（付記２）
複数の前記表示候補情報各々について、前記文体傾向と前記嗜好文体判定データとの比較結果に基づいた重み付けを行う付記１記載の検索方法。
（付記３）
前記検索対象情報の文体傾向を分析した結果である全体傾向データと、前記表示候補情報を所定の分析項目にしたがって分析した結果の文体傾向データとが格納された文体傾向記憶部を参照して前記表示候補情報の文体傾向を算出する付記１又は２記載の検索方法。
（付記４）
前記文体傾向データは、
文体の分析に係る分析項目と、前記分析項目の定義とが対応付けられて記憶領域に格納された分析項目テーブルを参照して前記検索対象情報毎に文体を分析し、
前記分析の結果と、分析対象の前記検索対象情報とを対応させたデータである付記３記載の検索方法。
（付記５）
前記全体傾向データは、
前記検索対象情報毎の前記文体傾向データの前記分析項目毎の平均値である付記４記載の検索方法。
（付記６）
前記検索対象情報に付与された前記利用者の評価の値が、前記利用者が前記文体を好むことを示す値であるとき、前記検索対象情報を高評価データに分類し、
前記利用者の評価の値が、前記利用者が前記文体を苦手とすることを示す値であるとき、前記検索対象情報を低評価データに分類し、
前記高評価データを、前記利用者を識別する情報と対応付けて前記嗜好情報記憶部へ記憶し、
前記低評価データを、前記利用者を識別する情報と対応付けて前記嗜好情報記憶部へ記憶し、
前記高評価データを前記分析項目テーブルに基づき分析し、
前記高評価データを分析した結果の前記分析項目毎の平均値を嗜好文体データとして、前記利用者を識別する情報と対応付けて前記嗜好情報記憶部へ記憶し、
前記低評価データを前記分析項目テーブルに基づき分析し、
前記低評価データを分析した結果の前記分析項目毎の平均値を苦手文体データとして、前記利用者を識別する情報と対応付けて前記嗜好情報記憶部へ記憶する付記４又は５記載の検索方法。
（付記７）
前記嗜好文体データの前記分析項目毎の値と、前記全体傾向データの前記分析項目毎の値とに基づき嗜好文体傾向データを算出し、
前記苦手文体データの前記分析項目毎の値と、前記全体傾向データの前記分析項目毎の値とに基づき苦手文体傾向データを算出し、
前記嗜好文体傾向データと前記苦手文体傾向データとに基づき前記嗜好文体判定データを算出し、
前記嗜好文体傾向データと、前記苦手文体傾向データと、前記嗜好文体判定データとを前記利用者毎嗜好データの一部として前記嗜好情報記憶部へ格納する付記６記載の検索方法。
（付記８）
前記検索対象情報は、前記利用者を含む複数の利用者による参照の回数、前記複数の利用者による参照の頻度を含む情報により有用と判断された有用情報である付記１乃至７の何れか一項に記載の検索方法。
（付記９）
利用者から文字列の入力を受付け、
文章を含む検索対象情報を記憶する検索対象情報記憶部から、前記文字列に関する検索対象情報を表示候補情報として取得し、
前記検索対象情報に対して前記利用者により付加された評価に基づいて生成された前記利用者の嗜好性の判定に用いる嗜好文体判定データが格納された嗜好情報記憶部から、前記嗜好文体判定データを抽出し、
前記表示候補情報を分析して算出した文体傾向と、抽出した前記嗜好文体判定データとを比較し、
前記比較の結果に基づき前記表示候補情報の少なくとも一部の表示順を決定する処理をコンピュータに実行させる検索プログラム。
（付記１０）
情報検索を行い、検索結果を表示させる検索装置であって、
文章を含む検索対象情報を記憶する検索対象情報記憶部から、前記文字列に関する検索対象情報を表示候補情報として取得する表示候補情報取得部と、
前記検索対象情報に対して前記利用者により付加された評価に基づいて生成された前記利用者の嗜好性の判定に用いる嗜好文体判定データが格納された嗜好情報記憶部と、
前記嗜好情報記憶部から前記嗜好文体判定データを抽出し、前記表示候補情報を分析して算出した文体傾向と、抽出した前記嗜好文体判定データとを比較する文体傾向比較部と、
前記比較の結果に基づき前記表示候補情報の少なくとも一部の表示順を決定する表示順決定部と、を有する検索装置。
（付記１１）
情報検索を行い、検索結果を表示させる検索装置と、前記検出装置と接続されたクライアントとを有する検索システムであって、
前記検索装置は、
文章を含む検索対象情報を記憶する検索対象情報記憶部から、前記文字列に関する検索対象情報を表示候補情報として取得する表示候補情報取得部と、
前記検索対象情報に対して前記利用者により付加された評価に基づいて生成された前記利用者の嗜好性の判定に用いる嗜好文体判定データが格納された嗜好情報記憶部と、
前記嗜好情報記憶部から前記嗜好文体判定データを抽出し、前記表示候補情報を分析して算出した文体傾向と、抽出した前記嗜好文体判定データとを比較する文体傾向比較部と、
前記比較の結果に基づき前記表示候補情報の少なくとも一部の表示順を決定する表示順決定部と、を有し、
前記クライアントは、
前記表示順にしたがって前記表示候補情報を表示させる表示部と、を有する検索システム。

本発明の実施形態は、具体的に開示された実施例に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。

１００検索システム
３００クライアント
４００検索装置
４１０情報登録部
４２０検索処理部
４３０登録情報データベース
４４０有用情報データベース
４４１検索対象情報データベース
４５０分析項目テーブル
４６０文体傾向データベース
４７０嗜好情報データベース
５００記憶領域

Claims

コンピュータが、情報検索を行い、検索結果を表示させる検索方法であって、該コンピュータが、
利用者から文字列の入力を受付け、
文章を含む検索対象情報を記憶する検索対象情報記憶部から、前記文字列に関する検索対象情報を表示候補情報として取得し、
前記検索対象情報に対して前記利用者により付加された評価に基づいて生成された前記利用者の嗜好性の判定に用いる嗜好文体判定データが格納された嗜好情報記憶部から、前記嗜好文体判定データを抽出し、
前記表示候補情報を分析して算出した文体傾向と、抽出した前記嗜好文体判定データとを比較し、
前記比較の結果に基づき前記表示候補情報の少なくとも一部の表示順を決定する検索方法。
複数の前記表示候補情報各々について、前記文体傾向と前記嗜好文体判定データとの比較結果に基づいた重み付けを行う請求項１記載の検索方法。
前記検索対象情報の文体傾向を分析した結果である全体傾向データと、前記表示候補情報を所定の分析項目にしたがって分析した結果の文体傾向データとが格納された文体傾向データベースを参照して前記表示候補情報の文体傾向を算出する請求項１又は２記載の検索方法。
利用者から文字列の入力を受付け、
文章を含む検索対象情報を記憶する検索対象情報記憶部から、前記文字列に関する検索対象情報を表示候補情報として取得し、
前記検索対象情報に対して前記利用者により付加された評価に基づいて生成された前記利用者の嗜好性の判定に用いる嗜好文体判定データが格納された嗜好情報記憶部から、前記嗜好文体判定データを抽出し、
前記表示候補情報を分析して算出した文体傾向と、抽出した前記嗜好文体判定データとを比較し、
前記比較の結果に基づき前記表示候補情報の少なくとも一部の表示順を決定する処理をコンピュータに実行させる検索プログラム。
情報検索を行い、検索結果を表示させる検索装置であって、
利用者から文字列の入力を受付ける検索要求受付部と、
文章を含む検索対象情報を記憶する検索対象情報記憶部から、前記文字列に関する検索対象情報を表示候補情報として取得する表示候補情報取得部と、
前記検索対象情報に対して前記利用者により付加された評価に基づいて生成された前記利用者の嗜好性の判定に用いる嗜好文体判定データが格納された嗜好情報記憶部と、
前記嗜好情報記憶部から前記嗜好文体判定データを抽出し、前記表示候補情報を分析して算出した文体傾向と、抽出した前記嗜好文体判定データとを比較する文体傾向比較部と、
前記比較の結果に基づき前記表示候補情報の少なくとも一部の表示順を決定する表示順決定部と、を有する検索装置。