JP2002032401A - 文書検索方法及び文書検索装置及び文書検索方法をコンピュータに実現させるためのプログラムを記録したコンピュータで読取可能な記録媒体 - Google Patents

文書検索方法及び文書検索装置及び文書検索方法をコンピュータに実現させるためのプログラムを記録したコンピュータで読取可能な記録媒体

Info

Publication number
JP2002032401A
JP2002032401A JP2000217005A JP2000217005A JP2002032401A JP 2002032401 A JP2002032401 A JP 2002032401A JP 2000217005 A JP2000217005 A JP 2000217005A JP 2000217005 A JP2000217005 A JP 2000217005A JP 2002032401 A JP2002032401 A JP 2002032401A
Authority
JP
Japan
Prior art keywords
document
information
search
user
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000217005A
Other languages
English (en)
Inventor
Takao Shinto
隆夫 新堂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2000217005A priority Critical patent/JP2002032401A/ja
Publication of JP2002032401A publication Critical patent/JP2002032401A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 ユーザの検索意図に適合する文書検索装置及
び方法を提供する。 【解決手段】 ユーザが入力した検索条件に基づいて文
書データベース104の中から目的とする文書を検索
し、個々のユーザの検索意図に対する適合度を検索結果
の一覧表を作成して、ユーザに提示する文書検索装置及
び方法において、文書を文書蓄積部107に登録する際
に、文書自体に含まれるキーワードによる索引に加え
て、どのようなプロファイル情報を持つユーザに該文書
が適合するかを示す適合度情報を予め作成して適合度情
報格納部109へ格納しておき、ユーザが検索毎に入力
した検索条件に加えて、ユーザが検索毎に入力する必要
のない個々のユーザのプロファイル情報と前記適合度情
報に基づいて、検索結果の各文書のスコア計算及びラン
キング(スコアの大小順序)を行い、個々のユーザに応
じて各文書の検索結果の一覧表内での提示順序を変更す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、ユーザが入力し
た検索条件に基づいて文書データベースの中から検索条
件に適合する文書を容易に検索する文書検索方法及び文
書検索装置及び文書検索方法を実現するためのプログラ
ムを記録する記録媒体に関する。
【0002】
【従来の技術】従来の文書検索方法では、文書検索は次
のように行なわれる。まず、ユーザが単一のキーワード
または複数のキーワードの組合わせからなる検索条件を
検索端末から入力する。入力された検索条件は、インタ
ーネットやローカルエリアネットワークなどのネットワ
ークを介して文書検索装置へ送信される。
【0003】文書検索装置には、検索対象である文書群
を格納した文書データベースと、検索条件を使って文書
データベースの検索を行なう検索手段が備えられてい
る。文書検索装置は、検索端末から受信した検索条件を
使って、検索条件に適合する文書の検索を行なう。検索
結果は、一覧表の形で、検索端末に、ネットワークを介
して返される。
【0004】ここで、検索手段が検索を効率よく行なう
ために、文書データベースに格納された文書群に含まれ
るキーワードを用いた索引が前もって作成される。文書
データベースは、文書群そのものを蓄積する文書蓄積部
と、索引格納部からなっており、索引格納部には、前記
索引が格納される。索引には、文書群に含まれるテキス
トデータの中から抽出したキーワードと、それを含む文
書の格納場所を示すポインタが含まれている。
【0005】文書検索装置は、索引を用いた検索の結果
として複数の文書が検索された場合、各文書がユーザの
検索意図にどれくらい適合しているかを、その検索に対
する各文書のスコアという数値として計算し、スコアの
大小順に各文書の順位、すなわちランキングを決定し
て、検索結果の一覧表の中でランキングの順に並べる。
検索端末には、検索結果の文書がランキングの順序に並
べられて、ユーザに提示される。
【0006】スコアの計算には、各種の方法が行われて
いるが、例えば、検索条件で指定されたキーワードが数
多く含まれている文書のスコアを高くする方法がある。
また、前記方法に加えて、そのキーワードが文書群全体
の中でどれくらい多くの文書に含まれているかを調べ、
数少ない文書に含まれているキーワードの重みを大きく
するという補正を行なう方法がある。
【0007】いずれにしても、従来の方法では、キーワ
ードの文書群の中での頻度分布と、ユーザが入力した検
索条件に含まれるキーワードとの関係のみを用い、ユー
ザ固有の情報を反映せずに、各文書のスコアを計算して
いた。
【0008】また、スコア計算に、個々のユーザの嗜好
情報や興味情報を含める方法も知られている。例えば、
予めユーザが興味のあるキーワード及びその重み付けを
文書検索装置に登録しておき、検索された文書にそれら
のキーワードが含まれている場合にその文書のスコアを
高くする方法がある。
【0009】また、予めユーザの嗜好情報を明示的に登
録するか、または、ユーザの操作履歴などから自動的に
嗜好情報を推定し、さらにその情報からキーワードを導
出しておき、検索された文書にそれらのキーワードが含
まれている場合にその文書のスコアを高くする方法があ
る。
【0010】
【発明が解決しようとする課題】従来の文書検索方法で
は、上記のような方法で文書検索を行なっていたため、
ユーザ固有の情報を反映せずに各文書のスコア計算及び
ランキングを行なう方法では、個々のユーザの検索意図
に十分に適合した検索結果一覧表が提示されるとは限ら
ないという問題があった。
【0011】また、個々のユーザの嗜好情報、興味情報
をスコア計算及びランキングに反映しようとする方法の
場合も、ユーザの嗜好情報、興味情報は、結局、検索対
象の文書群の中に含まれているキーワードに変換される
必要があるが、文書中のキーワードは必ずしもユーザの
嗜好情報、興味情報と強い相関があるとは限らず、個々
のユーザの検索意図に十分に適合した検索結果一覧表が
提示されるとは限らないという問題があった。
【0012】また、文書の提供者の立場においては、自
分が提供した文書が、必ずしも提供者が意図した対象の
ユーザによって検索され、閲覧されるとは限らないとい
う問題があった。
【0013】本発明は、以上のような問題点を解決する
ためになされたもので、ユーザ固有のプロファイル情報
を反映したスコア計算及びランキングを行い、ユーザの
検索意図に十分に適合した検索結果一覧表を提示するこ
とを目的とする。
【0014】また、文書提供者の意図に十分適合したユ
ーザに提供文書が検索、閲覧されることができる文書検
索装置と、それに用いられる文書検索方法と、該方法を
実施するためのプログラムを保持する記憶媒体とを提供
することを目的とする。
【0015】
【課題を解決するための手段】この発明に係る文書検索
方法は、入力を受け付けた検索条件に基づいて文書デー
タベースの中から適合する文書を検索し、検索した文書
の一覧表を提示する文書検索方法において、上記文書デ
ータベース内に、文書を蓄積する記憶領域である文書蓄
積部と、ユーザのプロファイル情報が上記文書に適合す
る度合いを示す適合度情報を格納する記憶領域である適
合度情報格納部とを形成する記憶領域形成工程と、文書
を上記文書蓄積部へ蓄積する文書蓄積工程と、上記文書
蓄積工程で蓄積する文書に対応する適合度情報の入力を
受け付け、受け付けた適合度情報を上記文書蓄積部に蓄
積する文書に対応させて上記適合度情報格納部へ格納す
る適合度情報格納工程と、検策条件と上記検策条件を入
力したユーザのプロファイル情報とを入力し、入力した
検策条件に基づいて、上記文書蓄積部から文書を検索
し、上記適合度情報格納部から適合度情報を読み込み、
入力したプロファイル情報と読み込んだ適合度情報とに
基づいて、検索した文書の適合度を数値で示すスコアを
計算し、上記スコアに基づいて文書を一覧表に提示する
順序を決定する検策実行工程とを備えたことを特徴とす
る。
【0016】上記プロファイル情報は、複数のデータ値
を採る複数種類の特性情報を含み、上記適合度情報格納
工程は、適合度情報として、適合度の度合いを数値で指
定し、プロファイル情報に含まれる複数種類の特性情報
それぞれが採り得る複数のデータ値それぞれに対応する
数値を指定する入力を受け付け、受け付けた複数種類の
特定情報それぞれが採り得る複数のデータ値それぞれに
対応する数値を適合度情報として格納することを特徴と
する。
【0017】上記検索実行工程は、上記プロファイル情
報に含まれる複数の特性情報それぞれについて、特性情
報が採るデータ値に対応する適合度情報として示される
数値を取得し、取得した複数の特性情報それぞれに対応
する数値を用いてスコアを計算することを特徴とする。
【0018】上記文書検策方法は、検索条件と、予め検
索に先立ってユーザが入力したプロファイル情報とを通
信網を介して受信し、上記検索実行工程は、受信した検
索条件とプロファイル情報とを入力することを特徴とす
る。
【0019】上記プロファイル情報は、ユーザの性別、
年齢、生年月日、住所、ユーザが関係の深い地域、業
種、職種、家族構成、年収、趣味、特に関心の深い分野
の内の少なくとも一つを含むことを特徴とする。
【0020】上記検索実行工程は、さらに、上記検索条
件と上記プロファイル情報とを受信した時に取得する通
信情報から、ユーザが上記検索条件と上記プロファイル
情報とを入力した検索端末に関する情報を収集すること
を特徴とする。
【0021】上記検索端末に関する情報は、検索端末も
しくは検索端末が接続しているプロキシサーバのインタ
ーネットプロトコルアドレスと、検索端末もしくは検索
端末が接続しているプロキシサーバの属するインターネ
ットドメイン名とのいずれか一つを含み、さらに、上記
インターネットプロトコルアドレスから特定されるユー
ザの属する国名と、上記インターネットドメイン名から
特定されるユーザの属する国名及びユーザの属する組織
の種類とのいずれか一方を含むこと特徴とする。
【0022】上記検索実行工程は、上記検索条件と上記
プロファイル情報に加え、検索条件を入力したユーザが
過去に上記文書蓄積工程で蓄積された文書を検索した履
歴情報を入力し、入力した履歴情報が所定の条件を示す
場合は、上記検索した文書のスコアを高くすることを特
徴とする。
【0023】上記履歴情報は、上記文書蓄積工程で蓄積
された文書を予め複数のカテゴリに分類し、過去一定期
間内に閲覧した文書が属するカテゴリと、上記カテゴリ
を閲覧した閲覧回数と、閲覧した日時時刻及び閲覧した
曜日及び時間帯とのいずれか一つとを含み、上記検索実
行工程は、ユーザが所定の期間内に、所定の回数上記文
書が属するカテゴリを閲覧した場合は、上記文書のスコ
アを高くすることを特徴とする。
【0024】この発明に係る文書検索装置は、入力を受
け付けた検索条件に基づいて文書データベースの中から
適合する文書を検索し、検索した文書の一覧表を提示す
る文書検索装置において、上記文書データベースは、文
書を予め蓄積する文書蓄積部と、ユーザに関する情報を
収集したプロファイル情報が上記文書蓄積部に蓄積され
る文書に適合する度合いを示す適合度情報の入力を受け
付け、受け付けた適合度情報を上記文書蓄積部に蓄積さ
れる文書に対応させて格納する適合度情報格納部とを有
し、上記文書検索装置は、検策条件と上記検策条件を入
力したユーザに関するプロファイル情報とを入力し、入
力した検策条件に基づいて、上記文書蓄積部から文書を
検索し、上記適合度情報格納部から適合度情報を読み込
み、入力したプロファイル情報と読み込んだ適合度情報
とに基づいて、検索した文書の適合度を数値で示すスコ
アを計算し、上記スコアに基づいて文書を一覧表に提示
する順序を決定する検策実行部とを備えたことを特徴と
する。
【0025】上記プロファイル情報は、複数のデータ値
を採る複数の特性情報を含み、上記適合度情報格納部
は、適合度情報として、適合度の度合いを数値で指定
し、プロファイル情報に含まれる複数種類の特性情報そ
れぞれが採り得る複数のデータ値それぞれに対応する数
値を指定する入力を受け付け、受け付けた複数種類の特
定情報それぞれが採り得るの複数のデータ値それぞれに
対応する数値を適合度情報として格納することを特徴と
する。
【0026】上記検索実行部は、上記プロファイル情報
に含まれる複数の特性情報それぞれについて、特性情報
が採るデータ値に対応する適合度情報として示される数
値を取得し、取得した複数の特性情報それぞれに対応す
る数値を用いてスコアを計算することを特徴とする。
【0027】上記文書検策装置は、さらに、通信網と接
続し、検索条件と、予め検索に先立ってユーザが入力し
たプロファイル情報とを通信網を介して受信する特徴と
する。
【0028】上記文書検索装置は、上記通信網を介して
検索端末と接続し、プロファイル情報をユーザに入力さ
せるプロファイル情報入力画面を上記検索端末へ送信
し、送信したプロファイル情報入力画面を用いてユーザ
にプロファイル情報の入力を促し、入力されたプロファ
イル情報を上記検索端末へ保存させることを特徴とす
る。
【0029】上記検索実行部は、上記検索条件と上記プ
ロファイル情報とを受信した時に取得する通信情報か
ら、ユーザが上記検索条件と上記プロファイル情報とを
入力した検索端末に関する情報を収集することを特徴と
する。
【0030】この発明に係る文書検索方法をコンピュー
タに実現させるためのプログラムを記録したコンピュー
タで読取可能な記録媒体は、入力を受け付けた検索条件
に基づいて文書データベースの中から適合する文書を検
索し、検索した文書の一覧表を提示する文書検索方法を
コンピュータに実現させるためのプログラムを記録した
コンピュータで読取可能な記録媒体において、上記文書
データベース内に、文書を蓄積する記憶領域である文書
蓄積部と、ユーザに関する情報を収集したプロファイル
情報が上記文書に適合する度合いを示す適合度情報を格
納する記憶領域である適合度情報格納部とを形成する記
憶領域形成工程と、文書を上記文書蓄積部へ蓄積する文
書蓄積工程と、上記文書蓄積工程で蓄積する文書に対応
する適合度情報の入力を受け付け、受け付けた適合度情
報を上記文書蓄積部に蓄積する文書に対応させて上記適
合度情報格納部へ格納する適合度情報格納工程と、検策
条件と上記検策条件を入力したユーザに関するプロファ
イル情報とを入力し、入力した検策条件に基づいて、上
記文書蓄積部から文書を検索し、上記適合度情報格納部
から適合度情報を読み込み、入力したプロファイル情報
と読み込んだ適合度情報とに基づいて、検索した文書の
適合度を数値で示すスコアを計算し、上記スコアに基づ
いて文書を一覧表に提示する順序を決定する検策実行工
程とを備えたことを特徴とする。
【0031】上記文書検策方法は、上記文書データベー
スを有し、文書を検索する文書検索装置と、ユーザが検
索条件を入力する検索端末とを用いて実行し、上記検索
端末において、予め検索に先立ってユーザが入力したプ
ロファイル情報を保存し、検索条件の入力を受け付け、
受け付けた検索条件と上記検索条件を入力したユーザに
対応するプロファイル情報とを上記文書検索装置へ送信
し、上記文書検索装置において、送信された検索条件と
プロファイル情報とを受信し、上記検索実行工程によ
り、上記検索条件とプロファイル情報とを入力すること
を特徴とする。
【0032】
【発明の実施の形態】実施の形態1.以下、本発明の一
実施の形態の文書検索装置を、図面を用いて説明する。
まず、システム構成について説明する。図1は、本発明
の文書検索装置を含む全体システムの構成を示す図であ
る。文書検索装置101は、インターネットやローカル
エリアネットワークなどのネットワーク103を介し
て、検索端末102と接続されている。
【0033】文書検索装置101は、文書データベース
104と、検索端末から受信した検索条件に基づいて文
書データベースの検索を行なう検索実行部105と、ネ
ットワークを介して検索端末と通信を行なう通信部10
6から構成されている。
【0034】文書データベース104は、検索対象の文
書群そのものを格納する文書蓄積部107と、検索対象
の文書から抽出したキーワードとそれを含む文書の格納
場所を示すポインタとを含む索引を格納する索引格納部
108と、どのようなプロファイル情報を持つユーザに
各文書が適合するかを示す適合度情報を格納する適合度
情報格納部109とから構成される。図2は、文書蓄積
部107のデータ構成の一例を示した図である。文書蓄
積部107は、複数の文書が貯えられているだけであ
り、一般的なファイルシステムであってもよい。
【0035】図3は、索引格納部108のデータ構成の
一例を示した図である。索引格納部108は、キーワー
ドと文書名とキーワードの位置を関連づけて格納する。
索引格納部108は、各文書から抽出されたキーワード
が、どの文書のどこにあるかの情報を格納する。同一の
キーワードが1つの文書内に複数存在することもある。
また、複数の文書が同一のキーワードを含むこともあ
る。
【0036】図4は、適合度情報格納部109のデータ
構成の一例を示した図である。適合度情報格納部109
は、各文書毎に適合度情報を格納する。省略された適合
度は、1.0(平均値)とみなされる。例えば、<趣味
>は省略されているので、どんな趣味に対しても1.0
であり、また、<住所>の中で北海道や大阪は省略され
ているので、1.0ということを意味する。
【0037】次に、ユーザのプロファイル情報について
説明する。ユーザのプロファイル情報の種類としては、
(1)ユーザが予め検索に先立って明示的に入力してお
くものと、(2)予めユーザが明示的に入力することな
く取得するものとの2種類がある。
【0038】まず、ユーザが予め検索に先立って明示的
に入力しておくプロファイル情報は、文書検索装置10
1から検索端末102へ送信したプロファイル情報入力
画面により、個々のユーザが自分のプロファイル情報を
入力する。図5に、プロファイル情報入力画面の一例を
示している。ユーザがこのプロファイル情報入力画面を
用いてプロファイル情報を入力することにより、検索時
に用いる適合度情報に対応したプロファイル情報を取得
することができる。
【0039】入力されたユーザプロファイル情報は、い
ったん文書検索装置101に送信されるが、再びそのユ
ーザの検索端末102に送り返され、検索端末102の
内部に格納される。後で、ユーザがその検索端末102
から検索を行なったとき、ユーザがプロファイル情報が
検索条件とともに、自動的に文書検索装置101に送信
される。
【0040】検索端末102と文書検索装置101の間
の通信がHTTP(Hyper Text Trans
fer Protocol)によっている場合、これ
は、クッキー(Cookie)と呼ばれる仕組みを用い
ることで実現できる。「cookie(クッキー)」と
いうのは、ユーザがプロファイル情報を登録すると、そ
の情報は一旦文書検索装置101(=Webサーバ)へ
送信される。文書検索装置101(=Webサーバ)
は、ユーザから受け取ったプロファイル情報をcook
ieの形にして、次の画面(例えば、プロファイル登録
完了通知画面)といっしょにユーザの検索端末102に
送信する。すると、検索端末(の上で動作しているWe
bブラウザ)は、cookieを検索端末102のディ
スク装置に格納する。格納されたcookieは、次に
同じ文書検索装置101(=Webサーバ)にHTTP
リクエストを送信するとき、常にいっしょに送信され
る。
【0041】この実施の形態では、このような技術を用
いて実現するが、これに限られるわけではない。また、
図1には明記していないが、検索端末102は、プロフ
ァイル情報を格納する記憶領域であるプロファイル情報
格納部を備える。
【0042】ユーザが予め検索に先立って明示的に入力
しておくユーザのプロファイル情報としては、次のもの
がある。ユーザの性別、年齢、生年月日、住所、ユーザ
が関係の深い地域、業種、職種、家族構成、年収、趣
味、関心の深い分野。
【0043】ユーザの性別は、男性、女性のいずれかで
ある。ユーザの生年月日が入力されている場合は、それ
から年齢を計算することが可能であるため、ユーザが年
齢を入力する必要は必ずしもない。ユーザがプライバシ
ー保護上の理由などにより、生年月日の入力を拒否した
場合、年齢の入力だけならば行なってもらえる可能性が
あるため、独立した項目としている。
【0044】住所は、都道府県名、市町村名、大字名、
丁目、街区番号、方書からなる。ユーザが関係の深い地
域は、都道府県名、市町村名からなり、ユーザの出身
地、かつて居住したところなど、地縁のある地域であ
る。
【0045】業種は、勤務先または自営の場合はその企
業の業種を複数の選択肢の中から選択して入力する。職
種は、例えば、営業、経理、技術、研究開発などといっ
たもので、複数の選択肢の中から選択して入力する。家
族構成は、同居家族の人数、各家族の性別、年齢からな
る。
【0046】趣味は、ユーザの趣味を複数の選択肢から
選択して入力し、複数の趣味を入力することができる。
関心の深い分野は、ユーザが業務上または個人的に関心
を持っている分野を複数の選択肢から選択して入力し、
複数の分野を入力することができる。プロファイル情報
のいずれの項目でも、ユーザはプライバシー保護上の理
由などにより、その項目の全部または一部の入力を行な
わないことができる。
【0047】次に、予めユーザが明示的に入力すること
なく取得するプロファイル情報には、ユーザの検索端末
102もしくはユーザの検索端末102が接続している
プロキシサーバのIPアドレス、ユーザの検索端末10
2もしくはユーザの検索端末102が接続しているプロ
キシサーバの属するインターネットドメイン名がある。
これらの情報は、検索端末102に関する情報である。
【0048】これらの情報は、もし取得が可能な場合に
は、曖昧さなく確定的な情報を取得することができる。
これらのプロファイル情報は、ユーザの検索端末102
から文書検索装置101へTCP/IPプロトコルによ
って接続を行なう度に取得することができるので、検索
端末102の内部に格納しておく必要はない。
【0049】ユーザの検索端末102もしくはユーザの
検索端末102が接続しているプロキシサーバのIPア
ドレスからは、検索端末102が存在している国名を推
定することができる。ユーザの住所、地縁情報が入力さ
れていない場合、これを住所、地縁情報の代わりに用い
る。ユーザの検索端末102もしくはユーザの検索端末
102が接続しているプロキシサーバの属するインター
ネットドメイン名からは、検索端末102が所属してい
る組織の特性が推定できる。例えば、日本国内(JPド
メイン)では、co.jpは企業、ac.jpは大学を
示す。ユーザの業種が入力されていない場合、これを業
種情報の代わりに用いる。
【0050】上記で説明したユーザが明示的に入力する
ことなく取得するプロファイル情報は、文書検索装置に
おいて、プロファイル情報を受信したときに収集され
る。
【0051】予めユーザが明示的に入力することなく取
得するプロファイル情報として、ユーザが過去に文書を
閲覧した履歴情報も用いる。まず、文書検索装置101
内の検索対象文書を、複数のカテゴリに分類しておく。
そして、ユーザが閲覧した文書の属するカテゴリ毎に、
過去一定期間内(例えば、1ヶ月間または1年間)にそ
のユーザが閲覧した回数を閲覧回数として、時間帯
(朝、午前中、昼、午後、夕方、夜、深夜)、曜日毎に
記録しておく。
【0052】履歴情報は、文書検索装置101でカウン
トされ、カウントした履歴情報は、文書検索装置101
から検索端末102へ送信される。閲覧回数などの履歴
情報の記録は、ユーザが明示的に入力するプロファイル
情報の場合と同様に、検索端末102の内部に格納して
おく。
【0053】図6に文書検索装置101で利用するプロ
ファイル情報のデータの構成の一例を示している。検索
端末102には、図6に一例として示すプロファイル情
報のうち、<端末/プロキシーIPアドレス>と<イン
ターネットドメイン名>とを除いた各データが記憶され
ていることになる。<端末/プロキシーIPアドレス>
と<インターネットドメイン名>とは、文書検索装置1
01において、検索端末102から検索条件とプロファ
イル情報とを受信したときに、収集されるデータであ
る。
【0054】また、上記で説明した履歴情報は、検索端
末102に記憶されるプロファイル情報に追加されても
よいし、プロファイル情報とは別にして記憶されていて
もよい。履歴情報は、検索端末102から文書検索装置
101へ検索条件とプロファイル情報とを送信するとき
に一緒に送信されればよい。
【0055】次に、適合度情報について説明する。文書
提供者は、自分の文書が文書検索装置101に登録され
る際に、その文書が、どのようなプロファイル情報を持
つユーザにどれくらい適したものであるかについての情
報を、適合度情報として、文書検索装置101の適合度
情報格納部109に登録する。
【0056】適合度情報は、複数種類の特性情報から構
成される。特性情報は、性別、年齢、生年月日、住所等
である。これらの登録方法については、下記に説明す
る。また、上記特性情報は、複数のデータ値を採りう
る。たとえば、性別の場合は、男・女という具合であ
る。従って、複数の特定情報それぞれは、複数のデータ
値を採り得るものである。また、適合度情報の複数の特
性情報は、ユーザが明示的に入力するプロファイル情報
と対応付けられる。しかしながら、必ずしも、一対一で
対応する場合でなくともよい。
【0057】なお、文書がHTML(Hyper Te
xt Markup Language)により記述さ
れてインターネット上のWWWサーバに公開されてお
り、文書検索装置101への登録がWWWロボットによ
って自動的に行われる場合、この処理は、文書中のHT
MLタグの1つである<META>タグ内に、ある定め
られた方法により適合度情報を記述することによって、
自動的に行なうことができる。
【0058】適合度情報の登録方法について、まず、性
別の場合を例に説明する。性別が男性、女性のユーザに
対する、その文書の適合度を、本実施の形態では、0.
0から2.0の範囲の数値で指定する。平均の適合度
は、1.0と考える。適合度が1.0よりも大きけれ
ば、平均よりも適合度が高いことを示し、適合度が1.
0よりも小さければ、平均よりも適合度が低いことを示
す。例えば、主として女性向けの文書の場合、男性に対
する適合度を0.2、女性に対する適合度を2.0と指
定する。性別が不明のユーザに対しては、適合度は1.
0と見なされる。
【0059】次に、年齢に対する適合度の登録方法につ
いて説明する。年齢層を、6歳以下、7歳〜12歳(小
学生)、13歳〜15歳(中学生)、16歳〜18歳
(高校生)、19歳〜22歳(大学生)、23歳〜29
歳、30歳〜39歳、...70歳〜79歳、80歳以
上と12個に分割し、各年齢層に対する文書の適合度
を、それぞれ0〜2.0の範囲の数値で指定する。例え
ば、主として大学生向けの文書であれば、19歳〜22
歳に対する適合度を2.0とし、16歳〜18歳及び2
3歳〜29歳に対する適合度を1.8として、残りの年
齢層に対する適合度を1.0とする。
【0060】次に、生年月日について説明する。生年月
日から分かる情報として年齢については、前記、年齢層
に対する適合度として説明した。生年月日からは、この
他に、誕生月や星占いの星座が分かる。誕生月毎、ある
いは星座毎の適合度を、前記年齢層の場合と同様に指定
する。また、年収、業種、職種、趣味、関心の深い分野
に対する適合度についても、前記年齢層の場合と同様に
指定することができる。
【0061】次に、住所の場合について説明する。住所
に対する適合度は、都道府県単位及び市町村単位につい
て設定することができる。いずれも、前記年齢層に対す
る指定と同様に行なうことができる。ユーザが関係の深
い地域についても、前記住所の場合と同様に適合度を指
定できる。
【0062】次に、家族構成について説明する。例え
ば、同居家族の構成を、1人(独居)、2人(夫婦)、
2人(親子)、2人(その他)、3〜4人、5人〜6
人、7人以上と分類することにより、前記、年齢層など
の場合と同様に適合度情報を指定することができる。
【0063】次に、ユーザが要求した検索に対する各文
書のスコアを計算する方法について説明する。まず、検
索条件に含まれるキーワードと検索対象文書群に含まれ
るキーワードの頻度分布から、従来から知られている方
法を使って、各文書dkの従来型スコアSo(dk)を
計算する。
【0064】例えば、検索条件に含まれるキーワードを
tj(j=1,2,3...)として、文書dkのスコ
アは、 So(dk)=Σtf(tj,dk)・idf(tj)
(但し、j=1,2,3...について総和をとる。) で計算することができる。上記の式において、dkは、
文書を示す。So(dk)は、文書dkのスコアを示
す。tj(j=1,2,3...)は、検索条件に含ま
れるキーワードを示す。
【0065】ここで、tfは、文書dkに含まれるキー
ワードtjの数、idfは、文書の総数をN、文書全体
の中でキーワードtjを含んでいる文書の数をdf(t
j)とするとき、 idf(tj)=log(N/df(tj))+1 である。
【0066】次に、検索要求を出しているユーザの各プ
ロファイル情報ui(i=1,2,3,...)に対す
る各文書の適合度情報ai(dk,ui)(i=1,
2,3,...)を、前記従来型スコアSo(dk)に
乗じた結果が、本実施の形態によるスコアSnとなる。
すなわち、 Sn(dk)=So(dk)・a1(dk,u1)・a
2(dk,u2)・a3(dk,u3)・...
【0067】さらに、ユーザの閲覧履歴情報を考慮する
ことができる。そのユーザが過去一定期間(例えば、1
ヶ月間)に閲覧した文書の属するカテゴリ毎の閲覧回数
をcm(m=1,2,3...)とし、文書dkの属す
るカテゴリの閲覧回数をc0とする。このとき、閲覧履
歴情報を考慮したスコアは、 Sn’(dk)=Sn(dk)・(1+c0/Σcm) として計算できる。
【0068】また、ユーザのカテゴリ毎の閲覧履歴を、
時間帯、曜日毎に記録しておけば、上記と同様に、時間
帯毎、曜日毎の閲覧履歴情報を考慮したスコアを計算す
ることができる。
【0069】次に、文書検索装置101へ文書を登録す
る場合の動作について、図7のフローチャートに従って
説明する。図8は、文書登録時に検索端末102に表示
されるメイン画面の一例である。文書提供者は、文書デ
ータベース104の文書蓄積部107へ文書の本体を登
録する(ステップ201)。文書提供者は、「登録する
文書名」と「登録する文書のファイル名」を入力する。
【0070】次に、索引格納部108に、登録する文書
から抽出したキーワードとその文書の格納場所を示すポ
インタとが格納される。このステップは、文書データベ
ース104に備えられた索引生成プログラムによって自
動的に行なわれる(ステップ202)。
【0071】次に、文書提供者は、ユーザのプロファイ
ル情報に対するその文書の適合度情報を、適合度情報格
納部109に格納する。このステップは、文書登録用の
画面によって、文書提供者が対話的に行なってもよい
し、文書に付属する制御情報の中に予め適合度情報を含
めて置くことにより、プログラムにより自動的に行なっ
てもよい(ステップ203)。
【0072】文書登録用の画面によって適合度を設定す
る場合は、適合度を設定する項目(例えば、年齢層)を
マウスでクリックすることによって選択する。図9は、
文書登録用の画面によって年齢層に対する適合度を設定
する画面の一例を示している。
【0073】最後に、閲覧履歴情報を考慮に入れるため
に必要な文書が属するカテゴリを指定する。このステッ
プも、文書登録用の画面によって、文書提供者が対話的
に行なってもよいし、文書に付属する制御情報の中に予
めカテゴリ情報を含めて置くことにより、プログラムに
より自動的に行なってもよい(ステップ204)。図8
の例では、「文書が属するカテゴリ」の項目に直接カテ
ゴリを入力するか、メニューからカテゴリを選択する。
【0074】次に、検索端末102から文書検索装置1
01に格納された文書を検索する場合の動作について、
図10のフローチャートに従って説明する。図11は、
文書検索時に検索端末102に表示される画面の一例で
ある。ユーザは、検索端末102から検索条件を入力す
る(ステップ301)。図11の例では、「携帯端末」
が検索条件として入力されている。その他、ユーザは、
検索の条件(and検索、or検索)、ユーザのプロフ
ァイル情報の使用の有無を選択する。
【0075】入力された検索条件は、ネットワーク10
3を介して文書検索装置101に送信される。このと
き、検索端末に格納されていたユーザのプロファイル情
報も、検索条件といっしょに、ネットワーク103を介
して文書検索装置101に送信される(ステップ30
2)。
【0076】文書検索装置101へ送信された検索条件
とユーザプロファイル情報は、通信部106により受信
され、検索実行部105に渡される(ステップ30
3)。検索実行部105は、検索条件に含まれるキーワ
ードと索引格納部108に格納された索引情報を用い
て、複数の候補文書の従来型スコアを算出する(ステッ
プ304)。
【0077】また、検索実行部105は、ユーザプロフ
ァイル情報と、適合度情報格納部109に格納された適
合度情報を用いて、ステップ404で算出された各候補
文書の従来型スコアをもとに、前述したスコアを計算す
る方法によるスコアを算出する(ステップ305)。ス
コアの算出については後述する。さらに、検索実行部1
05は、ユーザの閲覧履歴情報をもとに、閲覧履歴を考
慮したスコアを算出することもできる(ステップ30
6)。
【0078】最後に、検索実行部105は、候補文書の
名前をスコアの順に並べ替えて、通信部106に渡す
(ステップ307)。通信部106は、検索実行部10
5から渡された情報を、検索端末が表示できる形式のデ
ータに変換し、ネットワーク103に対応した通信プロ
トコルで、検索端末102に送信する(ステップ30
8)。検索端末102は、文書検索装置101から受取
ったデータを画面に表示する(ステップ309)。図1
2は、上記のようにして文書検索装置101を用いて検
索した結果、検索端末102に表示される検索結果の画
面の一例を示している。
【0079】以下に、スコアの算出の具体例について従
来型スコア計算と比較して説明する。 (1)検索条件 検索条件として、「携帯端末」が与えられたとする。 (2)従来型スコア計算 検索条件には唯一のキーワード「携帯端末」が含まれ
る。このキーワードは、文書1には2回含まれる。ま
た、文書2には5回含まれる。文書3,4,5・・・N
には1回も含まれないものとする。idf(「携帯端
末」)=log(N/2)+1=9+1=10(但し、
N=1024とする)であるから、 So(文書1)=2×10=20、 So(文書2)=5×10=50、 文書3,4,5...についてはSo=0。すなわち、
従来型スコア計算では、文書2のスコアが文書1より高
くなる。
【0080】(3)ユーザプロファイルと適合度情報に
基づくスコア計算 検索要求を出しているユーザ1のプロファイル情報が次
のものであったとする。 性別:女性、年齢:25歳、職種:OL、住所:東京 また、ユーザ2のプロファイル情報は以下のものとす
る。 性別:男性、年齢:35歳、職種:技術者、住所:大阪 ユーザ1が検索している場合、文書1の適合度情報は、
女性であることに対して2.0、年齢25歳に対して
2.0、職種がOLであることに対して2.0、住所が
東京であることに対して2.0であるので、ユーザプロ
ファイルを考慮したスコアは、 Sn(文書1)=So(文書1)×2.0×2.0×2.0×2.0 =20×16=320
【0081】また、文書2の適合度情報は、年齢25歳
に対して1.5のみであり、ユーザプロファイルを考慮
したスコアは、 Sn(文書2)=So(文書2)×1.5=50×1.
5=75 ユーザ2に対して同様に文書1、文書2のスコアを計算
すると、 Sn(文書1)=So(文書1)×1.8=20×1.
8=36 Sn(文書2)=So(文書2)×1.8×2.0×
2.0=50×7.2=360 すなわち、ユーザ1とユーザ2で同一の検索条件を指定
しても、文書1、文書2のスコアは逆転し、よりそのユ
ーザに適した文書のランクが上位となる。
【0082】(4)閲覧履歴を考慮したスコア計算 文書1はカテゴリ「営業情報」に属し、文書2はカテゴ
リ「技術情報」に属するものとする。ユーザ3は、次の
プロファイル情報を持つとする。 性別:男性、年齢:20歳、職種:学生、住所:大阪 すると、ユーザプロファイルと適合度までを考慮したス
コアは、 Sn(文書1)=20×1.8×2.0=72、 Sn(文書2)=50×0.6×2 =60 となる。
【0083】ここで、ユーザ3が過去1ヶ月間100回
の検索を行い、その内、営業情報のカテゴリに属する文
書を閲覧した回数が5回、技術情報に属する文書を閲覧
した回数が80回であったとすれば、閲覧履歴を考慮し
たスコアは、 S(文書1)=72×(1+5/100) =75.
6、 S(文書2)=60×(1+80/100)=108 となり、技術情報に属する文書のスコアが高くなる。以
上のようにして、スコアを算出する。
【0084】このように、個々のユーザのプロファイル
情報と適合度情報とを用いて、スコア計算を行うため、
文書中のキーワードに影響されることなくスコアを計算
することができる。このため、ユーザの嗜好情報、興味
情報を、検索結果に十分反映することが可能になる。ユ
ーザは、自己のプロファイル情報の特性情報を変えるこ
とによって、その時の嗜好情報、興味情報を反映する検
索結果を取得することが可能になる。
【0085】また、文書を登録した文書提供者によっ
て、適合度情報を入力することができるため、文書提供
者の意図する嗜好情報や興味情報を有するユーザに適合
するような検索結果を提供することが可能になる。文書
提供者は、提供した文書に対応する適合度情報の適合度
を示す数値を変更することによって、文書を提供する対
象となるユーザを拡大、縮小することが可能になる。
【0086】さらに、文書検索端末102側によって、
プロファイル情報を入力するプロファイル情報入力画面
を提供するため、上記適合度情報との対応が取りやす
い。また、文書提供者が入手したいプロファイル情報を
プロファイル情報入力画面に反映することも柔軟に行う
ことができる。従って、文書提供者の意図する嗜好情報
や興味情報を有するユーザと、ユーザの嗜好情報と興味
情報とを、より綿密に関連付けることが可能になる。
【0087】このように、この文書検索方法及び装置で
は、プロファイル情報として、性別、年齢、住所のよう
な客観性の高い情報を使用すること、また、趣味、関心
の深い分野のように主観的な情報については、ユーザ自
身が入力することにより正確性の高い情報を使用するこ
とを特徴とする。また、上記のようにして、プロファイ
ルを作成するため、プロファイルの客観性と正確性とを
維持することができる。さらに、上記プロファイル情報
に対する適合度情報を、文書登録者が予め検索対象文書
に付加しておくことにより、プロファイル情報と適合度
情報を基にしてスコアを計算することを特徴とする。ま
た、文書に適合度情報を対応づけることによって、プロ
ファイル情報と適合度情報をスコア計算に使用すること
を可能にしている。
【0088】以上のように、この文書検索方法及び文書
検索装置は、ユーザが入力した検索条件に基づいて文書
データベースの中から目的とする文書を検索し、個々の
ユーザの検索意図に対する適合度を検索結果の各文書毎
の数値(以下、スコアと記す)として計算し、スコアの
大小順序(以下、ランキングと記す)に従って検索結果
の一覧表を作成して、ユーザに提示する文書検索方法及
び装置において、文書を文書データベースに登録する際
に、文書自体に含まれるキーワードによる索引に加え
て、どのようなプロファイル情報を持つユーザに該文書
が適合するかを示す適合度情報を予め作成しておき、ユ
ーザが検索毎に入力した検索条件に加えて、ユーザが検
索毎に入力する必要のない個々のユーザのプロファイル
情報と前記適合度情報に基づいて、検索結果の各文書の
スコア計算及びランキングを行い、個々のユーザに応じ
て各文書の検索結果の一覧表内での提示順序を変更する
ことを特徴とする。
【0089】実施の形態2.上記実施の形態1で説明し
た文書検索装置及び文書検索方法は、コンピュータを用
いて、文書検索装置101と検索端末102を実現する
場合を説明した。この文書検索装置及び文書検索方法
は、コンピュータ上で動作するプログラム(ソフトウェ
ア)、ハードウェア、ファームウェア等によって実現す
ることができる。従って、この文書検索装置及び文書検
索方法を実現するためのプログラムを記録したコンピュ
ータ読み取り可能な記録媒体に記録されたプログラムを
コンピュータに読み込ませることによって、この文書検
索装置及び文書検索方法を実施することが可能である。
【0090】また、上記プログラムは、記録媒体に記録
されたプログラムに限られず、ネットワークを介して、
他のコンピュータから転送し、転送したプログラムによ
って実現することも可能である。コンピュータに読み込
める方法であれば、記録媒体、ネットワークに限られ
ず、その他の方法であっても、構わないことは言うまで
もない。
【0091】実施の形態3.上記実施の形態1では、W
WWの機能を用いて、文書検索方法及び装置を実現する
場合を説明したが、これに限られるわけではない。この
他の手段を用いてこの文書検索方法及び装置を実現して
も構わない。
【0092】実施の形態4.上記実施の形態1では、ユ
ーザのプロファイル情報、文書提供者が入力する適合度
情報は、それぞれ入力画面を用いて入力する場合を説明
した。しかし、これに限られることはない。所定の形式
に基づいて作成したファイルによってプロファイル情
報、適合度情報を登録することも可能である。更に、こ
の他の方法を用いてプロファイル情報、適合度情報を登
録しても構わない。
【0093】
【発明の効果】この発明に係る文書検索方法及び文書検
索装置によれば、ユーザの検索意図を反映した検索結果
を容易に表示することができる。
【0094】また、この発明によれば、文書中のキーワ
ードに影響されることなく、ユーザの嗜好情報、興味情
報を十分反映した検索結果を提供することができる。
【0095】この発明によれば、文書提供者が適合度情
報を指定することができるため、文書提供者の意図に応
じた検索結果を提供することができる。
【0096】この発明によれば、ユーザは、検索する度
にプロファイル情報を入力することなく、予め入力され
たプロファイル情報を用いて検索することができるた
め、ユーザは、少ない入力操作によってユーザの嗜好情
報、興味情報を十分反映した検索結果を取得することが
できる。
【0097】この発明によれば、ユーザが入力するプロ
ファイル情報に基づいて、ユーザに関する情報を収集す
るため、ユーザは、少ない入力操作によってユーザの嗜
好情報、興味情報を十分反映した検索結果を取得するこ
とができる。
【0098】この発明によれば、文書検索端末によって
提供されるプロファイル情報入力画面により、ユーザに
関する情報が取得できるとともに、取得したプロファイ
ル情報を検索端末に保存することにより、ユーザが毎回
プロファイル情報を入力する作業を削減することができ
る。
【図面の簡単な説明】
【図1】 実施の形態1の文書検策装置の構成のブロッ
ク図の一例を示した図。
【図2】 文書蓄積部のデータ構成の一例を示した図。
【図3】 索引格納部のデータ構成の一例を示した図。
【図4】 適合度情報格納部のデータ構成の一例を示し
た図。
【図5】 検策端末に表示される画面(プロファイル情
報入力)の一例を示した図。
【図6】 プロファイル情報のデータ構成の一例を示し
た図。
【図7】 実施の形態1の文書を登録する動作の一例を
示した図。
【図8】 検策端末に表示される画面(文書登録時のメ
イン画面)の一例を示した図。
【図9】 検策端末に表示される画面(文書登録時の年
齢層に対する適合度設定画面)の一例を示した図。
【図10】 実施の形態1の文書を検策する動作の一例
を示した図。
【図11】 検策端末に表示される画面(文書検策時)
の一例を示した図。
【図12】 検策端末に表示される画面(文書検策結
果)の一例を示した図。
【符号の説明】
101 文書検索装置、102 検索端末、103 ネ
ットワーク、104文書データベース、105 検索実
行部、106 通信部、107 文書蓄積部、108
索引格納部、109 適合度情報格納部。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 17/30 380 G06F 17/30 380E

Claims (17)

    【特許請求の範囲】
  1. 【請求項1】 入力を受け付けた検索条件に基づいて文
    書データベースの中から適合する文書を検索し、検索し
    た文書の一覧表を提示する文書検索方法において、 上記文書データベース内に、文書を蓄積する記憶領域で
    ある文書蓄積部と、ユーザのプロファイル情報が上記文
    書に適合する度合いを示す適合度情報を格納する記憶領
    域である適合度情報格納部とを形成する記憶領域形成工
    程と、 文書を上記文書蓄積部へ蓄積する文書蓄積工程と、 上記文書蓄積工程で蓄積する文書に対応する適合度情報
    の入力を受け付け、受け付けた適合度情報を上記文書蓄
    積部に蓄積する文書に対応させて上記適合度情報格納部
    へ格納する適合度情報格納工程と、 検策条件と上記検策条件を入力したユーザのプロファイ
    ル情報とを入力し、入力した検策条件に基づいて、上記
    文書蓄積部から文書を検索し、上記適合度情報格納部か
    ら適合度情報を読み込み、入力したプロファイル情報と
    読み込んだ適合度情報とに基づいて、検索した文書の適
    合度を数値で示すスコアを計算し、上記スコアに基づい
    て文書を一覧表に提示する順序を決定する検策実行工程
    とを備えたことを特徴とする文書検索方法。
  2. 【請求項2】 上記プロファイル情報は、複数のデータ
    値を採る複数種類の特性情報を含み、 上記適合度情報格納工程は、適合度情報として、適合度
    の度合いを数値で指定し、プロファイル情報に含まれる
    複数種類の特性情報それぞれが採り得る複数のデータ値
    それぞれに対応する数値を指定する入力を受け付け、受
    け付けた複数種類の特定情報それぞれが採り得る複数の
    データ値それぞれに対応する数値を適合度情報として格
    納することを特徴とする請求項1記載の文書検索方法。
  3. 【請求項3】 上記検索実行工程は、上記プロファイル
    情報に含まれる複数の特性情報それぞれについて、特性
    情報が採るデータ値に対応する適合度情報として示され
    る数値を取得し、取得した複数の特性情報それぞれに対
    応する数値を用いてスコアを計算することを特徴とする
    請求項2記載の文書検索方法。
  4. 【請求項4】 上記文書検策方法は、 検索条件と、予め検索に先立ってユーザが入力したプロ
    ファイル情報とを通信網を介して受信し、 上記検索実行工程は、受信した検索条件とプロファイル
    情報とを入力することを特徴とする請求項1から3いず
    れかに記載の文書検索方法。
  5. 【請求項5】 上記プロファイル情報は、ユーザの性
    別、年齢、生年月日、住所、ユーザが関係の深い地域、
    業種、職種、家族構成、年収、趣味、特に関心の深い分
    野の内の少なくとも一つを含むことを特徴とする請求項
    1から4いずれかに記載の文書検索方法。
  6. 【請求項6】 上記検索実行工程は、さらに、上記検索
    条件と上記プロファイル情報とを受信した時に取得する
    通信情報から、ユーザが上記検索条件と上記プロファイ
    ル情報とを入力した検索端末に関する情報を収集するこ
    とを特徴とする請求項4記載の文書検索方法。
  7. 【請求項7】 上記検索端末に関する情報は、検索端末
    もしくは検索端末が接続しているプロキシサーバのイン
    ターネットプロトコルアドレスと、検索端末もしくは検
    索端末が接続しているプロキシサーバの属するインター
    ネットドメイン名とのいずれか一つを含み、さらに、上
    記インターネットプロトコルアドレスから特定されるユ
    ーザの属する国名と、上記インターネットドメイン名か
    ら特定されるユーザの属する国名及びユーザの属する組
    織の種類とのいずれか一方を含むこと特徴とする請求項
    6記載の文書検索方法。
  8. 【請求項8】 上記検索実行工程は、上記検索条件と上
    記プロファイル情報に加え、検索条件を入力したユーザ
    が過去に上記文書蓄積工程で蓄積された文書を検索した
    履歴情報を入力し、入力した履歴情報が所定の条件を示
    す場合は、上記検索した文書のスコアを高くすることを
    特徴とする請求項1から7いずれかに記載の文書検索方
    法。
  9. 【請求項9】 上記履歴情報は、上記文書蓄積工程で蓄
    積された文書を予め複数のカテゴリに分類し、過去一定
    期間内に閲覧した文書が属するカテゴリと、上記カテゴ
    リを閲覧した閲覧回数と、閲覧した日時時刻及び閲覧し
    た曜日及び時間帯とのいずれか一つとを含み、 上記検索実行工程は、ユーザが所定の期間内に、所定の
    回数上記文書が属するカテゴリを閲覧した場合は、上記
    文書のスコアを高くすることを特徴とする請求項8記載
    の文書検索方法。
  10. 【請求項10】 入力を受け付けた検索条件に基づいて
    文書データベースの中から適合する文書を検索し、検索
    した文書の一覧表を提示する文書検索装置において、 上記文書データベースは、 文書を予め蓄積する文書蓄積部と、 ユーザに関する情報を収集したプロファイル情報が上記
    文書蓄積部に蓄積される文書に適合する度合いを示す適
    合度情報の入力を受け付け、受け付けた適合度情報を上
    記文書蓄積部に蓄積される文書に対応させて格納する適
    合度情報格納部とを有し、 上記文書検索装置は、 検策条件と上記検策条件を入力したユーザに関するプロ
    ファイル情報とを入力し、入力した検策条件に基づい
    て、上記文書蓄積部から文書を検索し、上記適合度情報
    格納部から適合度情報を読み込み、入力したプロファイ
    ル情報と読み込んだ適合度情報とに基づいて、検索した
    文書の適合度を数値で示すスコアを計算し、上記スコア
    に基づいて文書を一覧表に提示する順序を決定する検策
    実行部とを備えたことを特徴とする文書検索装置。
  11. 【請求項11】 上記プロファイル情報は、複数のデー
    タ値を採る複数の特性情報を含み、 上記適合度情報格納部は、適合度情報として、適合度の
    度合いを数値で指定し、プロファイル情報に含まれる複
    数種類の特性情報それぞれが採り得る複数のデータ値そ
    れぞれに対応する数値を指定する入力を受け付け、受け
    付けた複数種類の特定情報それぞれが採り得るの複数の
    データ値それぞれに対応する数値を適合度情報として格
    納することを特徴とする請求項10記載の文書検索装
    置。
  12. 【請求項12】 上記検索実行部は、上記プロファイル
    情報に含まれる複数の特性情報それぞれについて、特性
    情報が採るデータ値に対応する適合度情報として示され
    る数値を取得し、取得した複数の特性情報それぞれに対
    応する数値を用いてスコアを計算することを特徴とする
    請求項11記載の文書検索装置。
  13. 【請求項13】 上記文書検策装置は、さらに、通信網
    と接続し、検索条件と、予め検索に先立ってユーザが入
    力したプロファイル情報とを通信網を介して受信する特
    徴とする請求項10から12いずれかに記載の記載の文
    書検索装置。
  14. 【請求項14】 上記文書検索装置は、上記通信網を介
    して検索端末と接続し、プロファイル情報をユーザに入
    力させるプロファイル情報入力画面を上記検索端末へ送
    信し、送信したプロファイル情報入力画面を用いてユー
    ザにプロファイル情報の入力を促し、入力されたプロフ
    ァイル情報を上記検索端末へ保存させることを特徴とす
    る請求項13記載の文書検索装置。
  15. 【請求項15】 上記検索実行部は、上記検索条件と上
    記プロファイル情報とを受信した時に取得する通信情報
    から、ユーザが上記検索条件と上記プロファイル情報と
    を入力した検索端末に関する情報を収集することを特徴
    とする請求項13または14記載の文書検索装置。
  16. 【請求項16】 入力を受け付けた検索条件に基づいて
    文書データベースの中から適合する文書を検索し、検索
    した文書の一覧表を提示する文書検索方法をコンピュー
    タに実現させるためのプログラムを記録したコンピュー
    タで読取可能な記録媒体において、 上記文書データベース内に、文書を蓄積する記憶領域で
    ある文書蓄積部と、ユーザに関する情報を収集したプロ
    ファイル情報が上記文書に適合する度合いを示す適合度
    情報を格納する記憶領域である適合度情報格納部とを形
    成する記憶領域形成工程と、 文書を上記文書蓄積部へ蓄積する文書蓄積工程と、 上記文書蓄積工程で蓄積する文書に対応する適合度情報
    の入力を受け付け、受け付けた適合度情報を上記文書蓄
    積部に蓄積する文書に対応させて上記適合度情報格納部
    へ格納する適合度情報格納工程と、 検策条件と上記検策条件を入力したユーザに関するプロ
    ファイル情報とを入力し、入力した検策条件に基づい
    て、上記文書蓄積部から文書を検索し、上記適合度情報
    格納部から適合度情報を読み込み、入力したプロファイ
    ル情報と読み込んだ適合度情報とに基づいて、検索した
    文書の適合度を数値で示すスコアを計算し、上記スコア
    に基づいて文書を一覧表に提示する順序を決定する検策
    実行工程とを備えた文書検索方法をコンピュータに実現
    させるためのプログラムを記録したコンピュータで読取
    可能な記録媒体。
  17. 【請求項17】 上記文書検策方法は、上記文書データ
    ベースを有し、文書を検索する文書検索装置と、ユーザ
    が検索条件を入力する検索端末とを用いて実行し、上記
    検索端末において、 予め検索に先立ってユーザが入力したプロファイル情報
    を保存し、検索条件の入力を受け付け、受け付けた検索
    条件と上記検索条件を入力したユーザに対応するプロフ
    ァイル情報とを上記文書検索装置へ送信し、 上記文書検索装置において、 送信された検索条件とプロファイル情報とを受信し、上
    記検索実行工程により、上記検索条件とプロファイル情
    報とを入力することを特徴とする請求項1から4いずれ
    かに記載の文書検索方法。
JP2000217005A 2000-07-18 2000-07-18 文書検索方法及び文書検索装置及び文書検索方法をコンピュータに実現させるためのプログラムを記録したコンピュータで読取可能な記録媒体 Pending JP2002032401A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000217005A JP2002032401A (ja) 2000-07-18 2000-07-18 文書検索方法及び文書検索装置及び文書検索方法をコンピュータに実現させるためのプログラムを記録したコンピュータで読取可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000217005A JP2002032401A (ja) 2000-07-18 2000-07-18 文書検索方法及び文書検索装置及び文書検索方法をコンピュータに実現させるためのプログラムを記録したコンピュータで読取可能な記録媒体

Publications (1)

Publication Number Publication Date
JP2002032401A true JP2002032401A (ja) 2002-01-31

Family

ID=18712179

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000217005A Pending JP2002032401A (ja) 2000-07-18 2000-07-18 文書検索方法及び文書検索装置及び文書検索方法をコンピュータに実現させるためのプログラムを記録したコンピュータで読取可能な記録媒体

Country Status (1)

Country Link
JP (1) JP2002032401A (ja)

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003242157A (ja) * 2002-02-20 2003-08-29 Honda Motor Co Ltd 顧客の特性に応じた商品を検索するコンピュータシステム
JP2004260447A (ja) * 2003-02-25 2004-09-16 Sharp Corp 放送受信装置
JP2006024212A (ja) * 2004-06-30 2006-01-26 Microsoft Corp 探知されたユーザの選好に基づいて検索結果をランク付けするシステムおよび方法
JP2006092557A (ja) * 2004-09-24 2006-04-06 Microsoft Corp 検索エンジンから返されるページのランキングを制御するシステムおよび方法
JP2006120126A (ja) * 2004-10-20 2006-05-11 Toshiba Corp キーワード抽出装置、キーワード抽出プログラム
JP2006164246A (ja) * 2004-12-07 2006-06-22 Microsoft Corp エンティティ固有の調整された検索
WO2006095409A1 (ja) * 2005-03-07 2006-09-14 Mars Flag Corporation 情報検索装置,コンピュータプログラム及び記憶媒体
JP2006323790A (ja) * 2005-05-20 2006-11-30 Navitime Japan Co Ltd Poi情報提供システム、poi情報提供方法、情報配信サーバ、端末装置
JP2007507801A (ja) * 2003-09-30 2007-03-29 グーグル インコーポレイテッド ウェブ検索の個人化
KR100727056B1 (ko) * 2006-04-06 2007-06-12 엔에이치엔(주) 로컬 컴퓨터의 프로그램 실행 방법 및 시스템
JP2007531160A (ja) * 2004-03-29 2007-11-01 グーグル インク. 検索エンジンにおいて検索結果を可変的にパーソナライズ化すること
JP2008511057A (ja) * 2004-08-19 2008-04-10 クラリア コーポレイション エンドユーザの情報要求に応答するための方法及び装置
JP2009528619A (ja) * 2006-03-02 2009-08-06 マイクロソフト コーポレーション ウェブ検索の適合性を高めるためにウェブ検索のユーザの振舞いをマイニングすること
JP2011044166A (ja) * 2003-06-16 2011-03-03 Google Inc 検索結果に対し選好国偏向をもたらすシステムおよび方法
JP2011065570A (ja) * 2009-09-18 2011-03-31 Ntt Docomo Inc 情報検索システム及び情報検索方法
US8073866B2 (en) 2005-03-17 2011-12-06 Claria Innovations, Llc Method for providing content to an internet user based on the user's demonstrated content preferences
US8078602B2 (en) 2004-12-17 2011-12-13 Claria Innovations, Llc Search engine for a computer network
US8086697B2 (en) 2005-06-28 2011-12-27 Claria Innovations, Llc Techniques for displaying impressions in documents delivered over a computer network
JPWO2010058519A1 (ja) * 2008-11-18 2012-04-19 日本電気株式会社 ハイブリッド検索システム、ハイブリッド検索方法およびハイブリッド検索プログラム
US8170912B2 (en) 2003-11-25 2012-05-01 Carhamm Ltd., Llc Database structure and front end
US8176033B2 (en) 2008-04-22 2012-05-08 Ntt Docomo, Inc. Document processing device and document processing method
US8255413B2 (en) 2004-08-19 2012-08-28 Carhamm Ltd., Llc Method and apparatus for responding to request for information-personalization
JP2012528406A (ja) * 2009-05-27 2012-11-12 マイクロソフト コーポレーション 検索結果のマージ
US8316003B2 (en) 2002-11-05 2012-11-20 Carhamm Ltd., Llc Updating content of presentation vehicle in a computer network
JP2013511085A (ja) * 2009-11-12 2013-03-28 アリババ グループ ホールディング リミテッド 検索方法およびシステム
JP2013518323A (ja) * 2010-01-21 2013-05-20 マグネット システムズ, インコーポレイテッド 企業ビジネスアプリケーションのためのソーシャルおよびコンテキスト検索
US8620910B2 (en) 2008-02-27 2013-12-31 Nec Corporation Search system, search method, and program
US8689238B2 (en) 2000-05-18 2014-04-01 Carhamm Ltd., Llc Techniques for displaying impressions in documents delivered over a computer network
US9495446B2 (en) 2004-12-20 2016-11-15 Gula Consulting Limited Liability Company Method and device for publishing cross-network user behavioral data
US9852183B2 (en) 2012-04-26 2017-12-26 Alibaba Group Holding Limited Information providing method and system
JP6321874B1 (ja) * 2017-10-05 2018-05-09 株式会社発明通信社 サーバー装置
JP2019159970A (ja) * 2018-03-14 2019-09-19 株式会社リコー プロファイル管理システム、情報管理方法、プログラム、情報処理装置、データ送信方法
JP2020057280A (ja) * 2018-10-03 2020-04-09 東芝テック株式会社 検索装置、検索方法及びプログラム
CN116450769A (zh) * 2023-06-09 2023-07-18 北京量子伟业信息技术股份有限公司 智慧档案的管理方法、装置、设备及介质

Cited By (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8689238B2 (en) 2000-05-18 2014-04-01 Carhamm Ltd., Llc Techniques for displaying impressions in documents delivered over a computer network
US7483844B2 (en) 2002-02-20 2009-01-27 Honda Giken Kogyo Kabushiki Kaisha Computer system for retrieving a product that meets characteristics of a customer
JP2003242157A (ja) * 2002-02-20 2003-08-29 Honda Motor Co Ltd 顧客の特性に応じた商品を検索するコンピュータシステム
US8316003B2 (en) 2002-11-05 2012-11-20 Carhamm Ltd., Llc Updating content of presentation vehicle in a computer network
JP2004260447A (ja) * 2003-02-25 2004-09-16 Sharp Corp 放送受信装置
JP2011044166A (ja) * 2003-06-16 2011-03-03 Google Inc 検索結果に対し選好国偏向をもたらすシステムおよび方法
JP2007507801A (ja) * 2003-09-30 2007-03-29 グーグル インコーポレイテッド ウェブ検索の個人化
US9298777B2 (en) 2003-09-30 2016-03-29 Google Inc. Personalization of web search results using term, category, and link-based user profiles
US8170912B2 (en) 2003-11-25 2012-05-01 Carhamm Ltd., Llc Database structure and front end
JP4664355B2 (ja) * 2004-03-29 2011-04-06 グーグル インク. 検索エンジンにおいて検索結果を可変的にパーソナライズ化すること
JP2007531160A (ja) * 2004-03-29 2007-11-01 グーグル インク. 検索エンジンにおいて検索結果を可変的にパーソナライズ化すること
JP2006024212A (ja) * 2004-06-30 2006-01-26 Microsoft Corp 探知されたユーザの選好に基づいて検索結果をランク付けするシステムおよび方法
KR101137198B1 (ko) 2004-06-30 2012-04-19 마이크로소프트 코포레이션 사용자 선호도 트랙킹에 기초한 서치 결과 랭킹 시스템 및방법
JP2008511057A (ja) * 2004-08-19 2008-04-10 クラリア コーポレイション エンドユーザの情報要求に応答するための方法及び装置
US8255413B2 (en) 2004-08-19 2012-08-28 Carhamm Ltd., Llc Method and apparatus for responding to request for information-personalization
JP2006092557A (ja) * 2004-09-24 2006-04-06 Microsoft Corp 検索エンジンから返されるページのランキングを制御するシステムおよび方法
JP4699148B2 (ja) * 2004-10-20 2011-06-08 株式会社東芝 キーワード抽出装置、キーワード抽出プログラム
JP2006120126A (ja) * 2004-10-20 2006-05-11 Toshiba Corp キーワード抽出装置、キーワード抽出プログラム
JP2006164246A (ja) * 2004-12-07 2006-06-22 Microsoft Corp エンティティ固有の調整された検索
US8078602B2 (en) 2004-12-17 2011-12-13 Claria Innovations, Llc Search engine for a computer network
US9495446B2 (en) 2004-12-20 2016-11-15 Gula Consulting Limited Liability Company Method and device for publishing cross-network user behavioral data
JPWO2006095409A1 (ja) * 2005-03-07 2008-08-14 株式会社マーズフラッグ 情報検索装置、コンピュータプログラム及び記憶媒体
JP4527770B2 (ja) * 2005-03-07 2010-08-18 株式会社マーズフラッグ 情報検索装置、コンピュータプログラム及び記憶媒体
WO2006095409A1 (ja) * 2005-03-07 2006-09-14 Mars Flag Corporation 情報検索装置,コンピュータプログラム及び記憶媒体
US8073866B2 (en) 2005-03-17 2011-12-06 Claria Innovations, Llc Method for providing content to an internet user based on the user's demonstrated content preferences
JP2006323790A (ja) * 2005-05-20 2006-11-30 Navitime Japan Co Ltd Poi情報提供システム、poi情報提供方法、情報配信サーバ、端末装置
US8086697B2 (en) 2005-06-28 2011-12-27 Claria Innovations, Llc Techniques for displaying impressions in documents delivered over a computer network
JP2009528619A (ja) * 2006-03-02 2009-08-06 マイクロソフト コーポレーション ウェブ検索の適合性を高めるためにウェブ検索のユーザの振舞いをマイニングすること
JP2009532796A (ja) * 2006-04-06 2009-09-10 エヌエイチエヌ コーポレーション ローカルコンピュータのプログラム実行方法およびシステム
WO2007114562A1 (en) * 2006-04-06 2007-10-11 Nhn Corporation System and method for executing program in local computer
JP4910041B2 (ja) * 2006-04-06 2012-04-04 エヌエイチエヌ コーポレーション ローカルコンピュータのプログラム実行方法およびシステム
KR100727056B1 (ko) * 2006-04-06 2007-06-12 엔에이치엔(주) 로컬 컴퓨터의 프로그램 실행 방법 및 시스템
US8572090B2 (en) 2006-04-06 2013-10-29 Nhn Corporation System and method for executing program in local computer
US8620910B2 (en) 2008-02-27 2013-12-31 Nec Corporation Search system, search method, and program
US8176033B2 (en) 2008-04-22 2012-05-08 Ntt Docomo, Inc. Document processing device and document processing method
JPWO2010058519A1 (ja) * 2008-11-18 2012-04-19 日本電気株式会社 ハイブリッド検索システム、ハイブリッド検索方法およびハイブリッド検索プログラム
JP2012528406A (ja) * 2009-05-27 2012-11-12 マイクロソフト コーポレーション 検索結果のマージ
US9495460B2 (en) 2009-05-27 2016-11-15 Microsoft Technology Licensing, Llc Merging search results
JP2011065570A (ja) * 2009-09-18 2011-03-31 Ntt Docomo Inc 情報検索システム及び情報検索方法
JP2013511085A (ja) * 2009-11-12 2013-03-28 アリババ グループ ホールディング リミテッド 検索方法およびシステム
US9460158B2 (en) 2009-11-12 2016-10-04 Alibaba Group Holding Limited Search method and system
US9870408B2 (en) 2009-11-12 2018-01-16 Alibaba Group Holding Limited Search method and system
JP2013518323A (ja) * 2010-01-21 2013-05-20 マグネット システムズ, インコーポレイテッド 企業ビジネスアプリケーションのためのソーシャルおよびコンテキスト検索
US9852183B2 (en) 2012-04-26 2017-12-26 Alibaba Group Holding Limited Information providing method and system
JP6321874B1 (ja) * 2017-10-05 2018-05-09 株式会社発明通信社 サーバー装置
JP2019067330A (ja) * 2017-10-05 2019-04-25 株式会社発明通信社 サーバー装置
JP2019159970A (ja) * 2018-03-14 2019-09-19 株式会社リコー プロファイル管理システム、情報管理方法、プログラム、情報処理装置、データ送信方法
JP7081232B2 (ja) 2018-03-14 2022-06-07 株式会社リコー プロファイル管理システム、情報管理方法、プログラム、情報処理装置
JP2020057280A (ja) * 2018-10-03 2020-04-09 東芝テック株式会社 検索装置、検索方法及びプログラム
CN116450769A (zh) * 2023-06-09 2023-07-18 北京量子伟业信息技术股份有限公司 智慧档案的管理方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
JP2002032401A (ja) 文書検索方法及び文書検索装置及び文書検索方法をコンピュータに実現させるためのプログラムを記録したコンピュータで読取可能な記録媒体
KR100478019B1 (ko) 지역 정보 검색 결과 제공 방법 및 시스템
US9002894B2 (en) Objective and subjective ranking of comments
US8166013B2 (en) Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis
US7657504B2 (en) User interface for displaying images of sights
US7707208B2 (en) Identifying sight for a location
JP5572596B2 (ja) 検索結果内におけるプレーストコンテンツの順序付けのパーソナライズ
TWI474198B (zh) 於搜尋結果頁內提供已標定應用程式之系統與方法
JP2019028647A (ja) 研修情報提供装置、方法およびプログラム
US20080077581A1 (en) System and method for providing medical disposition sensitive content
US20120246139A1 (en) System and method for resume, yearbook and report generation based on webcrawling and specialized data collection
JP2008542926A (ja) オープンウェブコンテンツへのアクセスを備えるペイフォーアクセス法律調査システム
JP2002334104A (ja) 情報配信システム、情報配信サーバ、クライアント、情報送信方法、受信方法、並びにプログラム
KR100704404B1 (ko) 서비스 평가 정보를 제공하는 방법 및 그 시스템
JP6144799B2 (ja) 検索結果内に添付された情報データベースに基づいた検索リスト及び検索語順位の提供方法及びシステム
WO2012099196A1 (ja) 情報検索サービス提供装置及び方法、情報検索サービス提供用データベースの構築装置、並びにコンピュータプログラム信号
KR101020895B1 (ko) 지역 정보 검색 결과 제공 방법 및 시스템
KR100909561B1 (ko) 지역 정보 검색 결과 제공 시스템
JP2001331684A (ja) 就職支援システム
JP4385087B2 (ja) 生活情報支援システム
JP3933617B2 (ja) 共有情報検索方法、共有情報検索プログラム、および情報共有システム
JP4259233B2 (ja) 情報検索装置及びプログラム
KR20020020869A (ko) 분류 검색어의 자동삽입을 통한 1단어 검색서비스 방법