JP2003186907A - プロファイル情報の情報検索方法、プログラム、記録媒体及び装置 - Google Patents

プロファイル情報の情報検索方法、プログラム、記録媒体及び装置

Info

Publication number
JP2003186907A
JP2003186907A JP2001379851A JP2001379851A JP2003186907A JP 2003186907 A JP2003186907 A JP 2003186907A JP 2001379851 A JP2001379851 A JP 2001379851A JP 2001379851 A JP2001379851 A JP 2001379851A JP 2003186907 A JP2003186907 A JP 2003186907A
Authority
JP
Japan
Prior art keywords
candidate data
data
attribute
score
importance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001379851A
Other languages
English (en)
Other versions
JP4011906B2 (ja
Inventor
Aoshi Okamoto
青史 岡本
Hiroya Inakoshi
宏弥 稲越
Akira Sato
陽 佐藤
Takehisa Ando
剛寿 安藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2001379851A priority Critical patent/JP4011906B2/ja
Priority to US10/102,773 priority patent/US6915295B2/en
Priority to EP02252514A priority patent/EP1320041A3/en
Publication of JP2003186907A publication Critical patent/JP2003186907A/ja
Application granted granted Critical
Publication of JP4011906B2 publication Critical patent/JP4011906B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • G06F16/337Profile generation, learning or modification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/912Applications of a database
    • Y10S707/944Business related
    • Y10S707/947Human resources
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】プロファイルデータの変化に即座に対応でき、
ユーザ毎、コンテンツ毎、サービス毎などの特徴を正確
に把握して有用な検索や精度の高い未知属性値の推定を
可能とする。 【解決手段】候補データ検索ステップは、1又は複数の
属性値を指定した入力に基づいて、異なる属性毎に固有
の属性値を持つプロファイルデータ群の中から類似する
複数の候補データを検索し、重要度算出ステップは、検
索された候補データと非候補データに基づいて、属性に
関する重要度を算出する。スコア算出ステップは、算出
された重要度に基づいて、各候補データのスコアを算出
し、検索結果出力ステップは、算出されたスコアに基づ
いて各候補データをランキングし、ランキングされた上
位の候補データを検索結果として出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、属性値を用いてユー
ザ、コンテンツ、サービス等の特徴を表すプロファイル
データの検索や未知属性値を推定するためのプロファイ
ル情報の情報検索方法、プログラム、記録媒体及び装置
に関し、特に、検索入力として指定された属性の重要度
に基づいて有用なプロファイルデータの検索と未知属性
値を推定するためのプロファイル情報の情報検索方法、
プログラム、記録媒体及び装置に関する。
【0002】
【従来の技術】近年、ユーザ、コンテンツ、サービスな
どの特徴をプロファイルデータとして保持し、それらの
プロファイルデータを有効に利用することで、ユーザ
毎、コンテンツ毎、サービス毎の特徴に着目した検索
や、未知属性値の推定などの情報処理を行うことが重要
になってきている。
【0003】例えば、企業内であるプロジェクトを立ち
上げる場合、従業員の役職や所属、スキルなどの情報を
プロファイル化しておき、そのプロファイルデータを利
用して、プロジェクトの各担当にふさわしい従業員を検
索できる技術が重要になってきている。
【0004】また、電子商取引の分野においては、顧客
の特徴を表すユーザプロファイルデータを保持し、ユー
ザプロファイルデータを利用して、顧客が優良顧客なの
か、不良顧客なのかを推定する技術が重要になってきて
いる。
【0005】このように、各種プロファイルデータを利
用した検索や推定などの情報処理が重要になってきてお
り、各ユーザ、各コンテンツ、各サービスの特徴を有効
に活用した検索や推定を行える技術が待ち望まれてい
る。
【0006】従来の情報検索技術では、例えば特開2001
-148864に開示されているように、プロファイルデータ
に基づいて、類似したユーザを予めクラスタ化し、同じ
クラスタに属するユーザの特徴に基づいて、検索や推定
を行う方法がとられている。
【0007】この技術によれば、予め作成しておいたク
ラスタの中から、ユーザが属すると思われるクラスタを
選択し、そのクラスタに属するユーザを提示すること
で、そのユーザに類似したユーザを検索することが可能
となる。また、ユーザが属すると思われるクラスタ内の
値の分布から、未知属性値の推定を行うことが可能にな
る。
【0008】
【発明が解決しようとする課題】しかしながら、従来の
プロファイルデータを対象とした情報検索にあっては、
プロファイルデータの検索や未知属性値の推定を行う前
に、予めクラスタを作成する必要があるため、プロファ
イルデータが変化した場合、新たにクラスタを作成し直
すまで、情報の変化に対応ができないという問題が発生
する。
【0009】また、ユーザプロファイルデータは、予め
作成されたクラスタのいずれかに属するが、ユーザプロ
ファイルデータの特徴とクラスタの特徴とに違いがある
場合、そのユーザプロファイルデータに対する検索や未
知属性値の推定の精度が低下してしまうといった問題が
生じる。
【0010】更に、ユーザプロファイルデータによるユ
ーザの検索は、画一的な観点からしか行うことができな
いため、検索者は、多くの検索結果の中から所望の結果
を探すというコストの高い作業を強いられる可能性があ
る。
【0011】本発明は、プロファイルデータの変化に即
座に対応することが可能であり、ユーザ毎、コンテンツ
毎、サービス毎などの特徴を正確に把握して、有用な検
索や、精度の高い未知属性値の推定を可能とするプロフ
ァイル情報の情報検索方法、プログラム、記録媒体及び
装置を提供することを目的とする。
【0012】
【課題を解決するための手段】図1は本発明の原理説明
図である。
【0013】本発明は、プロファイルデータを対象とし
たプロファイル情報の情報検索方法を提供する。ここで
プロファイルデータとは、異なる属性毎に固有の属性値
を持つファイル情報であり、ユーザ、コンテンツ、サー
ビス等の対象毎に、それぞれの特徴を表す属性とその属
性値を保持している。
【0014】本発明の情報検索方法は、図1(A)のよ
うに、1又は複数の属性値を指定した入力データに基づ
いて、異なる属性毎に固有の属性値を持つプロファイル
データ群の中から類似する複数の候補データを検索する
候補データ検索ステップと、検索された候補データと非
候補データに基づいて、属性に関する重要度を算出する
重要度算出ステップと、算出された重要度に基づいて、
各候補データのスコアを算出するスコア算出ステップ
と、記算出されたスコアに基づいて各候補データをラン
キングし、ランキングされた上位の候補データを検索結
果として出力する検索結果出力ステップと、を備えたこ
とを特徴とする。
【0015】このような本発明の情報検索方法は、図1
(C)のように、候補データ検索ステップで入力属性値
に対しまず粗い検索を実行し、プロファイルデータ全体
を類似性のある候補データとそれ以外の非候補データに
大別する。次に重要度算出ステップで、候補データを正
例、非候補データを負例として、属性毎に負例に対し相
違する度合いが大きいほど高くなる正例(候補データ)
の重要度を算出する。続いてスコア算出ステップで、重
要度による重みを使用して各候補データの属性値のスコ
アを計算し、最終的に検索結果出力ステップで、高いス
コアをもつ候補データを検索結果とする。
【0016】このため、現在保持しているプロファイル
データに基づいた重要度の算出であることから、プロフ
ァイルデータの変化に即時に対応でき、検索入力で指定
した属性値に対し有用な検索結果を高精度で得ることが
できる。
【0017】ここで候補データ検索ステップは、各プロ
ファイルデータにつきスコアを求めて候補データを検索
し、これに対応してスコア算出ステップは、候補データ
検索ステップで求められたスコアを重要度に基づいて算
出されたスコアに加算して各候補データのスコアを算出
する。
【0018】重要度算出ステップは、候補データと非候
補データに基づいて、異なる属性毎の重要度を算出す
る。重要度算出ステップは、異なる属性毎の重要度とし
て、例えばインフォメーション・ゲインを算出する。こ
の場合、スコア算出ステップは、各候補データのスコア
として、インフォメーション・ゲインを重みとして類似
度を算出する。
【0019】また重要度算出ステップは、同じ属性に含
まれる異なる属性値の間の重要度を算出する。重要度算
出ステップは、異なる属性値の間の重要度として、例え
ばMVDM(Modified Value Difference Metric)を算出
する。この場合、スコア算出ステップは、各候補データ
のスコアとして、MVDM(Modified Value Difference
Metric)を重みとして類似度を算出する。
【0020】本発明は、候補データの重要度を算出する
ことを基本とするが、属性によっては、概略的な検索で
除外された非候補データの中に、候補データより高い重
要度が算出される場合がある。
【0021】そこで、スコア算出ステップは、更に、算
出された重要度に基づいて、非候補データのスコアを算
出し、検索結果出力ステップは、算出されたスコアに基
づいて各候補データ及び非候補データをランキングし、
ランキングされた上位の候補データを検索結果として出
力する。
【0022】コスト計算の負荷に余裕がある場合には、
このように非候補データについてもコストを算出し、出
力するプロファイルデータを決めても良い。
【0023】検索結果出力ステップは、ランキングされ
た上位所定数の候補データ、又は所定の閾値以上のスコ
アを持つ候補データを検索結果として出力する。
【0024】検索結果出力ステップは、検索結果として
出力するプロファイルデータの属性値に、算出された重
要度を付加して出力する。このため利用者は検索結果に
負荷された重要度をみて、検索結果を容易に理解するこ
とができ、有用な検索結果であることの判断が適切にで
きる。
【0025】検索結果出力ステップは、観点別の出力が
指定されていた場合、算出された重要度の中の高い重要
度を持つ属性を観点として自動的に選別し、選別した観
点の属性に含まれる異なる属性値毎に各候補データを分
類し、算出されたスコアに基づいて属性値毎に分類され
た各候補データをランキングし、ランキングされた上位
の候補データを観点別の検索結果として出力する。
【0026】このように算出された重要度から、例えば
最も高い重要度をもつ属性を観点として自動的に選別し
て候補データの分類とコストによるランキングに従った
出力で、利用者は例えばコンピュータ言語といった属性
が最大重要度となって観点として自動選別された場合、
Java(R)、C++、COBOLといった属性値毎
に分類してランキングされた観点別の検索結果を得るこ
とができ、効率良く短時間で希望する検索結果に行き着
く。
【0027】本発明は、図1(B)のように、未入力の
プロファイル属性値の推定を可能とする情報検索方法を
提供する。
【0028】この情報検索方法は、未入力の属性値を含
む1又は複数の属性値を指定した入力データに基づい
て、異なる属性毎に固有の属性値を持つ属性値を含むプ
ロファイルデータ群の中から類似する複数の候補データ
を検索する候補データ検索ステップと、検索された候補
データと非候補データに基づいて、属性に関する重要度
を算出する重要度算出ステップと、算出された重要度に
基づいて、各候補データのスコアを算出するスコア算出
ステップと、各候補データのスコアに応じて、入力属性
値に対する類似データを前記候補データの中から決定
し、類似データ中における未入力属性値の分布に基づい
て、入力データの未入力属性値を推定して出力する推定
結果出力ステップと、を備えたことを特徴とする。ここ
で候補データ検索ステップ、重要度算出ステップ及びス
コア算出ステップは、図1(A)の情報検索方法と基本
的に同じになる。
【0029】推定結果出力ステップは、推定した未入力
属性値に、各候補データのスコアに基づいて算出された
信頼度を付加して出力する。この信頼度は、例えば各候
補データの推定値を可とするスコアを総スコアで割った
値である。
【0030】本発明は、プロファイルデータ検索のため
のプログラムを提供する。このプログラムは、コンピュ
ータに、1又は複数の属性値を指定した入力データに基
づいて、異なる属性毎に固有の属性値を持つプロファイ
ルデータ群の中から類似する複数の候補データを検索す
る候補データ検索ステップと、検索された候補データと
非候補データに基づいて、属性に関する重要度を算出す
る重要度算出ステップと、算出された重要度に基づい
て、各候補データのスコアを算出するスコア算出ステッ
プと、算出されたスコアに基づいて各候補データをラン
キングし、ランキングされた上位の候補データを検索結
果として出力する検索結果出力ステップと、を実行させ
ることを特徴とする。
【0031】また本発明は、未入力のプロファイル属性
値を推定するための検索方法のプログラムを提供する。
このプログラムは、コンピュータに、未入力の属性値を
含む1又は複数の属性値を指定した入力に基づいて、異
なる属性毎に固有の属性値を持つ属性値を含むプロファ
イルデータ群の中から類似する複数の候補データを検索
する候補データ検索ステップと、検索された候補データ
と非候補データに基づいて、属性に関する重要度を算出
する重要度算出ステップと、算出された重要度に基づい
て、各候補データのスコアを算出するスコア算出ステッ
プと、各候補データのスコアに応じて、入力属性値に対
する類似データを候補データの中から決定し、類似デー
タ中における未入力属性値の分布に基づいて、入力デー
タの未入力属性値を推定して出力する推定結果出力ステ
ップと、を実行させる。
【0032】ここで候補データ検索ステップ、重要度算
出ステップ、及びスコア算出ステップは、図1(A)の
情報検索方法と基本的に同じになる。
【0033】推定結果出力ステップは、推定した未入力
属性値に、各候補データのスコアに基づいて算出された
信頼度を付加して出力する。この信頼度は、例えば各候
補データの推定値を可とするスコアを総スコアで割った
値である。
【0034】本発明は、プロファイルデータ検索のため
のプログラムを格納したコンピュータ読取り可能な記録
媒体を提供する。この記録媒体のプログラムは、コンピ
ュータに、未入力の属性値を含む1又は複数の属性値を
指定した入力データに基づいて、異なる属性毎に固有の
属性値を持つプロファイルデータ群の中から類似する複
数の候補データを検索する候補データ検索ステップと、
検索された候補データと非候補データに基づいて、属性
に関する重要度を算出する重要度算出ステップと、算出
された重要度に基づいて、各候補データのスコアを算出
するスコア算出ステップと、算出されたスコアに基づい
て各候補データをランキングし、ランキングされた上位
の候補データを検索結果として出力する検索結果出力ス
テップと、を実行させることを特徴とする。
【0035】また本発明は、未知のプロファイル属性値
を推定するためのプログラムを格納したコンピュータ読
取り可能な記録媒体を提供する。この記録媒体のプログ
ラムは、コンピュータに、未入力の属性値を含む1又は
複数の属性値を指定した入力データに基づいて、異なる
属性毎に固有の属性値を持つ属性値を含むプロファイル
データ群の中から類似する複数の候補データを検索する
候補データ検索ステップと、検索された候補データと非
候補データに基づいて、属性に関する重要度を算出する
重要度算出ステップと、算出された重要度に基づいて、
各候補データのスコアを算出するスコア算出ステップ
と、各候補データのスコアに応じて、入力属性値に対す
る類似データを前記候補データの中から決定し、類似デ
ータ中における未入力属性値の分布に基づいて、入力デ
ータの未入力属性値を推定して出力する推定結果出力ス
テップと、を実行させる。
【0036】本発明は、プロファイルデータを検索する
ための情報検索装置を提供する。この検索装置は、異な
る属性毎に固有の属性値を持つプロファイルデータを複
数記憶しているデータ記憶部と、1又は複数の属性値を
指定した入力データに基づいて、データ記憶部に記憶さ
れているプロファイルデータ群の中から類似する複数の
候補データを検索する候補データ検索部と、検索された
候補データと非候補データに基づいて、属性に関する重
要度を算出する重要度算出部と、算出された重要度に基
づいて、各候補データのスコアを算出するスコア算出部
と、算出されたスコアに基づいて各候補データをランキ
ングし、前記ランキングされた上位の候補データを検索
結果として出力する検索結果出力部と、を備えたことを
特徴とする。
【0037】本発明は、未知のプロファイル属性値を推
定するための情報検索装置を提供する。この検索装置
は、異なる属性毎に固有の属性値を持つ属性値を含むプ
ロファイルデータを複数記憶しているデータ記憶部と、
未入力の属性値を含む1又は複数の属性値を指定した入
力データに基づいて、データ記憶部に記憶されているプ
ロファイルデータ群の中から類似する複数の候補データ
を検索する候補データ検索部と、検索された候補データ
と非候補データに基づいて、属性に関する重要度を算出
する重要度算出部と、算出された重要度に基づいて、各
候補データのスコアを算出するスコア算出部と、各候補
データのスコアに応じて、入力属性値に対する類似デー
タを候補データの中から決定し、類似データ中における
未入力属性値の分布に基づいて、入力テータの未入力属
性値を推定して出力する推定結果出力部と、を備えたこ
とを特徴とする。
【0038】
【発明の実施の形態】図2は、本発明によるプロファイ
ル情報の情報検索処理が適用される動作環境の説明図で
ある。
【0039】図2において、本発明の情報検索処理は、
プロファイル情報処理サーバ10で実行される。プロフ
ァイル情報処理サーバ10に対しては、インターネット
12を介して、ユーザ装置14や企業の管理者装置16
が接続される。
【0040】ユーザ装置14や管理者装置16は、イン
ターネット12を経由してプロファイル情報処理サーバ
10に対しユーザ、コンテンツ、サービス等に関するプ
ロファイル情報の検索要求や未知の属性値を推定するた
めの検索要求を行う。
【0041】プロファイル情報処理サーバ10に対して
は、ユーザ、コンテンツ、サービスなどの特徴を表わし
たプロファイルデータを格納したプロファイルデータ記
憶部18が接続されている。
【0042】プロファイル情報処理サーバ10は、ハー
ドウェア構成として、CPU20、メモリ22及びキャ
ッシュ24を備えている。メモリ22には本発明の情報
検索処理を実行するプログラムがロードされ、これをC
PU20で実行することにより、検索要求に伴う入力デ
ータに基づいたプロファイルデータの検索や未知の属性
値の推定を実行する。
【0043】図3は、プロファイルデータを検索する本
発明の情報検索装置として動作する図1のプロファイル
情報処理サーバ10の機能構成のブロック図である。
【0044】図3において、プロファイル情報処理サー
バ10には、データ記憶部18、候補データ検索部2
8、重要度算出部30、スコア算出部32及び検索結果
出力部34が設けられる。データ記憶部18に記憶され
ているプロファイルデータは、ユーザ、コンテンツ、サ
ービス等の特徴を属性情報で表現したものである。
【0045】図4は、データ記憶部18に記憶されてい
るプロファイルデータの具体例であり、企業における従
業員のプロファイルデータ38を例にとっている。この
従業員のプロファイルデータ38は、従業員番号、入社
年度、性別、所属、業務、資格、言語のそれぞれが属性
であり、これらの異なる属性ごとに固有の属性値を持っ
ている。
【0046】再び図3を参照するに、候補データ検索部
28は検索要求で指定された1または複数の属性値を含
む検索データ入力26に基づいて、データ記憶部18に
保存しているプロファイルデータ群の中から類似する複
数の候補データを検索する。ここで、候補データ検索部
28により検索されたプロファイルデータを候補データ
というのに対し、検索されなかったプロファイルデータ
を非候補データという。
【0047】重要度算出部30は、候補データ検索部2
8で検索された候補データと検索されなかった非候補デ
ータに基づいて、属性に関する重要度を算出する。この
属性に関する重要度は、検索された候補データと検索さ
れなかった非候補データにおける情報量の変化が大きな
属性ほど大きな重要度を取るように算出される。また重
要度算出部30は、属性ごとの重要度以外に、同じ属性
における異なる属性値間の重要度も算出することができ
る。
【0048】スコア算出部32は、重要度算出部30で
算出された重要度に基づいて各候補データのスコアを算
出する。この各候補データのスコアの算出にあっては、
重要度算出部30で算出されたスコアに候補データ検索
部28で算出されているスコアを加算してもよい即ち候
補データ検索部28における検索も、入力データ26で
指定されている検索のためのプロファイル属性値と検索
対象となっているデータ記憶部18のプロファイルデー
タのプロファイル属性値との間の類似度をスコアとして
算出し、高いスコアをもつプロファイルデータを候補デ
ータとして検索していることから、このとき算出されて
いるスコアを重要度算出部30で算出されたスコアに加
算することで、スコアを算出することもできる。
【0049】検索結果出力部34は、スコア算出部32
で算出されたスコアに基づくソートにより各候補データ
をランキングし、ランキングされた上位の候補データを
検索結果として決定し、検索結果出力36を行う。この
検索結果出力部34にあっては更に、観点別の検索結果
の出力や補助情報として検索結果にスコア算出部32で
算出された重要度を付加して出力する処理を行う。
【0050】観点別の検索結果の出力は、スコア算出部
32で算出された重要度の中で高い重要度をもつ属性を
観点として自動的に選別し、選別した観点の属性に含ま
れる異なる属性値ごとに各候補データを分類し、算出さ
れたスコアに基づいて属性値ごとに分類された各候補デ
ータをランキングして、上位の候補データを観点別の検
索結果として出力する。
【0051】次に図5のフローチャートを参照して図3
の情報検索処理の詳細を説明する。この図5における検
索処理のフローチャートは、本発明における情報検索処
理のプログラムの実行ステップを実現するものでもあ
る。
【0052】図5において、ステップS1で図2に示し
たユーザ装置14もしくは管理者装置16からの検索要
求に伴う入力データとしてプロファイル属性値を入力す
る。この検索要求の入力データとしての属性値は、例え
ば図6(A)の入力データ52のように、性別、業務、
資格の各属性について、検索に必要な特定の属性値を設
定したデータである。
【0053】次のステップS2では、既知の検索アルゴ
リズムを用いて、データ記憶部18のプロファイルデー
タ群の中から候補データを検索する。ここで検索される
候補データの数は、検索要求を行った利用者が指定した
検索件数分だけでもよいし、同じく利用者が指定した検
索の際に算出しているスコアの閾値で区切った数であっ
てもよい。
【0054】既知の検索アルゴリズムとしては任意のも
のが使用可能であるが、例えば次式で与えられる類似度
関数を用いてステップS2の候補データの検索を行うこ
とができる。
【0055】
【数1】 (1) ここで、mはプロファイル属性数; xiはxにおける属性 iの値; yiはyにおける属性 iの値; wiは属性iの重み; δは属性iが離散値属性である場合、xi= yi で0、xi=
yiで1、 更に xi又はyi の値が指定されていない場合は常に0; (属性 i が連続値属性である場合、連続値の差の絶対
値を0から1で正規化した値) この類似度関数を用いた候補データの検索を、図6
(A)の検索要求に伴う入力データ52と図6(B)
(C)のデータ記憶部18に保存しているユーザプロフ
ァイルデータ54,56を例にとって具体的に説明する
と、次のようになる。
【0056】図6(A)の入力データ52における属性
iは、性別をi=1、業務をi=2、資格をi=3とす
ると、それぞれの属性値はx1=男、x2=プログラミ
ング、x3=英検1級となる。
【0057】一方、図6(B)の検索対象となるユーザ
プロファイルデータ54にあっては、入力データ52の
属性に対応して同じ性別、業務、資格の属性を含んでい
ることから、この属性値をy1=男、y2=プログラミ
ング、y3=英検2級とする。
【0058】ここで(1)式における属性iの重みwi
は、属性iに依存せずに全て1で表わす。また検索の条
件として、利用者がスコア1以下を閾値として指定して
いたとする。
【0059】図6(B)のユーザプロファイルデータ5
4について(1)式の類似度関数の演算を行うと、3種
類の属性値について次の関係からδが決まる。
【0060】 x1=y1、δ=0 x2=y2、δ=0 x3=y3、δ=1 したがって、3つの属性値のδの総和で与えられる類似
度関数としてのスコアは、この場合、1となる。このよ
うにスコアSimの値が1であれば、利用者が指定した
スコアの閾値1以下を満足することから、ユーザプロフ
ァイルデータ54は候補データとして検索される。
【0061】次に図6(C)のユーザプロファイルデー
タ56について、同様にして類似度関数としてのスコア
を求める。この場合の属性値x1〜x3,y1〜y3に
対するδは次のようになる。
【0062】 x1=y1、δ=0 x2≠y2、δ=1 x3≠y3、δ=1 このため、3つの属性のδの総和で与えられるスコアS
imの値は2となり、閾値としてのスコア1以下でない
ことから、ユーザプロファイルデータ56は候補データ
として検索されない。
【0063】図7は本発明の検索処理における基本的な
概念を表わしている。利用者の検索要求に伴う入力デー
タ26に基づく図5のステップS2の検索により、プロ
ファイル情報処理サーバ10内では、例えば(1)式の
類似度関数を用いた既知の検索アルゴリズムの実行によ
り、プロファイルデータ全体40の中から斜線部で示す
候補データ42が検索されたことになる。この検索され
た候補データ42に対し、残りのプロファイルデータは
非候補データ44となる。
【0064】次に図5のステップS3で、ステップS2
で検索された候補データを用いて属性に関する重要度を
算出する。この重要度の算出は、図7の基本概念の説明
のように、データ記憶部18に記憶されている全てのプ
ロファイルデータ即ちプロファイルデータ全体40を使
用して属性に関する重要度を算出するのではなく、ステ
ップS2で検索された検索要求に伴う入力データ26の
プロファイル属性値に類似しているプロファイルデータ
である候補データ42を使用して属性に関する重要度を
算出するため、検索用のプロファイル属性値である入力
データ26に、より適合した重要度を算出することがで
きる。
【0065】また図5のステップS3におけるプロファ
イルデータの属性の重要度は、図7において、ステップ
S2で検索されたプロファイルデータである候補データ
42を正例、検索されなかった非候補データ44を負例
と見なして、各属性のインフォメーションゲインIGと
して計算される。
【0066】即ち、ある属性iの重要度IG(i)は次
式で算出される。
【0067】
【数2】 (2) ここで、Nはプロファイルデータの総数 Npは正例の総数 Nnは負例の総数 vjは、属性 iのとりうる値 N(i,vj)は属性 iの値がvjであるプロファイルデータの
総数 Np(i,vj)は属性 iの値がvjである正例の数 Nn(i,vj)は属性 iの値がvjである負例の数 この(2)式のインフォメーションゲインIGを使うこ
とにより、図7の基本概念における正例である候補デー
タ42と負例である非候補データ44での情報量の変化
が大きな属性が、大きな重要度をとるように算出するこ
とができる。
【0068】ここで(2)式のインフォメーションゲイ
ンIGを用いた属性の重要度の決定では、異なる2つの
属性の内どちらの属性が重要であるかを判断することが
できる。しかしながら、同じ属性における異なる2つの
属性値間の重要度を判断することはできない。
【0069】例えば属性「業務」が属性値として「プロ
グラミング」「システム開発」「経理」を持っていたと
する。この場合、インフォメーションゲインIGを用い
た属性の重要度では、異なる属性値の組み合せ、即ち
「プログラミングとシステム開発」「プログラミングと
経理」はいずれもマッチせず、同じスコアをとる。
【0070】しかしながら、属性値「プログラミング」
は、属性値「経理」よりも属性値「システム開発」によ
り近いと思われる。このような同じ属性に含まれる異な
る属性値間の重要度は、MVDM(Modified Value Diff
erence Metric)と呼ばれる次式の値を用いることで判断
することができる。
【0071】
【数3】 (3) ここで、v1, v2は属性値 V1, V2はそれぞれv1, v2が出現するプロファイルデータ
数 v1p, v2pはv1, v2が出現する正例の数 v1n, v2nはv1, v2が出現する負例の数 更に図5のステップS3における連続値を持つ属性に関
しては、連続値を離散化することで(2)式のインフォ
メーションゲインIGやMVDMを直接利用することが
できる。
【0072】次に図5のステップS4では、ステップS
3で算出された属性に関する重要度を使用して、ステッ
プS2で検索された各候補データのスコアを算出する。
このスコアの算出は、ステップS3で算出された重要度
がインフォメーションゲインIGならば、(1)式の重
みwiに(2)式のインフォメーションゲインIG
(i)を代入して類似度関数を求め、この類似度関数を
候補データのスコアとする。
【0073】一方、ステップS3で算出された重要度が
MVDMならば、次の類似度関数をスコアとする。
【0074】
【数4】 (4) またステップS4のスコアの算出にあっては、重要度を
用いて各候補データについて算出したスコアにステップ
S2の候補データの検索の際に算出しているスコアを加
算したスコアを、各候補データのスコアとすることもで
きる。
【0075】更にステップS4でスコアの計算対象とな
るプロファイルデータは、ステップS2において検索さ
れた図7の基本概念における候補データ42だけとな
る。一般にステップS2で検索される候補データの数は
データ記憶部18に記憶されているプロファイルデータ
全数よりも少ないため、これによってステップS4にお
けるスコア計算の負担を低く抑えることができる。
【0076】一方、ステップS4で算出される重要度を
用いたスコアを計算する場合、ステップS2で検索され
なかった非候補データのスコアが、検索された候補デー
タよりも良いスコアを持つことがあり得る。
【0077】そこで、多少スコア計算に余分な時間がか
かっても、ステップS2で検索されなかった非候補デー
タについても検索を行いたい場合には、ステップS4の
スコア計算を図7における候補データ42に加え、非候
補データ44即ちプロファイルデータ全体40を対象に
行うこともできる。
【0078】続いて図5のステップS5で、観点別のプ
ロファイルデータの検索が指定されているか否か判定す
る。ここで観点別のプロファイルデータの検索とは、ス
テップS3で算出された重要度において、重要度の高い
特定のプロファイル属性における属性値ごとに候補デー
タを分類して、各属性値を観点としてプロファイルデー
タの検索結果を出力することを意味する。
【0079】ステップS5で観点別の出力が指定されて
いない場合には、ステップS6に進み、ステップS4で
算出されたスコアに応じて各候補データをソートしてラ
ンキングし、例えば上位指定件数の候補データを出力プ
ロファイルデータとして決定する。ここで上位指定件数
の代わりにスコアの閾値を利用者に指定してもらい、指
定した閾値以上となるスコアの候補データを、出力する
プロファイルデータとして決定してもよい。
【0080】一方、ステップS5で観点別出力が指定さ
れている場合には、ステップS7に進む。ステップS7
にあっては、ステップS4で算出された各属性の重要度
の中から重要度の高い特定の属性を選別し、選別された
属性における各属性値ごとに候補データを分類し、分類
した候補データごとにステップS4で算出されたスコア
に応じてソートすることでランキングし、上位指定件数
もしくは指定閾値のスコアにより、出力するプロファイ
ルデータを各属性値ごとの観点別に決定する。
【0081】このような観点別でのプロファイルデータ
の検索の実現は、利用者に検索結果の理解を容易にさせ
ることができ、希望する検索結果を利用者が得るための
時間を短縮できる。
【0082】図8はステップS7における観点別の検索
出力の処理の具体例である。いま図8(A)のプロファ
イル属性値をもつ入力データ58が与えられ、これに対
し図8(B)(C)(D)のユーザプロファイルデータ
60,62,64が候補データとして検索され、ステッ
プS3で算出された重要度について、例えば属性「言
語」が非常に大きな重要度を持っていたとすると、これ
が観点の対象となる属性として選択される。
【0083】そして選択された属性「言語」における属
性値「Java(R)」、「C++」及び「COBO
L」の各々を観点として、図8(B)〜(D)のような
観点別の検索結果を決定することができる。
【0084】この検索結果において、ユーザプロファイ
ルデータ60,62は入力データ58で指定された条件
を全て満足するが、利用者においてプログラム言語とし
て「Java(R)」が必要であればユーザプロファイ
ルデータ60の従業員が要求を満足すると判断できる。
【0085】一方、プログラム言語として「C++」が
必要であればユーザプロファイルデータ62の従業員と
判断することができる。このため観点別の検索結果の出
力によって、利用者にとっては、利用者が希望する検索
結果を得るための負担を大幅に低減することができる。
【0086】次に図5のステップS8において、検索要
求を行った利用者が補助情報の付加を指定しているか否
かを判定する。補助情報の付加を指定していない場合に
はステップS10に進み、検索結果をそのまま出力す
る。一方、補助情報の付加を指定していた場合にはステ
ップS9に進み、ステップS3で算出された属性に関す
る重要度を補助情報として付加した後に、ステップS1
0でプロファイルデータを出力する。
【0087】図9はステップS9で補助情報として付加
する重要度の例であり、例えば図9(A)の入力データ
58に対し、図9(B)のユーザプロファイルデータが
検索結果として決定された場合、利用者が補助情報の付
加を指定していることで、検索結果として出力するユー
ザプロファイルデータ62の属性である性別、業務及び
資格のそれぞれの属性値に「0.1」、「0.6」、
「0.9」といったステップS3で算出された重要度6
6−1,66−2,66−3を付加している。
【0088】このように検索結果としてのプロファイル
データの各属性に重要度を付加することにより、利用者
は検索結果の理解を、付加された重要度を見ることで容
易に行うことができる。
【0089】図10は、未知のプロファイル属性値を推
定する本発明の情報検索装置を構成する図2のプロファ
イル情報処理サーバ10の機能構成のブロック図であ
る。
【0090】この実施形態においてプロファイル情報処
理サーバ10は、データ記憶部18、候補データ検索部
28、重要度算出部30、スコア算出部32及び推定結
果出力部34を備える。この内、データ記憶部18、候
補データ検索部28、重要度算出部68及びスコア算出
部32は、図3の実施形態と基本的に同じになる。
【0091】即ち、データ記憶部18には図4に示した
ようなプロファイルデータが保存されている。候補デー
タ検索部28は検索要求に伴う未入力の属性値を含む1
または複数のプロファイル属性値を指定した入力データ
26に基づいて、データ記憶部18のプロファイルデー
タ群の中から類似する複数の候補データを検索する。
【0092】重要度算出部30は、候補データ検索部2
8で検索された候補データと検索されていない非候補デ
ータに基づいて、属性に関する重要度を算出する。スコ
ア算出部は、重要度算出部30で算出された重要度に基
づいて各候補データのスコアを算出する。
【0093】推定結果出力部68は、スコア算出部32
で算出された各候補データのスコアに応じて、入力属性
値に対する類似データを候補データの中から決定し、こ
の類似プロファイルデータ中における未知の属性値の分
布に基づいて、入力データにおける未入力のプロファイ
ル属性に関する属性値を推定して出力する。
【0094】図11は、図10の実施形態における属性
値推定処理のフローチャートであり、同時に属性値推定
処理を実行するプログラムの処理手順を表わしている。
【0095】図11において、属性値推定処理のステッ
プS1〜S4は、図5のステップS1〜S4と同じであ
る。次のステップS5では、ステップS4で算出したス
コアに応じて上位指定件数または指定した閾値以上のス
コアをもつ候補データを入力データに対する類似プロフ
ァイルデータとして決定し、この類似プロファイルデー
タにおける未入力属性値の分布に基づいて、検索要求を
行った入力データの中の未入力属性値の推定を行う。
【0096】図12は、ステップS5における未入力の
推定処理の具体例である。いま電子商取引の分野におい
て、あるユーザがある商品を買うかどうかを推定する問
題を考える。この場合、図12(A)のように入力デー
タ72として、あるユーザのプロファイルデータが与え
られたとする。
【0097】この入力データ72としてのプロファイル
データは、「職業」「興味音楽ジャンル」「興味本ジャ
ンル」が既知の入力属性値として与えられ、未知の入力
属性値としての「ISBN−xxx」という本を買うか
否かの問題である。
【0098】この入力データ72に対し、ステップS5
の処理で類似プロファイルデータとして選出されたもの
の中で「ISBN−xxx」という本を買う人と買わな
い人の分布を算出し、買う人の方が多ければ、入力デー
タとして与えられたユーザは本「ISBN−xxx」を
買うと推定し、少なければ買わないと推定する。
【0099】ここで未入力属性値の推定において、類似
プロファイルデータの中の未入力属性値の分布だけでは
なく、ステップS4で算出されたスコアも加味して推定
を行うと、推定の精度向上が期待できる。
【0100】例えば図12(A)の入力データ72に対
して、図12(B)のスコアを加味した類似プロファイ
ルデータ分布74が得られたとする。この場合、類似プ
ロファイルデータ分布74の中の未入力属性値「ISB
N−xxx」の分布は買わない方が多いため、ステップ
S5では買わないと推定してしまう。
【0101】しかし、スコアを見ると、高いスコアをも
つプロファイルデータでは「買う」、低いスコアをもつ
プロファイルデータでは「買わない」が分布しているこ
とが分かる。この場合、推定の指標として未入力属性値
「ISBN−xxx」のスコアによる重み付け分布を採
用すると、推定精度の向上が期待できる。
【0102】即ち、図12(B)の例では 買う=1.0+0.8=1.8 買わない=0.5+0.4+0.3=1.2 が指標となり、「買わない」よりも「買う」という値の
方が高いので、「買う」と推定することができる。
【0103】続いて図11のステップS6では、ステッ
プS5で推定した値に対し補助情報の付加指定があるか
否か判定する。ステップS6で補助情報の付加が指定さ
れた場合には、ステップS7で、推定する未入力属性値
に信頼度を例えば図12(C)のように付加する。この
信頼度は、ステップS5で求めた「買う」「買わない」
の値の分布やスコアによる重み付け分布の値を使用す
る。
【0104】例えば信頼度として重み付け分布の値を使
用する場合には、推定値「買う」に信頼度として 60%=100×1.8/3.0 を付加し、推定値「買わない」に、信頼度として 40%=100×1.2/3.0 を付加する。この信頼度の付加により、利用者は推定結
果の判断を容易に行うことができる。
【0105】図13は、本発明による情報検索処理を実
行するプログラムを格納したコンピュータ読取り可能な
記録媒体についての実施形態である。即ち、図5のフロ
ーチャートに示したプロファイルデータ検索処理のため
のプログラム、及び図11に示した属性値推定処理のた
めのプログラムを格納した記録媒体としては、図13の
例のようにCD−ROM82やフレキシブルディスク8
0などの可搬型記録媒体86だけではなく、ネットワー
ク上にある記憶装置88の記録媒体やコンピュータのハ
ードディスクやRAMなどの記憶媒体のいずれであって
もよく、プログラム90の実行時にはコンピュータ92
にローディングされ、その主メモリ上で実行される。
【0106】なお上記の実施形態は、情報検索処理の動
作環境として本発明の情報検索及び属性値推定処理をサ
ーバ上で行っているが、サーバまたはクライアント側に
独立に配置してもよいし、一部の機能をサーバ側に配置
し残りの機能をクライアント側に配置するようにしても
よい。
【0107】また上記の実施形態は付随する図面に関連
して説明したが、本発明はこれらの実施形態そのものに
限定されるものではなく、本発明の範囲または趣旨から
逸脱することのない様々な他の変更及び変形を含む。更
に本発明は上記の実施形態に示した数値による限定は受
けない。
【0108】(付記) (付記1)属性値を指定した入力データに基づいて、異
なる属性毎に固有の属性値を持つプロファイルデータ群
の中から類似する複数の候補データを検索する候補デー
タ検索ステップと、前記検索された候補データと非候補
データに基づいて、属性に関する重要度を算出する重要
度算出ステップと、前記算出された重要度に基づいて、
前記各候補データのスコアを算出するスコア算出ステッ
プと、前記算出されたスコアに基づいて各候補データを
ランキングし、前記ランキングされた上位の候補データ
を検索結果として出力する検索結果出力ステップと、を
備えたことを特徴とするプロファイル情報の情報検索方
法。(1)
【0109】(付記2)付記1記載のプロファイル情報
の情報検索方法に於いて、前記候補データ検索ステップ
は、各プロファイルデータにつきスコアを求めて候補デ
ータを検索し、前記スコア算出ステップは、前記候補デ
ータ検索ステップで求められたスコアを前記重要度に基
づいて算出されたスコアに加算して前記各候補データの
スコアを算出することを特徴とするプロファイル情報の
情報検索方法。
【0110】(付記3)付記1記載のプロファイル情報
の情報検索方法に於いて、前記重要度算出ステップは、
前記候補データと非候補データに基づいて、異なる属性
毎の重要度を算出することを特徴とするプロファイル情
報の情報検索方法。
【0111】(付記4)付記3記載のプロファイル情報
の情報検索方法に於いて、前記重要度算出ステップは、
前記異なる属性毎の重要度として、インフォメーション
・ゲインを算出することを特徴とするプロファイル情報
の情報検索方法。
【0112】(付記5)付記4記載のプロファイル情報
の情報検索方法に於いて、前記スコア算出ステップは、
前記各候補データのスコアとして、前記インフォメーシ
ョン・ゲインを重みとして類似度を算出することを特徴
とするプロファイル情報の情報検索方法。
【0113】(付記6)付記1記載のプロファイル情報
の情報検索方法に於いて、前記重要度算出ステップは、
同じ属性に含まれる異なる属性値の間の重要度を算出す
ることを特徴とするプロファイル情報の情報検索方法。
【0114】(付記7)付記6記載のプロファイル情報
の情報検索方法に於いて、前記重要度算出ステップは、
前記異なる属性値の間の重要度として、MVDM(Modif
ied Value Difference Metric)を算出することを特徴と
するプロファイル情報の情報検索方法。
【0115】(付記8)付記7記載のプロファイル情報
の情報検索方法に於いて、前記スコア算出ステップは、
前記各候補データのスコアとして、前記MVDM(Modif
ied Value Difference Metric)を重みとして類似度を算
出することを特徴とするプロファイル情報の情報検索方
法。
【0116】(付記9)付記1記載のプロファイル情報
の情報検索方法に於いて、前記スコア算出ステップは、
更に、前記算出された重要度に基づいて、前記非候補デ
ータのスコアを算出し、検索結果出力ステップは、前記
算出されたスコアに基づいて各候補データ及び非候補デ
ータをランキングし、前記ランキングされた上位の候補
データを検索結果として出力することを特徴とするプロ
ファイル情報の情報検索方法。
【0117】(付記10)付記1記載のプロファイル情
報の情報検索方法に於いて、前記検索結果出力ステップ
は、ランキングされた上位所定数の候補データ、又は所
定の閾値以上のスコアを持つ候補データを前記検索結果
として出力することを特徴とするプロファイル情報の情
報検索方法。
【0118】(付記11)付記1記載のプロファイル情
報の情報検索方法に於いて、前記検索結果出力ステップ
は、前記検索結果として出力するプロファイルデータの
属性値に、前記算出された重要度を付加して出力するこ
とを特徴とするプロファイル情報の情報検索方法。
(2)
【0119】(付記12)付記1記載のプロファイル情
報の情報検索方法に於いて、前記検索結果出力ステップ
は、観点別の出力が設定されていた場合、前記算出され
た重要度の中の高い重要度を持つ属性を観点として選別
し、選別した観点の属性に含まれる異なる属性値毎に前
記各候補データを分類し、前記算出されたスコアに基づ
いて属性値毎に分類された各候補データをランキング
し、前記ランキングされた上位の候補データを観点別の
検索結果として出力することを特徴とするプロファイル
情報の情報検索方法。(3)
【0120】(付記13)未入力の属性値を含む属性値
を指定した入力データに基づいて、異なる属性毎に固有
の属性値を持つ属性値を含むプロファイルデータ群の中
から類似する複数の候補データを検索する候補データ検
索ステップと、前記検索された候補データと非候補デー
タに基づいて、属性に関する重要度を算出する重要度算
出ステップと、前記算出された重要度に基づいて、前記
各候補データのスコアを算出するスコア算出ステップ
と、前記各候補データのスコアに応じて、前記入力属性
値に対する類似データを前記候補データの中から決定
し、前記類似データ中における未入力属性値の分布に基
づいて、前記入力データの未入力属性値を推定して出力
する推定結果出力ステップと、を備えたことを特徴とす
るプロファイル情報の情報検索方法。(4)
【0121】(付記14)付記13記載のプロファイル
情報の情報検索方法に於いて、前記候補データ検索ステ
ップは、各プロファイルデータにつきスコアを求めて候
補データを検索し、前記スコア算出ステップは、前記候
補データ検索ステップで求められたスコアを前記重要度
に基づいて算出されたスコアに加算して前記各候補デー
タのスコアを算出することを特徴とするプロファイル情
報の情報検索方法。
【0122】(付記15)付記13記載のプロファイル
情報の情報検索方法に於いて、前記重要度算出ステップ
は、前記候補データと非候補データに基づいて、異なる
属性毎の重要度を算出することを特徴とするプロファイ
ル情報の情報検索方法。
【0123】(付記16)付記15記載のプロファイル
情報の情報検索方法に於いて、前記重要度算出ステップ
は、前記異なる属性毎の重要度として、インフォメーシ
ョン・ゲインを算出することを特徴とするプロファイル
情報の情報検索方法。
【0124】(付記17)付記16記載のプロファイル
情報の情報検索方法に於いて、前記スコア算出ステップ
は、前記各候補データのスコアとして、前記インフォメ
ーション・ゲインを重みとして類似度を算出することを
特徴とするプロファイル情報の情報検索方法。
【0125】(付記18)付記13記載のプロファイル
情報の情報検索方法に於いて、前記重要度算出ステップ
は、同じ属性に含まれる異なる属性値の間の重要度を算
出することを特徴とするプロファイル情報の情報検索方
法。(5)
【0126】(付記19)付記18記載のプロファイル
情報の情報検索方法に於いて、前記重要度算出ステップ
は、前記異なる属性値の間の重要度として、MVDM(M
odified Value Difference Metric)を算出することを特
徴とするプロファイル情報の情報検索方法。
【0127】(付記20)付記19記載のプロファイル
情報の情報検索方法に於いて、前記スコア算出ステップ
は、前記各候補データのスコアとして、前記MVDM(M
odified Value Difference Metric)を重みとして類似度
を算出することを特徴とするプロファイル情報の情報検
索方法。
【0128】(付記21)付記13記載のプロファイル
情報の情報検索方法に於いて、前記推定結果出力ステッ
プは、前記推定した未入力属性値に、前記各候補データ
のスコアに基づいて算出された信頼度を付加して出力す
ることを特徴とするプロファイル情報の情報検索方法。
(6)
【0129】(付記22)付記21記載のプロファイル
情報の情報検索方法に於いて、前記推定結果出力ステッ
プは、前記信頼度は、前記各候補データの推定値を可と
するスコアを総スコアで割った値であることを特徴とす
るプロファイル情報の情報検索方法。
【0130】(付記23)コンピュータに、属性値を指
定した入力データに基づいて、異なる属性毎に固有の属
性値を持つプロファイルデータ群の中から類似する複数
の候補データを検索する候補データ検索ステップと、前
記検索された候補データと非候補データに基づいて、属
性に関する重要度を算出する重要度算出ステップと、前
記算出された重要度に基づいて、前記各候補データのス
コアを算出するスコア算出ステップと、前記算出された
スコアに基づいて各候補データをランキングし、前記ラ
ンキングされた上位の候補データを検索結果として出力
する検索結果出力ステップと、を実行させることを特徴
とするプログラム。(7)
【0131】(付記24)付記23記載のプログラムに
於いて、前記候補データ検索ステップは、各プロファイ
ルデータにつきスコアを求めて候補データを検索し、前
記スコア算出ステップは、前記候補データ検索ステップ
で求められたスコアを前記重要度に基づいて算出された
スコアに加算して前記各候補データのスコアを算出する
ことを特徴とするプログラム。
【0132】(付記25)付記23記載のプログラムに
於いて、前記重要度算出ステップは、前記候補データと
非候補データに基づいて、異なる属性毎の重要度を算出
することを特徴とするプログラム。
【0133】(付記26)付記25記載のプログラムに
於いて、前記重要度算出ステップは、前記異なる属性毎
の重要度として、インフォメーション・ゲインを算出す
ることを特徴とするプログラム。
【0134】(付記27)付記26記載のプログラムに
於いて、前記スコア算出ステップは、前記各候補データ
のスコアとして、前記インフォメーション・ゲインを重
みとして類似度を算出することを特徴とするプログラ
ム。
【0135】(付記28)付記23記載のプログラムに
於いて、前記重要度算出ステップは、同じ属性に含まれ
る異なる属性値の間の重要度を算出することを特徴とす
るプログラム。
【0136】(付記29)付記28記載のプログラムに
於いて、前記重要度算出ステップは、前記異なる属性値
の間の重要度として、MVDM(Modified Value Differ
ence Metric)を算出することを特徴とするプログラム。
【0137】(付記30)付記29記載のプログラムに
於いて、前記スコア算出ステップは、前記各候補データ
のスコアとして、前記MVDM(Modified Value Differ
ence Metric)を重みとして類似度を算出することを特徴
とするプログラム。
【0138】(付記31)付記23記載のプログラムに
於いて、前記スコア算出ステップは、更に、前記算出さ
れた重要度に基づいて、前記非候補データのスコアを算
出し、検索結果出力ステップは、前記算出されたスコア
に基づいて各候補データ及び非候補データをランキング
し、前記ランキングされた上位の候補データを検索結果
として出力することを特徴とするプログラム。
【0139】(付記32)付記23記載のプログラムに
於いて、前記検索結果出力ステップは、ランキングされ
た上位所定数の候補データ、又は所定の閾値以上のスコ
アを持つ候補データを前記検索結果として出力すること
を特徴とするプログラム。
【0140】(付記33)付記23記載のプログラムに
於いて、前記検索結果出力ステップは、前記検索結果と
して出力するプロファイルデータの属性値に、前記算出
された重要度を付加して出力することを特徴とするプロ
グラム。
【0141】(付記34)付記23記載のプログラムに
於いて、前記検索結果出力ステップは、観点別の出力が
指定されていた場合、前記算出された重要度の中の高い
重要度を持つ属性を観点として選別し、選択した観点の
属性に含まれる異なる属性値毎に前記各候補データを分
類し、前記算出されたスコアに基づいて属性値毎に分類
された各候補データをランキングし、前記ランキングさ
れた上位の候補データを観点別の検索結果として出力す
ることを特徴とするプログラム。
【0142】(付記35)コンピュータに、未入力の属
性値を含む属性値を指定した入力データに基づいて、異
なる属性毎に固有の属性値を持つ属性値を含むプロファ
イルデータ群の中から類似する複数の候補データを検索
する候補データ検索ステップと、前記検索された候補デ
ータと非候補データに基づいて、属性に関する重要度を
算出する重要度算出ステップと、前記算出された重要度
に基づいて、前記各候補データのスコアを算出するスコ
ア算出ステップと、前記各候補データのスコアに応じ
て、前記入力属性値に対する類似データを前記候補デー
タの中から決定し、前記類似データ中における未入力属
性値の分布に基づいて、前記入力データの未入力属性値
を推定して出力する推定結果出力ステップと、を実行さ
せることを特徴とするプログラム。(8)
【0143】(付記36)付記35記載のプログラムに
於いて、前記候補データ検索ステップは、各プロファイ
ルデータにつきスコアを求めて候補データを検索してお
り、前記スコア算出ステップは、前記候補データ検索ス
テップで求められたスコアを前記重要度に基づいて算出
されたスコアに加算して前記各候補データのスコアを算
出することを特徴とするプログラム。
【0144】(付記37)付記35記載のプログラムに
於いて、前記重要度算出ステップは、前記候補データと
非候補データに基づいて、異なる属性毎の重要度を算出
することを特徴とするプログラム。
【0145】(付記38)付記37記載のプログラムに
於いて、前記重要度算出ステップは、前記異なる属性毎
の重要度として、インフォメーション・ゲインを算出す
ることを特徴とするプログラム。
【0146】(付記39)付記38記載のプログラムに
於いて、前記スコア算出ステップは、前記各候補データ
のスコアとして、前記インフォメーション・ゲインを重
みとして類似度を算出することを特徴とするプログラ
ム。
【0147】(付記40)付記35記載のプログラムに
於いて、前記重要度算出ステップは、同じ属性に含まれ
る異なる属性値の間の重要度を算出することを特徴とす
るプログラム。
【0148】(付記41)付記40記載のプログラムに
於いて、前記重要度算出ステップは、前記異なる属性値
の間の重要度として、MVDM(Modified Value Differ
ence Metric)を算出することを特徴とするプログラム。
【0149】(付記42)付記41記載のプログラムに
於いて、前記スコア算出ステップは、前記各候補データ
のスコアとして、前記MVDM(Modified Value Differ
ence Metric)を重みとして類似度を算出することを特徴
とするプログラム。
【0150】(付記43)付記35記載のプログラムに
於いて、前記推定結果出力ステップは、前記推定した未
入力属性値に、前記各候補データのスコアに基づいて算
出された信頼度を付加して出力することを特徴とするプ
ログラム。
【0151】(付記44)付記35記載のプログラムに
於いて、前記推定結果出力ステップは、前記信頼度は、
前記各候補データの推定値を可とするスコアを総スコア
で割った値であることを特徴とするプログラム。
【0152】(付記45)コンピュータに、属性値を指
定した入力データに基づいて、異なる属性毎に固有の属
性値を持つプロファイルデータ群の中から類似する複数
の候補データを検索する候補データ検索ステップと、前
記検索された候補データと非候補データに基づいて、属
性に関する重要度を算出する重要度算出ステップと、前
記算出された重要度に基づいて、前記各候補データのス
コアを算出するスコア算出ステップと、前記算出された
スコアに基づいて各候補データをランキングし、前記ラ
ンキングされた上位の候補データを検索結果として出力
する検索結果出力ステップと、を実行させるプログラム
を格納したことを特徴とするコンピュータ読取り可能な
記録媒体。(9)
【0153】(付記46)コンピュータに、未入力属性
値を含む属性値を指定した入力データ基づいて、異なる
属性毎に固有の属性値を持つ属性値を含むプロファイル
データ群の中から類似する複数の候補データを検索する
候補データ検索ステップと、前記検索された候補データ
と非候補データに基づいて、属性に関する重要度を算出
する重要度算出ステップと、前記算出された重要度に基
づいて、前記各候補データのスコアを算出するスコア算
出ステップと、前記各候補データのスコアに応じて、前
記入力属性値に対する類似データを前記候補データの中
から決定し、前記類似データ中における未入力属性値の
分布に基づいて、前記入力データの未入力属性値を推定
して出力する推定結果出力ステップと、を実行させるプ
ログラムを格納したことを特徴とするコンピュータ読取
り可能な記録媒体。
【0154】(付記47)異なる属性毎に固有の属性値
を持つプロファイルデータを複数記憶しているデータ記
憶部と、属性値を指定した入力データに基づいて、前記
データ記憶部に記憶されているプロファイルデータ群の
中から類似する複数の候補データを検索する候補データ
検索部と、前記検索された候補データと非候補データに
基づいて、属性に関する重要度を算出する重要度算出部
と、前記算出された重要度に基づいて、前記各候補デー
タのスコアを算出するスコア算出部と、前記算出された
スコアに基づいて各候補データをランキングし、前記ラ
ンキングされた上位の候補データを検索結果として出力
する検索結果出力部と、を備えたことを特徴とする情報
検索装置。(10)
【0155】(付記48)異なる属性毎に固有の属性値
を持つ属性値を含むプロファイルデータを複数記憶して
いるデータ記憶部と、未入力属性値を含む属性値を指定
した入力データに基づいて、前記データ記憶部に記憶さ
れているプロファイルデータ群の中から類似する複数の
候補データを検索する候補データ検索部と、前記検索さ
れた候補データと非候補データに基づいて、属性に関す
る重要度を算出する重要度算出部と、前記算出された重
要度に基づいて、前記各候補データのスコアを算出する
スコア算出部と、前記各候補データのスコアに応じて、
前記入力属性値に対する類似データを前記候補データの
中から決定し、前記類似データ中における未入力属性値
の分布に基づいて、前記入力データの未入力属性値を推
定して出力する推定結果出力部と、を備えたことを特徴
とする情報検索装置。
【0156】
【発明の効果】以上説明してきたように本発明によれ
ば、検索要求に伴う入力データとして与えられるプロフ
ァイル属性値に基づいて、一度粗い検索を実行して候補
データと非候補データに分け、この検索結果を用いて属
性に関する重要度を算出して重み付けすることで、各候
補データのスコアを求め、スコアによるランキングで上
位の候補データを検索結果とて出力することにより、入
力データとして与えられるプロファイル属性値に適合し
たユーザ、コンテンツ、サービスなどのプロファイルデ
ータの検索、更に高精度な未入力属性値の推定を行うこ
とができる。
【0157】また本発明にあっては、入力データとして
検索のためのプロファイル属性値が与えられて初めて、
保持しているプロファイルデータ群を対象に候補データ
の検索を実行し、検索された候補データと非候補データ
を用いて属性に関する重要度を算出してスコアを求める
ため、プロファイルデータを検索対象となるデータ記憶
部に保存するだけで、プロファイルデータの変化に即座
に対応した検索や未入力属性値の推定を実現することが
できる。
【0158】更に本発明によれば、検索結果として算出
された重要度の高い属性を検索出力のための観点として
自動的に抽出し、抽出した属性における各属性値を観点
として、観点ごとに検索結果を分類して提示することが
でき、更にまた検索結果や推定結果に有用な補助情報を
付加することができ、これによって利用者が検索結果や
推定結果についての判断を容易に行うことができ、利用
者が希望する結果を得るための負担を大幅に削減するこ
とができる。
【図面の簡単な説明】
【図1】本発明の原理構成の説明図
【図2】本発明が適用される動作環境の説明図
【図3】プロファイルデータを検索する本発明の情報検
索装置の機能構成のブロック図
【図4】本発明で検索対象とするプロファイルデータの
説明図
【図5】図3の機能構成による本発明の検索処理のフロ
ーチャート
【図6】候補データの検索に用いる入力データと検索対
象となるプロファイルデータの説明図
【図7】本発明の検索処理による基本概念の説明図
【図8】入力データと観点別出力となるプロファイルデ
ータの説明図
【図9】重要度を付加して出力されるプロフアイルデー
タの説明図
【図10】未知のプロファイル属性値を推定する本発明
の情報検索装置の機能構成のブロック図
【図11】図10の機能構成による本発明の属性値推定
処理のフローチャート
【図12】属性値推定処理の入力データ、類似プロファ
イルデータ分布及び信頼度を付加した推定結果の説明図
【図13】本発明におけるプログラムを格納した記録媒
体の説明図
【符号の説明】
10:プロファイル情報処理サーバ 12:インターネット 14:ユーザ装置 16:管理者装置 18:プロファイルデータ記憶部 20:CPU 22:メモリ 24:キャッシュ 26:データ入力 28:候補データ検索部 30:重要度算出部 32:スコア算出部 34:検索結果出力部 36:検索結果出力 38,54,56,60.62,64:ユーザプロファ
イルデータ 40:プロファイルデータ全体 42:候補データ(正例) 44:非候補データ(負例) 46:真の類似データ 52,58,72:検索入力データ 66−1〜66−3:重要度 68:推定結果出力部 70:未知属性値出力
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成14年4月1日(2002.4.1)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】0034
【補正方法】変更
【補正内容】
【0034】本発明は、プロファイルデータ検索のため
のプログラムを格納したコンピュータ読取り可能な記録
媒体を提供する。この記録媒体のプログラムは、コンピ
ュータに、性値を指定した入力データに基づいて、異
なる属性毎に固有の属性値を持つプロファイルデータ群
の中から類似する複数の候補データを検索する候補デー
タ検索ステップと、検索された候補データと非候補デー
タに基づいて、属性に関する重要度を算出する重要度算
出ステップと、算出された重要度に基づいて、各候補デ
ータのスコアを算出するスコア算出ステップと、算出さ
れたスコアに基づいて各候補データをランキングし、ラ
ンキングされた上位の候補データを検索結果として出力
する検索結果出力ステップと、を実行させることを特徴
とする。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 佐藤 陽 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内 (72)発明者 安藤 剛寿 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内 Fターム(参考) 5B075 ND20 ND34 NK06 QM08 UU06 UU08 UU40

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】属性値を指定した入力データに基づいて、
    異なる属性毎に固有の属性値を持つプロファイルデータ
    群の中から類似する複数の候補データを検索する候補デ
    ータ検索ステップと、 前記検索された候補データと非候補データに基づいて、
    属性に関する重要度を算出する重要度算出ステップと、 前記算出された重要度に基づいて、前記各候補データの
    スコアを算出するスコア算出ステップと、 前記算出されたスコアに基づいて各候補データをランキ
    ングし、前記ランキングされた上位の候補データを検索
    結果として出力する検索結果出力ステップと、を備えた
    ことを特徴とするプロファイル情報のプロファイル情報
    の情報検索方法。
  2. 【請求項2】請求項1記載のプロファイル情報の情報検
    索方法に於いて、前記検索結果出力ステップは、前記検
    索結果として出力するプロファイルデータの属性値に、
    前記算出された重要度を付加して出力することを特徴と
    するプロファイル情報の情報検索方法。
  3. 【請求項3】請求項1記載のプロファイル情報の情報検
    索方法に於いて、前記検索結果出力ステップは、観点別
    の出力が設定されていた場合、前記算出された重要度の
    中の高い重要度を持つ属性を観点として選別し、選別し
    た観点の属性に含まれる異なる属性値毎に前記各候補デ
    ータを分類し、前記算出されたスコアに基づいて属性値
    毎に分類された各候補データをランキングし、前記ラン
    キングされた上位の候補データを観点別の検索結果とし
    て出力することを特徴とするプロファイル情報の情報検
    索方法。
  4. 【請求項4】未入力の属性値を含む属性値を指定した入
    力データに基づいて、異なる属性毎に固有の属性値を持
    つ属性値を含むプロファイルデータ群の中から類似する
    複数の候補データを検索する候補データ検索ステップ
    と、 前記検索された候補データと非候補データに基づいて、
    属性に関する重要度を算出する重要度算出ステップと、 前記算出された重要度に基づいて、前記各候補データの
    スコアを算出するスコア算出ステップと、 前記各候補データのスコアに応じて、前記入力属性値に
    対する類似データを前記候補データの中から決定し、前
    記類似データ中における未入力属性値の分布に基づい
    て、前記入力データの未入力属性値を推定して出力する
    推定結果出力ステップと、を備えたことを特徴とするプ
    ロファイル情報の情報検索方法。
  5. 【請求項5】請求項13記載のプロファイル情報の情報
    検索方法に於いて、前記重要度算出ステップは、同じ属
    性に含まれる異なる属性値の間の重要度を算出すること
    を特徴とするプロファイル情報の情報検索方法。
  6. 【請求項6】請求項13記載のプロファイル情報の情報
    検索方法に於いて、前記推定結果出力ステップは、前記
    推定した未入力属性値に、前記各候補データのスコアに
    基づいて算出された信頼度を付加して出力することを特
    徴とするプロファイル情報の情報検索方法。
  7. 【請求項7】コンピュータに、 属性値を指定した入力データに基づいて、異なる属性毎
    に固有の属性値を持つプロファイルデータ群の中から類
    似する複数の候補データを検索する候補データ検索ステ
    ップと、 前記検索された候補データと非候補データに基づいて、
    属性に関する重要度を算出する重要度算出ステップと、 前記算出された重要度に基づいて、前記各候補データの
    スコアを算出するスコア算出ステップと、 前記算出されたスコアに基づいて各候補データをランキ
    ングし、前記ランキングされた上位の候補データを検索
    結果として出力する検索結果出力ステップと、を実行さ
    せることを特徴とするプログラム。
  8. 【請求項8】コンピュータに、 未入力の属性値を含む属性値を指定した入力データに基
    づいて、異なる属性毎に固有の属性値を持つ属性値を含
    むプロファイルデータ群の中から類似する複数の候補デ
    ータを検索する候補データ検索ステップと、 前記検索された候補データと非候補データに基づいて、
    属性に関する重要度を算出する重要度算出ステップと、 前記算出された重要度に基づいて、前記各候補データの
    スコアを算出するスコア算出ステップと、 前記各候補データのスコアに応じて、前記入力属性値に
    対する類似データを前記候補データの中から決定し、前
    記類似データ中における未入力属性値の分布に基づい
    て、前記入力データの未入力属性値を推定して出力する
    推定結果出力ステップと、を実行させることを特徴とす
    るプログラム。
  9. 【請求項9】コンピュータに、 属性値を指定した入力データに基づいて、異なる属性毎
    に固有の属性値を持つプロファイルデータ群の中から類
    似する複数の候補データを検索する候補データ検索ステ
    ップと、 前記検索された候補データと非候補データに基づいて、
    属性に関する重要度を算出する重要度算出ステップと、 前記算出された重要度に基づいて、前記各候補データの
    スコアを算出するスコア算出ステップと、 前記算出されたスコアに基づいて各候補データをランキ
    ングし、前記ランキングされた上位の候補データを検索
    結果として出力する検索結果出力ステップと、を実行さ
    せるプログラムを格納したことを特徴とするコンピュー
    タ読取可能な記録媒体。
  10. 【請求項10】異なる属性毎に固有の属性値を持つプロ
    ファイルデータを複数記憶しているデータ記憶部と、 属性値を指定した入力データに基づいて、前記データ記
    憶部に記憶されているプロファイルデータ群の中から類
    似する複数の候補データを検索する候補データ検索部
    と、 前記検索された候補データと非候補データに基づいて、
    属性に関する重要度を算出する重要度算出部と、 前記算出された重要度に基づいて、前記各候補データの
    スコアを算出するスコア算出部と、 前記算出されたスコアに基づいて各候補データをランキ
    ングし、前記ランキングされた上位の候補データを検索
    結果として出力する検索結果出力部と、を備えたことを
    特徴とする情報検索装置。
JP2001379851A 2001-12-13 2001-12-13 プロファイル情報の情報検索方法、プログラム、記録媒体及び装置 Expired - Fee Related JP4011906B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2001379851A JP4011906B2 (ja) 2001-12-13 2001-12-13 プロファイル情報の情報検索方法、プログラム、記録媒体及び装置
US10/102,773 US6915295B2 (en) 2001-12-13 2002-03-22 Information searching method of profile information, program, recording medium, and apparatus
EP02252514A EP1320041A3 (en) 2001-12-13 2002-04-08 Searching profile information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001379851A JP4011906B2 (ja) 2001-12-13 2001-12-13 プロファイル情報の情報検索方法、プログラム、記録媒体及び装置

Publications (2)

Publication Number Publication Date
JP2003186907A true JP2003186907A (ja) 2003-07-04
JP4011906B2 JP4011906B2 (ja) 2007-11-21

Family

ID=19187001

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001379851A Expired - Fee Related JP4011906B2 (ja) 2001-12-13 2001-12-13 プロファイル情報の情報検索方法、プログラム、記録媒体及び装置

Country Status (3)

Country Link
US (1) US6915295B2 (ja)
EP (1) EP1320041A3 (ja)
JP (1) JP4011906B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006190127A (ja) * 2005-01-07 2006-07-20 Sony Corp 情報処理装置および方法、並びにプログラム
WO2006095409A1 (ja) * 2005-03-07 2006-09-14 Mars Flag Corporation 情報検索装置,コンピュータプログラム及び記憶媒体
JP2009517750A (ja) * 2005-12-01 2009-04-30 ユーシーエル ビジネス ピーエルシー 情報検索
JP2012115446A (ja) * 2010-11-30 2012-06-21 Canon Inc 診断支援装置、診断支援装置の制御方法、およびプログラム
JP2020095637A (ja) * 2018-12-14 2020-06-18 カルチュア・コンビニエンス・クラブ株式会社 会員に他の会員を紹介する装置、方法、およびプログラム
JP2022505237A (ja) * 2018-10-18 2022-01-14 オラクル・インターナショナル・コーポレイション コンテンツアイテム推奨をランク付けするための技術

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002207669A (ja) * 2001-01-12 2002-07-26 Fujitsu Ltd 情報配信装置及び記録媒体
US8719284B2 (en) * 2002-12-18 2014-05-06 International Business Machines Corporation Method, system and program product for filtering an entry of data items
CA2468481A1 (en) * 2003-05-26 2004-11-26 John T. Forbis Multi-position rail for a barrier
US7769759B1 (en) * 2003-08-28 2010-08-03 Biz360, Inc. Data classification based on point-of-view dependency
US9492245B2 (en) 2004-02-27 2016-11-15 Align Technology, Inc. Method and system for providing dynamic orthodontic assessment and treatment profiles
US7904308B2 (en) 2006-04-18 2011-03-08 Align Technology, Inc. Method and system for providing indexing and cataloguing of orthodontic related treatment profiles and options
US7519595B2 (en) * 2004-07-14 2009-04-14 Microsoft Corporation Method and system for adaptive categorial presentation of search results
US20080320002A1 (en) * 2004-09-21 2008-12-25 Koninklijke Philips Electronics, N.V. Method of Providing Information
US20070189544A1 (en) 2005-01-15 2007-08-16 Outland Research, Llc Ambient sound responsive media player
US20060195361A1 (en) * 2005-10-01 2006-08-31 Outland Research Location-based demographic profiling system and method of use
US20060161621A1 (en) * 2005-01-15 2006-07-20 Outland Research, Llc System, method and computer program product for collaboration and synchronization of media content on a plurality of media players
US7489979B2 (en) * 2005-01-27 2009-02-10 Outland Research, Llc System, method and computer program product for rejecting or deferring the playing of a media file retrieved by an automated process
US20060229058A1 (en) * 2005-10-29 2006-10-12 Outland Research Real-time person-to-person communication using geospatial addressing
US20060173828A1 (en) * 2005-02-01 2006-08-03 Outland Research, Llc Methods and apparatus for using personal background data to improve the organization of documents retrieved in response to a search query
US20060173556A1 (en) * 2005-02-01 2006-08-03 Outland Research,. Llc Methods and apparatus for using user gender and/or age group to improve the organization of documents retrieved in response to a search query
US20060179056A1 (en) * 2005-10-12 2006-08-10 Outland Research Enhanced storage and retrieval of spatially associated information
US20060179044A1 (en) * 2005-02-04 2006-08-10 Outland Research, Llc Methods and apparatus for using life-context of a user to improve the organization of documents retrieved in response to a search query from that user
US20060253210A1 (en) * 2005-03-26 2006-11-09 Outland Research, Llc Intelligent Pace-Setting Portable Media Player
US20060223637A1 (en) * 2005-03-31 2006-10-05 Outland Research, Llc Video game system combining gaming simulation with remote robot control and remote robot feedback
US20060256008A1 (en) * 2005-05-13 2006-11-16 Outland Research, Llc Pointing interface for person-to-person information exchange
US20060223635A1 (en) * 2005-04-04 2006-10-05 Outland Research method and apparatus for an on-screen/off-screen first person gaming experience
US20060241864A1 (en) * 2005-04-22 2006-10-26 Outland Research, Llc Method and apparatus for point-and-send data transfer within an ubiquitous computing environment
US20060256007A1 (en) * 2005-05-13 2006-11-16 Outland Research, Llc Triangulation method and apparatus for targeting and accessing spatially associated information
US20060259574A1 (en) * 2005-05-13 2006-11-16 Outland Research, Llc Method and apparatus for accessing spatially associated information
US20060271286A1 (en) * 2005-05-27 2006-11-30 Outland Research, Llc Image-enhanced vehicle navigation systems and methods
US20060186197A1 (en) * 2005-06-16 2006-08-24 Outland Research Method and apparatus for wireless customer interaction with the attendants working in a restaurant
US8176101B2 (en) 2006-02-07 2012-05-08 Google Inc. Collaborative rejection of media for physical establishments
US7577522B2 (en) * 2005-12-05 2009-08-18 Outland Research, Llc Spatially associated personal reminder system and method
US20070083323A1 (en) * 2005-10-07 2007-04-12 Outland Research Personal cuing for spatially associated information
US8090725B1 (en) 2006-01-13 2012-01-03 CareerBuilder, LLC Method and system for matching data sets of non-standard formats
US8375026B1 (en) 2006-01-13 2013-02-12 CareerBuilder, LLC Method and system for matching data sets of non-standard formats
US8103679B1 (en) 2006-01-13 2012-01-24 CareerBuilder, LLC Method and system for matching data sets of non-standard formats
US8843381B2 (en) * 2006-04-18 2014-09-23 Align Technology, Inc. Automated method and system for case matching assessment based on geometrical evaluation of stages in treatment plan
SE0600866L (sv) * 2006-04-20 2007-10-21 Valeryd Invest Ab Ett söksystem samt ett sökförfarande
US7921106B2 (en) * 2006-08-03 2011-04-05 Microsoft Corporation Group-by attribute value in search results
US20080228699A1 (en) * 2007-03-16 2008-09-18 Expanse Networks, Inc. Creation of Attribute Combination Databases
US20090043752A1 (en) * 2007-08-08 2009-02-12 Expanse Networks, Inc. Predicting Side Effect Attributes
US7917438B2 (en) * 2008-09-10 2011-03-29 Expanse Networks, Inc. System for secure mobile healthcare selection
US20100076950A1 (en) * 2008-09-10 2010-03-25 Expanse Networks, Inc. Masked Data Service Selection
US20100063830A1 (en) * 2008-09-10 2010-03-11 Expanse Networks, Inc. Masked Data Provider Selection
US8200509B2 (en) * 2008-09-10 2012-06-12 Expanse Networks, Inc. Masked data record access
US8255403B2 (en) * 2008-12-30 2012-08-28 Expanse Networks, Inc. Pangenetic web satisfaction prediction system
US8386519B2 (en) * 2008-12-30 2013-02-26 Expanse Networks, Inc. Pangenetic web item recommendation system
US20100169262A1 (en) * 2008-12-30 2010-07-01 Expanse Networks, Inc. Mobile Device for Pangenetic Web
US20100169313A1 (en) * 2008-12-30 2010-07-01 Expanse Networks, Inc. Pangenetic Web Item Feedback System
US8108406B2 (en) 2008-12-30 2012-01-31 Expanse Networks, Inc. Pangenetic web user behavior prediction system
US20100169338A1 (en) * 2008-12-30 2010-07-01 Expanse Networks, Inc. Pangenetic Web Search System
US20130144865A1 (en) * 2011-12-06 2013-06-06 Martina Rothley Managing electronic procurement transactions using an optimized search tool
US9245428B2 (en) 2012-08-02 2016-01-26 Immersion Corporation Systems and methods for haptic remote control gaming
US9922120B2 (en) * 2012-08-24 2018-03-20 Microsoft Technology Licensing, Llc Online learning of click-through rates on federated search results
CN104035980B (zh) * 2014-05-26 2017-08-04 王和平 一种面向结构化医药信息的检索方法和系统
US10698914B2 (en) * 2015-03-31 2020-06-30 Microsoft Technology Licensing, Llc Query-by-example for finding similar people
US11158012B1 (en) 2017-02-14 2021-10-26 Casepoint LLC Customizing a data discovery user interface based on artificial intelligence
US10740557B1 (en) 2017-02-14 2020-08-11 Casepoint LLC Technology platform for data discovery
US11275794B1 (en) * 2017-02-14 2022-03-15 Casepoint LLC CaseAssist story designer
WO2021229662A1 (ja) * 2020-05-11 2021-11-18 日本電気株式会社 判定装置、判定方法および記録媒体

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5758257A (en) * 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US6460036B1 (en) * 1994-11-29 2002-10-01 Pinpoint Incorporated System and method for providing customized electronic newspapers and target advertisements
US6356879B2 (en) 1998-10-09 2002-03-12 International Business Machines Corporation Content based method for product-peer filtering
US6363381B1 (en) * 1998-11-03 2002-03-26 Ricoh Co., Ltd. Compressed document matching
US6289340B1 (en) * 1999-08-03 2001-09-11 Ixmatch, Inc. Consultant matching system and method for selecting candidates from a candidate pool by adjusting skill values
US6385620B1 (en) * 1999-08-16 2002-05-07 Psisearch,Llc System and method for the management of candidate recruiting information
JP3840021B2 (ja) 1999-12-27 2006-11-01 株式会社東芝 移動無線端末
US20020062258A1 (en) * 2000-05-18 2002-05-23 Bailey Steven C. Computer-implemented procurement of items using parametric searching
US20020046074A1 (en) * 2000-06-29 2002-04-18 Timothy Barton Career management system, method and computer program product
US6681223B1 (en) * 2000-07-27 2004-01-20 International Business Machines Corporation System and method of performing profile matching with a structured document
US20020103793A1 (en) * 2000-08-02 2002-08-01 Daphne Koller Method and apparatus for learning probabilistic relational models having attribute and link uncertainty and for performing selectivity estimation using probabilistic relational models
US7164885B2 (en) * 2000-12-18 2007-01-16 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for selective service access
US6767213B2 (en) * 2001-03-17 2004-07-27 Management Research Institute, Inc. System and method for assessing organizational leadership potential through the use of metacognitive predictors
US6728706B2 (en) * 2001-03-23 2004-04-27 International Business Machines Corporation Searching products catalogs
US7080052B2 (en) * 2001-04-19 2006-07-18 International Business Machines Corporation Method and system for sample data selection to test and train predictive algorithms of customer behavior
US20030009479A1 (en) * 2001-07-03 2003-01-09 Calvetta Phair Employment placement method
US20030117444A1 (en) * 2001-08-13 2003-06-26 Kamala Puram Data capture system and method

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006190127A (ja) * 2005-01-07 2006-07-20 Sony Corp 情報処理装置および方法、並びにプログラム
JP4543930B2 (ja) * 2005-01-07 2010-09-15 ソニー株式会社 情報処理装置および方法、並びにプログラム
US8805851B2 (en) 2005-01-07 2014-08-12 Sony Corporation Information processing apparatus, information processing method, and program
US9558243B2 (en) 2005-01-07 2017-01-31 Sony Corporation Information processing apparatus, information processing method, and program
US10592958B2 (en) 2005-01-07 2020-03-17 Sony Corporation Information processing apparatus, information processing method, and program
WO2006095409A1 (ja) * 2005-03-07 2006-09-14 Mars Flag Corporation 情報検索装置,コンピュータプログラム及び記憶媒体
JP2009517750A (ja) * 2005-12-01 2009-04-30 ユーシーエル ビジネス ピーエルシー 情報検索
JP2012115446A (ja) * 2010-11-30 2012-06-21 Canon Inc 診断支援装置、診断支援装置の制御方法、およびプログラム
JP2022505237A (ja) * 2018-10-18 2022-01-14 オラクル・インターナショナル・コーポレイション コンテンツアイテム推奨をランク付けするための技術
JP7411651B2 (ja) 2018-10-18 2024-01-11 オラクル・インターナショナル・コーポレイション コンテンツアイテム推奨をランク付けするための技術
JP2020095637A (ja) * 2018-12-14 2020-06-18 カルチュア・コンビニエンス・クラブ株式会社 会員に他の会員を紹介する装置、方法、およびプログラム

Also Published As

Publication number Publication date
JP4011906B2 (ja) 2007-11-21
US6915295B2 (en) 2005-07-05
EP1320041A3 (en) 2005-07-20
EP1320041A2 (en) 2003-06-18
US20030115193A1 (en) 2003-06-19

Similar Documents

Publication Publication Date Title
JP2003186907A (ja) プロファイル情報の情報検索方法、プログラム、記録媒体及び装置
US7636713B2 (en) Using activation paths to cluster proximity query results
US9317533B2 (en) Adaptive image retrieval database
Sontag et al. Probabilistic models for personalizing web search
US7630976B2 (en) Method and system for adapting search results to personal information needs
US7853599B2 (en) Feature selection for ranking
US7818279B2 (en) Event detection based on evolution of click-through data
US8504584B1 (en) Systems and methods for providing search query refinements
CN109033101B (zh) 标签推荐方法及装置
US20130110829A1 (en) Method and Apparatus of Ranking Search Results, and Search Method and Apparatus
US20100185623A1 (en) Topical ranking in information retrieval
JP2005302041A (ja) キーワードとWebサイトのコンテンツとの間の関連性の検証
CN110147421B (zh) 一种目标实体链接方法、装置、设备及存储介质
JP2005302042A (ja) マルチセンスクエリについての関連語提案
CA3059929C (en) Text searching method, apparatus, and non-transitory computer-readable storage medium
JPWO2010026900A1 (ja) 関係性発見装置、関係性発見方法および関係性発見プログラム
US11941073B2 (en) Generating and implementing keyword clusters
JPWO2007088576A1 (ja) ファイル検索プログラム、方法及び装置
CN113312523B (zh) 字典生成、搜索关键字推荐方法、装置和服务器
CN115601103A (zh) 一种物品信息展示方法和装置
CN114610859A (zh) 基于内容与协同过滤的产品推荐方法、装置及设备
US20090327265A1 (en) Relevance score in a paid search advertisement system
JP5388988B2 (ja) 広告選択装置、方法及びプログラム
JP2005025465A (ja) 文書検索方法及び文書検索装置
CN107423298B (zh) 一种搜索方法和装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040823

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070529

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070719

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070814

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070906

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4011906

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100914

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100914

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110914

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120914

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120914

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130914

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees