JP2001265808A - 情報検索システム及び情報検索方法 - Google Patents

情報検索システム及び情報検索方法

Info

Publication number
JP2001265808A
JP2001265808A JP2000081037A JP2000081037A JP2001265808A JP 2001265808 A JP2001265808 A JP 2001265808A JP 2000081037 A JP2000081037 A JP 2000081037A JP 2000081037 A JP2000081037 A JP 2000081037A JP 2001265808 A JP2001265808 A JP 2001265808A
Authority
JP
Japan
Prior art keywords
content
user profile
feature vector
user
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000081037A
Other languages
English (en)
Inventor
Yasuo Hirooka
康雄 廣岡
Takao Terano
隆雄 寺野
Yukichi Otsuka
雄吉 大塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SKYSOFT Inc
Original Assignee
SKYSOFT Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SKYSOFT Inc filed Critical SKYSOFT Inc
Priority to JP2000081037A priority Critical patent/JP2001265808A/ja
Publication of JP2001265808A publication Critical patent/JP2001265808A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 有益性と意外性とを兼ね備えた書籍を探し当
てて顧客に推薦する。 【解決手段】 顧客が過去に購入した各書籍のキーワー
ド・ベクトルをカテゴリ別に合成して顧客プロファイル
を生成する。また、書籍データベースを基にして、各書
籍毎にキーワード・ベクトルを生成する。そして、同じ
カテゴリ間、並びに異なるカテゴリ間の双方の組み合わ
せで、顧客プロファイルのキーワード・ベクトルと未購
入の各書籍のキーワード・ベクトルの類似度を計算する
ことで、有益性と意外性の双方の観点から書籍を検索す
ることができる。類似度の高い未購入書籍をリコメンド
する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、膨大な情報コンテ
ンツの中からユーザの要求に合致したコンテンツを探し
出すための情報検索システム及び方法に係り、特に、ユ
ーザの趣味・嗜好や過去の探索履歴などのユーザ・プロ
ファイル情報に基づいて所望のコンテンツの探索を行う
情報検索システム及び方法に関する。
【0002】更に詳しくは、本発明は、インターネット
上で商品販売などのビジネスを行う場合に顧客が望む商
品を探し当ててリコメンドするために利用可能な情報検
索システム及び方法に係り、特に、書籍販売などのよう
に、顧客が有益性と意外性を兼ね備えた商品を求めるよ
うな商品販売ビジネスにおいて適用される情報検索シス
テム及び方法に関する。
【0003】
【従来の技術】昨今における半導体製造その他の工業技
術の向上に伴い、パーソナル・コンピュータ(PC)を
始めとして比較的低廉な計算システムを市場で提供する
ことが可能となってきた。計算機システムは、企業や研
究機関のオフィスや一般家庭に至るまで、広範に普及し
てきている。さらに、計算機システム同士を相互接続す
るネットワーク・コンピューティング技術に対する要望
も高まってきている。ネットワーク上では、各ユーザ同
士で、ファイルやプリンタなどのコンピュータ資源を共
有したり、情報の共有・流通・配布・交換などの協働的作
業を円滑に行うことができる。
【0004】コンピュータ同士を相互接続するネットワ
ークの形態は様々である。例えば、イーサネット(登録
商標)やトークンリングのような局所に敷設されたLA
N(Local Area Network)や、LAN同士を専用線など
で相互接続して構成されるWAN(Wide Area Networ
k)、さらには、ネットワーク同士の相互接続を繰り返
し行った結果として文字通り世界規模のネットワークへ
成長を遂げた「インターネット」(The Internet)など
様々である。
【0005】インターネットは、各大学や研究機関等に
設置されたサーバが自主的に相互接続を繰り返した結
果、巨大ネットワークへと成長するに至った。インター
ネット上のサーバ同士は、通常、TCP/IP(Transm
ission Control Protocol/Internet Protocol)ベース
で相互接続されている。
【0006】インターネット上では、WWW(World Wi
de Web)、News、TELNET(TELetypewriter N
ETwork)、FTP(File Transfer Protocol)、Gop
herなど、TCP/IPネットワーク上で動作する多
数のサービスが公開されている。特に、WWWは、ハイ
パーリンク構造の情報空間を提供する広域情報検索シス
テムであり、インターネットの爆発的な成長や急速な普
及を遂げる最大の要因ともなっている。
【0007】WWWはクライアント−サーバ型で構築さ
れる。WWWサーバは、HTTPデーモンと呼ばれるサ
ーバ・ソフトウェアを稼動し、HTML形式で記述され
た情報資源を格納し、及び/又は、該資源を提供するコ
ンピュータ・システムである。WWWサーバは、HTM
Lドキュメントを始めとする情報資源を、インターネッ
ト上で有償又は無償で公開する。TCP/IPに従え
ば、これらの情報資源は、URL(Uniform Resource L
ocator)という形式の識別子によって特定される。HT
MLドキュメントは、他の情報資源とのリンク関係を含
むことができるが、リンク情報もURL形式で指定され
る。
【0008】他方のWWWクライアントは、「WWWブ
ラウザ」又は「HTMLブラウザ」と呼ばれるユーザ・
エージェントを用いて動作するコンピュータである。米
Netscape Communications社の"Netscape Navigator"
や、米Microsoft社の"Internet Explorer"がWWWブラ
ウザの代表例である。
【0009】WWWクライアント・ユーザは、ブラウザ
画面上の場所ボックスに資源識別子としてのURL文字
列を記入することによって、所望の情報資源を指定する
ことができる。WWWブラウザは、通常、HTTP(Hy
per Text Transfer Protocol)プロトコルに従ってWW
Wサーバ上の情報資源へのアクセスすなわち情報資源の
取り出しを行う。さらに、WWWブラウザは、取得した
HTMLドキュメントを解析して、ブラウザ・ウィンド
ウ画面上で、その内容を表示する(すなわちホームペー
ジをブラウザ画面上で組み立てる)。ブラウザ画面に表
示されたWWWページ上では、リンク情報は「アンカ
ー」として表示される。ユーザはアンカーをクリックす
ることで、次の参照先である情報資源を順次指定するこ
とができる。すなわち、ユーザは、WWWブラウザ画面
を介して、インターネット上でハイパーリンクが張り巡
らされたWWW情報資源空間を探索し、多様な情報資源
に次々と継ぎ目なくアクセスすることができる(周
知)。WWWは、対話入力による簡単な操作で情報検索
を行うことができる、先進的なユーザ・インターフェー
スを備えている。
【0010】インターネットの普及率は既に高く、大学
など各種研究機関、企業のオフィス、一般家庭などに深
く浸透している。現在、インターネットは、単なる情報
配信のみならず、さまざまな商取引の手段として利用さ
れている。いわゆる「インターネット・ビジネス」と呼
ばれる商品流通・販売システムである。
【0011】例えば、コンピュータ・ソフトウェアや音
楽・映像コンテンツなどのデジタル情報は、インターネ
ット経由で配信することができる。このような場合、C
DやDVDなど記録メディアで販売する際に必要とされ
る商品の流通経路や販売路をほとんど省略することがで
きる。
【0012】また、旧来の通信販売に対してインターネ
ット・ビジネスを適用した場合、1ヶ所のWebサイト
上にカタログに相当するデータ・コンテンツをアップロ
ードしておくだけで、商品情報を世界中に瞬間的に配信
することができる。この結果、チラシやカタログなどの
印刷媒体を配布したり郵送したりする手間やコストを節
約することができる。商品情報の即時性があり、商品の
売買契約を円滑且つ迅速に成立させることができる。
【0013】インターネット上で商品情報を配信するこ
とにより、遠隔地に埋もれた消費者又は商品需要を比較
的容易に発掘することができる。商品販売業者側にとっ
ては、商品棚に並べる程の出荷高が見込まれないような
少量商品であっても、各地に散在する消費者に対してピ
ンポイントで販売することができる。また、一般消費者
側からすれば、輸入品や洋書など最寄の商店には取り扱
われておらず割高感のある商品であっても、供給業者を
容易に探し出し、低コストで購入することができる。言
い換えれば、店舗の敷居が格段と低くなる。
【0014】インターネット・ビジネスは、情報の即時
性に優れている。また、他の利点として、商品販売のた
めのショー・ケースのような物理的な手段をほとんど必
要とせず、商品販売及び販売促進に要するイニシャル・
コストが低いことが挙げられる。インターネット・ビジ
ネスの発達により、消費者の立場は強まり、商品選択の
幅が大きく拡張されたと言われている。さらに、料金の
支払いにセキュアな電子決済を採り入れることにより、
商品販売のほとんど全工程をネットワーク経由の遠隔操
作によって機械化・自動化することができる。
【0015】インターネット・ビジネスでは、基本的に
は、WWWのようなインタラクティブで先進的なユーザ
・インターフェースを介して取引を行うことができる。
また、インターネット・ビジネスを展開する企業では、
顧客とインタラクティブに結ばれているという点を活か
して、顧客毎にコンテンツやサービスをカスタマイズす
るパーソナライズ化が志向されている。
【0016】しかしながら、顧客毎に個別の対応を行う
ことは、WWWや電子メールにおける既存の技術で実現
可能である一方、顧客毎に適切なコンテンツを準備した
り推薦することは容易ではない。このような課題に対し
ては、自動的に推薦情報を生成する「リコメンダー・シ
ステム」が期待されている。
【0017】例えば、インターネット上で洋書などの書
籍販売を行うようなビジネスに対してリコメンダー・シ
ステムを適用することにより、各読者に対して好みに応
じた新刊書を提供することができ、顧客サービスを拡充
するとともに、売上の増大にもつながる。
【0018】リコメンダー・システムには、従来より、
「コンテンツ分析方式」及び「協調フィルタリング方
式」と呼ばれる2方式が存在している。
【0019】コンテンツ分析方式とは、リコメンド対象
となるコンテンツの特徴表現とユーザ興味表現であるユ
ーザ・プロファイルの比較を行うことにより、ユーザの
興味により近いコンテンツを選択して、リコメンドする
方法である。洋書販売に適用する場合、コンテンツの特
徴表現は、各書籍のタイトル、著者名、ジャンル、キー
ワードなどからなる書籍データベースとして蓄積され
る。また、ユーザ・プロファイルは、ユーザの趣味や特
技などのプロファイルの他、過去の書籍購買履歴や探索
履歴で構成される。
【0020】コンテンツ分析のために、情報検索分野の
周知技術を適用することができる。例えば、重み付きタ
ームによるベクトル空間モデル[1] 型の検索のような、
コンテンツに関する特徴ベクトル同士を比較するような
分析手法を利用することができる。すなわち、N個のキ
ーワードの各々に対して座標軸を割り当てたN次元空間
上において、コンテンツ中での各キーワードの出現回数
に重み付け因子を掛けた座標値を持つベクトルすなわち
「キーワード・ベクトル」を求め、キーワード・ベクト
ル同士の類似度を基にして所望のコンテンツを検索する
ものである。類似度は、例えば、ベクトルの内積や距離
に基づいて求めることができる。
【0021】しかしながら、コンテンツ分析方式の欠点
として、次に挙げる2点が指摘されている[2]。 (1)検索対象とするコンテンツが、コンテンツ分析技
術に依存する。現状では、情報検索技術が適用できるテ
キスト・ドキュメントに制限される。
【0022】(2)ユーザが高く評価した情報に類似し
た情報ばかりが抽出される傾向がある。
【0023】特に、情報検索を洋書などの書籍のリコメ
ンデーションに利用する場合、以前に購入した書籍と類
似した内容のものばかりが常に好まれる訳ではない。そ
もそも読書は知的欲求に基づく行為であるから、ユーザ
(読者)の趣味・嗜好に合致するなど有益性があるだけ
ではなく、意外性や新規性のある書籍をリコメンドする
ことが好ましい。類似内容の書籍ばかりリコメンデーシ
ョンを繰り返すと、顧客はやがて飽きてしまう。したが
って、コンテンツ分析方式が持つ上記(2)の欠点は、
書籍販売ビジネスに適用する上で致命的になりかねな
い。
【0024】また、協調フィルタリング方式は、コンテ
ンツ分析を行わずに、複数のユーザ間でのコンテンツ評
価情報を分析することによってリコメンド情報を生成す
る方式である。まず、ユーザ間のコンテンツ評価情報を
比較することにより、類似した興味を持つ仲間をグルー
プ化する。そして、自分の仲間が高く評価したコンテン
ツのうち、自分が未評価のものがリコメンドされる。協
調フィルタリング方式は、NetPerceptions[3][4]に代表
される、いくつかの商用ソリューションにおいて既に採
用されている。
【0025】協調フィルタリング方式は、コンテンツ分
析を行わないために、対象とするコンテンツに制限がな
いという利点があり、テキスト・ドキュメント以外のほ
とんどすべてのメディアに対しても適用可能である。一
方で、協調フィルタリング方式の欠点としては、次に挙
げる4点が指摘されている[2]
【0026】(1)対象コンテンツの量に対して、充分
なユーザ数と評価情報数が必要になる。ユーザ数が不足
する場合には、カバレッジが狭くなり、すべてのコンテ
ンツのうち限られた一部しかリコメンド対象とすること
ができなくなる。また、特異な嗜好を持つユーザには仲
間が見つからない結果として、リコメンド自体が不能に
なるなどが懸念される。
【0027】(2)新しいコンテンツが登録されても、
誰かが評価するまではリコメンド対象にならない。
【0028】(3)コンテンツ分析を行わないため、内
容が類似しているがIDが異なるコンテンツの評価が高
いユーザ同士を仲間にすることができない。
【0029】(4)コンテンツ評価の誤入力が、他ユー
ザへのリコメンドに与える影響を排除することが困難で
ある。
【0030】書籍を対象にリコメンド・サービスを考察
した場合、基本的には、コンテンツ方式と協調フィルタ
リング方式のどちらも適用可能である。但し、上述した
ように各方式にはそれぞれ欠点があることから、次の点
が懸念される。
【0031】(1)コンテンツ分析方式では、リコメン
ドされる書籍が、顧客が過去に購入した書籍に類似した
ものばかりになる可能性が高い。類似内容の書籍ばかり
リコメンデーションを繰り返すと、顧客はやがて飽きて
しまう。
【0032】(2)協調フィルタリング方式では、書籍
販売では対象とするコンテンツ数が膨大であるため、リ
コメンド・サービスの対象となる顧客数も相当な規模で
なければ、質の高いサービスが期待できない。
【0033】
【発明が解決しようとする課題】本発明の目的は、膨大
な情報コンテンツの中からユーザの要求に合致したコン
テンツを探し出してリコメンドすることができる、優れ
た情報検索システム及び方法を提供することにある。
【0034】本発明の更なる目的は、ユーザの趣味・嗜
好や過去の探索履歴・購買履歴などのユーザプロファイ
ル情報に基づいて所望のコンテンツの探索しリコメンド
を行うことができる、優れた情報検索システム及び方法
を提供することにある。
【0035】本発明の更なる目的は、インターネット上
で商品販売などのビジネスを行う場合において、顧客が
期待する商品を探し当ててリコメンドすることができ
る、優れた情報検索システム及び方法を提供することに
ある。
【0036】本発明の更なる目的は、書籍販売などのよ
うに、顧客が有益性の他に意外性を求めるような商品を
探し当てリコメンドすることができる、優れた情報検索
システム及び方法を提供することにある。
【0037】
【課題を解決するための手段】本発明は、上記課題を参
酌してなされたものであり、その第1の側面は、多数の
コンテンツを含む情報空間の中からユーザが望むコンテ
ンツを検索する情報検索システム又は方法であって、前
記情報空間上の各コンテンツを所定数のコンテンツ・カ
テゴリに分類する分類手段又はステップと、前記情報空
間上の各コンテンツの特徴ベクトルを生成する特徴ベク
トル生成手段又はステップと、前記情報空間上の各コン
テンツを所定数のコンテンツ・カテゴリに分類する分類
手段又はステップと、ユーザが過去アクセスしたコンテ
ンツの特徴ベクトルを含むユーザ・プロファイルを生成
するユーザ・プロファイル生成手段又はステップと、各
コンテンツ・カテゴリ毎にユーザ・プロファイルとコン
テンツの特徴ベクトルを比較するベクトル比較手段又は
ステップと、前記比較の結果に基づいて、ユーザが望む
コンテンツを特定するコンテンツ特定手段又はステップ
と、を具備することを特徴とする情報検索システム又は
方法である。
【0038】但し、本発明に係る情報検索システム又は
方法において、書籍のようにあらかじめコンテンツ・カ
テゴリが規定されている商品を検索対象コンテンツとし
て取り扱う場合には、上記の分類手段又はステップを省
略して、既存のコンテンツ・カテゴリをそのまま利用し
てもよい。書籍カテゴリの一例は、BISAC(BookIn
dustry Systems Advisory Committee)が提供する" BIS
AC Subject Category"である。
【0039】本発明の第1の側面に係る情報検索システ
ム又は方法において、前記コンテンツは書籍などのテキ
スト・ドキュメントを含むコンテンツであってもよい。
このような場合、前記特徴ベクトル生成手段又はステッ
プは、N個のキーワードの各々に対して座標軸を割り当
てたN次元キーワード空間上において、コンテンツ中で
の各キーワードの出現頻度に重み付け因子を掛けた座標
値を持つキーワード・ベクトルを生成するようにしても
よい。
【0040】また、前記ユーザ・プロファイル生成手段
又はステップは、ユーザが過去アクセスした各コンテン
ツの特徴ベクトルをコンテンツ・カテゴリ毎に合成し
て、各コンテンツ・カテゴリ毎の特徴ベクトルからなる
ユーザ・プロファイルを生成するようにしてもよい。
【0041】また、前記ユーザ・プロファイル生成手段
又はステップにおいて、各コンテンツ・カテゴリ毎の特
徴ベクトルからなるユーザ・プロファイルを生成するよ
うな場合には、前記ベクトル比較手段又はステップは、
同一カテゴリ内でユーザ・プロファイルの特徴ベクトル
とコンテンツの特徴ベクトルを比較する(順マッチン
グ)ようにしてもよい。あるいは、前記ベクトル比較手
段又はステップは、異なるカテゴリ間でユーザ・プロフ
ァイルの特徴ベクトルとコンテンツの特徴ベクトルを比
較する(交差マッチング)ようにしてもよい。
【0042】また、前記コンテンツ特定手段又はステッ
プは、ユーザ・プロファイルと類似度の高いコンテンツ
をユーザが望むコンテンツとして特定して、ユーザにリ
コメンドするようにしてもよい。
【0043】また、前記コンテンツ特定手段又はステッ
プは、ユーザ・プロファイルと類似度の高いコンテンツ
のうちユーザが未アクセスのものをユーザが望むコンテ
ンツとして特定して、ユーザにリコメンドするようにし
てもよい。
【0044】また、本発明の第2の側面は、多数のコン
テンツを含む情報空間の中からユーザが望むコンテンツ
を検索する情報検索処理をコンピュータ・システム上で
実行せしめるためのコンピュータ・ソフトウェアをコン
ピュータ可読形式で格納するソフトウェア記憶媒体であ
って、前記コンピュータ・ソフトウェアは、前記情報空
間上の各コンテンツの特徴ベクトルを生成する特徴ベク
トル生成ステップと、前記情報空間上の各コンテンツを
所定数のコンテンツ・カテゴリに分類する分類ステップ
と、ユーザが過去アクセスしたコンテンツの特徴ベクト
ルを含むユーザ・プロファイルを生成するユーザ・プロ
ファイル生成ステップと、各コンテンツ・カテゴリ毎に
ユーザ・プロファイルとコンテンツの特徴ベクトルを比
較するベクトル比較ステップと、前記比較の結果に基づ
いて、ユーザが望むコンテンツを特定するコンテンツ特
定ステップと、を具備することを特徴とするソフトウェ
ア記憶媒体である。
【0045】
【作用】本発明に係る情報検索システム及び方法は、書
籍等のテキスト・ドキュメントからなるコンテンツの探
索やリコメンデーションなどに好適に適用することがで
きる。
【0046】本発明に係る情報検索システム及び方法で
は、顧客が過去に購入した各書籍の特徴ベクトルをカテ
ゴリ別に合成して、カテゴリ毎の特徴ベクトルからなる
顧客プロファイルを生成する。また、書籍データベース
を基にして、各書籍に対してキーワード・ベクトル空間
構成処理を実行することで、各書籍毎に特徴ベクトルを
生成する。
【0047】そして、顧客プロファイルの特徴ベクトル
と未購入の各書籍が持つ特徴ベクトルの類似度を計算し
て、類似度の高い未購入書籍をリコメンドする。同じカ
テゴリ間(順マッチング)、並びに異なるカテゴリ間
(交差マッチング)の各々の組み合わせで特徴ベクトル
の類似度計算を行うことで、有益性と意外性の双方の観
点から書籍を検索することができる。
【0048】本発明において取り扱う特徴ベクトルは、
例えば、テキスト・ドキュメントなどのコンテンツ中に
散在するキーワードの出現頻度を表現した「キーワード
・ベクトル」でよい。キーワード・ベクトルは、N個の
キーワードの各々に対して座標軸を割り当てたN次元キ
ーワード空間上において、コンテンツ中での各キーワー
ドの出現回数に重み付け因子を掛けた座標値を持つベク
トルのことである。
【0049】本発明に係る情報検索システム及び方法
は、コンテンツ分析方式を基調とするが、リコメンド情
報の幅を広げる工夫をすることにより、コンテンツ分析
方式の欠点を解消することができる。また、書籍販売の
ように対象コンテンツ数が非常に大きな業種において本
発明を適用することで、顧客規模が小さい場合にも、質
の高いリコメンド・サービスを提供可能にすることがで
きる。
【0050】本発明の第2の側面に係るソフトウェア記
憶媒体は、例えば、様々なプログラム・コードを実行可
能な汎用コンピュータ・システムに対して、コンピュー
タ・ソフトウェアをコンピュータ可読な形式で提供する
媒体である。このような媒体は、例えば、CD(Compac
t Disc)やFD(Floppy Disc)、MO(Magneto-Optic
al disc)などの着脱自在で可搬性の記憶媒体である。
【0051】このようなソフトウェア記憶媒体は、コン
ピュータ・システム上で所定のコンピュータ・ソフトウ
ェアの機能を実現するための、コンピュータ・ソフトウ
ェアと記憶媒体との構造上又は機能上の協働的関係を定
義したものである。換言すれば、本発明の第2の側面に
係るソフトウェア記憶媒体を介して所定のコンピュータ
・ソフトウェアをコンピュータ・システムにインストー
ルすることによって、コンピュータ・システム上では協
働的作用が発揮され、本発明の第1の側面に係る情報検
索システム又は方法と同様の作用効果を得ることができ
る。
【0052】本発明のさらに他の目的、特徴や利点は、
後述する本発明の実施例や添付する図面に基づくより詳
細な説明によって明らかになるであろう。
【0053】
【発明の実施の形態】本発明に係る情報検索システム
は、例えば書籍販売に適用して、膨大数の書籍の山から
各顧客が望む書籍を探し出してリコメンドすなわち購買
を推薦することができる。
【0054】図1には、本発明に係る情報検索システム
がリコメンド情報を生成する手順を図解している。
【0055】テキスト・ドキュメントを対象としたコン
テンツ分析型リコメンデーションでは、顧客興味の表現
である顧客プロファイルやコンテンツの特徴表現として
キーワード・ベクトルを用いるのが一般的であるが、本
発明に係る情報検索システムの場合も同様である。キー
ワード・ベクトルとは、N個のキーワードの各々に対し
て座標軸を割り当てたN次元空間上において、コンテン
ツ中での各キーワードの出現回数に重み付け因子を掛け
た座標値を持つN次元ベクトルのことである(前述)。
【0056】本情報検索システムでは、書籍情報(書籍
データベース)と顧客の購買履歴情報(購買履歴データ
ベース)とを用いて、顧客プロファイルのキーワード・
ベクトルを生成する。ここでは、顧客プロファイルのキ
ーワード・ベクトルは、顧客が過去に購入した各書籍の
キーワード・ベクトルをカテゴリ別に合成して生成され
るベクトルで構成される。購買履歴情報は、例えば、顧
客の会員識別子(ID)や、過去に購買した書籍の識別
子(ISBN:International Standard BookNunber)
などで構成される。
【0057】他方、書籍データベースを基にして、各書
籍に対してキーワード・ベクトル空間構成処理を実行す
ることで、各書籍毎にキーワード・ベクトルを生成する
ことができる。書籍データベースは、各書籍のタイト
ル、内容説明(要約/抄録など)、著者名、カテゴリな
どで構成される。
【0058】そして、顧客プロファイルのキーワード・
ベクトルと未購入の各書籍のキーワード・ベクトルの類
似度を計算する。類似度の高い未購入書籍を顧客に対し
てリコメンドすることができる。
【0059】次いで、顧客プロファイルの作成処理につ
いて詳解する。
【0060】本発明では、顧客が実際の書店で興味にあ
った書籍を探し出す行動は、図2に示すような書籍購買
行動モデルに従うことを仮定する。図示の通り、購入書
籍の決定に至るまでの行動は、興味分野にあった書棚を
選択する行動と、該当する書棚の書籍の背表紙や目次の
情報を利用して興味に沿った書籍を選択する行動の2つ
に大別される。それぞれの行動の特徴から、前者を「分
類型選択行動」と呼び、後者を「検索型選択行動」と呼
ぶことができる。
【0061】本発明に係る情報検索システムでは、図2
に示す書籍購買行動モデルに基づき、分類型選択行動に
相当する書籍カテゴリと、検索的選択行動の基準となる
キーワード・ベクトルという、2種類の顧客興味表現系
を採用する。
【0062】書籍カテゴリは、本発明に係る情報検索シ
ステムのためにゼロから構築してもよいし、既存の書籍
カテゴリを適用することも可能である。既存の書籍カテ
ゴリとしては、例えば、BISAC(Book Industry Sy
stems Advisory Committee)が提供する" BISAC Subjec
t Category "を挙げることができる。BISAC SubjectCat
egory では、Art、Business & Economics、Cooking、Co
mputersなどの49種類のカテゴリに分類している。
【0063】図3には、BISAC Subject Categoryを用
いて、顧客の書籍購買カテゴリ数を調べたグラフを示し
ている。複数の書籍を購入した人ほど複数のカテゴリに
またがって書籍を購入している場合が多く、一般書籍に
対する興味の幅は非常に広い、という傾向があることを
理解できるであろう。
【0064】WWW(World Wide Web)を始めとする各
種の情報検索システムが充実したインターネット上で書
籍販売ビジネスを行う場合、ユーザすなわち顧客が自ら
販売サイトにアクセスして、目的の書籍を検索するのが
一般的である。検索には、書籍タイトル、著者名、出版
社やキーワードなどが用いられる。複数のカテゴリに興
味を持っている顧客の場合、検索する書籍カテゴリ毎に
まったく異なるキーワードを使い分けるであろうこと
は、容易に想像できる。
【0065】したがって、顧客興味を表現する顧客プロ
ファイルを作成する場合にも、顧客の興味の幅が広い場
合には、複数のキーワード・ベクトルを作成する必要が
あると思料される。
【0066】本発明に係る情報検索システムでは、書籍
カテゴリを顧客興味の単位と仮定して、購買書籍カテゴ
リ別の複数のキーワード・ベクトルにより顧客プロファ
イルを構成するようにした。
【0067】具体的な顧客プロファイルとしては、キー
ワード・ベクトルを用いる。キーワード・ベクトルと
は、N個のキーワードの各々に対して座標軸を割り当て
たN次元キーワード空間上において、コンテンツ中での
各キーワードの出現回数に重み付け因子を掛けた座標値
を持つベクトルのことである(前述)。
【0068】書籍データベース上の項目から、書籍の特
徴を代表する項目として、タイトル、内容説明、著者、
サブカテゴリ(49分類をさらに詳細に約3,700に
分類したもの)を用いて、キーワード・ベクトルを構成
する。一般には、タイトルや内容説明といったテキスト
形式のデータ中の語句をキーワードとして利用するが、
著者やサブカテゴリの情報も1つのキーワードとしてベ
クトル中に含めるようにしてもよい。
【0069】本実施例では、顧客プロファイルは、書籍
カテゴリ毎のキーワード・ベクトルで構成される。図4
には、顧客プロファイルのキーワード・ベクトル作成処
理手順を図解している。まず、書籍毎にキーワード・ベ
クトルを付与する。次いで、この顧客が過去に購買した
各書籍のキーワード・ベクトルを、書籍カテゴリ毎に合
算することによって、顧客の購買書籍カテゴリ毎のキー
ワード・ベクトルを作成する。
【0070】また、図5には、書籍毎のキーワード・ベ
クトルの作成手順を図解している。但し、書籍のタイト
ルと内容説明についてはテキスト処理を行う必要があ
る。テキスト処理の内容は、次の手順である。
【0071】(1)テキストに含まれる各単語に品詞を
付与する。品詞を付与するためのツールとしては、Bril
l's English tagger [5]を用いる。
【0072】(2)不要語の削除は、品詞情報を用いて
名詞・形容詞・外来語以外の品詞を削除する。その後、
事前に作成した不要語リストを適用する。
【0073】(3)削除されずに残った単語を単語キー
ワードとして利用する。
【0074】(4)複合語キーワードは、文章中に名詞
が連続して出現した場合に、その組み合わせを複合語キ
ーワードとして利用する。
【0075】著者、書籍カテゴリ、サブカテゴリについ
ては、前述の単語キーワードや複合語キーワードと同様
に重み付けを行い、キーワード・ベクトルに加える。本
実施例では、重み付けの方法は、語句の出現頻度TF
(Term Frequency)と逆文献頻度IDF(Inverse Docu
ment Frequency)を用いた、TFIDF[1]と呼ばれる
重み付け手法を用いる。
【0076】以下の説明では、i番目の書籍diにおけ
る単語・複合語・著者・サブカテゴリのj番目のキーワ
ードtjの出現頻度をfijとし、また、全書籍数Nの中
でキーワードtjが出現する書籍数をnjとおくこととす
る。また、キーワードの種別毎に設定した重みをkとす
る。本明細書中では、キーワード種別毎の重みは、経験
的にサブカテゴリについてはk=2とし、それ以外につ
いてはk=1とした。
【0077】また、同一のキーワードが過剰に出現した
場合の影響を緩和するために、i番目の書籍di中にお
けるj番目のキーワードtjの出現頻度fijをそのまま
用いるのではなく、対数表現を採り入れた以下の式で定
義されるTFijを用いて各キーワードの出現頻度を評価
することとした。
【0078】
【数1】
【0079】また、逆文献頻度に関しては、対数表現を
採り入れて、以下の式で定義されるIDFjを用いるこ
ととした。
【0080】
【数2】
【0081】また、書籍diにおけるキーワードtjに付
与される重みwijは、上記の各式[数1]及び[数2]
を用いて次式となる。
【0082】
【数3】
【0083】最終的な書籍毎のキーワード・ベクトル
は、キーワードtjの重みwjの降順に上位12個のキー
ワードを各書籍に付与する。但し、本発明を実現する上
で、キーワードの上限を設定する必要は必ずしもなく、
また、上限値が12個に限定されるものでもない。
【0084】図4に示すように、顧客プロファイルは、
書籍カテゴリ毎の購買書籍のキーワード・ベクトルの
和、すなわちカテゴリ毎の合成ベクトルで構成される。
顧客U kのカテゴリClについてのキーワードtjの重み
w'jklは、下式のように定義される。
【0085】
【数4】
【0086】但し、上式[数4]において、bikは、顧
客Ukが書籍diを購入していた場合に1とし、それ以外
は0とする。また、silは、書籍diがカテゴリClに属
している場合に1とし、それ以外は0とする。
【0087】顧客にリコメンドする書籍の選択は、顧客
プロファイルのキーワード・ベクトルと書籍の特徴を表
すキーワード・ベクトルの類似度を計算することによっ
て行う。類似度の計算方法には、キーワード・ベクトル
間のなす角のコサインを用いる。
【0088】顧客UkのカテゴリClにおけるキーワード
jの重みをw'jklとおき、また、書籍diにおけるキー
ワードtjの重みwijとおくと、顧客UkのカテゴリCl
に対する書籍diの推薦度riklは、次式の通りとなる。
【0089】
【数5】
【0090】次いで、書籍のリコメンデーション処理に
ついて説明する。
【0091】キーワード・ベクトルのような特徴ベクト
ルを用いたコンテンツ分析手法では、一般に、ベクトル
同士の類似度に基づいて特徴比較が行われる。
【0092】本実施例では、カテゴリ毎に特徴比較を行
う。より具体的には、同一の書籍カテゴリに含まれるキ
ーワード・ベクトル同士を比較する「順マッチング型リ
コメンデーション」と、異なる書籍カテゴリに含まれる
キーワード・ベクトル同士を比較する「交差マッチング
型リコメンデーション」の2通りを行う。
【0093】図6には、順マッチング型リコメンデーシ
ョンの処理手順を図解している。
【0094】顧客の興味表現すなわち顧客プロファイル
は、過去の購買履歴のある各書籍カテゴリにおけるキー
ワード・ベクトルの合成ベクトルで構成される。図6に
示す例では、顧客が過去に購入したことがある書籍カテ
ゴリA及びBの各々において、顧客プロファイルを表現
するキーワード・ベクトルが生成される。
【0095】他方、書籍データベースを基に、書籍毎の
キーワード・ベクトルが生成されており(図4を参照の
こと)、このうち、顧客の購買履歴が残された書籍カテ
ゴリA及びBの各々に含まれる書籍のキーワード・ベク
トルを抽出する。
【0096】さらに、同じ書籍カテゴリA又はB内で、
顧客プロファイルのキーワード・ベクトルと書籍のキー
ワード・ベクトルの比較すなわち類似度を計算する。類
似度の計算には、上記の[数5]を用いればよい。そし
て、類似度の高い書籍のうち、顧客が未購入のものを検
索結果として顧客にリコメンドする。
【0097】順マッチング型リコメンデーションでは、
まったく興味のないカテゴリの書籍が、いくつかのキー
ワードが一致したというだけでリコメンドされてしま
う、すなわち不要又は無益なリコメンデーションを防ぐ
ことができる。
【0098】また、図7には、交差マッチング型リコメ
ンデーションの処理手順を図解している。
【0099】顧客の興味表現すなわち顧客プロファイル
は、過去の購買履歴のある各書籍カテゴリにおけるキー
ワード・ベクトルの合成ベクトルで構成される。図7に
示す例では、顧客が過去に購入したことがある書籍カテ
ゴリA及びBの各々において、顧客プロファイルを表現
するキーワード・ベクトルが生成される。また、書籍デ
ータベースを基に、顧客の購買履歴が残された書籍カテ
ゴリA及びBの各々に含まれる書籍のキーワード・ベク
トルを抽出する(同上)。
【0100】さらに、異なる書籍カテゴリの間で、顧客
プロファイルのキーワード・ベクトルと書籍のキーワー
ド・ベクトルの比較を行う。図7に示す例では、書籍カ
テゴリAの顧客プロファイルと書籍カテゴリBの書籍キ
ーワード・ベクトルとを比較するとともに、書籍カテゴ
リBの顧客プロファイルと書籍カテゴリAの書籍キーワ
ード・ベクトルとを比較する。ベクトルの比較すなわち
類似度の計算には、上記の[数5]を用いればよい。そ
して、類似度の高い書籍のうち、顧客が未購入のものを
検索結果として顧客にリコメンドする。
【0101】交差マッチング型リコメンデーションによ
れば、キーワード・ベクトルと書籍特徴の書籍カテゴリ
の関係を交差させることにより、意外性の高いリコメン
ド情報を生成することができる。
【0102】例えば、図2に示した書籍購買行動モデル
の書籍探索フェーズのように、目的の書棚から必要なキ
ーワードを持つ書籍を探す行動を行っている際に、普段
から興味を持っているがまったく別の分野のキーワード
を含む書籍を偶然見つけるようなケースである。交差マ
ッチング型リコメンデーションは、意図的にこのような
効果を狙う手法である。
【0103】分かり易い例としては、Science Fiction
のカテゴリからStar Trekに関する書籍とCookingカテゴ
リからいくつかの書籍を購入している顧客に対するリコ
メンデーションを考察してみる。交差マッチング型リコ
メンデーションによれば、Cookingカテゴリの書籍をキ
ーワード"Star Trek"を用いて検索し、"Star Trek Cook
book"といった書籍を紹介することができる。
【0104】但し、交差マッチングにおいては、比較の
対象となる書籍カテゴリを、過去に購入実績があり顧客
が興味を持っている書籍カテゴリに限定することが、リ
コメンデーションの精度を向上する上で好ましいと思料
する。
【0105】
【実施例】以下、図面を参照しながら本発明の実施例を
詳解する。
【0106】図8には、本発明の実施に供される情報検
索システム10のハードウェア構成を模式的に示してい
る。情報検索システム10は、専用のハードウェア装置
としてデザインしてもよいが、一般的な計算機システム
上で所定のアプリケーション(本明細書中では、仮に
「リコメンド・アプリケーション」とする)を実行する
ことによっても実現される。計算機システムの一例は、
米IBM社のPC/AT互換機又はその後継機である。
以下、システム10の各部について説明する。
【0107】システム10のメイン・コントローラであ
るCPU(Central Processing Unit)11は、オペレ
ーティング・システム(OS)の制御下で、各種のアプ
リケーションを実行するようになっている。OSは、例
えばUNIX(登録商標)、あるいは米マイクロソフト
社のWindows98/NTでよい。
【0108】図示の通り、CPU11は、バス19によ
って他の機器類と相互接続されている。バス19上の各
機器にはそれぞれ固有のメモリ・アドレス又はI/Oア
ドレスが付与されており、CPU11はこれらアドレス
によって機器アクセスが可能となっている。バス19の
一例はPCI(Peripheral Component Interconnect)
バスである。
【0109】RAM(Random Access Memory)12は、
CPU11において実行されるプログラム・コードをロ
ードしたり、実行中の作業データを一時保管するために
使用される揮発性の記憶装置であり、通常は、複数個の
DRAM(dynamic RAM)チップで構成される。また、
ROM(Read Only Memory)13は、所定のプログラム
・コードやデータが恒久的に書き込まれた不揮発性の記
憶装置である。ROM13上には、例えば、電源投入時
に実行する自己診断プログラム(POST)や、ハード
ウェア入出力操作用のコード群(BIOS:基本入出力
システム)などが格納されている。
【0110】ディスプレイ・インターフェース14は、
CPU11が発行する描画命令を実際に処理するための
専用コントローラであり、より好ましくはSVGA(Su
perVideo Graphic Array)又はXGA(eXtended Graph
ic Array)相当のビットマップ描画機能をサポートして
いる。ディスプレイ・インターフェース14において処
理された描画データは、例えばフレーム・バッファ(図
示しない)に一旦書き込まれた後、表示装置21に画面
出力される。表示装置21は、例えば、CRT(Cathod
e Ray Tube)ディスプレイや、液晶表示ディスプレイ
(Liquid Crystal Display)などである。
【0111】入力機器インターフェース15は、キーボ
ード22やマウス23などのユーザ入力機器をシステム
1に接続するための装置である。入力機器インターフェ
ース15は、キーボード22によるキー入力又はマウス
23を介した座標指示入力に応答して、CPU11に対
して割り込みを発生する。
【0112】外部機器インターフェース17は、ハード
・ディスク・ドライブ(HDD)24やメディア・ドライ
ブ25などの外部装置をシステム1に接続するための装
置である。外部機器インターフェース17は、例えば、
IDE(Integrated Drive Electronics)やSCSI
(Small Computer System Interface)などのインター
フェース規格に準拠する。
【0113】HDD24は、記憶担体としての磁気ディ
スクを固定的に搭載した外部記憶装置であり(周知)、
記憶容量やデータ転送速度などの点で他の外部記憶装置
よりも優れている。ソフトウェア・プログラムを実行可
能な状態でHDD24上に置くことをプログラムのシス
テムへの「インストール」と呼ぶ。通常、HDD24に
は、オペレーティング・システムや、アプリケーション・
プログラム、デバイス・ドライバなどのCPU11の実
行プログラム・コードが不揮発的に格納されている。H
DD24にインストールされるアプリケーションの一例
は、本実施例に係るリコメンド・アプリケーションであ
る。また、HDD24に格納されるデータ・ファイルの
一例は、情報コンテンツの検索に利用されるキーワード
・ベクトルや顧客プロファイルである。
【0114】また、メディア・ドライブ25は、CD(C
ompact Disc)やMO(Magneto-Optical disc)、DV
D(Digital Versatile Disc)などの可搬型メディアを
装填して、データ記録面にアクセスするための装置であ
る。可搬型メディアは、主として、ソフトウェア・プロ
グラムやデータ・ファイルなどをコンピュータ可読形式
のデータとしてバックアップすることや、これらをシス
テム間で移動(販売・流通・配布を含む)する目的で使用
される。例えば、このような可搬型メディアを媒介にし
て、本実施例に係るリコメンド・アプリケーションを配
布したり、情報コンテンツの検索に利用されるキーワー
ド・ベクトルや顧客プロファイルなどのデータ・ファイ
ルを配布することが可能である。
【0115】ネットワーク・インターフェース16は、
Ethernetなどの所定の通信プロトコルに従っ
て、システム1をLAN(Local Area Network)に接続
することができる。ネットワーク・インターフェース1
6は、一般に、LANアダプタ・カードの形態で提供さ
れ、マザーボード(図示しない)上のPCIバス・スロ
ットの装着して用いられる。
【0116】LAN上には、サーバ又はクライアントと
して稼動する1以上の計算機システムが接続されてい
る。また、LAN上の計算機システムのうち一部はルー
タとして機能し、インターネットなどの外部の広域ネッ
トワークに接続されている。
【0117】これらネットワーク上では、多数の計算機
システムがトランスペアレントな状態で接続され、分散
コンピューティング環境が構築されている。かかる分散
環境下では、各ユーザはプログラムやデータなど資源オ
ブジェクトの所在を特に認識する必要がなくなる。ま
た、コンピュータにおいて実行される手続きやメソッド
も、ネットワーク上で分散して保持され、管理されてい
る。例えば、ネットワーク上のある1つのコンピュータ
上で動作しているプロセスが、他のコンピュータ上で動
作するプロセスの手続きを呼び出して実行させることが
できる。
【0118】ネットワーク上で稼動するサーバは、例え
ば、ファイル・サーバ、プリント・サーバ、データベー
ス・サーバであってもよい。また、インターネット上で
HTTP(Hyper Text Transfer Protocol)プロトコル
に従ってHTML(Hyper Text Markup Language)ドキ
ュメントを公開するWWW(World Wide Web)サーバ
や、メール送受信サービスを提供するメール・サーバで
あってもよい。
【0119】上述した情報検索システム10は、分散ネ
ットワーク上において、クライアントからの書籍リコメ
ンドなどの情報コンテンツ検索要求に対してリコメンド
情報を提供するサーバとして位置付けることができる。
【0120】但し、情報コンテンツ検索及びリコメンデ
ーションのための処理プロセスをすべて単一の計算機シ
ステム10上で実行する必要は必ずしもない。例えば、
ある1つの計算機システムが、CGI(Common Gateway
Interface)などの遠隔手続き呼び出しの仕組みを利用
することによって、WWWサーバ経由で情報コンテンツ
検索要求を受信した後、ネットワーク上の他のサーバに
対して検索処理の実行を委ねるようにしてもよい。
【0121】また、ネットワーク上では、ソフトウェア
・プログラムやデータ・コンテンツなどのディストリビ
ューションが行われる(周知)。例えば、本実施例に係
るリコメンデーション・アプリケーションをネットワー
ク経由で配信したり、コンテンツ検索のためのキーワー
ド・ベクトルや顧客プロファイルなどのデータ・ファイ
ルをネットワーク経由で配信することが可能である。
【0122】図9には、本実施例に係る情報検索システ
ム10が、情報コンテンツとしての書籍の検索のために
使用するデータベースを一覧表示している。但し、これ
らのデータベースをすべて単一の計算機システム上で蓄
積・管理する必要はなく、ネットワーク上の他の1以上
のデータベース・サーバやファイル・サーバに分散して
配置して、必要に応じて適宜アクセスするようにしても
よい。
【0123】次いで、情報検索システム10上で実行さ
れる情報検索及びリコメンド情報の生成処理について説
明する。以下で説明する処理手順は、例えば、一般的な
計算機システムで構成される情報検索システム10上
で、本実施例に係るリコメンデーション・アプリケーシ
ョンを実行することで実現される。また、以下の説明で
は、情報検索システム10は書籍の検索及びリコメンデ
ーションに適用されているものとする。
【0124】図10には、本実施例に係るコンテンツ検
索の処理手順を概略的に示している。
【0125】情報検索システム10は、コンテンツとし
ての書籍を検索するために、まずテンポラリ・テーブル
を初期化する(ステップS1)。テンポラリ・テーブル
には、コンテンツ検索のために使用されるキーワードを
登録するための「キーワード・テーブル」、各コンテン
ツすなわち書籍毎にキーワードの出現頻度(又はキーワ
ード・ベクトル)を登録するための「コンテンツ・キー
ワード・テーブル」、コンテンツ検索の要求元である顧
客のプロファイルを管理する「顧客プロファイル・テー
ブル」、並びに、本処理結果の戻り値であるリコメンド
情報を登録するために「推薦コンテンツ・テーブル」が
含まれる。
【0126】次いで、コンテンツ・キーワードの作成処
理を行う(ステップS2)。コンテンツ・キーワードの
作成処理は、図11にさらに詳しく記述しているが、詳
細は後述に譲る。
【0127】次いで、顧客プロファイルの作成処理を行
う(ステップS3)。コンテンツ・キーワードの作成処
理は、図12にさらに詳しく記述しているが、詳細は後
述に譲る。
【0128】次いで、推薦コンテンツの選択処理を行う
(ステップS4)。本実施例における推薦コンテンツの
選択処理は、書籍のリコメンド情報の生成に該当する。
前述したように書籍リコメンドには、順マッチング型リ
コメンデーションと、交差マッチング型リコメンデーシ
ョン、及び、両者のハイブリッド型リコメンデーション
が挙げられる。順マッチング型リコメンデーションの処
理手順については図13に、交差マッチング型リコメン
デーションの処理手順については図14及び図15に、
それぞれ詳しく記述しているが、詳細は後述に譲る。
【0129】図11には、コンテンツ・キーワード作成
の処理手順の詳細を、フローチャートの形式で図解して
いる。以下、このフローチャートに従って説明する。
【0130】まず、コンテンツ・テーブルからレコード
を1つずつ読み出す(ステップS11)。そして、書籍
の説明文をキーワードに分解して品詞を付与する(ステ
ップS12)。
【0131】次いで、品詞が不要品詞リストに含まれて
いるか否かをチェックする(ステップS13)。次い
で、キーワードが不要品詞リストに含まれているか否か
をチェックする(ステップS14)。
【0132】不要品詞リストには、テキスト・ドキュメ
ントなどのコンテンツ中で頻繁に出現してもあまり意味
を持たない単語(例えば、冠詞や、「情報」や「システ
ム」のようにそもそも頻繁に出現する性質の用語など)
が含まれている。不要品詞リストに含まれている品詞や
キーワードは、キーワードから除外する(ステップS1
5)。
【0133】次いで、コンテンツ・キーワード・テーブ
ル(書籍キーワード・テーブル)に一致するレコードが
既に存在するか否かをチェックする(ステップS1
6)。一致するレコードが発見された場合には、該レコ
ードの出現頻度を1だけ増分する(ステップS17)。
他方、一致するレコードが見つからなかった場合には、
コンテンツ・キーワード・テーブルにこのレコードを追
加する(ステップS18)。この新規レコードには、出
現頻度として1を、重みとしてゼロを与える。
【0134】ステップS13〜S18の処理を、すべて
のキーワードに対して繰り返し実行する(ステップS1
9)。また、ステップS11〜S19の処理を、すべて
のコンテンツ(すなわち書籍)に対して繰り返し実行す
る(ステップS20)。
【0135】次いで、コンテンツ・キーワード・テーブ
ルからキーワード毎に、レコード数をカウントして読み
出す(ステップS21)。
【0136】次いで、読み出したすべてのレコードをキ
ーワード・テーブルに追加する(ステップS22)。こ
のとき、コンテンツ頻度にレコード件数を代入する。
【0137】次いで、コンテンツ・キーワード・テーブ
ルからレコードを1つ読み出す(ステップS23)。
【0138】次いで、キーワード・テーブルから同一キ
ーワードのレコードを読み出す(ステップS24)。
【0139】次いで、重み(=出現頻度÷log(全コン
テンツ数÷コンテンツ頻度))を計算する(ステップS
25)。
【0140】次いで、コンテンツ・キーワード・テーブ
ル中の該当するレコードを、上記の計算した値で更新す
る(ステップS26)。
【0141】そして、ステップS23〜S26の処理を
すべてのコンテンツ・キーワードに対して繰り返し実行
することにより、コンテンツ・キーワードすなわち書籍
キーワードが完成する。
【0142】また、図12には、顧客プロファイル作成
の処理手順の詳細を、フローチャートの形式で図解して
いる。以下、このフローチャートに従って説明する。
【0143】まず、リコメンド要求元である顧客の購買
履歴テーブルからレコードを1つずつ読み出す(ステッ
プS31)。
【0144】そして、コンテンツ・キーワード・テーブ
ルの中から、コンテンツIDが一致するレコードを1つ
だけ読み出す(ステップS32)。
【0145】次いで、顧客プロファイル・テーブル中
に、顧客ID、カテゴリID、及び、キーワードが一致
するレコードが存在するか否かをチェックする(ステッ
プS33)。
【0146】一致するレコードが存在する場合には、こ
の一致レコードの重みに該処理中のレコードの重みを加
算する(ステップS34)。
【0147】次いで、顧客プロファイル・テーブルにこ
のレコードを追加する(ステップS35)。
【0148】上記のステップS32〜S35の処理を、
コンテンツIDが一致するすべてのレコードに対して実
行する(ステップS36)。
【0149】そして、ステップS31〜S36の処理
を、購買履歴テーブル中のすべてのレコードに対して実
行する(ステップS37)。
【0150】また、図13には、順マッチング型リコメ
ンデーションの処理手順の詳細を、フローチャートの形
式で図解している。以下、このフローチャートに従って
説明する。
【0151】まず、顧客プロファイルから顧客、カテゴ
リID毎にキーワード・ベクトルを読み出す(ステップ
S41)。
【0152】次いで、コンテンツ・テーブルからカテゴ
リIDが一致するコンテンツを1つ読み出す(ステップ
S42)。
【0153】次いで、コンテンツ・キーワード・テーブ
ルからコンテンツIDが一致するキーワードを読み出す
(ステップS43)。
【0154】そして、顧客プロファイル側のキーワード
・ベクトルと、コンテンツ側のキーワード・ベクトルを
用いて、推薦度を計算する(ステップS44)。顧客プ
ロファイルは、図12に示す処理手順に従って既に作成
されている。
【0155】また、顧客UkのカテゴリClにおけるキー
ワードtjの重みをw'jklとおき、コンテンツ(書籍)
iにおけるキーワードtjの重みwijとおいたとき、顧
客UkのカテゴリClに対するコンテンツdiの推薦度r
iklは、上記の式[数5]によって表される。但し、顧
客UkのカテゴリClにキーワードtjが存在しない場合
はw'jklをゼロとして扱い、また、コンテンツdiにキ
ーワードtjが存在しない場合はwijをゼロとして扱
う。
【0156】次いで、推薦コンテンツ・テーブルに新規
レコードを追加する(ステップS45)。
【0157】上記のステップS42〜S45の処理を、
カテゴリIDが一致するすべてのコンテンツすなわち書
籍に対して繰り返し実行する(ステップS46)。
【0158】また、上記のステップS41〜S46の処
理を、顧客プロファイル中のすべてのキーワード・ベク
トルに対して繰り返し実行する(ステップS47)。
【0159】次いで、推薦コンテンツ・テーブルから、
顧客毎に推薦度が高い順にレコードを読み出す(ステッ
プS48)。
【0160】そして、購買履歴テーブル中に顧客ID及
びコンテンツIDの双方が一致するレコードが存在する
か否かをチェックする(ステップS49)。一致するレ
コードは、推薦コンテンツ・テーブルから削除する(ス
テップS54)。
【0161】さらに、推薦履歴テーブル中に顧客ID及
びコンテンツIDの双方が一致するレコードが存在する
か否かをチェックする(ステップS50)。一致するレ
コードは、推薦コンテンツ・テーブルから削除する(ス
テップS54)。
【0162】次いで、推薦コンテンツを顧客毎にカウン
トする(ステップS51)。そして、カウントした件数
が推薦したいコンテンツ数を越えたか否かをチェックす
る(ステップS52)。推薦したいコンテンツ数以内で
あれば、推薦履歴テーブルに当該レコードを追加登録す
る(ステップS53)。逆に、推薦したいコンテンツ数
を超えてしまった場合には、当該レコードを推薦コンテ
ンツ・テーブルから削除する(ステップS54)。
【0163】上記のステップS48〜S54の処理を、
推薦コンテンツ・テーブル中のすべてのレコードに対し
て繰り返し実行する(ステップS55)。
【0164】また、図14及び図15には、交差マッチ
ング型リコメンデーションの処理手順の詳細を、フロー
チャートの形式で図解している。以下、これらのフロー
チャートに従って説明する。
【0165】まず、リストAを初期化する(ステップS
61)。
【0166】そして、顧客テーブルからレコードを1つ
読み出す(ステップS62)とともに、購買履歴テーブ
ルから顧客IDするレコードを読み出す(ステップS6
3)。
【0167】次いで、購買履歴のあるカテゴリIDのリ
ストを作成して、リストAに書き込む(ステップS6
4)。
【0168】次いで、顧客プルファイルの中から、顧客
IDが一致するレコードをカテゴリID毎に読み出す
(ステップS65)。
【0169】次いで、コンテンツ・テーブルから以下の
条件1を満たすコンテンツを1つ読み出す(ステップS
66)。
【0170】条件1:カテゴリIDが顧客プロファイル
のカテゴリIDと異なり(カテゴリが交差する)、且
つ、カテゴリIDがリストAに含まれること。
【0171】次いで、コンテンツ・キーワード・テーブ
ルの中から、コンテンツIDが一致するキーワード・ベ
クトルを読み出す(ステップS67)。顧客プロファイ
ルは、図12に示す処理手順に従って既に作成されてい
る。
【0172】次いで、顧客プロファイル側のキーワード
・ベクトルと、コンテンツ側のキーワード・ベクトルを
用いて、推薦度を計算する(ステップS68)。顧客プ
ロファイルは、図12に示す処理手順に従って既に作成
されている。
【0173】また、顧客UkのカテゴリClにおけるキー
ワードtjの重みをw'jklとおき、コンテンツ(書籍)
iにおけるキーワードtjの重みwijとおいたとき、顧
客U kのカテゴリClに対するコンテンツdiの推薦度r
iklは、上記の式[数5]によって表される。但し、顧
客UkのカテゴリClにキーワードtjが存在しない場合
はw'jklをゼロとして扱い、また、コンテンツdiにキ
ーワードtjが存在しない場合はwijをゼロとして扱
う。
【0174】次いで、推薦コンテンツ・テーブルの中
に、顧客IDとコンテンツIDの双方が一致するレコー
ドが存在するか否かをチェックする(ステップS6
9)。一致するレコードが存在しない場合には、推薦コ
ンテンツ・テーブルに当該レコードを追加登録する(ス
テップS72)。
【0175】また、推薦コンテンツ・テーブルの中に、
顧客IDとコンテンツIDの双方が一致するレコードが
存在する場合には、さらに、当該レコードの推薦度がス
テップS68で計算した推薦度よりも高いか否かをチェ
ックする(ステップS70)。計算した推薦度よりも高
い場合には、当該レコード上の推薦度を、計算した推薦
度の値で更新する(ステップS71)。また、計算した
推薦度よりも高くない場合には、ステップS71をスキ
ップする。
【0176】上記のステップS66〜S72の処理を、
カテゴリIDが条件1に合致するすべてのコンテンツに
対して繰り返し実行する(ステップS73)。
【0177】また、上記のステップS65〜S73の処
理を、該当する顧客のすべての顧客プロファイル・キー
ワード・ベクトルに対して繰り返し実行する(ステップ
S74)。
【0178】また、ステップS61〜S74の処理を、
顧客テーブル中のすべての顧客に対して繰り返し実行す
る(ステップS75)。
【0179】次いで、推薦コンテンツ・テーブルの中か
ら、顧客毎に推薦度が高い順で1つずつ読み出す(ステ
ップS76)。
【0180】そして、購買履歴テーブル中に顧客ID及
びコンテンツIDの双方が一致するレコードが存在する
か否かをチェックする(ステップS77)。一致するレ
コードは、推薦コンテンツ・テーブルから削除する(ス
テップS82)。
【0181】さらに、推薦履歴テーブル中に顧客ID及
びコンテンツIDの双方が一致するレコードが存在する
か否かをチェックする(ステップS78)。一致するレ
コードは、推薦コンテンツ・テーブルから削除する(ス
テップS82)。
【0182】次いで、推薦コンテンツを顧客毎にカウン
トする(ステップS79)。そして、カウントした件数
が推薦したいコンテンツ数を越えたか否かをチェックす
る(ステップS80)。推薦したいコンテンツ数以内で
あれば、推薦履歴テーブルに当該レコードを追加登録す
る(ステップS81)。逆に、推薦したいコンテンツ数
を超えてしまった場合には、当該レコードを推薦コンテ
ンツ・テーブルから削除する(ステップS82)。
【0183】上記のステップS76〜S82の処理を、
推薦コンテンツ・テーブル中のすべてのレコードに対し
て繰り返し実行する(ステップS83)。
【0184】《注釈》 [1]:G. Salton and C. Buckley, Term-weighting appr
oaches in automatic text retrieval., Information P
rocessing and Management, 1988, Vol.14, No.5, P.51
3-523 [2]:Marko Balabanovic, and Yoav Shoham, Content-B
ased, Collaborative Recommendation., Commnications
of the ACM, 1997, Vol. 40, No.3, p66-72 [3]:Paul Resnick, Neophytos Iacovou, Mitesh Sucha
k, et al., GroupLends:An Open Architecture for Col
laborative Filtering of Netnews. Proceedings of th
e Conference on Conputer Supported Cooperative Wor
k, 1994, p175-186 [4]:NetPerceptions Inc., Recommendation Engine Wh
ite Paper. http://www.netperceptions.com/literatur
e/content/recommendation.pdf, 2000 [5] :Eric Brill, Rule Based Tagger, http://www.c
s.jhu.edu/~brill/ home.html, 2000
【0185】[追補]以上、特定の実施例を参照しなが
ら、本発明について詳解してきた。しかしながら、本発
明の要旨を逸脱しない範囲で当業者が該実施例の修正や
代用を成し得ることは自明である。
【0186】本実施例では、書籍販売をベースに説明し
たが、他の商品の検索、あるいは商品以外の物品やデー
タ・コンテンツを探し当てる場合であっても、本発明が
同様に実現可能であることは言うまでもない。また、必
ずしも、インターネットなどの広域ネットワーク上での
コンテンツ検索に限定されない。例えば、スタンドアロ
ンの計算機システム上で、対話画面上でコンテンツ検索
サービスを検索する場合であっても、同様に本発明を適
用することかできる。
【0187】要するに、例示という形態で本発明を開示
してきたのであり、限定的に解釈されるべきではない。
本発明の要旨を判断するためには、冒頭に記載した特許
請求の範囲の欄を参酌すべきである。
【0188】
【発明の効果】以上詳記したように、本発明によれば、
膨大な情報コンテンツの中からユーザの要求に合致した
コンテンツを探し出してリコメンドすることができる、
優れた情報検索システム又は方法を提供することができ
る。
【0189】また、本発明によれば、ユーザの趣味・嗜
好や過去の探索履歴・購買履歴などのユーザプロファイ
ル情報に基づいて所望のコンテンツの探索しリコメンド
を行うことができる、優れた情報検索システム又は方法
を提供することができる。
【0190】また、本発明によれば、インターネット上
で商品販売などのビジネスを行う場合において、顧客が
期待する商品を探し当ててリコメンドすることができ
る、優れた情報検索システム又は方法を提供することが
できる。
【0191】また、本発明によれば、書籍販売などのよ
うに、顧客が有益性の他に意外性を求めるような商品を
探し当てて顧客にリコメンドすることができる、優れた
情報検索システム又は方法を提供することができる。
【0192】本発明に係る情報検索システム及び方法
は、コンテンツ分析方式を基調とするが、リコメンド情
報の幅を広げる工夫をすることにより、コンテンツ分析
方式の欠点を解消することができる。また、書籍販売の
ように対象コンテンツ数が非常に大きな業種において本
発明を適用することで、顧客規模が小さい場合にも、質
の高いリコメンド・サービスを提供可能にすることがで
きる。
【図面の簡単な説明】
【図1】本発明に係る情報検索システムがリコメンド情
報を生成する手順を示した図である。
【図2】本実施例において仮定される、顧客が実際の書
店で興味にあった書籍を探し出すときの書籍購買行動モ
デルを示した図である。
【図3】BISAC Subject Categoryを用いて、顧客の書
籍購買カテゴリ数を調べたグラフである。
【図4】顧客プロファイルのキーワード・ベクトル作成
処理手順を示した図である。
【図5】書籍毎のキーワード・ベクトルの作成手順を示
した図である。
【図6】順マッチング型リコメンデーションの処理手順
を示した図である。
【図7】交差マッチング型リコメンデーションの処理手
順を示した図である。
【図8】本発明の実施に供される情報検索システム10
のハードウェア構成を模式的に示した図である。
【図9】本実施例に係る情報検索システム10が、情報
コンテンツとしての書籍の検索のために使用するデータ
ベースを一覧表示した図である。
【図10】本実施例に係るコンテンツ検索の処理手順を
概略的に示したフローチャートである。
【図11】コンテンツ・キーワード作成の処理手順を詳
細に示したフローチャートである。
【図12】顧客プロファイル作成の処理手順を詳細に示
したフローチャートである。
【図13】順マッチング型リコメンデーションの処理手
順を詳細に示したフローチャートである。
【図14】交差マッチング型リコメンデーションの処理
手順(前半)を詳細に示したフローチャートである。
【図15】交差マッチング型リコメンデーションの処理
手順(後半)を詳細に示したフローチャートである。
【符号の説明】
10…情報検索システム 11…CPU 12…RAM 13…ROM 14…ディスプレイ・インターフェース 15…入力機器インターフェース 16…ネットワーク・インターフェース 17…外部機器インターフェース 19…バス 21…ディスプレイ 22…キーボード 23…マウス 24…ハード・ディスク装置 25…メディア・ドライブ
フロントページの続き Fターム(参考) 5B075 NK46 NR12 PP02 PP03 PQ02 PR04 PR06 QM08 UU11

Claims (21)

    【特許請求の範囲】
  1. 【請求項1】多数のコンテンツを含む情報空間の中から
    ユーザが望むコンテンツを検索する情報検索システムで
    あって、 前記情報空間上の各コンテンツを所定数のコンテンツ・
    カテゴリに分類する分類手段と、 前記情報空間上の各コンテンツの特徴ベクトルを生成す
    る特徴ベクトル生成手段と、 ユーザが過去アクセスしたコンテンツの特徴ベクトルを
    含むユーザ・プロファイルを生成するユーザ・プロファ
    イル生成手段と、 各コンテンツ・カテゴリ毎にユーザ・プロファイルとコ
    ンテンツの特徴ベクトルを比較するベクトル比較手段
    と、 前記比較の結果に基づいて、ユーザが望むコンテンツを
    特定するコンテンツ特定手段と、を具備することを特徴
    とする情報検索システム。
  2. 【請求項2】前記コンテンツは書籍などのテキスト・ド
    キュメントを含むコンテンツであり、 前記特徴ベクトル生成手段は、N個のキーワードの各々
    に対して座標軸を割り当てたN次元キーワード空間上に
    おいて、コンテンツ中での各キーワードの出現頻度に重
    み付け因子を掛けた座標値を持つキーワード・ベクトル
    を生成することを特徴とする請求項1に記載の情報検索
    システム。
  3. 【請求項3】前記ユーザ・プロファイル生成手段は、ユ
    ーザが過去アクセスした各コンテンツの特徴ベクトルを
    コンテンツ・カテゴリ毎に合成して、各コンテンツ・カ
    テゴリ毎の特徴ベクトルからなるユーザ・プロファイル
    を生成することを特徴とする請求項1に記載の情報検索
    システム。
  4. 【請求項4】前記ユーザ・プロファイル生成手段は、各
    コンテンツ・カテゴリ毎の特徴ベクトルからなるユーザ
    ・プロファイルを生成し、 前記ベクトル比較手段は、同一カテゴリ内でユーザ・プ
    ロファイルの特徴ベクトルとコンテンツの特徴ベクトル
    を比較することを特徴とする請求項1に記載の情報検索
    システム。
  5. 【請求項5】前記ユーザ・プロファイル生成手段は、各
    コンテンツ・カテゴリ毎の特徴ベクトルからなるユーザ
    ・プロファイルを生成し、 前記ベクトル比較手段は、異なるカテゴリ間でユーザ・
    プロファイルの特徴ベクトルとコンテンツの特徴ベクト
    ルを比較することを特徴とする請求項1に記載の情報検
    索システム。
  6. 【請求項6】前記コンテンツ特定手段は、ユーザ・プロ
    ファイルと類似度の高いコンテンツをユーザが望むコン
    テンツとして特定することを特徴とする請求項1に記載
    の情報検索システム。
  7. 【請求項7】前記コンテンツ特定手段は、ユーザ・プロ
    ファイルと類似度の高いコンテンツのうちユーザが未ア
    クセスのものをユーザが望むコンテンツとして特定する
    ことを特徴とする請求項1に記載の情報検索システム。
  8. 【請求項8】多数のコンテンツを含む情報空間の中から
    ユーザが望むコンテンツを検索する情報検索方法であっ
    て、 前記情報空間上の各コンテンツの特徴ベクトルを生成す
    る特徴ベクトル生成ステップと、 前記情報空間上の各コンテンツを所定数のコンテンツ・
    カテゴリに分類する分類ステップと、 ユーザが過去アクセスしたコンテンツの特徴ベクトルを
    含むユーザ・プロファイルを生成するユーザ・プロファ
    イル生成ステップと、 各コンテンツ・カテゴリ毎にユーザ・プロファイルとコ
    ンテンツの特徴ベクトルを比較するベクトル比較ステッ
    プと、 前記比較の結果に基づいて、ユーザが望むコンテンツを
    特定するコンテンツ特定ステップと、 を具備することを特徴とする情報検索方法。
  9. 【請求項9】前記コンテンツは書籍などのテキスト・ド
    キュメントを含むコンテンツであり、 前記特徴ベクトル生成ステップでは、N個のキーワード
    の各々に対して座標軸を割り当てたN次元キーワード空
    間上において、コンテンツ中での各キーワードの出現頻
    度に重み付け因子を掛けた座標値を持つキーワード・ベ
    クトルを生成することを特徴とする請求項8に記載の情
    報検索方法。
  10. 【請求項10】前記ユーザ・プロファイル生成ステップ
    では、ユーザが過去アクセスした各コンテンツの特徴ベ
    クトルをコンテンツ・カテゴリ毎に合成して、各コンテ
    ンツ・カテゴリ毎の特徴ベクトルからなるユーザ・プロ
    ファイルを生成することを特徴とする請求項8に記載の
    情報検索方法。
  11. 【請求項11】前記ユーザ・プロファイル生成ステップ
    では、各コンテンツ・カテゴリ毎の特徴ベクトルからな
    るユーザ・プロファイルを生成し、 前記ベクトル比較ステップでは、同一カテゴリ内でユー
    ザ・プロファイルの特徴ベクトルとコンテンツの特徴ベ
    クトルを比較することを特徴とする請求項8に記載の情
    報検索方法。
  12. 【請求項12】前記ユーザ・プロファイル生成ステップ
    では、各コンテンツ・カテゴリ毎の特徴ベクトルからな
    るユーザ・プロファイルを生成し、 前記ベクトル比較ステップは、異なるカテゴリ間でユー
    ザ・プロファイルの特徴ベクトルとコンテンツの特徴ベ
    クトルを比較することを特徴とする請求項8に記載の情
    報検索方法。
  13. 【請求項13】前記コンテンツ特定ステップでは、ユー
    ザ・プロファイルと類似度の高いコンテンツをユーザが
    望むコンテンツとして特定することを特徴とする請求項
    8に記載の情報検索方法。
  14. 【請求項14】前記コンテンツ特定ステップでは、ユー
    ザ・プロファイルと類似度の高いコンテンツのうちユー
    ザが未アクセスのものをユーザが望むコンテンツとして
    特定することを特徴とする請求項8に記載の情報検索方
    法。
  15. 【請求項15】多数のコンテンツを含む情報空間の中か
    らユーザが望むコンテンツを検索する情報検索処理をコ
    ンピュータ・システム上で実行せしめるためのコンピュ
    ータ・ソフトウェアをコンピュータ可読形式で格納する
    ソフトウェア記憶媒体であって、前記コンピュータ・ソ
    フトウェアは、 前記情報空間上の各コンテンツの特徴ベクトルを生成す
    る特徴ベクトル生成ステップと、 前記情報空間上の各コンテンツを所定数のコンテンツ・
    カテゴリに分類する分類ステップと、 ユーザが過去アクセスしたコンテンツの特徴ベクトルを
    含むユーザ・プロファイルを生成するユーザ・プロファ
    イル生成ステップと、 各コンテンツ・カテゴリ毎にユーザ・プロファイルとコ
    ンテンツの特徴ベクトルを比較するベクトル比較ステッ
    プと、 前記比較の結果に基づいて、ユーザが望むコンテンツを
    特定するコンテンツ特定ステップと、を具備することを
    特徴とするソフトウェア記憶媒体。
  16. 【請求項16】前記コンテンツは書籍などのテキスト・
    ドキュメントを含むコンテンツであり、 前記特徴ベクトル生成ステップでは、N個のキーワード
    の各々に対して座標軸を割り当てたN次元キーワード空
    間上において、コンテンツ中での各キーワードの出現頻
    度に重み付け因子を掛けた座標値を持つキーワード・ベ
    クトルを生成することを特徴とする請求項15に記載の
    ソフトウェア記憶媒体。
  17. 【請求項17】前記ユーザ・プロファイル生成ステップ
    では、ユーザが過去アクセスした各コンテンツの特徴ベ
    クトルをコンテンツ・カテゴリ毎に合成して、各コンテ
    ンツ・カテゴリ毎の特徴ベクトルからなるユーザ・プロ
    ファイルを生成することを特徴とする請求項15に記載
    のソフトウェア記憶媒体。
  18. 【請求項18】前記ユーザ・プロファイル生成ステップ
    では、各コンテンツ・カテゴリ毎の特徴ベクトルからな
    るユーザ・プロファイルを生成し、 前記ベクトル比較ステップでは、同一カテゴリ内でユー
    ザ・プロファイルの特徴ベクトルとコンテンツの特徴ベ
    クトルを比較することを特徴とする請求項15に記載の
    ソフトウェア記憶媒体。
  19. 【請求項19】前記ユーザ・プロファイル生成ステップ
    では、各コンテンツ・カテゴリ毎の特徴ベクトルからな
    るユーザ・プロファイルを生成し、 前記ベクトル比較ステップは、異なるカテゴリ間でユー
    ザ・プロファイルの特徴ベクトルとコンテンツの特徴ベ
    クトルを比較することを特徴とする請求項15に記載の
    ソフトウェア記憶媒体。
  20. 【請求項20】前記コンテンツ特定ステップでは、ユー
    ザ・プロファイルと類似度の高いコンテンツをユーザが
    望むコンテンツとして特定することを特徴とする請求項
    15に記載のソフトウェア記憶媒体。
  21. 【請求項21】前記コンテンツ特定ステップでは、ユー
    ザ・プロファイルと類似度の高いコンテンツのうちユー
    ザが未アクセスのものをユーザが望むコンテンツとして
    特定することを特徴とする請求項15に記載のソフトウ
    ェア記憶媒体。
JP2000081037A 2000-03-22 2000-03-22 情報検索システム及び情報検索方法 Pending JP2001265808A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000081037A JP2001265808A (ja) 2000-03-22 2000-03-22 情報検索システム及び情報検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000081037A JP2001265808A (ja) 2000-03-22 2000-03-22 情報検索システム及び情報検索方法

Publications (1)

Publication Number Publication Date
JP2001265808A true JP2001265808A (ja) 2001-09-28

Family

ID=18598024

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000081037A Pending JP2001265808A (ja) 2000-03-22 2000-03-22 情報検索システム及び情報検索方法

Country Status (1)

Country Link
JP (1) JP2001265808A (ja)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003196421A (ja) * 2001-12-25 2003-07-11 Pia Corp ランキング情報返送システム及びそれを実現するためのコンピュータプログラムとその方法
JP2006190164A (ja) * 2005-01-07 2006-07-20 Sony Corp 情報処理装置および方法、並びにプログラム
JP2008217370A (ja) * 2007-03-02 2008-09-18 Nec Corp プロファイル登録システム、プロファイル登録方法およびプロファイル登録プログラム
JP2008242437A (ja) * 2002-02-06 2008-10-09 Ordinate Corp 自動リーディングシステムおよび方法
JP2008262398A (ja) * 2007-04-12 2008-10-30 Toshiba Corp 情報推薦システムおよび情報推薦方法
US7707209B2 (en) 2004-11-25 2010-04-27 Kabushiki Kaisha Square Enix Retrieval method for contents to be selection candidates for user
JP2010157117A (ja) * 2008-12-26 2010-07-15 Toshiba Corp コンテンツ抽出装置およびコンテンツ抽出方法
JP2010262383A (ja) * 2009-04-30 2010-11-18 Ntt Docomo Inc レコメンド情報生成装置およびレコメンド情報生成方法
US7864640B2 (en) 2003-07-18 2011-01-04 Sony Corporation Reproducer and method for controlling reproduction
JP2011048646A (ja) * 2009-08-27 2011-03-10 Nifty Corp 検索装置、方法及びプログラム
WO2013080599A1 (ja) 2011-11-30 2013-06-06 楽天株式会社 情報処理装置、情報処理方法、情報処理プログラム及び記録媒体
JP5429172B2 (ja) * 2008-09-05 2014-02-26 ソニー株式会社 コンテンツ推薦システム、コンテンツ推薦方法、コンテンツ推薦装置、プログラム及び情報記憶媒体
KR20140031416A (ko) * 2012-08-27 2014-03-13 에스케이플래닛 주식회사 협업 필터링 기반의 아이템 추천 시스템과 방법 및 이를 지원하는 장치
JP2015022507A (ja) * 2013-07-18 2015-02-02 株式会社リコー 情報提示装置、情報提示システム及び情報提示プログラム
JP2015106346A (ja) * 2013-12-02 2015-06-08 株式会社Nttドコモ レコメンド情報生成装置およびレコメンド情報生成方法
JP2016053784A (ja) * 2014-09-03 2016-04-14 富士ゼロックス株式会社 情報推薦プログラム及び情報処理装置
JP2016062358A (ja) * 2014-09-18 2016-04-25 ヤフー株式会社 抽出装置、抽出方法及び抽出プログラム
KR20160083746A (ko) * 2015-01-02 2016-07-12 에스케이플래닛 주식회사 컨텐츠 추천 서비스 시스템, 그리고 이에 적용되는 장치 및 그 장치의 동작 방법
JP6165306B1 (ja) * 2016-09-20 2017-07-19 ヤフー株式会社 生成装置、生成方法及び生成プログラム
JP2017182746A (ja) * 2016-03-31 2017-10-05 大日本印刷株式会社 情報提供サーバ装置、プログラム及び情報提供方法
JP2018049588A (ja) * 2017-06-20 2018-03-29 ヤフー株式会社 生成装置、生成方法及び生成プログラム
JP2018088282A (ja) * 2018-02-23 2018-06-07 ヤフー株式会社 抽出装置、抽出方法及び抽出プログラム
US9996611B2 (en) 2013-03-12 2018-06-12 International Business Machines Corporation Method, computer program, and computer for classifying users of social media
JP7411651B2 (ja) 2018-10-18 2024-01-11 オラクル・インターナショナル・コーポレイション コンテンツアイテム推奨をランク付けするための技術

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003196421A (ja) * 2001-12-25 2003-07-11 Pia Corp ランキング情報返送システム及びそれを実現するためのコンピュータプログラムとその方法
JP2012238013A (ja) * 2002-02-06 2012-12-06 Ordinate Corp 自動リーディングシステムおよび方法
JP2008242437A (ja) * 2002-02-06 2008-10-09 Ordinate Corp 自動リーディングシステムおよび方法
US7864640B2 (en) 2003-07-18 2011-01-04 Sony Corporation Reproducer and method for controlling reproduction
US7707209B2 (en) 2004-11-25 2010-04-27 Kabushiki Kaisha Square Enix Retrieval method for contents to be selection candidates for user
JP2006190164A (ja) * 2005-01-07 2006-07-20 Sony Corp 情報処理装置および方法、並びにプログラム
JP4492354B2 (ja) * 2005-01-07 2010-06-30 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP2008217370A (ja) * 2007-03-02 2008-09-18 Nec Corp プロファイル登録システム、プロファイル登録方法およびプロファイル登録プログラム
JP2008262398A (ja) * 2007-04-12 2008-10-30 Toshiba Corp 情報推薦システムおよび情報推薦方法
JP5429172B2 (ja) * 2008-09-05 2014-02-26 ソニー株式会社 コンテンツ推薦システム、コンテンツ推薦方法、コンテンツ推薦装置、プログラム及び情報記憶媒体
JP2010157117A (ja) * 2008-12-26 2010-07-15 Toshiba Corp コンテンツ抽出装置およびコンテンツ抽出方法
JP2010262383A (ja) * 2009-04-30 2010-11-18 Ntt Docomo Inc レコメンド情報生成装置およびレコメンド情報生成方法
JP2011048646A (ja) * 2009-08-27 2011-03-10 Nifty Corp 検索装置、方法及びプログラム
WO2013080599A1 (ja) 2011-11-30 2013-06-06 楽天株式会社 情報処理装置、情報処理方法、情報処理プログラム及び記録媒体
TWI407379B (zh) * 2011-11-30 2013-09-01 Rakuten Inc Information processing apparatus, information processing method, information processing program product and recording medium
KR20140031416A (ko) * 2012-08-27 2014-03-13 에스케이플래닛 주식회사 협업 필터링 기반의 아이템 추천 시스템과 방법 및 이를 지원하는 장치
US9996611B2 (en) 2013-03-12 2018-06-12 International Business Machines Corporation Method, computer program, and computer for classifying users of social media
JP2015022507A (ja) * 2013-07-18 2015-02-02 株式会社リコー 情報提示装置、情報提示システム及び情報提示プログラム
JP2015106346A (ja) * 2013-12-02 2015-06-08 株式会社Nttドコモ レコメンド情報生成装置およびレコメンド情報生成方法
JP2016053784A (ja) * 2014-09-03 2016-04-14 富士ゼロックス株式会社 情報推薦プログラム及び情報処理装置
JP2016062358A (ja) * 2014-09-18 2016-04-25 ヤフー株式会社 抽出装置、抽出方法及び抽出プログラム
KR20160083746A (ko) * 2015-01-02 2016-07-12 에스케이플래닛 주식회사 컨텐츠 추천 서비스 시스템, 그리고 이에 적용되는 장치 및 그 장치의 동작 방법
KR102393154B1 (ko) * 2015-01-02 2022-04-29 에스케이플래닛 주식회사 컨텐츠 추천 서비스 시스템, 그리고 이에 적용되는 장치 및 그 장치의 동작 방법
JP2017182746A (ja) * 2016-03-31 2017-10-05 大日本印刷株式会社 情報提供サーバ装置、プログラム及び情報提供方法
JP6165306B1 (ja) * 2016-09-20 2017-07-19 ヤフー株式会社 生成装置、生成方法及び生成プログラム
JP2018049342A (ja) * 2016-09-20 2018-03-29 ヤフー株式会社 生成装置、生成方法及び生成プログラム
JP2018049588A (ja) * 2017-06-20 2018-03-29 ヤフー株式会社 生成装置、生成方法及び生成プログラム
JP2018088282A (ja) * 2018-02-23 2018-06-07 ヤフー株式会社 抽出装置、抽出方法及び抽出プログラム
JP7411651B2 (ja) 2018-10-18 2024-01-11 オラクル・インターナショナル・コーポレイション コンテンツアイテム推奨をランク付けするための技術

Similar Documents

Publication Publication Date Title
JP2001265808A (ja) 情報検索システム及び情報検索方法
US10628861B1 (en) Method and system for conducting a chat
US7177818B2 (en) System and method for an interactive shopping news and price information service
US8719296B2 (en) Method and apparatus for defining data of interest
KR100852034B1 (ko) 분배형 데이터베이스의 문서를 분류하고 제시하기 위한 방법 및 장치
US8260786B2 (en) Method and apparatus for categorizing and presenting documents of a distributed database
US7933864B1 (en) Surfacing forums associated with a search string
JP4647623B2 (ja) ユニバーサル・サーチエンジンのインターフェイス
USRE44794E1 (en) Method and apparatus for representing and navigating search results
JP4813552B2 (ja) 関連した検索クエリを作り出すシステム
US8170916B1 (en) Related-item tag suggestions
US20040049514A1 (en) System and method of searching data utilizing automatic categorization
US20060173753A1 (en) Method and system for online shopping
JP2006012197A (ja) データベースクエリおよび情報送達の方法およびシステム
WO2002033594A2 (en) Information storage and retrieval architecture
WO2008109980A1 (en) Entity recommendation system using restricted information tagged to selected entities
KR20020084418A (ko) 텍스트 기반 제품의 평가를 제공하기 위한 방법 및 시스템
US8463770B1 (en) System and method for conditioning search results
US10585931B1 (en) Dynamic determination of data facets
US20090100357A1 (en) Systems and methods for visually selecting information
WO2001027712A2 (en) A method and system for automatically structuring content from universal marked-up documents
JP7309669B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
Ball New Approaches to Custom WWW Interfaces
Lisnyak An Agent-Based System for Intelligent Internet Shopping
Jiang A usability approach to improving the user experience in web directories