JP2011048646A - 検索装置、方法及びプログラム - Google Patents

検索装置、方法及びプログラム Download PDF

Info

Publication number
JP2011048646A
JP2011048646A JP2009196823A JP2009196823A JP2011048646A JP 2011048646 A JP2011048646 A JP 2011048646A JP 2009196823 A JP2009196823 A JP 2009196823A JP 2009196823 A JP2009196823 A JP 2009196823A JP 2011048646 A JP2011048646 A JP 2011048646A
Authority
JP
Japan
Prior art keywords
search
feature
word
information
book
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009196823A
Other languages
English (en)
Inventor
Tetsuro Takahashi
哲朗 高橋
Kotaro Yoshida
耕太郎 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nifty Corp
Original Assignee
Nifty Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nifty Corp filed Critical Nifty Corp
Priority to JP2009196823A priority Critical patent/JP2011048646A/ja
Publication of JP2011048646A publication Critical patent/JP2011048646A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】ユーザ毎にそのユーザに合った柔軟な検索を可能とする技術を提供する。
【解決手段】検索装置は、各商品について特徴情報をそれぞれ格納する商品特徴格納部と、各検索ワード及び各検索ワードについての特徴情報をそれぞれ検索ユーザ毎に格納する検索特徴格納部と、検索時に、検索ワード及び検索ユーザを特定する情報を取得する検索情報取得手段と、この検索情報取得手段により取得された検索ワード及び検索ユーザを特定する情報を用いて上記検索特徴格納部を検索することにより、その検索ユーザに関し格納されている、その取得された検索ワードについての特徴情報を取得する特徴取得手段と、この特徴取得手段により取得された検索ワードの特徴情報と上記商品特徴格納部に格納されている各商品についての特徴情報とをそれぞれ比較することによりその検索ワードの特徴情報と類似する特徴情報を持つ商品のリストを生成する検索手段と、を備える。
【選択図】図1

Description

本発明は、検索技術に関する。
現在、インターネットを用いたオンライン取引が盛んに行われている。オンライン取引では、消費者であるユーザは、パーソナルコンピュータ(以降、PCと表記する)等の端末装置を用いて所望の店舗サイトにアクセスし、その店舗サイトにおいて所望の商品を選び出し、購入する。このようなオンライン取引には、オンラインオークション取引も含まれる。オンラインオークション取引では、ユーザは、オークションサイトにアクセスし、このオークションサイトで出品されている商品の中から所望の商品を選び出して入札する。
また、オンライン取引をする場合でなくとも、ユーザは、購入する商品を決める上で、参考となる情報を所定サイトで探す場合もある。例えば、コンピュータゲームソフトウェア(以降、ゲームソフトと表記する)が欲しくても、購入するゲームソフトが決まっていない場合に、ユーザは、ゲームソフトを紹介するサイト等において所望のキーワードで検索することにより所望のゲームソフトを決定する。
下記特許文献1では、利用者の嗜好を利用者により閲覧された書籍詳細説明情報やその他の対話入力から自動的に判断し、利用者の嗜好に基づいて利用者が興味を起こすであろう書籍を効率よく提供することが可能な書籍紹介装置が提案されている。
特開2002−269106号公報
しかしながら、従来の検索手法では、所望の商品に関するタイトル、作者、著者、ジャンル等の固定的な検索ワードが利用されるに過ぎず、ユーザの多様な要求に応えられる柔軟な手法とはなっていなかった。特定のワード(表現)によって必ずしも所望する商品を特定し得るとは限らない。例えば、「泣ける」という検索ワードにより映画ソフトが検索された場合に、そのユーザが「悲しい物語」を望んでいるのか、又は、「感動する物語」を望んでいるのかを特定することは困難である。
また、上記特許文献1で提案される技術では、各利用者についてそれぞれ画一的に嗜好が管理され、この嗜好に基づいて書籍が検索されるが、ユーザの興味は画一的とは限らない。同一検索ワードであっても、その時々によってユーザの求める書籍が異なる場合があり得る。
本発明の目的は、このような問題点に鑑み、ユーザ毎にそのユーザに合った柔軟な検索を可能とする技術を提供することにある。
本発明の態様では、上述した課題を解決するために、それぞれ以下の構成を採用する。
本態様は、検索装置に関する。本態様に係る検索装置は、各商品について特徴情報をそ
れぞれ格納する商品特徴格納部と、各検索ワード及び各検索ワードについての特徴情報をそれぞれ検索ユーザ毎に格納する検索特徴格納部と、検索時に、検索ワード及び検索ユーザを特定する情報を取得する検索情報取得手段と、この検索情報取得手段により取得された検索ワード及び検索ユーザを特定する情報を用いて上記検索特徴格納部を検索することにより、その検索ユーザに関し格納されている、その取得された検索ワードについての特徴情報を取得する特徴取得手段と、この特徴取得手段により取得された検索ワードの特徴情報と上記商品特徴格納部に格納されている各商品についての特徴情報とをそれぞれ比較することによりその検索ワードの特徴情報と類似する特徴情報を持つ商品のリストを生成する検索手段と、を備える。
本態様では、各検索ワード及び各検索ワードについての特徴情報がそれぞれ検索ユーザ毎に格納される。本態様では、検索時に検索ワード及び検索ユーザを特定する情報が取得されると、その検索ユーザに関し格納されるその検索ワードについての特徴情報が利用されることによりその検索ワードの特徴情報と類似する特徴情報を持つ商品のリストが生成される。これにより、本態様では、各検索ユーザに対して各検索ワード及びその特徴情報がそれぞれ格納及び利用されるため、同一検索ワードを用いた場合であっても異なる特徴情報により検索される場合がある。
従って、本態様によれば、ユーザ毎にそのユーザに合った検索を行うことができる。
本態様に係る検索装置は、好ましくは、上記検索手段により生成された商品のリストの中から上記検索ユーザによって選択された商品に関する情報を取得する取得手段と、この取得手段により取得された情報を用いて上記商品特徴格納部から上記検索ユーザによって選択された商品についての特徴情報を抽出し、この抽出された選択商品についての特徴情報を、上記検索特徴格納部に格納される、上記検索ユーザに関する上記取得された検索ワードについての特徴情報に反映させる更新手段と、を更に備える。
本態様に係る検索装置において、好ましくは、上記更新手段が、上記検索ユーザに関する上記取得された検索ワードについての特徴情報が上記検索特徴格納部に格納されていない場合には、上記抽出された選択商品についての特徴情報を、当該検索ユーザに関するその取得された検索ワードについての特徴情報として、上記検索特徴格納部に格納する。
これら態様では、各検索ユーザの各検索ワードについて管理される特徴情報が実際にその検索ユーザがその検索ワードで望んだ書籍の特徴情報で更新される。即ち、各検索ワードについての特徴情報は、各検索ユーザに適合した特徴を表わすように更新される。
従って、この態様によれば、検索が実行される度に各検索ユーザの望みをより多く反映した商品リストを得ることができるようになる。
本態様に係る検索装置は、好ましくは、商品についてのユーザの思考を示す少なくとも1つの単語を含む文字列データを取得し、この文字列データを構成する単語情報を取得する解析手段と、この解析手段により取得された単語情報に基づいて、当該文字列データに含まれる所定品詞の単語を要素としその単語の出現数をその要素の値とする特徴ベクトルを上記商品についての特徴情報として生成する特徴情報生成手段と、を更に備え、上記商品特徴格納部が、各商品について前記特徴情報生成手段により生成された各特徴ベクトルを特徴情報としてそれぞれ格納する。
この態様では、各商品についての特徴情報として、その商品についてのユーザの思考を示す各単語を要素としその単語の出現数をその要素の値とする特徴ベクトルがそれぞれ生成され、利用される。これにより、単に単語で構成されるのに較べて各要素に重みが与え
られるため、各商品についての特徴情報がその商品の特徴を精度よく表わすようになる。
この態様では、このような各商品についての特徴情報と検索ユーザの検索ワードについての特徴情報との比較により検索が行われるため、名称等のような固定的な情報のみで検索されるのに比較して、柔軟な検索を行うことができる。
本態様に係る検索装置において、好ましくは、上記特徴取得手段が、上記検索ユーザに関する上記取得された検索ワードについての特徴情報が上記検索特徴格納部に格納されていない場合には、他の検索ユーザに関し上記検索特徴格納部に格納されるその取得された検索ワードについての特徴情報を抽出し、この抽出された特徴情報から得られる特徴情報を上記検索ユーザに関するその取得された検索ワードについての特徴情報とする。
本態様に係る検索装置において、好ましくは、上記特徴取得手段が、上記取得された検索ワードについての特徴情報が上記検索特徴格納部に格納されていない場合には、その取得された検索ワードに含まれる単語及びその数に基づいてその取得された検索ワードについての特徴情報を生成する。
なお、本発明の別態様としては、以上の何れかの構成を実現する方法であってもよいし、プログラムであってもよいし、このようなプログラムを記録したコンピュータが読み取り可能な記憶媒体であってもよい。
本発明によれば、ユーザ毎にそのユーザに合った柔軟な検索を可能とする技術を提供することができる。
実施例1における検索システムのシステム構成を示す図。 実施例1における特徴情報サーバ8の構成を示す概念図。 書評テーブル28の例を示す図。 形態素解析の例を示す図。 書籍ベクトルテーブル29の例を示す図。 実施例1における検索サーバ10の構成を示す概念図。 検索ベクトルテーブル50の例を示す図。 実施例1における検索システムの書評データ入力処理を示すフローチャート。 実施例1における検索システムの検索処理を示すフローチャート。 実施例1における検索システムの検索結果の選択時処理を示すフローチャート。 検索ベクトルテーブル50の変形例を示す図。
以下、本発明を実施するための形態としてのオンライン検索システム(以降、単に検索システムと表記する)について具体例を挙げ説明する。以下に挙げた実施例はそれぞれ例示であり、本発明は以下の実施例の構成に限定されない。
以下、実施形態としての検索システムの実施例1について説明する。なお、説明を分かり易くするために、実施例1では、当該検索システムで検索される商品として書籍を例に挙げる。但し、本発明はこのような検索対象商品の種類を限定するものではない。
〔システム構成〕
まず、実施例1における検索システムのシステム構成について図1を用いて説明する。図1は、実施例1における検索システムのシステム構成を示す図である。
実施例1における検索システム5は、受付サーバ7、特徴情報サーバ8、検索サーバ10等から構成される。受付サーバ7、特徴情報サーバ8、検索サーバ10はそれぞれ内部ネットワーク(図示せず)で相互に接続される。検索システム5は、情報入力端末2、検索端末3等とネットワーク1を介して接続する。ネットワーク1及び検索システム5の内部ネットワークは、インターネット等の公衆ネットワークであってもよいし、LAN(Local Area Network)やWAN(Wide Area Network)等の社内ネットワークであってもよい。本発明は、このようなネットワークを限定するものではなく、ネットワーク上を流れるプロトコルを限定するものでもない。
情報入力端末2及び検索端末3は、例えば、PC、携帯電話等のユーザ端末である。説明の便宜のため、所定商品としての書籍の検索を行うユーザ(以降、検索ユーザと表記する)により利用される端末を検索端末3と表記し、書籍についての批評、感想等(以降、書評と表記する)を入力するユーザ(以降、情報入力ユーザと表記する)により利用される端末を情報入力端末2と表記する。情報入力端末2及び検索端末3は、検索システム5にアクセスしデータを受け得る一般的な通信機能、提供されたデータに基づく画面を表示及び操作することができる一般的なユーザインタフェース機能等を有するものであればよく、本発明はこれら情報入力端末2及び検索端末3のハードウェア構成及び機能構成を限定するものではない。
〔装置構成〕
以下、実施例1における検索システム5を構成する受付サーバ7、特徴情報サーバ8、検索サーバ10の各装置構成についてそれぞれ説明する。
〈受付サーバ〉
受付サーバ7は、情報入力端末2及び検索端末3と当該検索システム5との間のインタフェースをとる一般的なサーバである。受付サーバ7は、PC等のような汎用コンピュータで構築されてもよいし、専用コンピュータで構築されてもよい。そのインタフェースには、例えば、WEBシステムが利用される。受付サーバ7は、情報入力端末2及び検索端末3からアクセスされると、所定のユーザインタフェース画面を提供し、この画面を介して入力される情報やコマンド等を受ける。
具体的には、受付サーバ7は、書籍についての書評を入力するための画面データを情報入力端末2へ送り、この画面を介して情報入力端末2により入力された書評データ及び対象となる書籍を特定するための情報を受ける。実施例1では、この書籍を特定するための情報として、ISBN(International Standard Book Number)が利用される。受付サーバ7は、この書評データ及びその対象となる書籍のISBNを受け、これら情報を特徴情報サーバ8へ送る。
受付サーバ7は、書籍の検索を受け付けるための検索画面データを検索端末3へ送り、この画面を介して検索端末3により入力された検索ワードデータ及びそのユーザを特定するためのユーザIDを受信する。本検索システム5では、一般的な方法によりシステムのサービスを受け得るユーザがデータベース等で管理されている。これにより、検索ユーザは、検索端末3で表示される画面上に検索ワードと共に、自身を特定するためのユーザIDを入力する。ここで、検索ワードとは、検索ユーザにより入力される所望の書籍を抽出する(見つけ出す)ための検索キーワードである。例えば、検索ワードには、「泣ける」、「笑える」、「感動する」、「武士」等のような少なくとも1つの単語が含まれる。受付サーバ7は、受信された検索ワード及びユーザIDを検索サーバ10へ送る。
受付サーバ7は、その送った検索ワードについての検索結果となる書籍のリストを検索サーバ10から受けると、それらを表示し、ユーザに選択させるための画面を検索端末3へ送る。受付サーバ7は、この画面に表示される書籍リストの中からユーザによって選択された書籍のISBNを取得し、この取得されたISBNを検索サーバ10へ送る。
〈特徴情報サーバ〉
図2は、実施例1における特徴情報サーバ8の構成を示す概念図である。
特徴情報サーバ8は、ハードウェア構成として、図2に示されるように、バス22で接続される、制御部20、記憶部21、通信部23等を有する。記憶部21は、例えばハードディスクであり、制御部20で実行される処理で利用される各種情報を記憶する。制御部20は、CPU(Central Processing Unit)等の1又は複数のプロセッサ、このプロセッサの処理に利用される周辺回路(ROM(Read Only Memory)、RAM(Radom Access Memory)、インタフェース回路等)を有する。通信部23は、検索システム5の内部ネットワーク(図示せず)に接続され、特徴情報サーバ8と受付サーバ7及び検索サーバ10との間の通信等を実行する。本発明は、特徴情報サーバ8の通信形態を限定するものではなく、例えば、IP(Internet Protocol)通信が利用される。特徴情報サーバ8は、PC等のような汎用コンピュータで構築されてもよいし、専用コンピュータで構築されてもよい。本発明は、特徴情報サーバ8のハードウェア構成を限定するものではない。
特徴情報サーバ8は、記憶部21に記憶されるアプリケーションプログラムが制御部20により実行されることにより、図2に示す各処理ブロックを実現する。このような処理ブロックとして、特徴情報サーバ8は、書評管理部24、書評解析部25、書籍ベクトル生成部26、書籍ベクトル管理部27等を有する。これら処理ブロックにより参照されるデータベースとして、記憶部21には、書評テーブル28、書籍ベクトルテーブル29が格納される。以下、これら特徴情報サーバ8の各処理ブロックについてそれぞれ説明する。
書評管理部24は、書評テーブル28を管理する。具体的には、書評管理部24は、受付サーバ7から書評データ及びその対象となる書籍のISBNを受け、これらデータを書評テーブル28に格納する。図3は、書評テーブル28の例を示す図である。図3に示すように、書評テーブル28には、各書籍につき、ISBN及び書評データがそれぞれ格納される。1つの書籍について複数の書評データが格納される場合もある。書評管理部24は、新たな書評データを受けると、その書評データ及びISBNを書評解析部25に送る。
書評解析部25は、書評データに対して形態素解析を行う。書評データは、一般的には、文章形式となっているため、この形態素解析により各単語に分解される。書評解析部25は、形態素解析処理の結果、書評データに含まれる複数の単語と各単語についての品詞情報とを取得する。
図4は、形態素解析の例を示す図である。図4の例では、「とても感動しました。」という文字列データである書評データが、「とても」、「感動」、「する」、「ます」、「た」、「。」の各単語に分解される。各単語にはそれぞれ品詞情報が付加されて取得される。例えば、「とても」は副詞、「感動」は名詞、「する」は動詞、「ます」は助動詞、「た」は助動詞、「。」は記号といった各品詞情報がそれぞれ取得される。なお、このような形態素解析は、一般的な技術であるため、ここでは説明を簡略化する。書評解析部25は、書評データから取得された各単語及び各品詞情報をそれぞれ、ISBNと共に書籍ベクトル生成部26へ送る。
書籍ベクトル生成部26は、書評解析部25から取得された上記各単語及び各品詞情報を用いて、その書籍の特徴を示す特徴ベクトルを生成する。以降、この書籍の特徴ベクトルを書籍ベクトルと表記する。書籍ベクトル生成部26は、品詞情報が名詞、動詞、形容詞、感動詞、又は副詞を示す単語を書籍ベクトルの各要素とし、各要素の値をその単語の出現数とする。図4の例で示される書評データからは、要素「とても」の値(1)、要素「感動」の値(1)、要素「する」の値(1)から構成される書籍ベクトルが生成される。以降、書籍ベクトルを各要素とその値とを「:」で挟んだ形式で表記する場合がある((例)とても:1、感動:1、する:1)。書籍ベクトル生成部26は、生成された書籍ベクトルをISBNと共に書籍ベクトル管理部27へ送る。
書籍ベクトル管理部27は、書籍ベクトルテーブル29を管理する。図5は、書籍ベクトルテーブル29の例を示す図である。図5に示すように、書籍ベクトルテーブル29には、各書籍につき、ISBN、書評数、書籍ベクトルがそれぞれ格納される。書籍ベクトル管理部27は、書籍ベクトル生成部26から書籍ベクトルを受けると、その書籍ベクトルに対応する書籍のレコードが書籍ベクトルテーブル29に既に格納されているか否かを検索する。書籍ベクトル管理部27は、未だ格納されていない場合には、そのISBN、書籍ベクトル及び書評数(1)を含むレコードを新たに書籍ベクトルテーブル29に追加する。
書籍ベクトル管理部27は、その書籍のレコードが既に書籍ベクトルテーブル29に格納されている場合には、そのレコードの書評数に1を加算し、かつ、既に格納されているその書籍の書籍ベクトルをこの新たに生成された書籍ベクトルを用いて更新する。この書籍ベクトルの更新は、既存の書籍ベクトルと新たに生成された書籍ベクトルとの書評数を用いた重み平均により算出された書評ベクトルに置き換えられることで実現される。書評数を用いた重み平均は、以下の(式1)により示される。
Figure 2011048646
この(式1)で算出されるwは書籍ベクトルの要素iの値を示す。ここで、nは既存の書評数であり、wdbiは既存の書籍ベクトルの要素iの値を示し、wnewiは新たに生成された書籍ベクトルの要素iの値を示す。この重み平均により、書籍ベクトルでは、書評において出現頻度の多い単語に対応する要素の値が大きくなり、出現頻度の少ない単語に対応する要素の値が小さくなる。
書籍ベクトル管理部27は、検索サーバ10からの要求により、その要求の対象となる書籍の書籍ベクトルをこの書籍ベクトルテーブル29から抽出し、抽出された書籍ベクトルを返信する。
〈検索サーバ〉
図6は、実施例1における検索サーバ10の構成を示す概念図である。
検索サーバ10は、ハードウェア構成として、図6に示されるように、バス35で接続される、制御部31、記憶部32、通信部33等を有する。記憶部32は、例えばハードディスクであり、制御部31で実行される処理で利用される各種情報を記憶する。制御部
31は、CPU等の1又は複数のプロセッサ、このプロセッサの処理に利用される周辺回路(ROM、RAM、インタフェース回路等)を有する。通信部33は、検索システム5の内部ネットワーク(図示せず)に接続され、特徴情報サーバ8及び受付サーバ7と検索サーバ10との間の通信を実行する。本発明は、検索サーバ10の通信形態を限定するものではなく、例えば、IPパケットにより実現される。検索サーバ10は、PC等のような汎用コンピュータで構築されてもよいし、専用コンピュータで構築されるようにしてもよい。本発明は、検索サーバ10のハードウェア構成を限定するものではない。
検索サーバ10は、記憶部32に記憶されるアプリケーションプログラムが制御部31により実行されることにより、図6に示す各処理ブロックを実現する。このような処理ブロックとして、検索サーバ10は、検索ワード取得部51、検索ベクトル取得部52、検索ワード解析部53、検索部54、検索ベクトル更新部55等を有する。これら処理ブロックにより参照されるデータベースとして、記憶部32には、検索ベクトルテーブル50が格納される。以下、これら検索サーバ10の各処理ブロックについてそれぞれ説明する。
検索ワード取得部51は、受付サーバ7から検索ワード及びユーザIDを受ける。検索ワード取得部51は、これらデータを検索ベクトル取得部52及び検索ベクトル更新部55へ送る。
検索サーバ10は、各検索ワードについてその検索ワードの特徴を示す特徴ベクトルを、ユーザ毎にそれぞれ管理する。これは、同一検索ワードであってもユーザ毎にその検索ワードに関し所望する書籍が異なる場合に対応するためである。以降、検索ワードの特徴を示す特徴ベクトルを検索ベクトルと表記する。各ユーザに関する各検索ワードについての検索ベクトルは検索ベクトルテーブル50により管理される。
図7は、検索ベクトルテーブル50の例を示す図である。検索ベクトルテーブル50には、ユーザ(各ユーザID)毎に、検索ワード及びその検索ワードについての検索ベクトルがそれぞれ格納される。
検索ベクトル取得部52は、検索ワード取得部51から送られる検索ワード及びユーザIDに基づいて、このユーザIDで特定されるユーザに関する、この検索ワードについての検索ベクトルを取得する。検索ベクトル取得部52は、検索ベクトルテーブル50に既にそのユーザIDに関するその検索ワードについての検索ベクトルが格納されている場合には、その既に格納されているレコードに含まれる検索ベクトルを今回の検索に利用するための検索ベクトルとして取得する。
検索ベクトル取得部52は、そのユーザID及び検索ワードについての検索ベクトルが検索ベクトルテーブル50に存在しない場合には、そのユーザIDの指定をなくしその検索ワードのみをキーに検索ベクトルテーブル50を検索する。すなわち、検索ベクトル取得部52は、他のユーザに関し保存されるその検索ワードについての検索ベクトルを当該検索ベクトルテーブル50から抽出する。検索ベクトル取得部52は、この抽出された検索ベクトルを今回の検索に利用するための検索ベクトルとする。
ところが、この抽出処理では、複数のユーザにおいてその検索ワードが登録されている場合があるため、複数の検索ベクトルが抽出される可能性がある。検索ベクトル取得部52は、複数の検索ベクトルが抽出された場合には、これら複数の検索ベクトルの平均を算出する(以下の(式2)参照)。下記(式2)におけるwnewは算出される検索ベクトルを示し、Sは検索ベクトルの集合を示し、wは抽出された各検索ベクトルを示す。これにより、算出される検索ベクトルでは、同一要素(単語)の値が検索ベクトル毎に加算さ
れ、検索ベクトル数で平均された値となる。検索ベクトル取得部52は、このように算出された検索ベクトルを今回の検索に利用するための検索ベクトルとする。
Figure 2011048646
また、検索ベクトル取得部52は、その検索ワードがいずれのユーザに関しても当該検索ベクトルテーブル50に格納されていない場合には、新たにその検索ワードについての検索ベクトルを生成するために、その検索ワードを検索ワード解析部53へ送る。検索ベクトル取得部52は、検索ワード解析部53からその検索ワードに含まれる各単語及び各品詞情報をそれぞれ受け、これら情報を用いて検索ベクトルを生成する。具体的には、検索ベクトル取得部52は、品詞情報が名詞、動詞、形容詞、感動詞、又は副詞を示す単語を検索ベクトルの各要素とし、各要素の値をその単語の出現数とする。検索ベクトル取得部52は、このようにして取得された検索ベクトルを今回の検索に利用するための検索ベクトルとする。
検索ベクトル取得部52は、上述のいずれかの方法により取得された今回の検索に利用するための検索ベクトルを検索部54へ送る。
検索ワード解析部53は、検索ベクトル取得部52から送られた検索ワードに対して形態素解析を行う。この形態素解析は、上述した特徴情報サーバ8の書評解析部25と同様の処理である。結果、検索ワード解析部53は、その検索ワードから、各単語列及び各品詞情報をそれぞれ取得し、これら情報を検索ベクトル取得部52へ送る。
検索部54は、検索ベクトル取得部52から検索ベクトルを受けると、この検索ベクトルに近い特徴を表す書籍ベクトルを有する書籍(ISBN)を書籍ベクトルテーブル29から抽出する。具体的には、検索部54は、検索ベクトルと書籍ベクトルテーブル29に格納される各書籍ベクトルとの類似度をそれぞれ算出し、類似度の高い書籍ベクトルを有する書籍から所定件数分の書籍を抽出し、この書籍(ISBN)のリストを生成する。この抽出する件数は予め調整可能にメモリに保持される。
以下の(式3)は、検索ベクトルと各書籍ベクトルとの類似度simを算出する計算式の例を示す。bは1つの書籍ベクトルを示し、wは検索ベクトルを示し、bは書籍ベクトル内の1つの要素の値を示し、wは検索ベクトル内の1つの要素の値を示す。|b|及び|w|は書籍ベクトル及び検索ベクトルの各要素数をそれぞれ示す。
Figure 2011048646
この(式3)では、類似度(sim)は0以上1以下の値を取り、両ベクトルが同一の場合に1を全く共通しない場合に0を取る。検索部54は、simの値が大きいものから
順に所定件数分抽出することにより書籍リスト(ISBNリスト)を生成する。検索部54は、この生成された書籍のリストを検索結果として受付サーバ7へ送る。
検索ベクトル更新部55は、検索部54による検索結果である書籍リストの中から実際に検索ユーザによって選択された書籍の情報に応じて、検索ベクトルテーブル50内のその検索ユーザに関するその検索ワードについての検索ベクトルを更新する。この更新処理を行うにあたり、検索ベクトル更新部55は、検索ワード取得部51から検索ワード及びユーザIDを受け、その検索ワードでの検索結果である書籍リストの中から実際に検索ユーザによって選択された書籍を示すISBNを受付サーバ7から受ける。
検索ベクトル更新部55は、その選択された書籍を示すISBNに対応する書籍ベクトルを書籍ベクトルテーブル29から抽出するように特徴情報サーバ8に要求し、書籍ベクトルテーブル29から抽出された書籍ベクトルを取得する。この書籍ベクトルを取得すると、検索ベクトル更新部55は、その検索ワード及びユーザIDをキーに検索ベクトルテーブル50を検索することにより、そのユーザIDに関しその検索ワードについての検索ベクトルが格納されているか否かを判定する。
検索ベクトル更新部55は、検索ベクトルテーブル50に該当するレコードが存在しない場合には、そのユーザIDに関するその検索ワードについての検索ベクトルとして上記取得された書籍ベクトルを検索ベクトルテーブル50に格納する。これにより、或る検索ユーザにとって或る検索ワードが始めて使われた場合には、その検索ワードによる検索結果から選択された書籍の書籍ベクトルがその検索ユーザに関するその検索ワードについての検索ベクトルとして登録される。
検索ベクトル更新部55は、そのユーザIDに関するその検索ワードについての検索ベクトルが既に検索ベクトルテーブル50に格納されている場合には、その既に格納されている検索ベクトルと上記取得された書籍ベクトルとの平均を計算する。この平均計算には、例えば上記(式2)が利用される。検索ベクトル更新部55は、算出されたベクトルに検索ベクトルテーブル50に格納される検索ベクトルを置き換える。
〔動作例〕
以下、実施例1における検索システムの動作例について図8から図10を用いて説明する。図8は、実施例1における検索システムの書評データ入力処理を示すフローチャートである。
情報入力ユーザは情報入力端末2を用いて受付サーバ7にアクセスすることにより書評入力用の画面を参照する。情報入力ユーザは、この画面上で或る書籍を指定し、この指定された書籍についての書評を入力する。ここでは、書籍Aについて、「この本は家族の絆をテーマとしており、ほのぼのとしつつ感動を与えてくれる」という書評が入力されたものとする。受付サーバ7は、指定された書籍を特定するISBN及びその書評データを情報入力端末2から取得する(S81)。なお、ISBNについては、書籍名等から他のサイトから取得するようにしてもよい。受付サーバ7は、これら取得された情報を特徴情報サーバ8へ送る。
特徴情報サーバ8では、書評管理部24が、書評データ及び書籍Aを示すISBNを受け、これらデータを書評テーブル28に格納する(S82)。この書評テーブル28の内容は、受付サーバ7を介して情報入力端末2に提供されるようにしてもよい。書評管理部24は、書評テーブル28を更新すると、その書評データ及び書籍Aを示すISBNを書評解析部25へ送る。
書評解析部25は、その書評データに対して形態素解析を行い、その書評データに含まれる複数の単語及び各単語についての品詞情報をそれぞれ取得する(S83)。書評解析部25は、取得された各単語及び各単語についての品詞情報をそれぞれ、ISBNと共に書籍ベクトル生成部26へ送る。
書籍ベクトル生成部26は、書評解析部25から各単語及び各単語についての品詞情報並びにISBNを受け、その書評データに対応する書籍ベクトルを生成する(S84)。ここで生成される書籍ベクトルは、本:1、家族:1、絆:1、テーマ:1、する:2、ほのぼの:1、感動:1、与える:1といった要素及び値をそれぞれ持つ。書籍ベクトル生成部26は、このように生成された書籍ベクトルを書籍Aを示すISBNと共に書籍ベクトル管理部27へ送る。
書籍ベクトル管理部27は、書籍ベクトルテーブル29をそのISBNをキーにして検索することによりその書籍Aについての書籍ベクトルが格納されているか否かを判断する(S85)。書籍ベクトル管理部27は、書籍Aについての書籍ベクトルが未だ格納されていないと判断すると(S85;NO)、上述のように書評データに対応して生成された書籍ベクトル及び書評数(1)並びにその書籍Aを示すISBNの設定されたレコードを書籍ベクトルテーブル29に追加する(S86)。これにより、書籍Aについて初めて書評が入力された場合には、その入力された書評データに基づいて生成された書籍ベクトルがそのままその書籍Aについての書籍ベクトルとして書籍ベクトルテーブル29に格納される。
一方で、書籍ベクトル管理部27は、書籍Aについての書籍ベクトルが既に書籍ベクトルテーブル29に格納されていると判断すると(S85;YES)、その既に格納されている書籍ベクトル(以降、既存書籍ベクトルと表記する)と、上述のように書評データに基づいて生成された書籍ベクトル(以降、新たな書籍ベクトルと表記する)との重み平均を計算する(S87)(上記(式1)参照)。この重み平均には、書評ベクトルテーブルに既に格納されているレコードに含まれる書評数(以降、既存書評数と表記する)が用いられる。
これにより、各書籍ベクトルの同一要素(同一単語)については、既存書籍ベクトルの要素値を既存書評数で重み付けした値に新たな書籍ベクトルの要素値を加算して得られた値を、今回の書評数(既存書評数に1加算した値)で除算した値が、その要素値となる。既存書籍ベクトルには含まれるが新たな書籍ベクトルに含まれない要素については、既存書籍ベクトルの要素値を既存書評数で重み付けした値を、今回の書評数で除算した値が、その要素値となる。既存書籍ベクトルに含まれず新たな書籍ベクトルに含まれる要素については、新たな書籍ベクトルの要素値を今回の書評数で除算した値が、その要素値となる。
書籍ベクトル管理部27は、書籍Aを示すISBNに関し既に書籍ベクトルテーブル29に格納されている書籍ベクトル及び書評数を、書評数で重み平均して得られた書籍ベクトル及び今回の書評数(既存書評数に1加算した値)に置き換える(S88)。これにより、既に書評が入力されている書籍Aについて新たに書評が入力された場合には、既存の書籍ベクトルは、その入力された書評データが反映された値に更新される。
図9は、実施例1における検索システムの検索処理を示すフローチャートである。図9に示される検索処理は、上述の図8に示される書評データ入力処理とは独立して実行される。
検索ユーザは検索端末3を用いて受付サーバ7にアクセスすることにより書籍検索用の
画面を参照する。検索ユーザは、この画面上に所望の検索ワードを入力し、検索実行操作を行う。ここでは、検索ユーザXが「泣ける」という検索ワードを入力し、検索実行操作を行ったものとする。これにより、受付サーバ7は、検索ユーザXにより入力された検索ワードデータ及び検索実行の指示を取得すると共に、検索ユーザXを特定するためのユーザIDを取得する(S91)。このユーザIDは、例えば、検索端末3から検索ユーザXにより入力される。受付サーバ7は、検索ワード(「泣ける」)、検索ユーザXを示すユーザIDを検索サーバ10へ送る。
検索サーバ10では、検索ワード取得部51が、検索ワード及びユーザIDを受け(S92)、これらデータを検索ベクトル取得部52及び検索ベクトル更新部55へ送る。なお、検索ベクトル更新部55により実行される、この検索ワード及びユーザIDを用いた処理については、図10を用いて後述する。図10に示される処理は、図9に示される検索処理の後に実行される。
検索ベクトル取得部52は、検索ベクトルテーブル50をその検索ワード及びユーザIDをキーにして検索することにより、ユーザID(検索ユーザX)と検索ワード(「泣ける」)とが対になるレコードが検索ベクトルテーブル50に格納されているか否かを判断する(S93)。検索ベクトル取得部52は、検索ユーザXに関する検索ワード(「泣ける」)が既に格納されていると判断すると(S93;YES)、検索ユーザXと検索ワード(「泣ける」)とが対になるレコードの検索ベクトルを検索ベクトルテーブル50から抽出する(S94)。これは、その検索ユーザXが以前にその検索ワード(「泣ける」)で書籍検索したことがある場合に相当する。この場合、検索ベクトル取得部52は、検索ベクトルテーブル50から抽出された検索ベクトルを検索部54へ送る。
一方で、検索ベクトル取得部52は、検索ユーザXに関する検索ワード(「泣ける」)が未だ格納されていないと判断すると(S93;NO)、更に、検索ユーザの指定を外して検索ワード(「泣ける」)のみで検索ベクトルテーブル50を検索する(S95)。この検索により、検索ベクトル取得部52は、検索ワード(「泣ける」)が検索ベクトルテーブル50に格納されていると判断すると(S95;YES)、検索ワード(「泣ける」)についての全検索ベクトルを検索ベクトルテーブル50から抽出する(S96)。
検索ベクトル取得部52は、抽出された検索ベクトルの平均を算出する(上記(式2)参照)(S97)。これにより算出された検索ベクトルは、抽出された各検索ベクトルの要素の和集合の要素を持ち、抽出された各検索ベクトル間で同一要素が多い要素の値が大きくなり、1つの検索ベクトルのみにしかない要素の値は検索ベクトル数で除算された値となる。この場合は、検索ユーザXにとってはその検索ワード(「泣ける」)での検索が初めてであるが、その検索ワード(「泣ける」)で検索した他の検索ユーザが存在する場合に相当する。よって、この場合には、他の検索ユーザのその検索ワード(「泣ける」)についての検索ベクトルに基づいて、検索ユーザXの検索ワード(「泣ける」)についての検索ベクトルが生成される。検索ベクトル取得部52は、このように生成された検索ベクトルを検索部54へ送る。
また、検索ベクトル取得部52は、検索ワード(「泣ける」)についての検索ベクトルが全く検索ベクトルテーブル50に格納されていないと判断すると(S95;NO)、その検索ワード(「泣ける」)を検索ワード解析部53へ送る。
検索ワード解析部53は、この検索ワードに対して形態素解析を行う(S98)。ここでは、「泣く」、「できる」のような各単語と各品詞情報とがそれぞれ取得され、これら情報が検索ベクトル取得部52へ送られる。
検索ベクトル取得部52は、検索ワード解析部53から送られた情報に基づいて、検索ワードに対応する検索ベクトルを生成する(S99)。生成された検索ベクトルは、品詞情報が名詞、動詞、形容詞、感動詞、又は副詞を示す単語をその要素とし、その単語の出現数を各要素の値とする。ここでは、検索ワード(「泣ける」)に対応する検索ベクトル(泣ける:1)が生成される。この場合は、いずれの検索ユーザもその検索ワード(「泣ける」)で検索したことがない場合に相当するため、参照する検索ベクトルが存在しないことから、その検索ワードに含まれる単語から検索ベクトルが生成される。検索ベクトル取得部52は、このように生成された検索ベクトルを検索部54へ送る。
検索部54は、上述の(S94)、(S97)及び(S99)のいずれか1つで取得された検索ベクトルを検索ベクトル取得部52から受ける。検索ベクトルを受けると、検索部54は、特徴情報サーバ8の書籍ベクトル管理部27に依頼することにより、書籍ベクトルテーブル29に格納される全レコードのデータを取得する。検索部54は、検索ベクトルと書籍ベクトルテーブル29から抽出された各書籍ベクトルとの類似度を全書籍について算出する(S100)。この類似度の算出には、例えば、上記(式3)が利用される。
検索部54は、算出された全類似度のうち類似度の高いものから所定件数分抽出し、それら抽出された各類似度を示す書籍ベクトルに対応する書籍をISBNを用いてそれぞれ特定する。検索部54は、この特定された書籍を示すISBNのリストを生成し(S101)、この生成されたISBNのリストを検索結果として受付サーバ7へ送る。
受付サーバ7は、このISBNのリストを受けると、各ISBNで特定される各書籍に関する情報を表示する検索結果画面を検索端末3へ送る。検索端末3では、この検索結果画面が表示される(S102)。検索ユーザXは、この検索端末3で表示される検索結果画面を参照することにより、入力した検索ワードにより検索された書籍のリストを得ることができる。
図10は、実施例1における検索システムの検索結果の選択時処理を示すフローチャートである。上述したように、図10に示す処理は、上述の図9の(S102)から引き続いて実行される。
検索ユーザXは、上述の(S102)において検索結果画面で表示される書籍のリストの中から少なくとも1つの書籍を選択する(S111)。例えば、この検索結果画面において書籍を選択することにより、その書籍を購入するための画面が受付サーバ7から提供される。購入しない場合であっても、検索ユーザXによりその書籍リストの中から気に入った書籍を選択する操作が行われるようにしてもよい。受付サーバ7は、検索ユーザXによるこのような何らかの操作により選択された書籍のISBNを取得する(S112)。受付サーバ7は、取得されたISBN及びその検索ユーザXを示すユーザIDと共に、書籍が選択された旨を検索サーバ10へ通知する。ここでは、書籍Bが選択されたものとする。
検索サーバ10では、検索ベクトル更新部55が、選択された旨、その選択された書籍Bを示すISBN、及び検索ユーザXを示すユーザIDを受ける。このとき、上述したように、検索ベクトル更新部55は、検索ワード取得部51から検索時に利用された検索ワード(「泣ける」)及び検索ユーザXを示すユーザIDを取得している(図9のS92)。検索ベクトル更新部55は、ユーザIDにより、検索ワードと実際に選択された書籍Bを示すISBNとの関連性を把握することができる。
検索ベクトル更新部55は、その書籍Bを示すISBNに対応する書籍ベクトルを書籍
ベクトルテーブル29から抽出するように特徴情報サーバ8に依頼し、その書籍Bを示すISBNに対応する書籍ベクトルを取得する(S113)。続いて、検索ベクトル更新部55は、検索ワード取得部51から送られていた検索ワード及びユーザIDをキーに検索ベクトルテーブル50を検索することにより、検索ユーザXの検索ワード(「泣ける」)についての検索ベクトルが検索ベクトルテーブル50に格納されているか否かを判定する(S114)。
検索ベクトル更新部55は、検索ユーザXの検索ワード(「泣ける」)についての検索ベクトルが検索ベクトルテーブル50に既に格納されていると判断すると(S114;YES)、検索ユーザXの検索ワード(「泣ける」)について既に格納されている検索ベクトルを抽出する(S115)。検索ベクトル更新部55は、この抽出された検索ベクトルと上記取得された書籍ベクトルとの平均を算出する(S116)。
検索ベクトル更新部55は、検索ユーザXの検索ワード(「泣ける」)について既に格納されている検索ベクトルを平均計算で算出されたベクトルに置き換える(S117)。この場合は、検索ユーザXがその検索ワード(「泣ける」)で以前に検索したことがある場合に相当する。これにより、この場合、以前に検索されたときに生成された検索ベクトルが、今回の検索での検索ワード(「泣ける」)で実際に検索ユーザXが望んだ書籍に関する特徴(書籍ベクトル)を強く示すように更新されることになる。
一方で、検索ベクトル更新部55は、検索ユーザXの検索ワード(「泣ける」)についての検索ベクトルが検索ベクトルテーブル50に未だ格納されていないと判断すると(S114;NO)、検索ユーザXの検索ワード(「泣ける」)についての検索ベクトルを上記取得された書籍ベクトルとするレコードを検索ベクトルテーブル50に追加する(S118)。この場合は、検索ユーザXがその検索ワード(「泣ける」)で初めて検索した場合に相当する。この場合、検索ユーザXがその検索ワード(「泣ける」)で望むのは今回選択された書籍であるという情報しか存在しないため、その検索ワードの特徴を示す情報(検索ベクトル)としてその書籍の特徴を示す情報(書籍ベクトル)とされる。
〔実施例1における作用及び効果〕
上述したように、実施例1における検索システム5では、特徴情報サーバ8が検索の対象となる各書籍についての書評をそれぞれ取得し、この取得された書評から各書籍についてその書籍の特徴を示す情報である書籍ベクトルがそれぞれ生成される。各書籍についての書籍ベクトルはそれぞれ特徴情報サーバ8の書籍ベクトルテーブル29に格納される。
各書籍ベクトルでは、書評に含まれる所定の単語がその要素とされ、各単語の出現数がその要素値とされる。これにより、実施例1で生成される書籍ベクトルでは各要素に重みが加えられることになるため、各書籍の特徴が精度よく表わされる。更に、各書籍ベクトルは、検索ユーザにより書評が入力される度にその入力された書評を考慮した形で(ベクトル平均され)更新されるため、書評の数に応じてその特徴を表わす精度が増すようになっている。
一方で、実施例1における検索サーバ10では、検索ユーザにとって所望の書籍を表わすとして入力された検索ワードを直接使って検索を行うのではなく、この検索ワードに基づいて生成されるその検索ワードの特徴を示す情報としての検索ベクトルが利用される。すなわち、実施例1における検索サーバ10では、その検索ワードについての検索ベクトルと類似度の高い書籍ベクトルを持つ書籍が検索結果としてリストアップされる。
これにより、書籍名、著者、出版社等のような固定的な検索ワードのみで検索されるのに比較して、その検索ワードに概念的な広がりを持たせた形での柔軟な検索を行うことが
できる。このような柔軟な検索は、検索に用いられる書籍ベクトルが書評から得られる特徴ベクトルとして生成されていること、及び、検索ベクトルが検索ワードの特徴ベクトルとして生成されていること等から奏される。
更に、実施例における検索サーバ10では、検索ワードとその検索ワードの特徴を示す情報である検索ベクトルが検索ユーザ毎にそれぞれ管理され(検索ベクトルテーブル50)、各検索ユーザが検索を実行する場合にはその検索ユーザに関し管理される検索ワードの検索ベクトルが利用される。
これにより、実施例1によれば、ユーザ毎にそのユーザに合った検索を行うことができる。具体的には、異なる検索ユーザにおいて異なる書籍がそれぞれ望まれながら同一検索ワードにより検索が行われたとしても、各検索ユーザにおいてそれぞれ所望の書籍を検索結果として提供することができる。
更に、実施例1では、検索サーバ10において上述のように検索された結果抽出された書籍リストの中からその検索ユーザによって実際に書籍が選択された場合には、その情報が検索サーバ10にフィードバックされる。検索サーバ10では、検索ベクトル更新部55が、このフィードバックされた書籍についての書籍ベクトルをその検索ユーザのその検索ワードについて管理される検索ベクトルに反映させる。また、その検索ユーザのその検索ワードについての検索ベクトルが未だ管理されていない場合には、その書籍ベクトルがその検索ベクトルとされ管理され始める。即ち、実施例1では、各検索ユーザの各検索ワードについて管理される検索ベクトルが実際にその検索ユーザがその検索ワードで望んだ書籍の特徴を示す書籍ベクトルで更新される。
従って、各検索ワードについての検索ベクトルは、各検索ユーザに適合した特徴を表わすようになっていく。結果、実施例1によれば、検索ユーザは、検索を実行する度に自身の望みに合った検索結果を得ることができるようになるため、検索ユーザにとって自身に適合する検索手段を得ることができる。
また、実施例1では、例え、検索ユーザが検索にあたり初めて或る検索ワードを使った場合であっても、他の検索ユーザに関し管理及び学習されているその或る検索ワードについての検索ベクトルが利用される。すなわち、実施例1では、他の検索ユーザ同士で学習された内容が共有されるため、検索経験の少ない検索ユーザであっても或る程度自身の望みに合った検索結果を得ることができる。
[変形例]
上述の実施例1では、説明の便宜のため、検索される商品の例として書籍を挙げたが、本発明はこのような検索対象商品の種類を限定するものではない。
書籍でない商品を扱う場合には、その商品についての評価、感想等を特徴情報サーバ8の書評テーブル28で管理するようにすればよい。また、その商品が、その商品を特定するための書籍のISBNのような標準的なIDを持たない場合には、当該検索システムにおいて付与するようにしてもよいし、ユーザに入力させるようにしてもよい。
また、上述の実施例1では、書籍の特徴を示す情報として書評に含まれる単語を用いたが、それ以外の情報を用いるようにしてもよい。それ以外の情報として、例えば、インターネット上のニュースサイトやブログサイト等からその書籍についての情報を取得し、この情報に含まれる単語を用いるようにしてもよい。
また、上述の実施例1における検索サーバ10では、検索部54が検索ベクトルと各書
籍ベクトルとの類似度の計算を上記(式3)で求めたが、以下の式(4)で求めるようにしてもよい。この(式4)を用いれば、各ベクトルの要素の値を用いていないため、(式3)に比較して類似度の算出精度は落ちるものの計算量を削減することができる。
Figure 2011048646
また、上述の実施例1では、検索ワードが取得されることが前提となっていたが、検索ワード入力なしにその検索ユーザが所望する可能性の高い書籍のリストを検索するようにしてもよい。この場合には、図11の例に示すように、検索ベクトルテーブル50に使用回数フィールドを追加する。図11は、検索ベクトルテーブル50の変形例を示す図である。検索ベクトル更新部55が検索ベクトルテーブル50の検索ベクトルを更新する際に、その検索ユーザによるその検索ワードの使用回数も合わせて更新するようにする。そして、検索ベクトル取得部52が検索ワード未使用の検索が指示されたことを認識すると、検索ベクトルテーブル50からその検索ユーザに関し使用回数の高い検索ワードの検索ベクトルを取得するようにする。結果、この使用回数の高い検索ワードの検索ベクトルが利用されて検索が実行される。
このようにすれば、検索ワード入力なしにその検索ユーザが所望する可能性の高い書籍のリストを提供することができる。
1 ネットワーク
2 情報入力端末
3 検索端末
5 検索システム
7 受付サーバ
8 特徴情報サーバ
10 検索サーバ
20、31 制御部
21、32 記憶部
23、33 通信部
24 書評管理部
25 書評解析部
26 書籍ベクトル生成部
27 書籍ベクトル管理部
28 書評テーブル
29 書籍ベクトルテーブル
50 検索ベクトルテーブル
51 検索ワード取得部
52 検索ベクトル取得部
53 検索ワード解析部
54 検索部
55 検索ベクトル更新部

Claims (8)

  1. 各商品について特徴情報をそれぞれ格納する商品特徴格納部と、
    各検索ワード及び各検索ワードについての特徴情報をそれぞれ検索ユーザ毎に格納する検索特徴格納部と、
    検索時に、検索ワード及び検索ユーザを特定する情報を取得する検索情報取得手段と、
    前記検索情報取得手段により取得された検索ワード及び検索ユーザを特定する情報を用いて前記検索特徴格納部を検索することにより、その検索ユーザに関し格納されている、その取得された検索ワードについての特徴情報を取得する特徴取得手段と、
    前記特徴取得手段により取得された検索ワードの特徴情報と前記商品特徴格納部に格納されている各商品についての特徴情報とをそれぞれ比較することによりその検索ワードの特徴情報と類似する特徴情報を持つ商品のリストを生成する検索手段と、
    を備えることを特徴とする検索装置。
  2. 前記検索手段により生成された商品のリストの中から前記検索ユーザによって選択された商品に関する情報を取得する取得手段と、
    前記取得手段により取得された情報を用いて前記商品特徴格納部から前記検索ユーザによって選択された商品についての特徴情報を抽出し、この抽出された選択商品についての特徴情報を、前記検索特徴格納部に格納される、前記検索ユーザに関する前記取得された検索ワードについての特徴情報に反映させる更新手段と、
    を更に備えることを特徴とする請求項1に記載の検索装置。
  3. 前記更新手段は、前記検索ユーザに関する前記取得された検索ワードについての特徴情報が前記検索特徴格納部に格納されていない場合には、前記抽出された選択商品についての特徴情報を、前記検索ユーザに関するその取得された検索ワードについての特徴情報として、前記検索特徴格納部に格納することを特徴とする請求項2に記載の検索装置。
  4. 商品についてのユーザの思考を示す少なくとも1つの単語を含む文字列データを取得し、この文字列データを構成する単語情報を取得する解析手段と、
    前記解析手段により取得された単語情報に基づいて、前記文字列データに含まれる所定品詞の単語を要素としその単語の出現数をその要素の値とする特徴ベクトルを前記商品についての特徴情報として生成する特徴情報生成手段と、
    を更に備え、
    前記商品特徴格納部は、各商品について前記特徴情報生成手段により生成された各特徴ベクトルを特徴情報としてそれぞれ格納する、
    ことを特徴とする請求項1から3のいずれか1項に記載の検索装置。
  5. 前記特徴取得手段は、前記検索ユーザに関する前記取得された検索ワードについての特徴情報が前記検索特徴格納部に格納されていない場合には、他の検索ユーザに関し前記検索特徴格納部に格納されるその取得された検索ワードについての特徴情報を抽出し、この抽出された特徴情報から得られる特徴情報を前記検索ユーザに関するその取得された検索ワードについての特徴情報とすることを特徴とする請求項1から4のいずれか1項に記載の検索装置。
  6. 前記特徴取得手段は、前記取得された検索ワードについての特徴情報が前記検索特徴格納部に格納されていない場合には、その取得された検索ワードに含まれる単語及びその数に基づいてその取得された検索ワードについての特徴情報を生成することを特徴とする請求項1から5のいずれか1項に記載の検索装置。
  7. コンピュータが、
    各商品について特徴情報を商品特徴格納部にそれぞれ格納するステップと、
    各検索ワード及び各検索ワードについての特徴情報をそれぞれ検索ユーザ毎に検索特徴格納部に格納するステップと、
    検索時に、検索ワード及び検索ユーザを特定する情報を取得するステップと、
    前記取得された検索ワード及び検索ユーザを特定する情報を用いて前記検索特徴格納部を検索することにより、その検索ユーザに関し格納されている、その取得された検索ワードについての特徴情報を取得するステップと、
    前記取得された検索ワードの特徴情報と前記商品特徴格納部に格納されている各商品についての特徴情報とをそれぞれ比較することによりその検索ワードの特徴情報と類似する特徴情報を持つ商品のリストを生成するステップと、
    を実行することを特徴とする検索方法。
  8. コンピュータに、
    各商品について特徴情報を商品特徴格納部にそれぞれ格納するステップと、
    各検索ワード及び各検索ワードについての特徴情報をそれぞれ検索ユーザ毎に検索特徴格納部に格納するステップと、
    検索時に、検索ワード及び検索ユーザを特定する情報を取得するステップと、
    前記取得された検索ワード及び検索ユーザを特定する情報を用いて前記検索特徴格納部を検索することにより、その検索ユーザに関し格納されている、その取得された検索ワードについての特徴情報を取得するステップと、
    前記取得された検索ワードの特徴情報と前記商品特徴格納部に格納されている各商品についての特徴情報とをそれぞれ比較することによりその検索ワードの特徴情報と類似する特徴情報を持つ商品のリストを生成するステップと、
    を実行させることを特徴とする検索プログラム。
JP2009196823A 2009-08-27 2009-08-27 検索装置、方法及びプログラム Pending JP2011048646A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009196823A JP2011048646A (ja) 2009-08-27 2009-08-27 検索装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009196823A JP2011048646A (ja) 2009-08-27 2009-08-27 検索装置、方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2011048646A true JP2011048646A (ja) 2011-03-10

Family

ID=43834892

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009196823A Pending JP2011048646A (ja) 2009-08-27 2009-08-27 検索装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2011048646A (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001014227A (ja) * 1999-06-30 2001-01-19 Nec Corp タイムアウト時間更新方法及びその装置並びにプログラムを記録した機械読み取り可能な記録媒体
JP2001014337A (ja) * 1999-06-30 2001-01-19 Sharp Corp 検索装置及び検索プログラムを記録した記録媒体
JP2001265808A (ja) * 2000-03-22 2001-09-28 Skysoft Inc 情報検索システム及び情報検索方法
JP2002269106A (ja) * 2001-03-08 2002-09-20 Dainippon Printing Co Ltd 書籍紹介装置
JP2003141163A (ja) * 2001-11-05 2003-05-16 Nippon Telegr & Teleph Corp <Ntt> 情報蓄積・検索装置及び方法、情報蓄積・検索プログラムならびにそのプログラムを記録した記録媒体
JP2005322165A (ja) * 2004-05-11 2005-11-17 Nippon Telegr & Teleph Corp <Ntt> 検索キーワード提示方法及び装置及びプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001014227A (ja) * 1999-06-30 2001-01-19 Nec Corp タイムアウト時間更新方法及びその装置並びにプログラムを記録した機械読み取り可能な記録媒体
JP2001014337A (ja) * 1999-06-30 2001-01-19 Sharp Corp 検索装置及び検索プログラムを記録した記録媒体
JP2001265808A (ja) * 2000-03-22 2001-09-28 Skysoft Inc 情報検索システム及び情報検索方法
JP2002269106A (ja) * 2001-03-08 2002-09-20 Dainippon Printing Co Ltd 書籍紹介装置
JP2003141163A (ja) * 2001-11-05 2003-05-16 Nippon Telegr & Teleph Corp <Ntt> 情報蓄積・検索装置及び方法、情報蓄積・検索プログラムならびにそのプログラムを記録した記録媒体
JP2005322165A (ja) * 2004-05-11 2005-11-17 Nippon Telegr & Teleph Corp <Ntt> 検索キーワード提示方法及び装置及びプログラム

Similar Documents

Publication Publication Date Title
KR100692209B1 (ko) 맞춤형 상품 정보 제공 방법 및 그 시스템
US9727906B1 (en) Generating item clusters based on aggregated search history data
JP5541049B2 (ja) データ生成装置、データの生成方法及びデータ生成プログラム
TW201533590A (zh) 建立詞素重要性分析模型的方法及裝置
CN104572846A (zh) 一种热词推荐方法、装置和系统
CN109168047B (zh) 视频推荐方法、装置、服务器及存储介质
JP6664599B2 (ja) 曖昧性評価装置、曖昧性評価方法、及び曖昧性評価プログラム
US20170287041A1 (en) Information processing apparatus, information processing method, and information processing program
JP2008112355A (ja) ブックマーク管理装置,ブックマーク管理プログラムおよびブックマーク管理方法
JP2008158893A (ja) 情報検索装置、情報検索プログラム、プログラム格納媒体
JP4743766B2 (ja) 印象判定システム、広告記事生成システム、印象判定方法、広告記事生成方法、印象判定プログラムおよび広告記事生成プログラム
US20220237245A1 (en) Description set based searching
JP2012043289A (ja) 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体
JP6501936B1 (ja) 情報処理装置、情報処理方法、およびプログラム
KR101866411B1 (ko) 문서 추천 정보를 제공하는 방법 및 이를 이용하는 문서 추천 정보 제공 장치
CN110110217A (zh) 一种对信息的情感倾向性分析及信息推荐方法和装置
JP2009223372A (ja) リコメンド装置、リコメンドシステム、リコメンド装置の制御方法、およびリコメンドシステムの制御方法
JPH11296537A (ja) 情報検索システム、情報提供装置、情報検索端末装置、情報検索方法および記憶媒体
JP3547338B2 (ja) 情報検索方法及び装置
JP4749242B2 (ja) 類似キャラクタデータ検索方法、サーバおよびプログラム
JP2011048646A (ja) 検索装置、方法及びプログラム
JP7088656B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP5613699B2 (ja) 商品推薦装置及び方法及びプログラム
JP6851944B2 (ja) 検索システム、および検索方法
JP2009193202A (ja) 情報検索方法、検索装置及び検索プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120808

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130809

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130827

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140408

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140826