JP2015005050A - 検索支援装置及び検索支援プログラム - Google Patents

検索支援装置及び検索支援プログラム Download PDF

Info

Publication number
JP2015005050A
JP2015005050A JP2013128823A JP2013128823A JP2015005050A JP 2015005050 A JP2015005050 A JP 2015005050A JP 2013128823 A JP2013128823 A JP 2013128823A JP 2013128823 A JP2013128823 A JP 2013128823A JP 2015005050 A JP2015005050 A JP 2015005050A
Authority
JP
Japan
Prior art keywords
search
user
synonym
word
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013128823A
Other languages
English (en)
Other versions
JP5777663B2 (ja
Inventor
護智 北城
Moritomo Hojo
護智 北城
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2013128823A priority Critical patent/JP5777663B2/ja
Publication of JP2015005050A publication Critical patent/JP2015005050A/ja
Application granted granted Critical
Publication of JP5777663B2 publication Critical patent/JP5777663B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】インターネット検索において、検索者により入力された検索語よりも適切な検索語を、入力された検索語に対する同義語の中から決定する。【解決手段】本発明にかかる検索支援装置は、ユーザからの入力語を受け付ける入力手段と、入力語及び該入力語の同義語を、それぞれ検索語として情報検索した結果に基づいて収集されたユーザの行動実績値を記憶した記憶手段と、入力語に対するユーザの行動実績値と、同義語に対するユーザの行動実績値とに基づいて、入力語又は同義語の何れかを検索語と決定する決定手段とを有する。【選択図】図6

Description

本発明は、検索支援装置及び検索支援プログラムの技術に関する。
従来より、同義語辞書から検索語の同義語を取得し、同義語を用いて検索を行う技術がある。例えば、特許文献1には、特許検索などの際、予め容易された同義語辞書と該当件数(ヒット件数)に基づいて、検索語として採用すべき同義語を特定する検索支援装置が記載されている。
特開2012−118764号公報
しかしながら、インターネット上の検索エンジンでは、該当件数の多い少ないは、必ずしも検索結果の価値を意味する訳ではない。つまり、検索者の入力した検索語を基に、いかにして検索者の求める適切な検索結果を検索できるかが重要となる。このため、入力された検索語を、該当件数(ヒット件数)に基づく同義語に置き換えたり検索語の代替候補として提示しても、必ずしも検索結果の価値が改善しないという問題があった。
本発明は上記の点に鑑み提案されたものであり、インターネット検索において、検索者により入力された検索語よりも適切な検索語を、入力された検索語に対する同義語の中から決定することにある。
上記の課題を解決するため、本発明にかかる検索支援装置にあっては、ユーザからの入力語を受け付ける入力手段と、前記入力語及び該入力語の同義語を、それぞれ検索語として情報検索した結果に基づいて収集されたユーザの行動実績値を記憶した記憶手段と、前記入力語に対するユーザの行動実績値と、前記同義語に対するユーザの行動実績値とに基づいて、前記入力語又は前記同義語の何れかを検索語と決定する決定手段とを有する。
本発明の実施形態によれば、インターネット検索において、検索者により入力された検索語よりも適切な検索語を、入力された検索語に対する同義語の中から決定することができる。このため、例えば、検索者は、入力した検索語に対する同義語に基づいて、適切な検索結果を検索することができる。
検索システムのネットワーク構成図である。 検索支援サーバ1のハードウェア構成例を示す図である。 検索支援サーバ1のソフトウェア構成例を示す図である。 同義語DB101aのデータ構成例を示す図である。 ユーザ検索行動実績DB101bのデータ構成例を示す図である。 検索支援サーバ1の検索語決定理例を示すフローチャートである。 検索結果例(その1)を示す図である。 検索結果例(その2)を示す図である。
以下、本発明の好適な実施形態につき説明する。
<構成>
(ネットワーク構成)
図1は、本発明の一実施形態にかかる検索システムのネットワーク構成図である。検索システムは、検索支援サーバ1及び端末2が、ネットワーク3を介して接続される。
検索支援サーバ1は、端末2に対して、インターネット上の情報を検索する情報検索サービスを提供する。よって、検索支援サーバ1は、例えば、いわゆる検索エンジンとして構成される。検索支援サーバ1は、ユーザの端末2から検索語が入力されると、入力された検索語の同義語の中から、入力された検索語よりも検索語として適切な同義語が存在するかどうかを判定する。そして、検索支援サーバ1は、検索語としてより適切な同義語が存在する場合、その同義語を検索語として置換し、インターネット上から同義語にマッチする情報を検索する(詳細後述)。
端末2は、ユーザ(検索者)の利用するユーザ端末である。ユーザは端末2を用いて検索支援サーバ1にアクセスし、その検索画面から検索語を入力することで、インターネット上の情報(例えば、Webサイト等)を検索する。また、検索語としてより適切な同義語が存在する場合、検索画面上、その同義語が検索語として提示される。ユーザは提示された同義語を選択することで、提示された同義語にマッチする情報をインターネット上から検索する(詳細後述)。
なお、端末2は、PC(Personal Computer)、スマートフォン、タブレットPC、携帯電話等の情報処理機器から構成される。また、検索支援サーバ1にアクセスし検索画面を閲覧するため、例えば、Webブラウザなどのアプリケーションプログラムを備える。
ネットワーク3は、有線、無線を含む通信ネットワークであり、例えば、検索支援サーバ1及び端末2を接続するインターネット網である。
(ハードウェア構成)
図2は、本発明の一実施形態にかかる検索支援サーバ1のハードウェア構成例を示す図である。検索支援サーバ1は、CPU(Central Processing Unit)11、ROM(Read Only Memory)12、RAM(Random Access Memory)13、入力装置14、出力装置15、通信装置16、HDD(Hard Disk Drive)17を有する。
CPU11は、各種プログラムの実行や演算処理を行う。ROM12は、起動時に必要なプログラムなどが記憶されている。RAM13は、CPU11での処理を一時的に記憶したり、データを記憶したりする。入力装置14は、キーボードやマウスである(タッチパネルを含む)。出力装置15は、映像や画像を表示出力するディスプレイや、音声等を出力するスピーカーである。通信装置16は、ネットワーク3を介し、例えば端末2など他装置との通信を行う。HDD17は、各種データ及びプログラムを格納する記憶装置の一例である。
(ソフトウェア構成)
図3は、本発明の一実施形態にかかる検索支援サーバ1のソフトウェア構成例を示す図である。検索支援サーバ1は、主な機能部として、記憶部101、入力部102、同義語取得部103、ユーザ検索行動実績取得部104、検索語決定部105、検索部106を有する。
記憶部101は、同義語DB(Database)101a、ユーザ検索行動実績DB101bを記憶する。同義語DB101aは、あらゆる語(ワード)と、その語に対する同義語とが登録されたデータベース(同義語辞書)である。ユーザ検索行動実績DB101bは、あらゆる語(ワード)ごとに、その語が検索語として情報検索された結果に基づいて収集されたユーザの検索行動実績情報がデータベース(同義語辞書)である。これらDBについては具体例と共に後述する。
入力部102は、例えば、検索画面(検索窓)を介し、ユーザからの入力語を受け付ける。ユーザは情報を検索するため、検索した情報にマッチすると考える語(ワード)を入力語として入力する。なお、通常、ユーザが入力する語(ワード)は「検索語」と呼ばれるが、本実施形態では、ユーザからの入力語の「同義語」が検索語として用いられる場合がある。このため、ユーザから入力される語(ワード)はひとまず「入力語」と呼ぶものとしている。
同義語取得部103は、同義語DB101aを参照し、ユーザからの入力語の同義語を取得する。なお、入力語の同義語が複数存在する場合には、複数の同義語が取得される。
ユーザ検索行動実績取得部104は、ユーザ検索行動実績DB101bを参照し、ユーザからの入力語に対するユーザ検索行動実績を取得する。また、入力語の同義語に対するユーザ検索行動実績を取得する。複数の同義語が取得されている場合、同義語に対するユーザ検索行動実績も複数取得される。
検索語決定部105は、ユーザからの入力語に対するユーザ検索行動実績と、ユーザからの入力語の同義語に対するユーザ検索行動実績とに基づいて、ユーザからの入力語又は入力語の同義語の何れかを、検索語と決定する。
検索部106は、検索語を用いて、検索語にマッチする情報(例えば、Webサイト等)を検索し、その検索結果を端末2へ送信する。検索語は、検索語決定部105により決定されるもので、ユーザからの入力語又は入力語の同義語の何れかである。
以上、検索支援サーバ1の主な機能構成である。これらの各機能は、実際には検索支援サーバ1のCPU11が実行するプログラムによりコンピュータに実現させることで実現される。
(同義語DB101a)
図4は、本発明の一実施形態にかかる同義語DB101aのデータ構成例を示す図である。
同義語DB101aは、一般に意味が同義とされる語(ワード)をDBとして格納するもので、同義語取得部103により、ユーザからの入力語に対する同義語を取得する際に参照される。例えば、「かばん」の同義語として、「バッグ」、「カバン」、「鞄」などがある。また、「本」の同義語として、「ブック」、「書籍」、「図書」などがある。
例えば、ユーザから入力語「かばん」が入力されると、同義語取得部103は、同義語DB101aを参照し、入力語「かばん」に対する同義語「バッグ」、「カバン」、「鞄」を取得する。
なお、本実施形態において、検索支援サーバ1が予め構築済みの同義語DB101aを有していればよく、同義語DB101aの内容については従来の言語解析技術等により構築されればよい。
(ユーザ検索行動実績DB101b)
図5は、本発明の一実施形態にかかるユーザ検索行動実績DB101bのデータ構成例を示す図である。
ユーザ検索行動実績DB101bは、「検索語」と、その「検索語」に対するユーザ検索行動実績である「検索回数」、「PV(Page view)」、「CTR(Click Through Rate)」をDBとして格納する。ユーザ検索行動実績取得部104により、ユーザからの入力語に対するユーザ検索行動実績や、その入力語の同義語に対するユーザ検索行動実績を取得する際に参照される。
ユーザ検索行動実績DB101bは次のようにして、過去の一定期間の間、データ収集され構築される。
通常、検索支援サーバ1(又は他の情報検索サービスを提供するサーバでもよい)は、不特定多数ユーザにより検索画面を通じて検索語が入力されることで、検索結果を応答している。例えば、検索結果として、入力された検索語にマッチするWebサイトなどの一覧がリスト形式で表示される。
このとき、検索語として使用された「検索語」毎に、その検索に使用された回数をカウントし、そのカウント値を「検索回数」(累積値)に格納する。例えば、「バッグ」という検索語は、これまで不特定多数ユーザにより50297回、検索語として検索に使用された実績があることが分かる。このことから、「検索回数」が多いほど、その「検索語」は、世間一般で広く認識されよく検索語(クエリ)として使用されていることを意味するといえる。
次に、「PV」は、検索結果に対するユーザの応答ページ数である。インターネット上の情報検索の場合、例えば、検索結果として、入力された検索語にマッチするWebサイトなどの一覧がリスト形式で表示される。このとき、リスト内のあるWebサイトへのリンクがクリックされて参照されると、参照されたページ数をカウントし、カウント値を「PV」(累積値)に格納する。このことから、「PV」が多いほど、その「検索語」の検索語としての適切さ、検索結果のユーザ応答(反応)の良好さを意味するといえる。一方、ユーザが「検索語」を入力し、その検索結果が望むような検索結果でなければ、ユーザはその検索結果のWebサイトを参照しようとはしないので、そのような「検索語」に対する「PV」は少なくなる。なお、「PV」は、1つの検索結果画面中、複数のWebサイトが参照された場合、参照された複数ページ数分をカウントする。
次に、「CTR」は、検索結果に対するユーザの応答率である。例えば、検索結果として、入力された検索語にマッチするWebサイトなどの一覧がリスト形式で表示された場合、ユーザが1つでもリスト内のあるWebサイトへのリンクをクリックし参照すると、ユーザ応答ありとする。よって、「CTR」=ユーザ応答数/「検索回数」×100で算出される。このことから、「CRT」が多いほど、その「検索語」の検索語としての適切さ、検索結果のユーザ応答(反応)の良好さを意味するといえる。一方、ユーザが「検索語」を入力し、その検索結果が望むような検索結果でなければ、ユーザはその検索結果のWebサイトを1つも参照しようとはしないので、そのような「検索語」に対する「CTR」は少なくなる。
以上のように、本実施形態では、ユーザ検索行動実績を計りうる指標として、「検索回数」、「PV(Pageview)」、「CTR(Click Through Rate)」を例示する。ユーザ検索行動実績は、実際の不特定多数のユーザによる検索実績及びユーザ応答実績に基づいて、検索部106又は他の適宜な手段(例えば、図示しない実績記録手段など)により生成される。このため、いずれもユーザ所望の検索結果を導くための「検索語」として、その適切さを評価する指標といえる。
例えば、検索語「かばん」と、検索語「バッグ」とを比較すると、「検索回数」は、それぞれ7678と、50297である。これは、世間一般では、「かばん」よりも「バッグ」という検索語が広く認識され検索語として使用されていることを意味する。よって、この場合、あるユーザが検索語「かばん」を入力した場合、同義語である「バッグ」を検索語として使用(置換)した方がより適切な検索結果を得られる可能性がある。
また、例えば、検索語「かばん」と、検索語「バッグ」とを比較すると、「PV」は、それぞれ8231と、54975ある。これは、世間一般では、「かばん」よりも「バッグ」という検索語に対する検索結果の方が広く支持されていることを意味する。よって、この場合、あるユーザが検索語「かばん」を入力した場合、同義語である「バッグ」を検索語として使用(置換)した方がより適切な検索結果を得られる可能性がある。
また、例えば、検索語「かばん」と、検索語「バッグ」とを比較すると、「CTR」は、それぞれ31.47%と、58.93%である。これは、世間一般では、「かばん」よりも「バッグ」という検索語に対する検索結果の方が広く支持されていることを意味する。よって、この場合、あるユーザが検索語「かばん」を入力した場合、同義語である「バッグ」を検索語として使用(置換)した方がより適切な検索結果を得られる可能性がある。
なお、上述の「検索回数」、「PV(Page view)」、「CTR(Click Through Rate)」は、ユーザ検索行動実績を計りうる指標の一例である。よって、例えば、検索支援サーバ1がその値を追跡しうる範囲において、この他にも様々な指標があってよい。
例えば、「検索語」に対する検索結果が端末2に送信又は表示されてから、その検索結果に含まれるWebサイトのハイパーリンクが最初に操作されるまでの応答時間や、「検索語」に対する検索結果から遷移した先の所定の電子商取引Webサイトでの商品成約率なども指標となる。「検索語」に対する検索結果の応答時間は、応答時間が短いほどユーザ応答(反応)の良さ、即ちユーザにとって良い検索結果を得られたことを意味するからである。また、「検索語」に対するその後の商品成約率は、成約率が高いほどユーザ応答(反応)の良さ、ユーザにとって良い検索結果を得られたということの延長上にある指標といえる。
<動作>
図6は、本発明の一実施形態にかかる検索支援サーバ1の検索語決定処理を示すフローチャートである。以下、図面を参照しながら、詳しく説明する。なお、前提として、検索支援サーバ1は、予め構築済みの同義語DB101a及びユーザ検索行動実績DB101bを有している。
S1:入力部102は、検索要求(入力語を含む)を受信したか否かを判定する。例えば、入力部102は、検索画面(検索窓)を介し、ユーザの端末2から入力語を受け付けた場合、検索要求(入力語を含む)を受信したと判定できる。検索要求は、API(Application Programming Interface)によるものでもよい。
S2:同義語取得部103は、同義語DB101aを参照し、検索要求に含まれる入力語に基づいて、入力語の同義語を取得する。なお、入力語の同義語が複数存在する場合には、複数の同義語が取得される。
例えば、ユーザから入力語「かばん」が入力された場合、同義語取得部103は、同義語DB101a(図4)を参照し、入力語「かばん」に対する同義語「バッグ」、「カバン」、「鞄」を取得する。
S3:同義語取得部103は、同義語があったか否かを判定する。同義語がある場合、S4へ進む。一方、同義語がない場合、S8へ進む。
S4:ユーザ検索行動実績取得部104は、ユーザ検索行動実績DB101b(図5)を参照し、入力語(S1で取得)に対するユーザ検索行動実績を取得する。また、入力語の同義語(S2で取得)に対するユーザ検索行動実績を取得する。なお、複数の同義語が取得されている場合、同義語に対するユーザ検索行動実績も複数取得される。
例えば、入力語「かばん」に対し、例えば、ユーザ検索行動実績の1つである「CTR」31.47%を取得する。また、入力語「かばん」の同義語「バッグ」に対し、「CTR」58.93%を取得する。また、入力語「かばん」の同義語「カバン」に対し、「CTR」29.25%を取得する。また、入力語「かばん」の同義語「鞄」に対し、「CTR」50.36%を取得する。
S5:検索語決定部105は、ユーザ検索行動実績が最もよい入力語又は同義語を特定する。例えば、入力語「かばん」、同義語「バッグ」、同義語「カバン」、同義語「鞄」において、ユーザ検索行動実績の1つである「CTR」によれば、同義語「バッグ」が最も高い値58.93%を有している。よって、この場合、検索語決定部105は、同義語「バッグ」を特定する。
S6:検索語決定部105は、同義語を特定したか否かを判定する。同義語を特定した場合、S7へ進む。一方、同義語を特定しない場合(入力語を特定した場合)、S8へ進む。
S7:検索語決定部105は、S5で特定した同義語を検索語と決定する。
S8:一方、検索語決定部105は、S1で受信した入力語を検索語と決定する。
S9:検索部106は、検索語を使用して検索を実行し、検索結果を出力する。S7で、同義語を検索語と決定した場合、入力語は同義語に置換されて、同義語(例えば、「バッグ」)が検索語として使用される。一方、S8で、入力語を検索語と決定した場合、ユーザ入力通り、入力語(例えば、「かばん」)が検索語として使用される。
なお、説明を分かり易くするため、S4、5で、ユーザ検索行動実績として「CTR」を利用した。しかしながら、ユーザ検索行動実績として「検索回数」又は「PV」を利用してもよい。また、「検索回数」、「PV」及び「CTR」の全部又は任意の二つを利用してもよい。この場合、それぞれに重みなどを与え、検索語決定部105は、総合的にユーザ検索行動実績が最もよい入力語又は同義語を特定することができる。
<検索結果例>
図7は、本発明の一実施形態にかかる検索結果例(その1)を示す図である。
図7(a)では、入力語「かばん」701の同義語「バッグ」702が検索語として使用され、その検索結果703が表示されている。入力語「かばん」の同義語「バッグ」は、入力語「かばん」よりも、より適切な検索結果が期待できる検索語である(図6のS5、6、7のケース)。よって、ユーザによる置換の確認操作を待つことなく入力語「かばん」が同義語「バッグ」に置換されて検索されたことにより、ユーザはより適切な検索結果を早く得ることできる。
一方、図7(b)では、入力語「かばん」701が検索語として使用され、その検索結果704が表示されている。入力語「かばん」は、他の同義語と比べても、より適切な検索結果が期待できる検索語である(図6のS5、6、8のケース)。よって、ユーザ入力通り、入力語「かばん」が検索されたことにより、ユーザはより適切な検索結果を得ることできる。
図8は、本発明の一実施形態にかかる検索結果例(その2)を示す図である。
図8(a)では、入力語「かばん」801が検索語として使用され、その検索結果803が表示されている。しかしながら、入力語「かばん」の同義語「バッグ」は、入力語「かばん」よりも、より適切な検索結果が期待できる検索語である(図6のS5、6、7のケース)。よって、この場合、一旦はユーザ入力通り、入力語「かばん」での検索結果803を表示する。同時に、検索結果803において、例えば、「「バッグ」で検索してみませんか?」802との置換検索語を表示する。これにより、ユーザの入力語を尊重しながら、ユーザは、入力語「かばん」での検索結果803に所望の検索結果が得られないような場合、再度、提示されている「バッグ」で再検索することで、ユーザはより適切な検索結果を得ることできる。
図8(b)では、入力語「かばん」801が検索語として使用され、その検索結果803が表示されている。しかしながら、仮に、ユーザ検索行動実績として「検索回数」又は「PV」を利用する場合、入力語「かばん」の同義語「バッグ」に加え、同義語「鞄」及び同義語「カバン」も、入力語「かばん」よりは、より適切な検索結果が期待できる検索語である(図6のS5、6、7のケース)。よって、この場合、一旦はユーザ入力通り、入力語「かばん」での検索結果803を表示する。同時に、検索結果803において、例えば、「「バッグ」、「鞄」、「カバン」で検索してみませんか?」804との置換検索語をユーザに対し表示する。これにより、ユーザは、入力語「かばん」での検索結果803に所望の検索結果が得られないような場合、再度、提示されている「バッグ」、「鞄」、「カバン」などの検索語を使用して再検索を行うことで、ユーザはより適切な検索結果を得ることできる。
<変形例1>
変形例1として、検索語決定部105(決定手段)は、入力語とセットでの入力実績が所定数以上ある同義語に対するユーザの行動実績値に相対的に大きな重み付けを行う。その一態様は、入力語と同義語の組であって、「かばん 鞄」のように同じ検索窓や検索クエリで一度に複数入力された検索履歴が所定以上ある組に含まれる一の語が入力語のとき、同じ組に含まれる他の語に対するユーザの行動実績値に相対的に大きな重み付けを行うことである。他の態様は、次のようなものである。
一般に、検索支援サーバ1(又は他の情報検索サービスを提供するサーバでもよい)は、端末2やユーザを識別するとともに、検索窓からユーザにより入力された入力語を履歴として収集することが可能である。また、同じユーザが一の入力語の検索結果を見たうえで、続いてその入力語の同義語を入力する場合もある。よって、検索支援サーバ1は、検索窓から同じユーザにより複数の入力語が相次いで入力された場合、相前後する複数の入力語(相前後する複数の入力語のセット)を履歴として収集することができる。
例えば、同じ端末2の検索窓において、ユーザにより2つの入力語「かばん」、「鞄」(1つ目の入力語の同義語)が、検索結果を間に挟んで所定時間内に連続して入力されたものとする。この場合、検索支援サーバ1の検索部106(又は前記実績記録手段)は、この2つの入力語「かばん」、「鞄」が互いに同義語であることを同義語DB101aを参照することで判定し、連続して入力された同義語の組として、「かばん」が先、「鞄」が後、という順序の情報とともに履歴として収集し蓄積し、所定基準(所定数、所定割合など)以上蓄積された同じ履歴(「かばん」→「鞄」)を検出してフラグを立てておく。これもまたユーザ検索行動実績の1つである。
ここで、今度は、任意の端末2の検索窓において、ユーザにより1つの入力語「かばん」が入力されたものとする。上述の実施形態によれば、入力語「かばん」、入力語「かばん」の同義語「バッグ」、「カバン」、「鞄」の何れかが検索語として決定される。
この際、本変形例では、入力語「かばん」、同義語「鞄」のセットが所定数以上蓄積されている場合、今回の入力語「かばん」の検索結果を見た後で、しばしば入力されている同義語「鞄」の重み付けを重くする。上述の実施形態では、入力語「かばん」の「CTR」31.47%、同義語「バッグ」の「CTR」58.93%、同義語「カバン」の「CTR」29.25%同義語「鞄」の「CTR」50.36%という比較から、同義語「バッグ」が検索語と決定されている(図5)。しかしながら、本変形例では、「鞄」の重み付けを重くした結果、最終的に同義語「鞄」が検索語と決定されうるのである。
このように、ユーザが1つ目の入力語に続けて、その検索結果を確認したうえで所定時間に自発的に入力した同義語の実績が所定数以上ある場合、それだけの条件でその同義語を検索語として決定し、又は他の条件との複合条件において重み付けを操作し優先してその同義語が検索語として決定されやすくする。これにより、先に入力した入力語による検索結果に不満で、より望ましい同義語を入力し直した多数のユーザによる判断結果を活用し検索結果を改善できる。
<変形例2>
検索支援サーバ1(又は他の情報検索サービスを提供するサーバでもよい)は、検索窓からユーザにより入力された入力語を履歴として収集することが可能である。このような入力語のうち、最近所定期間の検索語として、所定基準以上頻繁に使用されている流行語(急上昇キーワード)がある。
よって、検索部106(又は前記実績記録手段、図示しない他の装置)により流行語を検出し、同義語の中に、流行語が含まれている場合、流行語である同義語の重み付けを重くする。上述の実施形態では、入力語「かばん」の「CTR」31.47%、同義語「バッグ」の「CTR」58.93%、同義語「カバン」の「CTR」29.25%同義語「鞄」の「CTR」50.36%という比較から、同義語「バッグ」が検索語と決定されている(図5)。しかしながら、本変形例では、例えば、流行語である「カバン」の重み付けを重くした結果、最終的に同義語「カバン」が検索語と決定されやすくなる。
このように、同義語の中に流行語がある場合、優先してその同義語が検索語として決定されやすくなるようにする。流行語は注目度の高い語であり、ユーザの検索意図もその流行語により適切な検索結果が得られる可能性が高い。流行語に限って、ユーザによる置換の確認操作を待つことなく、最初から、入力語を同義語に置換した検索結果を表示してもよい。
<変形例3>
上述の実施形態では、入力語「かばん」の「CTR」31.47%、同義語「バッグ」の「CTR」58.93%、同義語「カバン」の「CTR」29.25%同義語「鞄」の「CTR」50.36%という比較から、同義語「バッグ」が検索語と決定されている(図5)。これにより、検索支援サーバ1は、同義語「バッグ」を検索語として使用して検索を実行し、検索結果を出力する。
本変形例では、この後、検索支援サーバ1は、出力した検索結果に対するユーザ検索行動実績を収集するようにする。このユーザ検索行動実績は、例えば、置換検索語「バッグ」に対する「検索回数」、「PV」、「CTR」である。
ここで、当初、入力語「かばん」の「CTR」31.47%と、同義語「バッグ」の「CTR」58.93%との比較より、入力語「かばん」よりも同義語「バッグ」で検索した方がより適切な検索結果が得られるという期待の下、入力語の置換を実施した。同義語「バッグ」のこの期待値は「CTR」58.93%である。しかしながら、置換検索語「バッグ」に対するユーザ検索行動実績が思わしくない場合、以降は置換をしない方がよい。
例えば、置換検索語「バッグ」に対する「CTR」が28%であるとすると、当初の入力語「かばん」の「CTR」31.47%との比較より、置換検索語「バッグ」よりも入力語「かばん」で検索した方がより適切な検索結果が得られる。このことは、置換検索語「バッグ」は置換されてしまうことで、本来の「CTR」58.93%を大きく下回るような置換語であることを示している。つまり、入力語「かばん」の同義語「バッグ」は、入力語「かばん」の置換検索語としては適さない。
よって、この場合、検索支援サーバ1は、例えば、同義語DB101aから、入力語「かばん」の同義語「バッグ」を削除することで、以降、入力語「かばん」に対しては同義語「バッグ」に置換されないようにする。
このように、入力語を同義語に置換する場合、置換による効果を検証し、その検証結果をそれ以降にフィードバッグすることで、ユーザがより適切な検索結果が得られるようにすることが可能である。
<補足>
同義語DB101aは、固有名詞を含まず、一般名詞のみが格納される。というのも、固有名詞を含む場合、一般名詞の入力語から固有名詞の同義語、又は固有名詞の入力語から一般名詞の同義語へと検索語が置換される場合がある。固有名詞は特定商品名を表すことも多く、検索結果において、あたかも広告と取られてしまう可能性があるためである。
また、ユーザが本来一般名詞の入力語により、メーカ等を問わず広く検索したいにも関わらず、特定の特定商品名で検索されるならば、ユーザの所望する検索結果が得られないという場合もある。逆に、ユーザが固有名詞の入力語により、メーカ等を特定して検索したいにも関わらず、一般商品名で検索されるならば、ユーザの所望する検索結果が得られないという場合もある。
但し、このような事情はあくまで限定的な側面から見た一例であり、いうまでもなく、同義語DB101aは、固有名詞及び一般名詞のみが格納されてもよい。この場合、一般名詞の入力語から固有名詞の同義語、又は固有名詞の入力語から一般名詞の同義語へと検索語が置換されうる。また、本願における同義語は、類義語又は類似語と読み替えてもよい。
<総括>
以上、本発明の実施形態によれば、インターネット検索において、検索者により入力された検索語よりも適切な検索語を、入力された検索語に対する同義語の中から決定することができる。このため、例えば、検索者は、入力した検索語に対する同義語に基づいて、適切な検索結果を検索することができる。
また、本発明の好適な実施の形態により本発明を説明した。ここでは特定の具体例を示して本発明を説明したが、特許請求の範囲に定義された本発明の広範な趣旨および範囲から逸脱することなく、これら具体例に様々な修正および変更を加えることができることは明らかである。すなわち、具体例の詳細および添付の図面により本発明が限定されるものと解釈してはならない。
1 検索支援サーバ
2 端末
3 ネットワーク
11 CPU
12 ROM
13 RAM
14 入力装置
15 出力装置
16 通信装置
17 HDD
101 記憶部
102 入力部
103 同義語取得部
104 ユーザ検索行動実績取得部
105 検索語決定部
106 検索部

Claims (7)

  1. ユーザからの入力語を受け付ける入力手段と、
    前記入力語及び該入力語の同義語を、それぞれ検索語として情報検索した結果に基づいて収集されたユーザの行動実績値を記憶した記憶手段と、
    前記入力語に対するユーザの行動実績値と、前記同義語に対するユーザの行動実績値とに基づいて、前記入力語又は前記同義語の何れかを検索語と決定する決定手段と、
    を有することを特徴とする検索支援装置。
  2. 前記ユーザの行動実績値は、前記検索語の検索回数、前記検索語に対する検索結果のPV又はCTRの少なくとも何れかを含み、
    前記決定手段は、
    前記入力語に対するユーザの行動実績値と、前記同義語に対するユーザの行動実績値を比較し、前記入力語よりもユーザの行動実績値が大きい前記同義語を検索語と決定すること、
    を特徴とする請求項1記載の検索支援装置。
  3. 前記決定手段は、
    前記入力語よりもユーザの行動実績値が大きい前記同義語をユーザに提示し、ユーザにより提示した該同義語が選択された場合、該同義語を検索語と決定すること、
    を特徴とする請求項2記載の検索支援装置。
  4. 前記決定手段は、
    前記同義語に前記入力語とセットでの入力実績が所定数以上ある場合、該同義語に対するユーザの行動実績値に重み付けを行うこと、
    を特徴とする請求項1ないし3何れか一項記載の検索支援装置。
  5. 前記決定手段は、
    前記同義語が流行語である場合、該同義語に対するユーザの行動実績値に重み付けを行うこと、
    を特徴とする請求項1ないし4何れか一項記載の検索支援装置。
  6. 前記記憶手段は、
    前記決定手段により前記同義語が検索語と決定された場合、該同義語の検索語として情報検索した結果に基づいて収集された該同義語に対するユーザの行動実績を記憶し、該同義語に対するユーザの行動実績値が前記入力語に対するユーザの行動実績値よりも小さい場合、前記入力語の同義語を削除すること、
    を特徴とする請求項1ないし5何れか一項記載の検索支援装置。
  7. コンピュータに、
    ユーザからの入力語を受け付ける入力手段と、
    前記入力語及び該入力語の同義語を、それぞれ検索語として情報検索した結果に基づいて収集されたユーザの行動実績値を記憶した記憶手段と、
    前記入力語に対するユーザの行動実績値と、前記同義語に対するユーザの行動実績値とに基づいて、前記入力語又は前記同義語の何れかを検索語と決定する決定手段として機能させる検索支援プログラム。
JP2013128823A 2013-06-19 2013-06-19 検索支援装置及び検索支援プログラム Active JP5777663B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013128823A JP5777663B2 (ja) 2013-06-19 2013-06-19 検索支援装置及び検索支援プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013128823A JP5777663B2 (ja) 2013-06-19 2013-06-19 検索支援装置及び検索支援プログラム

Publications (2)

Publication Number Publication Date
JP2015005050A true JP2015005050A (ja) 2015-01-08
JP5777663B2 JP5777663B2 (ja) 2015-09-09

Family

ID=52300923

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013128823A Active JP5777663B2 (ja) 2013-06-19 2013-06-19 検索支援装置及び検索支援プログラム

Country Status (1)

Country Link
JP (1) JP5777663B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018120326A (ja) * 2017-01-24 2018-08-02 株式会社プロフィールド 商品情報管理装置、商品情報管理方法、およびプログラム
JP2020061108A (ja) * 2018-10-14 2020-04-16 株式会社トヨタマップマスター 入力アシスト装置、入力アシスト装置を備えたナビゲーション装置、入力アシスト方法、及びそのコンピュータプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080091670A1 (en) * 2006-10-11 2008-04-17 Collarity, Inc. Search phrase refinement by search term replacement
JP2008242622A (ja) * 2007-03-26 2008-10-09 Fujitsu Ltd 検索候補語句提示装置、検索候補語句提示プログラムおよび検索候補語句提示方法
JP2012079029A (ja) * 2010-09-30 2012-04-19 Yahoo Japan Corp サジェスチョンクエリ抽出装置及び方法、並びにプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080091670A1 (en) * 2006-10-11 2008-04-17 Collarity, Inc. Search phrase refinement by search term replacement
JP2008242622A (ja) * 2007-03-26 2008-10-09 Fujitsu Ltd 検索候補語句提示装置、検索候補語句提示プログラムおよび検索候補語句提示方法
JP2012079029A (ja) * 2010-09-30 2012-04-19 Yahoo Japan Corp サジェスチョンクエリ抽出装置及び方法、並びにプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018120326A (ja) * 2017-01-24 2018-08-02 株式会社プロフィールド 商品情報管理装置、商品情報管理方法、およびプログラム
JP2020061108A (ja) * 2018-10-14 2020-04-16 株式会社トヨタマップマスター 入力アシスト装置、入力アシスト装置を備えたナビゲーション装置、入力アシスト方法、及びそのコンピュータプログラム
JP7055728B2 (ja) 2018-10-14 2022-04-18 株式会社トヨタマップマスター 入力アシスト装置、入力アシスト装置を備えたナビゲーション装置、入力アシスト方法、及びそのコンピュータプログラム

Also Published As

Publication number Publication date
JP5777663B2 (ja) 2015-09-09

Similar Documents

Publication Publication Date Title
US20190220460A1 (en) Searchable index
KR101721338B1 (ko) 검색 엔진 및 그의 구현 방법
US9355185B2 (en) Infinite browse
CN102708174B (zh) 一种浏览器中的富媒体信息的展示方法和装置
JP4962967B2 (ja) Webページ検索サーバ及びクエリ推薦方法
US20090077065A1 (en) Method and system for information searching based on user interest awareness
JP2015191655A (ja) 推奨ページを生成するための方法及び装置
US9990442B2 (en) Method for determining relevant search results
US20230334102A1 (en) Displaying Stylized Text Snippets with Search Engine Results
US10606895B2 (en) Multiple entity aware typeahead in searches
JP2009503751A (ja) 関連性判定方法、情報収集方法、オブジェクト組織化方法及び検索システム
US11100169B2 (en) Alternative query suggestion in electronic searching
JP2011529600A (ja) 意味ベクトルおよびキーワード解析を使用することによるデータセットを関係付けるための方法および装置
KR20090003739A (ko) 태그 정보를 이용하여 사용자 취향정보를 수집하는 단말기기, 그 방법 및 기록매체
JP4939637B2 (ja) 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体
CN104090923A (zh) 一种浏览器中的富媒体信息的展示方法和装置
JP5194731B2 (ja) 文書関連度算出システム、文書関連度算出方法および文書関連度算出プログラム
TWI399657B (zh) A provider, a method of providing information, a program, and an information recording medium
JP5777663B2 (ja) 検索支援装置及び検索支援プログラム
JP2017072964A (ja) 情報分析装置及び情報分析方法
JP5141144B2 (ja) 情報検索システム及び情報検索プログラム
WO2016028948A1 (en) Method for record selection to avoid negatively impacting latency
KR101308821B1 (ko) 검색엔진용 키워드 추출 시스템 및 추출 방법
JP5039086B2 (ja) 評価情報入力支援装置、評価情報入力支援方法およびその方法を実行させるプログラム
JP5538459B2 (ja) 情報処理装置及び方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150410

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150414

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150522

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150623

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150707

R150 Certificate of patent or registration of utility model

Ref document number: 5777663

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250