JP2017045196A - Ambiguity evaluation device, ambiguity evaluation method, and ambiguity evaluation program - Google Patents
Ambiguity evaluation device, ambiguity evaluation method, and ambiguity evaluation program Download PDFInfo
- Publication number
- JP2017045196A JP2017045196A JP2015166161A JP2015166161A JP2017045196A JP 2017045196 A JP2017045196 A JP 2017045196A JP 2015166161 A JP2015166161 A JP 2015166161A JP 2015166161 A JP2015166161 A JP 2015166161A JP 2017045196 A JP2017045196 A JP 2017045196A
- Authority
- JP
- Japan
- Prior art keywords
- ambiguity
- search
- keyword
- similarity
- category
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 78
- 239000013598 vector Substances 0.000 claims description 26
- 239000000047 product Substances 0.000 description 31
- 238000000034 method Methods 0.000 description 24
- 230000008569 process Effects 0.000 description 20
- 238000012545 processing Methods 0.000 description 16
- 238000004891 communication Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 4
- 238000010413 gardening Methods 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 239000013589 supplement Substances 0.000 description 2
- 230000001502 supplementing effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、検索時に用いられたキーワードに対する曖昧性を評価する曖昧性評価装置、曖昧性評価方法、及び曖昧性評価プログラムに関する。 The present invention relates to an ambiguity evaluation apparatus, an ambiguity evaluation method, and an ambiguity evaluation program for evaluating ambiguity with respect to a keyword used at the time of search.
従来より、インターネット等の通信ネットワーク上にWebサイト等を公開し、そのWebサイトにアクセスしてきた端末に対して、端末のユーザが所望する情報を提示するサービスが存在する。例えば、オンラインショッピング等のサービス形態では、端末からユーザが指定した所定のキーワード(例えば、検索クエリ等)により、予め商品情報が登録されたデータベースを検索し、抽出された商品が、ユーザが目的としている商品であれば、その購入手続き等を行うことで、ユーザにその商品を提供することができる。 2. Description of the Related Art Conventionally, there are services that publish a website or the like on a communication network such as the Internet and present information desired by a user of the terminal to a terminal that has accessed the website. For example, in a service form such as online shopping, a database in which product information is registered in advance using a predetermined keyword (for example, a search query) designated by the user from the terminal is searched, and the extracted product is used by the user as a purpose. If it is an existing product, the product can be provided to the user by performing the purchase procedure.
また、従来では、ユーザが入力した検索キーワードを入力して「検索」ボタンをクリックすると、検索結果のページにジャンプするだけでなく、ユーザによって入力された検索キーワードに関連する他の検索キーワードを表示する仕組みが存在する(例えば、特許文献1参照)。 Conventionally, when a search keyword input by the user is input and the “search” button is clicked, not only the search result page is jumped but also other search keywords related to the search keyword input by the user are displayed. There is a mechanism to do this (see, for example, Patent Document 1).
特許文献1では、ユーザによって入力された検索キーワードセットを受信し、明確に規定されていない意図に対応する複数の所定の単語と検索キーワードセットとを比較することで、検索キーワードセットがユーザによって明確に規定された意図を示すか否かを判定し、検索キーワードセットが明確に規定された意図を示すと判定された場合に、更なる推薦検索キーワードを取得するための処理を実行している。
In
上述した手法では、検索キーワードを表示する処理の切り替えを適切に行うために、意図の曖昧性を正確に推定することが必要不可欠である。単純には、クエリ毎のクリック分布に基づき曖昧性の定量化を行うことができても、実際には、クリック同士の関連度に差異があり、より現実問題に則した推定を行うには、さらに踏み込んだ情報の利用が必要となる。 In the above-described method, it is essential to accurately estimate the ambiguity of the intention in order to appropriately switch the processing for displaying the search keyword. Simply, even if you can quantify the ambiguity based on the click distribution for each query, there is actually a difference in the degree of relevance between the clicks, and in order to make a more realistic estimation, Further use of information is required.
本発明は、上記課題に鑑みてなされたものであり、ユーザの意図の曖昧性を定量化してユーザへ適切な検索結果を提示することを目的とする。 The present invention has been made in view of the above problems, and an object thereof is to quantify the ambiguity of the user's intention and present an appropriate search result to the user.
本発明の一実施形態に係る曖昧性評価装置は、検索時に用いられたキーワードと、該キーワードを用いて検索対象データから検索された検索結果に対応するカテゴリとを関連付けて検索履歴情報として記憶する記憶手段と、前記記憶手段に記憶された検索履歴情報から、各キーワードに対する前記カテゴリ間の類似度を算出し、算出した類似度から前記キーワードの曖昧性を評価する曖昧性評価手段と、を有する。 The ambiguity evaluation apparatus according to an embodiment of the present invention associates a keyword used at the time of search with a category corresponding to a search result searched from search target data using the keyword, and stores it as search history information. Storage means, and ambiguity evaluation means for calculating similarity between the categories for each keyword from search history information stored in the storage means, and evaluating ambiguity of the keyword from the calculated similarity. .
本発明の一実施形態によれば、ユーザの意図の曖昧性を定量化してユーザへ適切な検索結果を提示することができる。 According to an embodiment of the present invention, it is possible to quantify the ambiguity of a user's intention and present an appropriate search result to the user.
以下、本発明の各実施形態の詳細について添付の図面を参照しながら説明する。 Hereinafter, details of each embodiment of the present invention will be described with reference to the accompanying drawings.
<情報提示システムの全体構成>
図1は、情報提示システムの全体構成の一例を示す図である。図1の例において、情報提示システム10は、情報提示装置の一例である曖昧性評価装置11と、1又は複数の端末12−1〜12−n(以下、必要に応じて、「端末12」と総称する)とを有する。曖昧性評価装置11と、端末12とは、LAN(Local Access Area)やインターネットに代表される通信ネットワーク13と、データの送受信が可能な状態で接続されている。
<Overall configuration of information presentation system>
FIG. 1 is a diagram illustrating an example of the overall configuration of the information presentation system. In the example of FIG. 1, the
曖昧性評価装置11は、例えばショッピングサイトやニュース・サイト、Q&Aサイト、電子商取引サイト、検索サイト等のWebサイトを公開している。曖昧性評価装置11は、通信ネットワーク13を介してアクセスしてきた端末12からの所定のキーワード(例えば、検索クエリ)等の入力を受け付け、予め記憶されている検索対象データ(例えば、商品データ)等を参照して、対応する商品情報(タイトル、カテゴリ等)や単語、文章等の検索結果を抽出し、キーワードを入力してきた端末12に提供する。また、曖昧性評価装置11は、各端末12からの検索クエリと、その検索クエリを用いて商品データから検索された検索結果に対するカテゴリとを関連付けて、例えば検索ログ(検索履歴情報)として記憶する。
The ambiguity evaluation apparatus 11 publishes Web sites such as shopping sites, news sites, Q & A sites, electronic commerce sites, and search sites. The ambiguity evaluation apparatus 11 receives input of a predetermined keyword (for example, a search query) from the
ここで、カテゴリとは、物事を一定の基準に基づいて分類した際の個々の区分のことであり、例えば分類、分野、区分、種類、部門、ジャンル等で区分けされる。例えば、検索クエリが「テーブル」である場合、カテゴリは「ローテーブル」、「センターテーブル」、「サイドテーブル」等であるが、これに限定されるものではない。なお、本実施形態では、曖昧性評価装置11は、他のWebサイトを提供している外部装置から、上述した商品データや検索ログの情報を取得してもよい。 Here, the category is an individual classification when things are classified based on a certain standard, and is classified by, for example, classification, field, classification, type, department, genre, and the like. For example, when the search query is “table”, the category is “low table”, “center table”, “side table”, etc., but is not limited thereto. In the present embodiment, the ambiguity evaluation device 11 may acquire the above-described product data and search log information from an external device that provides another Web site.
また、曖昧性評価装置11は、上述した商品データ及び検索ログを用いてカテゴリ間の類似度を算出し、算出した類似度に基づいてキーワード(クエリ)に関する曖昧性を評価する。例えば、曖昧性評価装置11は、商品データからカテゴリ毎のベクトル表現を生成し、また検索ログのクリック結果からクエリ毎のカテゴリ分布を抽出し、上述したベクトル表現とカテゴリ分布とを用いて得られたカテゴリ間の類似度に基づいて、クエリ毎の曖昧性を評価する。また、曖昧性評価装置11は、予め信頼性の高いカテゴリ間のツリー構造のデータ(カテゴリツリー)を有する場合には、そのカテゴリツリーに基づいて、類似度を算出してもよい。この場合、例えば検索時に用いるキーワード(例えば、テーブル)に対し、ツリー構造を参照して、そのキーワードに対応するカテゴリの下位概念のカテゴリ(例えば、ローテーブル等)等の関係性から類似度を算出することができる。 Further, the ambiguity evaluation device 11 calculates the similarity between categories using the above-described product data and search log, and evaluates the ambiguity related to the keyword (query) based on the calculated similarity. For example, the ambiguity evaluation apparatus 11 generates a vector expression for each category from the product data, extracts a category distribution for each query from the click result of the search log, and obtains the vector expression and the category distribution described above. The ambiguity for each query is evaluated based on the similarity between categories. In addition, the ambiguity evaluation apparatus 11 may calculate the similarity based on the category tree when the data has a tree structure between categories with high reliability (category tree) in advance. In this case, for example, with respect to a keyword (for example, a table) used at the time of search, the tree structure is referred to, and a similarity is calculated from a relationship such as a category (for example, a row table) of a lower concept of a category corresponding to the keyword. can do.
また、曖昧性評価装置11は、端末12からの検索クエリを受け付けた場合に、曖昧性の評価結果(曖昧度データ)を参照し、その検索クエリに対する曖昧度に基づいて他の情報(例えば、他の検索クエリ)等による検索クエリの補充等を行い、補充した内容で検索を行う。また、曖昧性評価装置11は、その検索結果を端末12に提示する。
Further, when the ambiguity evaluation apparatus 11 receives a search query from the
曖昧性評価装置11は、例えば汎用のPC(Personal Computer)やサーバ等でもよく、少なくとも1つの情報処理装置を有するクラウドコンピューティングにより構成されたクラウドサーバでもよいが、これらに限定されるものではない。 The ambiguity evaluation device 11 may be, for example, a general-purpose PC (Personal Computer) or a server, or may be a cloud server configured by cloud computing having at least one information processing device, but is not limited thereto. .
端末12は、各ユーザが曖昧性評価装置11等からサービスを受けるための装置である。ユーザは、端末12から通信ネットワーク13を介して曖昧性評価装置11にアクセスし、Webサイトに公開されている検索画面等を用いて所望する情報(商品情報)等の検索を行う。なお、検索を行う場合には、ユーザ登録等を行うことで、ユーザ毎の履歴情報を取得することができ、ユーザ毎に適切な検索結果を提示することができる。端末12は、PCでもよく、タブレット端末やスマートフォン、携帯電話等の通信端末でもよいが、これらに限定されるものではない。
The
通信ネットワーク13は、上述したようにLANやインターネット等である。通信ネットワーク13は、有線でも無線でも、これらの組み合わせでもよい。
As described above, the
<曖昧性評価装置11の機能構成>
次に、上述した曖昧性評価装置11の機能構成の一例について、具体的に説明する。図1に示すように、曖昧性評価装置11は、入力手段21と、出力手段22と、記憶手段23と、曖昧性評価手段24と、検索手段25と、情報提示手段26と、通信手段27と、制御手段28とを有する。
<Functional Configuration of Ambiguity Evaluation Device 11>
Next, an example of a functional configuration of the above-described ambiguity evaluation apparatus 11 will be specifically described. As shown in FIG. 1, the ambiguity evaluation apparatus 11 includes an input means 21, an output means 22, a storage means 23, an ambiguity evaluation means 24, a search means 25, an information presentation means 26, and a communication means 27. And control means 28.
入力手段21は、本実施形態における曖昧度の評価処理や、情報提示処理等の開始/終了、各種設定等の入力を受け付ける。入力手段21は、例えば曖昧性評価装置11がPC等の汎用のコンピュータであれば、キーボードやマウス等のポインティングデバイスである。また、入力手段21は、タッチパネル等でもよい。また、入力手段21は、例えば音声等により上述した入力が可能なマイク等の音声入力デバイスであってもよい。
The
出力手段22は、入力手段21により入力された内容や、入力内容に基づいて実行された内容等の出力を行う。出力手段22は、例えばディスプレイやスピーカ等である。出力手段22は、入力手段21と一体型のタッチパネルであってもよい。また、出力手段22は、処理結果等を紙等の印刷媒体に印刷するプリンタ等の印刷デバイスであってもよい。
The
記憶手段23は、本実施形態において必要な各種情報を記憶する。具体的には、記憶手段23は、入力された検索クエリに対応する商品情報を抽出するための商品データ31、検索クエリと、検索クエリによる検索結果に対応するカテゴリとを関連付けて記憶した検索ログ32、検索クエリ毎の曖昧度を記憶した曖昧度データ33、曖昧度に対応する補充情報や提示情報等が記憶された情報提示データ34等を記憶する。なお、商品データ31は、検索対象データの一例であり、商品データに限定されるものではない。
The
また、記憶手段23が記憶する情報は、これらに限定されるものではなく、例えば検索時に用いられるキーワードに関連付けられたカテゴリを、予め設定されたカテゴリ間のツリー構造のデータ(カテゴリツリー)として記憶してもよい。また、記憶手段23は、例えば端末12と通信を行うためのアドレス情報、ユーザを識別するためのユーザ情報、端末12を識別するための端末情報、エラー発生時の異常情報等を記憶してもよい。
Further, the information stored in the
曖昧性評価手段24は、検索クエリによる検索結果で得られたカテゴリ間の類似度に基づいて、検索クエリ毎の曖昧度を評価する。例えば、曖昧性評価手段24は、カテゴリの類似度を算出する際、各カテゴリを言語的な空間上のベクトルに置き換える。 The ambiguity evaluation means 24 evaluates the ambiguity for each search query based on the similarity between categories obtained as a result of the search query. For example, the ambiguity evaluation means 24 replaces each category with a vector in a linguistic space when calculating the similarity of the category.
例えば、曖昧性評価手段24は、商品データ31からカテゴリ毎のベクトル表現を生成する。なお、ベクトル表現の生成については、例えば潜在的意味索引(LSI:Latent Semantic Indexing)等の手法を用いることができるが、これに限定されるものではない。また、曖昧性評価手段24は、検索ログ32に含まれる各検索クエリに関連付けられたカテゴリ毎の数から、クエリ毎のカテゴリ分布(クリック割合)を抽出する。また、曖昧性評価手段24は、ベクトル表現及びカテゴリ分布とを組み合わせて類似度を算出し、算出した類似度に基づいてクエリ毎の曖昧性を評価する。
For example, the ambiguity evaluation means 24 generates a vector representation for each category from the
なお、検索ログ32は、各端末12のログが集約されていてもよく、端末12毎(ユーザ毎)であってもよく、所定の条件(例えば、期間、時間帯、地域)等で分類されていてもよい。また、検索ログ32には、検索結果に対応するカテゴリのうち、ユーザがクリック(閲覧指示)したカテゴリ群を記憶しておいてもよい。この場合、曖昧性評価手段24は、検索ログ32に含まれるカテゴリ毎のクリック数(閲覧指示数)からクエリ毎のカテゴリ分布(クリック割合)を抽出し、ベクトル表現及びカテゴリ分布とを組み合わせて類似度を算出する。このように、検索ログ32の情報量を削減することで、処理の迅速化を図ることができる。また、ユーザが閲覧指示したものは、ユーザが所望する情報である可能性が高いため、その有用な情報のみを用いて類似度を算出することで、適切にクエリ毎の曖昧性を評価し、その評価結果を次の検索時等に役立てることができる。
It should be noted that the
なお、曖昧性評価手段24は、上述した類似度の算出において、例えば各カテゴリに対応付けられた単語やジャンル、属性情報、詳細説明等のメタデータ同士を比較し、一致するデータの数や種類により類似度を算出してもよい。
Note that the
また、曖昧性評価手段24は、例えば記憶手段23等に予め設定されたカテゴリツリーが記憶されている場合には、そのカテゴリツリーに基づいて、類似度を算出してもよい。カテゴリツリーとは、例えば「テーブル>センターテーブル>ガラス製テーブル」、「テーブル>センターテーブル>木製テーブル」等のように、カテゴリ間の関係がツリー構造で形成されたものである。例えば、「テーブル>ローテーブル」、「テーブル>センターテーブル」、「テーブル>サイドテーブル」等のツリー構造がある場合には、同一のカテゴリの配下にある「ローテーブル」、「センターテーブル」、「サイドテーブル」間の類似度は、高いものとして算出される。
For example, when a preset category tree is stored in the
また、カテゴリツリーは、信頼性の高い(十分に信頼できる)ツリー構造を有することが好ましい。ツリー構造の編集は、通常、人手で編集されていることが多く、例えば「PC関連機器>デジタルカメラ」、「カメラ>デジタルカメラ」等のように、カテゴリ「デジタルカメラ」が人によって他のカテゴリと結びついてしまうような場合には、信頼性が低いものとなる。このような信頼性の低いカテゴリツリーではなく、所定の条件に基づいて機械的に形成された信頼性の高いカテゴリツリーを用いることで高精度に類似度を算出することができる。 The category tree preferably has a highly reliable (sufficiently reliable) tree structure. The tree structure is usually edited manually. For example, the category “digital camera” is classified into another category by a person such as “PC-related equipment> digital camera”, “camera> digital camera”, and the like. In such a case, the reliability is low. The similarity can be calculated with high accuracy by using a highly reliable category tree that is mechanically formed based on a predetermined condition, instead of the category tree having low reliability.
曖昧性評価手段24は、上述したカテゴリ間の類似度に基づいて得られる各クエリに対する曖昧性の評価結果を、曖昧度データ33として記憶手段23に記憶する。
The
検索手段25は、端末12からの検索クエリの入力を受け付けた場合に、その検索クエリに対応する曖昧度データ33を参照し、その検索クエリが曖昧でない場合には、そのままの検索クエリで商品データ31への検索を行う。また、検索手段25は、検索クエリが曖昧である場合、検索クエリの補充処理を行い、補充した内容で検索を行う。
When the search means 25 receives an input of a search query from the terminal 12, the search means 25 refers to the
ここで、補充処理とは、例えば入力された検索クエリに対応して予め設定された他の検索クエリを付加して検索範囲を拡張したり、予め登録されているユーザ嗜好情報(例えば、スポーツ好き、ガーデニング好き、ファッション好き)等に対応付けられた検索クエリを付加したり、入力されたクエリを変更して、検索範囲を絞り込む等の処理であるが、これに限定されるものではない。なお、上述した他の検索クエリやユーザ嗜好情報は、例えば情報提示データ34を参照して取得することができる。また、検索手段25は、検索クエリと、検索結果に対応するカテゴリ等とを関連付けて検索ログ32に記憶する。
Here, the supplement process is, for example, adding another search query set in advance corresponding to the input search query to expand the search range, or preregistered user preference information (for example, sports enthusiasts) , Gardening enthusiasts, fashion enthusiasts) or the like, or a process of narrowing the search range by changing the input query, but is not limited to this. The other search queries and user preference information described above can be acquired with reference to the
情報提示手段26は、検索手段25により検索された結果を端末12に提示する。なお、情報提示手段26は、検索結果を提示する際に、予めユーザ嗜好情報等が登録されていた場合には、検索結果をユーザ嗜好に対応する順に並べ替えて表示してもよい。また、情報提示手段26は、提示した端末12から検索結果のカテゴリに対するクリック等の閲覧指示があった場合には、その情報を検索ログ32に記憶してもよい。
The information presenting means 26 presents the result searched by the searching means 25 to the terminal 12. Note that the information presenting means 26 may arrange and display the search results in the order corresponding to the user preferences when the user preference information and the like are registered in advance when presenting the search results. Further, the
通信手段27は、通信ネットワーク13を介して各端末12とデータの送受信を行う。なお、通信手段27は、端末12からアクセスしてきた場合に、ユーザ認証処理を行ってもよい。ユーザ認証処理とは、例えば端末12から入力されたユーザIDやパスワード等の認証情報が、予め記憶手段23に記憶されたユーザ情報に含まれるユーザIDやパスワードに一致するか否かを判断し、一致する場合には、その端末12からのアクセスを認め、一致しない場合には、ユーザにその旨の通知をし、ユーザが新規登録をしない限り、ユーザに使用させない処理であるが、これに限定されるものではない。
The
制御手段28は、曖昧性評価装置11の各構成部全体の制御を行う。例えば、制御手段28は、曖昧性評価手段24による検索クエリ毎の曖昧性の評価、検索手段25による検索、情報提示手段26による情報提示等の制御を行うが、これらに限定されるものではない。例えば、制御手段28は、本実施形態における各種処理の開始や終了等の制御、エラー発生時の制御等を行ってもよい。
The control means 28 controls the entire components of the ambiguity evaluation apparatus 11. For example, the
<曖昧性評価装置11のハードウェア構成>
ここで、本実施形態では、上述した曖昧性評価装置11の各機能をコンピュータに実行させる実行プログラム(曖昧性評価プログラム)を生成し、例えば汎用のPC、サーバ等にインストールすることで、本実施形態における情報提示処理等を実現することができる。
<Hardware Configuration of Ambiguity Evaluation Device 11>
Here, in the present embodiment, an execution program (ambiguity evaluation program) that causes a computer to execute each function of the above-described ambiguity evaluation apparatus 11 is generated and installed in, for example, a general-purpose PC or server. An information presentation process or the like in the form can be realized.
図2は、曖昧性評価装置のハードウェア構成の一例を示す図である。図2に示す曖昧性評価装置11のコンピュータ本体には、入力装置41と、出力装置42と、ドライブ装置43と、補助記憶装置44と、メモリ装置45と、各種制御を行うCPU(Central Processing Unit)46と、ネットワーク接続装置47とを有するように構成され、これらはシステムバスBで相互に接続されている。
FIG. 2 is a diagram illustrating an example of a hardware configuration of the ambiguity evaluation apparatus. The computer body of the ambiguity evaluation apparatus 11 shown in FIG. 2 includes an
入力装置41は、ユーザ等が操作するキーボード、マウス等のポインティングデバイスを有しており、マイク等の音声入力デバイス等を有し、ユーザ等からのプログラムの実行等、各種操作信号を入力する。
The
出力装置42は、本実施形態における各処理を行うコンピュータ本体を操作するのに必要な各種ウィンドウやデータ等を表示するディスプレイを有し、CPU46が有する制御プログラムにより実行経過や結果等を表示する。
The
ここで、本実施形態においてコンピュータ本体にインストールされる実行プログラムは、例えば、USB(Universal Serial Bus)メモリやCD−ROM等の可搬型の記録媒体48等により提供される。記録媒体48は、ドライブ装置43にセット可能であり、記録媒体48に含まれる実行プログラムが、記録媒体48からドライブ装置43を介して補助記憶装置44にインストールされる。
Here, the execution program installed in the computer main body in the present embodiment is provided by, for example, a
補助記憶装置44は、ハードディスク等のストレージ手段であり、本実施形態における実行プログラムや、コンピュータに設けられた制御プログラム等を記憶し、必要に応じて入出力を行うことが可能である。
The
メモリ装置45は、CPU46により補助記憶装置44から読み出された実行プログラム等を格納する。なお、メモリ装置45は、ROM(Read Only Memory)やRAM(Random Access Memory)等である。なお、上述した補助記憶装置44やメモリ装置45は、1つの記憶装置として一体型に構成されていてもよい。
The
CPU46は、OS(Operating System)等の制御プログラム、及びメモリ装置45に格納されている実行プログラムに基づいて、各種演算や各ハードウェア構成部とのデータの入出力等、コンピュータ全体の処理を制御して、本実施形態における情報提示処理を実現する。なお、プログラム実行中に必要な各種情報等は、補助記憶装置44から取得し、実行結果等を格納してもよい。
The
ネットワーク接続装置47は、インターネットやLAN等に代表される通信ネットワーク等と接続することにより、実行プログラムを通信ネットワークに接続されている他の装置等から取得する。また、ネットワーク接続装置47は、プログラムを実行することで得られた実行結果又は本実施形態における実行プログラム自体を他の装置等に提供することが可能である。
The
記録媒体48は、上述したように実行プログラム等を格納するコンピュータで読み取り可能な記録媒体である。記録媒体48は、例えばフラッシュメモリ等の半導体メモリであってもよい。また、記録媒体48は、USBメモリ等の可搬型記録媒体であってもよいが、これに限定されるものではない。
The
本実施形態では、上述したコンピュータ本体のハードウェア構成に実行プログラム(例えば、曖昧性評価プログラム等)をインストールすることで、ハードウェア資源とソフトウェアとが協働して本実施形態における曖昧性評価処理等を実現することができる。また、上述した曖昧性評価処理に対応する曖昧性評価プログラムは、例えば装置上で常駐している状態であってもよく、起動指示により起動させてもよい。上述したハードウェア構成は、例えば端末12に適用してもよい。 In this embodiment, by installing an execution program (for example, an ambiguity evaluation program or the like) in the hardware configuration of the computer main body described above, the ambiguity evaluation processing in the present embodiment is performed in cooperation with hardware resources and software. Etc. can be realized. Further, the ambiguity evaluation program corresponding to the ambiguity evaluation process described above may be resident on the apparatus, for example, or may be activated by an activation instruction. The hardware configuration described above may be applied to the terminal 12, for example.
<本実施形態における情報提示処理>
次に、本実施形態における曖昧性評価処理を含む情報提示処理について、フローチャートを用いて説明する。図3は、情報提示処理の一例を示すフローチャートである。なお、以下の説明では、既に曖昧性評価装置11において、各端末12等による検索等が行われ、検索ログがある状態を示している。
<Information presentation process in this embodiment>
Next, information presentation processing including ambiguity evaluation processing in the present embodiment will be described using a flowchart. FIG. 3 is a flowchart illustrating an example of the information presentation process. In the following description, the ambiguity evaluation apparatus 11 has already been searched by each terminal 12 and the like, and a search log exists.
図3の例において、曖昧性評価手段24は、予め記憶されている検索対象データの一例としての商品データ31から、カテゴリ毎のベクトル表現を生成する(S01)。次に、曖昧性評価手段24は、検索ログ32のクリック結果からクエリ毎のカテゴリ分布を抽出する(S02)。なお、S02の処理では、検索ログ32に含まれる検索結果のカテゴリに対するクリック結果ではなく、検索結果のカテゴリを用いてカテゴリ分布を抽出してもよい。
In the example of FIG. 3, the ambiguity evaluation means 24 generates a vector representation for each category from the
次に、曖昧性評価手段24は、ベクトル表現とカテゴリ分布とを組み合わせてクエリ毎のカテゴリ間の類似度を算出し(S03)、算出した類似度からクエリ毎の曖昧性を評価し、曖昧度データ33として記憶手段23に記憶する(S04)。なお、S01〜S04の処理は、S05以降の処理よりも前に実行されていればよく、連続して行う必要はない。
Next, the
次に、検索手段25は、端末12からの検索クエリの入力を受け付け(S05)、受け付けた検索クエリに対して曖昧度データを参照し、対応する曖昧度を取得する(S06)。次に、検索手段25は、取得した曖昧度が予め設定された閾値以上か否かを判断し(S07)、閾値以上である場合(S07において、YES)、検索クエリに他の情報(例えば、追加キーワード等)を補充して検索を行う(S08)。また、S07の処理において、閾値以上でない場合(S07において、NO)、検索手段25は、補充を行わずに、検索クエリによる検索を行う(S09)。
Next, the search means 25 receives the input of the search query from the terminal 12 (S05), refers to the ambiguity data for the received search query, and acquires the corresponding ambiguity (S06). Next, the search means 25 determines whether or not the acquired ambiguity is greater than or equal to a preset threshold value (S07). If it is greater than or equal to the threshold value (YES in S07), other information (for example, The search is performed by supplementing additional keywords (S08). If the threshold value is not greater than or equal to the threshold value in the process of S07 (NO in S07), the
S08又はS09の処理後、情報提示手段26は、検索結果の情報を提示する(S10)。また、情報提示手段26は、提示した検索結果に対する端末12からのクリック結果等の情報を取得し、検索クエリ、検索結果等と共に検索ログ32に記憶する(S11)。
After the processing of S08 or S09, the information presenting means 26 presents information of the search result (S10). Further, the
ここで、検索手段25は、他の検索クエリの入力を受け付けたか否かを判断し(S12)、他の検索クエリの入力を受け付けた場合(S12において、YES)、S06の処理に戻る。また、他の検索クエリの入力を受け付けてない場合(S12において、NO)、例えば所定時間経過後、又は、端末12からWebサイトの画面を閉じる等の処理があった場合に、制御手段28は、本実施形態における情報提示処理を終了する。
Here, the
<クエリの曖昧性>
ここで、本実施形態におけるクエリの曖昧性について、図を用いて説明する。図4は、クエリの曖昧性を説明するための図である。
<Query ambiguity>
Here, the ambiguity of the query in the present embodiment will be described with reference to the drawings. FIG. 4 is a diagram for explaining the ambiguity of the query.
例えば、図4(A)に示す例では、検索クエリ「テーブル」に対する検索結果のうち、ユーザがクリックしたカテゴリが「ローテーブル」、「センターテーブル」、「サイドテーブル」等である場合、これらは同じ商品「机」のジャンル(属性)に該当するものであるため、類似度が高い。したがって、各カテゴリの類似度が高い(例えば、予め設定された閾値以上である)場合には、クエリの曖昧性が低いと判断し、「テーブル」のクエリに対する補充処理を行わずに検索が実施される。 For example, in the example shown in FIG. 4A, when the category clicked by the user is “low table”, “center table”, “side table”, etc., among the search results for the search query “table”, these are: Since it corresponds to the genre (attribute) of the same product “desk”, the degree of similarity is high. Therefore, if the similarity of each category is high (for example, it is equal to or higher than a preset threshold), it is determined that the ambiguity of the query is low, and the search is performed without performing the replenishment process for the query of “table”. Is done.
また、図4(B)に示す例では、検索クエリ「バルーン」に対する検索結果のうち、ユーザがクリックしたカテゴリが「バルーン鉢」、「バルーンスカート」、「バルーン電報」であったとする。このような場合には、それぞれが「バルーン」の文字を有するものの、商品のジャンルは同一ではない。したがって、このような場合には、カテゴリ間同士の類似度が低く、クエリ「バルーン」は、曖昧性が高いキーワードとして、上述し補充処理等を行う。例えば、ユーザ情報として「ガーデニング好き」等の嗜好情報がある場合には、検索クエリを「バルーン×ガーデニング」等の複合語によって検索する。これにより、ユーザへ適切な検索結果を提示することができる。 In the example shown in FIG. 4B, it is assumed that the category clicked by the user among the search results for the search query “balloon” is “balloon bowl”, “balloon skirt”, and “balloon telegram”. In such a case, although each has the letter “balloon”, the genre of the product is not the same. Therefore, in such a case, the similarity between the categories is low, and the query “balloon” performs the above-described replenishment process as a keyword with high ambiguity. For example, when there is preference information such as “gardening preference” as user information, the search query is searched with a compound word such as “balloon × gardening”. Thereby, an appropriate search result can be presented to the user.
<曖昧性評価手法>
次に、本実施形態における曖昧性評価手法の一例について、具体的に説明する。曖昧性評価手段24は、例えば商品データ31から得られる商品カテゴリや商品タイトルに関する情報や、検索ログ32に含まれている検索クエリと、その検索クエリによる検索結果のそれぞれのカテゴリに対する各ユーザのクリック数(閲覧指示の回数)をカウントすることにより、検索クエリの曖昧さを判断する。
<Ambiguity assessment method>
Next, an example of the ambiguity evaluation method in the present embodiment will be specifically described. The ambiguity evaluation means 24, for example, information on the product category and product title obtained from the
例えば、通常、カテゴリと商品との対応付けは、人の判断等により行われるため、不完全性を有する。また、カテゴリ間は、必ずしも独立しているわけではなく、他のカテゴリとの類似性が高いカテゴリも存在する。したがって、本実施形態では、各カテゴリをLSI等を利用して低次元のベクトル空間にマッピングする。LSIは、通常、ターム(単語)と文章(ドキュメント)との関連マトリックスに適用されるが、本実施形態では、クエリとカテゴリとの関連マトリックスに適用する。 For example, since the association between the category and the product is usually performed based on a person's judgment or the like, it has imperfections. In addition, the categories are not necessarily independent, and there are categories with high similarity to other categories. Therefore, in this embodiment, each category is mapped to a low-dimensional vector space using an LSI or the like. LSI is usually applied to a relationship matrix between terms (words) and sentences (documents), but in this embodiment, it is applied to a relationship matrix between queries and categories.
例えば、本実施形態では、以下の式(1)に示すようなTF(Term Frequency)−IDF(Inverse Document Frequency)によるスコアを使用してクエリとカテゴリとの関連マトリックスを構成する。 For example, in the present embodiment, a query / category association matrix is configured using scores based on TF (Term Frequency) -IDF (Inverse Document Frequency) as shown in the following formula (1).
また、本実施形態では、カテゴリベクトルcについて、このベクトルの「方向」に基づいて集約することで、クエリに対する曖昧さを定量化する。図5は、カテゴリに対する類似度及び曖昧性の関係を説明するための図である。例えば、図5(A)、(B)には、言語的な空間ベクトルが示されており、c1〜c3は、それぞれ検索クエリによって抽出され、ユーザによってクリックされたカテゴリを示している。 In the present embodiment, the ambiguity with respect to the query is quantified by aggregating the category vector c based on the “direction” of the vector. FIG. 5 is a diagram for explaining the relationship between similarity and ambiguity with respect to a category. For example, FIGS. 5A and 5B show linguistic space vectors, and c1 to c3 indicate categories extracted by the search query and clicked by the user.
このカテゴリを図5(A)、(B)に示す空間に落とし込んだ場合、図5(A)の例では、各カテゴリの方向が離散的であるため、各ベクトルの集約結果も小さなベクトル量となる。したがって、図5(A)のような場合には、カテゴリ間の類似度が低く、クエリの曖昧性が高いと評価する。また、図5(B)の例では、各カテゴリの方向が近く、各ベクトルの集約結果は大きなベクトル量となる。したがって、図5(B)のような場合には、カテゴリ間の類似度が高く、クエリの曖昧性が低いと評価する。 When this category is dropped into the spaces shown in FIGS. 5A and 5B, the direction of each category is discrete in the example of FIG. Become. Therefore, in the case of FIG. 5A, it is evaluated that the similarity between categories is low and the ambiguity of the query is high. In the example of FIG. 5B, the directions of the categories are close to each other, and the aggregation result of the vectors is a large vector amount. Therefore, in the case of FIG. 5B, it is evaluated that the similarity between categories is high and the ambiguity of the query is low.
なお、本実施形態では、ベクトルの方向の統一性を評価するため、まず各ベクトルに対する方向の中心(重心)を取得する。本実施形態では、例えば以下の(2)式によってカテゴリの方向の中心を算出することができる。 In this embodiment, in order to evaluate the uniformity of the vector direction, first, the center of the direction (center of gravity) for each vector is acquired. In the present embodiment, for example, the center of the category direction can be calculated by the following equation (2).
次に、取得した中心を基準にした各カテゴリベクトルの距離をコサイン類似度等を用いて算出することで、各カテゴリの類似度を算出ができる。なお、類似性の算出には、例えば、以下に示す式(3)等を用いることができる。 Next, the similarity of each category can be calculated by calculating the distance of each category vector based on the acquired center using the cosine similarity or the like. For example, the following formula (3) can be used for calculating the similarity.
<類似度の算出結果の例>
ここで、類似度の算出結果の一例について、図を用いて説明する。図6は、類似度の算出結果の一例を示す図である。図6の例では、実際の商取引サイト等のWebサイトにおいて使用された検索クエリ(キーワード)や検索結果(クリック数)等から類似度を算出したものである。
<Example of similarity calculation result>
Here, an example of the similarity calculation result will be described with reference to the drawings. FIG. 6 is a diagram illustrating an example of a similarity calculation result. In the example of FIG. 6, the similarity is calculated from a search query (keyword) used on a website such as an actual commercial transaction site, a search result (number of clicks), or the like.
図6の例において、クエリとして「テーブル(table)」と、「バルーン(balloon)との2つの例に対して、検索ログ32から取得した各カテゴリと、カテゴリ毎のクリック(閲覧指示)割合(probability)と、各クエリに対する上述した式(3)による算出結果(sim)が示されている。図6の例において、クエリ「テーブル」の場合には、全265個のカテゴリに対してクリック割合(probability)の最大が0.094であり、その他に上位5個のカテゴリを示している。この上位5個のカテゴリを含め、殆ど全てのカテゴリが、テーブル(Table)という同一のジャンル、属性に含まれ、上述した式(3)による類似度(sim)も0.883と高い数値となった。
In the example of FIG. 6, with respect to two examples of “table” and “balloon” as queries, each category acquired from the
一方、図6の例において、クエリ「バルーン」の場合には、全152個のカテゴリに対して、クリック割合の最大が0.094であり、その他に上位5個のカテゴリを示している。この上位5個のカテゴリには、ガーデニング(Gardening)や、玩具(Toy)、ファッション(Fashion)等の異なるジャンル、属性のものがあり、上述した式(3)による類似度(sim)も0.376と低い数値となった。 On the other hand, in the example of FIG. 6, in the case of the query “balloon”, the maximum click ratio is 0.094 for all 152 categories, and the other five categories are shown. The top five categories include those with different genres and attributes such as gardening, toys, fashion, etc., and the similarity (sim) according to the above equation (3) is also 0. It was a low figure of 376.
本実施形態では、上述した類似度を用いて曖昧性を定量化し、曖昧度データ33として記憶する。これにより、その後の検索要求に対して、入力された検索クエリに対する曖昧性を曖昧度データ33より判断し、類似度が低い(曖昧性が高い)場合に、検索キーワードの拡張やユーザ情報の利用によりクエリを補充して、検索処理を行い、結果を提示する。
In the present embodiment, ambiguity is quantified using the above-described similarity and stored as
<曖昧性データを利用した検索内容>
次に、本実施形態における曖昧性データを利用した検索内容について、図を用いて説明する。図7は、曖昧性データを利用した検索内容の一例を示す図である。なお、図7の例では、曖昧性データの生成と、生成した曖昧性データを利用した検索内容を示す。
<Search contents using ambiguity data>
Next, search contents using ambiguity data in the present embodiment will be described with reference to the drawings. FIG. 7 is a diagram showing an example of search contents using ambiguous data. In the example of FIG. 7, ambiguity data is generated and search contents using the generated ambiguity data are shown.
図7の例では、上述したように、商品データ31と、検索ログ32とを用いてクエリに対する曖昧度を評価する。本実施形態では、図7の(1)に示すように、商品データ31に含まれるカテゴリやタイトル(商品名)等からカテゴリ毎のベクトル表現を生成する。ベクトル表現は、例えばLSI等を用いることができ、また上述した式(1)等を用いて各カテゴリベクトルの方向及び量を算出することができる。
In the example of FIG. 7, as described above, the ambiguity with respect to the query is evaluated using the
また、本実施形態では、図7の(2)に示すように、検索ログ32を用いてクエリ(例えば、テーブル)に対してクリック(閲覧)した各カテゴリの分布(クリック割合)を抽出する。
In this embodiment, as shown in (2) of FIG. 7, the distribution (click ratio) of each category clicked (viewed) on a query (for example, a table) is extracted using the
次に、抽出した各カテゴリの分布に基づく各カテゴリベクトルを用いてカテゴリ間の類似度を算出し、算出した結果から曖昧度を評価する。図7の例では、「ローテーブル」、「センターテーブル」、「サイドテーブル」に対応するカテゴリベクトルを用いて、上述した式(2)、式(3)により類似度を算出し、算出結果を曖昧性の評価結果として、曖昧度データ33に記憶する。図7の(3)の例では、曖昧度の評価結果として式(3)で求めた類似度「0.88」がクエリ(テーブル)に対応付けられて記憶される。なお、曖昧度データ33に記憶されるデータは、上述した類似度の算出結果に限定されるものではなく、例えば「曖昧度=1−類似度」として、類似度を用いて計算された値(例えば、曖昧度=1−0.88=0.12)を曖昧度データ33に記憶してもよい。
Next, the similarity between categories is calculated using each category vector based on the distribution of each extracted category, and the ambiguity is evaluated from the calculated result. In the example of FIG. 7, using the category vectors corresponding to “low table”, “center table”, and “side table”, the similarity is calculated by the above formulas (2) and (3), and the calculation result is The ambiguity evaluation result is stored in the
この曖昧度データ33を用いることで、例えば図7の(4)に示すように、曖昧性評価装置11が提供する検索サイトにおいて、「テーブル」の検索クエリが入力された場合、曖昧度データ33を参照し、テーブルに対する曖昧度が低いため、そのままのクエリで検索を行う。また、他の検索クエリ「バルーン」の場合には、図6の例により、類似度が0.376と低い(曖昧度が高い)ため、他の検索キーワードを追加したり、ユーザ情報を利用して嗜好情報に対応したキーワードを補充して検索を行い、その検索結果を提示する。
By using this
<まとめ>
上述したように、本実施形態によれば、ユーザの意図の曖昧性を定量化することができる。これにより、本実施形態は、ユーザへ適切な検索結果を提示することができる。なお、上述した実施形態では、曖昧性の評価の対象となるクエリを1単語としたが、複数単語からなる複合語の場合にも、その複合語を1つの検索クエリとして、上述したカテゴリ間の類似度を算出し、算出した類似度に基づいて曖昧性の評価を行うことができる。また、上述したカテゴリ間の類似度の算出については、言語的な空間でベクトルに置き換えて類似度を算出してもよく、また予め設定されたカテゴリのツリー構造を用いて類似度を算出してもよく、これらを組み合わせてもよい。
<Summary>
As described above, according to the present embodiment, the ambiguity of the user's intention can be quantified. Thereby, this embodiment can present an appropriate search result to a user. In the above-described embodiment, the query for which the ambiguity is evaluated is one word. However, even in the case of a compound word composed of a plurality of words, the compound word is used as one search query between the above categories. Similarity can be calculated, and ambiguity can be evaluated based on the calculated similarity. As for the above-described similarity calculation between categories, the similarity may be calculated by replacing it with a vector in a linguistic space, or the similarity is calculated using a tree structure of a preset category. These may be combined.
以上、本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形、変更が可能である。 The preferred embodiments of the present invention have been described in detail above, but the present invention is not limited to such specific embodiments, and various modifications can be made within the scope of the gist of the present invention described in the claims. Can be changed.
また、上述した各実施形態で述べたフローチャートは、矛盾のない限り順序を入れ替えてもよい。また、上述した各実施形態の全部又は一部を組み合わせることができる。また、上述した各実施形態の全部又は一部は、プログラムによって実装され得る。このプログラムは、記憶媒体に格納することができる。 In addition, the order of the flowcharts described in the above embodiments may be changed as long as there is no contradiction. Moreover, all or some of the above-described embodiments can be combined. In addition, all or part of the above-described embodiments can be implemented by a program. This program can be stored in a storage medium.
なお、上記実施形態に挙げた構成等に、その他の要素との組み合わせ等、ここで示した構成に本発明が限定されるものではない。これらの点に関しては、本発明の趣旨を逸脱しない範囲で変更することが可能であり、その応用形態に応じて適切に定めることができる。 Note that the present invention is not limited to the configurations shown here, such as combinations with other elements, etc., in the configurations described in the above embodiments. These points can be changed without departing from the spirit of the present invention, and can be appropriately determined according to the application form.
10 情報提示システム
11 曖昧性評価装置
12 端末
13 通信ネットワーク
21 入力手段
22 出力手段
23 記憶手段
24 曖昧性評価手段
25 検索手段
26 情報提示手段
27 通信手段
28 制御手段
31 商品データ
32 検索ログ
33 曖昧度データ
34 情報提示データ
41 入力装置
42 出力装置
43 ドライブ装置
44 補助記憶装置
45 メモリ装置
46 CPU
47 ネットワーク接続装置
48 記録媒体
DESCRIPTION OF
47
Claims (10)
前記記憶手段に記憶された検索履歴情報から、各キーワードに対する前記カテゴリ間の類似度を算出し、算出した類似度から前記キーワードの曖昧性を評価する曖昧性評価手段と、
を有することを特徴とする曖昧性評価装置。 Storage means for associating and storing as a search history information a keyword used at the time of searching and a category corresponding to a search result searched from search target data using the keyword;
From the search history information stored in the storage means, the similarity between the categories for each keyword is calculated, and the ambiguity evaluation means for evaluating the ambiguity of the keyword from the calculated similarity,
The ambiguity evaluation apparatus characterized by having.
前記検索対象データに含まれる前記カテゴリ毎に空間上のベクトル表現を生成し、
前記検索履歴情報から得られる前記カテゴリ毎の数に基づき前記キーワード毎のカテゴリ分布を抽出し、
前記ベクトル表現と、前記カテゴリ分布とに基づいて、前記類似度を算出することを特徴とする請求項1に記載の曖昧性評価装置。 The ambiguity evaluation means includes
Generating a spatial vector representation for each of the categories included in the search target data;
Extracting the category distribution for each keyword based on the number for each category obtained from the search history information,
The ambiguity evaluation apparatus according to claim 1, wherein the similarity is calculated based on the vector expression and the category distribution.
前記キーワード毎に前記類似度に対応する曖昧性データを前記記憶手段に記憶することを特徴とする請求項1又は2に記載の曖昧性評価装置。 The ambiguity evaluation means includes
The ambiguity evaluation apparatus according to claim 1 or 2, wherein ambiguity data corresponding to the similarity is stored in the storage unit for each keyword.
前記曖昧度と、予め設定した閾値とを比較し、前記曖昧度が前記閾値以上である場合に、前記キーワードに他の情報を補充し、補充した内容で検索を行い、前記曖昧度が前記閾値以上でない場合に、前記キーワードで検索を行うことを特徴とする請求項4に記載の曖昧性評価装置。 The search means includes
The ambiguity is compared with a preset threshold, and when the ambiguity is equal to or greater than the threshold, the keyword is supplemented with other information, and a search is performed with the supplemented content. The ambiguity is the threshold 5. The ambiguity evaluation apparatus according to claim 4, wherein if it is not the above, a search is performed using the keyword.
前記検索対象データから検索された検索結果に対応するカテゴリのうち、ユーザが閲覧指示したカテゴリを前記キーワードと関連付けて検索履歴情報として記憶することを特徴とする請求項1乃至5の何れか1項に記載の曖昧性評価装置。 The storage means
6. The category corresponding to a search result searched from the search target data, the category designated by the user for browsing is stored as search history information in association with the keyword. The ambiguity evaluation apparatus described in 1.
予め設定された前記カテゴリ間のツリー構造のデータに基づいて、前記類似度を算出することを特徴とする請求項1乃至6の何れか1項に記載の曖昧性評価装置。 The ambiguity evaluation means includes
The ambiguity evaluation apparatus according to any one of claims 1 to 6, wherein the similarity is calculated based on data of a tree structure between the categories set in advance.
前記記憶手段に記憶された前記カテゴリ間のツリー構造のデータに基づいて、各キーワードに対する前記カテゴリ間の類似度を算出し、算出した類似度から前記キーワードの曖昧性を評価する曖昧性評価手段と、
を有することを特徴とする曖昧性評価装置。 Storage means for storing a category associated with a keyword used at the time of search as data of a tree structure between preset categories;
Ambiguity evaluation means for calculating the similarity between the categories for each keyword based on the data of the tree structure between the categories stored in the storage means, and evaluating the ambiguity of the keyword from the calculated similarity; ,
The ambiguity evaluation apparatus characterized by having.
前記記憶手段に記憶された検索履歴情報から、各キーワードに対する前記カテゴリ間の類似度を算出し、算出した類似度から前記キーワードの曖昧性を評価する曖昧性評価ステップと、
をコンピュータに実行させる曖昧性評価方法。 A storage step of associating the keyword used at the time of searching with the category corresponding to the search result searched from the search target data using the keyword, and storing it in the storage means as search history information;
From the search history information stored in the storage means, the similarity between the categories for each keyword is calculated, and the ambiguity evaluation step of evaluating the ambiguity of the keyword from the calculated similarity,
Ambiguity Evaluation Method that Causes a Computer to Run
検索時に用いられたキーワードと、該キーワードを用いて検索対象データから検索された検索結果に対応するカテゴリとを関連付けて検索履歴情報として記憶する記憶手段、及び、
前記記憶手段に記憶された検索履歴情報から、各キーワードに対する前記カテゴリ間の類似度を算出し、算出した類似度から前記キーワードの曖昧性を評価する曖昧性評価手段、
として機能させるための曖昧性評価プログラム。 Computer
Storage means for associating and storing as a search history information a keyword used at the time of searching and a category corresponding to a search result searched from search target data using the keyword;
From the search history information stored in the storage means, the similarity between the categories for each keyword is calculated, and the ambiguity evaluation means for evaluating the ambiguity of the keyword from the calculated similarity,
Ambiguity evaluation program to function as
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015166161A JP6664599B2 (en) | 2015-08-25 | 2015-08-25 | Ambiguity evaluation device, ambiguity evaluation method, and ambiguity evaluation program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015166161A JP6664599B2 (en) | 2015-08-25 | 2015-08-25 | Ambiguity evaluation device, ambiguity evaluation method, and ambiguity evaluation program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017045196A true JP2017045196A (en) | 2017-03-02 |
JP6664599B2 JP6664599B2 (en) | 2020-03-13 |
Family
ID=58210293
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015166161A Active JP6664599B2 (en) | 2015-08-25 | 2015-08-25 | Ambiguity evaluation device, ambiguity evaluation method, and ambiguity evaluation program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6664599B2 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018147447A (en) * | 2017-03-09 | 2018-09-20 | Supership株式会社 | Information processing device, information processing method, and program |
JP2019020939A (en) * | 2017-07-14 | 2019-02-07 | ヤフー株式会社 | Information processing system, information processing method, and program |
JP2019020940A (en) * | 2017-07-14 | 2019-02-07 | ヤフー株式会社 | Information processing system, information processing method, and program |
CN110659179A (en) * | 2019-08-30 | 2020-01-07 | 中国人民财产保险股份有限公司 | Method and device for evaluating system running condition and electronic equipment |
JP7451747B2 (en) | 2020-04-01 | 2024-03-18 | バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド | Methods, devices, equipment and computer readable storage media for searching content |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005322165A (en) * | 2004-05-11 | 2005-11-17 | Nippon Telegr & Teleph Corp <Ntt> | Retrieval keyword presentation method, device, and program |
US20120221557A1 (en) * | 2011-02-28 | 2012-08-30 | Ebay Inc. | Method and system for classifying queries to improve relevance of search results |
-
2015
- 2015-08-25 JP JP2015166161A patent/JP6664599B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005322165A (en) * | 2004-05-11 | 2005-11-17 | Nippon Telegr & Teleph Corp <Ntt> | Retrieval keyword presentation method, device, and program |
US20120221557A1 (en) * | 2011-02-28 | 2012-08-30 | Ebay Inc. | Method and system for classifying queries to improve relevance of search results |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018147447A (en) * | 2017-03-09 | 2018-09-20 | Supership株式会社 | Information processing device, information processing method, and program |
JP2019020939A (en) * | 2017-07-14 | 2019-02-07 | ヤフー株式会社 | Information processing system, information processing method, and program |
JP2019020940A (en) * | 2017-07-14 | 2019-02-07 | ヤフー株式会社 | Information processing system, information processing method, and program |
JP7001380B2 (en) | 2017-07-14 | 2022-01-19 | ヤフー株式会社 | Information processing systems, information processing methods, and programs |
CN110659179A (en) * | 2019-08-30 | 2020-01-07 | 中国人民财产保险股份有限公司 | Method and device for evaluating system running condition and electronic equipment |
CN110659179B (en) * | 2019-08-30 | 2022-11-04 | 中国人民财产保险股份有限公司 | Method and device for evaluating system running condition and electronic equipment |
JP7451747B2 (en) | 2020-04-01 | 2024-03-18 | バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド | Methods, devices, equipment and computer readable storage media for searching content |
Also Published As
Publication number | Publication date |
---|---|
JP6664599B2 (en) | 2020-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10042896B2 (en) | Providing search recommendation | |
JP6054577B2 (en) | Static ranking for search queries in online social networks | |
TWI650654B (en) | Query suggestion template | |
JP5281405B2 (en) | Selecting high-quality reviews for display | |
WO2017024884A1 (en) | Search intention identification method and device | |
CN108701155B (en) | Expert detection in social networks | |
US8909625B1 (en) | Image search | |
JP5721818B2 (en) | Use of model information group in search | |
JP6151450B2 (en) | Rewriting search queries in online social networks | |
WO2018028443A1 (en) | Data processing method, device and system | |
WO2016086724A1 (en) | Method and apparatus for determining quality information about to-be-commented item | |
US9268767B2 (en) | Semantic-based search system and search method thereof | |
JP6664599B2 (en) | Ambiguity evaluation device, ambiguity evaluation method, and ambiguity evaluation program | |
US11106707B2 (en) | Triggering application information | |
JP2015525929A (en) | Weight-based stemming to improve search quality | |
CN110968789B (en) | Electronic book pushing method, electronic equipment and computer storage medium | |
US9400789B2 (en) | Associating resources with entities | |
US20170293683A1 (en) | Method and system for providing contextual information | |
CN111737607A (en) | Data processing method, data processing device, electronic equipment and storage medium | |
JP6163143B2 (en) | Information providing apparatus, information providing method, and information providing program | |
US11586639B2 (en) | Information computing apparatus, information computing method, and non-transitory computer readable storage medium | |
CN112926297B (en) | Method, apparatus, device and storage medium for processing information | |
TWI547888B (en) | A method of recording user information and a search method and a server | |
JP2017208047A (en) | Information search method, information search apparatus, and program | |
JP2017072964A (en) | Information analyzing apparatus and information analyzing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180308 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190326 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190522 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191029 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191112 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191126 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6664599 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |