JP2017146926A - Information processing device, information processing method and information processing program - Google Patents

Information processing device, information processing method and information processing program Download PDF

Info

Publication number
JP2017146926A
JP2017146926A JP2016030239A JP2016030239A JP2017146926A JP 2017146926 A JP2017146926 A JP 2017146926A JP 2016030239 A JP2016030239 A JP 2016030239A JP 2016030239 A JP2016030239 A JP 2016030239A JP 2017146926 A JP2017146926 A JP 2017146926A
Authority
JP
Japan
Prior art keywords
information
search
ambiguity
keyword
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016030239A
Other languages
Japanese (ja)
Other versions
JP6203304B2 (en
Inventor
友貴 矢野
Tomoki Yano
友貴 矢野
玲 田島
Rei Tajima
玲 田島
幸浩 田頭
Yukihiro Tagashira
幸浩 田頭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2016030239A priority Critical patent/JP6203304B2/en
Publication of JP2017146926A publication Critical patent/JP2017146926A/en
Application granted granted Critical
Publication of JP6203304B2 publication Critical patent/JP6203304B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide an information processing device, an information processing method and an information processing program which can determine ambiguity of a keyword to be used for retrieval with high accuracy.SOLUTION: An information processing device 3 includes a storage part, and an ambiguity determination part. The storage part associates a keyword used during retrieval with information on a plurality of objects selected among retrieval results retrieved by using the keyword to be stored as retrieval history information. The ambiguity determination part calculates a similarity among the plurality of objects corresponding to the keyword on the basis of the retrieval history information stored in the storage part, and determines the ambiguity of the keyword from the calculated similarity.SELECTED DRAWING: Figure 2

Description

本発明は、情報処理装置、情報処理方法および情報処理プログラムに関する。   The present invention relates to an information processing apparatus, an information processing method, and an information processing program.

従来、インターネット等のネットワーク上にウェブサイトを公開し、そのウェブサイトにアクセスしてきた端末装置に対して、端末装置のユーザが所望する情報を提示するサービスが存在する。   2. Description of the Related Art Conventionally, there is a service for publishing a website on a network such as the Internet and presenting information desired by a user of the terminal apparatus to a terminal apparatus that has accessed the website.

例えば、オンラインショッピングのウェブサイトでは、ユーザが指定したキーワードを含む検索クエリを端末装置から受け付け、かかるキーワードに基づいて予め商品の情報が登録されたデータベースを検索し、検索された商品の情報を含む検索結果を端末装置へ送信する。検索された商品が、ユーザが目的としている商品の情報であれば、その購入手続き等を行うことで、ユーザにその商品を提供することができる。   For example, in an online shopping website, a search query including a keyword specified by a user is received from a terminal device, a database in which product information is registered in advance is searched based on the keyword, and information on the searched product is included. The search result is transmitted to the terminal device. If the searched product is information on the product intended by the user, the product can be provided to the user by performing a purchase procedure or the like.

また、ユーザが検索キーワードを入力して「検索」ボタンをクリックすると、検索結果のページにジャンプするだけでなく、ユーザによって入力された検索キーワードに関連する他の検索キーワードを表示する仕組みも提案されている(例えば、特許文献1参照)。   In addition, when a user inputs a search keyword and clicks the “search” button, a mechanism for displaying not only a search result page but also other search keywords related to the search keyword input by the user is proposed. (For example, refer to Patent Document 1).

特許文献1に記載の技術では、ユーザによって入力された検索キーワードを受信し、明確に規定されていない意図に対応する複数の所定の単語と検索キーワードとが比較される。そして、かかる比較結果に基づいて、検索キーワードがユーザによって明確に規定された意図を示すか否かが判定され、検索キーワードが明確に規定された意図を示さないと判定された場合に、更なる推薦検索キーワードを取得するための処理が実行される。   In the technique described in Patent Literature 1, a search keyword input by a user is received, and a plurality of predetermined words corresponding to intentions not clearly defined are compared with the search keyword. Then, based on the comparison result, it is determined whether or not the search keyword indicates the intention clearly defined by the user, and if it is determined that the search keyword does not indicate the clearly defined intention, further Processing for acquiring the recommended search keyword is executed.

特表2014−501422号公報Special table 2014-501422 gazette

しかしながら、上記従来の手法では、明確に規定されていない意図に対応する複数の所定の単語である不明確意図ワードセットを用いるため、例えば、不明確意図ワードセットの設定によってはキーワードの曖昧性の判定精度に課題がある。   However, since the above-described conventional method uses an unclear intention word set that is a plurality of predetermined words corresponding to intentions that are not clearly defined, for example, depending on the setting of the unclear intention word set, the ambiguity of the keyword may be reduced. There is a problem in determination accuracy.

本発明は、上記に鑑みてなされたものであって、検索に用いられるキーワードの曖昧性を精度よく判定することができる情報処理装置、情報処理方法および情報処理プログラムを提供することを目的とする。   The present invention has been made in view of the above, and an object thereof is to provide an information processing apparatus, an information processing method, and an information processing program capable of accurately determining the ambiguity of a keyword used for a search. .

本願に係る情報処理装置は、記憶部と、曖昧性判定部とを備える。前記記憶部は、検索時に用いられたキーワードと、当該キーワードを用いて検索された検索結果の中から選択された複数の対象に関する情報とを関連付けて検索履歴情報として記憶する。前記曖昧性判定部は、前記記憶部に記憶された検索履歴情報に基づき、前記キーワードに対応する前記複数の対象間の類似度を算出し、算出した類似度から前記キーワードの曖昧性を判定する。   The information processing apparatus according to the present application includes a storage unit and an ambiguity determination unit. The storage unit stores, as search history information, a keyword used at the time of search and information on a plurality of targets selected from search results searched using the keyword in association with each other. The ambiguity determination unit calculates the similarity between the plurality of objects corresponding to the keyword based on the search history information stored in the storage unit, and determines the ambiguity of the keyword from the calculated similarity .

実施形態の一態様によれば、検索に用いられるキーワードの曖昧性を精度よく判定することができる情報処理装置、情報処理方法および情報処理プログラムを提供することができる。   According to one aspect of the embodiment, it is possible to provide an information processing apparatus, an information processing method, and an information processing program that can accurately determine the ambiguity of a keyword used for a search.

図1は、実施形態に係る情報処理の説明図である。FIG. 1 is an explanatory diagram of information processing according to the embodiment. 図2は、実施形態に係る情報処理システムの構成例を示す図である。FIG. 2 is a diagram illustrating a configuration example of the information processing system according to the embodiment. 図3は、実施形態に係る情報処理装置の具体的構成例を示す図である。FIG. 3 is a diagram illustrating a specific configuration example of the information processing apparatus according to the embodiment. 図4は、曖昧性情報記憶部に記憶された曖昧度テーブルの一例を示す図である。FIG. 4 is a diagram illustrating an example of an ambiguity table stored in the ambiguity information storage unit. 図5は、検索履歴記憶部に記憶される検索履歴テーブルの一例を示す図である。FIG. 5 is a diagram illustrating an example of a search history table stored in the search history storage unit. 図6は、端末装置で表示される検索結果情報の一例を示す図である。FIG. 6 is a diagram illustrating an example of search result information displayed on the terminal device. 図7は、ある選択対象のトピック分布の一例を示す図である。FIG. 7 is a diagram illustrating an example of a topic distribution to be selected. 図8は、特徴情報記憶部に記憶される特徴情報の一例を示す図である。FIG. 8 is a diagram illustrating an example of feature information stored in the feature information storage unit. 図9は、異なるクエリのそれぞれのトピック分布を示す図である。FIG. 9 is a diagram illustrating topic distributions of different queries. 図10は、実施形態に係る情報処理装置における情報処理の流れを示すフローチャートである。FIG. 10 is a flowchart illustrating a flow of information processing in the information processing apparatus according to the embodiment. 図11は、図10に示す検索処理の流れを示すフローチャートである。FIG. 11 is a flowchart showing the flow of the search process shown in FIG. 図12は、図10に示す曖昧性判定処理の流れを示すフローチャートである。FIG. 12 is a flowchart showing the flow of the ambiguity determination process shown in FIG. 図13は、情報処理プログラムを実行するコンピュータのハードウェア構成の一例を示す図である。FIG. 13 is a diagram illustrating an example of a hardware configuration of a computer that executes an information processing program.

以下に、本願に係る情報処理装置、情報処理方法および情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法および情報処理プログラムが限定されるものではない。   Hereinafter, a mode for carrying out an information processing apparatus, an information processing method, and an information processing program according to the present application (hereinafter referred to as “embodiment”) will be described in detail with reference to the drawings. Note that the information processing apparatus, the information processing method, and the information processing program according to the present application are not limited by this embodiment.

[1.曖昧性判定処理を含む情報処理]
まず、実施形態に係る情報処理について説明する。図1は、実施形態に係る情報処理の説明図であり、かかる情報処理は情報処理装置3によって実行される。情報処理装置3が実行する情報処理には検索処理および曖昧性判定処理が含まれる。以下、検索処理および曖昧性判定処理の順に説明する。
[1. Information processing including ambiguity determination processing]
First, information processing according to the embodiment will be described. FIG. 1 is an explanatory diagram of information processing according to the embodiment, and the information processing is executed by the information processing apparatus 3. Information processing executed by the information processing apparatus 3 includes search processing and ambiguity determination processing. Hereinafter, the search process and the ambiguity determination process will be described in this order.

図1に示すように、実施形態に係る情報処理装置3は、端末装置2からキーワードk1(以下、検索キーワードk1と記載する)を含む検索クエリが送信されると(ステップS1)、検索クエリに含まれる検索キーワードk1を用いて検索処理を行い、かかる検索結果を端末装置へ送信する(ステップS2)。   As illustrated in FIG. 1, when a search query including a keyword k1 (hereinafter referred to as a search keyword k1) is transmitted from the terminal device 2 (step S1), the information processing apparatus 3 according to the embodiment receives the search query. A search process is performed using the included search keyword k1, and the search result is transmitted to the terminal device (step S2).

情報処理装置3から送信される検索結果には、複数の選択対象d1〜dn(nは2以上の整数)の情報が含まれている。端末装置2のユーザ(以下、端末ユーザと記載する場合がある)は、これら複数の選択対象d1〜dn(以下、選択対象dと総称する場合がある)の中から1以上の選択対象dを選択すると、かかる選択結果が情報処理装置3へ送信される(ステップS3)。情報処理装置3は、端末装置2から選択結果を受け取ると、かかる選択結果に対応する情報を端末装置2へ送信する(ステップS4)。   The search result transmitted from the information processing device 3 includes information on a plurality of selection targets d1 to dn (n is an integer of 2 or more). A user of the terminal device 2 (hereinafter sometimes referred to as a terminal user) selects one or more selection targets d from among the plurality of selection targets d1 to dn (hereinafter may be collectively referred to as selection targets d). When selected, the selection result is transmitted to the information processing apparatus 3 (step S3). When the information processing device 3 receives the selection result from the terminal device 2, the information processing device 3 transmits information corresponding to the selection result to the terminal device 2 (step S4).

例えば、情報処理装置3がオンラインショッピングのウェブサイトを提供する場合、情報処理装置3は、検索キーワードk1に応じた複数の商品のウェブページのそれぞれへのリンクが選択対象d1〜dnとして設定された検索結果ページを端末装置2へ送信する。端末ユーザは、検索結果ページの中から選択対象d1を選択(商品Aのリンクをクリック)すると、情報処理装置3は、選択対象d1(商品A)に対応するウェブページを端末装置2へ提供する。   For example, when the information processing device 3 provides a website for online shopping, the information processing device 3 sets the links to the web pages of a plurality of products corresponding to the search keyword k1 as the selection targets d1 to dn. The search result page is transmitted to the terminal device 2. When the terminal user selects the selection target d1 from the search result page (clicks on the link for the product A), the information processing device 3 provides the terminal device 2 with a web page corresponding to the selection target d1 (product A). .

情報処理装置3は、上述してステップS1〜S4で行われる検索処理の履歴を検索履歴情報として記憶する(ステップS5)。図1に示す例では、各選択対象d1〜dnの端末ユーザによる選択割合が検索キーワードk1に関連付けられて検索履歴情報として記憶されている。かかる選択割合は、同一の検索キーワードk1に対する1以上の端末ユーザの選択結果全体に対する割合である。   The information processing apparatus 3 stores the history of the search processing performed in steps S1 to S4 as described above as search history information (step S5). In the example shown in FIG. 1, the selection ratio by the terminal user of each of the selection targets d1 to dn is stored as search history information in association with the search keyword k1. This selection ratio is a ratio with respect to the entire selection result of one or more terminal users for the same search keyword k1.

また、情報処理装置3は、選択対象d1〜dnのそれぞれの特徴を解析して特徴情報として記憶部に記憶する(ステップS6)。特徴情報は、選択対象dの特徴を示すための指標である。例えば、情報処理装置3は、選択対象dがウェブページである場合、かかるウェブページに含まれる特徴要素を抽出し、ウェブページにおける特徴要素の分布を検出する。   Further, the information processing device 3 analyzes the features of the selection targets d1 to dn and stores them as feature information in the storage unit (step S6). The feature information is an index for indicating the feature of the selection target d. For example, when the selection target d is a web page, the information processing apparatus 3 extracts a feature element included in the web page and detects a distribution of the feature element in the web page.

特徴要素は、例えば、ウェブページに含まれる単語から抽出されるトピックである。かかるトピックは、ウェブページなどのデータに含まれる単語を例えば、話題や興味として抽象的に表したものである。例えば、情報処理装置3は、例えば、公知のトピックモデル(言語モデル)である潜在的ディリクレ配分法(LDA:Latent Dirichlet Allocation)を用いてトピックを抽出することができる。   The feature element is, for example, a topic extracted from a word included in a web page. Such a topic is an abstract representation of a word included in data such as a web page, for example, as a topic or interest. For example, the information processing apparatus 3 can extract topics using, for example, a latent Dirichlet Allocation (LDA) which is a known topic model (language model).

情報処理装置3は、検索キーワードk1に対応する複数の選択対象d1〜dn間の類似度を算出し、算出した類似度から検索キーワードk1の曖昧性を判定する(ステップS7)。例えば、情報処理装置3は、選択対象d1〜dn間での特徴要素の分布の類似度に基づいて、選択対象d1〜dn間の類似度を算出することができる。この場合、情報処理装置3は、例えば、上述した選択対象d1〜dnの選択割合に応じて各選択対象d1〜dnの特徴要素の重み付けを行い、このように重み付けを行った特徴要素の分布間の類似度を算出する。   The information processing device 3 calculates the similarity between the plurality of selection targets d1 to dn corresponding to the search keyword k1, and determines the ambiguity of the search keyword k1 from the calculated similarity (step S7). For example, the information processing device 3 can calculate the similarity between the selection targets d1 to dn based on the similarity of the distribution of the feature elements between the selection targets d1 to dn. In this case, for example, the information processing device 3 performs weighting of the feature elements of the selection targets d1 to dn according to the selection ratio of the selection targets d1 to dn described above, and between the distributions of the feature elements thus weighted. The similarity is calculated.

なお、情報処理装置3は、複数の選択対象d1〜dn間の類似度をそのまま検索キーワードk1の曖昧性としたり、複数の選択対象d1〜dn間の類似度に応じて、3段階の曖昧度を「低」、「中」、「高」のいずれかから選択したりすることもできる。   Note that the information processing device 3 directly uses the similarity between the plurality of selection targets d1 to dn as the ambiguity of the search keyword k1, or the three levels of ambiguity according to the similarity between the plurality of selection targets d1 to dn. Can be selected from “low”, “medium”, and “high”.

このように、情報処理装置3は、端末ユーザによって選択された選択対象d1〜dn(対象の一例)間の類似度から検索クエリに含まれる検索キーワードk1の曖昧性を判定することから、検索に用いられる検索キーワードk1の曖昧性を精度よく判定することができる。   As described above, the information processing device 3 determines the ambiguity of the search keyword k1 included in the search query from the similarity between the selection targets d1 to dn (an example of the target) selected by the terminal user. It is possible to accurately determine the ambiguity of the search keyword k1 used.

なお、2以上の選択対象dをグループ化して選択対象d1〜dnを複数のグループg1〜gm(m<n)に振り分け、グループg1〜gm(以下、選択グループgと総称する場合がある)間の類似度から検索クエリに含まれる検索キーワードk1の曖昧性を判定することもできる。情報処理装置3がオンラインショッピングのウェブサイトを提供する場合、選択グループgは、例えば、商品カテゴリである。   In addition, two or more selection targets d are grouped and the selection targets d1 to dn are distributed to a plurality of groups g1 to gm (m <n), and between groups g1 to gm (hereinafter, sometimes collectively referred to as a selection group g). It is also possible to determine the ambiguity of the search keyword k1 included in the search query from the similarity. When the information processing device 3 provides an online shopping website, the selection group g is, for example, a product category.

この場合、情報処理装置3は、各グループg1〜gm(対象の一例)の特徴を解析して特徴情報として記憶部に記憶する。例えば、情報処理装置3は、選択対象d1〜dnがウェブページである場合、各グループg1〜gmに含まれるウェブページに含まれる特徴要素を抽出し、各グループg1〜gmにおける特徴要素の分布を検出する。   In this case, the information processing device 3 analyzes the characteristics of each of the groups g1 to gm (an example of the target) and stores them as characteristic information in the storage unit. For example, when the selection targets d1 to dn are web pages, the information processing device 3 extracts feature elements included in the web pages included in the groups g1 to gm, and calculates the distribution of the feature elements in the groups g1 to gm. To detect.

[2.情報処理システム]
図2は、実施形態に係る情報処理システムの構成例を示す図である。図2に示すように、実施形態に係る情報処理システム1は、複数の端末装置2〜2(nは、2以上の整数)と、情報処理装置3とを備える。
[2. Information processing system]
FIG. 2 is a diagram illustrating a configuration example of the information processing system according to the embodiment. As illustrated in FIG. 2, the information processing system 1 according to the embodiment includes a plurality of terminal devices 2 1 to 2 n (n is an integer of 2 or more) and an information processing device 3.

これら複数の端末装置2〜2(以下、端末装置2と総称する場合がある)および情報処理装置3は、ネットワーク4を介して互いに通信可能に接続される。ネットワーク4は、例えば、LAN(Local Area Network)や、インターネットなどのWAN(Wide Area Network)である。 The plurality of terminal devices 2 1 to 2 n (hereinafter may be collectively referred to as the terminal device 2) and the information processing device 3 are connected to each other via the network 4 so as to communicate with each other. The network 4 is, for example, a LAN (Local Area Network) or a WAN (Wide Area Network) such as the Internet.

端末装置2は、例えば、端末ユーザによって利用されるPC(Personal Computer)、PDA(Personal Digital Assistant)、スマートフォンなどである。かかる端末装置2は、例えば、情報処理装置3にアクセスするためのアプリケーション(例えば、ブラウザアプリケーション)がインストールされている。   The terminal device 2 is, for example, a PC (Personal Computer), a PDA (Personal Digital Assistant), a smartphone, or the like used by a terminal user. In the terminal device 2, for example, an application (for example, a browser application) for accessing the information processing device 3 is installed.

情報処理装置3は、通信部10、記憶部20および制御部30を備える。制御部30は、情報提供部31と、曖昧性判定部32とを備える。情報提供部31は、例えばショッピングサイトやニュース・サイト、Q&Aサイト、電子商取引サイト、動画提供サイト、検索サイト等のウェブサイトをネットワーク4上で公開し、記憶部20に記憶された提供情報に基づいて情報提供サービスを端末装置2へ提供する。   The information processing apparatus 3 includes a communication unit 10, a storage unit 20, and a control unit 30. The control unit 30 includes an information providing unit 31 and an ambiguity determination unit 32. The information providing unit 31 publishes websites such as a shopping site, a news site, a Q & A site, an electronic commerce site, a video providing site, and a search site on the network 4, and based on the provided information stored in the storage unit 20. Thus, the information providing service is provided to the terminal device 2.

端末装置2は、端末ユーザが所望の情報にアクセスするために指定した検索キーワードを含む検索クエリを情報処理装置3へ送信し、情報処理装置3は、検索キーワードに応じた検索処理を行い、かかる検索結果を端末装置2へ提供する。端末ユーザが検索結果の中から所望の対象を選択すると、かかる選択結果が端末装置2から情報処理装置3へ送信される。情報処理装置3は、端末ユーザの選択結果に応じた情報を端末装置2へ提供する。なお、検索キーワードは、1以上の語(例えば、一つの単語や複数の単語の組)を含む。   The terminal device 2 transmits a search query including a search keyword designated for accessing desired information by the terminal user to the information processing device 3, and the information processing device 3 performs a search process according to the search keyword. The search result is provided to the terminal device 2. When the terminal user selects a desired target from the search results, the selection result is transmitted from the terminal device 2 to the information processing device 3. The information processing device 3 provides information corresponding to the selection result of the terminal user to the terminal device 2. Note that the search keyword includes one or more words (for example, one word or a set of a plurality of words).

記憶部20は、検索時に用いられた検索キーワードと、かかる検索キーワードを用いて検索された検索結果の中から選択された複数の対象に関する情報とを関連付けて検索履歴情報として記憶する。曖昧性判定部32は、記憶部20に記憶された検索履歴情報に基づき、検索キーワードに対応する複数の対象間の類似度を算出し、算出した類似度から検索キーワードの曖昧性を判定する。   The storage unit 20 stores the search keyword used at the time of search and the information related to a plurality of objects selected from the search results searched using the search keyword as search history information in association with each other. The ambiguity determination unit 32 calculates the similarity between a plurality of objects corresponding to the search keyword based on the search history information stored in the storage unit 20, and determines the ambiguity of the search keyword from the calculated similarity.

情報提供部31は、曖昧性判定部32によって判定された曖昧性に基づいて、検索キーワードに応じた検索結果を提供することができる。例えば、情報提供部31は、検索キーワードの曖昧度が高い場合、検索クエリに他の情報(例えば、追加キーワード等)を補充して検索を行ったり、検索を補助するための他の情報(例えば、追加キーワード等)を絞り込み候補の情報として端末装置2へ提供したりすることができる。絞り込み候補の情報は、端末ユーザに選択可能に端末装置2の検索画面(例えば、検索キーワードの入力ボックスの上部)に表示され、かかる絞り込み候補を端末装置2において端末ユーザが選択することによって、かかる選択結果が端末装置2から情報処理装置3へ送信される。これにより、情報提供部31は、端末ユーザに選択された絞り込み候補に応じた検索結果を端末ユーザに提供することができる。なお、絞り込み候補の情報は、検索キーワードと追加キーワードとを含む情報であってもよい。なお、上記他の情報として例えば端末ユーザのユーザ情報を利用して嗜好情報に対応したキーワードを用いることができる。   The information providing unit 31 can provide a search result corresponding to the search keyword based on the ambiguity determined by the ambiguity determining unit 32. For example, when the ambiguity of the search keyword is high, the information providing unit 31 performs a search by supplementing the search query with other information (for example, an additional keyword), or other information for assisting the search (for example, , Additional keywords, etc.) can be provided to the terminal device 2 as narrowing candidate information. The refinement candidate information is displayed on the search screen of the terminal device 2 (for example, at the top of the search keyword input box) so that the terminal user can select it, and the refinement candidate is selected by the terminal user in the terminal device 2. The selection result is transmitted from the terminal device 2 to the information processing device 3. Thereby, the information provision part 31 can provide the terminal user with the search result according to the narrowing-down candidate selected by the terminal user. The narrowing candidate information may be information including a search keyword and an additional keyword. Note that as the other information, for example, a keyword corresponding to preference information can be used using user information of the terminal user.

このように、情報処理装置3は、検索キーワードに対応する複数の対象(例えば、選択対象dまたは選択グループg)間の類似度を算出し、算出した類似度から検索キーワードの曖昧性を判定することから、検索キーワードの曖昧性を精度よく判定することができる。さらに、情報処理装置3は、検索キーワードの曖昧性に基づいて、端末ユーザへ適切な検索結果を提示したり、絞り込み候補の情報を端末ユーザに提供して端末ユーザに絞り込み候補を選択させることによって端末ユーザの検索意図をより明確にしたりすることができる。   In this way, the information processing device 3 calculates the similarity between a plurality of targets (for example, the selection target d or the selection group g) corresponding to the search keyword, and determines the ambiguity of the search keyword from the calculated similarity. Therefore, the ambiguity of the search keyword can be accurately determined. Furthermore, the information processing device 3 presents an appropriate search result to the terminal user based on the ambiguity of the search keyword, or provides the terminal user with information on the narrowing candidate to cause the terminal user to select the narrowing candidate. The search intention of the terminal user can be made clearer.

以下、図3を参照して情報処理装置3の構成についてさらに具体的に説明する。図3は、実施形態に係る情報処理装置3の具体的構成例を示す図である。以下、通信部10、記憶部20および制御部30の順に具体的に説明する。   Hereinafter, the configuration of the information processing apparatus 3 will be described more specifically with reference to FIG. FIG. 3 is a diagram illustrating a specific configuration example of the information processing apparatus 3 according to the embodiment. Hereinafter, the communication unit 10, the storage unit 20, and the control unit 30 will be described in detail.

[2.1.通信部10]
通信部10は、ネットワーク4との間で情報の送受信を行う通信インターフェイスであり、ネットワーク4との接続を有線または無線で行う。制御部30は、通信部10およびネットワーク4を介して、端末装置2との間で各種の情報を送受信することができる。
[2.1. Communication unit 10]
The communication unit 10 is a communication interface that transmits and receives information to and from the network 4, and connects to the network 4 by wire or wirelessly. The control unit 30 can transmit and receive various types of information to and from the terminal device 2 via the communication unit 10 and the network 4.

[2.2.記憶部20]
記憶部20は、提供情報記憶部21と、ユーザ情報記憶部22と、曖昧性情報記憶部23と、検索履歴記憶部24と、特徴情報記憶部25とを有する。提供情報記憶部21、ユーザ情報記憶部22、曖昧性情報記憶部23、検索履歴記憶部24および特徴情報記憶部25は、例えば、RAM(Random Access Memory)、フラッシュメモリ等の半導体メモリ素子、または、HDD(Hard Disk Drive)、光ディスク等の記憶装置である。
[2.2. Storage unit 20]
The storage unit 20 includes a provision information storage unit 21, a user information storage unit 22, an ambiguity information storage unit 23, a search history storage unit 24, and a feature information storage unit 25. The provided information storage unit 21, the user information storage unit 22, the ambiguity information storage unit 23, the search history storage unit 24, and the feature information storage unit 25 are, for example, a semiconductor memory element such as a RAM (Random Access Memory), a flash memory, or the like. , A storage device such as an HDD (Hard Disk Drive) or an optical disk.

[2.3.制御部30]
制御部30は、例えば、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)、入出力ポートなどを有するマイクロコンピュータや各種の回路を含む。
[2.3. Control unit 30]
The control unit 30 includes, for example, a microcomputer having a central processing unit (CPU), a read only memory (ROM), a random access memory (RAM), an input / output port, and various circuits.

制御部30は、情報提供部31と、曖昧性判定部32とを備える。かかる情報提供部31および曖昧性判定部32の機能は、例えば、上記CPUが上記ROMに記憶されているプログラムを読み出して実行することにより実現される。なお、情報提供部31および曖昧性判定部32は、それぞれ一部または全部がASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等のハードウェアで構成されてもよい。   The control unit 30 includes an information providing unit 31 and an ambiguity determination unit 32. The functions of the information providing unit 31 and the ambiguity determining unit 32 are realized, for example, by the CPU reading and executing a program stored in the ROM. The information providing unit 31 and the ambiguity determining unit 32 may be partially or entirely configured by hardware such as an application specific integrated circuit (ASIC) or a field programmable gate array (FPGA).

情報提供部31は、要求受信部41と、検索処理部42と、提供情報生成部43と、提供情報出力部44とを備える。また、曖昧性判定部32は、特徴抽出部51と、情報取得部52と、類似度算出部53と、クエリ曖昧度設定部54とを備える。以下、これらの各部について具体的に説明する。   The information provision unit 31 includes a request reception unit 41, a search processing unit 42, a provision information generation unit 43, and a provision information output unit 44. The ambiguity determination unit 32 includes a feature extraction unit 51, an information acquisition unit 52, a similarity calculation unit 53, and a query ambiguity setting unit 54. Hereinafter, each of these parts will be described in detail.

[2.3.1.要求受信部41]
要求受信部41は、端末装置2から送信される各種の情報提供要求をネットワーク4経由で受信する。情報提供要求として、例えば、検索キーワードを含む検索クエリや、要求する情報を特定する情報(例えば、URL(Uniform Resource Locator))を含む情報提供クエリなどがある。
[2.3.1. Request receiving unit 41]
The request receiving unit 41 receives various information provision requests transmitted from the terminal device 2 via the network 4. Examples of the information provision request include a search query including a search keyword and an information provision query including information for specifying requested information (for example, URL (Uniform Resource Locator)).

[2.3.2.検索処理部42]
検索処理部42は、要求受信部41により受信された検索クエリに含まれる検索キーワードを取得し、提供情報記憶部21に予め記憶されている検索対象データ(例えば、商品データ)等を参照して、検索キーワードに対応する複数のコンテンツを検索する。
[2.3.2. Search processing unit 42]
The search processing unit 42 acquires a search keyword included in the search query received by the request receiving unit 41 and refers to search target data (for example, product data) stored in advance in the provided information storage unit 21. Search for a plurality of contents corresponding to the search keyword.

かかるコンテンツは、情報提供部31がショッピングサイトのサービスを提供する場合、例えば、検索キーワードに対応する商品のウェブページ(以下、商品ページと記載する)であり、検索処理部42は、かかる商品ページの情報(例えば、商品名やURLの情報)を提供情報記憶部21から取得する。なお、提供情報記憶部21は、例えば、検索対象データを検索可能に構成されたデータベースである。   When the information providing unit 31 provides a shopping site service, the content is, for example, a product web page (hereinafter, referred to as a product page) corresponding to the search keyword, and the search processing unit 42 includes the product page. (For example, product name and URL information) is acquired from the provided information storage unit 21. The provided information storage unit 21 is, for example, a database configured to be able to search for search target data.

また、情報提供部31が動画提供サイトのサービスを提供する場合、上記コンテンツは、例えば、検索キーワードに対応する動画データであり、検索処理部42は、かかる動画データの情報(例えば、動画のタイトルやURLの情報)を取得する。   In addition, when the information providing unit 31 provides a service of a video providing site, the content is, for example, video data corresponding to a search keyword, and the search processing unit 42 includes information on the video data (for example, a video title) And URL information).

また、検索処理部42は、曖昧性情報記憶部23に記憶された曖昧度テーブルに基づいて、検索処理の内容を変更することができる。図4は、曖昧性情報記憶部23に記憶された曖昧度テーブルの一例を示す図である。   Further, the search processing unit 42 can change the content of the search processing based on the ambiguity table stored in the ambiguity information storage unit 23. FIG. 4 is a diagram illustrating an example of an ambiguity table stored in the ambiguity information storage unit 23.

図4に示すように、曖昧度テーブルは、検索キーワードk1〜kp(pは2以上の整数)のぞれぞれの曖昧度をそれぞれ検索キーワードk1〜kp(以下、検索キーワードkと総称する場合がある)と関連付けた情報である。図4に示す曖昧度テーブルでは、検索キーワードk1に曖昧度として「1.21」が対応付けられ、検索キーワードk2に曖昧度として「0.88」が対応付けられ、検索キーワードkpに曖昧度として「1.82」が対応付けられている。   As shown in FIG. 4, in the ambiguity table, the ambiguities of the search keywords k1 to kp (p is an integer of 2 or more) are collectively referred to as the search keywords k1 to kp (hereinafter collectively referred to as the search keyword k). Information). In the ambiguity table shown in FIG. 4, “1.21” is associated with the search keyword k1 as ambiguity, “0.88” is associated with the search keyword k2 as ambiguity, and the ambiguity is associated with the search keyword kp. “1.82” is associated.

検索処理部42は、かかる曖昧度テーブルに基づいて、例えば、検索キーワードkの曖昧度を判定し、かかる曖昧度が高い(例えば、予め設定された閾値TH以上である)場合、補助情報を利用した検索処理を行うことができる。   The search processing unit 42 determines, for example, the ambiguity of the search keyword k based on the ambiguity table, and uses the auxiliary information when the ambiguity is high (for example, equal to or higher than a preset threshold value TH). Search processing can be performed.

例えば、検索処理部42は、検索キーワードの曖昧度が高い場合、ユーザ情報記憶部22に記憶された端末ユーザのユーザ情報のうち検索クエリに対応する端末ユーザのユーザ情報を利用して嗜好情報に対応したキーワードを補助情報として検索キーワードに追加して検索処理を行う。一方、検索処理部42は、検索キーワードの曖昧度が低い(例えば、予め設定された閾値TH未満である)場合、検索キーワードに追加キーワードを補充することなく、検索処理を行う。   For example, when the ambiguity of the search keyword is high, the search processing unit 42 uses the user information of the terminal user corresponding to the search query among the user information of the terminal user stored in the user information storage unit 22 as preference information. The corresponding keyword is added to the search keyword as auxiliary information and search processing is performed. On the other hand, when the ambiguity of the search keyword is low (for example, less than a preset threshold value TH), the search processing unit 42 performs the search process without supplementing the search keyword with an additional keyword.

また、検索処理部42は、曖昧度が高い場合、例えば、検索キーワードkに補充する他の情報(例えば、追加キーワード)であって端末ユーザが選択可能な情報である絞り込み候補の情報を補助情報として端末装置2へ提供することができる。端末ユーザは、絞り込み候補を選択することで、絞り込み候補に応じた検索結果を得ることができ、より検索意図に応じた検索結果を得ることができる。なお、検索処理部42は、検索キーワードkの曖昧度に応じて、上述した補助情報の利用方法を切り替えることもできる。   In addition, when the degree of ambiguity is high, for example, the search processing unit 42 uses other information (for example, additional keywords) supplemented to the search keyword k and information on narrowing candidates that can be selected by the terminal user as auxiliary information. Can be provided to the terminal device 2 as follows. The terminal user can obtain a search result corresponding to the narrowing-down candidate by selecting a narrowing-down candidate, and can obtain a search result more according to the search intention. Note that the search processing unit 42 can also switch the usage method of the auxiliary information described above according to the ambiguity of the search keyword k.

また、検索処理部42は、検索クエリに含まれる検索キーワードkの曖昧度に応じて、検索方法を変更することもできる。例えば、検索処理部42は、曖昧度が高い検索キーワードkを有する検索クエリのための検索方法と、曖昧度が低いキーワードkを有する検索クエリのための検索方法とを異なる検索方法にし、検索キーワードkの曖昧度に応じて、検索方法を切り替えることができる。また、検索処理部42は、検索クエリに含まれる検索キーワードkの曖昧度に応じて、検索されたコンテンツ(例えば、ウェブページ)のランキング方法を変更して検索結果におけるコンテンツの表示順位を変更することもできる。   The search processing unit 42 can also change the search method according to the ambiguity of the search keyword k included in the search query. For example, the search processing unit 42 sets a search method for a search query having a search keyword k with a high degree of ambiguity and a search method for a search query having a keyword k with a low degree of ambiguity to different search methods. The search method can be switched according to the ambiguity of k. Further, the search processing unit 42 changes the ranking method of the searched content (for example, web page) and changes the display order of the content in the search result according to the ambiguity of the search keyword k included in the search query. You can also

[2.3.3.提供情報生成部43]
提供情報生成部43は、検索処理部42による検索処理の結果を取得し、かかる検索結果を含む情報(以下、検索結果情報と記載する)を提供情報として生成する。
[2.3.3. Provided information generation unit 43]
The provided information generation unit 43 acquires the result of the search process performed by the search processing unit 42, and generates information including the search result (hereinafter referred to as search result information) as provided information.

かかる検索結果情報は、情報提供部31がショッピングサイトのサービスを提供する場合、例えば、検索キーワードに対応する複数の商品の名称が表示され、かつ、検索キーワードに対応する複数の商品ページがリンク先として設定されたウェブページである。   For example, when the information providing unit 31 provides a shopping site service, the search result information is displayed with names of a plurality of products corresponding to the search keyword, and a plurality of product pages corresponding to the search keyword are linked. It is a web page set as.

また、情報提供部31が動画提供サイトのサービスを提供する場合、検索結果情報は、例えば、検索キーワードに対応する複数の動画データのタイトルが表示され、かつ、検索キーワードに対応する複数の動画データがリンク先として設定されたウェブページである。   Further, when the information providing unit 31 provides a service of a video providing site, the search result information includes, for example, titles of a plurality of video data corresponding to the search keyword, and a plurality of video data corresponding to the search keyword. Is a web page set as a link destination.

また、提供情報生成部43は、要求受信部41で受信した情報提供クエリに含まれる情報(例えば、URL)に応じたコンテンツを情報提供部31から取得し、取得したコンテンツを含む提供情報を生成する。   Further, the provision information generation unit 43 acquires content corresponding to information (for example, URL) included in the information provision query received by the request reception unit 41 from the information provision unit 31, and generates provision information including the acquired content. To do.

ここで、要求受信部41で受信した情報提供クエリが、検索結果情報に含まれる選択対象dのうち端末ユーザによって選択された選択対象dの情報の送信を要求するクエリであるとする。この場合、提供情報生成部43は、検索結果情報に対応するキーワードと選択された選択対象dに関する情報とを関連付けて検索履歴記憶部24に記憶する。   Here, it is assumed that the information providing query received by the request receiving unit 41 is a query for requesting transmission of information on the selection target d selected by the terminal user among the selection targets d included in the search result information. In this case, the provided information generation unit 43 stores the keyword corresponding to the search result information and the information related to the selected selection target d in the search history storage unit 24 in association with each other.

選択対象dに関する情報は、例えば、端末ユーザによって選択された選択対象dを特定する情報や、各選択対象dが端末ユーザにより選択される割合(以下、選択割合と記載する)の情報などが含まれる。   The information regarding the selection target d includes, for example, information for specifying the selection target d selected by the terminal user, information on a ratio (hereinafter referred to as a selection ratio) of selecting each selection target d by the terminal user, and the like. It is.

図5は、検索履歴記憶部24に記憶される検索履歴テーブルの一例を示す図である。図5に示す検索履歴テーブル(検索履歴情報の一例)には、例えば、検索キーワードk1と選択対象d1〜dnの選択割合の情報とが関連付けて記憶されている。   FIG. 5 is a diagram illustrating an example of a search history table stored in the search history storage unit 24. In the search history table (an example of search history information) illustrated in FIG. 5, for example, the search keyword k1 and information on the selection ratio of the selection targets d1 to dn are stored in association with each other.

図5に示す検索履歴テーブルは、検索キーワードk1による検索結果に含まれる選択対象d1、d2、d3、d4、・・・、dnの端末ユーザによる選択割合が5%、3%、12%、2%、・・・、4%であることを示す。以下、ある検索キーワードkによる検索結果に含まれる選択対象dの端末ユーザによる選択割合の分布をクリック分布p(d|q)と記載する場合がある。なお、検索履歴記憶部24に記憶される検索履歴情報は、図5に示す検索履歴テーブルに限定されず、例えば、検索キーワードkと各選択グループgの選択割合とが関連付けられたテーブルであってもよく、以下、選択グループgの選択割合の分布をクリック分布p(g|q)と記載する場合がある。   In the search history table shown in FIG. 5, the selection ratios of the selection targets d1, d2, d3, d4,..., Dn included in the search result by the search keyword k1 are 5%, 3%, 12%, 2 %,..., 4%. Hereinafter, the distribution of the selection ratio by the terminal user of the selection target d included in the search result by a certain search keyword k may be described as a click distribution p (d | q). Note that the search history information stored in the search history storage unit 24 is not limited to the search history table illustrated in FIG. 5, and is, for example, a table in which the search keyword k and the selection ratio of each selection group g are associated. Hereinafter, the distribution of the selection ratio of the selection group g may be referred to as a click distribution p (g | q).

[2.3.4.提供情報出力部44]
提供情報出力部44は、提供情報生成部43によって生成された提供情報を対応する情報提供要求(例えば、検索クエリや情報提供クエリ)を送信した通信部10を介して端末装置2へ送信する。これにより、端末装置2において、情報提供要求に応じた情報が取得され表示される。
[2.3.4. Provided information output unit 44]
The provision information output unit 44 transmits the provision information generated by the provision information generation unit 43 to the terminal device 2 via the communication unit 10 that has transmitted a corresponding information provision request (for example, a search query or an information provision query). Thereby, in the terminal device 2, the information according to the information provision request is acquired and displayed.

図6は、端末装置2で表示される検索結果情報の一例を示す図である。図6に示す検索結果情報は、情報提供部31がショッピングサイトのサービスを提供する場合において、端末装置2の表示部に表示される商品検索結果ページ80を示す。   FIG. 6 is a diagram illustrating an example of search result information displayed on the terminal device 2. The search result information illustrated in FIG. 6 indicates a product search result page 80 displayed on the display unit of the terminal device 2 when the information providing unit 31 provides a shopping site service.

図6に示す商品検索結果ページ80では、検索キーワードとして、端末ユーザにより「カメラ」が入力ボックス81へ入力された状態で検索ボタン82をクリック(選択)して検索した場合における検索結果が示される。かかる商品検索結果ページ80には、検索結果として、商品A、B、Cの情報をそれぞれ選択可能に表示した複数の領域83〜85が設定される。   The product search result page 80 shown in FIG. 6 shows a search result when a search is performed by clicking (selecting) the search button 82 in a state where “camera” is input to the input box 81 by the terminal user as a search keyword. . In the product search result page 80, a plurality of areas 83 to 85 in which information of products A, B, and C are displayed so as to be selectable are set as search results.

端末ユーザが、例えば、「商品A」の文字を選択(例えば、クリック)することで、商品Aが選択対象dとして選択され、かかる選択結果を含む情報提供クエリが端末装置2から情報処理装置3へ送信される。また、端末ユーザが、例えば、「商品B」の文字を選択(例えば、クリック)することで、商品Bが選択対象dとして選択され、かかる選択結果を含む情報提供クエリが端末装置2から情報処理装置3へ送信される。   For example, when the terminal user selects (for example, clicks) the characters “product A”, the product A is selected as the selection target d, and an information provision query including the selection result is sent from the terminal device 2 to the information processing device 3. Sent to. In addition, for example, when the terminal user selects (for example, clicks) the letter “product B”, the product B is selected as the selection target d, and an information provision query including the selection result is processed from the terminal device 2. It is transmitted to the device 3.

[2.3.5.特徴抽出部51]
特徴抽出部51は、検索履歴記憶部24に記憶された情報と提供情報記憶部21に記憶された情報に基づいて、各検索キーワードkに対応する検索結果に含まれる選択対象dの特徴を抽出する。
[2.3.5. Feature extraction unit 51]
The feature extraction unit 51 extracts the feature of the selection target d included in the search result corresponding to each search keyword k based on the information stored in the search history storage unit 24 and the information stored in the provided information storage unit 21. To do.

かかる特徴抽出部51は、選択対象dがウェブページである場合、かかるウェブページに含まれる自然言語のデータから形態素解析により複数の形態素を抽出し、かかる形態素から特徴語(例えば、名詞)を抽出する。そして、特徴抽出部51は、抽出した各特徴語が属するトピックt(特徴要素の一例)を公知のトピックモデル(例えば、上述したLDA)を用いて判定し、選択対象dにおけるトピックtの確率分布としてトピック分布p(t|d)を求める。   When the selection target d is a web page, the feature extraction unit 51 extracts a plurality of morphemes by morphological analysis from natural language data included in the web page, and extracts feature words (for example, nouns) from the morphemes. To do. Then, the feature extraction unit 51 determines a topic t (an example of a feature element) to which each extracted feature word belongs using a known topic model (for example, the above-described LDA), and the probability distribution of the topic t in the selection target d. The topic distribution p (t | d) is obtained as follows.

また、特徴抽出部51は、例えば、選択対象dが動画データである場合や動画データが含まれるウェブページである場合、動画データに含まれる特徴画像、特徴音声、特徴語などの特徴要素をトピックtとして抽出し、各トピックtの出現割合の分布を求めることができる。   For example, when the selection target d is moving image data or a web page including moving image data, the feature extraction unit 51 selects feature elements such as feature images, feature sounds, and feature words included in the moving image data as topics. Extracted as t, the distribution of the appearance ratio of each topic t can be obtained.

なお、トピック分布p(t|d)は、一つの選択対象dを対象とした確率分布であるが、特徴抽出部51は、2以上の選択対象dを含む選択グループgを対象とした確率分布であるトピック分布p(t|g)を求めることもできる。このようにグループ化することによって、選択対象dが多い場合であっても、トピック分布の演算負荷を抑えることができる。   Note that the topic distribution p (t | d) is a probability distribution targeting one selection target d, but the feature extraction unit 51 is a probability distribution targeting a selection group g including two or more selection targets d. It is also possible to obtain a topic distribution p (t | g). By grouping in this way, even if there are many selection targets d, it is possible to reduce the computation load of the topic distribution.

図7は、ある選択対象dのトピック分布p(t|d)の一例を示す図である。図7に示す例では、ある選択対象dに含まれる全トピックt1〜tn(nは、2以上の整数)の数に対する各トピックt1〜tn数の割合がトピック分布p(t|d)として表されている。   FIG. 7 is a diagram illustrating an example of a topic distribution p (t | d) of a certain selection target d. In the example illustrated in FIG. 7, the ratio of the number of topics t1 to tn to the number of all topics t1 to tn (n is an integer of 2 or more) included in a selection target d is represented as a topic distribution p (t | d). Has been.

特徴抽出部51は、抽出した選択対象dの特徴を示す特徴情報として各選択対象dのトピック分布p(t|d)の情報と各選択対象dの情報とを対応づけた情報を特徴情報記憶部25に記憶する。図8は、特徴情報記憶部25に記憶される特徴情報の一例を示す図である。なお、特徴情報は、図8に示す特徴情報に限定されない。例えば、特徴情報は、各選択グループgのトピック分布p(t|g)の情報と各選択グループgの情報とを対応づけた情報であってもよい。   The feature extraction unit 51 stores, as feature information indicating the characteristics of the extracted selection target d, information that associates the information of the topic distribution p (t | d) of each selection target d with the information of each selection target d. Store in unit 25. FIG. 8 is a diagram illustrating an example of feature information stored in the feature information storage unit 25. Note that the feature information is not limited to the feature information illustrated in FIG. For example, the feature information may be information in which information on the topic distribution p (t | g) of each selection group g is associated with information on each selection group g.

また、特徴抽出部51は、例えば、選択対象dの特徴を空間ベクトル上のベクトルで表した特徴情報を選択対象dから算出し、かかる特徴情報を特徴情報記憶部25に記憶することもできる。かかる特徴情報は、ベクトルの向きおよび大きさによって選択対象dの特徴が表現される。なお、ベクトル表現の生成については、例えば潜在的意味索引(LSI:Latent Semantic Indexing)等の手法を用いることができる。なお、特徴抽出部51は、選択グループgのベクトルで表した特徴情報を選択グループgに含まれる複数の選択対象dから算出することもできる。   The feature extraction unit 51 can also calculate, for example, feature information representing the feature of the selection target d by a vector on a space vector from the selection target d and store the feature information in the feature information storage unit 25. In the feature information, the feature of the selection target d is expressed by the direction and size of the vector. For generating the vector representation, for example, a technique such as latent semantic indexing (LSI) can be used. Note that the feature extraction unit 51 can also calculate feature information represented by a vector of the selection group g from a plurality of selection targets d included in the selection group g.

[2.3.6.情報取得部52]
情報取得部52は、検索履歴記憶部24に記憶されている検索履歴情報を取得する。情報取得部52は、図5に示す検索履歴テーブルが検索履歴記憶部24に記憶されている場合、例えば、検索キーワードk1に対応する選択対象d1〜dnの選択割合の情報を検索履歴記憶部24から取得する。
[2.3.6. Information acquisition unit 52]
The information acquisition unit 52 acquires search history information stored in the search history storage unit 24. When the search history table shown in FIG. 5 is stored in the search history storage unit 24, the information acquisition unit 52, for example, displays information on the selection ratios of the selection targets d1 to dn corresponding to the search keyword k1 as the search history storage unit 24. Get from.

また、情報取得部52は、特徴情報記憶部25に記憶される特徴情報を取得する。例えば、情報取得部52は、検索キーワードk1に対応する選択対象d1〜dnのそれぞれのトピック分布p(t|d)を特徴情報記憶部25から取得する。また、情報取得部52は、検索キーワードk1に対応する複数の選択グループgのそれぞれのトピック分布p(t|g)を特徴情報記憶部25から取得することもできる。   The information acquisition unit 52 acquires feature information stored in the feature information storage unit 25. For example, the information acquisition unit 52 acquires the topic distribution p (t | d) of the selection targets d1 to dn corresponding to the search keyword k1 from the feature information storage unit 25. The information acquisition unit 52 can also acquire the topic distribution p (t | g) of each of the plurality of selection groups g corresponding to the search keyword k1 from the feature information storage unit 25.

[2.3.7.類似度算出部53]
類似度算出部53は、情報取得部52で取得される各検索キーワードkに対応する複数の選択対象dの情報と、かかる複数の選択対象dのそれぞれのトピック分布p(t|d)とに基づいて、各検索キーワードkに対応する複数の選択対象d間の類似度を算出する。
[2.3.7. Similarity calculation unit 53]
The similarity calculation unit 53 includes information on a plurality of selection targets d corresponding to each search keyword k acquired by the information acquisition unit 52 and each topic distribution p (t | d) of the plurality of selection targets d. Based on this, the similarity between a plurality of selection targets d corresponding to each search keyword k is calculated.

類似度算出部53は、トピックtの分布の強度を定量化するために、検索キーワードkに対応する検索結果のうち選択された選択対象dのトピック分布p(t|d)を選択対象dの選択割合に応じて重み付けを行った後に合算して、平均トピック分布p(t|q)を求める。例えば、類似度算出部53は、下記式(1)を用いて、検索キーワードk毎に平均トピック分布p(t|q)を求める。

Figure 2017146926
The similarity calculation unit 53 quantifies the topic distribution p (t | d) of the selection target d selected from the search results corresponding to the search keyword k in order to quantify the intensity of the distribution of the topic t. After weighting according to the selection ratio, the average topic distribution p (t | q) is obtained by adding together. For example, the similarity calculation unit 53 obtains an average topic distribution p (t | q) for each search keyword k using the following formula (1).
Figure 2017146926

平均トピック分布p(t|q)は、ある検索キーワードkを有する検索クエリqが与えられたときに、あるトピックtが出てくる確率を示す。なお、上記式(1)において、「q」は検索キーワードkを有する検索クエリqを示し、検索クエリqと検索キーワードkとは一対一で対応する。したがって、「q」は、実質的に検索キーワードkを示す。   The average topic distribution p (t | q) indicates the probability that a certain topic t appears when a search query q having a certain search keyword k is given. In the above formula (1), “q” indicates a search query q having the search keyword k, and the search query q and the search keyword k correspond one-to-one. Therefore, “q” substantially indicates the search keyword k.

また、上記式(1)において、「d」は、選択(クリック)された選択対象dを示し、「Dq」は、検索クエリqに関連する選択対象dを要素とする集合を示す。また、「p(d|q)」は、上述したクリック分布(選択分布)であり、ある検索クエリqが与えられたときに、ある選択対象dが選択(クリック)される確率を示す。   In the above formula (1), “d” indicates the selection target d that has been selected (clicked), and “Dq” indicates a set having the selection target d related to the search query q as an element. “P (d | q)” is the click distribution (selection distribution) described above, and indicates a probability that a certain selection target d is selected (clicked) when a certain search query q is given.

次に、類似度算出部53は、検索クエリq毎に、選択対象d間の類似度を算出する。例えば、類似度算出部53は、検索クエリq毎に、各選択対象dのクエリ分布と平均トピック分布p(t|q)との類似性を算出し、平均トピック分布p(t|q)と基準とした選択対象d間の類似性を求める。   Next, the similarity calculation unit 53 calculates the similarity between the selection targets d for each search query q. For example, the similarity calculation unit 53 calculates the similarity between the query distribution of each selection target d and the average topic distribution p (t | q) for each search query q, and the average topic distribution p (t | q) The similarity between the selection targets d used as a reference is obtained.

さらに、類似度算出部53は、選択対象d間の類似性に基づいて、検索クエリq毎の検索キーワードkの曖昧度(以下、キーワード曖昧度と記載する)を判定する。例えば、類似度算出部53は、すべての選択対象dの類似性を平均した値を算出し、かかる算出結果をキーワード曖昧度として判定する。   Further, the similarity calculation unit 53 determines the ambiguity of the search keyword k for each search query q (hereinafter referred to as keyword ambiguity) based on the similarity between the selection targets d. For example, the similarity calculation unit 53 calculates a value obtained by averaging the similarities of all selection targets d, and determines the calculation result as a keyword ambiguity.

具体的には、類似度算出部53は、下記式(2)を用いて、選択対象d間の類似度をカルバック・ライブラー情報量(Kullback-Leibler divergence)として算出し、さらに、かかる選択対象d間の類似度に基づいてクエリ曖昧度amb(q,Dq)をキーワード曖昧度として求める。クエリ曖昧度amb(q,Dq)は、各トピック分布p(t|d)と平均トピック分布p(t|q)との間のカルバック・ライブラー情報量を選択対象dの選択割合で重み付けして平均化した値である。

Figure 2017146926
Specifically, the similarity calculation unit 53 calculates the similarity between the selection targets d as a Kullback-Leibler divergence using the following formula (2), and further selects the selection target. The query ambiguity amb (q, Dq) is obtained as the keyword ambiguity based on the similarity between d. The query ambiguity amb (q, Dq) is obtained by weighting the amount of information of the Cullback liberer between each topic distribution p (t | d) and the average topic distribution p (t | q) by the selection ratio of the selection target d. Is the averaged value.
Figure 2017146926

クエリ曖昧度amb(q,Dq)は、負ではなく、また、端末ユーザの検索意図が完全に明確な検索キーワードkを有する検索クエリqの場合はゼロであり、端末ユーザの検索意図がより曖昧である検索キーワードkを有する検索クエリqほどより大きな値になる。なお、上記式(2)において、「T」は、トピックtを要素とする集合を示し、「Dq」は、上述したように検索クエリqに関連する選択対象dを要素とする集合を示す。また、上述したように、検索クエリqと検索キーワードkとは一対一で対応しており、したがって、クエリ曖昧度amb(q,Dq)は、キーワードの曖昧度を示す。   The query ambiguity amb (q, Dq) is not negative, and is zero in the case of the search query q having the search keyword k whose terminal user's search intention is completely clear, and the terminal user's search intention is more ambiguous. The search query q having the search keyword k is a larger value. In the above formula (2), “T” represents a set having topic t as an element, and “Dq” represents a set having selection target d related to search query q as an element as described above. Further, as described above, the search query q and the search keyword k have a one-to-one correspondence. Therefore, the query ambiguity amb (q, Dq) indicates the ambiguity of the keyword.

このように、類似度算出部53は、検索クエリq毎に、選択対象d間のトピック分布p(t|d)を比較することによって、検索クエリqの曖昧性(キーワードの曖昧性)を定量化できる。図9は、異なる検索クエリq1、q2、q3のそれぞれのトピック分布p(t|q)を示す図である。図9に示すトピック分布p(t|q)は、理解を容易にするために、トピックtが3つ(トピックt1〜t3)であり、選択対象dが3つ(選択対象d1〜d3)である例を示す。   Thus, the similarity calculation unit 53 quantifies the ambiguity (keyword ambiguity) of the search query q by comparing the topic distribution p (t | d) between the selection targets d for each search query q. Can be FIG. 9 is a diagram illustrating topic distributions p (t | q) of different search queries q1, q2, and q3. The topic distribution p (t | q) shown in FIG. 9 includes three topics t (topics t1 to t3) and three selection targets d (selection targets d1 to d3) for easy understanding. Here is an example.

図9に示すように、トピックt1〜t3から構成されるトピック空間における選択対象d1〜d3間の距離が異なり、検索クエリq1、検索クエリq2、検索クエリq3の順に、選択対象d1〜d3間の距離が近くなる。したがって、検索クエリqの曖昧度(キーワード曖昧度)は、検索クエリq1>検索クエリq2>検索クエリq3であることが理解できる。   As shown in FIG. 9, the distances between the selection targets d1 to d3 in the topic space composed of the topics t1 to t3 are different, and the search queries q1, the search queries q2, and the search queries q3 are in the order of the selection targets d1 to d3. The distance gets closer. Therefore, it can be understood that the ambiguity (keyword ambiguity) of the search query q is: search query q1> search query q2> search query q3.

したがって、上述のように、検索クエリq毎に、トピック分布p(t|q)を選択対象d間で比較することにより、各検索クエリqの検索キーワードkの曖昧性を精度よく判定することができることがわかる。   Therefore, as described above, the ambiguity of the search keyword k of each search query q can be accurately determined by comparing the topic distribution p (t | q) between the selection targets d for each search query q. I understand that I can do it.

ところで、各選択対象dが一つのトピックtだけ有し、かつ、各選択対象dのトピックtが独立である場合、上記式(2)は、下記式(3)に示すように簡略化することができる。

Figure 2017146926
By the way, when each selection target d has only one topic t and the topic t of each selection target d is independent, the above formula (2) is simplified as shown in the following formula (3). Can do.
Figure 2017146926

また、類似度算出部53は、検索クエリq毎に、選択グループg間のトピック分布p(t|g)を比較してキーワード曖昧度を求めることもできる。この場合、類似度算出部53は、選択対象dを選択グループgに置き換えて上述と同様の処理を行うことで、キーワード曖昧度を求めることができる。例えば、類似度算出部53は、上述した(1)、(2)等において、トピック分布p(t|d)をトピック分布p(t|g)に置き換え、クリック分布p(d|q)をクリック分布p(g|q)に置き換えることによって、キーワード曖昧度を求めることができる。   In addition, the similarity calculation unit 53 can obtain the keyword ambiguity by comparing the topic distribution p (t | g) between the selected groups g for each search query q. In this case, the similarity calculation unit 53 can obtain the keyword ambiguity by replacing the selection target d with the selection group g and performing the same processing as described above. For example, the similarity calculation unit 53 replaces the topic distribution p (t | d) with the topic distribution p (t | g) and replaces the click distribution p (d | q) in (1), (2), and the like described above. The keyword ambiguity can be obtained by replacing with the click distribution p (g | q).

なお、選択対象d間(または選択グループg間)の類似性の算出手法は、上述した例に限定されず、選択対象d間(または選択グループg間)の類似性を算出することができればよい。類似度算出部53は、予め準備した基準のトピック分布と各選択対象dのトピック分布p(t|d)との類似性を算出し、かかる類似性間の類似性に基づいて、選択対象d間の類似性を算出することもできる。また、類似度算出部53は、選択グループgについても同様に、予め準備した基準のトピック分布と各選択グループgのトピック分布p(t|g)との類似性を算出し、選択グループg間の類似性を判定することもできる。   Note that the method for calculating the similarity between the selection targets d (or between the selection groups g) is not limited to the above-described example, and it is sufficient that the similarity between the selection targets d (or between the selection groups g) can be calculated. . The similarity calculation unit 53 calculates the similarity between the reference topic distribution prepared in advance and the topic distribution p (t | d) of each selection target d, and selects the selection target d based on the similarity between the similarities. The similarity between them can also be calculated. Similarly, for the selected group g, the similarity calculation unit 53 calculates the similarity between the reference topic distribution prepared in advance and the topic distribution p (t | g) of each selected group g. It is also possible to determine the similarity.

また、類似度算出部53は、例えば、選択対象dの特徴が空間ベクトル上のベクトルで表される場合、かかるベクトルの選択対象d間での類似度を算出することで、選択対象d間の類似度を算出することができる。なお、選択グループgについても同様に、類似度算出部53は、ベクトルの選択グループg間の類似性を判定することができる。   Further, for example, when the feature of the selection target d is represented by a vector on a space vector, the similarity calculation unit 53 calculates the similarity between the selection targets d of the vector so that the selection target d Similarity can be calculated. Similarly, for the selected group g, the similarity calculation unit 53 can determine the similarity between the selected groups g of vectors.

[2.3.8.クエリ曖昧度設定部54]
クエリ曖昧度設定部54は、クエリ曖昧度amb(q,Dq)をそのままキーワード曖昧度として曖昧性情報記憶部23に設定する。また、クエリ曖昧度設定部54は、クエリ曖昧度amb(q,Dq)をそのままキーワード曖昧度とせずに、所定の変換テーブルを用いて、クエリ曖昧度amb(q,Dq)をキーワード曖昧度に変換することもできる。
[2.3.8. Query ambiguity setting unit 54]
The query ambiguity setting unit 54 sets the query ambiguity amb (q, Dq) as it is in the ambiguity information storage unit 23 as the keyword ambiguity. Further, the query ambiguity setting unit 54 does not use the query ambiguity amb (q, Dq) as the keyword ambiguity as it is, but uses the predetermined conversion table to change the query ambiguity amb (q, Dq) into the keyword ambiguity. It can also be converted.

変換テーブルは、例えば、「低」、「中」、「高」の3段階に分けたキーワード曖昧度とクエリ曖昧度amb(q,Dq)の値の範囲とを対応付けたテーブルであり、かかるテーブルに基づいて、キーワード曖昧度が「低」、「中」、「高」の中から判定される。   The conversion table is, for example, a table in which the keyword ambiguity divided into three stages of “low”, “medium”, and “high” is associated with the value range of the query ambiguity amb (q, Dq). Based on the table, the keyword ambiguity is determined from “low”, “medium”, and “high”.

なお、類似度算出部53に基づいて算出した選択対象d間(または選択グループg間)の類似性が低いほどキーワード曖昧度が高くなるように、検索キーワードk毎のキーワード曖昧度を曖昧性情報記憶部23に設定することができれば上記方法に限定されない。   The keyword ambiguity for each search keyword k is increased so that the lower the similarity between the selection targets d (or between selected groups g) calculated based on the similarity calculation unit 53 is, the higher the keyword ambiguity is. If it can set to the memory | storage part 23, it will not be limited to the said method.

[3.情報処理装置3の処理フロー]
次に、図10を用いて、情報処理装置3における情報処理の手順について説明する。図10は、実施形態に係る情報処理装置3における情報処理の流れを示すフローチャートであり、かかる情報処理は繰り返し実行される。
[3. Processing flow of information processing apparatus 3]
Next, the procedure of information processing in the information processing apparatus 3 will be described with reference to FIG. FIG. 10 is a flowchart showing a flow of information processing in the information processing apparatus 3 according to the embodiment, and the information processing is repeatedly executed.

図10に示すように、情報処理装置3の情報提供部31は、端末装置2からの検索クエリを受信したか否かを判定する(ステップS10)。検索クエリを受信したと判定した場合(ステップS10;Yes)、情報提供部31は、検索処理を実行する(ステップS11)。かかる検索処理は、図11に示すステップS20〜S25に示す処理であり、後で詳述する。   As illustrated in FIG. 10, the information providing unit 31 of the information processing device 3 determines whether a search query from the terminal device 2 has been received (step S10). When it determines with having received the search query (step S10; Yes), the information provision part 31 performs a search process (step S11). Such search processing is processing shown in steps S20 to S25 shown in FIG. 11, and will be described in detail later.

ステップS11の処理が終了した場合、または、ステップS10において検索クエリを受信していないと判定した場合(ステップS10;No)、情報提供クエリを受信したか否かを判定する(ステップS12)。情報提供クエリを受信したと判定した場合(ステップS12;Yes)、情報提供部31は、情報提供クエリに応じた提供情報を端末装置2へ送信し(ステップS13)、情報提供クエリによって要求された提供情報に関する情報を検索履歴情報として記憶する(ステップS14)。提供情報に関する情報は、例えば、選択された選択対象に関する情報である。   When the process of step S11 is completed, or when it is determined in step S10 that a search query has not been received (step S10; No), it is determined whether an information providing query has been received (step S12). When it determines with having received the information provision query (step S12; Yes), the information provision part 31 transmits the provision information according to an information provision query to the terminal device 2 (step S13), and was requested | required by the information provision query. Information related to the provided information is stored as search history information (step S14). The information related to the provided information is, for example, information related to the selected selection target.

ステップS14の処理が終了した場合、または、ステップS12において情報提供クエリを受信していないと判定した場合(ステップS12;No)、曖昧性判定部32は、曖昧性判定契機になったか否かを判定する(ステップS15)。曖昧性判定契機は、例えば、所定周期(例えば、1日毎)に発生する契機である。   When the process of step S14 is completed, or when it is determined in step S12 that an information providing query has not been received (step S12; No), the ambiguity determination unit 32 determines whether or not an ambiguity determination trigger has occurred. Determination is made (step S15). The ambiguity determination opportunity is an opportunity that occurs at a predetermined cycle (for example, every day), for example.

曖昧性判定契機になったと判定した場合(ステップS15;Yes)、曖昧性判定部32は、曖昧性判定処理を実行する(ステップS16)。かかる曖昧性判定処理は、図12に示すステップS30〜S33に示す処理であり、後で詳述する。ステップS16の処理が終了した場合、または、ステップS15において曖昧性判定契機になっていないと判定した場合(ステップS15;No)、制御部30は、図10に示す処理を終了する。   When it is determined that the ambiguity determination is triggered (step S15; Yes), the ambiguity determination unit 32 executes an ambiguity determination process (step S16). Such ambiguity determination processing is processing shown in steps S30 to S33 shown in FIG. 12, and will be described in detail later. When the process of step S16 is completed, or when it is determined in step S15 that there is no ambiguity determination trigger (step S15; No), the control unit 30 ends the process shown in FIG.

次に、ステップS11に示す検索処理について説明する。図11は、図10に示すステップS11の検索処理の流れを示すフローチャートである。   Next, the search process shown in step S11 will be described. FIG. 11 is a flowchart showing the flow of the search process in step S11 shown in FIG.

図11に示すように、情報提供部31は、受信した検索クエリのキーワード曖昧度の情報を記憶部20から取得し(ステップS20)、取得したキーワード曖昧度が閾値TH以上であるか否かを判定する(ステップS21)。   As shown in FIG. 11, the information providing unit 31 acquires keyword ambiguity information of the received search query from the storage unit 20 (step S20), and determines whether or not the acquired keyword ambiguity is greater than or equal to a threshold value TH. Determination is made (step S21).

キーワード曖昧度が閾値TH以上であると判定した場合(ステップS21;Yes)、情報提供部31は、補助情報を取得する(ステップS23)。補助情報は、例えば、検索クエリに含まれる検索キーワードに補充する情報(例えば、追加キーワード)である。ステップS23が終了した場合、または、キーワード曖昧度が閾値TH以上ではないと判定した場合(ステップS21;No)、情報提供部31は、検索クエリに含まれる検索キーワードを用いた検索を行う(ステップS22)。   If it is determined that the keyword ambiguity is equal to or higher than the threshold value TH (step S21; Yes), the information providing unit 31 acquires auxiliary information (step S23). The auxiliary information is information (for example, additional keywords) supplemented to the search keyword included in the search query, for example. When step S23 is completed or when it is determined that the keyword ambiguity is not equal to or higher than the threshold TH (step S21; No), the information providing unit 31 performs a search using the search keyword included in the search query (step S21). S22).

情報提供部31は、ステップS23で補助情報を取得している場合、ステップS22において、補助情報を利用する。例えば、情報提供部31は、検索キーワードkに補助情報(例えば、追加キーワード)を補充した検索キーワードによって検索処理を行うことができる。また、情報提供部31は、検索クエリに含まれる検索キーワードkに補充する絞り込み候補の情報(例えば、追加キーワード)を補助情報として端末装置2へ送信して端末ユーザに絞り込み候補の情報を提供する。そして、情報提供部31は、端末ユーザが選択した絞り込み候補を含むクエリを受信すると、検索キーワードkに絞り込み候補を補充したキーワードによって検索を行う。   If the information providing unit 31 has acquired auxiliary information in step S23, the information providing unit 31 uses the auxiliary information in step S22. For example, the information providing unit 31 can perform a search process using a search keyword in which auxiliary information (for example, an additional keyword) is supplemented to the search keyword k. In addition, the information providing unit 31 transmits information on narrowing candidates (for example, additional keywords) to be supplemented to the search keyword k included in the search query to the terminal device 2 as auxiliary information to provide narrowing candidate information to the terminal user. . And the information provision part 31 will perform a search by the keyword which supplemented the refinement candidate to the search keyword k, if the query containing the refinement candidate selected by the terminal user is received.

ステップS22、S23の処理が終了した場合、情報提供部31は、検索結果の情報を検索クエリの送信元である端末装置2へ送信する(ステップS24)。そして、情報提供部31は、かかる検索履歴の情報(例えば、検索キーワードkや選択対象dの情報)を記憶部20に記憶し(ステップS25)、図11に示す処理を終了する。   When the processes of steps S22 and S23 are completed, the information providing unit 31 transmits information on the search result to the terminal device 2 that is the transmission source of the search query (step S24). And the information provision part 31 memorize | stores the information (for example, the information of the search keyword k or the selection object d) of this search history in the memory | storage part 20 (step S25), and complete | finishes the process shown in FIG.

次に、ステップS16に示す曖昧性判定処理について説明する。図12は、図10に示すステップS16の曖昧性判定処理の流れを示すフローチャートである。   Next, the ambiguity determination process shown in step S16 will be described. FIG. 12 is a flowchart showing the ambiguity determination process in step S16 shown in FIG.

図12に示すように、曖昧性判定部32は、各検索キーワードkに対応する選択対象d(または選択グループg)の特徴を抽出する(ステップS30)。次に、曖昧性判定部32は、選択対象d(または選択グループg)の選択割合の情報を取得する(ステップS31)。   As shown in FIG. 12, the ambiguity determination unit 32 extracts the characteristics of the selection target d (or selection group g) corresponding to each search keyword k (step S30). Next, the ambiguity determination unit 32 acquires information on the selection ratio of the selection target d (or selection group g) (step S31).

次に、曖昧性判定部32は、ステップS31で取得した情報に基づいて、選択対象dまたは選択グループg間の類似性を算出する(ステップS32)。曖昧性判定部32は、例えば、選択対象d(または選択グループg)の選択割合に応じて各選択対象d(または選択グループg)の特徴要素の重み付けを行い、このように重み付けを行った特徴要素の分布間の類似度を算出することで、選択対象d(または選択グループg)間の類似性を算出する。   Next, the ambiguity determination unit 32 calculates the similarity between the selection target d or the selection group g based on the information acquired in step S31 (step S32). The ambiguity determination unit 32 weights the feature elements of each selection target d (or selection group g) according to the selection ratio of the selection target d (or selection group g), for example, and the weighted feature By calculating the similarity between the distributions of elements, the similarity between the selection targets d (or selection group g) is calculated.

次に、曖昧性判定部32は、ステップS32で算出した類似性に応じたクエリ曖昧度を記憶部20に記憶し(ステップS33)、図12に示す処理を終了する。かかる処理において、曖昧性判定部32は、例えば、ステップS32で算出した類似性をそのままクエリ曖昧度として記憶部20に記憶したり、所定の変換テーブルを用いて、ステップS32で算出した類似性をクエリ曖昧度に変換したりすることもできる。   Next, the ambiguity determination unit 32 stores the query ambiguity according to the similarity calculated in step S32 in the storage unit 20 (step S33), and ends the process illustrated in FIG. In such processing, for example, the ambiguity determination unit 32 stores the similarity calculated in step S32 as it is in the storage unit 20 as a query ambiguity, or uses the predetermined conversion table to calculate the similarity calculated in step S32. It can also be converted to query ambiguity.

[4.変形例]
上述した実施形態では、キーワード曖昧性を考慮した検索処理とキーワード曖昧性を判定する曖昧性判定処理とを同一の情報処理装置3によって実行する例を説明したが、検索処理を行う情報処理装置と曖昧性判定処理を行う情報処理装置とを別体の装置で行っても良い。この場合、これらの装置間でキーワード曖昧性の情報が送受信される。
[4. Modified example]
In the above-described embodiment, the example in which the search processing in consideration of the keyword ambiguity and the ambiguity determination processing for determining the keyword ambiguity are executed by the same information processing device 3 has been described. The information processing apparatus that performs the ambiguity determination process may be performed by a separate apparatus. In this case, keyword ambiguity information is transmitted and received between these devices.

また、情報処理装置3が検索キーワードkに対応して提供するコンテンツは、ウェブページなどのウェブコンテンツに限定されるものではなく、検索キーワードkで検索されるデジタルコンテンツであればよい。なお、デジタルコンテンツとしては、例えば、文書データ、動画データ、音声データなどが含まれる。   Further, the content provided by the information processing apparatus 3 corresponding to the search keyword k is not limited to web content such as a web page, and may be digital content searched using the search keyword k. The digital content includes, for example, document data, moving image data, audio data, and the like.

また、上述した実施形態では、曖昧性判定部32は、選択対象dの特徴としてトピックモデル(例えば、LDA)を用いてトピックtの分布に基づいて選択対象d間の類似度を判定する例を示したが、かかる例に限定されない。例えば、曖昧性判定部32は、選択対象d間における特徴語(例えば、予め設定された名詞)の分布の類似度に基づいて、選択対象d間の類似度を判定することもできる。   In the embodiment described above, the ambiguity determination unit 32 uses the topic model (for example, LDA) as the feature of the selection target d to determine the similarity between the selection targets d based on the distribution of the topic t. Although shown, it is not limited to such an example. For example, the ambiguity determination unit 32 can also determine the similarity between the selection targets d based on the similarity of the distribution of feature words (for example, preset nouns) between the selection targets d.

曖昧性判定部32は、選択対象d(または選択グループg)の選択割合に加え、さらに選択対象d(または選択グループg)の選択までにかかった時間に応じた重み付けを行うことができる。これにより、さらに、検索キーワードkの曖昧性を精度よく判定することができる。この場合、情報提供部31は、選択対象d(または選択グループg)の選択までにかかった時間の情報を検索履歴情報として記憶部20に記憶する。   In addition to the selection ratio of the selection target d (or selection group g), the ambiguity determination unit 32 can further perform weighting according to the time taken to select the selection target d (or selection group g). Thereby, the ambiguity of the search keyword k can be determined with high accuracy. In this case, the information providing unit 31 stores information on the time taken until selection of the selection target d (or selection group g) in the storage unit 20 as search history information.

[5.ハードウェア構成〕
なお、上述した実施形態における情報処理装置3は、例えば図13に示すような構成のコンピュータ100が情報処理プログラムを実行することによって実現される。図13は、情報処理プログラムを実行するコンピュータのハードウェア構成の一例を示す図である。コンピュータ100は、CPU101、RAM102、ROM103、HDD104、通信インターフェイス(I/F)105、入出力インターフェイス(I/F)106、およびメディアインターフェイス(I/F)107を備える。
[5. Hardware configuration)
Note that the information processing apparatus 3 in the above-described embodiment is realized by a computer 100 having a configuration as illustrated in FIG. 13 executing an information processing program, for example. FIG. 13 is a diagram illustrating an example of a hardware configuration of a computer that executes an information processing program. The computer 100 includes a CPU 101, a RAM 102, a ROM 103, an HDD 104, a communication interface (I / F) 105, an input / output interface (I / F) 106, and a media interface (I / F) 107.

CPU101は、ROM103またはHDD104に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM103は、コンピュータ100の起動時にCPU101によって実行されるブートプログラムや、コンピュータ100のハードウェアに依存するプログラム等を格納する。   The CPU 101 operates based on a program stored in the ROM 103 or the HDD 104 and controls each unit. The ROM 103 stores a boot program executed by the CPU 101 when the computer 100 is started up, a program depending on the hardware of the computer 100, and the like.

HDD104は、CPU101によって実行されるプログラムによって使用されるデータ等を格納する。例えば、HDD104は、図3に記載した提供情報記憶部21、ユーザ情報記憶部22、曖昧性情報記憶部23、検索履歴記憶部24および特徴情報記憶部25と同様のデータを記憶する。通信インターフェイス105は、通信部10に対応し、ネットワーク4を介して他の機器からデータを受信してCPU101へ送り、CPU101が生成したデータを、ネットワーク4を介して他の機器へ送信する。   The HDD 104 stores data used by programs executed by the CPU 101. For example, the HDD 104 stores the same data as the provided information storage unit 21, the user information storage unit 22, the ambiguity information storage unit 23, the search history storage unit 24, and the feature information storage unit 25 described in FIG. 3. The communication interface 105 corresponds to the communication unit 10, receives data from other devices via the network 4, sends the data to the CPU 101, and transmits data generated by the CPU 101 to other devices via the network 4.

CPU101は、入出力インターフェイス106を介して、ディスプレイやプリンタ等の出力装置、および、キーボードやマウス等の入力装置を制御する。CPU101は、入出力インターフェイス106を介して、入力装置からデータを取得する。また、CPU101は、生成したデータを、入出力インターフェイス106を介して出力装置へ出力する。   The CPU 101 controls an output device such as a display and a printer and an input device such as a keyboard and a mouse via the input / output interface 106. The CPU 101 acquires data from the input device via the input / output interface 106. Further, the CPU 101 outputs the generated data to the output device via the input / output interface 106.

メディアインターフェイス107は、記録媒体108に格納されたプログラムまたはデータを読み取り、RAM102を介してCPU101に提供する。CPU101は、当該プログラムを、メディアインターフェイス107を介して記録媒体108からRAM102上にロードし、ロードしたプログラムを実行する。記録媒体108は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。   The media interface 107 reads a program or data stored in the recording medium 108 and provides it to the CPU 101 via the RAM 102. The CPU 101 loads the program from the recording medium 108 onto the RAM 102 via the media interface 107, and executes the loaded program. The recording medium 108 is, for example, an optical recording medium such as a DVD (Digital Versatile Disc) or PD (Phase change rewritable disk), a magneto-optical recording medium such as an MO (Magneto-Optical disk), a tape medium, a magnetic recording medium, or a semiconductor memory. Etc.

コンピュータ100が上述した実施形態に係る情報処理装置3して機能する場合、コンピュータ100のCPU101は、RAM102上にロードされたプログラムを実行することにより、図3に示す情報提供部31および曖昧性判定部32の各機能を実現する。コンピュータ100のCPU101は、情報処理プログラムを、記録媒体108から読み取って実行するが、他の例として、他の装置から、ネットワーク4を介してこれらのプログラムを取得してもよい。   When the computer 100 functions as the information processing apparatus 3 according to the above-described embodiment, the CPU 101 of the computer 100 executes the program loaded on the RAM 102 to thereby execute the information providing unit 31 and the ambiguity determination illustrated in FIG. Each function of the unit 32 is realized. The CPU 101 of the computer 100 reads the information processing program from the recording medium 108 and executes the information processing program. However, as another example, the program may be acquired from another device via the network 4.

[6.効果]
実施形態に係る情報処理装置3は、記憶部20と、曖昧性判定部32とを備える。記憶部20は、検索時に用いられた検索キーワードkと、検索キーワードkを用いて検索された検索結果の中から選択された複数の選択対象d(または複数の選択グループg;対象の一例)に関する情報とを関連付けて検索履歴情報として記憶する。曖昧性判定部32は、記憶部20に記憶された検索履歴情報に基づき、検索キーワードkに対応する複数の選択対象d間(または複数の選択グループg間)の類似度を算出し、算出した類似度から検索キーワードkの曖昧性を判定する。このように、端末ユーザによって選択された選択対象d1〜dn間(または複数の選択グループg間)の関係を考慮して検索キーワードkの曖昧性を判定することから、検索に用いられる検索キーワードkの曖昧性を精度よく判定することができる。
[6. effect]
The information processing apparatus 3 according to the embodiment includes a storage unit 20 and an ambiguity determination unit 32. The storage unit 20 relates to a search keyword k used at the time of search and a plurality of selection targets d (or a plurality of selection groups g; examples of targets) selected from the search results searched using the search keyword k. The information is stored in association with the search history information. Based on the search history information stored in the storage unit 20, the ambiguity determination unit 32 calculates a similarity between a plurality of selection targets d (or between a plurality of selection groups g) corresponding to the search keyword k. The ambiguity of the search keyword k is determined from the similarity. In this way, the ambiguity of the search keyword k is determined in consideration of the relationship between the selection targets d1 to dn (or between a plurality of selection groups g) selected by the terminal user, so that the search keyword k used for the search is used. Can be accurately determined.

また、曖昧性判定部32は、情報取得部52と、類似度算出部53とを備える。情報取得部52は、選択された複数の選択対象d(または複数の選択グループg)それぞれの特徴を示す特徴情報を取得する。また、類似度算出部53は、選択対象dの選択割合(または選択グループgの選択割合)に基づいて重み付けられた複数の選択対象d間(または複数の選択グループg間)での特徴情報の類似度に基づき、複数の選択対象d間(または複数の選択グループg間)の類似度(以下、対象類似度と記載する)を算出する。このように特徴情報に基づいて、対象類似度を算出することから、かかる類似度を精度よく算出することができる。   The ambiguity determination unit 32 includes an information acquisition unit 52 and a similarity calculation unit 53. The information acquisition unit 52 acquires feature information indicating the features of each of the plurality of selected selection targets d (or a plurality of selection groups g). In addition, the similarity calculation unit 53 calculates feature information between a plurality of selection targets d (or between a plurality of selection groups g) weighted based on the selection ratio of the selection target d (or the selection ratio of the selection group g). Based on the similarity, a similarity (hereinafter referred to as a target similarity) between a plurality of selection targets d (or between a plurality of selection groups g) is calculated. Since the target similarity is calculated based on the feature information as described above, the similarity can be calculated with high accuracy.

また、情報取得部52は、特徴情報としてトピック分布p(t|d)(またはp(t|g))(特徴要素の分布の一例)を示す情報を取得する。類似度算出部53は、選択された複数の選択対象d間(または複数の選択グループg間)でのトピック分布p(t|d)(またはp(t|g))の類似度に基づき、対象類似度の類似度を算出する。このように、トピック分布p(t|d)(またはp(t|g))の類似度を用いることにより、対象類似度をさらに精度よく算出することができる。   In addition, the information acquisition unit 52 acquires information indicating the topic distribution p (t | d) (or p (t | g)) (an example of the distribution of feature elements) as feature information. The similarity calculation unit 53 is based on the similarity of the topic distribution p (t | d) (or p (t | g)) between a plurality of selected selection targets d (or between a plurality of selection groups g). The similarity of the target similarity is calculated. As described above, by using the similarity of the topic distribution p (t | d) (or p (t | g)), the target similarity can be calculated with higher accuracy.

また、選択された選択対象dは、検索結果の中から選択されたコンテンツ(またはコンテンツのグループ)であり、特徴情報は、コンテンツに含まれるトピック分布(またはグループの2以上のコンテンツに含まれるトピック分布)である。事前に十分に調整されたグループが存在する場合、選択されたグループのトピック分布に基いて対象類似度を算出する方が、コンテンツのトピック分布を基いて対象類似度を算出する場合に比べ、対象類似度をより精度よく算出できる可能性がある。また、選択されたグループのトピック分布に基づいて対象類似度を算出することによって、例えば、判定対象を減らすことができることから対象類似度の判定負荷を軽減することができる。   The selected selection target d is content (or a group of content) selected from the search results, and the feature information is a topic distribution included in the content (or topics included in two or more contents of the group). Distribution). If there is a well-adjusted group in advance, the target similarity is calculated based on the topic distribution of the selected group compared to the target similarity calculated based on the topic distribution of the content. There is a possibility that the similarity can be calculated more accurately. Further, by calculating the target similarity based on the topic distribution of the selected group, for example, the determination target can be reduced because the determination target can be reduced, for example.

曖昧性判定部32は、検索キーワードk毎に類似度に対応するキーワード曖昧度を含む曖昧性情報を記憶部20に記憶する。このように、検索キーワードk毎に類似度に対応するキーワード曖昧度を記憶するとから、新たな検索を行うために入力された検索キーワードkに対して、キーワード曖昧度に応じた検索を行うことができる。   The ambiguity determination unit 32 stores the ambiguity information including the keyword ambiguity corresponding to the similarity for each search keyword k in the storage unit 20. As described above, since the keyword ambiguity corresponding to the similarity is stored for each search keyword k, the search according to the keyword ambiguity can be performed on the search keyword k input for performing a new search. it can.

実施形態に係る情報処理装置3は、情報提供部31を備える。情報提供部31は、新たに検索を行うために入力された検索キーワードkに対して、曖昧性情報から検索キーワードkに対するキーワード曖昧度(曖昧度の情報の一例)を取得し、取得したキーワード曖昧度の情報に対応させた情報提供処理(例えば、検索処理)を行う。これにより、検索クエリqの検索キーワードkの曖昧度に応じた適切な検索結果を端末ユーザに提供することができる。   The information processing apparatus 3 according to the embodiment includes an information providing unit 31. The information providing unit 31 acquires a keyword ambiguity (an example of ambiguity information) for the search keyword k from the ambiguity information for the search keyword k input for a new search, and acquires the acquired keyword ambiguity. Information provision processing (for example, search processing) corresponding to the degree information is performed. Thereby, an appropriate search result according to the ambiguity of the search keyword k of the search query q can be provided to the terminal user.

情報提供部31は、キーワード曖昧度と、予め設定した閾値THとを比較し、キーワード曖昧度が閾値TH以上である場合に、検索キーワードkに他の情報を補充し、補充した内容で検索を行い、キーワード曖昧度が閾値TH以上でない場合に、検索キーワードkで検索を行う。これにより、曖昧度が高い検索キーワードkを有する検索クエリに対して、ユーザの検索意図に対応する適切な検索結果を端末ユーザに提供することができる。   The information providing unit 31 compares the keyword ambiguity with a preset threshold value TH, and when the keyword ambiguity is equal to or greater than the threshold value TH, the search keyword k is supplemented with other information, and the search is performed with the supplemented content. If the keyword ambiguity is not greater than or equal to the threshold value TH, the search is performed with the search keyword k. Thereby, an appropriate search result corresponding to the user's search intention can be provided to the terminal user for the search query having the search keyword k having a high degree of ambiguity.

情報提供部31は、キーワード曖昧度と、予め設定した閾値THとを比較し、キーワード曖昧度が閾値TH以上である場合に、検索キーワードkに他の情報を補充する絞り込み候補の情報を端末装置2へ提供することもできる。これにより、曖昧度が高い検索キーワードkを有する検索クエリに対して、ユーザの検索意図に対応するより明確なり込み候補を端末ユーザに提供することができる。   The information providing unit 31 compares the keyword ambiguity with a preset threshold value TH, and if the keyword ambiguity is equal to or greater than the threshold value TH, information on narrowing candidates for supplementing the search keyword k with other information is displayed on the terminal device. 2 can also be provided. As a result, for a search query having a search keyword k with a high degree of ambiguity, it is possible to provide a terminal user with a clearer infiltration candidate that corresponds to the user's search intention.

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。   As described above, some of the embodiments of the present application have been described in detail based on the drawings. It is possible to implement the present invention in other forms with improvements.

また、上述した情報処理装置3は、複数のサーバコンピュータで実現してもよく、また、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティングなどで呼び出して実現するなど、構成は柔軟に変更できる。   Further, the information processing apparatus 3 described above may be realized by a plurality of server computers, and depending on functions, an external platform or the like may be realized by calling an API (Application Programming Interface) or network computing. Can be changed flexibly.

また、上記してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、曖昧性判定部は、曖昧性判定手段や曖昧性判定回路に読み替えることができる。   Moreover, the above-mentioned “section (module, unit)” can be read as “means”, “circuit”, and the like. For example, the ambiguity determination unit can be read as ambiguity determination means or an ambiguity determination circuit.

1 情報処理システム
2 端末装置
3 情報処理装置
4 ネットワーク
10 通信部
20 記憶部
21 提供情報記憶部
22 ユーザ情報記憶部
23 曖昧性情報記憶部
24 検索履歴記憶部
25 特徴情報記憶部
30 制御部
31 情報提供部
32 曖昧性判定部
41 要求受信部
42 検索処理部
43 提供情報生成部
44 提供情報出力部
51 特徴抽出部
52 情報取得部
53 類似度算出部
54 クエリ曖昧度設定部
DESCRIPTION OF SYMBOLS 1 Information processing system 2 Terminal device 3 Information processing apparatus 4 Network 10 Communication part 20 Storage part 21 Provided information storage part 22 User information storage part 23 Ambiguity information storage part 24 Search history storage part 25 Feature information storage part 30 Control part 31 Information Provision unit 32 Ambiguity determination unit 41 Request reception unit 42 Search processing unit 43 Provision information generation unit 44 Provision information output unit 51 Feature extraction unit 52 Information acquisition unit 53 Similarity calculation unit 54 Query ambiguity setting unit

Claims (10)

検索時に用いられたキーワードと、当該キーワードを用いて検索された検索結果の中から選択された複数の対象に関する情報とを関連付けて検索履歴情報として記憶する記憶部と、
前記記憶部に記憶された検索履歴情報に基づき、前記キーワードに対応する前記複数の対象間の類似度を算出し、算出した類似度から前記キーワードの曖昧性を判定する曖昧性判定部と、
を有することを特徴とする情報処理装置。
A storage unit that associates and stores, as search history information, a keyword used at the time of search and information related to a plurality of targets selected from search results searched using the keyword;
Based on the search history information stored in the storage unit, the similarity between the plurality of objects corresponding to the keyword is calculated, and an ambiguity determination unit that determines the ambiguity of the keyword from the calculated similarity,
An information processing apparatus comprising:
前記曖昧性判定部は、
前記複数の対象それぞれの特徴を示す特徴情報を取得する情報取得部と、
前記対象の選択割合に基づいて重み付けた前記複数の対象間での前記特徴情報の類似度に基づき、前記複数の対象間の類似度を算出する類似度算出部と、を備える
ことを特徴とする請求項1に記載の情報処理装置。
The ambiguity determination unit
An information acquisition unit that acquires characteristic information indicating characteristics of each of the plurality of objects;
A similarity calculation unit that calculates the similarity between the plurality of objects based on the similarity of the feature information between the plurality of objects weighted based on the selection ratio of the objects. The information processing apparatus according to claim 1.
前記情報取得部は、
前記特徴情報として特徴要素の分布を示す情報を取得し、
前記類似度算出部は、
前記複数の対象間での前記特徴要素の分布の類似度に基づき、前記複数の対象間の類似度を算出する
ことを特徴とする請求項2に記載の情報処理装置。
The information acquisition unit
Obtaining information indicating the distribution of feature elements as the feature information,
The similarity calculation unit includes:
The information processing apparatus according to claim 2, wherein the similarity between the plurality of objects is calculated based on the similarity of the distribution of the feature elements between the plurality of objects.
前記対象は、前記検索結果の中から選択されたコンテンツまたは当該コンテンツのグループであり、
前記特徴情報は、前記コンテンツに含まれる特徴要素の分布または前記グループの2以上のコンテンツに含まれる特徴要素の分布である
ことを特徴とする請求項3に記載の情報処理装置。
The target is a content selected from the search results or a group of the content,
The information processing apparatus according to claim 3, wherein the feature information is a distribution of feature elements included in the content or a distribution of feature elements included in two or more contents of the group.
前記曖昧性判定部は、
前記キーワード毎に前記類似度に対応する曖昧性情報を前記記憶部に記憶する
ことを特徴とする請求項1〜4のいずれか一つに記載の情報処理装置。
The ambiguity determination unit
The information processing apparatus according to any one of claims 1 to 4, wherein ambiguity information corresponding to the similarity is stored in the storage unit for each keyword.
新たに検索を行うために入力されたキーワードに対して、前記曖昧性情報から前記キーワードに対する曖昧度の情報を取得し、取得した曖昧度の情報に対応させた情報提供処理を行う情報提供部を有する
ことを特徴とする請求項5に記載の情報処理装置。
An information providing unit that obtains ambiguity information for the keyword from the ambiguity information and performs an information provision process corresponding to the obtained ambiguity information with respect to the keyword newly entered for performing a search. The information processing apparatus according to claim 5, further comprising:
前記情報提供部は、
前記曖昧度と、予め設定した閾値とを比較し、前記曖昧度が前記閾値以上である場合に、前記キーワードに他の情報を補充し、補充した内容で検索を行い、前記曖昧度が前記閾値以上でない場合に、前記キーワードで検索を行う
ことを特徴とする請求項6に記載の情報処理装置。
The information providing unit
The ambiguity is compared with a preset threshold, and when the ambiguity is equal to or greater than the threshold, the keyword is supplemented with other information, and a search is performed with the supplemented content. The ambiguity is the threshold The information processing apparatus according to claim 6, wherein, if not, the search is performed using the keyword.
前記情報提供部は、
前記曖昧度と、予め設定した閾値とを比較し、前記曖昧度が前記閾値以上である場合に、前記キーワードを送信した端末装置へ前記キーワードに補充する他の情報を提供する
ことを特徴とする請求項6または7に記載の情報処理装置。
The information providing unit
The ambiguity is compared with a preset threshold value, and when the ambiguity is equal to or greater than the threshold value, other information supplemented to the keyword is provided to the terminal device that transmitted the keyword. The information processing apparatus according to claim 6 or 7.
コンピュータが実行する情報処理方法であって、
検索時に用いられたキーワードと、当該キーワードを用いて検索された検索結果の中から選択された複数の対象に関する情報とを関連付けて検索履歴情報として記憶部に記憶する記憶工程と、
前記記憶部に記憶された検索履歴情報に基づき、前記キーワードに対応する前記複数の対象間の類似度を算出し、算出した類似度から前記キーワードの曖昧性を判定する曖昧性判定工程と、を含む
ことを特徴とする情報処理方法。
An information processing method executed by a computer,
A storage step of associating and storing in a storage unit as search history information the keywords used during the search and the information related to a plurality of objects selected from the search results searched using the keywords;
Based on the search history information stored in the storage unit, the similarity between the plurality of objects corresponding to the keyword is calculated, and the ambiguity determination step of determining the ambiguity of the keyword from the calculated similarity. Information processing method characterized by including.
検索時に用いられたキーワードと、当該キーワードを用いて検索された検索結果の中から選択された複数の対象に関する情報とを関連付けて検索履歴情報として記憶部に記憶する記憶手順と、
前記記憶部に記憶された検索履歴情報に基づき、前記キーワードに対応する前記複数の対象間の類似度を算出し、算出した類似度から前記キーワードの曖昧性を判定する曖昧性判定手順と、
をコンピュータに実行させることを特徴とする情報処理プログラム。
A storage procedure for associating a keyword used at the time of search with information related to a plurality of objects selected from search results searched using the keyword in the storage unit as search history information;
Based on the search history information stored in the storage unit, the similarity between the plurality of objects corresponding to the keyword is calculated, and the ambiguity determination procedure for determining the ambiguity of the keyword from the calculated similarity,
An information processing program for causing a computer to execute.
JP2016030239A 2016-02-19 2016-02-19 Information processing apparatus, information processing method, and information processing program Active JP6203304B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016030239A JP6203304B2 (en) 2016-02-19 2016-02-19 Information processing apparatus, information processing method, and information processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016030239A JP6203304B2 (en) 2016-02-19 2016-02-19 Information processing apparatus, information processing method, and information processing program

Publications (2)

Publication Number Publication Date
JP2017146926A true JP2017146926A (en) 2017-08-24
JP6203304B2 JP6203304B2 (en) 2017-09-27

Family

ID=59683221

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016030239A Active JP6203304B2 (en) 2016-02-19 2016-02-19 Information processing apparatus, information processing method, and information processing program

Country Status (1)

Country Link
JP (1) JP6203304B2 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019096185A (en) * 2017-11-27 2019-06-20 キヤノンマーケティングジャパン株式会社 Information processing system, control method therefor and program, information processing device, control method therefor and program
JP2020109689A (en) * 2018-11-06 2020-07-16 データ・サイエンティスト株式会社 Retrieval need evaluation device, retrieval need evaluation system, and retrieval need evaluation method
JP2020177549A (en) * 2019-04-22 2020-10-29 株式会社プレシジョン Information processing device, information processing method and information processing program
WO2022097197A1 (en) * 2020-11-04 2022-05-12 データ・サイエンティスト株式会社 Search needs evaluation program, search needs evaluation device, search needs evaluation method, evaluation program, evaluation device, and evaluation method
JP2022177197A (en) * 2020-11-04 2022-11-30 データ・サイエンティスト株式会社 Search needs evaluation program, search needs evaluation device, and search needs evaluation method, and evaluation program, evaluation device, and evaluation method

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11143892A (en) * 1997-11-07 1999-05-28 Fujitsu Ltd Device and method for keyword weight generation and program storage medium
JP2003076694A (en) * 2001-09-05 2003-03-14 Canon Inc Image retrieval device, and method and program therefor
JP2008523469A (en) * 2004-12-06 2008-07-03 ヤフー! インコーポレイテッド Search processing by automatic categorization of queries
JP2009277154A (en) * 2008-05-16 2009-11-26 Ntt Docomo Inc Information retrieval device and information retrieval method
JP2014197300A (en) * 2013-03-29 2014-10-16 株式会社Jvcケンウッド Text information processor, text information processing method, and text information processing program

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11143892A (en) * 1997-11-07 1999-05-28 Fujitsu Ltd Device and method for keyword weight generation and program storage medium
JP2003076694A (en) * 2001-09-05 2003-03-14 Canon Inc Image retrieval device, and method and program therefor
JP2008523469A (en) * 2004-12-06 2008-07-03 ヤフー! インコーポレイテッド Search processing by automatic categorization of queries
JP2009277154A (en) * 2008-05-16 2009-11-26 Ntt Docomo Inc Information retrieval device and information retrieval method
JP2014197300A (en) * 2013-03-29 2014-10-16 株式会社Jvcケンウッド Text information processor, text information processing method, and text information processing program

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019096185A (en) * 2017-11-27 2019-06-20 キヤノンマーケティングジャパン株式会社 Information processing system, control method therefor and program, information processing device, control method therefor and program
JP7132479B2 (en) 2017-11-27 2022-09-07 キヤノンマーケティングジャパン株式会社 Information processing system, its control method, and program, and information processing device, its control method, and program
JP2020109689A (en) * 2018-11-06 2020-07-16 データ・サイエンティスト株式会社 Retrieval need evaluation device, retrieval need evaluation system, and retrieval need evaluation method
JP2020177549A (en) * 2019-04-22 2020-10-29 株式会社プレシジョン Information processing device, information processing method and information processing program
WO2022097197A1 (en) * 2020-11-04 2022-05-12 データ・サイエンティスト株式会社 Search needs evaluation program, search needs evaluation device, search needs evaluation method, evaluation program, evaluation device, and evaluation method
JPWO2022097197A1 (en) * 2020-11-04 2022-05-12
JP2022177197A (en) * 2020-11-04 2022-11-30 データ・サイエンティスト株式会社 Search needs evaluation program, search needs evaluation device, and search needs evaluation method, and evaluation program, evaluation device, and evaluation method
JP7262871B2 (en) 2020-11-04 2023-04-24 データ・サイエンティスト株式会社 Search Needs Evaluation Program, Search Needs Evaluation Device and Search Needs Evaluation Method, Evaluation Program, Evaluation Device and Evaluation Method
JP7262863B2 (en) 2020-11-04 2023-04-24 データ・サイエンティスト株式会社 Search Needs Evaluation Program, Search Needs Evaluation Device and Search Needs Evaluation Method, Evaluation Program, Evaluation Device and Evaluation Method

Also Published As

Publication number Publication date
JP6203304B2 (en) 2017-09-27

Similar Documents

Publication Publication Date Title
US9594826B2 (en) Co-selected image classification
US9830390B2 (en) Related entities
JP6050327B2 (en) Dynamic image display area and image display in web search results
US9436707B2 (en) Content-based image ranking
US8209330B1 (en) Ordering image search results
US9053158B1 (en) Method for human ranking of search results
US8620929B2 (en) Context based resource relevance
JP6203304B2 (en) Information processing apparatus, information processing method, and information processing program
US9336318B2 (en) Rich content for query answers
US8326836B1 (en) Providing time series information with search results
US20110213772A1 (en) Blending Mobile Search Results
US9183312B2 (en) Image display within web search results
US9613145B2 (en) Generating contextual search presentations
US20170097967A1 (en) Automated Customization of Display Component Data for Search Results
JP6956119B2 (en) Systems and methods for providing contextual information
JP2014515514A (en) Method and apparatus for providing suggested words
US9916384B2 (en) Related entities
JP2020024674A (en) Method and apparatus for pushing information
JP2018504686A (en) Method and apparatus for processing search data
JP2016110260A (en) Content search result provision system and content search result provision method
US10055463B1 (en) Feature based ranking adjustment

Legal Events

Date Code Title Description
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20170518

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170725

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170801

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170829

R150 Certificate of patent or registration of utility model

Ref document number: 6203304

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350