JP7008152B1 - Information processing equipment, information processing methods and information processing programs - Google Patents

Information processing equipment, information processing methods and information processing programs Download PDF

Info

Publication number
JP7008152B1
JP7008152B1 JP2021034630A JP2021034630A JP7008152B1 JP 7008152 B1 JP7008152 B1 JP 7008152B1 JP 2021034630 A JP2021034630 A JP 2021034630A JP 2021034630 A JP2021034630 A JP 2021034630A JP 7008152 B1 JP7008152 B1 JP 7008152B1
Authority
JP
Japan
Prior art keywords
query
information processing
search
user
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021034630A
Other languages
Japanese (ja)
Other versions
JP2022135055A (en
Inventor
孝太 坪内
拓明 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2021034630A priority Critical patent/JP7008152B1/en
Application granted granted Critical
Publication of JP7008152B1 publication Critical patent/JP7008152B1/en
Publication of JP2022135055A publication Critical patent/JP2022135055A/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】クエリ間の関係性を適切に推定することができる情報処理装置、情報処理方法および情報処理プログラムを提供する。【解決手段】本願に係る情報処理装置は、取得部と、抽出部と、推定部とを備える。取得部は、ユーザによって入力された第1クエリによる検索要求に基づいて第1クエリとは異なる第2クエリを用いた検索結果が提供された場合のユーザの検索行動に関する履歴情報を取得する。抽出部は、取得部によって取得された履歴情報に基づいて検索行動に際してのコンテキストを含む検索行動の特徴情報を抽出する。推定部は、抽出部によって抽出された特徴情報の変化に基づいて、第1クエリと第2クエリとの間の関係性を推定する。【選択図】図5PROBLEM TO BE SOLVED: To provide an information processing device, an information processing method and an information processing program capable of appropriately estimating a relationship between queries. An information processing apparatus according to the present application includes an acquisition unit, an extraction unit, and an estimation unit. The acquisition unit acquires history information regarding the user's search behavior when a search result using a second query different from the first query is provided based on the search request by the first query input by the user. The extraction unit extracts the characteristic information of the search behavior including the context in the search behavior based on the history information acquired by the acquisition unit. The estimation unit estimates the relationship between the first query and the second query based on the change in the feature information extracted by the extraction unit. [Selection diagram] FIG. 5

Description

本発明は、情報処理装置、情報処理方法および情報処理プログラムに関する。 The present invention relates to an information processing apparatus, an information processing method and an information processing program.

従来、ユーザが入力した文字列を検索クエリ(以下、単に「クエリ」と呼ぶ)として、様々な情報の検索サービスを行うための技術が提供されている。そのような検索サービスにおいては、ユーザが入力したクエリに誤記が含まれる場合等において、その誤記を変換した上で検索を行い、検索結果をユーザに提供する技術が提供されている(例えば、特許文献1参照)。 Conventionally, there has been provided a technique for performing a search service for various information by using a character string input by a user as a search query (hereinafter, simply referred to as a "query"). In such a search service, when a query entered by a user contains an error, a technique is provided in which the error is converted and then searched, and the search result is provided to the user (for example, a patent). See Document 1).

特許第6529456号公報Japanese Patent No. 6529456

しかしながら、上記の従来技術を用いた場合、入力されたクエリと実際の検索に用いるべきクエリの間の関係性を判断することが難しい。例えば、従来技術では、第1文字列とその第1文字列の誤記として入力され得る第2文字列とを対応付けた辞書を用いて、第2文字列が入力された場合に、第2文字列を第1文字列へと変換しているに過ぎない。 However, when the above-mentioned conventional technique is used, it is difficult to determine the relationship between the input query and the query to be used for the actual search. For example, in the prior art, when the second character string is input by using a dictionary in which the first character string and the second character string that can be input as an erroneous description of the first character string are associated with each other, the second character is input. It's just converting the column to the first string.

このため、従来技術では、ユーザが入力した第2文字列をそのままクエリとしたい場合には、ユーザは望む検索結果を得られないおそれがある。したがって、クエリ間の関係性を適切に推定することが望まれている。 Therefore, in the prior art, if the user wants to use the second character string input by the user as a query as it is, the user may not be able to obtain the desired search result. Therefore, it is desired to properly estimate the relationship between queries.

本願は、上記に鑑みてなされたものであって、クエリ間の関係性を適切に推定することができる情報処理装置、情報処理方法および情報処理プログラムを提供することを目的とする。 The present application has been made in view of the above, and an object of the present application is to provide an information processing apparatus, an information processing method, and an information processing program capable of appropriately estimating the relationship between queries.

本願に係る情報処理装置は、取得部と、抽出部と、推定部とを備える。前記取得部は、ユーザによって入力された第1クエリによる検索要求に基づいて前記第1クエリとは異なる第2クエリを用いた検索結果が提供された場合の前記ユーザの検索行動に関する履歴情報を取得する。前記抽出部は、前記取得部によって取得された前記履歴情報に基づいて前記検索行動に際してのコンテキストを含む前記検索行動の特徴情報を抽出する。前記推定部は、前記抽出部によって抽出された前記特徴情報の変化に基づいて、前記第1クエリと前記第2クエリとの間の関係性を推定する。 The information processing apparatus according to the present application includes an acquisition unit, an extraction unit, and an estimation unit. The acquisition unit acquires history information regarding the search behavior of the user when a search result using a second query different from the first query is provided based on a search request by the first query input by the user. do. The extraction unit extracts characteristic information of the search behavior including a context for the search behavior based on the history information acquired by the acquisition unit. The estimation unit estimates the relationship between the first query and the second query based on the change in the feature information extracted by the extraction unit.

実施形態の一態様によれば、クエリ間の関係性を適切に推定することができるという効果を奏する。 According to one aspect of the embodiment, there is an effect that the relationship between queries can be appropriately estimated.

図1は、実施形態に係る情報処理の一例を示す図である。FIG. 1 is a diagram showing an example of information processing according to an embodiment. 図2は、実施形態に係る情報処理の処理説明図(その1)である。FIG. 2 is a processing explanatory diagram (No. 1) of information processing according to the embodiment. 図3は、実施形態に係る情報処理の処理説明図(その2)である。FIG. 3 is a process explanatory diagram (No. 2) of information processing according to the embodiment. 図4は、実施形態に係る情報処理システムの構成例を示す図である。FIG. 4 is a diagram showing a configuration example of an information processing system according to an embodiment. 図5は、実施形態に係る情報処理装置の構成例を示すブロック図である。FIG. 5 is a block diagram showing a configuration example of the information processing apparatus according to the embodiment. 図6は、実施形態に係る推定処理の処理説明図(その1)である。FIG. 6 is a process explanatory diagram (No. 1) of the estimation process according to the embodiment. 図7は、実施形態に係る推定処理の処理説明図(その2)である。FIG. 7 is a process explanatory diagram (No. 2) of the estimation process according to the embodiment. 図8は、実施形態に係る推定処理の処理説明図(その3)である。FIG. 8 is a process explanatory diagram (No. 3) of the estimation process according to the embodiment. 図9は、実施形態に係る情報処理装置が実行する処理手順を示すフローチャートである。FIG. 9 is a flowchart showing a processing procedure executed by the information processing apparatus according to the embodiment. 図10は、実施形態に係る情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。FIG. 10 is a hardware configuration diagram showing an example of a computer that realizes the functions of the information processing apparatus according to the embodiment.

以下に、本願に係る情報処理装置、情報処理方法および情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法および情報処理プログラムが限定されるものではない。また、各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。 Hereinafter, an information processing apparatus, an information processing method, and an embodiment for implementing an information processing program (hereinafter referred to as “embodiments”) according to the present application will be described in detail with reference to the drawings. Note that this embodiment does not limit the information processing apparatus, information processing method, and information processing program according to the present application. In addition, each embodiment can be appropriately combined as long as the processing contents do not contradict each other. Further, in each of the following embodiments, the same parts are designated by the same reference numerals, and duplicate explanations are omitted.

〔1.情報処理の一例〕
まず、実施形態に係る情報処理の一例について、図1~図3を用いて説明する。図1は、実施形態に係る情報処理の一例を示す図である。また、図2は、実施形態に係る情報処理の処理説明図(その1)である。また、図3は、実施形態に係る情報処理の処理説明図(その3)である。
[1. An example of information processing]
First, an example of information processing according to the embodiment will be described with reference to FIGS. 1 to 3. FIG. 1 is a diagram showing an example of information processing according to an embodiment. Further, FIG. 2 is a processing explanatory diagram (No. 1) of information processing according to the embodiment. Further, FIG. 3 is a processing explanatory diagram (No. 3) of information processing according to the embodiment.

図1~図3では、実施形態に係る情報処理システム1に含まれる情報処理装置100が、ユーザUによって入力された第1クエリによる検索要求に基づいて第1クエリとは異なる第2クエリを用いた検索結果が提供された場合のユーザUの検索行動に関する履歴情報を取得し、取得された履歴情報に基づいて検索行動に際してのコンテキストを含む検索行動の特徴情報を抽出し、抽出された特徴情報の変化に基づいて、第1クエリと第2クエリとの間の関係性を推定する処理を実行する例を示す。 In FIGS. 1 to 3, the information processing apparatus 100 included in the information processing system 1 according to the embodiment uses a second query different from the first query based on the search request by the first query input by the user U. The history information about the search behavior of the user U when the searched result is provided is acquired, and the feature information of the search behavior including the context of the search behavior is extracted based on the acquired history information, and the extracted feature information is extracted. An example of executing a process of estimating the relationship between the first query and the second query based on the change of is shown.

図1に示すように、実施形態に係る情報処理システム1は、ユーザ端末10と、情報処理装置100とを含む。 As shown in FIG. 1, the information processing system 1 according to the embodiment includes a user terminal 10 and an information processing device 100.

ユーザ端末10は、ユーザUすなわちユーザU1,U2…がそれぞれ利用する端末装置であるユーザ端末10-1,10-2…である。ユーザUは、ユーザ端末10から図示略のネットワークを介し、情報処理装置100へアクセスすることで、情報処理装置100が提供するサービスの一つである検索サービスを利用する。なお、以下では、「ユーザU」は、適宜「ユーザ端末10」と読み替えることができる。 The user terminal 10 is a user terminal 10-1, 10-2 ... Which is a terminal device used by the user U, that is, the users U1, U2 ... The user U uses the search service, which is one of the services provided by the information processing apparatus 100, by accessing the information processing apparatus 100 from the user terminal 10 via a network (not shown). In the following, "user U" can be appropriately read as "user terminal 10".

情報処理装置100は、各種サービスをユーザUへ提供するサーバ装置である。情報処理装置100が提供するサービスは、例えば、ユーザ端末10にインストールされた各種アプリやブラウザを介して各種情報を提供するサービスである。提供されるサービスには、検索サービスの他、例えば、ニュース提供サービスや、オークションサービス、天気予報サービス、ショッピングサービス、金融取引(株取引等)サービス、路線検索サービス、地図提供サービス、旅行サービス、飲食店紹介サービス、ブログサービス等が含まれてもよい。 The information processing device 100 is a server device that provides various services to the user U. The service provided by the information processing apparatus 100 is, for example, a service that provides various information via various applications and browsers installed in the user terminal 10. In addition to search services, the services provided include, for example, news services, auction services, weather forecast services, shopping services, financial trading (stock trading, etc.) services, route search services, map providing services, travel services, and food and beverage services. Store introduction services, blog services, etc. may be included.

ユーザUは、検索サービスを利用する場合、情報処理装置100へアクセス後、ユーザ端末10から検索キーワードとなる文字列であるクエリを入力する。以下、ユーザUが入力するクエリを「第1クエリ」と呼ぶ。そして、ユーザUは、第1クエリによる検索要求を情報処理装置100へ送信する(ステップS1)。 When using the search service, the user U inputs a query, which is a character string as a search keyword, from the user terminal 10 after accessing the information processing apparatus 100. Hereinafter, the query input by the user U is referred to as a "first query". Then, the user U transmits the search request by the first query to the information processing apparatus 100 (step S1).

ここで、第1クエリには誤記が含まれる場合がある。情報処理装置100は、例えば誤記として入力され得る第1クエリと、第1クエリに対し正しいと想定される文字列である第2クエリとを対応付けた辞書情報を有しており、これを用いて第1クエリが入力された場合に、第1クエリを第2クエリへ変換して第2クエリを用いた情報の検索を行う。 Here, the first query may contain an error. The information processing apparatus 100 has dictionary information in which a first query that can be input as an erroneous description and a second query, which is a character string that is assumed to be correct for the first query, are associated with each other, and is used. When the first query is input, the first query is converted into the second query and the information is searched using the second query.

そして、情報処理装置100は、かかる第2クエリを用いた検索結果をユーザUへ送信する(ステップS2)。ユーザUは、これに応じ、閲覧したい検索結果のうちの一つを選択する(ステップS3)。 Then, the information processing apparatus 100 transmits the search result using the second query to the user U (step S2). The user U selects one of the search results to be browsed accordingly (step S3).

ステップS1~S3までの流れを分かりやすく図2に示した。図2に示すのは、ユーザ端末10に表示された検索結果一覧画面の一部の例である。図2では、ユーザUが第1クエリ「XXXX」を入力し、検索を実行したところ、「XXXX」は「YYYY」の誤記候補に含まれており、情報処理装置100は、これに応じて「YYYY」を第2クエリとして用いた検索結果を提供した例を示している。 The flow from steps S1 to S3 is shown in FIG. 2 in an easy-to-understand manner. FIG. 2 shows a part of the search result list screen displayed on the user terminal 10. In FIG. 2, when the user U inputs the first query "XXXX" and executes the search, "XXXXX" is included in the error candidate of "YYYY", and the information processing apparatus 100 responds to "". An example of providing a search result using "YYYY" as a second query is shown.

なお、同図に示すように、第1クエリ「XXXX」による検索結果も下方に表示されており、ユーザUがかかる第1クエリによる検索結果を望んでいるのであれば、これを選択することはできる。ただし、下方に表示されるなど、第2クエリによる検索結果よりも低い優先度で取り扱われる都合上、ユーザUがこれを選択するまでには、第2クエリによる検索結果を選択するよりも時間がかかることとなる。 As shown in the figure, the search result by the first query "XXXX" is also displayed below, and if the user U wants the search result by the first query, he / she can select this. can. However, because it is treated with a lower priority than the search result by the second query, such as being displayed at the bottom, it takes longer than the user U to select the search result by the second query before selecting this. It will take.

図1の説明に戻る。情報処理装置100は、これらステップS1~S3のユーザUの検索行動を含むユーザUの行動に関する履歴情報をユーザ端末10から随時収集し、蓄積する。 Returning to the description of FIG. The information processing apparatus 100 collects and stores historical information about the user U's behavior including the search behavior of the user U in steps S1 to S3 from the user terminal 10 at any time.

履歴情報には、例えば、ユーザUが入力した第1クエリによる検索が要求された時点から、ユーザUに第1クエリとは異なる第2クエリを用いた検索結果を提供し、ユーザUによりその検索結果が選択された時点までの経過時間が含まれる。また、履歴情報には、例えば、ユーザUの行動から推定されるコンテキストが含まれる。 For the history information, for example, from the time when the search by the first query input by the user U is requested, the search result using the second query different from the first query is provided to the user U, and the search is performed by the user U. Includes the elapsed time to the point when the result was selected. Further, the history information includes, for example, a context estimated from the behavior of the user U.

コンテキストは、検索行動を含む各種の行動をユーザUが取るに際してのユーザUの状況や、ユーザUの環境等を示す情報である。具体的には、コンテキストには、ユーザUのジオグラフィック属性(検索行動をとった際の位置等)や、デモグラフィック属性(年齢や、性別、収入、職業等)、サイコグラフィック属性(価値観や、ライフスタイル、性格、好み等)等が含まれる。 The context is information indicating the situation of the user U when the user U takes various actions including the search action, the environment of the user U, and the like. Specifically, the context includes the geographic attribute of the user U (position when the search action is taken, etc.), the demographic attribute (age, gender, income, occupation, etc.), and the psychographic attribute (values, etc.). , Lifestyle, personality, taste, etc.) are included.

そして、情報処理装置100は随時、履歴情報に基づいてユーザUの検索行動に関する特徴情報を抽出する(ステップS4)。特徴情報は、前述した選択までの経過時間に関する特徴や、検索行動に際してのコンテキストに関する特徴を含む。 Then, the information processing apparatus 100 extracts feature information regarding the search behavior of the user U based on the history information at any time (step S4). The feature information includes the feature regarding the elapsed time until the selection described above and the feature regarding the context in the search behavior.

これら特徴は、例えば統計的な特徴である。情報処理装置100は、例えば前述の経過時間の標準偏差を抽出する。例えば、図1には、情報処理装置100が、経過時間の中央値μに対する標準偏差σを抽出した例を示している。また、情報処理装置100は、例えば前述のコンテキストの分布を抽出する。 These features are, for example, statistical features. The information processing apparatus 100 extracts, for example, the standard deviation of the elapsed time described above. For example, FIG. 1 shows an example in which the information processing apparatus 100 extracts the standard deviation σ with respect to the median μ of the elapsed time. Further, the information processing apparatus 100 extracts, for example, the above-mentioned context distribution.

そして、情報処理装置100は、抽出された時系列上の特徴情報の変化に基づいて、クエリ間、すなわち第1クエリと第2クエリとの間の関係性を推定する(ステップS5)。 Then, the information processing apparatus 100 estimates the relationship between the queries, that is, between the first query and the second query, based on the change in the extracted feature information on the time series (step S5).

具体的には、図3に示すように、情報処理装置100は、例えば経過時間のばらつき度合いが小さい間は、第1クエリと第2クエリとの関係性が高いと推定する。すなわち、情報処理装置100は、第1クエリが第2クエリの誤記であると推定する。 Specifically, as shown in FIG. 3, the information processing apparatus 100 estimates that the relationship between the first query and the second query is high, for example, while the degree of variation in the elapsed time is small. That is, the information processing apparatus 100 estimates that the first query is an error in the second query.

また、情報処理装置100は、例えば経過時間のばらつき度合いが大きくなると、第1クエリと第2クエリとの関係性が低いと推定する。すなわち、情報処理装置100は、第1クエリが第2クエリの誤記でなく、新規のワードであると推定する。これにより、情報処理装置100は、例えば前述の第2クエリの誤記候補から第1クエリを除外することができる。 Further, the information processing apparatus 100 estimates that the relationship between the first query and the second query is low, for example, when the degree of variation in the elapsed time becomes large. That is, the information processing apparatus 100 estimates that the first query is not an error in the second query, but a new word. Thereby, the information processing apparatus 100 can exclude the first query from, for example, the above-mentioned error candidate of the second query.

また、情報処理装置100は、例えばコンテキストの分布のばらつき度合いが小さい間は、第1クエリと第2クエリとの関係性が高いと推定する。すなわち、情報処理装置100は、この場合、ユーザUの検索行動の際のコンテキストが例えば一様であり、これまでの既知の用法により、第1クエリが用いられていると推定する。したがって、第1クエリが第2クエリの誤記である場合を含む。 Further, the information processing apparatus 100 estimates that the relationship between the first query and the second query is high, for example, while the degree of variation in the context distribution is small. That is, in this case, the information processing apparatus 100 estimates that the context of the user U's search behavior is uniform, and that the first query is used according to the known usage so far. Therefore, the case where the first query is an error of the second query is included.

また、情報処理装置100は、例えばコンテキストの分布のばらつき度合いが大きくなると、第1クエリと第2クエリとの関係性が低いと推定する。すなわち、情報処理装置100は、既知の用法とは異なる新規の用法で用いられていると推定する。したがって、第1クエリが第2クエリの誤記でなく、新規のワードとして入力される場合を含む。 Further, the information processing apparatus 100 estimates that the relationship between the first query and the second query is low, for example, when the degree of variation in the context distribution becomes large. That is, it is presumed that the information processing apparatus 100 is used in a new usage different from the known usage. Therefore, the case where the first query is input as a new word instead of the typographical error of the second query is included.

このように、新規の用法で用いられていることを推定できる、言い換えれば、特定の文字列に新たな特徴が表出してくるのを検出できることによって、ターゲティング等の各種分析や、いわゆる「バズる」といった事象発生の検出等に活用することができる。 In this way, it is possible to presume that it is used in a new usage, in other words, by being able to detect that a new feature appears in a specific character string, various analyzes such as targeting and so-called "buzz" It can be used to detect the occurrence of an event such as ".

上述したように、実施形態に係る情報処理方法では、ユーザUによって入力された第1クエリによる検索要求に基づいて第1クエリとは異なる第2クエリを用いた検索結果が提供された場合のユーザUの検索行動に関する履歴情報を取得し、取得された履歴情報に基づいて検索行動に際してのコンテキストを含む検索行動の特徴情報を抽出し、抽出された特徴情報の変化に基づいて、第1クエリと第2クエリとの間の関係性を推定する。 As described above, in the information processing method according to the embodiment, the user when the search result using the second query different from the first query is provided based on the search request by the first query input by the user U. The history information about the search behavior of U is acquired, the feature information of the search behavior including the context of the search behavior is extracted based on the acquired history information, and the first query and the first query are based on the change of the extracted feature information. Estimate the relationship with the second query.

したがって、実施形態に係る情報処理方法によれば、クエリ間の関係性を適切に推定することができる。 Therefore, according to the information processing method according to the embodiment, the relationship between the queries can be appropriately estimated.

以下、上記のような情報処理を行う情報処理装置100、および、かかる情報処理装置100を含む情報処理システム1について詳細に説明する。 Hereinafter, the information processing apparatus 100 that performs the above-mentioned information processing and the information processing system 1 including the information processing apparatus 100 will be described in detail.

〔2.情報処理システム1の構成〕
次に、図4を用いて、実施形態に係る情報処理システム1の構成について説明する。図4は、実施形態に係る情報処理システム1の構成例を示す図である。図4に例示するように、実施形態に係る情報処理システム1は、複数のユーザ端末10-1~10-nと、情報処理装置100と、を含む。
[2. Configuration of information processing system 1]
Next, the configuration of the information processing system 1 according to the embodiment will be described with reference to FIG. FIG. 4 is a diagram showing a configuration example of the information processing system 1 according to the embodiment. As illustrated in FIG. 4, the information processing system 1 according to the embodiment includes a plurality of user terminals 10-1 to 10-n and an information processing apparatus 100.

これらの各種装置は、ネットワークNを介して、有線または無線により通信可能に接続される。ネットワークNは、LAN(Local Area Network)、WAN(Wide Area Network)、電話網(携帯電話網、固定電話網等)、地域IP(Internet Protocol)網、インターネット等の通信ネットワークである。ネットワークNには、有線ネットワークが含まれていてもよいし、無線ネットワークが含まれていてもよい。 These various devices are connected so as to be communicable by wire or wirelessly via the network N. The network N is a communication network such as a LAN (Local Area Network), a WAN (Wide Area Network), a telephone network (mobile telephone network, fixed telephone network, etc.), a regional IP (Internet Protocol) network, and the Internet. The network N may include a wired network or may include a wireless network.

ユーザ端末10は、上記したように、ユーザUによって利用される端末装置である。ユーザ端末10は、例えば、スマートフォンを含む携帯電話機や、タブレット端末や、デスクトップ型PCや、ノート型PCや、PDA(Personal Digital Assistant)等の情報処理装置である。また、ユーザ端末10には、眼鏡型や時計型の情報処理装置であるウェアラブルデバイス(wearable device)も含まれる。 As described above, the user terminal 10 is a terminal device used by the user U. The user terminal 10 is, for example, an information processing device such as a mobile phone including a smartphone, a tablet terminal, a desktop PC, a notebook PC, or a PDA (Personal Digital Assistant). Further, the user terminal 10 also includes a wearable device which is a glasses-type or watch-type information processing device.

ユーザ端末10は、ユーザUによる操作や、ユーザ端末10が有する機能(例えば、検索サービスを利用するためのアプリを実行する機能や、ブラウザ機能等)に応じて各種情報を取得し、取得した情報に応じた情報を生成して送信する。例えば、ユーザ端末10は、ネットワークNを介して、情報処理装置100が提供する検索サービスのサイトへアクセスする。そして、ユーザUが例えば検索したい検索キーワードであるクエリを指定することによって、ユーザ端末10は、情報処理装置100に対してクエリを送信する。 The user terminal 10 acquires various information according to the operation by the user U and the function of the user terminal 10 (for example, a function of executing an application for using a search service, a browser function, etc.), and the acquired information. Generates and sends information according to the above. For example, the user terminal 10 accesses the site of the search service provided by the information processing apparatus 100 via the network N. Then, by designating a query that is a search keyword that the user U wants to search for, for example, the user terminal 10 transmits the query to the information processing apparatus 100.

情報処理装置100は、ユーザ端末10に対し、検索サービスを提供するサービス提供サーバとして機能するサーバ装置である。また、情報処理装置100は、検索サービスの履歴情報に基づいてユーザUの検索行動の特徴情報を抽出するとともに、抽出された特徴情報の変化に基づいてクエリ間の関係性を推定する。 The information processing device 100 is a server device that functions as a service providing server that provides a search service to the user terminal 10. Further, the information processing apparatus 100 extracts the feature information of the search behavior of the user U based on the history information of the search service, and estimates the relationship between the queries based on the change of the extracted feature information.

なお、図4では、1つの情報処理装置100が、検索サービスの提供、特徴情報の抽出、クエリ間の関係性の推定の各機能を兼ね備える場合を示したが、例えば、複数の情報処理装置100が、これらの各機能を分担して行ってもよい。 Note that FIG. 4 shows a case where one information processing device 100 has functions of providing a search service, extracting feature information, and estimating a relationship between queries. For example, a plurality of information processing devices 100 are shown. However, each of these functions may be shared.

〔3.情報処理装置100〕
次に、図5を用いて、情報処理装置100の構成例について説明する。図5は、実施形態に係る情報処理装置100の構成例を示すブロック図である。なお、図5では、情報処理装置100の説明に必要となる構成要素のみを示しており、一般的な構成要素についての記載を省略している。
[3. Information processing device 100]
Next, a configuration example of the information processing apparatus 100 will be described with reference to FIG. FIG. 5 is a block diagram showing a configuration example of the information processing apparatus 100 according to the embodiment. Note that FIG. 5 shows only the components necessary for the explanation of the information processing apparatus 100, and the description of general components is omitted.

図5に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、情報処理装置100は、情報処理装置100を利用する管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。 As shown in FIG. 5, the information processing apparatus 100 includes a communication unit 110, a storage unit 120, and a control unit 130. The information processing device 100 includes an input unit (for example, a keyboard, a mouse, etc.) that receives various operations from an administrator or the like who uses the information processing device 100, and a display unit (for example, a liquid crystal display, etc.) for displaying various information. ) May have.

(通信部110について)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。通信部110は、ネットワークNと有線または無線で接続され、ネットワークNを介して、ユーザ端末10との間で情報の送受信を行う。
(About communication unit 110)
The communication unit 110 is realized by, for example, a NIC (Network Interface Card) or the like. The communication unit 110 is connected to the network N by wire or wirelessly, and transmits / receives information to / from the user terminal 10 via the network N.

(記憶部120について)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現され、図5の例では、記憶部120は、履歴情報記憶部121と、特徴情報記憶部122と、推定情報記憶部123とを有する。
(About the storage unit 120)
The storage unit 120 is realized by, for example, a semiconductor memory element such as a RAM (Random Access Memory) or a flash memory (Flash Memory), or a storage device such as a hard disk or an optical disk. In the example of FIG. 5, the storage unit 120 is a storage unit 120. It has a history information storage unit 121, a feature information storage unit 122, and an estimation information storage unit 123.

(履歴情報記憶部121)
履歴情報記憶部121は、後述する取得部131によって取得されるユーザUの検索行動の履歴に関する各種情報、すなわち上述した履歴情報を記憶する。したがって、履歴情報記憶部121は、例えば、ユーザUが入力した第1クエリによる検索が要求された第1時点から、ユーザUに第1クエリとは異なる第2クエリを用いた検索結果を提供し、ユーザUによりその検索結果が選択された第2時点までの経過時間を記憶する。また、履歴情報記憶部121は、例えば、ユーザUの検索行動から推定されるコンテキストを記憶する。
(History information storage unit 121)
The history information storage unit 121 stores various information regarding the history of the search behavior of the user U acquired by the acquisition unit 131 described later, that is, the above-mentioned history information. Therefore, the history information storage unit 121 provides the user U with a search result using a second query different from the first query from the first time point when the search by the first query input by the user U is requested, for example. , The elapsed time up to the second time point when the search result is selected by the user U is stored. Further, the history information storage unit 121 stores, for example, the context estimated from the search behavior of the user U.

(特徴情報記憶部122)
特徴情報記憶部122は、後述する抽出部132によって抽出されるユーザUの検索行動に関する特徴情報を記憶する。特徴情報は、上述したように、前述の経過時間に関する統計的な特徴や、コンテキストに関する統計的な特徴を含む。
(Characteristic information storage unit 122)
The feature information storage unit 122 stores feature information related to the search behavior of the user U extracted by the extraction unit 132, which will be described later. As described above, the feature information includes the above-mentioned statistical features related to elapsed time and statistical features related to context.

(推定情報記憶部123)
推定情報記憶部123は、後述する推定部133によって推定された推定結果に関する情報を記憶する。例えば、推定情報記憶部123は、新たなワードとして推定した新単語を記憶する。また、例えば、推定情報記憶部123は、推定した新たな用法を単語(新単語を含む)に対応付けて記憶する。
(Estimated information storage unit 123)
The estimation information storage unit 123 stores information regarding the estimation result estimated by the estimation unit 133, which will be described later. For example, the estimation information storage unit 123 stores a new word estimated as a new word. Further, for example, the estimation information storage unit 123 stores the estimated new usage in association with a word (including a new word).

(制御部130について)
制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報処理装置100内部の記憶装置に記憶されている各種プログラム(情報処理プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、コントローラであり、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
(About control unit 130)
The control unit 130 is a controller, and for example, various programs (information processing programs) stored in a storage device inside the information processing device 100 by a CPU (Central Processing Unit), an MPU (Micro Processing Unit), or the like. (Corresponding to one example) is realized by executing RAM as a work area. Further, the control unit 130 is, for example, a controller, and is realized by an integrated circuit such as an ASIC (Application Specific Integrated Circuit) or an FPGA (Field Programmable Gate Array).

図5に示すように、制御部130は、取得部131と、抽出部132と、推定部133と、処理部134と、提供部135とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図5に示した構成に限られず、後述する情報処理を行うことができる構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、図5に示した接続関係に限られず、他の接続関係であってもよい。 As shown in FIG. 5, the control unit 130 includes an acquisition unit 131, an extraction unit 132, an estimation unit 133, a processing unit 134, and a provision unit 135, and has functions and operations of information processing described below. Realize or execute. The internal configuration of the control unit 130 is not limited to the configuration shown in FIG. 5, and may be any other configuration as long as it can perform information processing described later. Further, the connection relationship of each processing unit included in the control unit 130 is not limited to the connection relationship shown in FIG. 5, and may be another connection relationship.

制御部130は、ユーザUによって入力された第1クエリによる検索要求に基づいて第1クエリとは異なる第2クエリを用いた検索結果が提供された場合のユーザUの検索行動に関する履歴情報を取得し、取得された履歴情報に基づいて検索行動に際してのコンテキストを含む検索行動の特徴情報を抽出し、抽出された特徴情報の変化に基づいて、第1クエリと第2クエリとの間の関係性を推定する。 The control unit 130 acquires history information regarding the search behavior of the user U when a search result using a second query different from the first query is provided based on the search request by the first query input by the user U. Then, based on the acquired history information, the characteristic information of the search behavior including the context of the search behavior is extracted, and the relationship between the first query and the second query is based on the change of the extracted characteristic information. To estimate.

(取得部131について)
取得部131は、ユーザUによって入力された第1クエリによる検索要求に基づいて第1クエリとは異なる第2クエリを用いた検索結果が提供された場合のユーザUの検索行動に関する履歴情報を取得する。
(About acquisition unit 131)
The acquisition unit 131 acquires history information regarding the search behavior of the user U when a search result using a second query different from the first query is provided based on the search request by the first query input by the user U. do.

具体的には、取得部131は、通信部110を介して、ユーザUによって入力された第1クエリによる検索要求を取得する。また、取得部131は、通信部110を介して、ユーザUによって選択された検索結果を取得する。また、取得部131は、通信部110を介して履歴情報を取得し、履歴情報記憶部121へ記憶させる。 Specifically, the acquisition unit 131 acquires the search request by the first query input by the user U via the communication unit 110. Further, the acquisition unit 131 acquires the search result selected by the user U via the communication unit 110. Further, the acquisition unit 131 acquires the history information via the communication unit 110 and stores it in the history information storage unit 121.

(抽出部132について)
抽出部132は、履歴情報記憶部121へ記憶された履歴情報に基づいて、ユーザUの検索行動に際してのコンテキストを含む検索行動の特徴情報を抽出する。
(About the extraction unit 132)
The extraction unit 132 extracts the characteristic information of the search behavior including the context in the search behavior of the user U based on the history information stored in the history information storage unit 121.

抽出部132は、例えば前述の経過時間の標準偏差を抽出する。また、抽出部132は、例えば前述のコンテキストの分布を抽出する。コンテキストの分布については、図6~図8を用いた説明で後述する。また、抽出部132は、抽出された特徴情報を特徴情報記憶部122へ記憶させる。 The extraction unit 132 extracts, for example, the standard deviation of the elapsed time described above. Further, the extraction unit 132 extracts, for example, the above-mentioned context distribution. The distribution of the context will be described later with reference to FIGS. 6 to 8. Further, the extraction unit 132 stores the extracted feature information in the feature information storage unit 122.

(推定部133について)
推定部133は、特徴情報記憶部122へ記憶された特徴情報の変化に基づいて、第1クエリと第2クエリとの間の関係性を推定する。また、推定部133は、推定された推定結果に関する情報を推定情報記憶部123へ記憶させる。
(About estimation unit 133)
The estimation unit 133 estimates the relationship between the first query and the second query based on the change in the feature information stored in the feature information storage unit 122. Further, the estimation unit 133 stores information about the estimated estimation result in the estimation information storage unit 123.

ここで、推定部133が実行する推定処理について、より具体的に説明する。図6は、実施形態に係る推定処理の処理説明図(その1)である。また、図7は、実施形態に係る推定処理の処理説明図(その2)である。また、図8は、実施形態に係る推定処理の処理説明図(その3)である。 Here, the estimation process executed by the estimation unit 133 will be described more specifically. FIG. 6 is a process explanatory diagram (No. 1) of the estimation process according to the embodiment. Further, FIG. 7 is a process explanatory diagram (No. 2) of the estimation process according to the embodiment. Further, FIG. 8 is a process explanatory diagram (No. 3) of the estimation process according to the embodiment.

なお、図6~図8を用いた説明では、上述したコンテキストの分布に基づいてクエリ間の関係性を推定する場合について説明する。 In the description using FIGS. 6 to 8, a case where the relationship between queries is estimated based on the above-mentioned context distribution will be described.

図6に示すように、例えば既知のメディア作品に関する既知のワード「鬼滅の巨人」があり、これに対する第1クエリとして「撲滅の巨人」があるものとする。当初、「撲滅の巨人」は、「鬼滅の巨人」の誤記候補であるものとする。 As shown in FIG. 6, for example, it is assumed that there is a known word "Kimetsu no Giant" regarding a known media work, and there is "Eradication Giant" as the first query for this. Initially, the "Giant of Eradication" is assumed to be a false candidate for the "Giant of Demon".

かかる場合に、第1クエリ「撲滅の巨人」が入力されたユーザUの検索行動から推定されるコンテキスト群が、図7に示すように、時点T1においては、年齢「10代」、性別「男性および女性」、職業「学生」、検索時間帯「「鬼滅の巨人」の放送時間帯」、位置情報「全国各地」等であったとする。 In such a case, the context group estimated from the search behavior of the user U to which the first query "Giant of Eradication" is input is, as shown in FIG. 7, at the time point T1, the age "teen" and the gender "male". And women, profession "student", search time zone "broadcast time zone of" demon giant "", location information "all over the country", etc.

一方、同図に示すように、時点T1より後の時点T2においては、年齢「20代以上」、性別「男性および女性」、職業「社会人」、検索時間帯「B県警の「事故撲滅の巨人」キャンペーンCM放送後」、位置情報「B県」等であったとする。なお、時点T1から時点T2の間は通常、ある程度の日数が空く場合が多い。 On the other hand, as shown in the figure, at time point T2 after time point T1, age "20s or older", gender "male and female", occupation "worker", search time zone "B prefectural police" accident eradication " It is assumed that "Giants" campaign CM broadcast ", location information" B prefecture ", etc. It should be noted that there is usually a certain number of days between the time point T1 and the time point T2.

推定部133は、これら時点T1,T2のそれぞれにおけるコンテキストの分布を比較することによって、クエリ間の関係性を推定する。なお、同図に示すようにコンテキストの内容およびその変化は多様であり、言い換えればコンテキストは多次元の特徴を有すると言える。 The estimation unit 133 estimates the relationship between queries by comparing the distribution of contexts at each of these time points T1 and T2. As shown in the figure, the contents of the context and its changes are various, in other words, it can be said that the context has multidimensional characteristics.

そこで、推定部133は、例えば機械学習のアルゴリズムを用いた時点T1,T2それぞれにおけるコンテキストの分布を算出する。 Therefore, the estimation unit 133 calculates the distribution of the context at each of the time points T1 and T2 using, for example, a machine learning algorithm.

具体的には、図8に示すように、例えば推定部133は、UMAP(Uniform Manifold Approximation and Projection)を用いた次元削減により、コンテキストの分布を算出する。UMAPは、機械学習による非線形次元圧縮手法であり、リーマン幾何学と代数トポロジーに基づき、高次元空間のデータ構造を保ち、トポロジー間のクロス・エントロピーを最小にしながら低次元のデータに変換する。 Specifically, as shown in FIG. 8, for example, the estimation unit 133 calculates the distribution of the context by dimension reduction using UMAP (Uniform Manifold Approximation and Projection). UMAP is a machine learning non-linear dimensional compression technique that, based on Lehman geometry and algebraic topology, preserves the data structure of high dimensional space and converts it into low dimensional data while minimizing cross-entropy between topologies.

すなわち、推定部133は、かかるUMAPを用いて、時点T1,T2それぞれにおける検索行動のコンテキストの高次元空間における特徴量を、次元削減による低次元表現へ変換する。同図では、推定部133が、コンテキストの高次元空間における特徴量を三次元の低次元空間へ変換して埋め込んだ例を示している。図中の丸印の一つ一つは、それぞれユーザUの検索行動の一つ一つに対応する。 That is, the estimation unit 133 uses the UMAP to convert the feature amount in the high-dimensional space of the context of the search behavior at each of the time points T1 and T2 into a low-dimensional representation by dimension reduction. The figure shows an example in which the estimation unit 133 converts and embeds a feature amount in a high-dimensional space of a context into a three-dimensional low-dimensional space. Each of the circles in the figure corresponds to each of the search actions of the user U.

ここで、同図に示すように、例えばコンテキストの分布が、時点T1においてはある領域R1にまとまっていたが、時点T2においては、領域R1については減少したものの、領域R1とは明らかに異なる領域R2へ新たにまとまって見られるようになったとする。 Here, as shown in the figure, for example, the distribution of the context was gathered in a certain region R1 at the time point T1, but at the time point T2, although the region R1 decreased, the region clearly different from the region R1. It is assumed that the R2 can be seen as a new group.

かかる場合、推定部133は、同図に示す三次元の特徴量空間においてコンテキストの分布のばらつき度合いが大きくなったと判定できるので、第1クエリと第2クエリとの関係性が低いと推定する。すなわち、推定部133は、時点T2における第1クエリ「撲滅巨人」は、既知の用法とは異なる新規の用法で用いられていると推定する。なお、コンテキストの分布のばらつき度合いが大きいか否かは、例えば上述の三次元空間におけるコンテキストの分布の時点T1から時点T2にかけての変化量が、所定の閾値以上である否かによって判定することができる。 In such a case, the estimation unit 133 can determine that the degree of variation in the context distribution has increased in the three-dimensional feature space shown in the figure, and therefore it is estimated that the relationship between the first query and the second query is low. That is, the estimation unit 133 estimates that the first query "eradication giant" at time point T2 is used in a new usage different from the known usage. Whether or not the degree of variation in the context distribution is large can be determined, for example, by whether or not the amount of change in the context distribution from the time point T1 to the time point T2 in the above-mentioned three-dimensional space is equal to or greater than a predetermined threshold value. can.

また、図8を用いた説明では、次元削減のアルゴリズムとしてUMAPを用いる例を挙げたが、用いるアルゴリズムを限定するものではない。例えば他のアルゴリズムとして、主成分分析や、t分布型確率的近傍埋め込み法(t-SNE:t-distributed Stochastic Neighbor Embedding)等を用いてもよい。 Further, in the description using FIG. 8, an example in which UMAP is used as the dimension reduction algorithm is given, but the algorithm to be used is not limited. For example, as another algorithm, principal component analysis, t-distributed Stochastic Neighbor Embedding, or the like may be used.

(処理部134について)
図5の説明に戻る。処理部134は、各種の処理を実行する。処理部134は、ユーザUが入力した第1クエリに基づく検索処理を実行する。処理部134は、ユーザUが入力した第1クエリを用いて検索処理を実行する。また、処理部134は、ユーザUへ提供するコンテンツを含む各種情報を生成する。
(About processing unit 134)
Returning to the description of FIG. The processing unit 134 executes various processes. The processing unit 134 executes a search process based on the first query input by the user U. The processing unit 134 executes the search process using the first query input by the user U. Further, the processing unit 134 generates various information including contents to be provided to the user U.

また、処理部134は、ユーザUが入力した第1クエリとは異なる第2クエリを用いて検索処理を実行する。処理部134は、ユーザUが入力した第1クエリが前述の誤記候補に含まれる場合、第1クエリを、その第1クエリに対応付けられた第2クエリへ変換する。そして、処理部134は、変換後の第2クエリを用いて検索処理を実行する。 Further, the processing unit 134 executes the search process using a second query different from the first query input by the user U. When the first query input by the user U is included in the above-mentioned error candidate, the processing unit 134 converts the first query into the second query associated with the first query. Then, the processing unit 134 executes the search process using the converted second query.

(提供部135について)
提供部135は、通信部110を介して、ユーザ端末10へ各種情報を送信する。提供部135は、ユーザUへ検索サービスを提供する。例えば、提供部135は、処理部134による検索処理の結果である検索結果をユーザ端末10へ送信する。また、提供部135は、処理部134により生成された各種情報をユーザ端末10へ送信する。また、提供部135は、推定部133によって推定された推定結果を情報処理装置100のオペレータ等へ提供する。
(About the provider 135)
The providing unit 135 transmits various information to the user terminal 10 via the communication unit 110. The providing unit 135 provides a search service to the user U. For example, the providing unit 135 transmits the search result, which is the result of the search processing by the processing unit 134, to the user terminal 10. Further, the providing unit 135 transmits various information generated by the processing unit 134 to the user terminal 10. Further, the providing unit 135 provides the estimation result estimated by the estimation unit 133 to the operator of the information processing apparatus 100 and the like.

〔4.情報処理装置100の処理手順〕
次に、実施形態に係る情報処理装置100が実行する処理手順について説明する。図9は、実施形態に係る情報処理装置100が実行する処理手順を示すフローチャートである。
[4. Processing procedure of information processing apparatus 100]
Next, a processing procedure executed by the information processing apparatus 100 according to the embodiment will be described. FIG. 9 is a flowchart showing a processing procedure executed by the information processing apparatus 100 according to the embodiment.

図9に示すように、まず取得部131が、ユーザUによって入力された第1クエリによる検索要求に基づいて第1クエリとは異なる第2クエリを用いた検索結果が提供された場合のユーザUの検索行動に関する履歴情報を取得する(ステップS101)。 As shown in FIG. 9, first, the user U when the acquisition unit 131 provides a search result using a second query different from the first query based on the search request by the first query input by the user U. Acquire history information regarding the search behavior of (step S101).

そして、抽出部132が、取得された履歴情報に基づいて検索行動に際してのコンテキストを含む検索行動の特徴情報を抽出する(ステップS102)。 Then, the extraction unit 132 extracts the characteristic information of the search action including the context in the search action based on the acquired history information (step S102).

そして、推定部133が、抽出された特徴情報の変化に基づいて、第1クエリと第2クエリとの間の関係性を推定する(ステップS103)。そして、処理を終了する。 Then, the estimation unit 133 estimates the relationship between the first query and the second query based on the change in the extracted feature information (step S103). Then, the process is terminated.

〔5.ハードウェア構成〕
上述してきた実施形態に係る情報処理装置100やユーザ端末10は、例えば図10に示すような構成のコンピュータ1000によって実現される。以下、情報処理装置100を例に挙げて説明する。図10は、実施形態に係る情報処理装置100の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU(Central Processing Unit)1100、RAM(Random Access Memory)1200、ROM(Read Only Memory)1300、HDD(Hard Disk Drive)1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、およびメディアインターフェイス(I/F)1700を備える。
[5. Hardware configuration]
The information processing apparatus 100 and the user terminal 10 according to the above-described embodiment are realized by, for example, a computer 1000 having a configuration as shown in FIG. Hereinafter, the information processing apparatus 100 will be described as an example. FIG. 10 is a hardware configuration diagram showing an example of a computer that realizes the functions of the information processing apparatus 100 according to the embodiment. The computer 1000 includes a CPU (Central Processing Unit) 1100, a RAM (Random Access Memory) 1200, a ROM (Read Only Memory) 1300, an HDD (Hard Disk Drive) 1400, a communication interface (I / F) 1500, and an input / output interface (I). It includes a / F) 1600 and a media interface (I / F) 1700.

CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。 The CPU 1100 operates based on a program stored in the ROM 1300 or the HDD 1400, and controls each part. The ROM 1300 stores a boot program executed by the CPU 1100 when the computer 1000 is started, a program depending on the hardware of the computer 1000, and the like.

HDD1400は、CPU1100によって実行されるプログラムおよび当該プログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、通信網500(図4に示したネットワークNに対応)を介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを、通信網500を介して他の機器へ送信する。 The HDD 1400 stores a program executed by the CPU 1100, data used by the program, and the like. The communication interface 1500 receives data from another device via the communication network 500 (corresponding to the network N shown in FIG. 4) and sends the data to the CPU 1100, and the data generated by the CPU 1100 is transmitted to another device via the communication network 500. Send to the device.

CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、および、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを、入出力インターフェイス1600を介して出力装置へ出力する。 The CPU 1100 controls an output device such as a display or a printer, and an input device such as a keyboard or a mouse via the input / output interface 1600. The CPU 1100 acquires data from the input device via the input / output interface 1600. Further, the CPU 1100 outputs the generated data to the output device via the input / output interface 1600.

メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、当該プログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。 The media interface 1700 reads a program or data stored in the recording medium 1800 and provides the program or data to the CPU 1100 via the RAM 1200. The CPU 1100 loads the program from the recording medium 1800 onto the RAM 1200 via the media interface 1700, and executes the loaded program. The recording medium 1800 is, for example, an optical recording medium such as a DVD (Digital Versatile Disc) or PD (Phase change rewritable Disk), a magneto-optical recording medium such as MO (Magneto-Optical disk), a tape medium, a magnetic recording medium, or a semiconductor memory. And so on.

例えば、コンピュータ1000が実施形態に係る情報処理装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の各機能を実現する。また、HDD1400には、記憶部120内のデータが記憶される。コンピュータ1000のCPU1100は、これらのプログラムを、記録媒体1800から読み取って実行するが、他の例として、他の装置から、通信網500を介してこれらのプログラムを取得してもよい。 For example, when the computer 1000 functions as the information processing apparatus 100 according to the embodiment, the CPU 1100 of the computer 1000 realizes each function of the control unit 130 by executing a program loaded on the RAM 1200. Further, the data in the storage unit 120 is stored in the HDD 1400. The CPU 1100 of the computer 1000 reads and executes these programs from the recording medium 1800, but as another example, these programs may be acquired from another device via the communication network 500.

〔6.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
[6. others〕
Further, among the processes described in the above-described embodiment, all or a part of the processes described as being automatically performed can be manually performed, or the processes described as being manually performed can be performed. All or part of it can be done automatically by a known method. In addition, information including processing procedures, specific names, various data and parameters shown in the above documents and drawings can be arbitrarily changed unless otherwise specified. For example, the various information shown in each figure is not limited to the information shown in the figure.

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。 Further, each component of each of the illustrated devices is a functional concept, and does not necessarily have to be physically configured as shown in the figure. That is, the specific form of distribution / integration of each device is not limited to the one shown in the figure, and all or part of them may be functionally or physically distributed / physically in any unit according to various loads and usage conditions. Can be integrated and configured.

例えば、図5に示した取得部131と提供部135とは、統合されてもよい。また、例えば、抽出部132と推定部133とは、統合されてもよい。また、例えば、記憶部120に記憶される情報は、ネットワークNを介して、外部に備えられた所定の記憶装置に記憶されてもよい。 For example, the acquisition unit 131 and the provision unit 135 shown in FIG. 5 may be integrated. Further, for example, the extraction unit 132 and the estimation unit 133 may be integrated. Further, for example, the information stored in the storage unit 120 may be stored in a predetermined storage device provided externally via the network N.

また、上記実施形態では、情報処理装置100が、例えば、ユーザUによって入力された第1クエリによる検索要求に基づいて第1クエリとは異なる第2クエリを用いた検索結果が提供された場合のユーザUの検索行動に関する履歴情報を取得する取得処理と、取得された履歴情報に基づいて検索行動に際してのコンテキストを含む検索行動の特徴情報を抽出する抽出処理と、抽出された特徴情報の変化に基づいて、第1クエリと第2クエリとの間の関係性を推定する推定処理と、を行う例を示した。しかし、上述した情報処理装置100は、取得処理を行う取得装置と、抽出処理を行う抽出装置と、推定処理を行う推定装置とが分離されてもよい。この場合、取得装置は、少なくとも取得部131を有する。抽出装置は、少なくとも抽出部132を有する。推定装置は、少なくとも推定部133を有する。そして、上記の情報処理装置100による処理は、取得装置と、抽出装置と、推定装置との各装置を含む情報処理システム1によって実現される。 Further, in the above embodiment, when the information processing apparatus 100 is provided with a search result using a second query different from the first query based on the search request by the first query input by the user U, for example. For acquisition processing to acquire history information related to the search behavior of user U, extraction processing to extract feature information of the search behavior including the context of the search behavior based on the acquired history information, and change of the extracted feature information. Based on this, an example of performing estimation processing for estimating the relationship between the first query and the second query is shown. However, in the information processing device 100 described above, the acquisition device that performs the acquisition process, the extraction device that performs the extraction process, and the estimation device that performs the estimation process may be separated. In this case, the acquisition device has at least the acquisition unit 131. The extraction device has at least an extraction unit 132. The estimation device has at least an estimation unit 133. The processing by the information processing device 100 is realized by the information processing system 1 including the acquisition device, the extraction device, and the estimation device.

また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。 Further, the above-described embodiments and modifications can be appropriately combined as long as the processing contents do not contradict each other.

〔7.効果〕
実施形態に係る情報処理装置100は、取得部131と、抽出部132と、推定部133とを備える。取得部131は、ユーザUによって入力された第1クエリによる検索要求に基づいて第1クエリとは異なる第2クエリを用いた検索結果が提供された場合のユーザUの検索行動に関する履歴情報を取得する。抽出部132は、取得部131によって取得された履歴情報に基づいて上記検索行動に際してのコンテキストを含む上記検索行動の特徴情報を抽出する。推定部133は、抽出部132によって抽出された特徴情報の変化に基づいて、第1クエリと第2クエリとの間の関係性を推定する。
[7. effect〕
The information processing apparatus 100 according to the embodiment includes an acquisition unit 131, an extraction unit 132, and an estimation unit 133. The acquisition unit 131 acquires history information regarding the search behavior of the user U when a search result using a second query different from the first query is provided based on the search request by the first query input by the user U. do. The extraction unit 132 extracts the feature information of the search behavior including the context for the search behavior based on the history information acquired by the acquisition unit 131. The estimation unit 133 estimates the relationship between the first query and the second query based on the change in the feature information extracted by the extraction unit 132.

したがって、実施形態に係る情報処理装置100によれば、クエリ間の関係性を適切に推定することができる。 Therefore, according to the information processing apparatus 100 according to the embodiment, the relationship between queries can be appropriately estimated.

また、推定部133は、特徴情報に含まれる上記検索行動に関する統計的な特徴の時系列上の変化に基づいて、第1クエリと第2クエリとの間の関係性を推定する。 In addition, the estimation unit 133 estimates the relationship between the first query and the second query based on the time-series changes in the statistical features related to the search behavior included in the feature information.

したがって、実施形態に係る情報処理装置100によれば、統計的な特徴の時系列上の変化に基づいて、クエリ間の関係性を適切に推定することができる。 Therefore, according to the information processing apparatus 100 according to the embodiment, the relationship between queries can be appropriately estimated based on the time-series changes in statistical features.

また、推定部133は、特徴情報に含まれるコンテキストの分布のばらつき度合いに基づいて、第1クエリと第2クエリとの間の関係性を推定する。 Further, the estimation unit 133 estimates the relationship between the first query and the second query based on the degree of variation in the distribution of the context included in the feature information.

したがって、実施形態に係る情報処理装置100によれば、コンテキストの分布のばらつき度合いに基づいて、クエリ間の関係性を適切に推定することができる。 Therefore, according to the information processing apparatus 100 according to the embodiment, the relationship between queries can be appropriately estimated based on the degree of variation in the distribution of the context.

また、推定部133は、時点T1(「第1時点」の一例に相当)における上記ばらつき度合いと、時点T1よりも後の時点T2(「第2時点」の一例に相当)における上記ばらつき度合いとを比較することによって、第1クエリと第2クエリとの間の関係性を推定する。 Further, the estimation unit 133 determines the degree of variation at the time point T1 (corresponding to an example of the "first time point") and the degree of variation at the time point T2 after the time point T1 (corresponding to an example of the "second time point"). Estimate the relationship between the first query and the second query by comparing.

したがって、実施形態に係る情報処理装置100によれば、時点T1における上記ばらつき度合いと、時点T2における上記ばらつき度合いとの比較により、クエリ間の関係性を適切に推定することができる。 Therefore, according to the information processing apparatus 100 according to the embodiment, the relationship between the queries can be appropriately estimated by comparing the degree of variation at the time point T1 with the degree of variation at the time point T2.

また、推定部133は、時点T1から時点T2にかけての上記ばらつき度合いの変化量が所定の閾値以上である場合に、第1クエリが既知の用法とは異なる新規の用法で用いられていると推定する。 Further, the estimation unit 133 estimates that the first query is used in a new usage different from the known usage when the amount of change in the degree of variation from the time point T1 to the time point T2 is equal to or more than a predetermined threshold value. do.

したがって、実施形態に係る情報処理装置100によれば、上記ばらつき度合いに基づいて、第1クエリが既知の用法とは異なる新規の用法で用いられていると推定することができる。また、特定の文字列に新たな特徴が表出してくるのを検出できることによって、ターゲティング等の各種分析や、いわゆる「バズる」といった事象発生の検出等に活用することができる。 Therefore, according to the information processing apparatus 100 according to the embodiment, it can be estimated that the first query is used in a new usage different from the known usage based on the above degree of variation. In addition, by being able to detect the appearance of a new feature in a specific character string, it can be utilized for various analyzes such as targeting and detection of the occurrence of an event such as so-called "buzz".

以上、本願の実施形態を図面に基づいて詳細に説明したが、これは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。 The embodiments of the present application have been described in detail with reference to the drawings, but this is an example, and various modifications and improvements are made based on the knowledge of those skilled in the art, including the embodiments described in the disclosure column of the invention. It is possible to carry out the present invention in other forms described above.

また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。 Further, the above-mentioned "section, module, unit" can be read as "means" or "circuit". For example, the acquisition unit can be read as an acquisition means or an acquisition circuit.

1 情報処理システム
10 ユーザ端末
100 情報処理装置
110 通信部
120 記憶部
121 履歴情報記憶部
122 特徴情報記憶部
123 推定情報記憶部
130 制御部
131 取得部
132 抽出部
133 推定部
134 処理部
135 提供部
1 Information processing system 10 User terminal 100 Information processing device 110 Communication unit 120 Storage unit 121 History information storage unit 122 Feature information storage unit 123 Estimated information storage unit 130 Control unit 131 Acquisition unit 132 Extraction unit 133 Estimating unit 134 Processing unit 135 Providing unit

Claims (7)

ユーザによって入力された第1クエリによる検索要求に基づいて前記第1クエリとは異なる第2クエリを用いた検索結果が提供された場合の前記ユーザの検索行動に関する履歴情報を取得する取得部と、
前記取得部によって取得された前記履歴情報に基づいて前記検索行動に際してのコンテキストを含む前記検索行動の特徴情報を抽出する抽出部と、
前記抽出部によって抽出された前記特徴情報の変化に基づいて、前記第1クエリと前記第2クエリとの間の関係性を推定する推定部と
を備えることを特徴とする情報処理装置。
An acquisition unit that acquires history information regarding the user's search behavior when a search result using a second query different from the first query is provided based on a search request by the first query input by the user.
An extraction unit that extracts characteristic information of the search behavior including a context for the search behavior based on the history information acquired by the acquisition unit, and an extraction unit.
An information processing apparatus including an estimation unit that estimates a relationship between the first query and the second query based on a change in the feature information extracted by the extraction unit.
前記推定部は、
前記特徴情報に含まれる前記検索行動に関する統計的な特徴の時系列上の変化に基づいて、前記第1クエリと前記第2クエリとの間の関係性を推定する
ことを特徴とする請求項1に記載の情報処理装置。
The estimation unit
Claim 1 is characterized in that the relationship between the first query and the second query is estimated based on the time-series changes in the statistical features of the search behavior included in the feature information. The information processing device described in.
前記推定部は、
前記特徴情報に含まれる前記コンテキストの分布のばらつき度合いに基づいて、前記第1クエリと前記第2クエリとの間の関係性を推定する
ことを特徴とする請求項2に記載の情報処理装置。
The estimation unit
The information processing apparatus according to claim 2, wherein the relationship between the first query and the second query is estimated based on the degree of variation in the distribution of the context included in the feature information.
前記推定部は、
第1時点における前記ばらつき度合いと、前記第1時点よりも後の第2時点における前記ばらつき度合いとを比較することによって、前記第1クエリと前記第2クエリとの間の関係性を推定する
ことを特徴とする請求項3に記載の情報処理装置。
The estimation unit
To estimate the relationship between the first query and the second query by comparing the degree of variation at the first time point with the degree of variation at the second time point after the first time point. The information processing apparatus according to claim 3.
前記推定部は、
前記第1時点から前記第2時点にかけての前記ばらつき度合いの変化量が所定の閾値以上である場合に、前記第1クエリが既知の用法とは異なる新規の用法で用いられていると推定する
ことを特徴とする請求項4に記載の情報処理装置。
The estimation unit
When the amount of change in the degree of variation from the first time point to the second time point is equal to or greater than a predetermined threshold value, it is estimated that the first query is used in a new usage different from the known usage. The information processing apparatus according to claim 4.
コンピュータが実行する情報処理方法であって、
ユーザによって入力された第1クエリによる検索要求に基づいて前記第1クエリとは異なる第2クエリを用いた検索結果が提供された場合の前記ユーザの検索行動に関する履歴情報を取得する取得工程と、
前記取得工程において取得された前記履歴情報に基づいて前記検索行動に際してのコンテキストを含む前記検索行動の特徴情報を抽出する抽出工程と、
前記抽出工程において抽出された前記特徴情報の変化に基づいて、前記第1クエリと前記第2クエリとの間の関係性を推定する推定工程と
を含むことを特徴とする情報処理方法。
It is an information processing method executed by a computer.
An acquisition process for acquiring history information regarding the user's search behavior when a search result using a second query different from the first query is provided based on a search request by the first query input by the user.
An extraction step of extracting characteristic information of the search behavior including a context for the search behavior based on the history information acquired in the acquisition step, and an extraction step.
An information processing method comprising an estimation step of estimating a relationship between the first query and the second query based on a change in the feature information extracted in the extraction step.
ユーザによって入力された第1クエリによる検索要求に基づいて前記第1クエリとは異なる第2クエリを用いた検索結果が提供された場合の前記ユーザの検索行動に関する履歴情報を取得する取得手順と、
前記取得手順によって取得された前記履歴情報に基づいて前記検索行動に際してのコンテキストを含む前記検索行動の特徴情報を抽出する抽出手順と、
前記抽出手順によって抽出された前記特徴情報の変化に基づいて、前記第1クエリと前記第2クエリとの間の関係性を推定する推定手順と
をコンピュータに実行させることを特徴とする情報処理プログラム。
An acquisition procedure for acquiring history information regarding the user's search behavior when a search result using a second query different from the first query is provided based on a search request by the first query input by the user, and an acquisition procedure.
An extraction procedure for extracting characteristic information of the search behavior including a context for the search behavior based on the history information acquired by the acquisition procedure, and an extraction procedure.
An information processing program characterized by causing a computer to execute an estimation procedure for estimating a relationship between the first query and the second query based on a change in the feature information extracted by the extraction procedure. ..
JP2021034630A 2021-03-04 2021-03-04 Information processing equipment, information processing methods and information processing programs Active JP7008152B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021034630A JP7008152B1 (en) 2021-03-04 2021-03-04 Information processing equipment, information processing methods and information processing programs

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021034630A JP7008152B1 (en) 2021-03-04 2021-03-04 Information processing equipment, information processing methods and information processing programs

Publications (2)

Publication Number Publication Date
JP7008152B1 true JP7008152B1 (en) 2022-01-25
JP2022135055A JP2022135055A (en) 2022-09-15

Family

ID=80629619

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021034630A Active JP7008152B1 (en) 2021-03-04 2021-03-04 Information processing equipment, information processing methods and information processing programs

Country Status (1)

Country Link
JP (1) JP7008152B1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040254920A1 (en) * 2003-06-16 2004-12-16 Brill Eric D. Systems and methods that employ a distributional analysis on a query log to improve search results
JP2011044122A (en) * 2009-07-23 2011-03-03 Rakuten Inc Device, method and program for processing information for presenting appropriate search query
JP2011085992A (en) * 2009-10-13 2011-04-28 Nippon Telegr & Teleph Corp <Ntt> Device, method and program for retrieving document
JP2011253506A (en) * 2010-06-04 2011-12-15 Yahoo Japan Corp Related burst query extraction device and method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040254920A1 (en) * 2003-06-16 2004-12-16 Brill Eric D. Systems and methods that employ a distributional analysis on a query log to improve search results
JP2011044122A (en) * 2009-07-23 2011-03-03 Rakuten Inc Device, method and program for processing information for presenting appropriate search query
JP2011085992A (en) * 2009-10-13 2011-04-28 Nippon Telegr & Teleph Corp <Ntt> Device, method and program for retrieving document
JP2011253506A (en) * 2010-06-04 2011-12-15 Yahoo Japan Corp Related burst query extraction device and method

Also Published As

Publication number Publication date
JP2022135055A (en) 2022-09-15

Similar Documents

Publication Publication Date Title
JP6415619B2 (en) Analysis device, analysis method, and program
US20160026643A1 (en) Presenting suggested facets
JP5905551B1 (en) Information processing device, terminal device, information processing method, and information processing program
JP2018156429A (en) Information processing device, information processing method, and program
US20210142196A1 (en) Digital content classification and recommendation based upon artificial intelligence reinforcement learning
JP2014518418A (en) System and method for recommending fonts
JP2018504686A (en) Method and apparatus for processing search data
JP6407318B2 (en) Information processing device, terminal device, information processing method, and information processing program
JP2020035167A (en) Device, method, and program for processing information
JP6818717B2 (en) Extractor, extraction method, and extraction program
JP7008152B1 (en) Information processing equipment, information processing methods and information processing programs
JP2016119123A (en) Information processing device, terminal device, information processing method, and information processing program
US20160321259A1 (en) Network insights
US20150169523A1 (en) Smart Scoring And Filtering of User-Annotated Geocoded Datasets
JP2020035219A (en) Device, method, and program for processing information
JP2019185620A (en) Message processor and program
JP7390091B2 (en) Information processing device, information processing method, and information processing program
US10845970B2 (en) Non-transitory computer-readable storage medium for storing program, method, and apparatus of visualizing information on topic for conversation
JP2020035072A (en) Device, method, and program for processing information
JP2019159666A (en) Real estate information providing system
JP2020042607A (en) Information processor, server, information processing method and information processing program
JP2019053682A (en) Information processing apparatus, information processing method, and program
JP7342534B2 (en) Chat programs, devices, and methods
JP7080198B2 (en) Estimator, estimation method and estimation program
JP7144468B2 (en) Information processing device, information processing method and information processing program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211020

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20211020

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211214

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220107

R150 Certificate of patent or registration of utility model

Ref document number: 7008152

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350