JP7440338B2 - Information processing device, information processing method, information processing program, and recording medium - Google Patents

Information processing device, information processing method, information processing program, and recording medium Download PDF

Info

Publication number
JP7440338B2
JP7440338B2 JP2020083510A JP2020083510A JP7440338B2 JP 7440338 B2 JP7440338 B2 JP 7440338B2 JP 2020083510 A JP2020083510 A JP 2020083510A JP 2020083510 A JP2020083510 A JP 2020083510A JP 7440338 B2 JP7440338 B2 JP 7440338B2
Authority
JP
Japan
Prior art keywords
vector
facility
similarity
unit
determination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020083510A
Other languages
Japanese (ja)
Other versions
JP2021179696A (en
Inventor
達司 田川
新太郎 大崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Mapmaster Inc
Original Assignee
Toyota Mapmaster Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Mapmaster Inc filed Critical Toyota Mapmaster Inc
Priority to JP2020083510A priority Critical patent/JP7440338B2/en
Publication of JP2021179696A publication Critical patent/JP2021179696A/en
Application granted granted Critical
Publication of JP7440338B2 publication Critical patent/JP7440338B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、情報処理装置、情報処理方法、情報処理プログラム及び記録媒体に関する。 The present invention relates to an information processing device, an information processing method, an information processing program, and a recording medium.

従来から、情報を検索する際に、入力された単語の類似度を、特徴ベクトルを利用して取得することが行われている。特許文献1に記載された技術は、検索フレーズから検索対象の単語に関連する特徴語を生成し、特徴語に基づいてデータベースを検索し、検索結果を出力する。特許文献1に記載された技術は、特徴語の代わりとして、入力された単語に関する特徴情報として特徴ベクトルを取得し、特徴ベクトルに対して類似度が高い類似語を取得し、その類似語を利用して検索を行う。 BACKGROUND ART Conventionally, when searching for information, similarity of input words has been obtained using feature vectors. The technology described in Patent Document 1 generates characteristic words related to a search target word from a search phrase, searches a database based on the characteristic words, and outputs the search results. The technology described in Patent Document 1 acquires a feature vector as feature information regarding the input word instead of a feature word, acquires a similar word with a high degree of similarity to the feature vector, and uses the similar word. to search.

特開2019-149145号公報Japanese Patent Application Publication No. 2019-149145

しかしながら、特許文献1に記載された技術のように、特徴ベクトルを利用して単語に類似する類似語を取得して、その類似語に基づいて検索を行うだけでは、ユーザが所望する施設を検索結果として出力することができない可能性がある。例えば、特定の施設を検索する場合でも、種々の業態があり、特に、同一の系列施設であってもサービス内容が異なる場合がある。このため、ユーザが施設を検索する際に、ユーザが所望する施設の検索結果を出力することが望まれている。 However, as with the technology described in Patent Document 1, it is not possible to simply retrieve similar words similar to a word using feature vectors and perform a search based on the similar words. As a result, it may not be possible to output. For example, even when searching for a specific facility, there are various types of business, and in particular, the service content may differ even for the same affiliated facility. Therefore, when a user searches for a facility, it is desired to output search results for the facility desired by the user.

本発明は、施設を検索することができる情報処理装置、情報処理方法、情報処理プログラム及び記録媒体を提供することを目的とする。 An object of the present invention is to provide an information processing device, an information processing method, an information processing program, and a recording medium that can search for facilities.

一態様の情報処理装置は、情報を出力する出力部と、複数の施設に関する1又は複数の情報について分散表現に関する処理を行うことにより生成された第1ベクトルを記憶する記憶部と、検索対象となる施設に関する所定のデータを受け付ける受付部と、受付部によって受け付けた所定のデータに含まれる情報を相対的に高次元のベクトルで表現し、そのベクトルについて第2ベクトルとして生成する生成部と、記憶部に記憶される第1ベクトルと、生成部によって生成される第2ベクトルとの類似度を判定する判定部と、判定部によって判定された類似度が高い順に、その類似度が高い第1ベクトルに対応する施設に関する情報を出力部から出力する出力制御部と、を備える。 An information processing device according to one aspect includes an output unit that outputs information, a storage unit that stores a first vector generated by performing processing related to distributed representation on one or more pieces of information regarding a plurality of facilities, and a search target. a reception unit that receives predetermined data regarding the facility; a generation unit that expresses information included in the predetermined data received by the reception unit as a relatively high-dimensional vector and generates a second vector for the vector; a determination unit that determines the degree of similarity between the first vector stored in the unit and the second vector generated by the generation unit; and a determination unit that determines the similarity between the first vector stored in the unit and the second vector generated by the generation unit; and an output control unit that outputs information regarding the facility corresponding to the output unit from the output unit.

一態様の情報処理装置では、記憶部は、第1ベクトルとして、施設に関する情報として施設の名称について分散表現に関する処理を行うことにより生成された第11ベクトルと、第1ベクトルとして、施設に関する情報としてその施設を説明するための文書について分散表現に関する処理を行うことにより生成された第12ベクトルと、第1ベクトルとして、施設に関する情報としてその施設の画像について分散表現に関する処理を行うことにより生成された第13ベクトルと、を記憶し、判定部は、施設の名称に基づく第11ベクトルと、第2ベクトルとの類似度を判定する第1判定処理部と、第1判定処理部によって類似度が高いと判定された第11ベクトルに対応する施設を説明するための文書に基づく第12ベクトル及びその施設の画像に基づく第13ベクトルのうちの少なくとも一方と、第2ベクトルとの類似度を判定する第2判定処理部と、を備え、出力制御部は、第2判定処理部によって判定された類似度が高い順に、その類似度が高い第2ベクトルに対応する施設に関する情報を出力部から出力することとしてもよい。 In one embodiment of the information processing device, the storage unit includes, as the first vector, an eleventh vector generated by performing processing related to distributed representation on the name of the facility as information regarding the facility, and as the first vector, as information regarding the facility. The twelfth vector is generated by performing processing related to distributed representation on a document for explaining the facility, and the first vector is generated by performing processing related to distributed representation on an image of the facility as information regarding the facility. a 13th vector, and a determination unit that determines the degree of similarity between the 11th vector based on the name of the facility and the second vector; A step of determining the degree of similarity between the second vector and at least one of a twelfth vector based on a document for explaining the facility corresponding to the eleventh vector determined as such and a thirteenth vector based on an image of the facility. 2 determination processing unit, and the output control unit outputs, from the output unit, information regarding facilities corresponding to the second vectors having the highest degrees of similarity in the order of the degree of similarity determined by the second determination processing unit. You can also use it as

一態様の情報処理装置では、記憶部は、第12ベクトル及び第13ベクトルに基づいて、類似度の高い施設をクラスタリングした施設群に関するクラスタリング情報を記憶し、第2判定処理部は、第1判定処理部によって類似度が高いと判定された施設と、クラスタリング情報に基づいて、その施設に対して類似度が高い施設群に対応する第12ベクトル及び第13ベクトルの少なくとも一方のベクトルを記憶部から取得し、そのベクトルと、第2ベクトルとの類似度を判定することとしてもよい。 In one aspect of the information processing device, the storage unit stores clustering information regarding a facility group obtained by clustering highly similar facilities based on the twelfth vector and the thirteenth vector, and the second determination processing unit performs the first determination. At least one of a twelfth vector and a thirteenth vector corresponding to a facility that is determined to have a high degree of similarity by the processing unit and a group of facilities that have a high degree of similarity to that facility based on the clustering information is stored in the storage unit. The vector may be acquired, and the degree of similarity between the vector and the second vector may be determined.

一態様の情報処理装置では、第1判定処理部は、受付部によって所定のデータとして施設に関する文字列データを受け付けた場合、文字列データに記録される文字列と、施設の名称との類似度を判定する第1判定と、第11ベクトルと第2ベクトルとの類似度を判定する第2判定と、を行い、第1判定と第2判定との結果に基づいて、文字列と施設との類似度を取得することとしてもよい。 In one embodiment of the information processing device, when the reception unit receives character string data regarding a facility as predetermined data, the first determination processing unit determines the degree of similarity between the character string recorded in the character string data and the name of the facility. A first judgment for determining the similarity between the 11th vector and the second vector is performed, and based on the results of the first judgment and the second judgment, the relationship between the character string and the facility is determined. It is also possible to obtain the degree of similarity.

一態様の情報処理装置では、受付部は、所定のデータとして、施設に関する文字列データ、及び、施設に関する画像データの少なくとも一方を受け付けることが可能であり、生成部は、受付部によって受け付けた文字列データ及び画像データについて分散表現に関する処理を行うことによって第2ベクトルを生成することとしてもよい。 In one aspect of the information processing device, the reception unit can receive at least one of character string data regarding the facility and image data regarding the facility as the predetermined data, and the generation unit can receive the character string data received by the reception unit. The second vector may be generated by performing processing related to distributed representation on the column data and image data.

一態様の情報処理方法では、出力部を備えるコンピュータが、複数の施設に関する1又は複数の情報について分散表現に関する処理を行うことにより生成された第1ベクトルを記憶部に記憶する記憶ステップと、検索対象となる施設に関する所定のデータを受け付ける受付ステップと、受付ステップによって受け付けた所定のデータに含まれる情報を相対的に高次元のベクトルで表現し、そのベクトルについて第2ベクトルとして生成する生成ステップと、記憶部に記憶される第1ベクトルと、生成ステップによって生成される第2ベクトルとの類似度を判定する判定ステップと、判定ステップによって判定された類似度が高い順に、その類似度が高い第1ベクトルに対応する施設に関する情報を出力部から出力する出力制御ステップと、を実行する。 In one aspect of the information processing method, a storage step in which a computer including an output unit stores in a storage unit a first vector generated by performing processing related to distributed representation on one or more pieces of information regarding a plurality of facilities; a reception step that receives predetermined data regarding the target facility; and a generation step that expresses information included in the predetermined data received by the reception step as a relatively high-dimensional vector and generates a second vector for the vector. , a determination step of determining the degree of similarity between the first vector stored in the storage unit and the second vector generated in the generation step; an output control step of outputting information regarding the facility corresponding to one vector from the output unit.

一態様の情報処理プログラムは、コンピュータに、情報を出力する出力機能と、複数の施設に関する1又は複数の情報について分散表現に関する処理を行うことにより生成された第1ベクトルを記憶する記憶機能と、検索対象となる施設に関する所定のデータを受け付ける受付機能と、受付機能によって受け付けた所定のデータに含まれる情報を相対的に高次元のベクトルで表現し、そのベクトルについて第2ベクトルとして生成する生成機能と、記憶機能に記憶される第1ベクトルと、生成機能によって生成される第2ベクトルとの類似度を判定する判定機能と、判定機能によって判定された類似度が高い順に、その類似度が高い第1ベクトルに対応する施設に関する情報を出力機能から出力する出力制御機能と、を実現させる。
一態様の記録媒体は、上述した一態様の情報処理プログラムを記録した、コンピュータで読み取り可能な非一時的な記録媒体である。
An information processing program in one aspect includes: an output function for outputting information to a computer; a storage function for storing a first vector generated by performing processing related to distributed representation on one or more pieces of information regarding a plurality of facilities; A reception function that accepts predetermined data regarding the facility to be searched, and a generation function that expresses information included in the predetermined data received by the reception function as a relatively high-dimensional vector, and generates a second vector for that vector. and a determination function that determines the degree of similarity between the first vector stored in the storage function and the second vector generated by the generation function; and an output control function that outputs information regarding the facility corresponding to the first vector from the output function.
A recording medium according to one embodiment is a computer-readable non-temporary recording medium on which the information processing program according to one embodiment described above is recorded.

一態様の情報処理装置は、複数の施設に関する1又は複数の情報について分散表現に関する処理を行うことにより生成された第1ベクトルと、検索対象となる施設に関する所定のデータに含まれる情報を相対的に高次元のベクトルで表現し、そのベクトルとしての第2ベクトルとの類似度を判定し、その判定された類似度が高い順に、その類似度が高い第1ベクトルに対応する施設に関する情報を出力するので、施設を検索することができる。
また、一態様の情報処理方法、情報処理プログラム及び記録媒体は、上述した一態様の情報処理装置と同様の効果を奏することができる。
In one embodiment, the information processing device relatively compares a first vector generated by performing processing related to distributed representation on one or more pieces of information regarding a plurality of facilities, and information included in predetermined data regarding a facility to be searched. is expressed as a high-dimensional vector, the degree of similarity between that vector and a second vector is determined, and information regarding the facilities corresponding to the first vector with the highest degree of similarity is output in the order of the determined degree of similarity. Therefore, you can search for facilities.
Further, the information processing method, the information processing program, and the recording medium of one embodiment can achieve the same effects as the information processing device of one embodiment described above.

一実施形態に係る情報処理装置について説明するためのブロック図である。FIG. 1 is a block diagram for explaining an information processing device according to an embodiment. 第1ベクトル(第11ベクトル、第12ベクトル及び第13ベクトル)について説明するための図である。It is a figure for demonstrating the 1st vector (11th vector, 12th vector, and 13th vector). クラスタリング情報について説明するための図である。FIG. 3 is a diagram for explaining clustering information. 一実施形態に係る情報処理方法について説明するためのフローチャートである。1 is a flowchart for explaining an information processing method according to an embodiment.

以下、本発明の一実施形態について説明する。
本明細書では、「情報」の文言を使用しているが、「情報」の文言は「データ」と言い換えることができ、「データ」の文言は「情報」と言い換えることができる。
An embodiment of the present invention will be described below.
Although the wording "information" is used in this specification, the wording "information" can be rephrased as "data" and the wording "data" can be rephrased as "information."

図1は、一実施形態に係る情報処理装置1について説明するためのブロック図である。 FIG. 1 is a block diagram for explaining an information processing device 1 according to an embodiment.

情報処理装置1は、例えば、コンピュータ及びサーバ等の装置である。情報処理装置1は、ユーザによって入力された情報を基に施設を検索する際に、入力された検索条件となる検索情報をベクトル化した第1情報と、施設に関する情報をベクトル化した第2情報との類似度を判定し、判定結果として類似度の高い施設を出力する。 The information processing device 1 is, for example, a device such as a computer and a server. When searching for a facility based on information input by a user, the information processing device 1 generates first information that is vectorized search information that is the input search condition, and second information that is vectorized information about the facility. The degree of similarity between the facility and the facility is determined, and facilities with a high degree of similarity are output as the determination result.

第1情報は、例えば、検索情報(例えば、単語、文書及び画像等)を相対的に高次元のベクトルで表現した、そのベクトルであってもよい。同様に、第2情報は、例えば、施設情報(例えば、施設の名称、施設を説明する文書及び施設の画像等)を相対的に高次元のベクトルで表現した、そのベクトルであってもよい。ここで、各ベクトルは、例えば、分散表現技術により生成されたベクトルであってもよい。 The first information may be, for example, a vector in which search information (eg, words, documents, images, etc.) is expressed as a relatively high-dimensional vector. Similarly, the second information may be, for example, a vector representing facility information (for example, the name of the facility, a document explaining the facility, an image of the facility, etc.) as a relatively high-dimensional vector. Here, each vector may be a vector generated by, for example, a distributed representation technique.

次に、情報処理装置1について詳細に説明する。
情報処理装置1は、入力部16、通信部17、記憶部18、表示部19、受付部12、生成部13、判定部14及び出力制御部15を備える。受付部12、生成部13、判定部14及び出力制御部15は、情報処理装置1の制御部11(例えば、演算処理装置等)の一機能として実現されてもよい。通信部17、記憶部18及び表示部19は、本発明の「出力部」の一実施形態であってもよい。
Next, the information processing device 1 will be explained in detail.
The information processing device 1 includes an input section 16 , a communication section 17 , a storage section 18 , a display section 19 , a reception section 12 , a generation section 13 , a determination section 14 , and an output control section 15 . The reception unit 12, the generation unit 13, the determination unit 14, and the output control unit 15 may be realized as a function of the control unit 11 (for example, an arithmetic processing device, etc.) of the information processing device 1. The communication section 17, the storage section 18, and the display section 19 may be an embodiment of the "output section" of the present invention.

入力部16は、施設を検索するための条件(検索条件)が入力される装置である。一例として、入力部16は、キーボード及びマウス等であってもよい。
なお、入力部16は、情報処理装置1が備える例に限定されず、情報処理装置1の外部に配されてもよい。例えば、入力部16は、ユーザが所有する携帯端末及び情報処理端末(図示せず)であってもよい。携帯端末は、例えば、スマートフォン及びタブレット等であってもよい。情報処理端末は、ラップトップ及びパソコン等のコンピュータ等であってもよい。入力部16が情報処理装置1の外部に配される場合、情報処理装置1は、入力部16によって入力された施設を検索するための条件(検索条件)を、通信ネットワークを介して後述する通信部17で受信することとしてもよい。
The input unit 16 is a device into which conditions for searching for facilities (search conditions) are input. As an example, the input unit 16 may be a keyboard, a mouse, or the like.
Note that the input unit 16 is not limited to the example provided in the information processing device 1, and may be provided outside the information processing device 1. For example, the input unit 16 may be a mobile terminal or an information processing terminal (not shown) owned by the user. The mobile terminal may be, for example, a smartphone, a tablet, or the like. The information processing terminal may be a computer such as a laptop or a personal computer. When the input unit 16 is disposed outside the information processing device 1, the information processing device 1 transmits the conditions (search conditions) for searching for facilities input by the input unit 16 via the communication network, which will be described later. The information may be received by the unit 17.

出力部は、情報を出力する。出力部の具体的な一例としては、上述したように、通信部17、記憶部18及び表示部19であってよい。 The output unit outputs information. A specific example of the output section may be the communication section 17, the storage section 18, and the display section 19, as described above.

通信部17は、情報処理装置1の外部にある装置との間で情報の送受信を行う装置である。例えば、通信部17は、外部にある装置として、外部サーバ、携帯端末及び情報処理端末(いずれも図示せず)との間で通信を行う。 The communication unit 17 is a device that transmits and receives information to and from devices outside the information processing device 1 . For example, the communication unit 17 communicates with an external server, a mobile terminal, and an information processing terminal (all not shown) as external devices.

記憶部18は、例えば、種々の情報及びプログラム等を記憶する装置である。記憶部18は、本実施形態で説明するように情報処理装置1に配されてもよく、情報処理装置1の外部に配されてもよい。記憶部18が情報処理装置1の外部に配される場合、その記憶部18は、例えば、外部サーバ等であってもよい。 The storage unit 18 is, for example, a device that stores various information, programs, and the like. The storage unit 18 may be arranged in the information processing device 1 as described in this embodiment, or may be arranged outside the information processing device 1. When the storage unit 18 is placed outside the information processing device 1, the storage unit 18 may be, for example, an external server.

記憶部18は、複数の施設に関する1又は複数の情報について分散表現に関する処理を行うことにより生成された第1ベクトルを記憶する。分散表現に関する処理とは、情報(例えば、単語、文書及び画像等)を相対的に高次元(一例として、200~300次元等)のベクトルで表現するために、情報に基づいてベクトルを生成する処理である。分散表現は、近い意味を持つ情報を近いベクトルに対応させる技術である。一例として、制御部11は、分散表現に関する処理として、例えば、word2vec、GloVe及びgensim等を利用することにより、相対的に高次元のベクトルを生成することが可能である。 The storage unit 18 stores a first vector generated by performing processing related to distributed representation on one or more pieces of information regarding a plurality of facilities. Distributed representation processing involves generating vectors based on information in order to represent information (for example, words, documents, images, etc.) as relatively high-dimensional (for example, 200 to 300 dimensions) vectors. It is processing. Distributed representation is a technology that associates information with similar meanings with nearby vectors. As an example, the control unit 11 can generate a relatively high-dimensional vector by using, for example, word2vec, GloVe, gensim, etc. as processing related to distributed representation.

図2は、第1ベクトル(第11ベクトル、第12ベクトル及び第13ベクトル)について説明するための図である。
記憶部18は、第1ベクトルとして、第11ベクトル、第12ベクトル及び第13ベクトルを記憶することとしてもよい。第11ベクトルは、第1ベクトルとして、施設に関する情報として施設の名称について分散表現に関する処理を行うことにより生成された施設名称ベクトルである。第12ベクトルは、第1ベクトルとして、施設に関する情報としてその施設を説明するための文書について分散表現に関する処理を行うことにより生成された施設説明ベクトルである。第13ベクトルは、第1ベクトルとして、施設に関する情報としてその施設の画像について分散表現に関する処理を行うことにより生成された施設画像ベクトルである。
FIG. 2 is a diagram for explaining the first vectors (the 11th vector, the 12th vector, and the 13th vector).
The storage unit 18 may store an 11th vector, a 12th vector, and a 13th vector as the first vector. The 11th vector is a facility name vector generated as the first vector by performing processing related to distributed representation on the name of the facility as information regarding the facility. The twelfth vector is a facility description vector generated by performing processing related to distributed representation on a document for explaining the facility as information regarding the facility, as the first vector. The 13th vector is a facility image vector generated as the first vector by performing processing related to distributed representation on an image of the facility as information regarding the facility.

例えば、図2に示すように、制御部11は、施設の名称、施設を説明するための文書、及び、施設の画像それぞれについて分散表現に関する処理を行うことにより、第1ベクトル(第11ベクトル、第12ベクトル及び第13ベクトル)を生成して、記憶部18に記憶することとしてもよい。 For example, as shown in FIG. 2, the control unit 11 performs processing related to distributed representation for each of the name of the facility, the document for explaining the facility, and the image of the facility. A twelfth vector and a thirteenth vector) may be generated and stored in the storage unit 18.

又は、上述したように制御部11が第1ベクトルを生成する代わりに、例えば、情報処理装置1の外部にある装置(例えば、外部サーバ等)が施設の名称、施設を説明するための文書、及び、施設の画像それぞれについて分散表現に関する処理を行うことにより、第1ベクトル(第11ベクトル、第12ベクトル及び第13ベクトル)を生成することとしてもよい。この場合、情報処理装置1は、通信部17を介して外部サーバから第1ベクトルを取得して、記憶部18に記憶することとしてもよい。 Alternatively, instead of the control unit 11 generating the first vector as described above, for example, a device external to the information processing device 1 (for example, an external server, etc.) generates the name of the facility, a document for explaining the facility, Further, the first vectors (the 11th vector, the 12th vector, and the 13th vector) may be generated by performing processing related to distributed representation for each image of the facility. In this case, the information processing device 1 may acquire the first vector from the external server via the communication unit 17 and store it in the storage unit 18.

又は、例えば、外部サーバが本実施形態の記憶部18として機能する場合には、その外部サーバにおいて上述した場合と同様に第1ベクトルを生成し、蓄積することとしてもよい。この場合、例えば、情報処理装置1(例えば、後述する判定部14)は、外部サーバ(記憶部18)から第1ベクトル(第11ベクトル、第12ベクトル及び第13ベクトル)を取得することとしてもよい。 Alternatively, for example, when an external server functions as the storage unit 18 of this embodiment, the first vector may be generated and stored in the external server in the same manner as described above. In this case, for example, the information processing device 1 (for example, the determination unit 14 described later) may acquire the first vector (the 11th vector, the 12th vector, and the 13th vector) from the external server (the storage unit 18). good.

ここで、「施設の名称」は、例えば、施設の店名であってもよい。「施設を説明するための文書」は、例えば、施設で提供するサービス及び商品を説明する文書、施設の業種、施設の営業時間、及び、施設に駐車場が有るか否かの説明等、その施設がどのような施設であるかを具体的又は簡潔に説明する文書であってもよい。「施設の画像」は、例えば、施設の外観の画像、施設の内部の画像、施設が提供するサービス及び商品の画像等、その施設がどのような施設であるかを示す画像(静止画又は動画)であってもよい。 Here, the "name of facility" may be, for example, the store name of the facility. "Documents to explain the facility" include, for example, documents explaining the services and products provided by the facility, the industry of the facility, the business hours of the facility, and an explanation of whether the facility has a parking lot. It may be a document that specifically or concisely explains what kind of facility the facility is. "Facility images" are images that show what kind of facility the facility is, such as images of the exterior of the facility, images of the interior of the facility, images of services and products provided by the facility, etc. (still images or videos). ).

図3は、クラスタリング情報について説明するための図である。
記憶部18は、第12ベクトル及び第13ベクトルに基づいて、類似度の高い施設をクラスタリングした施設群に関するクラスタリング情報を記憶することとしてもよい。
例えば、施設の業種によっては、施設を説明する文書と、施設の画像とが類似する場合がある。具体的な一例としては、施設が「レストラン」の場合には、施設(レストラン)を説明するための文書と、施設の画像(例えば、施設内部及び施設の外観の画像等)とが、複数の施設(レストラン)で共通する(類似する)可能性が高い。
このため、例えば、制御部11は、(共通する)類似する複数の施設をクラスタリングしてクラスタリング情報を生成し(類似する複数の施設で施設群を生成し)、そのクラスタリング情報を記憶部18に記憶することとしてもよい。制御部11は、施設群を複数生成する、すなわち、クラスタリング情報を複数生成してもよい。
より具体的な一例として、図3に示すように、制御部11は、同一の施設の説明文書及び画像それぞれから第12ベクトル及び第13ベクトルを生成する。さらに、制御部11は、類似施設の第12ベクトル及び第13ベクトルをクラスタリングして、クラスタリング情報を生成する。
又は、情報処理装置1の外部にある外部サーバが、上述した制御部11の場合と同様にクラスタリング情報を生成して蓄積することとしてもよい。
FIG. 3 is a diagram for explaining clustering information.
The storage unit 18 may store clustering information regarding a facility group obtained by clustering facilities with high similarity based on the 12th vector and the 13th vector.
For example, depending on the industry of the facility, a document explaining the facility and an image of the facility may be similar. As a specific example, if the facility is a "restaurant," a document explaining the facility (restaurant) and images of the facility (for example, images of the inside of the facility and the exterior of the facility, etc.) There is a high possibility that it will be common (similar) among facilities (restaurants).
Therefore, for example, the control unit 11 clusters a plurality of (common) similar facilities to generate clustering information (generates a facility group with a plurality of similar facilities), and stores the clustering information in the storage unit 18. It can also be memorized. The control unit 11 may generate a plurality of facility groups, that is, may generate a plurality of clustering information.
As a more specific example, as shown in FIG. 3, the control unit 11 generates a 12th vector and a 13th vector from respective explanatory documents and images of the same facility. Furthermore, the control unit 11 clusters the 12th vector and the 13th vector of similar facilities to generate clustering information.
Alternatively, an external server outside the information processing device 1 may generate and accumulate clustering information in the same way as the control unit 11 described above.

なお、施設の業種によっては、施設の名称と、施設を説明する文書と、施設の画像とが類似する場合がある。この場合、制御部11(又は、外部サーバ)は、類似する(共通する)複数の施設(施設群)をクラスタリングしてクラスタリング情報を生成し、そのクラスタリング情報を記憶部18に記憶することとしてもよい。すなわち、記憶部18は、第11ベクトル、第12ベクトル及び第13ベクトルに基づいて、類似度の高い施設をクラスタリングした施設群に関するクラスタリング情報を記憶することとしてもよい。 Note that depending on the industry of the facility, the name of the facility, the document explaining the facility, and the image of the facility may be similar. In this case, the control unit 11 (or external server) may generate clustering information by clustering a plurality of similar (common) facilities (facility group), and store the clustering information in the storage unit 18. good. That is, the storage unit 18 may store clustering information regarding a facility group obtained by clustering facilities with a high degree of similarity based on the 11th vector, the 12th vector, and the 13th vector.

表示部19は、例えば、文字及び画像等を表示することが可能な装置である。 The display unit 19 is, for example, a device that can display characters, images, and the like.

受付部12は、検索対象となる施設に関する所定のデータを受け付ける。受付部12は、所定のデータとして、施設に関する文字列データ、及び、施設に関する画像データの少なくとも一方を受け付けることが可能であってもよい。例えば、受付部12は、入力部16によって入力された検索条件を施設に関する所定のデータとして受け付ける。検索条件は、上述したように、例えば、単語、文書及び画像等のいずれかであってもよい。したがって、検索条件のデータ(所定のデータ)は、例えば、文字列データ及び画像データ等のいずれかであってもよい。なお、文字列データには、複数の文字からなる文字列のデータの他に、1つの文字からなる文字のデータも含まれる。文字には、文字そのものの他に、例えば、記号及び絵文字等が含まれる。 The reception unit 12 receives predetermined data regarding the facility to be searched. The reception unit 12 may be able to receive at least one of character string data regarding the facility and image data regarding the facility as the predetermined data. For example, the reception unit 12 receives search conditions input through the input unit 16 as predetermined data regarding the facility. As described above, the search condition may be, for example, a word, a document, an image, or the like. Therefore, the search condition data (predetermined data) may be, for example, either character string data or image data. Note that the character string data includes not only character string data consisting of a plurality of characters, but also character data consisting of one character. In addition to the characters themselves, the characters include, for example, symbols and pictograms.

生成部13は、受付部12によって受け付けた所定のデータに含まれる情報を相対的に高次元のベクトルで表現し、そのベクトルについて第2ベクトルとして生成する。生成部13は、受付部12によって受け付けた文字列データ及び画像データについて分散表現に関する処理を行うことによって第2ベクトルを生成することとしてもよい。すなわち、生成部13は、検索条件(例えば、単語、文書及び画像等それぞれ)から相対的に高次元のベクトル(第2ベクトル)を生成する。生成部13によって行われる分散表現に関する処理は、第1ベクトルを生成する際の分散表現に関する処理と同様であってもよい。 The generation unit 13 expresses the information included in the predetermined data received by the reception unit 12 as a relatively high-dimensional vector, and generates the vector as a second vector. The generation unit 13 may generate the second vector by performing processing related to distributed representation on the character string data and image data received by the reception unit 12. That is, the generation unit 13 generates a relatively high-dimensional vector (second vector) from the search conditions (for example, words, documents, images, etc.). The processing related to the distributed representation performed by the generation unit 13 may be the same as the processing related to the distributed representation when generating the first vector.

判定部14は、記憶部18に記憶される第1ベクトルと、生成部13によって生成される第2ベクトルとの類似度を判定する。すなわち、判定部14は、第1ベクトル及び第2ベクトルに基づいて、意味合いが類似した施設を抽出する。判定部14は、例えば、第1ベクトルと第2ベクトルとのコサイン類似度及びユークリッド距離等を算出することに基づいて、類似度を判定することとしてもよい。なお、判定部14は、上述した一例に限定されることはなく、種々の方法により類似度を判定することとしてもよい。 The determining unit 14 determines the degree of similarity between the first vector stored in the storage unit 18 and the second vector generated by the generating unit 13. That is, the determination unit 14 extracts facilities with similar meanings based on the first vector and the second vector. The determination unit 14 may determine the degree of similarity based on, for example, calculating the cosine similarity, Euclidean distance, etc. between the first vector and the second vector. Note that the determination unit 14 is not limited to the example described above, and may determine the degree of similarity using various methods.

一例として、判定部14は、第1判定処理部141及び第2判定処理部142を備えることとしてもよい。判定部14は、後述するように、第1判定処理部141によって第11ベクトルと第2ベクトルとの類似度を判定した後、第2判定処理部142によって第12ベクトル及び第13ベクトルと第2ベクトルとの類似度を判定することとしてもよいし、他の手順により類似度を判定することとしてもよい。
他の手順の一例として、判定部14は、第11ベクトル、第12ベクトル及び第13ベクトルと、第2ベクトルとの類似度を一度に判定することとしてもよい。又は、判定部14は、第11ベクトル及び第12ベクトルと第2ベクトルとの類似度を判定することと、第13ベクトルと第2ベクトルとの類似度を判定することとを分けて行うこととしてもよい。又は、判定部14は、第11ベクトル及び第13ベクトルと第2ベクトルとの類似度を判定することと、第12ベクトルと第2ベクトルとの類似度を判定することとを分けて行うこととしてもよい。
As an example, the determination unit 14 may include a first determination processing unit 141 and a second determination processing unit 142. As will be described later, in the determination unit 14, after the first determination processing unit 141 determines the degree of similarity between the eleventh vector and the second vector, the second determination processing unit 142 determines the similarity between the twelfth vector, the thirteenth vector, and the second vector. The degree of similarity with the vector may be determined, or the degree of similarity may be determined using another procedure.
As an example of another procedure, the determining unit 14 may determine the degree of similarity between the 11th vector, the 12th vector, the 13th vector, and the second vector all at once. Alternatively, the determination unit 14 separately determines the degree of similarity between the 11th vector, the 12th vector, and the second vector, and the degree of similarity between the 13th vector and the second vector. Good too. Alternatively, the determination unit 14 separately determines the degree of similarity between the 11th vector, the 13th vector, and the second vector, and the degree of similarity between the 12th vector and the second vector. Good too.

第1判定処理部141は、施設の名称に基づく第11ベクトルと、第2ベクトルとの類似度を判定することとしてもよい。
第1判定処理部141は、後述する第1判定及び第2判定を行い、第1判定と第2判定との結果に基づいて、文字列と施設との類似度を取得することとしてもよい。第1判定は、受付部12によって所定のデータとして施設に関する文字列データを受け付けた場合、文字列データに記録される文字列と、施設の名称との類似度を判定する。第2判定は、第11ベクトルと第2ベクトルとの類似度を判定する。
The first determination processing unit 141 may determine the degree of similarity between the eleventh vector based on the name of the facility and the second vector.
The first determination processing unit 141 may perform a first determination and a second determination, which will be described later, and obtain the degree of similarity between the character string and the facility based on the results of the first determination and the second determination. In the first determination, when the reception unit 12 receives character string data regarding a facility as predetermined data, the degree of similarity between the character string recorded in the character string data and the name of the facility is determined. The second determination determines the degree of similarity between the eleventh vector and the second vector.

すなわち、第1判定処理部141は、第11ベクトルと第2ベクトルとの類似度を判定することに基づいて、検索条件としての文字(文字列)と、検索対象となる施設の名称との類似度を判定する。第1判定処理部141は、第11ベクトルと第2ベクトルとの類似度が相対的に高い場合に、検索条件としての文字(文字列)と検索対象となる施設の名称とが一致している可能性が高いと判定する。これに対し、第1判定処理部141は、第11ベクトルと第2ベクトルとの類似度が相対的に低い場合に、検索条件としての文字(文字列)と検索対象となる施設の名称とが一致している可能性が低いと判定する。 That is, the first determination processing unit 141 determines the similarity between the characters (character string) as the search condition and the name of the facility to be searched based on determining the degree of similarity between the eleventh vector and the second vector. Determine the degree. The first determination processing unit 141 determines that when the degree of similarity between the eleventh vector and the second vector is relatively high, the characters (character string) as the search condition match the name of the facility to be searched. It is determined that the possibility is high. On the other hand, when the degree of similarity between the 11th vector and the 2nd vector is relatively low, the first determination processing unit 141 determines whether the characters (character string) as the search condition and the name of the facility to be searched are It is determined that the possibility of a match is low.

ここで、第1判定処理部141は、例えば、ユーザが入力した検索条件(文字列)に基づいて、第11ベクトルと第2ベクトルとを判定した結果として、例えば、同綴同義語、同形異義語、類似語等を出力することが可能である。そこで、情報処理装置1は、ユーザが入力した検索条件(文字列)により合致した検索結果を出力するために、第2判定処理部142によって判定処理を行う。 Here, the first determination processing unit 141 determines, for example, the 11th vector and the 2nd vector based on the search condition (character string) input by the user. It is possible to output words, similar words, etc. Therefore, the information processing device 1 performs a determination process using the second determination processing unit 142 in order to output a search result that matches the search condition (character string) input by the user.

すなわち、第2判定処理部142は、第1判定処理部141によって類似度が高いと判定された第11ベクトルに対応する施設を説明するための文書に基づく第12ベクトル及びその施設の画像に基づく第13ベクトルのうちの少なくとも一方と、第2ベクトルとの類似度を判定することとしてもよい。 That is, the second determination processing unit 142 determines the twelfth vector based on the document for explaining the facility corresponding to the eleventh vector determined to have a high degree of similarity by the first determination processing unit 141 and the image of the facility. The degree of similarity between at least one of the thirteenth vectors and the second vector may be determined.

第2判定処理部142は、第1判定処理部141によって類似度が高いとされた施設の名称(第11ベクトル)に対応する、その施設を説明するための文書(第12ベクトル)と、その施設の画像(第13ベクトル)とのうちの少なくとも一方のベクトルと、第2ベクトルとの類似度を判定する。具体的な一例として、第2判定処理部142は、ユーザが入力した検索条件(文字列)が「レストラン」の場合には、第12ベクトル(施設を説明するための文書)及び第13ベクトル(施設の画像)の少なくとも一方に基づいて、第2ベクトル(検索条件「レストラン」)との類似度を判定する。 The second determination processing unit 142 generates a document (twelfth vector) for explaining the facility that corresponds to the name of the facility (eleventh vector) determined to have a high degree of similarity by the first determination processing unit 141, and The degree of similarity between at least one of the facility images (the thirteenth vector) and the second vector is determined. As a specific example, when the search condition (character string) input by the user is "restaurant," the second determination processing unit 142 may select the twelfth vector (a document for explaining the facility) and the thirteenth vector ( The degree of similarity with the second vector (search condition "restaurant") is determined based on at least one of the images (images of facilities).

第2判定処理部142は、上述したような処理を行うことにより、例えば、検索条件がいわゆる「目的検索」の場合には、その目的検索に応じた検索結果(類似度の判定結果)を出力することが可能となる。例えば、第2判定処理部142は、検索条件(目的検索)が「桜の名所」の場合には、「桜の名所」(第2ベクトル)と、「春には花見客で賑わっている」という文書に基づいて生成された第12ベクトル、及び、「桜が満開の写真」に基づいて生成された第13ベクトルとに基づいて類似度を判定して、類似する施設(桜の名所)を出力することが可能になる。 By performing the processing described above, the second determination processing unit 142 outputs a search result (similarity determination result) according to the purpose search, for example, when the search condition is a so-called "purpose search". It becomes possible to do so. For example, if the search condition (objective search) is "cherry blossom viewing spots", the second determination processing unit 142 searches for "cherry blossom viewing spots" (second vector) and the document "busy with cherry blossom viewing visitors in spring". and a 13th vector generated based on the "photo of cherry blossoms in full bloom" to determine the degree of similarity and output similar facilities (cherry blossom spots). becomes possible.

この場合、第2判定処理部142は、第1判定処理部141によって類似度が高いと判定された施設と、クラスタリング情報に基づいて、その施設に対して類似度が高い施設群に対応する第12ベクトル及び第13ベクトルの少なくとも一方のベクトルを記憶部18から取得し、そのベクトルと、第2ベクトルとの類似度を判定することとしてもよい。すなわち、例えば、第2判定処理部142は、記憶部18には類似する複数の施設をクラスリングしたクラスタリング情報が記憶されているため、第1判定処理部141によって類似度が高いと判定された施設を含むクラスタリング情報(そのクラスタリング情報に対応する第12ベクトル及び第13ベクトルの少なくとも一方のベクトル)と、第2ベクトルとの類似度を判定する。 In this case, the second determination processing unit 142 selects a facility that has been determined to have a high degree of similarity by the first determination processing unit 141, and a facility that corresponds to a group of facilities that have a high degree of similarity to that facility based on the clustering information. At least one of the 12th vector and the 13th vector may be acquired from the storage unit 18, and the degree of similarity between this vector and the second vector may be determined. That is, for example, the second determination processing unit 142 determines that the first determination processing unit 141 has determined that the degree of similarity is high because the storage unit 18 stores clustering information that classifies a plurality of similar facilities. The degree of similarity between the clustering information including the facility (at least one of the twelfth vector and the thirteenth vector corresponding to the clustering information) and the second vector is determined.

具体的な一例として、検索条件が「レストラン」の文字列の場合には、第2判定処理部142は、レストランに属する又は類似する複数の施設をクラスタリングしたクラスタリング情報に含まれる第12ベクトル及び第13ベクトルの少なくとも一方のベクトルと、第2ベクトルとの類似度を判定する。これにより、第2判定処理部142は、検索条件(一例として、レストラン等)に対して類似度がより高い施設を取得することが可能になる。 As a specific example, when the search condition is the character string "restaurant", the second determination processing unit 142 uses the 12th vector and the The degree of similarity between at least one of the 13 vectors and the second vector is determined. This allows the second determination processing unit 142 to acquire facilities with a higher degree of similarity to the search conditions (for example, restaurants, etc.).

第2判定処理部142は、類似度が高い施設を複数取得することとしてもよい。この場合、第2判定処理部142は、類似度が高い順に予め設定された数の施設を取得することとしてもよい。 The second determination processing unit 142 may acquire a plurality of facilities with a high degree of similarity. In this case, the second determination processing unit 142 may acquire a preset number of facilities in descending order of similarity.

なお、判定部14は、例えば、検索条件としてユーザの現在位置が入力された場合には、その現在位置の周辺で、類似する第1ベクトルに基づいた施設を出力することとしてもよい。ユーザの現在位置は、例えば、GNSS(Global Navigation Satellite System)等を利用して取得されてもよい。判定部14は、例えば、検索条件として入力された施設が臨時休業だった場合には、現在位置から時間的又は距離的に近くの類似施設を、第1ベクトルに基づいて出力することとしてもよい。 Note that, for example, when the user's current location is input as a search condition, the determination unit 14 may output facilities based on similar first vectors around the current location. The user's current location may be acquired using, for example, GNSS (Global Navigation Satellite System). For example, if the facility input as the search condition is temporarily closed, the determination unit 14 may output similar facilities that are close in time or distance from the current location based on the first vector. .

また、判定部14は、例えば、検索条件として「京都で香嵐渓みたいな所」と入力された場合には、類似する第1ベクトルに基づいて「嵐山」を出力することとしてもよい。すなわち、判定部14は、ユーザの現在位置の周辺で、類似する第1ベクトルに基づく施設を抽出することとしてもよい。 Further, for example, when "a place like Korankei in Kyoto" is input as a search condition, the determination unit 14 may output "Arashiyama" based on the similar first vector. That is, the determination unit 14 may extract facilities based on similar first vectors around the user's current location.

出力制御部15は、判定部14によって判定された類似度が高い順に、その類似度が高い第1ベクトルに対応する施設に関する情報を出力部から出力する。すなわち、出力制御部15は、第2判定処理部142によって判定された類似度が高い順に、その類似度が高い第2ベクトルに対応する施設に関する情報を出力部から出力することとしてもよい。
出力部は、上述したように、通信部17、記憶部18及び表示部19であってもよい。
The output control unit 15 outputs, from the output unit, information regarding facilities corresponding to the first vectors having the highest degrees of similarity in the order of the degrees of similarity determined by the determination unit 14. That is, the output control unit 15 may output, from the output unit, information regarding facilities corresponding to the second vectors having the highest degrees of similarity in the order of the degrees of similarity determined by the second determination processing unit 142.
The output section may be the communication section 17, the storage section 18, and the display section 19, as described above.

出力制御部15は、例えば、施設に関する情報として、施設の名称を表示するよう表示部19(出力部)を制御することとしてもよい。又は、出力制御部15は、例えば、施設に関する情報として、施設の名称をユーザが所有する携帯端末及び情報処理端末(図示せず)に送信するよう通信部17を制御することとしてもよい。又は、出力制御部15は、例えば、施設に関する情報として、施設の名称に関する情報を記憶部18に記憶することとしてもよい。
なお、施設に関する情報は、上述した施設の名称に限定されることはなく、施設の名称に加えて又は施設の名称に代えて、施設を説明する文書及び施設の画像のうち少なくとも一方が含まれていてもよい。
又は、出力制御部15は、判定部14によって判定された類似度が予め設定された閾値以上の第1ベクトルに対応する施設に関する情報を出力部から出力することとしてもよい。
又は、出力制御部15は、判定部14によって判定された類似度が高い順に、上位から予め設定された数の第1ベクトルに対応する施設に関する情報を出力部から出力することとしてもよい。
The output control unit 15 may, for example, control the display unit 19 (output unit) to display the name of the facility as information regarding the facility. Alternatively, the output control unit 15 may, for example, control the communication unit 17 to transmit the name of the facility as information regarding the facility to a mobile terminal and an information processing terminal (not shown) owned by the user. Alternatively, the output control unit 15 may store, for example, information regarding the name of the facility in the storage unit 18 as the information regarding the facility.
The information regarding the facility is not limited to the name of the facility mentioned above, and may include at least one of a document explaining the facility and an image of the facility, in addition to or instead of the name of the facility. You can leave it there.
Alternatively, the output control unit 15 may output, from the output unit, information regarding the facility corresponding to the first vector whose degree of similarity determined by the determination unit 14 is greater than or equal to a preset threshold.
Alternatively, the output control unit 15 may output, from the output unit, information regarding facilities corresponding to a preset number of first vectors from the top in descending order of the degree of similarity determined by the determination unit 14.

次に、情報処理方法について説明する。
図4は、一実施形態に係る情報処理方法について説明するためのフローチャートである。
Next, an information processing method will be explained.
FIG. 4 is a flowchart for explaining an information processing method according to an embodiment.

ステップST101において、受付部12は、検索対象となる施設に関する所定のデータを受け付ける。受付部12は、所定のデータとして、施設に関する文字列データ、及び、施設に関する画像データの少なくとも一方を受け付けることが可能であってもよい。 In step ST101, the reception unit 12 receives predetermined data regarding the facility to be searched. The reception unit 12 may be able to receive at least one of character string data regarding the facility and image data regarding the facility as the predetermined data.

ステップST102において、生成部13は、ステップST101で受け付けた所定のデータに含まれる情報を相対的に高次元のベクトルで表現し、そのベクトルについて第2ベクトルとして生成する。すなわち、生成部13は、情報を分散表現した第2ベクトルを生成する。 In step ST102, the generation unit 13 expresses the information included in the predetermined data received in step ST101 as a relatively high-dimensional vector, and generates the vector as a second vector. That is, the generation unit 13 generates a second vector that represents information in a distributed manner.

ステップST103において、第1判定処理部141は、第1判定として、例えば、ステップST101で所定のデータとして施設に関する文字列データを受け付けた場合、文字列データに記録される文字列と、施設の名称との類似度を判定する。 In step ST103, the first determination processing unit 141 makes a first determination, for example, when character string data regarding a facility is received as predetermined data in step ST101, the first determination processing unit 141 includes a character string recorded in the character string data and a name of the facility. Determine the degree of similarity with.

ステップST104において、第1判定処理部141は、第2判定として、施設の名称を分散表現した第1ベクトル(第11ベクトル)と、ステップST101で受け付けた所定のデータ(例えば、文字列データ等)を分散表現した第2ベクトルとの類似度を判定する。 In step ST104, the first determination processing unit 141, as a second determination, uses a first vector (eleventh vector) that is a distributed representation of the name of the facility and the predetermined data (for example, character string data, etc.) received in step ST101. The similarity with a second vector that is a distributed representation of is determined.

なお、本実施形態ではステップST103とステップST104とは別の処理として説明しているが、他の実施形態としてステップST103とステップST104とは1つの処理として行われてもよい。すなわち、第1判定処理部141は、ステップST102で所定のデータを分散表現した第2ベクトルと、施設の名称を分散表現した第1ベクトル(第11ベクトル)との類似度を判定することとしてもよい。 Note that in this embodiment, step ST103 and step ST104 are described as separate processes, but in other embodiments, step ST103 and step ST104 may be performed as one process. That is, the first determination processing unit 141 may determine the degree of similarity between the second vector that is a distributed representation of the predetermined data in step ST102 and the first vector (eleventh vector) that is a distributed representation of the name of the facility. good.

ステップST105において、第2判定処理部142は、ステップST104によって類似度が高いと判定された第11ベクトルに対応する施設を説明するための文書に基づく第12ベクトル及びその施設の画像に基づく第13ベクトルのうちの少なくとも一方と、第2ベクトルとの類似度を判定する。この場合、第2判定処理部142は、類似する複数の施設をクラスリングしたクラスタリング情報を利用して、そのクラスタリング情報に含まれる第12ベクトル及び第13ベクトルの少なくとも一方と、第2ベクトルとに基づいて、類似度を判定することとしてもよい。 In step ST105, the second determination processing unit 142 generates a 12th vector based on the document for explaining the facility corresponding to the 11th vector determined to have a high degree of similarity in step ST104, and a 13th vector based on the image of the facility. A degree of similarity between at least one of the vectors and the second vector is determined. In this case, the second determination processing unit 142 utilizes clustering information obtained by classifying a plurality of similar facilities to distinguish between at least one of the twelfth vector and the thirteenth vector included in the clustering information and the second vector. The degree of similarity may be determined based on the above.

ステップST106において、出力制御部15は、ステップST105で判定された類似度が高い第1ベクトルに対応する施設に関する情報を出力する。この場合、出力制御部15は、類似度が高い順に施設に関する情報を出力することとしてもよい。出力制御部15は、出力部として、例えば、通信部17、記憶部18及び表示部19を制御することにより、施設に関する情報を出力する。 In step ST106, the output control unit 15 outputs information regarding the facility corresponding to the first vector with a high degree of similarity determined in step ST105. In this case, the output control unit 15 may output information regarding facilities in descending order of similarity. The output control unit 15 outputs information regarding the facility by controlling, for example, the communication unit 17, the storage unit 18, and the display unit 19 as output units.

次に、本実施形態の効果について説明する。
情報処理装置1は、情報を出力する出力部と、複数の施設に関する1又は複数の情報について分散表現に関する処理を行うことにより生成された第1ベクトルを記憶する記憶部18と、検索対象となる施設に関する所定のデータを受け付ける受付部12と、受付部12によって受け付けた所定のデータに含まれる情報を相対的に高次元のベクトルで表現し、そのベクトルについて第2ベクトルとして生成する生成部13と、記憶部18に記憶される第1ベクトルと、生成部13によって生成される第2ベクトルとの類似度を判定する判定部14と、判定部14によって判定された類似度が高い順に、その類似度が高い第1ベクトルに対応する施設に関する情報を出力部から出力する出力制御部15と、を備える。
これにより、情報処理装置1は、施設を検索して、その検索の結果を出力することができる。すなわち、情報処理装置1は、分散表現したベクトルを利用することにより、ユーザが入力した検索条件(所定のデータの情報)に合致した施設を検索することができる。
Next, the effects of this embodiment will be explained.
The information processing device 1 includes an output unit that outputs information, a storage unit 18 that stores a first vector generated by performing processing related to distributed representation on one or more pieces of information regarding a plurality of facilities, and a storage unit 18 that stores a first vector generated by performing processing related to distributed representation on one or more pieces of information regarding a plurality of facilities. a reception unit 12 that receives predetermined data regarding the facility; and a generation unit 13 that expresses information included in the predetermined data received by the reception unit 12 as a relatively high-dimensional vector and generates a second vector for the vector. , a determining unit 14 that determines the degree of similarity between the first vector stored in the storage unit 18 and the second vector generated by the generating unit 13; and an output control unit 15 that outputs information regarding the facility corresponding to the first vector having a high degree from the output unit.
Thereby, the information processing device 1 can search for a facility and output the search results. That is, the information processing device 1 can search for facilities that match the search conditions (information on predetermined data) input by the user by using the distributed vectors.

情報処理装置1では、記憶部18は、第1ベクトルとして、第11ベクトルと、第12ベクトルと、第13ベクトルとを記憶することとしてもよい。この場合、判定部14は、施設の名称に基づく第11ベクトルと、第2ベクトルとの類似度を判定する第1判定処理部141と、第1判定処理部141によって類似度が高いと判定された第11ベクトルに対応する施設を説明するための文書に基づく第12ベクトル及びその施設の画像に基づく第13ベクトルのうちの少なくとも一方と、第2ベクトルとの類似度を判定する第2判定処理部142と、を備えることとしてもよい。出力制御部15は、第2判定処理部142によって判定された類似度が高い順に、その類似度が高い第2ベクトルに対応する施設に関する情報を出力部から出力することとしてもよい。
すなわち、情報処理装置1は、第11ベクトルと第2ベクトルとの類似度が高い場合に、第12ベクトル及び第13ベクトルの少なくとも一方と第2ベクトルとの類似度を判定するので、ユーザが入力した検索条件(所定のデータの情報)により合致した施設を検索して、その検索結果を出力することができる。
In the information processing device 1, the storage unit 18 may store an 11th vector, a 12th vector, and a 13th vector as the first vector. In this case, the determination unit 14 includes a first determination processing unit 141 that determines the similarity between the eleventh vector based on the name of the facility and the second vector, and a first determination processing unit 141 that determines the similarity between the eleventh vector based on the name of the facility and the second vector. a second determination process of determining the degree of similarity between the second vector and at least one of a twelfth vector based on a document for explaining a facility corresponding to the eleventh vector and a thirteenth vector based on an image of the facility; It is good also as including the part 142. The output control unit 15 may output, from the output unit, information regarding facilities corresponding to the second vectors having the highest degrees of similarity in the order of the degrees of similarity determined by the second determination processing unit 142.
That is, the information processing device 1 determines the similarity between at least one of the twelfth vector and the thirteenth vector and the second vector when the similarity between the eleventh vector and the second vector is high. It is possible to search for facilities that match the search conditions (information on predetermined data) and output the search results.

情報処理装置1では、記憶部18は、第12ベクトル及び第13ベクトルに基づいて、類似度の高い施設をクラスタリングした施設群に関するクラスタリング情報を記憶することとしてもよい。第2判定処理部142は、第1判定処理部141によって類似度が高いと判定された施設と、クラスタリング情報に基づいて、その施設に対して類似度が高い施設群に対応する第12ベクトル及び第13ベクトルの少なくとも一方のベクトルを記憶部18から取得し、そのベクトルと、第2ベクトルとの類似度を判定することとしてもよい。
情報処理装置1は、少なくとも第12ベクトル及び第13ベクトルに基づいて、類似する複数の施設をクラスタリングし、そのクラスタリングした範囲内で類似度を判定するので、ユーザが入力した検索条件(所定のデータの情報)により合致した施設を検索して、その検索結果を出力することができる。
In the information processing device 1, the storage unit 18 may store clustering information regarding a facility group obtained by clustering facilities with a high degree of similarity based on the 12th vector and the 13th vector. The second determination processing unit 142 generates a twelfth vector corresponding to the facility that is determined to have a high degree of similarity by the first determination processing unit 141 and a group of facilities that have a high degree of similarity to the facility based on the clustering information. At least one of the thirteenth vectors may be acquired from the storage unit 18, and the degree of similarity between this vector and the second vector may be determined.
The information processing device 1 clusters a plurality of similar facilities based on at least the 12th vector and the 13th vector, and determines the degree of similarity within the clustered range. It is possible to search for matching facilities based on the information provided by the facility and output the search results.

情報処理装置1では、第1判定処理部141は、受付部12によって所定のデータとして施設に関する文字列データを受け付けた場合、文字列データに記録される文字列と、施設の名称との類似度を判定する第1判定と、第11ベクトルと第2ベクトルとの類似度を判定する第2判定と、を行い、第1判定と第2判定との結果に基づいて、文字列と施設との類似度を取得することとしてもよい。
これにより、情報処理装置1は、施設の名称に関する第11ベクトルと第2ベクトルとの類似度に基づいて、検索条件の文字列と、検索対象の施設の名称とが一致している可能性を取得することができる。
In the information processing device 1, when the reception unit 12 receives character string data regarding a facility as predetermined data, the first determination processing unit 141 determines the degree of similarity between the character string recorded in the character string data and the name of the facility. A first judgment for determining the similarity between the 11th vector and the second vector is performed, and based on the results of the first judgment and the second judgment, the relationship between the character string and the facility is determined. It is also possible to obtain the degree of similarity.
Thereby, the information processing device 1 calculates the possibility that the character string of the search condition matches the name of the facility to be searched based on the degree of similarity between the eleventh vector and the second vector regarding the name of the facility. can be obtained.

情報処理装置1では、受付部12は、所定のデータとして、施設に関する文字列データ、及び、施設に関する画像データの少なくとも一方を受け付けることが可能である。この場合、生成部13は、受付部12によって受け付けた文字列データ及び画像データについて分散表現に関する処理を行うことによって第2ベクトルを生成することとしてもよい。
情報処理装置1は、分散表現したベクトルに基づいて、検索条件に応じた施設を検索することができる。
In the information processing device 1, the reception unit 12 can receive at least one of character string data regarding the facility and image data regarding the facility as predetermined data. In this case, the generation unit 13 may generate the second vector by performing processing related to distributed representation on the character string data and image data received by the reception unit 12.
The information processing device 1 can search for facilities according to search conditions based on the vectors expressed in a distributed manner.

情報処理方法では、出力部を備えるコンピュータが、複数の施設に関する1又は複数の情報について分散表現に関する処理を行うことにより生成された第1ベクトルを記憶部18に記憶する記憶ステップと、検索対象となる施設に関する所定のデータを受け付ける受付ステップと、受付ステップによって受け付けた所定のデータに含まれる情報を相対的に高次元のベクトルで表現し、そのベクトルについて第2ベクトルとして生成する生成ステップと、記憶部18に記憶される第1ベクトルと、生成ステップによって生成される第2ベクトルとの類似度を判定する判定ステップと、判定ステップによって判定された類似度が高い順に、その類似度が高い第1ベクトルに対応する施設に関する情報を出力部から出力する出力制御ステップと、を実行する。
これにより、情報処理方法は、施設を検索して、その検索の結果を出力することができる。すなわち、情報処理方法は、分散表現したベクトルを利用することにより、ユーザが入力した検索条件(所定のデータの情報)に合致した施設を検索することができる。
The information processing method includes a storage step in which a computer including an output unit stores a first vector generated by performing processing related to distributed representation on one or more pieces of information regarding a plurality of facilities in a storage unit 18; a reception step that receives predetermined data regarding the facility; a generation step that expresses information included in the predetermined data received by the reception step as a relatively high-dimensional vector and generates a second vector for the vector; a determination step of determining the degree of similarity between the first vector stored in the unit 18 and the second vector generated in the generation step; an output control step of outputting information regarding the facility corresponding to the vector from the output unit.
Thereby, the information processing method can search for a facility and output the search results. That is, the information processing method can search for facilities that match the search conditions (information on predetermined data) input by the user by using vectors expressed in a distributed manner.

情報処理プログラムは、コンピュータに、情報を出力する出力機能と、複数の施設に関する1又は複数の情報について分散表現に関する処理を行うことにより生成された第1ベクトルを記憶する記憶機能と、検索対象となる施設に関する所定のデータを受け付ける受付機能と、受付機能によって受け付けた所定のデータに含まれる情報を相対的に高次元のベクトルで表現し、そのベクトルについて第2ベクトルとして生成する生成機能と、記憶機能に記憶される第1ベクトルと、生成機能によって生成される第2ベクトルとの類似度を判定する判定機能と、判定機能によって判定された類似度が高い順に、その類似度が高い第1ベクトルに対応する施設に関する情報を出力機能から出力する出力制御機能と、を実現させる。
これにより、情報処理プログラムは、施設を検索して、その検索の結果を出力することができる。すなわち、情報処理プログラムは、分散表現したベクトルを利用することにより、ユーザが入力した検索条件(所定のデータの情報)に合致した施設を検索することができる。
The information processing program provides a computer with an output function for outputting information, a storage function for storing a first vector generated by performing processing related to distributed representation on one or more pieces of information regarding a plurality of facilities, and a search target. a reception function that accepts predetermined data regarding a facility, a generation function that expresses information included in the predetermined data received by the reception function as a relatively high-dimensional vector, and generates a second vector for that vector; A determination function that determines the degree of similarity between a first vector stored in the function and a second vector generated by the generation function; and a first vector having a higher degree of similarity in the order of the degree of similarity determined by the determination function. and an output control function that outputs information regarding the facility corresponding to the output function from the output function.
This allows the information processing program to search for facilities and output the search results. That is, the information processing program can search for facilities that match the search conditions (information on predetermined data) input by the user by using the distributed vectors.

上述した情報処理装置1の各部は、コンピュータの演算処理装置等の機能として実現されてもよい。すなわち、情報処理装置1の受付部12、生成部13、判定部14及び出力制御部15は、コンピュータの演算処理装置等による受付機能、生成機能、判定機能及び出力制御機能としてそれぞれ実現されてもよい。
情報処理プログラムは、上述した各機能をコンピュータに実現させることができる。情報処理プログラムは、外部メモリ又は光ディスク等の、コンピュータで読み取り可能な非一時的な記録媒体に記録されていてもよい。
また、上述したように、情報処理装置1の各部は、コンピュータの演算処理装置等で実現されてもよい。その演算処理装置等は、例えば、集積回路等によって構成される。このため、情報処理装置1の各部は、演算処理装置等を構成する回路として実現されてもよい。すなわち、情報処理装置1の受付部12、生成部13、判定部14及び出力制御部15は、コンピュータの演算処理装置等を構成する受付回路、生成回路、判定回路及び出力制御回路として実現されてもよい。
また、情報処理装置1の入力部16、並びに、通信部17、記憶部18及び表示部19(出力部)は、例えば、演算処理装置等の機能を含む入力機能、並びに、通信機能、記憶機能及び表示機能(出力機能)として実現されもよい。また、情報処理装置1の入力部16、並びに、通信部17、記憶部18及び表示部19(出力部)は、例えば、集積回路等によって構成されることにより入力回路、並びに、通信回路、記憶回路及び表示回路(出力回路)として実現されてもよい。また、情報処理装置1の入力部16、並びに、通信部17、記憶部18及び表示部19(出力部)は、例えば、複数のデバイスによって構成されることにより入力装置、並びに、通信装置、記憶装置及び表示装置(出力装置)として構成されてもよい。
Each part of the information processing device 1 described above may be realized as a function of a computer processing device or the like. That is, the reception unit 12, generation unit 13, determination unit 14, and output control unit 15 of the information processing device 1 may be implemented as a reception function, a generation function, a determination function, and an output control function, respectively, by an arithmetic processing unit of a computer. good.
The information processing program can cause a computer to realize each of the functions described above. The information processing program may be recorded on a computer-readable non-transitory recording medium such as an external memory or an optical disc.
Further, as described above, each part of the information processing device 1 may be realized by a calculation processing device of a computer or the like. The arithmetic processing device and the like are constituted by, for example, an integrated circuit or the like. Therefore, each part of the information processing device 1 may be realized as a circuit that constitutes an arithmetic processing device or the like. That is, the reception unit 12, generation unit 13, determination unit 14, and output control unit 15 of the information processing device 1 are realized as a reception circuit, a generation circuit, a determination circuit, and an output control circuit that constitute an arithmetic processing unit of a computer. Good too.
In addition, the input unit 16, communication unit 17, storage unit 18, and display unit 19 (output unit) of the information processing device 1 have input functions including functions such as an arithmetic processing device, communication functions, and storage functions. It may also be realized as a display function (output function). Furthermore, the input section 16, the communication section 17, the storage section 18, and the display section 19 (output section) of the information processing device 1 are configured by, for example, an integrated circuit or the like, so that the input circuit, the communication circuit, the storage section, etc. It may be realized as a circuit and a display circuit (output circuit). In addition, the input unit 16, the communication unit 17, the storage unit 18, and the display unit 19 (output unit) of the information processing device 1 may be configured by a plurality of devices, so that the input unit, the communication device, and the storage unit may be configured by a plurality of devices. It may be configured as a device and a display device (output device).

1 情報処理装置
11 制御部
12 受付部
13 生成部
14 判定部
141 第1判定処理部
142 第2判定処理部
15 出力制御部
16 入力部
17 通信部
18 記憶部
19 表示部
1 Information processing device 11 Control section 12 Reception section 13 Generation section 14 Judgment section 141 First judgment processing section 142 Second judgment processing section 15 Output control section 16 Input section 17 Communication section 18 Storage section 19 Display section

Claims (8)

情報を出力する出力部と、
複数の施設に関する1又は複数の情報について分散表現に関する処理を行うことにより生成された第1ベクトルを記憶し、当該第1ベクトルとして、施設に関する情報として施設の名称、その施設を説明するための文書、及び、その施設の画像それぞれのベクトルを記憶する記憶部と、
検索対象となる施設に関する所定のデータを受け付ける受付部と、
前記受付部によって受け付けた所定のデータに含まれる情報を相対的に高次元のベクトルで表現し、当該ベクトルについて第2ベクトルとして生成する生成部と、
前記記憶部に記憶される第1ベクトルとしての施設の名称を示すベクトルと、前記生成部によって生成される第2ベクトルとの類似度を判定し、当該判定により類似度が高いと判定されたベクトルに対応する第1ベクトルとしての施設を説明するための文書、及び、その施設の画像のうち少なくとも一方のベクトルと、第2ベクトルとの類似度を判定する判定部と、
前記判定部によって判定された類似度が高い順に、その類似度が高い第1ベクトルに対応する施設に関する情報を前記出力部から出力する出力制御部と、
を備える情報処理装置。
an output section that outputs information;
A first vector generated by performing processing related to distributed representation on one or more pieces of information regarding a plurality of facilities is stored, and as the first vector, information regarding the facility includes the name of the facility and a document for explaining the facility. , and a storage unit that stores vectors for each image of the facility;
a reception department that receives predetermined data regarding the facility to be searched;
a generation unit that expresses information included in the predetermined data received by the reception unit as a relatively high-dimensional vector, and generates a second vector for the vector;
The degree of similarity between a vector indicating the name of a facility as a first vector stored in the storage unit and a second vector generated by the generation unit is determined, and a vector determined to have a high degree of similarity based on the determination. a document for explaining the facility as a first vector corresponding to the image, and a determination unit that determines the degree of similarity between at least one vector of the image of the facility and the second vector;
an output control unit that outputs, from the output unit, information regarding facilities corresponding to the first vectors having the highest degrees of similarity in the order of the degree of similarity determined by the determination unit;
An information processing device comprising:
前記記憶部は、
第1ベクトルとして、施設に関する情報として施設の名称について分散表現に関する処理を行うことにより生成された第11ベクトルと、
第1ベクトルとして、施設に関する情報としてその施設を説明するための文書について分散表現に関する処理を行うことにより生成された第12ベクトルと、
第1ベクトルとして、施設に関する情報としてその施設の画像について分散表現に関する処理を行うことにより生成された第13ベクトルと、を記憶し、
前記判定部は、
施設の名称に基づく第11ベクトルと、第2ベクトルとの類似度を判定する第1判定処理部と、
前記第1判定処理部によって類似度が高いと判定された第11ベクトルに対応する施設を説明するための文書に基づく第12ベクトル及び当該施設の画像に基づく第13ベクトルのうちの少なくとも一方と、第2ベクトルとの類似度を判定する第2判定処理部と、を備え、
前記出力制御部は、第2判定処理部によって判定された類似度が高い順に、その類似度が高い第1ベクトルに対応する施設に関する情報を前記出力部から出力する
請求項1に記載の情報処理装置。
The storage unit includes:
As the first vector, an 11th vector generated by performing processing related to distributed representation of the name of the facility as information regarding the facility;
As the first vector, a twelfth vector generated by performing processing related to distributed representation on a document for explaining the facility as information regarding the facility;
storing, as the first vector, a thirteenth vector generated by performing processing related to distributed representation on the image of the facility as information regarding the facility;
The determination unit includes:
a first determination processing unit that determines the degree of similarity between the eleventh vector based on the name of the facility and the second vector;
at least one of a twelfth vector based on a document for explaining a facility corresponding to an eleventh vector determined to have a high degree of similarity by the first determination processing unit and a thirteenth vector based on an image of the facility; a second determination processing unit that determines the degree of similarity with the second vector;
The information processing according to claim 1, wherein the output control unit outputs, from the output unit, information regarding facilities corresponding to the first vectors having the highest degrees of similarity in the order of the degrees of similarity determined by the second determination processing unit. Device.
前記記憶部は、第12ベクトル及び第13ベクトルに基づいて、類似度の高い施設をクラスタリングした施設群に関するクラスタリング情報を記憶し、
前記第2判定処理部は、前記第1判定処理部によって類似度が高いと判定された施設と、クラスタリング情報に基づいて、当該施設に対して類似度が高い施設群に対応する第12ベクトル及び第13ベクトルの少なくとも一方のベクトルを前記記憶部から取得し、当該ベクトルと、第2ベクトルとの類似度を判定する
請求項2に記載の情報処理装置。
The storage unit stores clustering information regarding a facility group in which facilities with high similarity are clustered based on a twelfth vector and a thirteenth vector,
The second determination processing unit generates a twelfth vector corresponding to a facility that is determined to have a high degree of similarity by the first determination processing unit and a group of facilities that have a high degree of similarity to the facility based on the clustering information. The information processing apparatus according to claim 2, wherein at least one of the thirteenth vectors is acquired from the storage unit, and a degree of similarity between the third vector and the second vector is determined.
前記第1判定処理部は、
前記受付部によって所定のデータとして施設に関する文字列データを受け付けた場合、文字列データに記録される文字列と、施設の名称との類似度を判定する第1判定と、
第11ベクトルと第2ベクトルとの類似度を判定する第2判定と、を行い、
前記第1判定と前記第2判定との結果に基づいて、前記文字列と施設との類似度を取得する
請求項2又は3に記載の情報処理装置。
The first determination processing unit includes:
a first determination of determining the degree of similarity between the character string recorded in the character string data and the name of the facility when the reception unit receives character string data regarding the facility as predetermined data;
performing a second determination of determining the degree of similarity between the eleventh vector and the second vector;
The information processing device according to claim 2 or 3, wherein the degree of similarity between the character string and the facility is acquired based on the results of the first determination and the second determination.
前記受付部は、所定のデータとして、施設に関する文字列データ、及び、施設に関する画像データの少なくとも一方を受け付けることが可能であり、
前記生成部は、前記受付部によって受け付けた文字列データ及び画像データについて分散表現に関する処理を行うことによって第2ベクトルを生成する
請求項1~4のいずれか1項に記載の情報処理装置。
The reception unit is capable of accepting at least one of character string data regarding the facility and image data regarding the facility as predetermined data,
The information processing device according to claim 1, wherein the generation unit generates the second vector by performing processing related to distributed representation on the character string data and image data received by the reception unit.
出力部を備えるコンピュータが、
複数の施設に関する1又は複数の情報について分散表現に関する処理を行うことにより生成された第1ベクトルを記憶部に記憶し、当該第1ベクトルとして、施設に関する情報として施設の名称、その施設を説明するための文書、及び、その施設の画像それぞれのベクトルを記憶する記憶ステップと、
検索対象となる施設に関する所定のデータを受け付ける受付ステップと、
前記受付ステップによって受け付けた所定のデータに含まれる情報を相対的に高次元のベクトルで表現し、当該ベクトルについて第2ベクトルとして生成する生成ステップと、
前記記憶部に記憶される第1ベクトルとしての施設の名称を示すベクトルと、前記生成ステップによって生成される第2ベクトルとの類似度を判定し、当該判定により類似度が高いと判定されたベクトルに対応する第1ベクトルとしての施設を説明するための文書、及び、その施設の画像のうち少なくとも一方のベクトルと、第2ベクトルとの類似度を判定する判定ステップと、
前記判定ステップによって判定された類似度が高い順に、その類似度が高い第1ベクトルに対応する施設に関する情報を前記出力部から出力する出力制御ステップと、
を実行する情報処理方法。
A computer equipped with an output section,
A first vector generated by performing processing related to distributed representation on one or more pieces of information regarding a plurality of facilities is stored in the storage unit, and as the first vector, the name of the facility and the facility are explained as information regarding the facility. a storage step of storing vectors for each of the documents and images of the facility;
a reception step of accepting predetermined data regarding the facility to be searched;
a generation step of expressing information included in the predetermined data received in the reception step as a relatively high-dimensional vector, and generating a second vector for the vector;
The degree of similarity between the vector indicating the name of the facility as a first vector stored in the storage unit and the second vector generated in the generation step is determined, and the vector determined to have a high degree of similarity based on the determination. a document for explaining the facility as a first vector corresponding to the image, and a determination step of determining the degree of similarity between at least one vector of the image of the facility and the second vector;
an output control step of outputting, from the output unit, information regarding facilities corresponding to the first vectors having the highest degrees of similarity in the order of the degrees of similarity determined in the determination step;
An information processing method that performs.
コンピュータに、
情報を出力する出力機能と、
複数の施設に関する1又は複数の情報について分散表現に関する処理を行うことにより生成された第1ベクトルを記憶し、当該第1ベクトルとして、施設に関する情報として施設の名称、その施設を説明するための文書、及び、その施設の画像それぞれのベクトルを記憶する記憶機能と、
検索対象となる施設に関する所定のデータを受け付ける受付機能と、
前記受付機能によって受け付けた所定のデータに含まれる情報を相対的に高次元のベクトルで表現し、当該ベクトルについて第2ベクトルとして生成する生成機能と、
前記記憶機能に記憶される第1ベクトルとしての施設の名称を示すベクトルと、前記生成機能によって生成される第2ベクトルとの類似度を判定し、当該判定により類似度が高いと判定されたベクトルに対応する第1ベクトルとしての施設を説明するための文書、及び、その施設の画像のうち少なくとも一方のベクトルと、第2ベクトルとの類似度を判定する判定機能と、
前記判定機能によって判定された類似度が高い順に、その類似度が高い第1ベクトルに対応する施設に関する情報を前記出力機能から出力する出力制御機能と、
を実現させる情報処理プログラム。
to the computer,
An output function that outputs information,
A first vector generated by performing processing related to distributed representation on one or more pieces of information regarding a plurality of facilities is stored, and as the first vector, information regarding the facility includes the name of the facility and a document for explaining the facility. , and a memory function that stores vectors for each image of the facility;
A reception function that accepts predetermined data regarding the facility to be searched,
a generation function that expresses information included in the predetermined data received by the reception function as a relatively high-dimensional vector, and generates a second vector for the vector;
The degree of similarity between a vector indicating the name of a facility as a first vector stored in the storage function and a second vector generated by the generation function is determined, and a vector determined to have a high degree of similarity based on the determination. a document for explaining the facility as a first vector corresponding to the image, and a determination function that determines the degree of similarity between at least one vector of the image of the facility and the second vector;
an output control function that outputs, from the output function, information regarding facilities corresponding to first vectors with the highest degrees of similarity in the order of the degrees of similarity determined by the determination function;
An information processing program that realizes.
コンピュータに、
情報を出力する出力機能と、
複数の施設に関する1又は複数の情報について分散表現に関する処理を行うことにより生成された第1ベクトルを記憶し、当該第1ベクトルとして、施設に関する情報として施設の名称、その施設を説明するための文書、及び、その施設の画像それぞれのベクトルを記憶する記憶機能と、
検索対象となる施設に関する所定のデータを受け付ける受付機能と、
前記受付機能によって受け付けた所定のデータに含まれる情報を相対的に高次元のベクトルで表現し、当該ベクトルについて第2ベクトルとして生成する生成機能と、
前記記憶機能に記憶される第1ベクトルとしての施設の名称を示すベクトルと、前記生成機能によって生成される第2ベクトルとの類似度を判定し、当該判定により類似度が高いと判定されたベクトルに対応する第1ベクトルとしての施設を説明するための文書、及び、その施設の画像のうち少なくとも一方のベクトルと、第2ベクトルとの類似度を判定する判定機能と、
前記判定機能によって判定された類似度が高い順に、その類似度が高い第1ベクトルに対応する施設に関する情報を前記出力機能から出力する出力制御機能と、
を実現させる情報処理プログラムを記録した、前記コンピュータで読み取り可能な非一時的な記録媒体。
to the computer,
An output function that outputs information,
A first vector generated by performing processing related to distributed representation on one or more pieces of information regarding a plurality of facilities is stored, and as the first vector, information regarding the facility includes the name of the facility and a document for explaining the facility. , and a memory function that stores vectors for each image of the facility;
A reception function that accepts predetermined data regarding the facility to be searched,
a generation function that expresses information included in the predetermined data received by the reception function as a relatively high-dimensional vector, and generates a second vector for the vector;
The degree of similarity between a vector indicating the name of a facility as a first vector stored in the storage function and a second vector generated by the generation function is determined, and a vector determined to have a high degree of similarity based on the determination. a document for explaining the facility as a first vector corresponding to the image, and a determination function that determines the degree of similarity between at least one vector of the image of the facility and the second vector;
an output control function that outputs, from the output function, information regarding facilities corresponding to first vectors with the highest degrees of similarity in the order of the degrees of similarity determined by the determination function;
The computer-readable non-transitory recording medium that records an information processing program for realizing the above.
JP2020083510A 2020-05-11 2020-05-11 Information processing device, information processing method, information processing program, and recording medium Active JP7440338B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020083510A JP7440338B2 (en) 2020-05-11 2020-05-11 Information processing device, information processing method, information processing program, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020083510A JP7440338B2 (en) 2020-05-11 2020-05-11 Information processing device, information processing method, information processing program, and recording medium

Publications (2)

Publication Number Publication Date
JP2021179696A JP2021179696A (en) 2021-11-18
JP7440338B2 true JP7440338B2 (en) 2024-02-28

Family

ID=78511516

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020083510A Active JP7440338B2 (en) 2020-05-11 2020-05-11 Information processing device, information processing method, information processing program, and recording medium

Country Status (1)

Country Link
JP (1) JP7440338B2 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005129002A (en) 2003-10-02 2005-05-19 Yoshihide Hosokawa Landmark retrieval device, information retrieval system, information generation device, object person identification device, and information distribution system
JP2016053870A (en) 2014-09-04 2016-04-14 富士ゼロックス株式会社 Information presentation program and information processing apparatus
JP6059314B1 (en) 2015-09-17 2017-01-11 ヤフー株式会社 Estimation apparatus, estimation method, and estimation program
JP2018028732A (en) 2016-08-15 2018-02-22 株式会社トヨタマップマスター Facility searching device, facility searching method, computer program, and recording medium having computer program recorded therein
CN110674419A (en) 2019-01-25 2020-01-10 北京嘀嘀无限科技发展有限公司 Geographic information retrieval method and device, electronic equipment and readable storage medium

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005129002A (en) 2003-10-02 2005-05-19 Yoshihide Hosokawa Landmark retrieval device, information retrieval system, information generation device, object person identification device, and information distribution system
JP2016053870A (en) 2014-09-04 2016-04-14 富士ゼロックス株式会社 Information presentation program and information processing apparatus
JP6059314B1 (en) 2015-09-17 2017-01-11 ヤフー株式会社 Estimation apparatus, estimation method, and estimation program
JP2018028732A (en) 2016-08-15 2018-02-22 株式会社トヨタマップマスター Facility searching device, facility searching method, computer program, and recording medium having computer program recorded therein
CN110674419A (en) 2019-01-25 2020-01-10 北京嘀嘀无限科技发展有限公司 Geographic information retrieval method and device, electronic equipment and readable storage medium

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
中村 玄貴,コンテキストを考慮した画像生成のための敵対的生成ネットワークの提案,第11回データ工学と情報マネジメントに関するフォーラム (第17回日本データベース学会年次大会) [online] ,一般社団法人 電子情報通信学会、一般社団法人 日本データベース学会、一般社団法人 情報処理学会,2019年03月06日,DEIM Forum 2019 A5-3, Internet<URL:http://db-event.jpn.org/deim2019/post/papers/282.pdf>
高橋 輝,店舗の分散表現に対する意味演算を用いた飲食店検索手法,第12回データ工学と情報マネジメントに関するフォーラム (第18回日本データベース学会年次大会) [online] ,一般社団法人 電子情報通信学会、一般社団法人 日本データベース学会、一般社団法人 情報処理学会,2020年03月04日,DEIM 2020 P1-15, Internet<URL:https://proceedings-of-deim.github.io/DEIM2020/papers/P1-15.pdf>

Also Published As

Publication number Publication date
JP2021179696A (en) 2021-11-18

Similar Documents

Publication Publication Date Title
US11310559B2 (en) Method and apparatus for recommending video
CN109947919B (en) Method and apparatus for generating text matching model
US11216459B2 (en) Multi-layer semantic search
CN104094255B (en) For searching for the method and apparatus of image and computer readable recording medium storing program for performing for performing this method
US10810494B2 (en) Systems, methods, and computer program products for extending, augmenting and enhancing searching and sorting capabilities by learning and adding concepts on the fly
WO2020118741A1 (en) Efficient and accurate named entity recognition method and apparatus
CN105517679B (en) Determination of the geographic location of a user
JP5808371B2 (en) Image recognition apparatus, image recognition method, and image recognition program
US11334715B2 (en) Topic-identifying information processing device, topic-identifying information processing method, and topic-identifying computer program product
CN113297891A (en) Video information processing method and device and electronic equipment
CN110263218B (en) Video description text generation method, device, equipment and medium
CN112766284A (en) Image recognition method and device, storage medium and electronic equipment
US9424484B2 (en) Feature interpolation
CN114625918A (en) Video recommendation method, device, equipment, storage medium and program product
JP7440338B2 (en) Information processing device, information processing method, information processing program, and recording medium
Schroth et al. Rapid image retrieval for mobile location recognition
WO2018131132A1 (en) Information processing device, information processing method, and program
CN110851629A (en) Image retrieval method
CN112307243A (en) Method and apparatus for retrieving image
CN114780757A (en) Short media label extraction method and device, computer equipment and storage medium
KR102193571B1 (en) Electronic device, image searching system and controlling method thereof
CN114241361A (en) Video gene extraction and video matching method and device based on video gene
US10909154B2 (en) Search system, search method and search program
WO2022044104A1 (en) Image matching apparatus, control method, and non-transitory computer-readable storage medium
CN115905584B (en) Video splitting method and device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231017

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231102

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240215

R150 Certificate of patent or registration of utility model

Ref document number: 7440338

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150