JP6537477B2 - Search system, search method, computer program thereof and recording medium recording the computer program - Google Patents
Search system, search method, computer program thereof and recording medium recording the computer program Download PDFInfo
- Publication number
- JP6537477B2 JP6537477B2 JP2016139878A JP2016139878A JP6537477B2 JP 6537477 B2 JP6537477 B2 JP 6537477B2 JP 2016139878 A JP2016139878 A JP 2016139878A JP 2016139878 A JP2016139878 A JP 2016139878A JP 6537477 B2 JP6537477 B2 JP 6537477B2
- Authority
- JP
- Japan
- Prior art keywords
- server
- fluctuation
- glossary
- client
- writing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
本発明は、表記揺れ用語集作成装置、検索システム、それらの方法、それらのコンピュータプログラム及びそれらのコンピュータプログラムを記録した記録媒体に関する。 The present invention relates to a writing fluctuation glossary creation device, a search system, methods thereof, computer programs thereof, and recording media recording the computer programs thereof.
近年、インターネット及び移動体端末装置の普及と相まって、カーナビゲーション装置やスマートフォン等の移動体端末装置を利用した目的地検索が日常的に行われている。そして、この目的地検索は、一般に、目的地の地名や施設名を入力して行われている。これに関連する技術として、特許文献1では、入力された検索用の文字に基づいて候補目的地を検索し、各候補目的地に対し、その内容と現在の状況に基づいて、表記する優先度を決定し、決定した優先度の高い候補目的地を優先して表記するナビゲーション装置が開示されている。
一方、表記ゆれを含むデータに対する検索処理の網羅性を向上させるための技術として、表記ゆれ辞書を作成し、作成された表記ゆれ辞書を用いて、検索要求で受け付けた検索ワードに対応する表記ゆれのパターンを特定し、特定されたパターンの文字列を含む検索を実行するデータ検索システムが開示されている(特許文献2)。
本発明に関連する従来技術を開示する特許文献3〜5も参照されたい。
In recent years, in conjunction with the spread of the Internet and mobile terminal devices, destination search using mobile terminal devices such as car navigation devices and smart phones is routinely performed. And this destination search is generally performed by inputting the place name or facility name of the destination. As a technique related to this, in Patent Document 1, the candidate destinations are searched based on the input search character, and for each candidate destination, the priority to be written based on the content and the current situation A navigation device is disclosed that determines and designates the determined high priority candidate destinations with priority.
On the other hand, as a technique for improving the comprehensiveness of search processing for data including notation fluctuation, a notation fluctuation dictionary is created, and the notation fluctuation corresponding to the search word received in the search request is generated using the created notation fluctuation dictionary. Patent Document 2 discloses a data search system which identifies a pattern of and performs a search including a string of the identified pattern.
See, also, US Pat.
一般的な検索システムでは、検索クエリを構成する文字列と施設データベース等の検索データベース中に格納されている施設名称等のキーワードを構成する文字列とを比較し、完全一致、前方一致、部分一致等しているか否かで、検索クエリに対応する施設検索が行われている。しかしながら、ユーザが入力した検索クエリに表記揺れが含まれていることにより、検索データベース内のキーワードと合致せず、ユーザの所望する施設が検索されない場合もある。そこで、本発明者は、施設等を検索するユーザが入力した検索クエリがその施設の正確な表記でない場合であっても、施設データベースからユーザが所望する施設を検索可能とすべく鋭意検討を重ねてきた。その結果、所定のルールに沿って当該検索クエリの表記揺れ用語から構成される表記揺れ用語集を作成することに想到した。このような表記揺れ用語集を検索クエリとともに施設検索に用いることで、検索クエリで検索される施設に加えて、表記揺れ用語集に含まれる表記揺れ用語で検索される施設も検索でき、広範な検索を行うことが可能となる。 In a general search system, a character string constituting a search query is compared with a character string constituting a keyword such as a facility name stored in a search database such as a facility database, and perfect match, forward match, partial match The facility search corresponding to the search query is performed depending on whether they are equal or not. However, when the search query input by the user includes a writing fluctuation, it may not match the keyword in the search database and the facility desired by the user may not be searched. Therefore, even if the search query input by the user who searches for a facility etc. is not an accurate description of the facility, the present inventor repeatedly diligently studied to make it possible to search for the facility desired by the user from the facility database. It has As a result, it was conceived to create a writing fluctuation glossary composed of writing fluctuation terms of the search query according to a predetermined rule. By using such a expression swing glossary together with a search query for facility search, in addition to the facilities searched by the search query, it is possible to search a facility searched by a expression swing term included in the expression swing glossary, and a wide range of It becomes possible to do a search.
この発明は上述の課題に鑑みてなされたものであり、その第1の局面は次のように規定される。即ち、
検索クエリに対する表記揺れ用語集を作成する装置であって、
前記表記揺れ用語集は、第1の表記揺れ用語集及び第2の表記揺れ用語集を含み、
前記検索クエリを第1のルールで処理して得られる第1の表記揺れ用語からなる前記第1の表記揺れ用語集を作成し、第1の表記揺れ用語集格納部に格納する第1の作成部と、
前記第1の表記揺れ用語集を前記第1のルールと異なる第2のルールで処理して得られる第2の表記揺れ用語からなる前記第2の表記揺れ用語集を作成し、第2の表記揺れ用語集格納部に格納する第2の作成部と、
を備える、表記揺れ用語集作成装置。
This invention is made in view of the above-mentioned subject, and the 1st situation is specified as follows. That is,
An apparatus for creating a expression fluctuation glossary for a search query, wherein
The sway glossary includes a first sway glossary and a second sway glossary,
A first creation of creating the first transcription fluctuation glossary of the first transcription fluctuation terms obtained by processing the search query according to the first rule, and storing the first transcription fluctuation glossary in the first transcription fluctuation glossary storage unit Department,
Creating a second transcription fluctuation glossary comprising a second transcription fluctuation term obtained by processing the first transcription fluctuation glossary according to a second rule different from the first rule; A second creating unit stored in the shaking glossary storage unit;
Notation swing glossary creation device equipped with.
このように規定される第1の局面の表記揺れ用語集作成装置によれば、検索クエリを第1のルールで処理して第1の表記揺れ用語から構成される第1の表記揺れ用語集を作成し、作成された第1の表記揺れ用語を第1のルールと異なる第2のルールで処理して第2の表記揺れ用語から構成される第2の表記揺れ用語集を作成し、第1の表記揺れ用語集及び第2の表記揺れ用語集を対応する検索クエリと関連付けて格納する。このようにして作成された表記揺れ用語集を施設検索に用いれば、ユーザが入力した検索クエリに対応する施設だけでなく、表記揺れ用語集に対応する検索クエリの表記揺れを考慮した広範な施設検索が可能となる。また、このような表記揺れ用語集を用いた検索装置によれば、検索クエリの表記揺れを含む広範な検索が可能となるだけでなく、該表記揺れ用語集を用いることで表記揺れを含む検索の検索速度を向上させることが可能となる等、コンピュータの機能を改良することができる。 According to the expression fluctuation glossary creating device of the first aspect defined in this way, the first expression fluctuation glossary composed of the first expression fluctuation terms by processing the search query according to the first rule Create and process the created first writing fluctuation terms with a second rule different from the first rule to create a second writing fluctuation glossary composed of the second writing fluctuation terms, And the second fluctuation vocabulary are stored in association with the corresponding search query. If the expression fluctuation glossary created in this way is used for the facility search, not only the facility corresponding to the search query input by the user but also a wide range of facilities considering the fluctuation of the expression of the search query corresponding to the expression fluctuation glossary Search is possible. Moreover, according to a search device using such a expression fluctuation glossary, not only a broad search including expression fluctuation of a search query becomes possible, but also a search including expression fluctuation by using the expression fluctuation glossary It is possible to improve the function of the computer, such as improving the search speed of
表記揺れ用語とは、検索クエリの文字列と表記が部分的に異なるものの同義を示す用語を意味し、例えば、検索クエリを形態素解析、漢字−カタカナ変換、カタカナ漢字変換、アルファベット−カタカナ変換、カタカナ−アルファベット変換、「ヴァ」から「バ」等カタカナ表記の揺らぎ変換等のルールに基づいて処理することにより得られる。表記揺れ用語には、該検索クエリから得られた表記揺れ用語に対して、更に、当該処理を行って得られた用語も含まれる。
表記揺れ用語集とは、検索クエリに対して同一のルールで処理された一又は複数の表記揺れ用語から構成されるものを意味する。検索クエリから得られた表記揺れ用語を更に他のルールで処理して得られた一又は複数の表記揺れ用語から構成されるものも含まれる。
また、形態素解析とは、形態素から構成される文字列を各形態素に分割する作業を意味し、漢字−カタカナ変換とは、文字列中の各漢字について音読み変換し、又は、訓読み変換し、又は、音読み変換及び訓読み変換の組み合わせを意味する。
ここで、前記第1のルールは形態素解析の手法とすることができる(第2の局面)。
The term "swinging term" means a term that indicates the synonym of a search query string and a partially different notation but, for example, the search query includes morphological analysis, kanji-katakana conversion, katakana-kanji conversion, alphabet-katakana conversion, katakana -It is obtained by processing based on rules such as alphabet conversion, fluctuation conversion of katakana notation such as "va" to "ba", and the like. The term fluctuation term also includes a term obtained by performing the processing on a term fluctuation term obtained from the search query.
The expression fluctuation glossary means what is comprised from one or more expression fluctuation terms processed by the same rule to a search query. The term also includes those composed of one or more notation fluctuation terms obtained by processing the notation fluctuation terms obtained from the search query according to further rules.
In addition, morpheme analysis means an operation of dividing a character string composed of morphemes into morphemes, and kanji-katakana conversion performs phonetic reading conversion or training reading conversion for each kanji in the character string, or , Meaning a combination of phonetic conversion and training conversion.
Here, the first rule can be a method of morphological analysis (second aspect).
この発明の第3の局面は次のように規定される。即ち、
クライアント端末からの検索クエリに基づいて、該クライアント端末とネットワークを介して通信可能に接続されたサーバ装置が検索を実行する検索システムであって、
前記クライアント端末は、
検索クエリの入力を受け付ける入力受付部と、
前記入力を受け付けた検索クエリを前記第1のルールで処理して得られる第1のクライアント側表記揺れ用語からなる第1のクライアント側表記揺れ用語集を作成し、第1のクライアント側表記揺れ用語集格納部に格納する第1のクライアント側作成部と、
前記第1のクライアント側表記揺れ用語集を前記第2のルールで処理して得られる第2のクライアント側表記揺れ用語からなる第2のクライアント側表記揺れ用語集を作成し、第2のクライアント側表記揺れ用語集格納部に格納する第2のクライアント側作成部と、
を備え、
前記サーバ装置は、
施設名称及び/又は施設住所を含む施設情報を記憶する施設データベースと、
前記施設名称及び/又は施設住所に含まれるキーワードを第1のルールで処理して得られる第1のサーバ側表記揺れ用語からなる第1のサーバ側表記揺れ用語集を作成し、第1のサーバ側表記揺れ用語集格納部に格納する第1のサーバ側作成部と、
前記第1のサーバ側表記揺れ用語集を前記第1のルールと異なる第2のルールで処理して得られる第2のサーバ側表記揺れ用語からなる第2のサーバ側表記揺れ用語集を作成し、第2のサーバ側表記揺れ用語集格納部に格納する第2のサーバ側作成部と、
前記第1のクライアント側表記揺れ用語集と前記第1のサーバ側表記揺れ用語集とを比較し、前記第1のクライアント側表記揺れ用語に合致する前記第1のサーバ側表記揺れ用語を抽出する第1の抽出部と、
前記第2のクライアント側表記揺れ用語集と前記第2のサーバ側表記揺れ用語集とを比較し、前記第2のクライアント側表記揺れ用語に合致する前記第2のサーバ側表記揺れ用語を抽出する第2の抽出部と、
前記第1の抽出部で抽出された第1のサーバ側表記揺れ用語及び前記第2の抽出部で抽出された第2のサーバ側表記揺れ用語にスコアを付与する第1のスコア付与部と、
を備える、検索システム。
The third aspect of the present invention is defined as follows. That is,
A search system in which a server apparatus communicably connected to a client terminal via a network executes a search based on a search query from the client terminal,
The client terminal is
An input reception unit that receives an input of a search query;
Creating a first client-side transcription wobble glossary comprising a first client-side transcription fluctuation term obtained by processing the search query having received the input according to the first rule; A first client side creation unit stored in the collection storage unit;
Creating a second client-side transcription wobble glossary consisting of a second client-side transcription fluctuation term obtained by processing the first client-side transcription fluctuation glossary according to the second rule; A second client-side creation unit stored in the writing fluctuation glossary storage unit;
Equipped with
The server device is
A facility database storing facility information including a facility name and / or a facility address;
Creating a first server-side handwritten swing glossary comprising a first server-side handwritten swing term obtained by processing the facility name and / or a keyword included in the facility address according to a first rule; A first server-side creation unit stored in the side-notation swing glossary storage unit;
Creating a second server-side transcription wobble glossary comprising a second server-side transcription fluctuation term obtained by processing the first server-side transcription fluctuation glossary according to a second rule different from the first rule; , A second server-side creation unit stored in a second server-side writing fluctuation glossary storage unit,
Comparing the first client-side writing swing glossary with the first server-side writing swing glossary, and extracting the first server-side writing swing term that matches the first client-side writing swing term A first extractor,
Comparing the second client-side writing swing glossary with the second server-side writing swing glossary, and extracting the second server-side writing swing terms that match the second client-side writing swing term A second extractor,
A first scoring unit for adding a score to the first server-side writing fluctuation term extracted by the first extraction unit and the second server-side writing fluctuation term extracted by the second extraction unit;
A search system comprising.
このように規定される第3の局面の検索システムによれば、クライアント端末において検索クエリに基づき第1の局面と同様に第1のルール及び第2のルールで処理してクライアント側表記揺れ用語集を作成する一方、サーバ装置においても施設データベース中の施設の名称等に基づき第1の局面と同様に第1のルール及び第2のルールで処理してサーバ側表記揺れ用語集を作成し、第1のルールで処理された表記揺れ用語集同士を比較して、第1のクライアント側表記揺れ用語に合致する第1のサーバ側表記揺れ用語を抽出し、第2のルールで処理された表記揺れ用語集同士を比較して、第2のクライアント側表記揺れ用語に合致する第2のサーバ側表記揺れ用語を抽出し、抽出された第1のサーバ側表記揺れ用語及び第2のサーバ側表記揺れ用語に、検索結果の出力順位の指標となるスコアを付与する。このようにしてクライアント端末及びサーバ装置の両者において夫々作成された表記揺れ用語集を施設検索に用いれば、ユーザが入力した検索クエリに対応する施設だけでなく、表記揺れ用語集に対応する検索クエリの表記揺れを考慮した広範な施設検索が可能となる。また、このような表記揺れ用語集を用いた検索システムによれば、検索クエリ及び施設名称等の表記揺れを含む広範な検索が可能となるだけでなく、該表記揺れ用語集を用いることで表記揺れを含む検索の検索速度を向上させることが可能となる等、コンピュータの機能を改良することができる。 According to the search system of the third aspect defined in this manner, the client terminal processes the first rule and the second rule in the same manner as the first aspect based on the search query and processes the client side expression fluctuation glossary In the same way as in the first aspect, the server device also processes the first rule and the second rule to create a server-side transcription fluctuation glossary, based on the facility name etc. in the facility database. The first server-side writing fluctuation term matching the first client-side writing fluctuation term is extracted by comparing the writing fluctuation glossaries processed by the rule 1 and the writing fluctuation processed by the second rule The glossaries are compared with each other to extract a second server-side transcription term matching the second client-side transcription term, and the extracted first server-side transcription term and second server-side notation The Re term, imparts a score indicative of an output order of the search results. By using the term fluctuation glossary created respectively in both the client terminal and the server apparatus for facility search in this way, a search query corresponding not only to the facility corresponding to the search query input by the user but also the term fluctuation glossary A wide range of facility searches can be made in consideration of the fluctuation of notation. Moreover, according to a search system using such a expression fluctuation glossary, not only is it possible to perform a wide range of searches including expression fluctuation such as search queries and facility names, etc., the expression is expressed using the expression fluctuation glossary It is possible to improve the function of the computer, such as it becomes possible to improve the search speed of the search including the fluctuation.
前記第1のスコア付与部は、前記第1の抽出部で抽出された第1のサーバ側表記揺れ用語に、前記第2の抽出部で抽出された第2のサーバ側表記揺れ用語よりも高いスコアを付与することができる(第4の局面)。
ユーザが入力した検索クエリからの表記の変化度合いが小さいクライアント側表記揺れ用語ほど、すなわち、検索クエリから少ない回数の表記揺れ処理によって得られたクライアント側表記揺れ用語ほど、より精度良くユーザの想定する施設を表していると推測される。この推測に基づけば、サーバ装置内の施設データベースに格納された施設のうち、検索クエリからの表記の変化度合いがより小さい第1のクライアント側表記揺れ用語と合致する第1のサーバ側表記揺れ用語に高いスコアを付与して、該第1のサーバ側表記揺れ用語に関連付けられた第1の施設を検索結果として高順位に出力することが好ましい。そして、第1のクライアント側表記揺れ用語を介して得られた第2のクライアント側表記揺れ用語に合致した第2のサーバ側表記揺れ用語に、第1のサーバ側表記揺れ用語に付与したスコアより低いスコアを付与して、該第2のサーバ側表記揺れ用語に関連付けられた第2の施設を第1の施設より低い順位に出力することが好ましい。
The first scoring unit is higher than the second server-side writing fluctuation term extracted by the second extracting unit in the first server-side writing fluctuation term extracted by the first extraction unit. A score can be given (fourth phase).
The more accurate the client-side notation fluctuation terms that the degree of change in the expression from the search query input by the user is smaller, that is, the client-side notation fluctuation terms obtained by the processing of the notation fluctuation processing from the search query It is presumed to represent a facility. Based on this assumption, among the facilities stored in the facility database in the server device, the first server-side transcription fluctuation term that matches the first client-side transcription fluctuation term having a smaller degree of change in expression from the search query It is preferable to give a high score to and output the first facility associated with the first server-side writing fluctuation term as a search result in high priority. Then, based on the score given to the first server-side writing fluctuation term, the second server-side writing fluctuation term matching the second client-side writing fluctuation term obtained through the first client-side writing fluctuation term Preferably, a low score is given to output the second facility associated with the second server-side writing swing term to a lower rank than the first facility.
この発明の第5の局面は次のように規定される。即ち、
第3又は第4の局面に規定の検索システムにおいて、前記入力を受け付けた検索クエリと前記第1のサーバ側表記揺れ用語集とを比較し、前記入力を受け付けた検索クエリに合致する前記第1のサーバ側表記揺れ用語を抽出する第3の抽出部と、
前記入力を受け付けた検索クエリと前記第2のサーバ側表記揺れ用語集とを比較し、前記入力を受け付けた検索クエリに合致する前記第2のサーバ側表記揺れ用語を抽出する第4の抽出部と、
前記第3の抽出部で抽出された第1のサーバ側表記揺れ用語に、前記第4の抽出部で抽出された第2のサーバ側表記揺れ用語よりも高いスコアを付与する第2のスコア付与部と、を備える。
このように規定される第5の局面の検索システムによれば、検索クエリと合致する第1のサーバ側表記揺れ用語に、該検索クエリと合致する第2のサーバ側表記揺れ用語に比べ高いスコアを付与する。施設名称等からの表記揺れ処理回数の少ない第1のサーバ側表記揺れ用語に関連付けられた施設の方が、表記揺れ処理を二回行って得られた第2のサーバ側表記揺れ用語に関連付けられた施設に比べて、該検索クエリを入力したユーザの所望する施設により近いと推定される。
The fifth aspect of the present invention is defined as follows. That is,
In the search system defined in the third or fourth aspect, the search query for which the input is received is compared with the first server-side writing fluctuation glossary, and the first search engine that matches the search query for which the input is received A third extraction unit for extracting server-side notation fluctuation terms of
A fourth extraction unit that compares the search query receiving the input with the second server-side writing fluctuation glossary, and extracts the second server-side writing fluctuation term that matches the search query receiving the input When,
A second score giving a score higher than the second server-side writing fluctuation term extracted by the fourth extracting unit to the first server-side writing fluctuation term extracted by the third extracting unit And a unit.
According to the search system of the fifth aspect defined in this manner, the first server-side writing fluctuation term matching the search query has a higher score than the second server-side writing fluctuation term matching the search query. Grant The facility associated with the first server-side writing fluctuation term with a small number of writing fluctuation processing from the facility name etc. is associated with the second server-side writing fluctuation term obtained by performing the writing fluctuation processing twice. It is estimated that it is closer to the desired facility of the user who has input the search query, as compared to the selected facility.
この発明の第6の局面は次のように規定される。即ち、
第3又は第4の局面に規定の検索システムにおいて、前記第1のクライアント側表記揺れ用語集と前記第2のサーバ側表記揺れ用語集とを比較し、前記第1のクライアント側表記揺れ用語に合致する前記第2のサーバ側表記揺れ用語を抽出する第5の抽出部と、
前記第5の抽出部で抽出された第2のサーバ側表記揺れ用語に、前記第1の抽出部で抽出された第1のサーバ側表記揺れ用語及び前記第2の抽出部で抽出された第2のサーバ側表記揺れ用語よりも低いスコアを付与する第3のスコア付与部と、を備える。
The sixth aspect of the present invention is defined as follows. That is,
In the search system as defined in the third or fourth aspect, comparing the first client-side transcription fluctuation glossary with the second server-side transcription fluctuation glossary, in the first client-side transcription fluctuation term A fifth extractor for extracting the matching second server-side writing fluctuation terms;
In the second server-side writing fluctuation terms extracted by the fifth extraction unit, the first server-side writing fluctuation terms extracted by the first extraction unit and the second extraction unit extracted by the second extraction unit And a third scoring unit that assigns a score lower than the two server-side writing fluctuation terms.
また、この発明の第7の局面は次のように規定される。即ち、
検索クエリに対する表記揺れ用語集を作成する方法であって、
前記表記揺れ用語集は、第1の表記揺れ用語集及び第2の表記揺れ用語集を含み、
第1の作成部が、前記検索クエリを第1のルールで処理して得られる第1の表記揺れ用語からなる前記第1の表記揺れ用語集を作成し、第1の表記揺れ用語集格納部に格納する第1の作成ステップと、
第2の作成部が、前記第1の表記揺れ用語集を前記第1のルールと異なる第2のルールで処理して得られる第2の表記揺れ用語からなる前記第2の表記揺れ用語集を作成し、第2の表記揺れ用語集格納部に格納する第2の作成ステップと、
を備える、表記揺れ用語集作成方法。
このように規定される第7の局面の発明によれば、第1の局面と同等の効果を奏する。
The seventh aspect of the present invention is defined as follows. That is,
A method of creating a writing fluctuation glossary for a search query, comprising:
The sway glossary includes a first sway glossary and a second sway glossary,
A first creation unit creates the first transcription fluctuation glossary consisting of a first transcription fluctuation term obtained by processing the search query according to a first rule, and a first transcription fluctuation glossary storage section A first creation step to store in
The second transcription fluctuation glossary including a second transcription fluctuation term obtained by processing the first transcription fluctuation glossary according to a second rule different from the first rule. A second creating step of creating and storing in a second writing fluctuation glossary storage;
How to make a writing vocabulary glossary.
According to the invention of the seventh aspect defined as above, the same effects as the first aspect are exerted.
この発明の第8の局面は次のように規定される。即ち、
第7の局面の方法において、前記第1のルールは形態素解析の手法である。
このように規定される第8の局面の発明によれば、第2の局面と同等の効果を奏する。
The eighth aspect of the present invention is defined as follows. That is,
In the method of the seventh aspect, the first rule is a method of morphological analysis.
According to the invention of the eighth aspect defined as above, the same effects as the second aspect are exerted.
この発明の第9の局面は次のように規定される。即ち、
クライアント端末からの検索クエリに基づいて、該クライアント端末とネットワークを介して通信可能に接続されたサーバ装置が検索を実行する検索方法であって、
前記クライアント端末において、入力受付部が、検索クエリの入力を受け付ける入力受付ステップと、
前記クライアント端末において、第1のクライアント側作成部が、前記入力を受け付けた検索クエリを前記第1のルールで処理して得られる第1のクライアント側表記揺れ用語からなる第1のクライアント側表記揺れ用語集を作成し、第1のクライアント側表記揺れ用語集格納部に格納する第1のクライアント側作成ステップと、
前記クライアント端末において、第2のクライアント側作成部が、前記第1のクライアント側表記揺れ用語集を前記第2のルールで処理して得られる第2のクライアント側表記揺れ用語からなる第2のクライアント側表記揺れ用語集を作成し、第2のクライアント側表記揺れ用語集格納部に格納する第2のクライアント側作成ステップと、
前記サーバ装置において、施設名称及び/又は施設住所を含む施設情報を施設データベースに記憶する記憶ステップと、
前記サーバ装置において、第1のサーバ側作成部が、前記施設名称及び/又は施設住所に含まれるキーワードを第1のルールで処理して得られる第1のサーバ側表記揺れ用語からなる第1のサーバ側表記揺れ用語集を作成し、第1のサーバ側表記揺れ用語集格納部に格納する第1のサーバ側作成ステップと、
前記サーバ装置において、第2のサーバ側作成部が、前記第1のサーバ側表記揺れ用語集を前記第1のルールと異なる第2のルールで処理して得られる第2のサーバ側表記揺れ用語からなる第2のサーバ側表記揺れ用語集を作成し、第2のサーバ側表記揺れ用語集格納部に格納する第2のサーバ側作成ステップと、
前記サーバ装置において、第1の抽出部が、前記第1のクライアント側表記揺れ用語集と前記第1のサーバ側表記揺れ用語集とを比較し、前記第1のクライアント側表記揺れ用語に合致する前記第1のサーバ側表記揺れ用語を抽出する第1の抽出ステップと、
前記サーバ装置において、第2の抽出部が、前記第2のクライアント側表記揺れ用語集と前記第2のサーバ側表記揺れ用語集とを比較し、前記第2のクライアント側表記揺れ用語に合致する前記第2のサーバ側表記揺れ用語を抽出する第2の抽出ステップと、
前記サーバ装置において、第1のスコア付与部が、前記第1の抽出ステップで抽出された第1のサーバ側表記揺れ用語及び前記第2の抽出ステップで抽出された第2のサーバ側表記揺れ用語にスコアを付与する第1のスコア付与ステップと、
を備える、検索方法。
このように規定される第9の局面の発明によれば、第3の局面と同等の効果を奏する。
The ninth aspect of the present invention is defined as follows. That is,
A search method in which a server apparatus communicably connected to a client terminal via a network executes a search based on a search query from the client terminal,
In the client terminal, an input accepting step of accepting an input of a search query by an input accepting unit;
In the client terminal, a first client-side writing fluctuation consisting of a first client-side writing fluctuation term obtained by processing a search query in which the first client-side creating unit receives the input according to the first rule. A first client-side creation step of creating a glossary and storing it in a first client-side transcription vocabulary storage;
In the client terminal, a second client that includes a second client-side transcription fluctuation term obtained by processing the first client-side transcription fluctuation glossary according to the second rule by a second client-side creation unit A second client-side creation step of creating a side-notch swing glossary and storing it in a second client-side off-track glossary storage;
A storage step of storing facility information including a facility name and / or a facility address in a facility database in the server device;
In the server device, a first server-side creating unit is a first server-side handwritten swing term obtained by processing a keyword included in the facility name and / or facility address according to a first rule. A first server-side creating step of creating a server-side transcription fluctuation glossary and storing the server-side transcription fluctuation glossary in a first server-side transcription fluctuation glossary storage;
In the server apparatus, a second server-side transcription fluctuation term obtained by processing the first server-side transcription fluctuation glossary according to a second rule different from the first rule in a second server-side creation unit A second server-side creation step of creating a second server-side transcription wobble glossary and storing the second server-side transcription fluctuation glossary in the second server-side transcription fluctuation glossary storage;
In the server device, a first extraction unit compares the first client-side writing fluctuation glossary with the first server-side writing fluctuation glossary, and matches the first client-side writing fluctuation term. A first extraction step for extracting the first server-side writing fluctuation term;
In the server device, a second extraction unit compares the second client-side writing fluctuation glossary with the second server-side writing fluctuation glossary, and matches the second client-side writing fluctuation term A second extraction step of extracting the second server-side writing fluctuation term;
In the server device, the first scoring unit determines the first server-side expression fluctuation term extracted in the first extraction step and the second server-side expression fluctuation term extracted in the second extraction step. A first scoring step for scoring the
A search method comprising.
According to the invention of the ninth aspect thus defined, the same effect as the third aspect is exerted.
この発明の第10の局面は次のように規定される。即ち、
第9の局面に規定の方法において、前記第1のスコア付与ステップでは、前記第1の抽出ステップで抽出された第1のサーバ側表記揺れ用語に、前記第2の抽出ステップで抽出された第2のサーバ側表記揺れ用語よりも高いスコアを付与する。
このように規定される第10の局面の発明によれば、第4の局面と同等の効果を奏する。
The tenth aspect of the present invention is defined as follows. That is,
In the method as defined in the ninth aspect, in the first scoring step, the first server-side writing fluctuation term extracted in the first extraction step is extracted in the second extraction step. Give a higher score than 2 server-side writing wobble terms.
According to the invention of the tenth aspect as defined above, the same effect as that of the fourth aspect is exerted.
この発明の第11の局面は次のように規定される。即ち、
第9又は第10の局面に規定の方法において、第3の抽出部が、前記入力を受け付けた検索クエリと前記第1のサーバ側表記揺れ用語集とを比較し、前記入力を受け付けた検索クエリに合致する前記第1のサーバ側表記揺れ用語を抽出する第3の抽出ステップと、
第4の抽出部が、前記入力を受け付けた検索クエリと前記第2のサーバ側表記揺れ用語集とを比較し、前記入力を受け付けた検索クエリに合致する前記第2のサーバ側表記揺れ用語を抽出する第4の抽出ステップと、
第2のスコア付与部が、前記第3の抽出ステップで抽出された第1のサーバ側表記揺れ用語に、前記第4の抽出ステップで抽出された第2のサーバ側表記揺れ用語よりも高いスコアを付与する第2のスコア付与ステップと、を備える。
このように規定される第11の局面の発明によれば、第5の局面と同等の効果を奏する。
The eleventh aspect of the present invention is defined as follows. That is,
In the method as defined in the ninth or tenth aspect, the third extraction unit compares the search query receiving the input with the first server-side writing fluctuation glossary, and the search query receives the input A third extraction step for extracting the first server-side writing fluctuation term that matches
A fourth extraction unit compares the search query receiving the input with the second server-side writing fluctuation glossary, and the second server-side writing fluctuation term that matches the search query receiving the input is A fourth extraction step to extract;
A second scoring unit scores the first server-side writing fluctuation term extracted in the third extraction step higher than the second server-side writing fluctuation term extracted in the fourth extraction step. And a second scoring step of
According to the invention of the eleventh aspect as defined above, the same effect as that of the fifth aspect is exerted.
この発明の第12の局面は次のように規定される。即ち、
第9又は第10の局面に規定の方法において、第5の抽出部が、前記第1のクライアント側表記揺れ用語集と前記第2のサーバ側表記揺れ用語集とを比較し、前記第1のクライアント側表記揺れ用語に合致する前記第2のサーバ側表記揺れ用語を抽出する第5の抽出ステップと、
第3のスコア付与部が、前記第5の抽出ステップで抽出された第2のサーバ側表記揺れ用語に、前記第1の抽出ステップで抽出された第1のサーバ側表記揺れ用語及び前記第2の抽出ステップで抽出された第2のサーバ側表記揺れ用語よりも低いスコアを付与する第3のスコア付与ステップと、を備える。
このように規定される第12の局面の発明によれば、第6の局面と同等の効果を奏する。
The twelfth aspect of the present invention is defined as follows. That is,
In the method as defined in the ninth or tenth aspect, the fifth extraction unit compares the first client-side writing swing glossary with the second server-side writing swing glossary, and Extracting a second server-side typographical term that matches the client-side typographical term;
A third scoring unit applies the second server-side transcription fluctuation term extracted in the fifth extraction step to the first server-side transcription fluctuation term extracted in the first extraction step and the second Providing a score lower than the second server-side writing fluctuation term extracted in the extracting step.
According to the invention of the twelfth aspect as defined above, the same effect as that of the sixth aspect is exerted.
更に、この発明の第13の局面は次のように規定される。即ち、
検索クエリに対する表記揺れ用語集を作成するためのコンピュータプログラムであって、
前記表記揺れ用語集は、第1の表記揺れ用語集及び第2の表記揺れ用語集を含み、
コンピュータを、
前記検索クエリを第1のルールで処理して得られる第1の表記揺れ用語からなる前記第1の表記揺れ用語集を作成し、第1の表記揺れ用語集格納手段に格納する第1の作成手段と、
前記第1の表記揺れ用語集を前記第1のルールと異なる第2のルールで処理して得られる第2の表記揺れ用語からなる前記第2の表記揺れ用語集を作成し、第2の表記揺れ用語集格納手段に格納する第2の作成手段、
として機能させる、コンピュータプログラム。
このように規定される第13の局面の発明によれば、第1の局面と同等の効果を奏する。
Furthermore, the thirteenth aspect of the present invention is defined as follows. That is,
A computer program for creating a writing fluctuation glossary for a search query, comprising:
The sway glossary includes a first sway glossary and a second sway glossary,
Computer,
A first creation of creating the first transcription fluctuation glossary of the first transcription fluctuation terms obtained by processing the search query according to the first rule and storing the first transcription fluctuation glossary in the first transcription fluctuation glossary storage means Means,
Creating a second transcription fluctuation glossary comprising a second transcription fluctuation term obtained by processing the first transcription fluctuation glossary according to a second rule different from the first rule; Second creating means for storing in the shaking glossary storing means,
A computer program to function as.
According to the invention of the thirteenth aspect as defined above, the same effects as in the first aspect are exerted.
この発明の第14の局面は次のように規定される。即ち、
第13の局面に規定のコンピュータプログラムにおいて、前記第1のルールは形態素解析の手法である。
このように規定される第14の局面の発明によれば、第2の局面と同等の効果を奏する。
The fourteenth aspect of the present invention is defined as follows. That is,
In the computer program defined in the thirteenth aspect, the first rule is a method of morphological analysis.
According to the invention of the fourteenth aspect as defined above, the same effects as the second aspect are exerted.
この発明の第15の局面は次のように規定される。即ち、
クライアント端末からの検索クエリに基づいて、該クライアント端末とネットワークを介して通信可能に接続されたサーバ装置が検索するよう構成された検索システムに適用されるコンピュータプログラムであって、
前記クライアント端末として機能するコンピュータを、
検索クエリの入力を受け付ける入力受付手段と、
前記入力を受け付けた検索クエリを前記第1のルールで処理して得られる第1のクライアント側表記揺れ用語からなる第1のクライアント側表記揺れ用語集を作成し、第1のクライアント側表記揺れ用語集格納手段に格納する第1のクライアント側作成手段と、
前記第1のクライアント側表記揺れ用語集を前記第2のルールで処理して得られる第2のクライアント側表記揺れ用語からなる第2のクライアント側表記揺れ用語集を作成し、第2のクライアント側表記揺れ用語集格納手段に格納する第2のクライアント側作成手段、
として機能させ、
前記サーバ装置として機能するコンピュータを、
施設名称及び/又は施設住所を含む施設情報を施設データベースに記憶する記憶手段と、
前記施設名称及び/又は施設住所に含まれるキーワードを第1のルールで処理して得られる第1のサーバ側表記揺れ用語からなる第1のサーバ側表記揺れ用語集を作成し、第1のサーバ側表記揺れ用語集格納手段に格納する第1のサーバ側作成手段と、
前記第1のサーバ側表記揺れ用語集を前記第1のルールと異なる第2のルールで処理して得られる第2のサーバ側表記揺れ用語からなる第2のサーバ側表記揺れ用語集を作成し、第2のサーバ側表記揺れ用語集格納手段に格納する第2のサーバ側作成手段と、
前記第1のクライアント側表記揺れ用語集と前記第1のサーバ側表記揺れ用語集とを比較し、前記第1のクライアント側表記揺れ用語に合致する前記第1のサーバ側表記揺れ用語を抽出する第1の抽出手段と、
前記第2のクライアント側表記揺れ用語集と前記第2のサーバ側表記揺れ用語集とを比較し、前記第2のクライアント側表記揺れ用語に合致する前記第2のサーバ側表記揺れ用語を抽出する第2の抽出手段と、
前記第1の抽出手段で抽出された第1のサーバ側表記揺れ用語及び前記第2の抽出部で抽出された第2のサーバ側表記揺れ用語にスコアを付与する第1のスコア付与手段、
として機能させる、コンピュータプログラム。
このように規定される第15の局面の発明によれば、第3の局面と同等の効果を奏する。
The fifteenth aspect of the present invention is defined as follows. That is,
A computer program applied to a search system configured to be searched by a server apparatus communicably connected to the client terminal via a network based on a search query from the client terminal,
A computer that functions as the client terminal;
Input receiving means for receiving a search query input;
Creating a first client-side transcription wobble glossary comprising a first client-side transcription fluctuation term obtained by processing the search query having received the input according to the first rule; First client-side creating means stored in the collection storage means;
Creating a second client-side transcription wobble glossary consisting of a second client-side transcription fluctuation term obtained by processing the first client-side transcription fluctuation glossary according to the second rule; Second client-side creation means stored in the expression fluctuation glossary storage means,
To act as
A computer that functions as the server device;
Storage means for storing facility information including facility name and / or facility address in a facility database;
Creating a first server-side handwritten swing glossary comprising a first server-side handwritten swing term obtained by processing the facility name and / or a keyword included in the facility address according to a first rule; A first server-side creating unit to be stored in the side writing fluctuation glossary storing unit;
Creating a second server-side transcription wobble glossary comprising a second server-side transcription fluctuation term obtained by processing the first server-side transcription fluctuation glossary according to a second rule different from the first rule; , Second server-side creating means stored in the second server-side writing fluctuation glossary storing means,
Comparing the first client-side writing swing glossary with the first server-side writing swing glossary, and extracting the first server-side writing swing term that matches the first client-side writing swing term A first extraction means,
Comparing the second client-side writing swing glossary with the second server-side writing swing glossary, and extracting the second server-side writing swing terms that match the second client-side writing swing term A second extraction means,
A first scoring means for scoring a first server-side writing fluctuation term extracted by the first extraction unit and a second server-side writing fluctuation term extracted by the second extraction unit;
A computer program to function as.
According to the invention of the fifteenth aspect defined as described above, the same effects as in the third aspect are exerted.
この発明の第16の局面は次のように規定される。即ち、
第15の局面に規定のコンピュータプログラムにおいて、前記第1のスコア付与手段は、前記第1の抽出手段で抽出された第1のサーバ側表記揺れ用語に、前記第2の抽出手段で抽出された第2のサーバ側表記揺れ用語よりも高いスコアを付与する。
このように規定される第16の局面の発明によれば、第4の局面と同等の効果を奏する。
The sixteenth aspect of the present invention is defined as follows. That is,
In the computer program defined in the fifteenth aspect, the first scoring unit is extracted by the second extraction unit into the first server-side writing fluctuation term extracted by the first extraction unit. Gives a higher score than the second server-side writing wobble term.
According to the invention of the sixteenth aspect defined as described above, the same effect as that of the fourth aspect is exerted.
この発明の第17の局面は次のように規定される。即ち、
第15又は第16の局面に規定のコンピュータプログラムにおいて、前記サーバ装置として機能するコンピュータを、更に、
前記入力を受け付けた検索クエリと前記第1のサーバ側表記揺れ用語集とを比較し、前記入力を受け付けた検索クエリに合致する前記第1のサーバ側表記揺れ用語を抽出する第3の抽出手段と、
前記入力を受け付けた検索クエリと前記第2のサーバ側表記揺れ用語集とを比較し、前記入力を受け付けた検索クエリに合致する前記第2のサーバ側表記揺れ用語を抽出する第4の抽出手段と、
前記第3の抽出手段で抽出された第1のサーバ側表記揺れ用語に、前記第4の抽出手段で抽出された第2のサーバ側表記揺れ用語よりも高いスコアを付与する第2のスコア付与手段、
として機能させる。
このように規定される第17の局面の発明によれば、第5の局面と同等の効果を奏する。
The seventeenth aspect of the present invention is defined as follows. That is,
In the computer program defined in the fifteenth or sixteenth aspect, a computer functioning as the server device, further comprising:
Third extraction means for comparing the search query receiving the input with the first server-side writing fluctuation glossary, and extracting the first server-side writing fluctuation term that matches the search query receiving the input When,
Fourth extraction means for comparing the search query having received the input with the second server-side expression fluctuation glossary, and extracting the second server-side expression fluctuation term matching the search query having received the input When,
A second score giving a higher score to the first server-side writing fluctuation term extracted by the third extracting means than the second server-side writing fluctuation term extracted by the fourth extracting means means,
Act as
According to the invention of the seventeenth aspect thus defined, the same effect as that of the fifth aspect is exerted.
この発明の第18の局面は次のように規定される。即ち、
第19の局面に規定のコンピュータプログラムにおいて、前記サーバ装置として機能するコンピュータを、更に、
前記第1のクライアント側表記揺れ用語集と前記第2のサーバ側表記揺れ用語集とを比較し、前記第1のクライアント側表記揺れ用語に合致する前記第2のサーバ側表記揺れ用語を抽出する第5の抽出手段と、
前記第5の抽出手段で抽出された第2のサーバ側表記揺れ用語に、前記第1の抽出手段で抽出された第1のサーバ側表記揺れ用語及び前記第2の抽出手段で抽出された第2のサーバ側表記揺れ用語よりも低いスコアを付与する第3のスコア付与手段、
として機能させる。
このように規定される第18の局面の発明によれば、第6の局面と同等の効果を奏する。
The eighteenth aspect of the present invention is defined as follows. That is,
In the computer program defined in the nineteenth aspect, a computer functioning as the server device, further comprising:
Comparing the first client-side writing swing glossary with the second server-side writing swing glossary, and extracting the second server-side writing swing terms that match the first client-side writing swing term A fifth extraction means,
In the second server-side writing fluctuation terms extracted by the fifth extraction means, the first server-side writing fluctuation terms extracted by the first extraction means and the second extraction terms extracted by the second extraction means A third scoring means, which gives a score lower than 2 server-side writing wobble terms,
Act as
According to the invention of the eighteenth aspect defined as described above, the same effects as in the sixth aspect are exerted.
第13〜第18のいずれかの局面に規定されるコンピュータプログラムを記録する記録媒体が第19の局面として規定される。 A recording medium recording the computer program defined in any one of the thirteenth to eighteenth aspects is defined as a nineteenth aspect.
この発明の実施の形態の表記揺れ用語集作成装置を説明する。
図1に、表記揺れ用語集作成装置1の概略構成を示す。
図1に示すように、この表記揺れ用語集作成装置1は、入力受付部3、表記揺れ用語集作成部5及び表記揺れ用語集格納部7を備えている。本実施の形態では、ユーザが使用するクライアント端末に搭載される表記揺れ用語集作成装置1であって、ユーザが入力した検索クエリに基づいて表記揺れ用語集を作成する表記揺れ用語集作成装置1について説明しているが、これに限らず、本発明の表記揺れ用語集作成装置は、サーバ装置に搭載され、施設名称等のキーワードに基づいて表記揺れ用語集を作成する装置であっても良い。サーバ装置に搭載される表記揺れ用語集作成装置の場合には、後述の入力受付部はサーバ装置内又はサーバ装置外に備えられた検索データベースに格納される施設名称等のキーワードのうち、オペレータが選択するキーワードの入力を受け付け、又は、任意のキーワードの自動入力を受け付ける。
A description is given of a writing fluctuation glossary creating apparatus according to an embodiment of the present invention.
FIG. 1 shows a schematic configuration of a writing fluctuation glossary creating apparatus 1.
As shown in FIG. 1, the expression fluctuation glossary creating device 1 includes an input receiving unit 3, a expression fluctuation
入力受付部3は、ユーザによる検索クエリの入力を受け付ける。当該検索クエリは、ユーザが検索時に入力する単語やフレーズ等の複合語であり、検索条件等検索データベースに対する要求や問い合わせを文字列にしたものである。当該文字列としては、漢字、ひらがな、カタカナ、アルファベット、数字、記号等が挙げられ、これらのうちの1つ、あるいは2つ以上を組み合わせたものが挙げられる。当該文字列は、表示画面において各文字に割り当てられた文字キーを夫々タッチすることによって、又はキーボード等の入力部を用いることによってその入力を受け付けることができる。 The input receiving unit 3 receives an input of a search query by the user. The said search query is compound words, such as a word and a phrase which a user inputs at the time of a search, and makes a request and a query to search databases, such as search conditions, a character string. The character strings include kanji characters, hiragana characters, katakana characters, alphabets, numbers, symbols and the like, and one or a combination of two or more of them may be mentioned. The said character string can receive the input by each touching the character key allocated to each character on a display screen, or by using input parts, such as a keyboard.
表記揺れ用語集作成部5は、上記検索クエリに関する表記揺れ用語集を作成する。表記揺れ用語集作成部5は、第1の作成部501及び第2の作成部502を備える。
第1の作成部501は、検索クエリに基づいて第1の表記揺れ用語集を作成する。すなわち、第1の作成部501は、入力受付部3で入力受付された検索クエリを第1のルールで処理して得られる第1の表記揺れ用語からなる第1の表記揺れ用語集を作成する。当該第1の表記揺れ用語集の作成の際に用いる第1のルールとしては特に限定されないが、例えば、形態素解析、漢字−カタカナ変換、カタカナ−漢字変換、カタカナ−アルファベット変換又はアルファベット−カタカナ変換等の手法を用いることができる。例えば、検索クエリ「白鳥庭園」の場合、形態素解析によれば、形態素「白鳥」及び形態素「庭園」という単位に分解され、第1の表記揺れ用語は「白鳥、庭園」となる。この場合、第1の表記揺れ用語集は、第1の表記揺れ用語「白鳥、庭園」から構成される。一方、漢字−カタカナ変換によれば、検索クエリ「白鳥庭園」は、「シラトリテイエン」、「シロトリテイエン」、「ハクチョウテイエン」のようにカタカナ変換される。この場合、第1の表記揺れ用語集は、第1の表記揺れ用語「シラトリテイエン」、「シロトリテイエン」、「ハクチョウテイエン」から構成される。作成された第1の表記揺れ用語集は、上記検索クエリと関連付けて第1の格納部701に格納される。
The expression fluctuation
The first creating
第2の作成部502は、第1の表記揺れ用語集に基づいて第2の表記揺れ用語集を作成する。すなわち、第2の作成部502は、第1の作成部501で作成された第1の表記揺れ用語集を上記第1のルールと異なる第2のルールで処理して得られる第2の表記揺れ用語からなる第2の表記揺れ用語集を作成する。当該第2の表記揺れ用語集の作成の際に用いる第2のルールは特に限定されず、上記第1のルールと同様、形態素解析、漢字−カタカナ変換、カタカナ−漢字変換、カタカナ−アルファベット変換又はアルファベット−カタカナ変換等の手法を用いることができる。例えば、第1のルールとして形態素解析を用いて作成された第1の表記揺れ用語集を構成する第1の表記揺れ用語が「白鳥、庭園」である場合、第2の作成部502は第2のルールとして漢字−カタカナ変換を用いて、「シラトリ、テイエン」、「シロトリ、テイエン」、「ハクチョウ、テイエン」のようにカタカナ変換される。この場合、第2の表記揺れ用語集は、第2の表記揺れ用語「シラトリ、テイエン」、「シロトリ、テイエン」、「ハクチョウ、テイエン」から構成される。作成された第2の表記揺れ用語集は、上記検索クエリ及び/又は第1の表記揺れ用語と関連付けて第2の格納部702に格納される。
The second creating
表記揺れ用語集格納部7は、第1の作成部501で作成された第1の表記揺れ用語集を格納する第1の格納部701、及び、第2の作成部502で作成された第2の表記揺れ用語集を格納する第2の格納部702を備える。
上記の表記揺れ用語集作成装置1は、表記揺れ用語集作成部5内に第1の作成部501及び第2の作成部502の二つの作成部を備えているが、これに限定されることなく、作成部の数は二つを超えるものであってもよい。この場合、各作成部は他の作成部が用いたルールと異なるルールを用いることとしてもよいし、直前の作成部が用いたルールと異なるルールを用いることとしてもよい。また、表記揺れ用語集格納部7内の格納部は、作成部の数に対応して備えられる。
The writing fluctuation
Although the above-mentioned writing fluctuation glossary compilation device 1 is provided with two creation parts of the
図2を用いて、図1に示す装置1の動作の一例を説明する。この例において、表記揺れ用語集作成装置1は、検索クエリ「白鳥庭園」に関する表記揺れ用語集を作成する。
まず、ステップ1では、入力受付部3は、検索クエリ「白鳥庭園」の入力を受け付ける。
ステップ3では、第1の作成部501は、ステップ1で入力を受け付けた検索クエリ「白鳥庭園」を形態素解析により、第1の形態素「白鳥」及び第2の形態素「庭園」の二つの単位に分解して得られた「白鳥、庭園」を第1の表記揺れ用語とし、該第1の表記揺れ用語「白鳥、庭園」から構成される第1の表記揺れ用語集を作成し、作成された第1の表記揺れ用語集を検索クエリ「白鳥庭園」と関連付けて第1の格納部701に格納する。
An example of the operation of the device 1 shown in FIG. 1 will be described using FIG. In this example, the expression fluctuation glossary preparing device 1 generates an expression fluctuation glossary relating to a search query “Swan Garden”.
First, in step 1, the input reception unit 3 receives an input of the search query "Swan Garden".
In step 3, the
ステップ5では、第2の作成部502は、ステップ3で作成された第1の表記揺れ用語集に含まれる第1の表記揺れ用語「白鳥、庭園」を漢字−カタカナ変換により、第2の表記揺れ用語「シラトリ、テイエン」、「シロトリ、テイエン」、「ハクチョウ、テイエン」から構成される第2の表記揺れ用語集を作成し、作成された第2の表記揺れ用語集を検索クエリ「白鳥庭園」と関連付けて第2の格納部702に格納する。上記第2の表記揺れ用語は、第1の表記揺れ用語「白鳥、庭園」中の第1の形態素「白鳥」をカタカナ変換した「シラトリ」、「シロトリ」、「ハクチョウ」と、第2の形態素「庭園」をカタカナ変換した「テイエン」とを夫々組み合わせて構成される。
In
ステップ1〜5を実行することにより、表記揺れ用語集作成装置1は、検索クエリ「白鳥庭園」に対応する表記揺れ用語集として、第1の表記揺れ用語集「白鳥、庭園」、第2の表記揺れ用語集「シラトリ、テイエン」、「シロトリ、テイエン」、「ハクチョウ、テイエン」から構成される用語集を作成する。検索クエリ「白鳥庭園」に対し、このような表記揺れ用語集を作成することにより、クライアント端末において検索クエリ「白鳥庭園」の入力を受け付けた際に、検索データベースとしての施設データベースに格納されている施設のうち、その施設情報に「白鳥庭園」のキーワードを含む施設「白鳥庭園」だけでなく、「白鳥」及び「庭園」のキーワードを含む施設、例えば、施設「白鳥日本庭園」を検索することが可能となる。該施設データベースは、表記揺れ用語集作成装置を備える移動体端末装置等に搭載されていてもよく、また、移動体端末装置と通信可能なサーバ装置に搭載されていてもよい。 By executing steps 1 to 5, the expression fluctuation glossary creation device 1 sets the first expression fluctuation glossary "Swan, garden", the second as the expression fluctuation glossary corresponding to the search query "Swan garden". Create a glossary consisting of the expression fluctuation glossary "Shiratori, Tyeng", "Shirotori, Tyeng", and "Purchine, Tyeng". The search query "Swan Garden" is stored in a facility database as a search database when input of the search query "Swan Garden" is accepted at the client terminal by creating such a expression fluctuation vocabulary. Among the facilities, search not only facilities "Swan Garden" that includes the keyword "Swan Garden" in its facility information but also facilities that include the keywords "Swan" and "garden", for example, the facility "Swan Japanese Garden" Is possible. The facility database may be mounted on a mobile terminal device or the like provided with a writing fluctuation glossary creation device, or may be mounted on a server device capable of communicating with the mobile terminal device.
他の例として、表記揺れ用語集作成装置が二つを超える作成部を備えた場合ついて説明する。この例において、表記揺れ用語集作成装置は、検索クエリ「しらとり庭園」に関する表記揺れ用語集を作成する。
まず、ステップ21では、ステップ1と同様に、入力受付部は、検索クエリ「しらとり庭園」の入力を受け付ける。
ステップ23では、ステップ3と同様に、第1の作成部は、ステップ21で入力を受け付けた検索クエリ「しらとり庭園」を形態素解析して、第1の表記揺れ用語「しらとり、庭園」から構成される第1の表記揺れ用語集を作成し、第1の格納部に格納する。
As another example, the case where the writing fluctuation glossary creating device includes more than two creating units will be described. In this example, the expression fluctuation glossary creation device generates an expression fluctuation glossary relating to the search query “Shirotori Garden”.
First, in step 21, as in step 1, the input receiving unit receives an input of the search query “Shiratori garden”.
In step 23, as in step 3, the first preparation unit morphologically analyzes the search query “Shiratori garden” which has received the input in step 21, and uses the first expression fluctuation term “Shiratori, garden”. Create a first transcription fluctuation glossary to be constructed and store in a first storage unit.
ステップ25では、ステップ5と同様に、第2の作成部は、ステップ23で作成された第1の表記揺れ用語集に含まれる第1の表記揺れ用語「しらとり、庭園」を漢字−カタカナ変換して、第2の表記揺れ用語「シラトリ、テイエン」から構成される第2の表記揺れ用語集を作成し、第2の格納部に格納する。
ステップ27では、第3の作成部(図示しない)は、ステップ25で作成された第2の表記揺れ用語集に含まれる第2の表記揺れ用語「シラトリ、テイエン」をカタカナ−漢字変換して、第3の表記揺れ用語「白鳥、庭園」から構成される第3の表記揺れ用語集を作成し、第3の格納部に格納する。
In step 25, as in
In step 27, the third creating unit (not shown) converts the second writing fluctuation term “Shiratori, Tien” included in the second writing fluctuation glossary created in step 25 into katakana-kanji, Create a third transcription swing glossary composed of the third transcription swing terms "swan, garden" and store it in the third storage unit.
ステップ29では、第4の作成部(図示しない)は、ステップ27で作成された第3の表記揺れ用語集に含まれる第3の表記揺れ用語「白鳥、庭園」を漢字−カタカナ変換して、第4の表記揺れ用語「シラトリ、テイエン」、「シロトリ、テイエン」、「ハクチョウ、テイエン」から構成される第4の表記揺れ用語集を作成し、第4の格納部に格納する。
ステップ21〜29を実行することにより、表記揺れ用語集作成装置は、検索クエリ「しらとり庭園」に対応する表記揺れ用語集として、第1の表記揺れ用語集「しらとり、庭園」、第2の表記揺れ用語集「シラトリ、テイエン」、第3の表記揺れ用語集「白鳥、庭園」、第4の表記揺れ用語集「シラトリ、テイエン」、「シロトリ、テイエン」、「ハクチョウ、テイエン」から構成される用語集を作成する。検索クエリ「しらとり庭園」に対しこのような表記揺れ用語集を作成することにより、クライアント端末において検索クエリ「しらとり庭園」の入力を受け付けた際に、施設データベースに格納されている施設のうち、その施設情報に「しらとり庭園」のキーワードを含む施設だけでなく、第3の表記揺れ用語集「白鳥、庭園」に基づき「白鳥」及び「庭園」のキーワードを含む施設、例えば、施設「白鳥庭園」を検索したり、第4の表記揺れ用語集「シロトリ、テイエン」に基づき「シロトリ」及び「テイエン」のキーワードをそのよみ情報に含む施設「白鳥庭園(よみ)シロトリテイエン」を検索することが可能となる。
In step 29, the fourth preparation unit (not shown) performs the Kanji-Katakana conversion of the third notation fluctuation term "swan, garden" included in the third notation fluctuation glossary created in step 27. A fourth writing fluctuation glossary composed of the fourth writing fluctuation terms "Shiratori, Tyeng", "Shirotori, Tyeng", and "Purchine, Tyeng" is created and stored in the fourth storage section.
By performing steps 21 to 29, the expression fluctuation glossary creation apparatus is configured to generate the first expression fluctuation glossary "Sirari, garden" as the expression fluctuation glossary corresponding to the search query "Sirtori Garden", 2nd Nomenclature fluctuation glossary "Shiratori, Teien", third notation fluctuation glossary "Swan, garden", fourth notation fluctuation glossary "Shiratori, Teien", "Shirotori, Teien", "War Swan, Teien" Create a glossary. Among the facilities stored in the facility database when the client terminal receives an input of the search query "Shirotori Garden" by creating such a expression fluctuation vocabulary for the search query "Shirotori Garden" Not only facilities that include the keyword "Shiratori Gardens" in their facility information, but also facilities that include the keywords "Swan" and "garden" based on the third expression Shake Glossary "Swan, Gardens", for example, facilities " Search for the Swan Garden, or search for the facility "Shirotori Garden (Yoromi) Shirotori Teien", which includes the keywords "Shirotori" and "Tien" in its information based on the fourth expression fluctuation glossary "Shirotori, Teien" It becomes possible.
図3に、本発明の実施の形態の検索システム100を示す。図3において、図1と同一の要素には同一の符号を付して、その説明を部分的に省略する。適宜、図4に示す表を用いて、以下に説明する。
図3に示すのは、第1のクライアント端末11、第2〜第nのクライアント端末(M2〜Mn)及びサーバ装置101を備える検索システム100であって、各クライアント端末とサーバ装置とはネットワークNを介して夫々無線接続されている。
第1のクライアント端末11としては、車載ナビゲーション装置や、ユーザが携帯可能な通信端末装置等が挙げられ、後者の例として、携帯電話機、PDA(Portable Digital Assistants)、携帯ゲーム機、ノート型PC、PND(Portable Navigation Device)、スマートフォン、頭部や腕等に装着可能なウェアラブル機器等が挙げられる。
FIG. 3 shows a search system 100 according to the embodiment of this invention. In FIG. 3, the same elements as those in FIG. 1 are denoted by the same reference numerals, and the description thereof will be partially omitted. This will be described below using the table shown in FIG. 4 as appropriate.
FIG. 3 shows a search system 100 including a
Examples of the
第1のクライアント端末11は、入力受付部13、クライアント側表記揺れ用語集作成部15、クライアント側表記揺れ用語集格納部17、検索要求部19及びクライアント側通信部20を備える。
入力受付部13、クライアント側表記揺れ用語集作成部15及びクライアント側表記揺れ用語集格納部17は、夫々入力受付部3、表記揺れ用語集作成部5及び表記揺れ用語集格納部7と同様に機能する。
この例において、入力受付部13は、検索クエリ「ビクトリー鶴舞」を受け付ける。
The
The
In this example, the
第1のクライアント側作成部1501は、第1のルールとしての形態素解析により、第1のクライアント側表記揺れ用語「ビクトリー、鶴舞」から構成される第1のクライアント側表記揺れ用語集(図4参照)を作成して第1のクライアント側表記揺れ用語集格納部1701に格納する。
第2のクライアント側作成部1502は、第2のルールとしての漢字−カタカナ変換及びカタカナ表記の揺らぎ変換により、第2のクライアント側表記揺れ用語「ビクトリー、ツルマイ」、「ヴィクトリー、ツルマイ」、「ビクトリー、ツルマ」、「ヴィクトリー、ツルマ」、「ビクトリー、カクマイ」・・・から構成される第2のクライアント側表記揺れ用語集(図4参照)を作成して第2のクライアント側表記揺れ用語集格納部1702に格納する。この例において、第2のルールとして「漢字−カタカナ変換」及び「カタカナ表記の揺らぎ変換」の両方を用いたが、第2のルールとして両者の一方、例えば「漢字−カタカナ変換」と用い、更に第3のルールとして他方の「カタカナ表記の揺らぎ変換」を用いて細分化して処理してもよい。
The first client-
The second client-side creating unit 1502 uses the second client-side expression fluctuation term “victory, thulmai”, “victory, thulmai”, “victory” by the kanji-katakana conversion and fluctuation conversion of katakana notation as the second rule. "Turuma", "Victory, Tulma", "Victory, Kakumai" ... Create a second client-side transcription fluctuation glossary (see Figure 4) and store the second client-side transcription fluctuation glossary It is stored in
検索要求部19は、入力受付部13を参照して、入力を受け付けた検索クエリ「ビクトリー鶴舞」に対応する施設の検索を要求する。当該検索要求の方法は、特に限定されないが、例えば、検索要求を示す「検索」等のボタンをタッチすることにより、検索要求を実行することができる。
クライアント側通信部20は、各種情報をサーバ装置101へ送信する送信部と、各種情報をサーバ装置101から受信する受信部とを備える。当該クライアント側通信部20が送信する情報としては、例えば、上記検索クエリ及びクライアント側表記揺れ用語集等が挙げられる。また、上記検索要求の実行は、該クライアント側通信部20を介してサーバ装置101へ送信される。一方、当該クライアント側通信部20が受信する情報としては、例えば、後述の検索部による検索結果、スコア等が挙げられる。
The
The client-
サーバ装置101は、施設データベース103、サーバ側表記揺れ用語集作成部105、サーバ側表記揺れ用語集格納部107、サーバ側通信部111、クライアント側表記揺れ用語集格納部113、検索部としての第1の抽出部115及び第2の抽出部116、第1のスコア付与部117及び第1のスコア格納部119を備える。
施設データベース103には、各施設に関連付けて施設名称及び/又は施設住所を含む施設情報が記憶されている。例えば、施設「ヴィクトリー鶴舞」に関連付けて記憶される施設情報として、例えば、施設名称「ヴィクトリー鶴舞」、施設名称よみ「ヴィクトリーツルマ」、施設住所「名古屋市中区千代田○丁目△番×号」、施設住所よみ「ナゴヤシナカクチヨダ○チョウメ△バン×ゴウ」等が挙げられる。また、施設「ビクトリーカフェ鶴舞」に関連付けて記憶される施設情報として、例えば、施設名称「ビクトリーカフェ鶴舞」、施設名称よみ「ビクトリーカフェツルマイ」、施設住所「名古屋市中区栄○丁目△番×号」、施設住所よみ「ナゴヤシナカクサカエ○チョウメ△バン×ゴウ」等が挙げられる。他にも、例えば、施設のジャンル、施設の内容を説明する情報、施設の口コミ情報等の施設情報が記憶されていてもよい。
The
The
サーバ側表記揺れ用語集作成部105は、施設データベース103内に格納されている施設名称や施設住所等の施設情報に関するサーバ側表記揺れ用語集を作成する。サーバ側表記揺れ用語集作成部105は、第1のサーバ側作成部1051及び第2のサーバ側作成部1052を備える。
第1のサーバ側作成部1051は、施設名称等に基づいて第1のサーバ側表記揺れ用語集を作成する。すなわち、第1のサーバ側作成部1051は、例えば、施設データベース103内の例えば施設名称を第1のルールで処理して得られる第1のサーバ側表記揺れ用語からなる第1のサーバ側表記揺れ用語集を作成する。当該第1のルールとしては、第1のクライアント側作成部1501で用いられる第1のルールと同一のルールを用いることができる。ここで、第1のクライアント側作成部1501と同様に第1のルールとして形態素解析を用いた場合、施設「ヴィクトリー鶴舞」に対して、第1のサーバ側表記揺れ用語「ヴィクトリー、鶴舞」から構成される第1のサーバ側表記揺れ用語集を作成して第1のサーバ側表記揺れ用語集格納部1071に格納する。
The server-side notation shaking
The first server-
第2のサーバ側作成部1052は、第1のサーバ側表記揺れ用語集に基づいて第2のサーバ側表記揺れ用語集を作成する。すなわち、第2のサーバ側作成部1052は、第1のサーバ側作成部1051で作成された第1のサーバ側表記揺れ用語集を上記第1のルールと異なる第2のルールで処理して得られる第2のサーバ側表記揺れ用語からなる第2の表記揺れ用語集を作成する。当該第2のルールとしては、第2のクライアント側作成部1502で用いられる第2のルールと同一のルールを用いることができる。ここで、第2のクライアント側作成部1502と同様に第2のルールとして漢字−カタカナ変換及びカタカナ表記の揺らぎ変換により、第2のクライアント側表記揺れ用語「ヴィクトリー、ツルマイ」、「ビクトリー、ツルマイ」、「ヴィクトリー、ツルマ」、「ビクトリー、ツルマ」、「ヴィクトリー、カクマイ」・・・から構成される第2のサーバ側表記揺れ用語集を作成して第2のサーバ側表記揺れ用語集格納部1072に格納する。
The second server-
また、施設「ビクトリーカフェ鶴舞」に対しては、上記と同様の方法によって、第1のサーバ側作成部1051において、第1のサーバ側表記揺れ用語「ビクトリー、カフェ、鶴舞」から構成される第1のサーバ側表記揺れ用語集が作成され、第2のサーバ側作成部1052において、第2のサーバ側表記揺れ用語「ビクトリー、カフェ、ツルマイ」、「ヴィクトリー、カフェ、ツルマイ」、「ビクトリー、カフェ、ツルマ」、「ヴィクトリー、カフェ、ツルマ」、「ビクトリー、カフェ、カクマイ」・・・から構成される第2のサーバ側表記揺れ用語集が作成される。
In addition, for the facility "Victory Cafe Tsurumai", the first server
サーバ側通信部111は、各種情報をクライアント端末11へ送信する送信部と、各種情報をクライアント端末11から受信する受信部とを備える。当該サーバ側通信部111が送信する情報としては、例えば、後述の検索部による検索結果、スコア等が挙げられる。また、一方、当該サーバ側通信部111が受信する情報としては、例えば、上記検索クエリ及びクライアント側表記揺れ用語集等が挙げられる。
クライアント側表記揺れ用語集格納部113はサーバ側通信部111で受信したクライアント側表記揺れ用語集を検索クエリと関連付けて格納し、第1のクライアント側表記揺れ用語集格納部1131及び第2のクライアント側表記揺れ用語集格納部1132を備える。
第1のクライアント側格納部1131には、第1のクライアント側格納部1701に格納された第1のクライアント側表記揺れ用語集が格納される。
第2のクライアント側格納部1132には、第2のクライアント側格納部1702に格納された第2のクライアント側表記揺れ用語集が格納される。
The server-
The client-side transcription fluctuation
The first client-
The second client-
第1の抽出部115は、第1のクライアント側格納部1131及び第1のサーバ側格納部1071を参照して、第1のクライアント側表記揺れ用語集と第1のサーバ側表記揺れ用語集とを比較し、第1のクライアント側表記揺れ用語に合致する第1のサーバ側表記揺れ用語を抽出する。第1の抽出部115は、第1のクライアント側表記揺れ用語に含まれる構成単位を全て含む第1のサーバ側表記揺れ用語を抽出することができる。すなわち、第1のクライアント側表記揺れ用語「ビクトリー、鶴舞」の場合、構成単位「ビクトリー」、「鶴舞」の両方を含む第1のサーバ側表記揺れ用語「ビクトリー、カフェ、鶴舞」が抽出される。第1のクライアント側表記揺れ用語が複数存在する場合には、夫々について上記と同様の方法により比較及び抽出を行う。当該抽出の際に、構成単位の数の異同を更なる条件としてもよく、第1のクライアント側表記揺れ用語の構成単位の数と合致する数の構成単位から構成される第1のサーバ側表記揺れ用語を抽出の対象とすることとしてもよい。他の例として、抽出された第1のサーバ側表記揺れ用語に該第1のサーバ側表記揺れ用語と第1のクライアント側表記揺れ用語との構成単位の数の異同に関する情報を関連付けておくこととしてもよい。このような構成単位の数の異同は、後述の表示順位決定部で検索結果の表示順位を決定する際に用いることができる。
The first extracting
第2の抽出部116は、第2のクライアント側格納部1132及び第2のサーバ側格納部1072を参照して、第2のクライアント側表記揺れ用語集と第2のサーバ側表記揺れ用語集とを比較し、第2のクライアント側表記揺れ用語に合致する第2のサーバ側表記揺れ用語を抽出する。当該抽出の方法は、第1の抽出部115と同様の方法で行うことができる。すなわち、第2のクライアント側表記揺れ用語「ビクトリー、ツルマイ」の場合、構成単位「ビクトリー」、「ツルマイ」の両方を含む第2のサーバ側表記揺れ用語「ビクトリー、ツルマイ」及び「ビクトリー、カフェ、ツルマイ」が抽出される。第2の抽出部116は、第1の抽出部115で抽出された第1のサーバ側表記揺れ用語に関連する施設を除く施設について第2の表記揺れ用語を抽出することとしてもよい。この例において、具体的には、施設「ビクトリーカフェ鶴舞」については第1の抽出部115で第1のサーバ側表記揺れ用語「ビクトリー、カフェ、鶴舞」が抽出されているため、第2の抽出部116は、施設「ビクトリーカフェ鶴舞」を除く施設、例えば、施設「ヴィクトリー鶴舞」について第2のサーバ側表記揺れ用語を抽出することができる。また、第1の抽出部115と同様、第2の抽出部116においても、当該抽出の際に、構成単位の数の異同を更なる条件としてもよく、又は、抽出された第2のサーバ側表記揺れ用語に構成単位の数の異同に関する情報を関連付けておくこととしてもよい。このような構成単位の数の異同は、上記と同様、後述の表示順位決定部で検索結果の表示順位を決定する際に用いることができる。
The second extracting
第1のスコア付与部117は、第1の抽出部115で抽出された第1のサーバ側表記揺れ用語及び第2の抽出部116で抽出された第2のサーバ側表記揺れ用語にスコアを付与する。当該スコア付与の方法として、例えば、第1の抽出部115で抽出された第1のサーバ側表記揺れ用語に、第2の抽出部116で抽出された第2のサーバ側表記揺れ用語よりも高いスコアを付与することができる。例えば、施設「ヴィクトリー鶴舞」について第2の抽出部116で抽出された第2のサーバ側表記揺れ用語「ビクトリー、ツルマイ」に対してスコア「1」を付与した場合、施設「ビクトリーカフェ鶴舞」について第1の抽出部115で抽出された第1のサーバ側表記揺れ用語「ビクトリー、カフェ、ツルマイ」に対してスコア「1」よりも高いスコア「2」を付与することができる。また、第2の抽出部116が、施設「ビクトリーカフェ鶴舞」についても第2のサーバ側表記揺れ用語「ビクトリー、カフェ、ツルマイ」を抽出した場合には、該第2のサーバ側表記揺れ用語に対してもスコア「1」を付与することができる。また、別の例として、第1のスコア付与部117は、上位の抽出部で抽出された表記揺れ用語に優先的にスコアを付与し、その場合には下位の抽出部で抽出された表記揺れ用語にはスコアを付与しないこととしてもよい。当該付与されたスコアは各サーバ側表記揺れ用語と関連付けて第1のスコア格納部119に格納される。当該スコアは、施設と関連付けて格納されてもよく、また、一の施設について複数のスコアが付与されている場合にはそれらのスコアの合計を施設と関連付けて格納してもよい。
The
図5に、他の実施の形態の検索システム300を示す。図5において、図1及び図3と同一の要素には同一の符号を付して、その説明を部分的に省略する。
図5に示すのは、図3に示す検索システム100において、サーバ装置101に代えてサーバ装置301を備える検索システム300である。
サーバ装置301は、サーバ装置100において、検索クエリ格納部313、第3の抽出部315、第4の抽出部316、第2のスコア付与部317及び第2のスコア格納部319を備える。
FIG. 5 shows a search system 300 of another embodiment. In FIG. 5, the same elements as those in FIGS.
What is shown in FIG. 5 is a search system 300 provided with a
The
検索クエリ格納部313には、クライアント端末11の入力受付部13及び検索要求部19にて入力受付され、検索要求され、通信部20及び111を介して取得された検索クエリが格納される。
第3の抽出部315は、検索クエリ格納部313及び第1のサーバ側格納部1071を参照して、検索クエリと第1のサーバ側表記揺れ用語集とを比較し、検索クエリに合致する第1のサーバ側表記揺れ用語を抽出する。
第4の抽出部316は、検索クエリ格納部313及び第2のサーバ側格納部1072を参照して、検索クエリと第2のサーバ側表記揺れ用語集とを比較し、検索クエリに合致する第2のサーバ側表記揺れ用語を抽出する。
第2のスコア付与部317は、第3の抽出部315で抽出された第1のサーバ側表記揺れ用語に、第4の抽出部316で抽出された第2のサーバ側表記揺れ用語よりも高いスコアを付与する。当該付与されたスコアは各サーバ側表記揺れ用語と関連付けて第2のスコア格納部319に格納される。
The search
The
The
The
図6に、他の実施の形態の検索システム400を示す。図6において、図1、図3及び図5と同一の要素には同一の符号を付して、その説明を部分的に省略する。
図6に示すのは、図3に示す検索システム100において、サーバ装置101に代えてサーバ装置401を備える検索システム400である。
サーバ装置401は、サーバ装置100において、第5の抽出部415、第3のスコア付与部417及び第3のスコア格納部419を備える。
FIG. 6 shows a search system 400 according to another embodiment. In FIG. 6, the same elements as those in FIGS. 1, 3 and 5 are denoted by the same reference numerals, and the description thereof will be partially omitted.
6 shows a search system 400 provided with a
The
第5の抽出部415は、第1のクライアント側格納部1131及び第2のサーバ側格納部1072を参照して、第1のクライアント側表記揺れ用語集と第2のサーバ側表記揺れ用語集とを比較し、第1のクライアント側表記揺れ用語に合致する第2のサーバ側表記揺れ用語を抽出する。
第3のスコア付与部417は、第1のスコア格納部119を参照して、第5の抽出部415で抽出された第2のサーバ側表記揺れ用語に、第1の抽出部115で抽出された第1のサーバ側表記揺れ用語及び第2の抽出部116で抽出された第2のサーバ側表記揺れ用語よりも低いスコアを付与する。当該付与されたスコアは各サーバ側表記揺れ用語と関連付けて第3のスコア格納部419に格納される。
The
The third
図7に実施例の検索システム500を示す。図7において、図1、図3、図5及び図6と同一の要素には同一の符号を付して、その説明を部分的に省略する。
図7に示すのは、施設の検索システムに関し、クライアント端末にて検索結果を出力する際に、付与されたスコアの高い施設を優先的に出力可能な検索システム500である。この検索システム500は、第1のクライアント端末510及びサーバ装置530を備えている。
第1のクライアント端末510は、制御部511、メモリ部512、出力部513、入力受付部13、インターフェース部514、通信部20、表記揺れ用語集作成部15、表記揺れ用語集格納部17及び検索要求部19を備えている。
FIG. 7 shows a search system 500 of the embodiment. In FIG. 7, the same elements as those in FIGS. 1, 3, 5 and 6 are assigned the same reference numerals, and the explanation thereof will be partially omitted.
What is shown in FIG. 7 relates to a search system for facilities, and is a search system 500 that can preferentially output a facility with a high score when the search result is output at the client terminal. The search system 500 includes a
The
クライアント側制御部511は、バッファメモリその他の装置を備えたコンピュータ装置であり、クライアント端末510を構成する他の要素を制御する。
クライアント側メモリ部512にはコンピュータプログラムが保存され、このコンピュータプログラムはコンピュータ装置である制御部511に読み込まれて、これを機能させる。このコンピュータプログラムはSD(登録商標)メモリカード等の汎用的な媒体へ保存できる。
The client-
A computer program is stored in the client-side memory unit 512, and the computer program is read by the
クライアント側出力部513はディスプレイを含み、後述の表示順位決定部535で決定された表示順位に従って、検索結果としての施設を表示する。また、一般的な出力部としての機能として目的地検索のための検索画面、地図、クライアント端末の現在位置、経路探索を行った際の案内経路、その他の情報を表示する。この出力部513は音声発信部を含み、音声によって上記検索結果を出力してもよい。
クライアント側インターフェース部514はクライアント端末510を無線ネットワーク等へ連結させる。
The client side output unit 513 includes a display, and displays facilities as search results according to the display order determined by the display
The client side interface unit 514 connects the
サーバ装置530は、制御部531、メモリ部532、インターフェース部533、通信部111、施設データベース103、表記揺れ用語集作成部105、表記揺れ用語集格納部107、表記揺れ用語集格納部113、第1の抽出部115、第2の抽出部116、第1のスコア付与部117、第1のスコア格納部119及び表示順位決定部535を備えている。
サーバ側制御部531は、CPU、バッファメモリその他の装置を備えたコンピュータ装置であり、サーバ装置530を構成する他の要素を制御する。
The
The server-
サーバ側メモリ部532にはコンピュータプログラムが保存され、このコンピュータプログラムはコンピュータ装置であるサーバ側制御部531に読み込まれて、これを機能させる。このコンピュータプログラムはDVD等の汎用的な媒体へ保存できる。
サーバ側インターフェース部533はサーバ装置530を無線ネットワーク等へ連結させる。
A computer program is stored in the server-side memory unit 532. The computer program is read by the server-
The server side interface unit 533 connects the
表示順位決定部535は、第1スコア格納部119に格納された第1のスコアに基づいて、第1の抽出部115及び第2の抽出部116で抽出された表記揺れ用語が関連する施設の表示順位を決定する。当該表示順位の決定の結果、当該スコアの値が大きい施設を上位に表示することができる。例えば、上記例において、表示順位決定部535は、検索クエリ「ビクトリー鶴舞」に対して、第1の抽出部115で抽出された第1のサーバ側表記揺れ用語「ビクトリー、カフェ、鶴舞」が関連する施設「ビクトリーカフェ鶴舞」のスコア「2」と、第2の抽出部116で抽出された第2のサーバ側表記揺れ用語「ビクトリー、ツルマイ」が関連する施設「ヴィクトリー鶴舞」のスコア「1」に基づいて、両検索結果のうち施設「ビクトリーカフェ鶴舞」を第1順位に、施設「ヴィクトリー鶴舞」を第2順位に表示することを決定する。当該決定された表示順位は、施設に関連付けて、通信部111及び20を介してクライアント端末510の出力部513から上述の通り出力される。
Based on the first score stored in the first
表示順位決定部535は、さらに、上述した構成単位の数の異同を上記表示順位に反映させてもよい。例えば、表示順位を決定する対象となる複数の施設のうち、そのスコアが同じである施設については検索クエリと構成単位の数が同じである施設が上位に表示されるよう表示順位を決定することができる。他の例として、構成単位の数の異同に基づく参照スコアを別途設け、上記第1のスコアを付与する際に参照スコアを考慮することとしてもよい。例えば、該構成単位の数が同じであるときに参照スコアとして正のスコア(例えば、スコア「5」)を付与し、又は、該構成単位の数が異なるときに参照スコアとして負のスコア(例えば、スコア「−5」)を付与することができる。前者の場合、例えば、2つの構成要素「ビクトリー」及び「鶴舞」から構成される検索クエリ「ビクトリー鶴舞」に対して、第1のサーバ側表記揺れ用語「ビクトリー、カフェ、鶴舞」は構成要素が3であり異なる一方、第2のサーバ側表記揺れ用語「ヴィクトリー、鶴舞」は構成要素が2つであり同じ数であるため、参照スコア「5」を付与する。この場合において、第1のサーバ側表記揺れ用語「ビクトリー、カフェ、鶴舞」が関連する施設「ビクトリーカフェ鶴舞」のスコア「2」に対して、第2のサーバ側表記揺れ用語「ビクトリー、ツルマイ」が関連する施設「ヴィクトリー鶴舞」は参照スコア「5」が加味され合計スコア「6」となるため、表示順位決定部535は合計スコアの値が大きい施設「ヴィクトリー鶴舞」を施設「ビクトリーカフェ鶴舞」より上位に表示させる。
The display
図8を用いて、図7に示す検索システム500の動作の一例を説明する。
まず、ステップ51では、クライアント端末510に備えられた入力受付部13は、検索ユーザの検索クエリに関する入力を受け付ける。この例において、検索クエリ「ビクトリー鶴舞」の入力を受け付けたものとする。
ステップ53では、クライアント側表記揺れ用語集作成部15内の第1のクライアント側作成部1501は、ステップ51の入力受付に基づき、検索クエリ「ビクトリー鶴舞」を形態素解析して、第1のクライアント側表記揺れ用語「ビクトリー、鶴舞」から構成される第1のクライアント側表記揺れ用語集を作成して、第1のクライアント側表記揺れ用語集格納部1701に格納する。
An example of the operation of the search system 500 shown in FIG. 7 will be described using FIG.
First, in step 51, the
In step 53, the first client-
ステップ55では、クライアント側表記揺れ用語集作成部15内の第2のクライアント側作成部1502は、ステップ53で作成された第1のクライアント側表記揺れ用語集に基づき、第1のクライアント側表記揺れ用語「ビクトリー、鶴舞」を漢字−カタカナ変換及びカタカナ表記の揺らぎ変換して、第2のクライアント側表記揺れ用語「ビクトリー、ツルマイ」、「ヴィクトリー、ツルマイ」、「ビクトリー、ツルマ」、「ヴィクトリー、ツルマ」、「ビクトリー、カクマイ」・・・から構成される第2のクライアント側表記揺れ用語集を作成して、第2のクライアント側表記揺れ用語集格納部1702に格納する。
ステップ57では、検索要求部19は、ステップ51の検索クエリに対応する施設の検索要求を行うべく、該検索クエリ、ステップ53の第1の表記揺れ用語集及びステップ55の第2の表記揺れ用語集を、クライアント側通信部20を介してサーバ装置530に送信する。
In step 55, the second client-side creating unit 1502 in the client-side writing fluctuation glossary creating unit 15 generates the first client-side writing fluctuation based on the first client-side writing fluctuation glossary created in step 53. The term "victory, tsurumai" is converted to the kanji-katakana conversion and katakana notation fluctuation, and the second client-side expression fluctuation term "victory, thulmai", "victory, thulmai", "victory, thulma", "victory, thulma" The second client-side writing fluctuation glossary composed of “Victory, Kakumai,...” Is created and stored in the second client-side writing fluctuation
In step 57, the
ステップ61では、サーバ側表記揺れ用語集作成部105内の第1のサーバ側作成部1051は、施設データベース103内に格納されている施設の施設名称を形態素解析して、第1のサーバ側表記揺れ用語から構成される第1のサーバ側表記揺れ用語集を作成して、第1のサーバ側表記揺れ用語集格納部1071に格納する。この例において、図4に示す通り、施設「ヴィクトリー鶴舞」について第1のサーバ側表記揺れ用語集「ヴィクトリー、鶴舞」が作成され、施設「ビクトリーカフェ鶴舞」について第1のサーバ側表記揺れ用語集「ビクトリー、カフェ、鶴舞」が作成される。
In step 61, the first server-
ステップ63では、サーバ側表記揺れ用語集作成部105内の第2のサーバ側作成部1052は、ステップ61で作成された第1のサーバ側表記揺れ用語集を漢字−カタカナ変換及びカタカナ表記湯の揺らぎ変換して、第2のサーバ側表記揺れ用語を作成して、第2のサーバ側表記揺れ用語集格納部1072に格納する。この例において図4に示す通り、施設「ヴィクトリー鶴舞」について第2のサーバ側表記揺れ用語集「ヴィクトリー、ツルマイ」、「ビクトリー、ツルマイ」、「ヴィクトリー、ツルマ」、「ビクトリー、ツルマ」、「ヴィクトリー、カクマイ」・・・が作成され、施設「ビクトリーカフェ鶴舞」について第2のサーバ側表記揺れ用語集「ビクトリー、カフェ、ツルマイ」、「ヴィクトリー、カフェ、ツルマイ」、「ビクトリー、カフェ、ツルマ」、「ヴィクトリー、カフェ、ツルマ」、「ビクトリー、カフェ、カクマイ」・・・が作成される。
In step 63, the second server-
ステップ65では、サーバ装置530は、サーバ側通信部111を介して、ステップ57で送信された検索要求を受信する。受信された第1のクライアント側表記揺れ用語集は、クライアント側表記揺れ用語集格納部113内の第1のクライアント側格納部1131に格納され、第2のクライアント側表記揺れ用語集は、第2のクライアント側格納部1132に格納される。
In step 65, the
ステップ67では、第1の抽出部115は、ステップ61で作成された第1のサーバ側表記揺れ用語集を参照して、第1のクライアント側格納部1131に格納された第1のクライアント側表記揺れ用語に合致する表記揺れ用語を抽出する。この例において、第1のクライアント側表記揺れ用語「ビクトリー、鶴舞」の構成単位「ビクトリー」、「鶴舞」の両方を含む第1のサーバ側表記揺れ用語「ビクトリー、カフェ、鶴舞」が施設「ビクトリーカフェ鶴舞」に関連付けられて抽出される。
ステップ69では、第2の抽出部116は、ステップ63で作成された第2のサーバ側表記揺れ用語集を参照して、第2のクライアント側格納部1132に格納された第2のクライアント側表記揺れ用語に合致する表記揺れ用語を抽出する。この例において、第2のクライアント側表記揺れ用語のうち「ビクトリー、ツルマイ」の場合、構成単位「ビクトリー」、「ツルマイ」の両方を含む第2のサーバ側表記揺れ用語「ビクトリー、ツルマイ」及び「ビクトリー、カフェ、ツルマイ」が夫々施設「ヴィクトリー鶴舞」、「ビクトリーカフェ鶴舞」に関連付けられて抽出される。
In step 67, the
In step 69, the
ステップ71では、第1のスコア付与部117は、ステップ67の第1のサーバ側表記揺れ用語及びステップ69の第2のサーバ側表記揺れ用語にスコアを付与し、第1のスコア格納部119に格納する。ステップ71において、第1のスコアは、ステップ67で抽出された第1のサーバ側表記揺れ用語に、ステップ69で抽出された第2のサーバ側表記揺れ用語よりも高いスコアを付与する。例えば、第1のサーバ側表記揺れ用語にスコア「2」、第2のサーバ側表記揺れ用語にスコア「1」を付与することができる。この例において、施設「ビクトリーカフェ鶴舞」の第1のサーバ側表記揺れ用語にスコア「2」、第2のサーバ側表記揺れ用語にスコア「1」を付与するとともに、施設「ヴィクトリー鶴舞」の第2のサーバ側表記揺れ用語にスコア「1」を付与する。
In step 71, the first
ステップ73では、表示順位決定部535は、ステップ71で付与されたスコアに基づき、夫々のサーバ側表記揺れ用語に関連付けられた施設の表示順位を決定する。当該表示順位の決定は、スコアの高い順に上位の表示順位となるよう決定される。例えば、一の施設について複数のサーバ側表記揺れ用語に夫々スコアが付与されている場合には、それらの合計スコアを表示順位決定の指標としてもよいし、一の施設について複数のサーバ側表記揺れ用語に付与されたスコアのうち最も高いスコアを表示順位決定の指標としてもよい。前者の場合、例えば、施設「ビクトリーカフェ鶴舞」のスコアは第1のサーバ側表記揺れ用語に対し「2」及び第2のサーバ側表記揺れ用語に対し「1」付与されているため、その合計スコアは「3」となる。施設「ヴィクトリー鶴舞」のスコアは第2のサーバ側表記揺れ用語に対し「1」付与されているため、その合計スコアは「1」である。したがって、その合計スコアがより大きい施設「ビクトリーカフェ鶴舞」が施設「ヴィクトリー鶴舞」に比べ上位の表示順位となる。後者の場合、例えば、施設「ビクトリーカフェ鶴舞」のサーバ側表記揺れ用語に付与されたスコアのうち最も高いスコアは「2」であり、施設「ヴィクトリー鶴舞」のサーバ側表記揺れ用語に付与されたスコアのうち最も高いスコアは「1」であるため、そのスコアがより大きい施設「ビクトリーカフェ鶴舞」が施設「ヴィクトリー鶴舞」に比べ上位の表示順位となる。
In step 73, the display
ステップ75では、ステップ73で決定された表示順位とともに、ステップ67及びステップ69で抽出されたサーバ側表記揺れ用語に関連付けられた施設を検索結果としてクライアント端末に送信する。
ステップ59では、クライアント端末510は、ステップ75の検索結果に関する情報を受信し、出力部513により出力する。この例において、出力部としての表示部は、検索結果として、第1順位に施設「ビクトリーカフェ鶴舞」、第2順位に施設「ヴィクトリー鶴舞」を表示する。
In step 75, along with the display order determined in step 73, the facility associated with the server-side handwritten swing term extracted in step 67 and step 69 is transmitted as a search result to the client terminal.
At step 59, the
以上、本発明の実施の形態及び実施例について説明してきたが、これらのうち、2つ以上の実施の形態(実施例)を組み合わせて実施しても構わない。あるいは、これらのうち、1つの実施の形態(実施例)を部分的に実施しても構わない。さらには、これらのうち、2つ以上の実施の形態(実施例)を部分的に組み合わせて実施しても構わない。 Although the embodiments and examples of the present invention have been described above, two or more of the embodiments (examples) may be combined and implemented. Alternatively, among these, one embodiment (example) may be partially implemented. Furthermore, among these, two or more of the embodiments (examples) may be partially combined and implemented.
この発明は、上記発明の実施の形態及び実施例の説明に何ら限定されるものではない。特許請求の範囲の記載を逸脱せず、当業者が容易に想到できる範囲で種々の変形態様もこの発明に含まれる。 The present invention is not limited to the description of the embodiments and examples of the above-mentioned invention. Various modifications are also included in the present invention as long as those skilled in the art can easily conceive of the claims without departing from the scope of the claims.
1 表記揺れ用語集作成装置
3 13 入力受付部
5 15 105 表記揺れ用語集作成部
7 17 107 113 表記揺れ用語集格納部
100 300 400 500 検索システム
11 510 クライアント端末
19 検索要求部
20 111 通信部
101 301 401 530 サーバ装置
103 施設データベース
115 116 315 316 415 抽出部
117 317 417 スコア付与部
119 319 419 スコア格納部
313 検索クエリ格納部
535 表示順位決定部
DESCRIPTION OF SYMBOLS 1 Notation fluctuation glossary compilation device 3 13
Claims (13)
前記クライアント端末は、
検索クエリの入力を受け付ける入力受付部と、
前記入力を受け付けた検索クエリを第1のルールで処理して得られる第1のクライアント側表記揺れ用語からなる第1のクライアント側表記揺れ用語集を作成し、第1のクライアント側表記揺れ用語集格納部に格納する第1のクライアント側作成部と、
前記第1のクライアント側表記揺れ用語集を第2のルールで処理して得られる第2のクライアント側表記揺れ用語からなる第2のクライアント側表記揺れ用語集を作成し、第2のクライアント側表記揺れ用語集格納部に格納する第2のクライアント側作成部と、
を備え、
前記サーバ装置は、
施設名称及び/又は施設住所を含む施設情報を記憶する施設データベースと、
前記施設名称及び/又は施設住所に含まれるキーワードを第1のルールで処理して得られる第1のサーバ側表記揺れ用語からなる第1のサーバ側表記揺れ用語集を作成し、第1のサーバ側表記揺れ用語集格納部に格納する第1のサーバ側作成部と、
前記第1のサーバ側表記揺れ用語集を前記第1のルールと異なる第2のルールで処理して得られる第2のサーバ側表記揺れ用語からなる第2のサーバ側表記揺れ用語集を作成し、第2のサーバ側表記揺れ用語集格納部に格納する第2のサーバ側作成部と、
前記第1のクライアント側表記揺れ用語集と前記第1のサーバ側表記揺れ用語集とを比較し、前記第1のクライアント側表記揺れ用語に合致する前記第1のサーバ側表記揺れ用語を抽出する第1の抽出部と、
前記第2のクライアント側表記揺れ用語集と前記第2のサーバ側表記揺れ用語集とを比較し、前記第2のクライアント側表記揺れ用語に合致する前記第2のサーバ側表記揺れ用語を抽出する第2の抽出部と、
前記第1の抽出部で抽出された第1のサーバ側表記揺れ用語及び前記第2の抽出部で抽出された第2のサーバ側表記揺れ用語にスコアを付与する第1のスコア付与部と、
を備える、検索システム。 A search system in which a server apparatus communicably connected to a client terminal via a network executes a search based on a search query from the client terminal,
The client terminal is
An input reception unit that receives an input of a search query;
Creating a first client-side transcription fluctuation glossary consisting of a first client-side transcription fluctuation term obtained by processing the search query having received the input according to a first rule; A first client side creation unit stored in the storage unit;
Creating a second client-side transcription swing glossary comprising a second client-side transcription swing term obtained by processing the first client-side transcription swing glossary according to a second rule; A second client-side creation unit stored in the shaking glossary storage unit;
Equipped with
The server device is
A facility database storing facility information including a facility name and / or a facility address;
Creating a first server-side handwritten swing glossary comprising a first server-side handwritten swing term obtained by processing the facility name and / or a keyword included in the facility address according to a first rule; A first server-side creation unit stored in the side-notation swing glossary storage unit;
Creating a second server-side transcription wobble glossary comprising a second server-side transcription fluctuation term obtained by processing the first server-side transcription fluctuation glossary according to a second rule different from the first rule; , A second server-side creation unit stored in a second server-side writing fluctuation glossary storage unit,
Comparing the first client-side writing swing glossary with the first server-side writing swing glossary, and extracting the first server-side writing swing term that matches the first client-side writing swing term A first extractor,
Comparing the second client-side writing swing glossary with the second server-side writing swing glossary, and extracting the second server-side writing swing terms that match the second client-side writing swing term A second extractor,
A first scoring unit for adding a score to the first server-side writing fluctuation term extracted by the first extraction unit and the second server-side writing fluctuation term extracted by the second extraction unit;
A search system comprising.
請求項1に記載の検索システム。 The first scoring unit is higher than the second server-side writing fluctuation term extracted by the second extracting unit in the first server-side writing fluctuation term extracted by the first extraction unit. Give a score,
The search system according to claim 1 .
前記入力を受け付けた検索クエリと前記第2のサーバ側表記揺れ用語集とを比較し、前記入力を受け付けた検索クエリに合致する前記第2のサーバ側表記揺れ用語を抽出する第4の抽出部と、
前記第3の抽出部で抽出された第1のサーバ側表記揺れ用語に、前記第4の抽出部で抽出された第2のサーバ側表記揺れ用語よりも高いスコアを付与する第2のスコア付与部と、
を備える、請求項1又は2に記載の検索システム。 A third extraction unit that compares the search query receiving the input with the first server-side writing fluctuation glossary, and extracts the first server-side writing fluctuation term that matches the search query receiving the input When,
A fourth extraction unit that compares the search query receiving the input with the second server-side writing fluctuation glossary, and extracts the second server-side writing fluctuation term that matches the search query receiving the input When,
A second score giving a score higher than the second server-side writing fluctuation term extracted by the fourth extracting unit to the first server-side writing fluctuation term extracted by the third extracting unit Department,
Comprising a search system according to claim 1 or 2.
前記第5の抽出部で抽出された第2のサーバ側表記揺れ用語に、前記第1の抽出部で抽出された第1のサーバ側表記揺れ用語及び前記第2の抽出部で抽出された第2のサーバ側表記揺れ用語よりも低いスコアを付与する第3のスコア付与部と、
を備える、請求項1又は2に記載の検索システム。 Comparing the first client-side writing swing glossary with the second server-side writing swing glossary, and extracting the second server-side writing swing terms that match the first client-side writing swing term A fifth extraction unit,
In the second server-side writing fluctuation terms extracted by the fifth extraction unit, the first server-side writing fluctuation terms extracted by the first extraction unit and the second extraction unit extracted by the second extraction unit A third scoring unit that assigns a score lower than the two server-side writing fluctuation terms;
Comprising a search system according to claim 1 or 2.
前記クライアント端末において、入力受付部が、検索クエリの入力を受け付ける入力受付ステップと、
前記クライアント端末において、第1のクライアント側作成部が、前記入力を受け付けた検索クエリを第1のルールで処理して得られる第1のクライアント側表記揺れ用語からなる第1のクライアント側表記揺れ用語集を作成し、第1のクライアント側表記揺れ用語集格納部に格納する第1のクライアント側作成ステップと、
前記クライアント端末において、第2のクライアント側作成部が、前記第1のクライアント側表記揺れ用語集を第2のルールで処理して得られる第2のクライアント側表記揺れ用語からなる第2のクライアント側表記揺れ用語集を作成し、第2のクライアント側表記揺れ用語集格納部に格納する第2のクライアント側作成ステップと、
前記サーバ装置において、施設名称及び/又は施設住所を含む施設情報を施設データベースに記憶する記憶ステップと、
前記サーバ装置において、第1のサーバ側作成部が、前記施設名称及び/又は施設住所に含まれるキーワードを第1のルールで処理して得られる第1のサーバ側表記揺れ用語からなる第1のサーバ側表記揺れ用語集を作成し、第1のサーバ側表記揺れ用語集格納部に格納する第1のサーバ側作成ステップと、
前記サーバ装置において、第2のサーバ側作成部が、前記第1のサーバ側表記揺れ用語集を前記第1のルールと異なる第2のルールで処理して得られる第2のサーバ側表記揺れ用語からなる第2のサーバ側表記揺れ用語集を作成し、第2のサーバ側表記揺れ用語集格納部に格納する第2のサーバ側作成ステップと、
前記サーバ装置において、第1の抽出部が、前記第1のクライアント側表記揺れ用語集と前記第1のサーバ側表記揺れ用語集とを比較し、前記第1のクライアント側表記揺れ用語に合致する前記第1のサーバ側表記揺れ用語を抽出する第1の抽出ステップと、
前記サーバ装置において、第2の抽出部が、前記第2のクライアント側表記揺れ用語集と前記第2のサーバ側表記揺れ用語集とを比較し、前記第2のクライアント側表記揺れ用語に合致する前記第2のサーバ側表記揺れ用語を抽出する第2の抽出ステップと、
前記サーバ装置において、第1のスコア付与部が、前記第1の抽出ステップで抽出された第1のサーバ側表記揺れ用語及び前記第2の抽出ステップで抽出された第2のサーバ側表記揺れ用語にスコアを付与する第1のスコア付与ステップと、
を備える、検索方法。 A search method in which a server apparatus communicably connected to a client terminal via a network executes a search based on a search query from the client terminal,
In the client terminal, an input accepting step of accepting an input of a search query by an input accepting unit;
In the client terminal, a first client-side transcription fluctuation term including a first client-side transcription fluctuation term obtained by processing a search query in which the first client-side creation unit receives the input according to a first rule. A first client-side creating step of creating a collection and storing the collection in the first client-side writing fluctuation glossary storage;
In the client terminal, a second client-side creating section includes a second client-side writing fluctuation term obtained by processing the first client-side writing fluctuation glossary according to a second rule. A second client-side creation step of creating a writing fluctuation glossary and storing it in a second client-side writing fluctuation glossary storage;
A storage step of storing facility information including a facility name and / or a facility address in a facility database in the server device;
In the server device, a first server-side creating unit is a first server-side handwritten swing term obtained by processing a keyword included in the facility name and / or facility address according to a first rule. A first server-side creating step of creating a server-side transcription fluctuation glossary and storing the server-side transcription fluctuation glossary in a first server-side transcription fluctuation glossary storage;
In the server apparatus, a second server-side transcription fluctuation term obtained by processing the first server-side transcription fluctuation glossary according to a second rule different from the first rule in a second server-side creation unit A second server-side creation step of creating a second server-side transcription wobble glossary and storing the second server-side transcription fluctuation glossary in the second server-side transcription fluctuation glossary storage;
In the server device, a first extraction unit compares the first client-side writing fluctuation glossary with the first server-side writing fluctuation glossary, and matches the first client-side writing fluctuation term. A first extraction step for extracting the first server-side writing fluctuation term;
In the server device, a second extraction unit compares the second client-side writing fluctuation glossary with the second server-side writing fluctuation glossary, and matches the second client-side writing fluctuation term A second extraction step of extracting the second server-side writing fluctuation term;
In the server device, the first scoring unit determines the first server-side expression fluctuation term extracted in the first extraction step and the second server-side expression fluctuation term extracted in the second extraction step. A first scoring step for scoring the
A search method comprising.
請求項5に記載の検索方法。 In the first scoring step, the first server-side writing swing term extracted in the first extraction step is higher than the second server-side writing swing term extracted in the second extraction step. Give a score,
The search method according to claim 5 .
第4の抽出部が、前記入力を受け付けた検索クエリと前記第2のサーバ側表記揺れ用語集とを比較し、前記入力を受け付けた検索クエリに合致する前記第2のサーバ側表記揺れ用語を抽出する第4の抽出ステップと、
第2のスコア付与部が、前記第3の抽出ステップで抽出された第1のサーバ側表記揺れ用語に、前記第4の抽出ステップで抽出された第2のサーバ側表記揺れ用語よりも高いスコアを付与する第2のスコア付与ステップと、
を備える、請求項5又は6に記載の検索方法。 A third extraction unit compares the search query receiving the input with the first server-side writing fluctuation glossary, and the first server-side writing fluctuation term that matches the search query receiving the input is A third extraction step to extract;
A fourth extraction unit compares the search query receiving the input with the second server-side writing fluctuation glossary, and the second server-side writing fluctuation term that matches the search query receiving the input is A fourth extraction step to extract;
A second scoring unit scores the first server-side writing fluctuation term extracted in the third extraction step higher than the second server-side writing fluctuation term extracted in the fourth extraction step. A second scoring step of applying
The search method according to claim 5 or 6 , comprising
第3のスコア付与部が、前記第5の抽出ステップで抽出された第2のサーバ側表記揺れ用語に、前記第1の抽出ステップで抽出された第1のサーバ側表記揺れ用語及び前記第2の抽出ステップで抽出された第2のサーバ側表記揺れ用語よりも低いスコアを付与する第3のスコア付与ステップと、
を備える、請求項5又は6に記載の検索方法。 A fifth extractor compares the first client-side transcript lexicon with the second server-side transcript lexicon, and the second server matches the first client-side transcript lexicon A fifth extraction step of extracting a side-notation swing term;
A third scoring unit applies the second server-side transcription fluctuation term extracted in the fifth extraction step to the first server-side transcription fluctuation term extracted in the first extraction step and the second A third scoring step for giving a score lower than the second server-side writing fluctuation term extracted in the extracting step of
The search method according to claim 5 or 6 , comprising
前記クライアント端末として機能するコンピュータを、
検索クエリの入力を受け付ける入力受付手段と、
前記入力を受け付けた検索クエリを第1のルールで処理して得られる第1のクライアント側表記揺れ用語からなる第1のクライアント側表記揺れ用語集を作成し、第1のクライアント側表記揺れ用語集格納手段に格納する第1のクライアント側作成手段と、
前記第1のクライアント側表記揺れ用語集を第2のルールで処理して得られる第2のクライアント側表記揺れ用語からなる第2のクライアント側表記揺れ用語集を作成し、第2のクライアント側表記揺れ用語集格納手段に格納する第2のクライアント側作成手段、
として機能させ、
前記サーバ装置として機能するコンピュータを、
施設名称及び/又は施設住所を含む施設情報を施設データベースに記憶する記憶手段と、
前記施設名称及び/又は施設住所に含まれるキーワードを第1のルールで処理して得られる第1のサーバ側表記揺れ用語からなる第1のサーバ側表記揺れ用語集を作成し、第1のサーバ側表記揺れ用語集格納手段に格納する第1のサーバ側作成手段と、
前記第1のサーバ側表記揺れ用語集を前記第1のルールと異なる第2のルールで処理して得られる第2のサーバ側表記揺れ用語からなる第2のサーバ側表記揺れ用語集を作成し、第2のサーバ側表記揺れ用語集格納手段に格納する第2のサーバ側作成手段と、
前記第1のクライアント側表記揺れ用語集と前記第1のサーバ側表記揺れ用語集とを比較し、前記第1のクライアント側表記揺れ用語に合致する前記第1のサーバ側表記揺れ用語を抽出する第1の抽出手段と、
前記第2のクライアント側表記揺れ用語集と前記第2のサーバ側表記揺れ用語集とを比較し、前記第2のクライアント側表記揺れ用語に合致する前記第2のサーバ側表記揺れ用語を抽出する第2の抽出手段と、
前記第1の抽出手段で抽出された第1のサーバ側表記揺れ用語及び前記第2の抽出部で抽出された第2のサーバ側表記揺れ用語にスコアを付与する第1のスコア付与手段、
として機能させる、コンピュータプログラム。 A computer program applied to a search system configured to be searched by a server apparatus communicably connected to the client terminal via a network based on a search query from the client terminal,
A computer that functions as the client terminal;
Input receiving means for receiving a search query input;
Creating a first client-side transcription fluctuation glossary consisting of a first client-side transcription fluctuation term obtained by processing the search query having received the input according to a first rule; First client-side creating means stored in the storing means;
Creating a second client-side transcription swing glossary comprising a second client-side transcription swing term obtained by processing the first client-side transcription swing glossary according to a second rule; Second client side creation means stored in the shaking glossary storage means,
To act as
A computer that functions as the server device;
Storage means for storing facility information including facility name and / or facility address in a facility database;
Creating a first server-side handwritten swing glossary comprising a first server-side handwritten swing term obtained by processing the facility name and / or a keyword included in the facility address according to a first rule; A first server-side creating unit to be stored in the side writing fluctuation glossary storing unit;
Creating a second server-side transcription wobble glossary comprising a second server-side transcription fluctuation term obtained by processing the first server-side transcription fluctuation glossary according to a second rule different from the first rule; , Second server-side creating means stored in the second server-side writing fluctuation glossary storing means,
Comparing the first client-side writing swing glossary with the first server-side writing swing glossary, and extracting the first server-side writing swing term that matches the first client-side writing swing term A first extraction means,
Comparing the second client-side writing swing glossary with the second server-side writing swing glossary, and extracting the second server-side writing swing terms that match the second client-side writing swing term A second extraction means,
A first scoring means for scoring a first server-side writing fluctuation term extracted by the first extraction unit and a second server-side writing fluctuation term extracted by the second extraction unit;
A computer program to function as.
請求項9に記載のコンピュータプログラム。 The first scoring unit is configured to set the first server-side writing fluctuation term extracted by the first extracting unit higher than the second server-side writing fluctuation term extracted by the second extracting unit. Give a score,
A computer program according to claim 9 .
前記入力を受け付けた検索クエリと前記第1のサーバ側表記揺れ用語集とを比較し、前記入力を受け付けた検索クエリに合致する前記第1のサーバ側表記揺れ用語を抽出する第3の抽出手段と、
前記入力を受け付けた検索クエリと前記第2のサーバ側表記揺れ用語集とを比較し、前記入力を受け付けた検索クエリに合致する前記第2のサーバ側表記揺れ用語を抽出する第4の抽出手段と、
前記第3の抽出手段で抽出された第1のサーバ側表記揺れ用語に、前記第4の抽出手段で抽出された第2のサーバ側表記揺れ用語よりも高いスコアを付与する第2のスコア付与手段、
として機能させる、請求項9又は10に記載のコンピュータプログラム。 Furthermore, a computer that functions as the server device,
Third extraction means for comparing the search query receiving the input with the first server-side writing fluctuation glossary, and extracting the first server-side writing fluctuation term that matches the search query receiving the input When,
Fourth extraction means for comparing the search query having received the input with the second server-side expression fluctuation glossary, and extracting the second server-side expression fluctuation term matching the search query having received the input When,
A second score giving a higher score to the first server-side writing fluctuation term extracted by the third extracting means than the second server-side writing fluctuation term extracted by the fourth extracting means means,
The computer program according to claim 9 or 10 , which functions as:
前記第1のクライアント側表記揺れ用語集と前記第2のサーバ側表記揺れ用語集とを比較し、前記第1のクライアント側表記揺れ用語に合致する前記第2のサーバ側表記揺れ用語を抽出する第5の抽出手段と、
前記第5の抽出手段で抽出された第2のサーバ側表記揺れ用語に、前記第1の抽出手段で抽出された第1のサーバ側表記揺れ用語及び前記第2の抽出手段で抽出された第2のサーバ側表記揺れ用語よりも低いスコアを付与する第3のスコア付与手段、
として機能させる、請求項9又は10に記載のコンピュータプログラム。 Furthermore, a computer that functions as the server device,
Comparing the first client-side writing swing glossary with the second server-side writing swing glossary, and extracting the second server-side writing swing terms that match the first client-side writing swing term A fifth extraction means,
In the second server-side writing fluctuation terms extracted by the fifth extraction means, the first server-side writing fluctuation terms extracted by the first extraction means and the second extraction terms extracted by the second extraction means A third scoring means, which gives a score lower than 2 server-side writing wobble terms,
The computer program according to claim 9 or 10 , which functions as:
Recording medium for recording a computer program according to any one of claims 9-12.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016139878A JP6537477B2 (en) | 2016-07-15 | 2016-07-15 | Search system, search method, computer program thereof and recording medium recording the computer program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016139878A JP6537477B2 (en) | 2016-07-15 | 2016-07-15 | Search system, search method, computer program thereof and recording medium recording the computer program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018010543A JP2018010543A (en) | 2018-01-18 |
JP6537477B2 true JP6537477B2 (en) | 2019-07-03 |
Family
ID=60994425
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016139878A Active JP6537477B2 (en) | 2016-07-15 | 2016-07-15 | Search system, search method, computer program thereof and recording medium recording the computer program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6537477B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111160564B (en) * | 2019-12-17 | 2023-05-19 | 电子科技大学 | Chinese knowledge graph representation learning method based on feature tensor |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008299675A (en) * | 2007-05-31 | 2008-12-11 | Yahoo Japan Corp | Kana mixture notation extracting device, method and program |
JP5094486B2 (en) * | 2008-03-14 | 2012-12-12 | 日本電信電話株式会社 | Synonymity determination device, method, program, and recording medium |
JP5221630B2 (en) * | 2010-12-07 | 2013-06-26 | 楽天株式会社 | Server, information management method, information management program, and computer-readable recording medium for recording the program |
-
2016
- 2016-07-15 JP JP2016139878A patent/JP6537477B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018010543A (en) | 2018-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3091535B1 (en) | Multi-modal input on an electronic device | |
CN104011712B (en) | To being evaluated across the query translation of language inquiry suggestion | |
US7979268B2 (en) | String matching method and system and computer-readable recording medium storing the string matching method | |
US8543375B2 (en) | Multi-mode input method editor | |
EP3153978B1 (en) | Address search method and device | |
CN107562824B (en) | Text similarity detection method | |
US8994660B2 (en) | Text correction processing | |
JP5257071B2 (en) | Similarity calculation device and information retrieval device | |
JP5379138B2 (en) | Creating an area dictionary | |
JP2010531492A (en) | Word probability determination | |
US20140201229A1 (en) | Providing display suggestions | |
US20180181544A1 (en) | Systems for Automatically Extracting Job Skills from an Electronic Document | |
US20150073801A1 (en) | Apparatus and method for selecting a control object by voice recognition | |
JP2014186395A (en) | Document preparation support device, method, and program | |
US20120109994A1 (en) | Robust auto-correction for data retrieval | |
CN111259262A (en) | Information retrieval method, device, equipment and medium | |
JP5231484B2 (en) | Voice recognition apparatus, voice recognition method, program, and information processing apparatus for distributing program | |
Xiong et al. | Extended HMM and ranking models for Chinese spelling correction | |
JP6537477B2 (en) | Search system, search method, computer program thereof and recording medium recording the computer program | |
JP6571053B2 (en) | FACILITY SEARCH DEVICE, FACILITY SEARCH METHOD, COMPUTER PROGRAM, AND RECORDING MEDIUM CONTAINING COMPUTER PROGRAM | |
US10614065B2 (en) | Controlling search execution time for voice input facility searching | |
US11281736B1 (en) | Search query mapping disambiguation based on user behavior | |
CN112817996A (en) | Illegal keyword library updating method, device, equipment and storage medium | |
JP6496286B2 (en) | FACILITY SEARCH DEVICE, FACILITY SEARCH METHOD, COMPUTER PROGRAM, AND RECORDING MEDIUM CONTAINING COMPUTER PROGRAM | |
CN113722447B (en) | Voice search method based on multi-strategy matching |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180226 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190313 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190509 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190529 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190604 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6537477 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |