JP2018010543A - 表記揺れ用語集作成装置、検索システム、それらの方法、それらのコンピュータプログラム及びそれらのコンピュータプログラムを記録した記録媒体 - Google Patents

表記揺れ用語集作成装置、検索システム、それらの方法、それらのコンピュータプログラム及びそれらのコンピュータプログラムを記録した記録媒体 Download PDF

Info

Publication number
JP2018010543A
JP2018010543A JP2016139878A JP2016139878A JP2018010543A JP 2018010543 A JP2018010543 A JP 2018010543A JP 2016139878 A JP2016139878 A JP 2016139878A JP 2016139878 A JP2016139878 A JP 2016139878A JP 2018010543 A JP2018010543 A JP 2018010543A
Authority
JP
Japan
Prior art keywords
server
terminology
notation
client
fluctuation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016139878A
Other languages
English (en)
Other versions
JP6537477B2 (ja
Inventor
洋介 太田
Yosuke Ota
洋介 太田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Mapmaster Inc
Original Assignee
Toyota Mapmaster Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Mapmaster Inc filed Critical Toyota Mapmaster Inc
Priority to JP2016139878A priority Critical patent/JP6537477B2/ja
Publication of JP2018010543A publication Critical patent/JP2018010543A/ja
Application granted granted Critical
Publication of JP6537477B2 publication Critical patent/JP6537477B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】広範な検索を可能とするための表記揺れ用語集作成装置、検索システム、それらの方法、それらのコンピュータプログラム及びそれらのコンピュータプログラムを記録した記録媒体を提供する。【解決手段】検索クエリに対する表記揺れ用語集を作成する表記揺れ用語集作成装置1は、第1の表記揺れ用語集及び第2の表記揺れ用語集を含み、検索クエリを第1のルールで処理して得られる第1の表記揺れ用語からなる第1の表記揺れ用語集を作成して第1の表記揺れ用語集格納部701に格納し、第1の表記揺れ用語集を第1のルールと異なる第2のルールで処理して得られる第2の表記揺れ用語からなる第2の表記揺れ用語集を作成して第2の表記揺れ用語集格納部702に格納する。【選択図】図1

Description

本発明は、表記揺れ用語集作成装置、検索システム、それらの方法、それらのコンピュータプログラム及びそれらのコンピュータプログラムを記録した記録媒体に関する。
近年、インターネット及び移動体端末装置の普及と相まって、カーナビゲーション装置やスマートフォン等の移動体端末装置を利用した目的地検索が日常的に行われている。そして、この目的地検索は、一般に、目的地の地名や施設名を入力して行われている。これに関連する技術として、特許文献1では、入力された検索用の文字に基づいて候補目的地を検索し、各候補目的地に対し、その内容と現在の状況に基づいて、表記する優先度を決定し、決定した優先度の高い候補目的地を優先して表記するナビゲーション装置が開示されている。
一方、表記ゆれを含むデータに対する検索処理の網羅性を向上させるための技術として、表記ゆれ辞書を作成し、作成された表記ゆれ辞書を用いて、検索要求で受け付けた検索ワードに対応する表記ゆれのパターンを特定し、特定されたパターンの文字列を含む検索を実行するデータ検索システムが開示されている(特許文献2)。
本発明に関連する従来技術を開示する特許文献3〜5も参照されたい。
特開2009−14704号公報 特開2015−106361号公報 特開2012−059126号公報 特開2011−186976号公報 特開2011−154602号公報
一般的な検索システムでは、検索クエリを構成する文字列と施設データベース等の検索データベース中に格納されている施設名称等のキーワードを構成する文字列とを比較し、完全一致、前方一致、部分一致等しているか否かで、検索クエリに対応する施設検索が行われている。しかしながら、ユーザが入力した検索クエリに表記揺れが含まれていることにより、検索データベース内のキーワードと合致せず、ユーザの所望する施設が検索されない場合もある。そこで、本発明者は、施設等を検索するユーザが入力した検索クエリがその施設の正確な表記でない場合であっても、施設データベースからユーザが所望する施設を検索可能とすべく鋭意検討を重ねてきた。その結果、所定のルールに沿って当該検索クエリの表記揺れ用語から構成される表記揺れ用語集を作成することに想到した。このような表記揺れ用語集を検索クエリとともに施設検索に用いることで、検索クエリで検索される施設に加えて、表記揺れ用語集に含まれる表記揺れ用語で検索される施設も検索でき、広範な検索を行うことが可能となる。
この発明は上述の課題に鑑みてなされたものであり、その第1の局面は次のように規定される。即ち、
検索クエリに対する表記揺れ用語集を作成する装置であって、
前記表記揺れ用語集は、第1の表記揺れ用語集及び第2の表記揺れ用語集を含み、
前記検索クエリを第1のルールで処理して得られる第1の表記揺れ用語からなる前記第1の表記揺れ用語集を作成し、第1の表記揺れ用語集格納部に格納する第1の作成部と、
前記第1の表記揺れ用語集を前記第1のルールと異なる第2のルールで処理して得られる第2の表記揺れ用語からなる前記第2の表記揺れ用語集を作成し、第2の表記揺れ用語集格納部に格納する第2の作成部と、
を備える、表記揺れ用語集作成装置。
このように規定される第1の局面の表記揺れ用語集作成装置によれば、検索クエリを第1のルールで処理して第1の表記揺れ用語から構成される第1の表記揺れ用語集を作成し、作成された第1の表記揺れ用語を第1のルールと異なる第2のルールで処理して第2の表記揺れ用語から構成される第2の表記揺れ用語集を作成し、第1の表記揺れ用語集及び第2の表記揺れ用語集を対応する検索クエリと関連付けて格納する。このようにして作成された表記揺れ用語集を施設検索に用いれば、ユーザが入力した検索クエリに対応する施設だけでなく、表記揺れ用語集に対応する検索クエリの表記揺れを考慮した広範な施設検索が可能となる。また、このような表記揺れ用語集を用いた検索装置によれば、検索クエリの表記揺れを含む広範な検索が可能となるだけでなく、該表記揺れ用語集を用いることで表記揺れを含む検索の検索速度を向上させることが可能となる等、コンピュータの機能を改良することができる。
表記揺れ用語とは、検索クエリの文字列と表記が部分的に異なるものの同義を示す用語を意味し、例えば、検索クエリを形態素解析、漢字−カタカナ変換、カタカナ漢字変換、アルファベット−カタカナ変換、カタカナ−アルファベット変換、「ヴァ」から「バ」等カタカナ表記の揺らぎ変換等のルールに基づいて処理することにより得られる。表記揺れ用語には、該検索クエリから得られた表記揺れ用語に対して、更に、当該処理を行って得られた用語も含まれる。
表記揺れ用語集とは、検索クエリに対して同一のルールで処理された一又は複数の表記揺れ用語から構成されるものを意味する。検索クエリから得られた表記揺れ用語を更に他のルールで処理して得られた一又は複数の表記揺れ用語から構成されるものも含まれる。
また、形態素解析とは、形態素から構成される文字列を各形態素に分割する作業を意味し、漢字−カタカナ変換とは、文字列中の各漢字について音読み変換し、又は、訓読み変換し、又は、音読み変換及び訓読み変換の組み合わせを意味する。
ここで、前記第1のルールは形態素解析の手法とすることができる(第2の局面)。
この発明の第3の局面は次のように規定される。即ち、
クライアント端末からの検索クエリに基づいて、該クライアント端末とネットワークを介して通信可能に接続されたサーバ装置が検索を実行する検索システムであって、
前記クライアント端末は、
検索クエリの入力を受け付ける入力受付部と、
前記入力を受け付けた検索クエリを前記第1のルールで処理して得られる第1のクライアント側表記揺れ用語からなる第1のクライアント側表記揺れ用語集を作成し、第1のクライアント側表記揺れ用語集格納部に格納する第1のクライアント側作成部と、
前記第1のクライアント側表記揺れ用語集を前記第2のルールで処理して得られる第2のクライアント側表記揺れ用語からなる第2のクライアント側表記揺れ用語集を作成し、第2のクライアント側表記揺れ用語集格納部に格納する第2のクライアント側作成部と、
を備え、
前記サーバ装置は、
施設名称及び/又は施設住所を含む施設情報を記憶する施設データベースと、
前記施設名称及び/又は施設住所に含まれるキーワードを第1のルールで処理して得られる第1のサーバ側表記揺れ用語からなる第1のサーバ側表記揺れ用語集を作成し、第1のサーバ側表記揺れ用語集格納部に格納する第1のサーバ側作成部と、
前記第1のサーバ側表記揺れ用語集を前記第1のルールと異なる第2のルールで処理して得られる第2のサーバ側表記揺れ用語からなる第2のサーバ側表記揺れ用語集を作成し、第2のサーバ側表記揺れ用語集格納部に格納する第2のサーバ側作成部と、
前記第1のクライアント側表記揺れ用語集と前記第1のサーバ側表記揺れ用語集とを比較し、前記第1のクライアント側表記揺れ用語に合致する前記第1のサーバ側表記揺れ用語を抽出する第1の抽出部と、
前記第2のクライアント側表記揺れ用語集と前記第2のサーバ側表記揺れ用語集とを比較し、前記第2のクライアント側表記揺れ用語に合致する前記第2のサーバ側表記揺れ用語を抽出する第2の抽出部と、
前記第1の抽出部で抽出された第1のサーバ側表記揺れ用語及び前記第2の抽出部で抽出された第2のサーバ側表記揺れ用語にスコアを付与する第1のスコア付与部と、
を備える、検索システム。
このように規定される第3の局面の検索システムによれば、クライアント端末において検索クエリに基づき第1の局面と同様に第1のルール及び第2のルールで処理してクライアント側表記揺れ用語集を作成する一方、サーバ装置においても施設データベース中の施設の名称等に基づき第1の局面と同様に第1のルール及び第2のルールで処理してサーバ側表記揺れ用語集を作成し、第1のルールで処理された表記揺れ用語集同士を比較して、第1のクライアント側表記揺れ用語に合致する第1のサーバ側表記揺れ用語を抽出し、第2のルールで処理された表記揺れ用語集同士を比較して、第2のクライアント側表記揺れ用語に合致する第2のサーバ側表記揺れ用語を抽出し、抽出された第1のサーバ側表記揺れ用語及び第2のサーバ側表記揺れ用語に、検索結果の出力順位の指標となるスコアを付与する。このようにしてクライアント端末及びサーバ装置の両者において夫々作成された表記揺れ用語集を施設検索に用いれば、ユーザが入力した検索クエリに対応する施設だけでなく、表記揺れ用語集に対応する検索クエリの表記揺れを考慮した広範な施設検索が可能となる。また、このような表記揺れ用語集を用いた検索システムによれば、検索クエリ及び施設名称等の表記揺れを含む広範な検索が可能となるだけでなく、該表記揺れ用語集を用いることで表記揺れを含む検索の検索速度を向上させることが可能となる等、コンピュータの機能を改良することができる。
前記第1のスコア付与部は、前記第1の抽出部で抽出された第1のサーバ側表記揺れ用語に、前記第2の抽出部で抽出された第2のサーバ側表記揺れ用語よりも高いスコアを付与することができる(第4の局面)。
ユーザが入力した検索クエリからの表記の変化度合いが小さいクライアント側表記揺れ用語ほど、すなわち、検索クエリから少ない回数の表記揺れ処理によって得られたクライアント側表記揺れ用語ほど、より精度良くユーザの想定する施設を表していると推測される。この推測に基づけば、サーバ装置内の施設データベースに格納された施設のうち、検索クエリからの表記の変化度合いがより小さい第1のクライアント側表記揺れ用語と合致する第1のサーバ側表記揺れ用語に高いスコアを付与して、該第1のサーバ側表記揺れ用語に関連付けられた第1の施設を検索結果として高順位に出力することが好ましい。そして、第1のクライアント側表記揺れ用語を介して得られた第2のクライアント側表記揺れ用語に合致した第2のサーバ側表記揺れ用語に、第1のサーバ側表記揺れ用語に付与したスコアより低いスコアを付与して、該第2のサーバ側表記揺れ用語に関連付けられた第2の施設を第1の施設より低い順位に出力することが好ましい。
この発明の第5の局面は次のように規定される。即ち、
第3又は第4の局面に規定の検索システムにおいて、前記入力を受け付けた検索クエリと前記第1のサーバ側表記揺れ用語集とを比較し、前記入力を受け付けた検索クエリに合致する前記第1のサーバ側表記揺れ用語を抽出する第3の抽出部と、
前記入力を受け付けた検索クエリと前記第2のサーバ側表記揺れ用語集とを比較し、前記入力を受け付けた検索クエリに合致する前記第2のサーバ側表記揺れ用語を抽出する第4の抽出部と、
前記第3の抽出部で抽出された第1のサーバ側表記揺れ用語に、前記第4の抽出部で抽出された第2のサーバ側表記揺れ用語よりも高いスコアを付与する第2のスコア付与部と、を備える。
このように規定される第5の局面の検索システムによれば、検索クエリと合致する第1のサーバ側表記揺れ用語に、該検索クエリと合致する第2のサーバ側表記揺れ用語に比べ高いスコアを付与する。施設名称等からの表記揺れ処理回数の少ない第1のサーバ側表記揺れ用語に関連付けられた施設の方が、表記揺れ処理を二回行って得られた第2のサーバ側表記揺れ用語に関連付けられた施設に比べて、該検索クエリを入力したユーザの所望する施設により近いと推定される。
この発明の第6の局面は次のように規定される。即ち、
第3又は第4の局面に規定の検索システムにおいて、前記第1のクライアント側表記揺れ用語集と前記第2のサーバ側表記揺れ用語集とを比較し、前記第1のクライアント側表記揺れ用語に合致する前記第2のサーバ側表記揺れ用語を抽出する第5の抽出部と、
前記第5の抽出部で抽出された第2のサーバ側表記揺れ用語に、前記第1の抽出部で抽出された第1のサーバ側表記揺れ用語及び前記第2の抽出部で抽出された第2のサーバ側表記揺れ用語よりも低いスコアを付与する第3のスコア付与部と、を備える。
また、この発明の第7の局面は次のように規定される。即ち、
検索クエリに対する表記揺れ用語集を作成する方法であって、
前記表記揺れ用語集は、第1の表記揺れ用語集及び第2の表記揺れ用語集を含み、
第1の作成部が、前記検索クエリを第1のルールで処理して得られる第1の表記揺れ用語からなる前記第1の表記揺れ用語集を作成し、第1の表記揺れ用語集格納部に格納する第1の作成ステップと、
第2の作成部が、前記第1の表記揺れ用語集を前記第1のルールと異なる第2のルールで処理して得られる第2の表記揺れ用語からなる前記第2の表記揺れ用語集を作成し、第2の表記揺れ用語集格納部に格納する第2の作成ステップと、
を備える、表記揺れ用語集作成方法。
このように規定される第7の局面の発明によれば、第1の局面と同等の効果を奏する。
この発明の第8の局面は次のように規定される。即ち、
第7の局面の方法において、前記第1のルールは形態素解析の手法である。
このように規定される第8の局面の発明によれば、第2の局面と同等の効果を奏する。
この発明の第9の局面は次のように規定される。即ち、
クライアント端末からの検索クエリに基づいて、該クライアント端末とネットワークを介して通信可能に接続されたサーバ装置が検索を実行する検索方法であって、
前記クライアント端末において、入力受付部が、検索クエリの入力を受け付ける入力受付ステップと、
前記クライアント端末において、第1のクライアント側作成部が、前記入力を受け付けた検索クエリを前記第1のルールで処理して得られる第1のクライアント側表記揺れ用語からなる第1のクライアント側表記揺れ用語集を作成し、第1のクライアント側表記揺れ用語集格納部に格納する第1のクライアント側作成ステップと、
前記クライアント端末において、第2のクライアント側作成部が、前記第1のクライアント側表記揺れ用語集を前記第2のルールで処理して得られる第2のクライアント側表記揺れ用語からなる第2のクライアント側表記揺れ用語集を作成し、第2のクライアント側表記揺れ用語集格納部に格納する第2のクライアント側作成ステップと、
前記サーバ装置において、施設名称及び/又は施設住所を含む施設情報を施設データベースに記憶する記憶ステップと、
前記サーバ装置において、第1のサーバ側作成部が、前記施設名称及び/又は施設住所に含まれるキーワードを第1のルールで処理して得られる第1のサーバ側表記揺れ用語からなる第1のサーバ側表記揺れ用語集を作成し、第1のサーバ側表記揺れ用語集格納部に格納する第1のサーバ側作成ステップと、
前記サーバ装置において、第2のサーバ側作成部が、前記第1のサーバ側表記揺れ用語集を前記第1のルールと異なる第2のルールで処理して得られる第2のサーバ側表記揺れ用語からなる第2のサーバ側表記揺れ用語集を作成し、第2のサーバ側表記揺れ用語集格納部に格納する第2のサーバ側作成ステップと、
前記サーバ装置において、第1の抽出部が、前記第1のクライアント側表記揺れ用語集と前記第1のサーバ側表記揺れ用語集とを比較し、前記第1のクライアント側表記揺れ用語に合致する前記第1のサーバ側表記揺れ用語を抽出する第1の抽出ステップと、
前記サーバ装置において、第2の抽出部が、前記第2のクライアント側表記揺れ用語集と前記第2のサーバ側表記揺れ用語集とを比較し、前記第2のクライアント側表記揺れ用語に合致する前記第2のサーバ側表記揺れ用語を抽出する第2の抽出ステップと、
前記サーバ装置において、第1のスコア付与部が、前記第1の抽出ステップで抽出された第1のサーバ側表記揺れ用語及び前記第2の抽出ステップで抽出された第2のサーバ側表記揺れ用語にスコアを付与する第1のスコア付与ステップと、
を備える、検索方法。
このように規定される第9の局面の発明によれば、第3の局面と同等の効果を奏する。
この発明の第10の局面は次のように規定される。即ち、
第9の局面に規定の方法において、前記第1のスコア付与ステップでは、前記第1の抽出ステップで抽出された第1のサーバ側表記揺れ用語に、前記第2の抽出ステップで抽出された第2のサーバ側表記揺れ用語よりも高いスコアを付与する。
このように規定される第10の局面の発明によれば、第4の局面と同等の効果を奏する。
この発明の第11の局面は次のように規定される。即ち、
第9又は第10の局面に規定の方法において、第3の抽出部が、前記入力を受け付けた検索クエリと前記第1のサーバ側表記揺れ用語集とを比較し、前記入力を受け付けた検索クエリに合致する前記第1のサーバ側表記揺れ用語を抽出する第3の抽出ステップと、
第4の抽出部が、前記入力を受け付けた検索クエリと前記第2のサーバ側表記揺れ用語集とを比較し、前記入力を受け付けた検索クエリに合致する前記第2のサーバ側表記揺れ用語を抽出する第4の抽出ステップと、
第2のスコア付与部が、前記第3の抽出ステップで抽出された第1のサーバ側表記揺れ用語に、前記第4の抽出ステップで抽出された第2のサーバ側表記揺れ用語よりも高いスコアを付与する第2のスコア付与ステップと、を備える。
このように規定される第11の局面の発明によれば、第5の局面と同等の効果を奏する。
この発明の第12の局面は次のように規定される。即ち、
第9又は第10の局面に規定の方法において、第5の抽出部が、前記第1のクライアント側表記揺れ用語集と前記第2のサーバ側表記揺れ用語集とを比較し、前記第1のクライアント側表記揺れ用語に合致する前記第2のサーバ側表記揺れ用語を抽出する第5の抽出ステップと、
第3のスコア付与部が、前記第5の抽出ステップで抽出された第2のサーバ側表記揺れ用語に、前記第1の抽出ステップで抽出された第1のサーバ側表記揺れ用語及び前記第2の抽出ステップで抽出された第2のサーバ側表記揺れ用語よりも低いスコアを付与する第3のスコア付与ステップと、を備える。
このように規定される第12の局面の発明によれば、第6の局面と同等の効果を奏する。
更に、この発明の第13の局面は次のように規定される。即ち、
検索クエリに対する表記揺れ用語集を作成するためのコンピュータプログラムであって、
前記表記揺れ用語集は、第1の表記揺れ用語集及び第2の表記揺れ用語集を含み、
コンピュータを、
前記検索クエリを第1のルールで処理して得られる第1の表記揺れ用語からなる前記第1の表記揺れ用語集を作成し、第1の表記揺れ用語集格納手段に格納する第1の作成手段と、
前記第1の表記揺れ用語集を前記第1のルールと異なる第2のルールで処理して得られる第2の表記揺れ用語からなる前記第2の表記揺れ用語集を作成し、第2の表記揺れ用語集格納手段に格納する第2の作成手段、
として機能させる、コンピュータプログラム。
このように規定される第13の局面の発明によれば、第1の局面と同等の効果を奏する。
この発明の第14の局面は次のように規定される。即ち、
第13の局面に規定のコンピュータプログラムにおいて、前記第1のルールは形態素解析の手法である。
このように規定される第14の局面の発明によれば、第2の局面と同等の効果を奏する。
この発明の第15の局面は次のように規定される。即ち、
クライアント端末からの検索クエリに基づいて、該クライアント端末とネットワークを介して通信可能に接続されたサーバ装置が検索するよう構成された検索システムに適用されるコンピュータプログラムであって、
前記クライアント端末として機能するコンピュータを、
検索クエリの入力を受け付ける入力受付手段と、
前記入力を受け付けた検索クエリを前記第1のルールで処理して得られる第1のクライアント側表記揺れ用語からなる第1のクライアント側表記揺れ用語集を作成し、第1のクライアント側表記揺れ用語集格納手段に格納する第1のクライアント側作成手段と、
前記第1のクライアント側表記揺れ用語集を前記第2のルールで処理して得られる第2のクライアント側表記揺れ用語からなる第2のクライアント側表記揺れ用語集を作成し、第2のクライアント側表記揺れ用語集格納手段に格納する第2のクライアント側作成手段、
として機能させ、
前記サーバ装置として機能するコンピュータを、
施設名称及び/又は施設住所を含む施設情報を施設データベースに記憶する記憶手段と、
前記施設名称及び/又は施設住所に含まれるキーワードを第1のルールで処理して得られる第1のサーバ側表記揺れ用語からなる第1のサーバ側表記揺れ用語集を作成し、第1のサーバ側表記揺れ用語集格納手段に格納する第1のサーバ側作成手段と、
前記第1のサーバ側表記揺れ用語集を前記第1のルールと異なる第2のルールで処理して得られる第2のサーバ側表記揺れ用語からなる第2のサーバ側表記揺れ用語集を作成し、第2のサーバ側表記揺れ用語集格納手段に格納する第2のサーバ側作成手段と、
前記第1のクライアント側表記揺れ用語集と前記第1のサーバ側表記揺れ用語集とを比較し、前記第1のクライアント側表記揺れ用語に合致する前記第1のサーバ側表記揺れ用語を抽出する第1の抽出手段と、
前記第2のクライアント側表記揺れ用語集と前記第2のサーバ側表記揺れ用語集とを比較し、前記第2のクライアント側表記揺れ用語に合致する前記第2のサーバ側表記揺れ用語を抽出する第2の抽出手段と、
前記第1の抽出手段で抽出された第1のサーバ側表記揺れ用語及び前記第2の抽出部で抽出された第2のサーバ側表記揺れ用語にスコアを付与する第1のスコア付与手段、
として機能させる、コンピュータプログラム。
このように規定される第15の局面の発明によれば、第3の局面と同等の効果を奏する。
この発明の第16の局面は次のように規定される。即ち、
第15の局面に規定のコンピュータプログラムにおいて、前記第1のスコア付与手段は、前記第1の抽出手段で抽出された第1のサーバ側表記揺れ用語に、前記第2の抽出手段で抽出された第2のサーバ側表記揺れ用語よりも高いスコアを付与する。
このように規定される第16の局面の発明によれば、第4の局面と同等の効果を奏する。
この発明の第17の局面は次のように規定される。即ち、
第15又は第16の局面に規定のコンピュータプログラムにおいて、前記サーバ装置として機能するコンピュータを、更に、
前記入力を受け付けた検索クエリと前記第1のサーバ側表記揺れ用語集とを比較し、前記入力を受け付けた検索クエリに合致する前記第1のサーバ側表記揺れ用語を抽出する第3の抽出手段と、
前記入力を受け付けた検索クエリと前記第2のサーバ側表記揺れ用語集とを比較し、前記入力を受け付けた検索クエリに合致する前記第2のサーバ側表記揺れ用語を抽出する第4の抽出手段と、
前記第3の抽出手段で抽出された第1のサーバ側表記揺れ用語に、前記第4の抽出手段で抽出された第2のサーバ側表記揺れ用語よりも高いスコアを付与する第2のスコア付与手段、
として機能させる。
このように規定される第17の局面の発明によれば、第5の局面と同等の効果を奏する。
この発明の第18の局面は次のように規定される。即ち、
第19の局面に規定のコンピュータプログラムにおいて、前記サーバ装置として機能するコンピュータを、更に、
前記第1のクライアント側表記揺れ用語集と前記第2のサーバ側表記揺れ用語集とを比較し、前記第1のクライアント側表記揺れ用語に合致する前記第2のサーバ側表記揺れ用語を抽出する第5の抽出手段と、
前記第5の抽出手段で抽出された第2のサーバ側表記揺れ用語に、前記第1の抽出手段で抽出された第1のサーバ側表記揺れ用語及び前記第2の抽出手段で抽出された第2のサーバ側表記揺れ用語よりも低いスコアを付与する第3のスコア付与手段、
として機能させる。
このように規定される第18の局面の発明によれば、第6の局面と同等の効果を奏する。
第13〜第18のいずれかの局面に規定されるコンピュータプログラムを記録する記録媒体が第19の局面として規定される。
図1は、本発明の実施の形態の表記揺れ用語集作成装置1の構成を示すブロック図である。 図2は、本発明の実施の形態の表記揺れ用語集作成装置1の動作の一例を示すフローチャートである。 図3は、本発明の実施の形態の検索システム100の構成を示すブロック図である。 図4は、クライアント側表記揺れ用語集作成部及びサーバ側表記揺れ用語集作成部で夫々作成される表記揺れ用語集の一例である。 図5は、本発明の他の実施の形態の検索システム300の構成を示すブロック図である。 図6は、本発明の他の実施の形態の検索システム400の構成を示すブロック図である。 図7は、本発明の実施例の検索システム500の構成を示すブロック図である。 図8は、本発明の実施例の検索システム500の動作の一例を示すフローチャート図である。
この発明の実施の形態の表記揺れ用語集作成装置を説明する。
図1に、表記揺れ用語集作成装置1の概略構成を示す。
図1に示すように、この表記揺れ用語集作成装置1は、入力受付部3、表記揺れ用語集作成部5及び表記揺れ用語集格納部7を備えている。本実施の形態では、ユーザが使用するクライアント端末に搭載される表記揺れ用語集作成装置1であって、ユーザが入力した検索クエリに基づいて表記揺れ用語集を作成する表記揺れ用語集作成装置1について説明しているが、これに限らず、本発明の表記揺れ用語集作成装置は、サーバ装置に搭載され、施設名称等のキーワードに基づいて表記揺れ用語集を作成する装置であっても良い。サーバ装置に搭載される表記揺れ用語集作成装置の場合には、後述の入力受付部はサーバ装置内又はサーバ装置外に備えられた検索データベースに格納される施設名称等のキーワードのうち、オペレータが選択するキーワードの入力を受け付け、又は、任意のキーワードの自動入力を受け付ける。
入力受付部3は、ユーザによる検索クエリの入力を受け付ける。当該検索クエリは、ユーザが検索時に入力する単語やフレーズ等の複合語であり、検索条件等検索データベースに対する要求や問い合わせを文字列にしたものである。当該文字列としては、漢字、ひらがな、カタカナ、アルファベット、数字、記号等が挙げられ、これらのうちの1つ、あるいは2つ以上を組み合わせたものが挙げられる。当該文字列は、表示画面において各文字に割り当てられた文字キーを夫々タッチすることによって、又はキーボード等の入力部を用いることによってその入力を受け付けることができる。
表記揺れ用語集作成部5は、上記検索クエリに関する表記揺れ用語集を作成する。表記揺れ用語集作成部5は、第1の作成部501及び第2の作成部502を備える。
第1の作成部501は、検索クエリに基づいて第1の表記揺れ用語集を作成する。すなわち、第1の作成部501は、入力受付部3で入力受付された検索クエリを第1のルールで処理して得られる第1の表記揺れ用語からなる第1の表記揺れ用語集を作成する。当該第1の表記揺れ用語集の作成の際に用いる第1のルールとしては特に限定されないが、例えば、形態素解析、漢字−カタカナ変換、カタカナ−漢字変換、カタカナ−アルファベット変換又はアルファベット−カタカナ変換等の手法を用いることができる。例えば、検索クエリ「白鳥庭園」の場合、形態素解析によれば、形態素「白鳥」及び形態素「庭園」という単位に分解され、第1の表記揺れ用語は「白鳥、庭園」となる。この場合、第1の表記揺れ用語集は、第1の表記揺れ用語「白鳥、庭園」から構成される。一方、漢字−カタカナ変換によれば、検索クエリ「白鳥庭園」は、「シラトリテイエン」、「シロトリテイエン」、「ハクチョウテイエン」のようにカタカナ変換される。この場合、第1の表記揺れ用語集は、第1の表記揺れ用語「シラトリテイエン」、「シロトリテイエン」、「ハクチョウテイエン」から構成される。作成された第1の表記揺れ用語集は、上記検索クエリと関連付けて第1の格納部701に格納される。
第2の作成部502は、第1の表記揺れ用語集に基づいて第2の表記揺れ用語集を作成する。すなわち、第2の作成部502は、第1の作成部501で作成された第1の表記揺れ用語集を上記第1のルールと異なる第2のルールで処理して得られる第2の表記揺れ用語からなる第2の表記揺れ用語集を作成する。当該第2の表記揺れ用語集の作成の際に用いる第2のルールは特に限定されず、上記第1のルールと同様、形態素解析、漢字−カタカナ変換、カタカナ−漢字変換、カタカナ−アルファベット変換又はアルファベット−カタカナ変換等の手法を用いることができる。例えば、第1のルールとして形態素解析を用いて作成された第1の表記揺れ用語集を構成する第1の表記揺れ用語が「白鳥、庭園」である場合、第2の作成部502は第2のルールとして漢字−カタカナ変換を用いて、「シラトリ、テイエン」、「シロトリ、テイエン」、「ハクチョウ、テイエン」のようにカタカナ変換される。この場合、第2の表記揺れ用語集は、第2の表記揺れ用語「シラトリ、テイエン」、「シロトリ、テイエン」、「ハクチョウ、テイエン」から構成される。作成された第2の表記揺れ用語集は、上記検索クエリ及び/又は第1の表記揺れ用語と関連付けて第2の格納部702に格納される。
表記揺れ用語集格納部7は、第1の作成部501で作成された第1の表記揺れ用語集を格納する第1の格納部701、及び、第2の作成部502で作成された第2の表記揺れ用語集を格納する第2の格納部702を備える。
上記の表記揺れ用語集作成装置1は、表記揺れ用語集作成部5内に第1の作成部501及び第2の作成部502の二つの作成部を備えているが、これに限定されることなく、作成部の数は二つを超えるものであってもよい。この場合、各作成部は他の作成部が用いたルールと異なるルールを用いることとしてもよいし、直前の作成部が用いたルールと異なるルールを用いることとしてもよい。また、表記揺れ用語集格納部7内の格納部は、作成部の数に対応して備えられる。
図2を用いて、図1に示す装置1の動作の一例を説明する。この例において、表記揺れ用語集作成装置1は、検索クエリ「白鳥庭園」に関する表記揺れ用語集を作成する。
まず、ステップ1では、入力受付部3は、検索クエリ「白鳥庭園」の入力を受け付ける。
ステップ3では、第1の作成部501は、ステップ1で入力を受け付けた検索クエリ「白鳥庭園」を形態素解析により、第1の形態素「白鳥」及び第2の形態素「庭園」の二つの単位に分解して得られた「白鳥、庭園」を第1の表記揺れ用語とし、該第1の表記揺れ用語「白鳥、庭園」から構成される第1の表記揺れ用語集を作成し、作成された第1の表記揺れ用語集を検索クエリ「白鳥庭園」と関連付けて第1の格納部701に格納する。
ステップ5では、第2の作成部502は、ステップ3で作成された第1の表記揺れ用語集に含まれる第1の表記揺れ用語「白鳥、庭園」を漢字−カタカナ変換により、第2の表記揺れ用語「シラトリ、テイエン」、「シロトリ、テイエン」、「ハクチョウ、テイエン」から構成される第2の表記揺れ用語集を作成し、作成された第2の表記揺れ用語集を検索クエリ「白鳥庭園」と関連付けて第2の格納部702に格納する。上記第2の表記揺れ用語は、第1の表記揺れ用語「白鳥、庭園」中の第1の形態素「白鳥」をカタカナ変換した「シラトリ」、「シロトリ」、「ハクチョウ」と、第2の形態素「庭園」をカタカナ変換した「テイエン」とを夫々組み合わせて構成される。
ステップ1〜5を実行することにより、表記揺れ用語集作成装置1は、検索クエリ「白鳥庭園」に対応する表記揺れ用語集として、第1の表記揺れ用語集「白鳥、庭園」、第2の表記揺れ用語集「シラトリ、テイエン」、「シロトリ、テイエン」、「ハクチョウ、テイエン」から構成される用語集を作成する。検索クエリ「白鳥庭園」に対し、このような表記揺れ用語集を作成することにより、クライアント端末において検索クエリ「白鳥庭園」の入力を受け付けた際に、検索データベースとしての施設データベースに格納されている施設のうち、その施設情報に「白鳥庭園」のキーワードを含む施設「白鳥庭園」だけでなく、「白鳥」及び「庭園」のキーワードを含む施設、例えば、施設「白鳥日本庭園」を検索することが可能となる。該施設データベースは、表記揺れ用語集作成装置を備える移動体端末装置等に搭載されていてもよく、また、移動体端末装置と通信可能なサーバ装置に搭載されていてもよい。
他の例として、表記揺れ用語集作成装置が二つを超える作成部を備えた場合ついて説明する。この例において、表記揺れ用語集作成装置は、検索クエリ「しらとり庭園」に関する表記揺れ用語集を作成する。
まず、ステップ21では、ステップ1と同様に、入力受付部は、検索クエリ「しらとり庭園」の入力を受け付ける。
ステップ23では、ステップ3と同様に、第1の作成部は、ステップ21で入力を受け付けた検索クエリ「しらとり庭園」を形態素解析して、第1の表記揺れ用語「しらとり、庭園」から構成される第1の表記揺れ用語集を作成し、第1の格納部に格納する。
ステップ25では、ステップ5と同様に、第2の作成部は、ステップ23で作成された第1の表記揺れ用語集に含まれる第1の表記揺れ用語「しらとり、庭園」を漢字−カタカナ変換して、第2の表記揺れ用語「シラトリ、テイエン」から構成される第2の表記揺れ用語集を作成し、第2の格納部に格納する。
ステップ27では、第3の作成部(図示しない)は、ステップ25で作成された第2の表記揺れ用語集に含まれる第2の表記揺れ用語「シラトリ、テイエン」をカタカナ−漢字変換して、第3の表記揺れ用語「白鳥、庭園」から構成される第3の表記揺れ用語集を作成し、第3の格納部に格納する。
ステップ29では、第4の作成部(図示しない)は、ステップ27で作成された第3の表記揺れ用語集に含まれる第3の表記揺れ用語「白鳥、庭園」を漢字−カタカナ変換して、第4の表記揺れ用語「シラトリ、テイエン」、「シロトリ、テイエン」、「ハクチョウ、テイエン」から構成される第4の表記揺れ用語集を作成し、第4の格納部に格納する。
ステップ21〜29を実行することにより、表記揺れ用語集作成装置は、検索クエリ「しらとり庭園」に対応する表記揺れ用語集として、第1の表記揺れ用語集「しらとり、庭園」、第2の表記揺れ用語集「シラトリ、テイエン」、第3の表記揺れ用語集「白鳥、庭園」、第4の表記揺れ用語集「シラトリ、テイエン」、「シロトリ、テイエン」、「ハクチョウ、テイエン」から構成される用語集を作成する。検索クエリ「しらとり庭園」に対しこのような表記揺れ用語集を作成することにより、クライアント端末において検索クエリ「しらとり庭園」の入力を受け付けた際に、施設データベースに格納されている施設のうち、その施設情報に「しらとり庭園」のキーワードを含む施設だけでなく、第3の表記揺れ用語集「白鳥、庭園」に基づき「白鳥」及び「庭園」のキーワードを含む施設、例えば、施設「白鳥庭園」を検索したり、第4の表記揺れ用語集「シロトリ、テイエン」に基づき「シロトリ」及び「テイエン」のキーワードをそのよみ情報に含む施設「白鳥庭園(よみ)シロトリテイエン」を検索することが可能となる。
図3に、本発明の実施の形態の検索システム100を示す。図3において、図1と同一の要素には同一の符号を付して、その説明を部分的に省略する。適宜、図4に示す表を用いて、以下に説明する。
図3に示すのは、第1のクライアント端末11、第2〜第nのクライアント端末(M2〜Mn)及びサーバ装置101を備える検索システム100であって、各クライアント端末とサーバ装置とはネットワークNを介して夫々無線接続されている。
第1のクライアント端末11としては、車載ナビゲーション装置や、ユーザが携帯可能な通信端末装置等が挙げられ、後者の例として、携帯電話機、PDA(Portable Digital Assistants)、携帯ゲーム機、ノート型PC、PND(Portable Navigation Device)、スマートフォン、頭部や腕等に装着可能なウェアラブル機器等が挙げられる。
第1のクライアント端末11は、入力受付部13、クライアント側表記揺れ用語集作成部15、クライアント側表記揺れ用語集格納部17、検索要求部19及びクライアント側通信部20を備える。
入力受付部13、クライアント側表記揺れ用語集作成部15及びクライアント側表記揺れ用語集格納部17は、夫々入力受付部3、表記揺れ用語集作成部5及び表記揺れ用語集格納部7と同様に機能する。
この例において、入力受付部13は、検索クエリ「ビクトリー鶴舞」を受け付ける。
第1のクライアント側作成部1501は、第1のルールとしての形態素解析により、第1のクライアント側表記揺れ用語「ビクトリー、鶴舞」から構成される第1のクライアント側表記揺れ用語集(図4参照)を作成して第1のクライアント側表記揺れ用語集格納部1701に格納する。
第2のクライアント側作成部1502は、第2のルールとしての漢字−カタカナ変換及びカタカナ表記の揺らぎ変換により、第2のクライアント側表記揺れ用語「ビクトリー、ツルマイ」、「ヴィクトリー、ツルマイ」、「ビクトリー、ツルマ」、「ヴィクトリー、ツルマ」、「ビクトリー、カクマイ」・・・から構成される第2のクライアント側表記揺れ用語集(図4参照)を作成して第2のクライアント側表記揺れ用語集格納部1702に格納する。この例において、第2のルールとして「漢字−カタカナ変換」及び「カタカナ表記の揺らぎ変換」の両方を用いたが、第2のルールとして両者の一方、例えば「漢字−カタカナ変換」と用い、更に第3のルールとして他方の「カタカナ表記の揺らぎ変換」を用いて細分化して処理してもよい。
検索要求部19は、入力受付部13を参照して、入力を受け付けた検索クエリ「ビクトリー鶴舞」に対応する施設の検索を要求する。当該検索要求の方法は、特に限定されないが、例えば、検索要求を示す「検索」等のボタンをタッチすることにより、検索要求を実行することができる。
クライアント側通信部20は、各種情報をサーバ装置101へ送信する送信部と、各種情報をサーバ装置101から受信する受信部とを備える。当該クライアント側通信部20が送信する情報としては、例えば、上記検索クエリ及びクライアント側表記揺れ用語集等が挙げられる。また、上記検索要求の実行は、該クライアント側通信部20を介してサーバ装置101へ送信される。一方、当該クライアント側通信部20が受信する情報としては、例えば、後述の検索部による検索結果、スコア等が挙げられる。
サーバ装置101は、施設データベース103、サーバ側表記揺れ用語集作成部105、サーバ側表記揺れ用語集格納部107、サーバ側通信部111、クライアント側表記揺れ用語集格納部113、検索部としての第1の抽出部115及び第2の抽出部116、第1のスコア付与部117及び第1のスコア格納部119を備える。
施設データベース103には、各施設に関連付けて施設名称及び/又は施設住所を含む施設情報が記憶されている。例えば、施設「ヴィクトリー鶴舞」に関連付けて記憶される施設情報として、例えば、施設名称「ヴィクトリー鶴舞」、施設名称よみ「ヴィクトリーツルマ」、施設住所「名古屋市中区千代田○丁目△番×号」、施設住所よみ「ナゴヤシナカクチヨダ○チョウメ△バン×ゴウ」等が挙げられる。また、施設「ビクトリーカフェ鶴舞」に関連付けて記憶される施設情報として、例えば、施設名称「ビクトリーカフェ鶴舞」、施設名称よみ「ビクトリーカフェツルマイ」、施設住所「名古屋市中区栄○丁目△番×号」、施設住所よみ「ナゴヤシナカクサカエ○チョウメ△バン×ゴウ」等が挙げられる。他にも、例えば、施設のジャンル、施設の内容を説明する情報、施設の口コミ情報等の施設情報が記憶されていてもよい。
サーバ側表記揺れ用語集作成部105は、施設データベース103内に格納されている施設名称や施設住所等の施設情報に関するサーバ側表記揺れ用語集を作成する。サーバ側表記揺れ用語集作成部105は、第1のサーバ側作成部1051及び第2のサーバ側作成部1052を備える。
第1のサーバ側作成部1051は、施設名称等に基づいて第1のサーバ側表記揺れ用語集を作成する。すなわち、第1のサーバ側作成部1051は、例えば、施設データベース103内の例えば施設名称を第1のルールで処理して得られる第1のサーバ側表記揺れ用語からなる第1のサーバ側表記揺れ用語集を作成する。当該第1のルールとしては、第1のクライアント側作成部1501で用いられる第1のルールと同一のルールを用いることができる。ここで、第1のクライアント側作成部1501と同様に第1のルールとして形態素解析を用いた場合、施設「ヴィクトリー鶴舞」に対して、第1のサーバ側表記揺れ用語「ヴィクトリー、鶴舞」から構成される第1のサーバ側表記揺れ用語集を作成して第1のサーバ側表記揺れ用語集格納部1071に格納する。
第2のサーバ側作成部1052は、第1のサーバ側表記揺れ用語集に基づいて第2のサーバ側表記揺れ用語集を作成する。すなわち、第2のサーバ側作成部1052は、第1のサーバ側作成部1051で作成された第1のサーバ側表記揺れ用語集を上記第1のルールと異なる第2のルールで処理して得られる第2のサーバ側表記揺れ用語からなる第2の表記揺れ用語集を作成する。当該第2のルールとしては、第2のクライアント側作成部1502で用いられる第2のルールと同一のルールを用いることができる。ここで、第2のクライアント側作成部1502と同様に第2のルールとして漢字−カタカナ変換及びカタカナ表記の揺らぎ変換により、第2のクライアント側表記揺れ用語「ヴィクトリー、ツルマイ」、「ビクトリー、ツルマイ」、「ヴィクトリー、ツルマ」、「ビクトリー、ツルマ」、「ヴィクトリー、カクマイ」・・・から構成される第2のサーバ側表記揺れ用語集を作成して第2のサーバ側表記揺れ用語集格納部1072に格納する。
また、施設「ビクトリーカフェ鶴舞」に対しては、上記と同様の方法によって、第1のサーバ側作成部1051において、第1のサーバ側表記揺れ用語「ビクトリー、カフェ、鶴舞」から構成される第1のサーバ側表記揺れ用語集が作成され、第2のサーバ側作成部1052において、第2のサーバ側表記揺れ用語「ビクトリー、カフェ、ツルマイ」、「ヴィクトリー、カフェ、ツルマイ」、「ビクトリー、カフェ、ツルマ」、「ヴィクトリー、カフェ、ツルマ」、「ビクトリー、カフェ、カクマイ」・・・から構成される第2のサーバ側表記揺れ用語集が作成される。
サーバ側通信部111は、各種情報をクライアント端末11へ送信する送信部と、各種情報をクライアント端末11から受信する受信部とを備える。当該サーバ側通信部111が送信する情報としては、例えば、後述の検索部による検索結果、スコア等が挙げられる。また、一方、当該サーバ側通信部111が受信する情報としては、例えば、上記検索クエリ及びクライアント側表記揺れ用語集等が挙げられる。
クライアント側表記揺れ用語集格納部113はサーバ側通信部111で受信したクライアント側表記揺れ用語集を検索クエリと関連付けて格納し、第1のクライアント側表記揺れ用語集格納部1131及び第2のクライアント側表記揺れ用語集格納部1132を備える。
第1のクライアント側格納部1131には、第1のクライアント側格納部1701に格納された第1のクライアント側表記揺れ用語集が格納される。
第2のクライアント側格納部1132には、第2のクライアント側格納部1702に格納された第2のクライアント側表記揺れ用語集が格納される。
第1の抽出部115は、第1のクライアント側格納部1131及び第1のサーバ側格納部1071を参照して、第1のクライアント側表記揺れ用語集と第1のサーバ側表記揺れ用語集とを比較し、第1のクライアント側表記揺れ用語に合致する第1のサーバ側表記揺れ用語を抽出する。第1の抽出部115は、第1のクライアント側表記揺れ用語に含まれる構成単位を全て含む第1のサーバ側表記揺れ用語を抽出することができる。すなわち、第1のクライアント側表記揺れ用語「ビクトリー、鶴舞」の場合、構成単位「ビクトリー」、「鶴舞」の両方を含む第1のサーバ側表記揺れ用語「ビクトリー、カフェ、鶴舞」が抽出される。第1のクライアント側表記揺れ用語が複数存在する場合には、夫々について上記と同様の方法により比較及び抽出を行う。当該抽出の際に、構成単位の数の異同を更なる条件としてもよく、第1のクライアント側表記揺れ用語の構成単位の数と合致する数の構成単位から構成される第1のサーバ側表記揺れ用語を抽出の対象とすることとしてもよい。他の例として、抽出された第1のサーバ側表記揺れ用語に該第1のサーバ側表記揺れ用語と第1のクライアント側表記揺れ用語との構成単位の数の異同に関する情報を関連付けておくこととしてもよい。このような構成単位の数の異同は、後述の表示順位決定部で検索結果の表示順位を決定する際に用いることができる。
第2の抽出部116は、第2のクライアント側格納部1132及び第2のサーバ側格納部1072を参照して、第2のクライアント側表記揺れ用語集と第2のサーバ側表記揺れ用語集とを比較し、第2のクライアント側表記揺れ用語に合致する第2のサーバ側表記揺れ用語を抽出する。当該抽出の方法は、第1の抽出部115と同様の方法で行うことができる。すなわち、第2のクライアント側表記揺れ用語「ビクトリー、ツルマイ」の場合、構成単位「ビクトリー」、「ツルマイ」の両方を含む第2のサーバ側表記揺れ用語「ビクトリー、ツルマイ」及び「ビクトリー、カフェ、ツルマイ」が抽出される。第2の抽出部116は、第1の抽出部115で抽出された第1のサーバ側表記揺れ用語に関連する施設を除く施設について第2の表記揺れ用語を抽出することとしてもよい。この例において、具体的には、施設「ビクトリーカフェ鶴舞」については第1の抽出部115で第1のサーバ側表記揺れ用語「ビクトリー、カフェ、鶴舞」が抽出されているため、第2の抽出部116は、施設「ビクトリーカフェ鶴舞」を除く施設、例えば、施設「ヴィクトリー鶴舞」について第2のサーバ側表記揺れ用語を抽出することができる。また、第1の抽出部115と同様、第2の抽出部116においても、当該抽出の際に、構成単位の数の異同を更なる条件としてもよく、又は、抽出された第2のサーバ側表記揺れ用語に構成単位の数の異同に関する情報を関連付けておくこととしてもよい。このような構成単位の数の異同は、上記と同様、後述の表示順位決定部で検索結果の表示順位を決定する際に用いることができる。
第1のスコア付与部117は、第1の抽出部115で抽出された第1のサーバ側表記揺れ用語及び第2の抽出部116で抽出された第2のサーバ側表記揺れ用語にスコアを付与する。当該スコア付与の方法として、例えば、第1の抽出部115で抽出された第1のサーバ側表記揺れ用語に、第2の抽出部116で抽出された第2のサーバ側表記揺れ用語よりも高いスコアを付与することができる。例えば、施設「ヴィクトリー鶴舞」について第2の抽出部116で抽出された第2のサーバ側表記揺れ用語「ビクトリー、ツルマイ」に対してスコア「1」を付与した場合、施設「ビクトリーカフェ鶴舞」について第1の抽出部115で抽出された第1のサーバ側表記揺れ用語「ビクトリー、カフェ、ツルマイ」に対してスコア「1」よりも高いスコア「2」を付与することができる。また、第2の抽出部116が、施設「ビクトリーカフェ鶴舞」についても第2のサーバ側表記揺れ用語「ビクトリー、カフェ、ツルマイ」を抽出した場合には、該第2のサーバ側表記揺れ用語に対してもスコア「1」を付与することができる。また、別の例として、第1のスコア付与部117は、上位の抽出部で抽出された表記揺れ用語に優先的にスコアを付与し、その場合には下位の抽出部で抽出された表記揺れ用語にはスコアを付与しないこととしてもよい。当該付与されたスコアは各サーバ側表記揺れ用語と関連付けて第1のスコア格納部119に格納される。当該スコアは、施設と関連付けて格納されてもよく、また、一の施設について複数のスコアが付与されている場合にはそれらのスコアの合計を施設と関連付けて格納してもよい。
図5に、他の実施の形態の検索システム300を示す。図5において、図1及び図3と同一の要素には同一の符号を付して、その説明を部分的に省略する。
図5に示すのは、図3に示す検索システム100において、サーバ装置101に代えてサーバ装置301を備える検索システム300である。
サーバ装置301は、サーバ装置100において、検索クエリ格納部313、第3の抽出部315、第4の抽出部316、第2のスコア付与部317及び第2のスコア格納部319を備える。
検索クエリ格納部313には、クライアント端末11の入力受付部13及び検索要求部19にて入力受付され、検索要求され、通信部20及び111を介して取得された検索クエリが格納される。
第3の抽出部315は、検索クエリ格納部313及び第1のサーバ側格納部1071を参照して、検索クエリと第1のサーバ側表記揺れ用語集とを比較し、検索クエリに合致する第1のサーバ側表記揺れ用語を抽出する。
第4の抽出部316は、検索クエリ格納部313及び第2のサーバ側格納部1072を参照して、検索クエリと第2のサーバ側表記揺れ用語集とを比較し、検索クエリに合致する第2のサーバ側表記揺れ用語を抽出する。
第2のスコア付与部317は、第3の抽出部315で抽出された第1のサーバ側表記揺れ用語に、第4の抽出部316で抽出された第2のサーバ側表記揺れ用語よりも高いスコアを付与する。当該付与されたスコアは各サーバ側表記揺れ用語と関連付けて第2のスコア格納部319に格納される。
図6に、他の実施の形態の検索システム400を示す。図6において、図1、図3及び図5と同一の要素には同一の符号を付して、その説明を部分的に省略する。
図6に示すのは、図3に示す検索システム100において、サーバ装置101に代えてサーバ装置401を備える検索システム400である。
サーバ装置401は、サーバ装置100において、第5の抽出部415、第3のスコア付与部417及び第3のスコア格納部419を備える。
第5の抽出部415は、第1のクライアント側格納部1131及び第2のサーバ側格納部1072を参照して、第1のクライアント側表記揺れ用語集と第2のサーバ側表記揺れ用語集とを比較し、第1のクライアント側表記揺れ用語に合致する第2のサーバ側表記揺れ用語を抽出する。
第3のスコア付与部417は、第1のスコア格納部119を参照して、第5の抽出部415で抽出された第2のサーバ側表記揺れ用語に、第1の抽出部115で抽出された第1のサーバ側表記揺れ用語及び第2の抽出部116で抽出された第2のサーバ側表記揺れ用語よりも低いスコアを付与する。当該付与されたスコアは各サーバ側表記揺れ用語と関連付けて第3のスコア格納部419に格納される。
図7に実施例の検索システム500を示す。図7において、図1、図3、図5及び図6と同一の要素には同一の符号を付して、その説明を部分的に省略する。
図7に示すのは、施設の検索システムに関し、クライアント端末にて検索結果を出力する際に、付与されたスコアの高い施設を優先的に出力可能な検索システム500である。この検索システム500は、第1のクライアント端末510及びサーバ装置530を備えている。
第1のクライアント端末510は、制御部511、メモリ部512、出力部513、入力受付部13、インターフェース部514、通信部20、表記揺れ用語集作成部15、表記揺れ用語集格納部17及び検索要求部19を備えている。
クライアント側制御部511は、バッファメモリその他の装置を備えたコンピュータ装置であり、クライアント端末510を構成する他の要素を制御する。
クライアント側メモリ部512にはコンピュータプログラムが保存され、このコンピュータプログラムはコンピュータ装置である制御部511に読み込まれて、これを機能させる。このコンピュータプログラムはSD(登録商標)メモリカード等の汎用的な媒体へ保存できる。
クライアント側出力部513はディスプレイを含み、後述の表示順位決定部535で決定された表示順位に従って、検索結果としての施設を表示する。また、一般的な出力部としての機能として目的地検索のための検索画面、地図、クライアント端末の現在位置、経路探索を行った際の案内経路、その他の情報を表示する。この出力部513は音声発信部を含み、音声によって上記検索結果を出力してもよい。
クライアント側インターフェース部514はクライアント端末510を無線ネットワーク等へ連結させる。
サーバ装置530は、制御部531、メモリ部532、インターフェース部533、通信部111、施設データベース103、表記揺れ用語集作成部105、表記揺れ用語集格納部107、表記揺れ用語集格納部113、第1の抽出部115、第2の抽出部116、第1のスコア付与部117、第1のスコア格納部119及び表示順位決定部535を備えている。
サーバ側制御部531は、CPU、バッファメモリその他の装置を備えたコンピュータ装置であり、サーバ装置530を構成する他の要素を制御する。
サーバ側メモリ部532にはコンピュータプログラムが保存され、このコンピュータプログラムはコンピュータ装置であるサーバ側制御部531に読み込まれて、これを機能させる。このコンピュータプログラムはDVD等の汎用的な媒体へ保存できる。
サーバ側インターフェース部533はサーバ装置530を無線ネットワーク等へ連結させる。
表示順位決定部535は、第1スコア格納部119に格納された第1のスコアに基づいて、第1の抽出部115及び第2の抽出部116で抽出された表記揺れ用語が関連する施設の表示順位を決定する。当該表示順位の決定の結果、当該スコアの値が大きい施設を上位に表示することができる。例えば、上記例において、表示順位決定部535は、検索クエリ「ビクトリー鶴舞」に対して、第1の抽出部115で抽出された第1のサーバ側表記揺れ用語「ビクトリー、カフェ、鶴舞」が関連する施設「ビクトリーカフェ鶴舞」のスコア「2」と、第2の抽出部116で抽出された第2のサーバ側表記揺れ用語「ビクトリー、ツルマイ」が関連する施設「ヴィクトリー鶴舞」のスコア「1」に基づいて、両検索結果のうち施設「ビクトリーカフェ鶴舞」を第1順位に、施設「ヴィクトリー鶴舞」を第2順位に表示することを決定する。当該決定された表示順位は、施設に関連付けて、通信部111及び20を介してクライアント端末510の出力部513から上述の通り出力される。
表示順位決定部535は、さらに、上述した構成単位の数の異同を上記表示順位に反映させてもよい。例えば、表示順位を決定する対象となる複数の施設のうち、そのスコアが同じである施設については検索クエリと構成単位の数が同じである施設が上位に表示されるよう表示順位を決定することができる。他の例として、構成単位の数の異同に基づく参照スコアを別途設け、上記第1のスコアを付与する際に参照スコアを考慮することとしてもよい。例えば、該構成単位の数が同じであるときに参照スコアとして正のスコア(例えば、スコア「5」)を付与し、又は、該構成単位の数が異なるときに参照スコアとして負のスコア(例えば、スコア「−5」)を付与することができる。前者の場合、例えば、2つの構成要素「ビクトリー」及び「鶴舞」から構成される検索クエリ「ビクトリー鶴舞」に対して、第1のサーバ側表記揺れ用語「ビクトリー、カフェ、鶴舞」は構成要素が3であり異なる一方、第2のサーバ側表記揺れ用語「ヴィクトリー、鶴舞」は構成要素が2つであり同じ数であるため、参照スコア「5」を付与する。この場合において、第1のサーバ側表記揺れ用語「ビクトリー、カフェ、鶴舞」が関連する施設「ビクトリーカフェ鶴舞」のスコア「2」に対して、第2のサーバ側表記揺れ用語「ビクトリー、ツルマイ」が関連する施設「ヴィクトリー鶴舞」は参照スコア「5」が加味され合計スコア「6」となるため、表示順位決定部535は合計スコアの値が大きい施設「ヴィクトリー鶴舞」を施設「ビクトリーカフェ鶴舞」より上位に表示させる。
図8を用いて、図7に示す検索システム500の動作の一例を説明する。
まず、ステップ51では、クライアント端末510に備えられた入力受付部13は、検索ユーザの検索クエリに関する入力を受け付ける。この例において、検索クエリ「ビクトリー鶴舞」の入力を受け付けたものとする。
ステップ53では、クライアント側表記揺れ用語集作成部15内の第1のクライアント側作成部1501は、ステップ51の入力受付に基づき、検索クエリ「ビクトリー鶴舞」を形態素解析して、第1のクライアント側表記揺れ用語「ビクトリー、鶴舞」から構成される第1のクライアント側表記揺れ用語集を作成して、第1のクライアント側表記揺れ用語集格納部1701に格納する。
ステップ55では、クライアント側表記揺れ用語集作成部15内の第2のクライアント側作成部1502は、ステップ53で作成された第1のクライアント側表記揺れ用語集に基づき、第1のクライアント側表記揺れ用語「ビクトリー、鶴舞」を漢字−カタカナ変換及びカタカナ表記の揺らぎ変換して、第2のクライアント側表記揺れ用語「ビクトリー、ツルマイ」、「ヴィクトリー、ツルマイ」、「ビクトリー、ツルマ」、「ヴィクトリー、ツルマ」、「ビクトリー、カクマイ」・・・から構成される第2のクライアント側表記揺れ用語集を作成して、第2のクライアント側表記揺れ用語集格納部1702に格納する。
ステップ57では、検索要求部19は、ステップ51の検索クエリに対応する施設の検索要求を行うべく、該検索クエリ、ステップ53の第1の表記揺れ用語集及びステップ55の第2の表記揺れ用語集を、クライアント側通信部20を介してサーバ装置530に送信する。
ステップ61では、サーバ側表記揺れ用語集作成部105内の第1のサーバ側作成部1051は、施設データベース103内に格納されている施設の施設名称を形態素解析して、第1のサーバ側表記揺れ用語から構成される第1のサーバ側表記揺れ用語集を作成して、第1のサーバ側表記揺れ用語集格納部1071に格納する。この例において、図4に示す通り、施設「ヴィクトリー鶴舞」について第1のサーバ側表記揺れ用語集「ヴィクトリー、鶴舞」が作成され、施設「ビクトリーカフェ鶴舞」について第1のサーバ側表記揺れ用語集「ビクトリー、カフェ、鶴舞」が作成される。
ステップ63では、サーバ側表記揺れ用語集作成部105内の第2のサーバ側作成部1052は、ステップ61で作成された第1のサーバ側表記揺れ用語集を漢字−カタカナ変換及びカタカナ表記湯の揺らぎ変換して、第2のサーバ側表記揺れ用語を作成して、第2のサーバ側表記揺れ用語集格納部1072に格納する。この例において図4に示す通り、施設「ヴィクトリー鶴舞」について第2のサーバ側表記揺れ用語集「ヴィクトリー、ツルマイ」、「ビクトリー、ツルマイ」、「ヴィクトリー、ツルマ」、「ビクトリー、ツルマ」、「ヴィクトリー、カクマイ」・・・が作成され、施設「ビクトリーカフェ鶴舞」について第2のサーバ側表記揺れ用語集「ビクトリー、カフェ、ツルマイ」、「ヴィクトリー、カフェ、ツルマイ」、「ビクトリー、カフェ、ツルマ」、「ヴィクトリー、カフェ、ツルマ」、「ビクトリー、カフェ、カクマイ」・・・が作成される。
ステップ65では、サーバ装置530は、サーバ側通信部111を介して、ステップ57で送信された検索要求を受信する。受信された第1のクライアント側表記揺れ用語集は、クライアント側表記揺れ用語集格納部113内の第1のクライアント側格納部1131に格納され、第2のクライアント側表記揺れ用語集は、第2のクライアント側格納部1132に格納される。
ステップ67では、第1の抽出部115は、ステップ61で作成された第1のサーバ側表記揺れ用語集を参照して、第1のクライアント側格納部1131に格納された第1のクライアント側表記揺れ用語に合致する表記揺れ用語を抽出する。この例において、第1のクライアント側表記揺れ用語「ビクトリー、鶴舞」の構成単位「ビクトリー」、「鶴舞」の両方を含む第1のサーバ側表記揺れ用語「ビクトリー、カフェ、鶴舞」が施設「ビクトリーカフェ鶴舞」に関連付けられて抽出される。
ステップ69では、第2の抽出部116は、ステップ63で作成された第2のサーバ側表記揺れ用語集を参照して、第2のクライアント側格納部1132に格納された第2のクライアント側表記揺れ用語に合致する表記揺れ用語を抽出する。この例において、第2のクライアント側表記揺れ用語のうち「ビクトリー、ツルマイ」の場合、構成単位「ビクトリー」、「ツルマイ」の両方を含む第2のサーバ側表記揺れ用語「ビクトリー、ツルマイ」及び「ビクトリー、カフェ、ツルマイ」が夫々施設「ヴィクトリー鶴舞」、「ビクトリーカフェ鶴舞」に関連付けられて抽出される。
ステップ71では、第1のスコア付与部117は、ステップ67の第1のサーバ側表記揺れ用語及びステップ69の第2のサーバ側表記揺れ用語にスコアを付与し、第1のスコア格納部119に格納する。ステップ71において、第1のスコアは、ステップ67で抽出された第1のサーバ側表記揺れ用語に、ステップ69で抽出された第2のサーバ側表記揺れ用語よりも高いスコアを付与する。例えば、第1のサーバ側表記揺れ用語にスコア「2」、第2のサーバ側表記揺れ用語にスコア「1」を付与することができる。この例において、施設「ビクトリーカフェ鶴舞」の第1のサーバ側表記揺れ用語にスコア「2」、第2のサーバ側表記揺れ用語にスコア「1」を付与するとともに、施設「ヴィクトリー鶴舞」の第2のサーバ側表記揺れ用語にスコア「1」を付与する。
ステップ73では、表示順位決定部535は、ステップ71で付与されたスコアに基づき、夫々のサーバ側表記揺れ用語に関連付けられた施設の表示順位を決定する。当該表示順位の決定は、スコアの高い順に上位の表示順位となるよう決定される。例えば、一の施設について複数のサーバ側表記揺れ用語に夫々スコアが付与されている場合には、それらの合計スコアを表示順位決定の指標としてもよいし、一の施設について複数のサーバ側表記揺れ用語に付与されたスコアのうち最も高いスコアを表示順位決定の指標としてもよい。前者の場合、例えば、施設「ビクトリーカフェ鶴舞」のスコアは第1のサーバ側表記揺れ用語に対し「2」及び第2のサーバ側表記揺れ用語に対し「1」付与されているため、その合計スコアは「3」となる。施設「ヴィクトリー鶴舞」のスコアは第2のサーバ側表記揺れ用語に対し「1」付与されているため、その合計スコアは「1」である。したがって、その合計スコアがより大きい施設「ビクトリーカフェ鶴舞」が施設「ヴィクトリー鶴舞」に比べ上位の表示順位となる。後者の場合、例えば、施設「ビクトリーカフェ鶴舞」のサーバ側表記揺れ用語に付与されたスコアのうち最も高いスコアは「2」であり、施設「ヴィクトリー鶴舞」のサーバ側表記揺れ用語に付与されたスコアのうち最も高いスコアは「1」であるため、そのスコアがより大きい施設「ビクトリーカフェ鶴舞」が施設「ヴィクトリー鶴舞」に比べ上位の表示順位となる。
ステップ75では、ステップ73で決定された表示順位とともに、ステップ67及びステップ69で抽出されたサーバ側表記揺れ用語に関連付けられた施設を検索結果としてクライアント端末に送信する。
ステップ59では、クライアント端末510は、ステップ75の検索結果に関する情報を受信し、出力部513により出力する。この例において、出力部としての表示部は、検索結果として、第1順位に施設「ビクトリーカフェ鶴舞」、第2順位に施設「ヴィクトリー鶴舞」を表示する。
以上、本発明の実施の形態及び実施例について説明してきたが、これらのうち、2つ以上の実施の形態(実施例)を組み合わせて実施しても構わない。あるいは、これらのうち、1つの実施の形態(実施例)を部分的に実施しても構わない。さらには、これらのうち、2つ以上の実施の形態(実施例)を部分的に組み合わせて実施しても構わない。
この発明は、上記発明の実施の形態及び実施例の説明に何ら限定されるものではない。特許請求の範囲の記載を逸脱せず、当業者が容易に想到できる範囲で種々の変形態様もこの発明に含まれる。
1 表記揺れ用語集作成装置
3 13 入力受付部
5 15 105 表記揺れ用語集作成部
7 17 107 113 表記揺れ用語集格納部
100 300 400 500 検索システム
11 510 クライアント端末
19 検索要求部
20 111 通信部
101 301 401 530 サーバ装置
103 施設データベース
115 116 315 316 415 抽出部
117 317 417 スコア付与部
119 319 419 スコア格納部
313 検索クエリ格納部
535 表示順位決定部

Claims (19)

  1. 検索クエリに対する表記揺れ用語集を作成する装置であって、
    前記表記揺れ用語集は、第1の表記揺れ用語集及び第2の表記揺れ用語集を含み、
    前記検索クエリを第1のルールで処理して得られる第1の表記揺れ用語からなる前記第1の表記揺れ用語集を作成し、第1の表記揺れ用語集格納部に格納する第1の作成部と、
    前記第1の表記揺れ用語集を前記第1のルールと異なる第2のルールで処理して得られる第2の表記揺れ用語からなる前記第2の表記揺れ用語集を作成し、第2の表記揺れ用語集格納部に格納する第2の作成部と、
    を備える、表記揺れ用語集作成装置。
  2. 前記第1のルールは形態素解析の手法である、請求項1に記載の表記揺れ用語集作成装置。
  3. クライアント端末からの検索クエリに基づいて、該クライアント端末とネットワークを介して通信可能に接続されたサーバ装置が検索を実行する検索システムであって、
    前記クライアント端末は、
    検索クエリの入力を受け付ける入力受付部と、
    前記入力を受け付けた検索クエリを前記第1のルールで処理して得られる第1のクライアント側表記揺れ用語からなる第1のクライアント側表記揺れ用語集を作成し、第1のクライアント側表記揺れ用語集格納部に格納する第1のクライアント側作成部と、
    前記第1のクライアント側表記揺れ用語集を前記第2のルールで処理して得られる第2のクライアント側表記揺れ用語からなる第2のクライアント側表記揺れ用語集を作成し、第2のクライアント側表記揺れ用語集格納部に格納する第2のクライアント側作成部と、
    を備え、
    前記サーバ装置は、
    施設名称及び/又は施設住所を含む施設情報を記憶する施設データベースと、
    前記施設名称及び/又は施設住所に含まれるキーワードを第1のルールで処理して得られる第1のサーバ側表記揺れ用語からなる第1のサーバ側表記揺れ用語集を作成し、第1のサーバ側表記揺れ用語集格納部に格納する第1のサーバ側作成部と、
    前記第1のサーバ側表記揺れ用語集を前記第1のルールと異なる第2のルールで処理して得られる第2のサーバ側表記揺れ用語からなる第2のサーバ側表記揺れ用語集を作成し、第2のサーバ側表記揺れ用語集格納部に格納する第2のサーバ側作成部と、
    前記第1のクライアント側表記揺れ用語集と前記第1のサーバ側表記揺れ用語集とを比較し、前記第1のクライアント側表記揺れ用語に合致する前記第1のサーバ側表記揺れ用語を抽出する第1の抽出部と、
    前記第2のクライアント側表記揺れ用語集と前記第2のサーバ側表記揺れ用語集とを比較し、前記第2のクライアント側表記揺れ用語に合致する前記第2のサーバ側表記揺れ用語を抽出する第2の抽出部と、
    前記第1の抽出部で抽出された第1のサーバ側表記揺れ用語及び前記第2の抽出部で抽出された第2のサーバ側表記揺れ用語にスコアを付与する第1のスコア付与部と、
    を備える、検索システム。
  4. 前記第1のスコア付与部は、前記第1の抽出部で抽出された第1のサーバ側表記揺れ用語に、前記第2の抽出部で抽出された第2のサーバ側表記揺れ用語よりも高いスコアを付与する、
    請求項3に記載の検索システム。
  5. 前記入力を受け付けた検索クエリと前記第1のサーバ側表記揺れ用語集とを比較し、前記入力を受け付けた検索クエリに合致する前記第1のサーバ側表記揺れ用語を抽出する第3の抽出部と、
    前記入力を受け付けた検索クエリと前記第2のサーバ側表記揺れ用語集とを比較し、前記入力を受け付けた検索クエリに合致する前記第2のサーバ側表記揺れ用語を抽出する第4の抽出部と、
    前記第3の抽出部で抽出された第1のサーバ側表記揺れ用語に、前記第4の抽出部で抽出された第2のサーバ側表記揺れ用語よりも高いスコアを付与する第2のスコア付与部と、
    を備える、請求項3又は4に記載の検索システム。
  6. 前記第1のクライアント側表記揺れ用語集と前記第2のサーバ側表記揺れ用語集とを比較し、前記第1のクライアント側表記揺れ用語に合致する前記第2のサーバ側表記揺れ用語を抽出する第5の抽出部と、
    前記第5の抽出部で抽出された第2のサーバ側表記揺れ用語に、前記第1の抽出部で抽出された第1のサーバ側表記揺れ用語及び前記第2の抽出部で抽出された第2のサーバ側表記揺れ用語よりも低いスコアを付与する第3のスコア付与部と、
    を備える、請求項3又は4に記載の検索システム。
  7. 検索クエリに対する表記揺れ用語集を作成する方法であって、
    前記表記揺れ用語集は、第1の表記揺れ用語集及び第2の表記揺れ用語集を含み、
    第1の作成部が、前記検索クエリを第1のルールで処理して得られる第1の表記揺れ用語からなる前記第1の表記揺れ用語集を作成し、第1の表記揺れ用語集格納部に格納する第1の作成ステップと、
    第2の作成部が、前記第1の表記揺れ用語集を前記第1のルールと異なる第2のルールで処理して得られる第2の表記揺れ用語からなる前記第2の表記揺れ用語集を作成し、第2の表記揺れ用語集格納部に格納する第2の作成ステップと、
    を備える、表記揺れ用語集作成方法。
  8. 前記第1のルールは形態素解析の手法である、請求項7に記載の表記揺れ用語集作成方法。
  9. クライアント端末からの検索クエリに基づいて、該クライアント端末とネットワークを介して通信可能に接続されたサーバ装置が検索を実行する検索方法であって、
    前記クライアント端末において、入力受付部が、検索クエリの入力を受け付ける入力受付ステップと、
    前記クライアント端末において、第1のクライアント側作成部が、前記入力を受け付けた検索クエリを前記第1のルールで処理して得られる第1のクライアント側表記揺れ用語からなる第1のクライアント側表記揺れ用語集を作成し、第1のクライアント側表記揺れ用語集格納部に格納する第1のクライアント側作成ステップと、
    前記クライアント端末において、第2のクライアント側作成部が、前記第1のクライアント側表記揺れ用語集を前記第2のルールで処理して得られる第2のクライアント側表記揺れ用語からなる第2のクライアント側表記揺れ用語集を作成し、第2のクライアント側表記揺れ用語集格納部に格納する第2のクライアント側作成ステップと、
    前記サーバ装置において、施設名称及び/又は施設住所を含む施設情報を施設データベースに記憶する記憶ステップと、
    前記サーバ装置において、第1のサーバ側作成部が、前記施設名称及び/又は施設住所に含まれるキーワードを第1のルールで処理して得られる第1のサーバ側表記揺れ用語からなる第1のサーバ側表記揺れ用語集を作成し、第1のサーバ側表記揺れ用語集格納部に格納する第1のサーバ側作成ステップと、
    前記サーバ装置において、第2のサーバ側作成部が、前記第1のサーバ側表記揺れ用語集を前記第1のルールと異なる第2のルールで処理して得られる第2のサーバ側表記揺れ用語からなる第2のサーバ側表記揺れ用語集を作成し、第2のサーバ側表記揺れ用語集格納部に格納する第2のサーバ側作成ステップと、
    前記サーバ装置において、第1の抽出部が、前記第1のクライアント側表記揺れ用語集と前記第1のサーバ側表記揺れ用語集とを比較し、前記第1のクライアント側表記揺れ用語に合致する前記第1のサーバ側表記揺れ用語を抽出する第1の抽出ステップと、
    前記サーバ装置において、第2の抽出部が、前記第2のクライアント側表記揺れ用語集と前記第2のサーバ側表記揺れ用語集とを比較し、前記第2のクライアント側表記揺れ用語に合致する前記第2のサーバ側表記揺れ用語を抽出する第2の抽出ステップと、
    前記サーバ装置において、第1のスコア付与部が、前記第1の抽出ステップで抽出された第1のサーバ側表記揺れ用語及び前記第2の抽出ステップで抽出された第2のサーバ側表記揺れ用語にスコアを付与する第1のスコア付与ステップと、
    を備える、検索方法。
  10. 前記第1のスコア付与ステップでは、前記第1の抽出ステップで抽出された第1のサーバ側表記揺れ用語に、前記第2の抽出ステップで抽出された第2のサーバ側表記揺れ用語よりも高いスコアを付与する、
    請求項9に記載の検索方法。
  11. 第3の抽出部が、前記入力を受け付けた検索クエリと前記第1のサーバ側表記揺れ用語集とを比較し、前記入力を受け付けた検索クエリに合致する前記第1のサーバ側表記揺れ用語を抽出する第3の抽出ステップと、
    第4の抽出部が、前記入力を受け付けた検索クエリと前記第2のサーバ側表記揺れ用語集とを比較し、前記入力を受け付けた検索クエリに合致する前記第2のサーバ側表記揺れ用語を抽出する第4の抽出ステップと、
    第2のスコア付与部が、前記第3の抽出ステップで抽出された第1のサーバ側表記揺れ用語に、前記第4の抽出ステップで抽出された第2のサーバ側表記揺れ用語よりも高いスコアを付与する第2のスコア付与ステップと、
    を備える、請求項9又は10に記載の検索方法。
  12. 第5の抽出部が、前記第1のクライアント側表記揺れ用語集と前記第2のサーバ側表記揺れ用語集とを比較し、前記第1のクライアント側表記揺れ用語に合致する前記第2のサーバ側表記揺れ用語を抽出する第5の抽出ステップと、
    第3のスコア付与部が、前記第5の抽出ステップで抽出された第2のサーバ側表記揺れ用語に、前記第1の抽出ステップで抽出された第1のサーバ側表記揺れ用語及び前記第2の抽出ステップで抽出された第2のサーバ側表記揺れ用語よりも低いスコアを付与する第3のスコア付与ステップと、
    を備える、請求項9又は10に記載の検索方法。
  13. 検索クエリに対する表記揺れ用語集を作成するためのコンピュータプログラムであって、
    前記表記揺れ用語集は、第1の表記揺れ用語集及び第2の表記揺れ用語集を含み、
    コンピュータを、
    前記検索クエリを第1のルールで処理して得られる第1の表記揺れ用語からなる前記第1の表記揺れ用語集を作成し、第1の表記揺れ用語集格納手段に格納する第1の作成手段と、
    前記第1の表記揺れ用語集を前記第1のルールと異なる第2のルールで処理して得られる第2の表記揺れ用語からなる前記第2の表記揺れ用語集を作成し、第2の表記揺れ用語集格納手段に格納する第2の作成手段、
    として機能させる、コンピュータプログラム。
  14. 前記第1のルールは形態素解析の手法である、請求項13に記載のコンピュータプログラム。
  15. クライアント端末からの検索クエリに基づいて、該クライアント端末とネットワークを介して通信可能に接続されたサーバ装置が検索するよう構成された検索システムに適用されるコンピュータプログラムであって、
    前記クライアント端末として機能するコンピュータを、
    検索クエリの入力を受け付ける入力受付手段と、
    前記入力を受け付けた検索クエリを前記第1のルールで処理して得られる第1のクライアント側表記揺れ用語からなる第1のクライアント側表記揺れ用語集を作成し、第1のクライアント側表記揺れ用語集格納手段に格納する第1のクライアント側作成手段と、
    前記第1のクライアント側表記揺れ用語集を前記第2のルールで処理して得られる第2のクライアント側表記揺れ用語からなる第2のクライアント側表記揺れ用語集を作成し、第2のクライアント側表記揺れ用語集格納手段に格納する第2のクライアント側作成手段、
    として機能させ、
    前記サーバ装置として機能するコンピュータを、
    施設名称及び/又は施設住所を含む施設情報を施設データベースに記憶する記憶手段と、
    前記施設名称及び/又は施設住所に含まれるキーワードを第1のルールで処理して得られる第1のサーバ側表記揺れ用語からなる第1のサーバ側表記揺れ用語集を作成し、第1のサーバ側表記揺れ用語集格納手段に格納する第1のサーバ側作成手段と、
    前記第1のサーバ側表記揺れ用語集を前記第1のルールと異なる第2のルールで処理して得られる第2のサーバ側表記揺れ用語からなる第2のサーバ側表記揺れ用語集を作成し、第2のサーバ側表記揺れ用語集格納手段に格納する第2のサーバ側作成手段と、
    前記第1のクライアント側表記揺れ用語集と前記第1のサーバ側表記揺れ用語集とを比較し、前記第1のクライアント側表記揺れ用語に合致する前記第1のサーバ側表記揺れ用語を抽出する第1の抽出手段と、
    前記第2のクライアント側表記揺れ用語集と前記第2のサーバ側表記揺れ用語集とを比較し、前記第2のクライアント側表記揺れ用語に合致する前記第2のサーバ側表記揺れ用語を抽出する第2の抽出手段と、
    前記第1の抽出手段で抽出された第1のサーバ側表記揺れ用語及び前記第2の抽出部で抽出された第2のサーバ側表記揺れ用語にスコアを付与する第1のスコア付与手段、
    として機能させる、コンピュータプログラム。
  16. 前記第1のスコア付与手段は、前記第1の抽出手段で抽出された第1のサーバ側表記揺れ用語に、前記第2の抽出手段で抽出された第2のサーバ側表記揺れ用語よりも高いスコアを付与する、
    請求項15に記載のコンピュータプログラム。
  17. 前記サーバ装置として機能するコンピュータを、更に、
    前記入力を受け付けた検索クエリと前記第1のサーバ側表記揺れ用語集とを比較し、前記入力を受け付けた検索クエリに合致する前記第1のサーバ側表記揺れ用語を抽出する第3の抽出手段と、
    前記入力を受け付けた検索クエリと前記第2のサーバ側表記揺れ用語集とを比較し、前記入力を受け付けた検索クエリに合致する前記第2のサーバ側表記揺れ用語を抽出する第4の抽出手段と、
    前記第3の抽出手段で抽出された第1のサーバ側表記揺れ用語に、前記第4の抽出手段で抽出された第2のサーバ側表記揺れ用語よりも高いスコアを付与する第2のスコア付与手段、
    として機能させる、請求項15又は16に記載のコンピュータプログラム。
  18. 前記サーバ装置として機能するコンピュータを、更に、
    前記第1のクライアント側表記揺れ用語集と前記第2のサーバ側表記揺れ用語集とを比較し、前記第1のクライアント側表記揺れ用語に合致する前記第2のサーバ側表記揺れ用語を抽出する第5の抽出手段と、
    前記第5の抽出手段で抽出された第2のサーバ側表記揺れ用語に、前記第1の抽出手段で抽出された第1のサーバ側表記揺れ用語及び前記第2の抽出手段で抽出された第2のサーバ側表記揺れ用語よりも低いスコアを付与する第3のスコア付与手段、
    として機能させる、請求項15又は16に記載のコンピュータプログラム。
  19. 請求項13〜18のいずれか一項に記載のコンピュータプログラムを記録する記録媒体。
JP2016139878A 2016-07-15 2016-07-15 検索システム、検索方法、それらのコンピュータプログラム及びそれらのコンピュータプログラムを記録した記録媒体 Active JP6537477B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016139878A JP6537477B2 (ja) 2016-07-15 2016-07-15 検索システム、検索方法、それらのコンピュータプログラム及びそれらのコンピュータプログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016139878A JP6537477B2 (ja) 2016-07-15 2016-07-15 検索システム、検索方法、それらのコンピュータプログラム及びそれらのコンピュータプログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2018010543A true JP2018010543A (ja) 2018-01-18
JP6537477B2 JP6537477B2 (ja) 2019-07-03

Family

ID=60994425

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016139878A Active JP6537477B2 (ja) 2016-07-15 2016-07-15 検索システム、検索方法、それらのコンピュータプログラム及びそれらのコンピュータプログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP6537477B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111160564A (zh) * 2019-12-17 2020-05-15 电子科技大学 一种基于特征张量的中文知识图谱表示学习方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008299675A (ja) * 2007-05-31 2008-12-11 Yahoo Japan Corp かな混在表記抽出装置、方法及びプログラム
JP2009223463A (ja) * 2008-03-14 2009-10-01 Nippon Telegr & Teleph Corp <Ntt> 同義性判定装置、その方法、プログラム及び記録媒体
JP2012123541A (ja) * 2010-12-07 2012-06-28 Rakuten Inc サーバ、情報管理方法、情報管理プログラム、及びそのプログラムを記録するコンピュータ読み取り可能な記録媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008299675A (ja) * 2007-05-31 2008-12-11 Yahoo Japan Corp かな混在表記抽出装置、方法及びプログラム
JP2009223463A (ja) * 2008-03-14 2009-10-01 Nippon Telegr & Teleph Corp <Ntt> 同義性判定装置、その方法、プログラム及び記録媒体
JP2012123541A (ja) * 2010-12-07 2012-06-28 Rakuten Inc サーバ、情報管理方法、情報管理プログラム、及びそのプログラムを記録するコンピュータ読み取り可能な記録媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
平手 勇宇、外2名: "キーワード型検索エンジンにおける修正キーワード提示アルゴリズム", 日本データベース学会論文誌, vol. 第9巻,第1号, JPN6019008078, 25 June 2010 (2010-06-25), JP, pages p.23−28 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111160564A (zh) * 2019-12-17 2020-05-15 电子科技大学 一种基于特征张量的中文知识图谱表示学习方法

Also Published As

Publication number Publication date
JP6537477B2 (ja) 2019-07-03

Similar Documents

Publication Publication Date Title
US8745051B2 (en) Resource locator suggestions from input character sequence
US10282419B2 (en) Multi-domain natural language processing architecture
US20140201229A1 (en) Providing display suggestions
US9710456B1 (en) Analyzing user reviews to determine entity attributes
JP6180470B2 (ja) 文章候補提示端末、文章候補提示システム、文章候補提示方法、及びプログラム
JP6506489B1 (ja) 特許評価判定方法、特許評価判定装置、および特許評価判定プログラム
JP2020516980A (ja) コンテキストディープブックマーキング
CN111259262A (zh) 一种信息检索方法、装置、设备及介质
JP2006099428A (ja) 文書要約作成システム、方法、及びプログラム
US10387543B2 (en) Phoneme-to-grapheme mapping systems and methods
JP5231484B2 (ja) 音声認識装置、音声認識方法、プログラム、及びプログラムを配信する情報処理装置
JP2010067005A (ja) 検索装置、および検索装置の制御方法
WO2008038416A1 (fr) Dispositif de recherche de document et procédé de recherche de document
JP6846666B2 (ja) 翻訳文生成方法、翻訳文生成装置及び翻訳文生成プログラム
JP2011065255A (ja) データ処理装置、データ名生成方法及びコンピュータプログラム
JP2010092357A (ja) 施設関連情報検索方法および施設関連情報検索システム
JP2011165092A (ja) 文書画像関連情報提供装置、及び文書画像関連情報取得システム
JP5179564B2 (ja) クエリセグメント位置決定装置
JP2018010543A (ja) 表記揺れ用語集作成装置、検索システム、それらの方法、それらのコンピュータプログラム及びそれらのコンピュータプログラムを記録した記録媒体
JP6571053B2 (ja) 施設検索装置、施設検索方法、コンピュータプログラム及びコンピュータプログラムを記録した記録媒体
KR101349969B1 (ko) 추천 질의어 제공 시스템 및 방법
JP6496286B2 (ja) 施設検索装置、施設検索方法、コンピュータプログラム及びコンピュータプログラムを記録した記録媒体
CN112691379A (zh) 游戏资源文本审核方法及装置、存储介质、计算机设备
JP2020021455A (ja) 特許評価判定方法、特許評価判定装置、および特許評価判定プログラム
JP2007148630A (ja) 特許分析装置、特許分析システム、特許分析方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180226

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190313

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190509

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190529

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190604

R150 Certificate of patent or registration of utility model

Ref document number: 6537477

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250