JP2009271869A - 情報検索装置、情報検索方法、及びコンピュータプログラム - Google Patents

情報検索装置、情報検索方法、及びコンピュータプログラム Download PDF

Info

Publication number
JP2009271869A
JP2009271869A JP2008124048A JP2008124048A JP2009271869A JP 2009271869 A JP2009271869 A JP 2009271869A JP 2008124048 A JP2008124048 A JP 2008124048A JP 2008124048 A JP2008124048 A JP 2008124048A JP 2009271869 A JP2009271869 A JP 2009271869A
Authority
JP
Japan
Prior art keywords
information
character
divided
search
specifying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008124048A
Other languages
English (en)
Inventor
Noriyuki Shirakami
則幸 白上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canvas Mapple Co Ltd
Original Assignee
Canvas Mapple Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canvas Mapple Co Ltd filed Critical Canvas Mapple Co Ltd
Priority to JP2008124048A priority Critical patent/JP2009271869A/ja
Publication of JP2009271869A publication Critical patent/JP2009271869A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】文字情報の適宜分割において、連続した文字列が途中で分割されてしまう不都合を解消し、所望のサービス情報を効率良く円滑に探し出す検索を行う。
【解決手段】本装置10では、サービス情報に含まれる文字情報を適宜分割し、分割した後の各文字情報の品詞を特定し、所定の品詞である分割文字情報を抽出した後、抽出した分割文字情報同士の連続性を判定して、連続する分割文字情報同士は連結して複合語とする。次いで、複合語とした文字情報と、抽出した分割文字情報の文字数を算出し、2文字以上の分割文字情報を索引用の文字列として特定すると共に、この文字列を含むサービス情報の記憶位置を特定する検索位置特定情報を特定し、互いに関連付けて記憶するサービス検索情報記憶部F2を作成する。そして、サービス情報を検索するための文字列の入力を受け付けたとき、このサービス検索情報記憶部を参照してサービス情報を検索する。
【選択図】図3

Description

本発明は、所望のサービス情報を探し出す検索技術に係り、詳しくは、検索対象となる所定の情報群より、指定(入力)された文字列に対応するサービス情報を、効率良く円滑に探し出すことのできる検索を行う情報検索装置、情報検索方法、及び情報検索用のコンピュータプログラムに関する。
従来、ガソリンスタントやコンビニエンスストア、ラーメン店、ホテル・旅館といった店舗や、有名な施設、行楽地といったPOI(Point Of Interest)を検索対象物とし、その属性となり得る名称や住所、紹介記事等の文字情報に含まれる文字列からPOIを探し出し、POIに関する情報をサービス情報として表示する情報検索装置が知られている。また、この情報検索装置機能を備え、電子地図と共にその情報を表示するカーナビゲーション装置(以下、「カーナビ」という。)も知られている。
このような情報検索装置では、検索データより所望のサービス情報を探し出す場合、サービス情報に含まれる文字情報を適宜分割して得られた文字列を検索用の索引(インデックス)としている。この場合、日本語の文字情報を適宜分割する解析手法として、形態素解析というものが用いられている。この形態素解析とは、コンピュータ等の計算機を用いた自然言語処理の基礎技術のひとつであり、自然言語で書かれた文を、言語で意味を持つ最小単位、すなわち形態素の列に分割し、それぞれの品詞を判別する作業をいう。
ところが、形態素解析において文字情報を適宜分割すると、連続した文字列(単語)であっても途中で分割され、1文字で区切られてしまうことがある。そのため、得られた結果の形態素を検索用の索引文字列として用いると、サービス情報を検索するために検索システムなどでユーザが入力すると思われる文字列とは異なるものとなってしまい、所望のサービス情報を探し出すことができないことがある。
特に、たとえばPOIの紹介記事といったテキスト文においては、連続した文字列が途中で分割されてしまうと、POIの特徴を示す索引とはなり得ない文字列も存在することになり、所望の情報を効率良く探し出すことができない検索精度が劣るものとなってしまう虞もある。
したがって、サービス情報に含まれる文字情報を適宜分割して得られた文字列を、適切な検索用の索引文字列としてそのまま採用することができない。
また、形態素解析等によって適宜分割された結果の形態素を索引用の索引文字列としてそのまま用いると、上述のように1文字で区切られた文字情報といった索引とはなり得ない文字列の存在が多くなる虞が多分にあり、データサイズが非常に大きなものとなってしまうと共に、所望の情報を素早く探し出すことが困難となってしまうといった問題がある。
そこで、索引として用いる文字列の登録を制限し、所望のサービス情報を素早く探し出すことができるようにした手段が提案されている。
たとえば、施設の正式名称を入力し、入力された施設の正式名称を形態素に分割し、分割された形態素から地域名称及び施設の正式名称の一部を抽出し、抽出された地域名称と抽出された施設の正式名称の一部とを連結単語で連結した単語を辞書用単語として生成するようにした手段がある(特許文献1を参照)。
特開2005−202198号公報
しかしながら、上記特許文献1に記載の技術は、サービス情報に含まれる文字情報を適宜分割して得られた文字列を、適切な索引用の索引文字列として採用することができるように工夫を施したものではない。
また、Webを利用して情報検索サービスを行うWebアプリでは、データベース等を使用することにより、入力された文字列に応じて適切に検索を行うようにするものもある。しかしながら、カーナビのような限られた環境ではデータサイズの制約によりデータベースを導入することが困難である。
このように、形態素解析等による文字情報の適宜分割において、連続した文字列が途中で分割されてしまうことの不都合を解消し、得られた索引用の索引文字列から所望のサービス情報を効率良く円滑に探し出すことを可能とした検索手段は、現在のところ提案されていない。
本発明は、上記事情に鑑みて成されたものであり、形態素解析等による文字情報の適宜分割において、連続した文字列が途中で分割されてしまうことの不都合を解消し、得られた索引用の索引文字列から所望のサービス情報を効率良く円滑に探し出す検索を行うことが可能な仕組みを提供することを目的とする。
本発明の情報検索装置は、検索対象となる所定の情報群より、指定された文字列に対応するサービス情報を効率良く円滑に探し出す検索を行う情報検索装置であって、前記サービス情報を記憶し、その記憶位置を特定する検索位置特定情報と、前記サービス情報と、を互いに関連付けて記憶する第1記憶手段と、前記サービス情報に含まれる文字情報を適宜分割する文字情報分割手段と、前記文字情報分割手段において分割した後の各文字情報(以下、「分割文字情報」という。)の品詞を特定し、所定の品詞である分割文字情報を抽出する文字情報抽出手段と、前記文字情報抽出手段において抽出した分割文字情報同士の連続性を判定し、連続する分割文字情報同士は連結して複合語とする文字情報連結手段と、前記文字情報連結手段で複合語とした分割文字情報を含み、前記文字情報抽出手段において抽出した分割文字情報の文字数を算出し、2文字以上の分割文字情報を索引用の文字列として特定する文字列特定手段と、前記文字情報分割手段で分割した前記サービス情報の前記第1記憶手段での記憶位置を特定する検索位置特定情報を特定し、前記文字列特定手段で特定した文字列と、特定したこの検索位置特定情報と、を互いに関連付けて記憶する第2記憶手段を作成する索引情報作成手段と、前記サービス情報を検索するための文字列の入力を受け付ける文字列情報受付手段と、前記文字列情報受付手段で受け付けた文字列に基づき、前記索引情報作成手段で作成した前記第2記憶手段を参照して検索位置特定情報を特定する検索位置情報特定手段と、前記検索位置情報特定手段で特定した検索位置特定情報に基づき、前記第1記憶手段を参照してサービス情報を特定し、抽出するサービス情報検索手段と、前記サービス情報検索手段で抽出したサービス情報を出力するサービス情報出力手段と、を備えることを特徴とする。
また、本発明の情報検索装置は、前記文字情報連結手段が、前記文字情報分割手段において分割した文字情報の前記サービス情報内での属性区分を判定し、この属性区分が紹介記事であるとき、前記分割文字情報同士の連続性に基づいた連結を行うものとしても良い。
また、本発明の情報検索方法は、サービス情報を記憶し、その記憶位置を特定する検索位置特定情報と、前記サービス情報と、を互いに関連付けて記憶する第1記憶手段、を備え、情報検索装置において、検索対象となる所定の情報群より、指定された文字列に対応するサービス情報を効率良く円滑に探し出す検索を行う情報検索方法であって、前記情報検索装置が、前記サービス情報に含まれる文字情報を適宜分割する第1ステップと、前記情報検索装置において、前記第1ステップにおいて分割した後の各文字情報(以下、「分割文字情報」という。)の品詞を特定し、所定の品詞である分割文字情報を抽出する第2ステップと、前記情報検索装置において、前記第2ステップにおいて抽出した分割文字情報同士の連続性を判定し、連続する分割文字情報同士は連結して複合語とする第3ステップと、前記情報検索装置において、前記第3ステップで複合語とした分割文字情報を含み、前記第2ステップにおいて抽出した分割文字情報の文字数を算出し、2文字以上の分割文字情報を索引用の文字列として特定する第4ステップと、前記情報検索装置において、前記第1ステップで分割した前記サービス情報の前記第1記憶手段での記憶位置を特定する検索位置特定情報を特定し、前記第4ステップで特定した文字列と、特定したこの検索位置特定情報と、を互いに関連付けて記憶する第2記憶手段を作成する第5ステップと、前記情報検索装置において、前記サービス情報を検索するための文字列の入力を受け付ける第6ステップと、前記情報検索装置において、前記第6ステップで受け付けた文字列に基づき、前記第5ステップで作成した前記第2記憶手段を参照して検索位置特定情報を特定する第7ステップと、前記情報検索装置において、前記第7ステップで特定した検索位置特定情報に基づき、前記第1記憶手段を参照してサービス情報を特定し、抽出する第8ステップと、前記第8ステップで抽出したサービス情報を前記情報検索装置より出力する第9ステップと、を含むことを特徴とする。
また、本発明の情報検索方法は、前記情報検索装置において、前記第3ステップが、前記第1ステップにおいて分割した文字情報の前記サービス情報内での属性区分を判定し、この属性区分が紹介記事であるとき、前記分割文字情報同士の連続性に基づいた連結を行うものとしても良い。
また、本発明のコンピュータプログラムは、サービス情報を記憶し、その記憶位置を特定する検索位置特定情報と、前記サービス情報と、を互いに関連付けて記憶する第1記憶手段、を備え、検索対象となる所定の情報群より、指定された文字列に対応するサービス情報を効率良く円滑に探し出す検索を行うことを実行させるためにコンピュータを、前記サービス情報に含まれる文字情報を適宜分割する手段、分割した後の前記各文字情報(以下、「分割文字情報」という。)の品詞を特定し、所定の品詞である分割文字情報を抽出する手段、抽出した前記分割文字情報同士の連続性を判定し、連続する分割文字情報同士は連結して複合語とする手段、前記複合語とした分割文字情報を含み、抽出した前記分割文字情報の文字数を算出し、2文字以上の分割文字情報を索引用の文字列として特定する手段、分割した前記サービス情報の前記第1記憶手段での記憶位置を特定する検索位置特定情報を特定し、特定した前記文字列と、特定したこの検索位置特定情報と、を互いに関連付けて記憶する第2記憶手段を作成する手段、前記サービス情報を検索するための文字列の入力を受け付ける手段、受け付けた前記文字列に基づき、作成した前記第2記憶手段を参照して検索位置特定情報を特定する手段、特定した前記検索位置特定情報に基づき、前記第1記憶手段を参照してサービス情報を特定し、抽出する手段、抽出した前記サービス情報を出力する手段、として機能させることを特徴とする。
また、本発明のコンピュータプログラムは、前記コンピュータを、分割した前記文字情報の前記サービス情報内での属性区分を判定し、この属性区分が紹介記事であるとき、前記分割文字情報同士の連続性に基づいた連結を行う手段、としてさらに機能させるものとしても良い。
本発明の情報検索装置は、サービス情報に含まれる文字情報を適宜分割し、分割した後の各文字情報の品詞を特定し、所定の品詞である分割文字情報を抽出した後、抽出した分割文字情報同士の連続性を判定して、連続する分割文字情報同士は連結して複合語とする。そして、複合語とした文字情報と、抽出した分割文字情報の文字数を算出し、2文字以上の分割文字情報を索引用の文字列として特定すると共に、この文字列を含むサービス情報の前記第1記憶手段での記憶位置を特定する検索位置特定情報を特定し、文字列と検索位置特定情報とを互いに関連付けて記憶する索引手段を作成する。ゆえに、サービス情報を検索するための文字列の入力を受け付けると、この索引手段を参照して検索位置特定情報を特定し、サービス情報を特定・抽出し、抽出したサービス情報を出力することができる。
したがって、態素解析等による文字情報の適宜分割において、連続した文字列が途中で分割されてしまうことの不都合を解消し、得られた索引用の索引文字列から所望のサービス情報を効率良く円滑に探し出す検索を行うことが可能となる。
以下、図面を参照しながら、本発明に係る情報検索装置、情報検索方法、情報検索用のコンピュータプログラムの一例について説明する。
本発明に係る情報検索装置(以下、「本装置」という)は、検索対象となる所定の情報群より、指定された文字列に対応するサービス情報を効率良く円滑に探し出す検索を行う
図1は、本装置10を用いた情報検索システム(以下、「本システム」という)の一例を示す概略図である。
本システムは、図1に示すように、本装置10と、表示部20と、入力部30と、によって構成することができる。
表示部20は、本装置10に対して検索を指示する文字列や、本装置10による検索結果を出力・表示するディスプレイ(モニタ)である。
入力部30は、本装置10に対して各種指示を行うコマンドの入力用ボタンである。
また、図2は、本システムを用いることにより実現されるナビゲーション装置1を示す概略図である。
図2において、表示部20のスクリーン上に、入力部30が積層されたものとなっている。
入力部30を構成する入力用ボタンは、図2に示すように、文字入力ボタン31、片仮名入力又は変換するための「カタカナ」ボタン32、アルファベット入力又は変換するための「ABC」ボタン33、小文字入力に切り替えたり、濁点「゛」や半濁点「゜」を入力したりするための「小゛゜」ボタン34、数字を入力するための「123」ボタン35、入力された仮名文字を漢字へ変換する「変換」ボタン36、入力文字列の確定や、受け付けた文字情報により構成された文字列に基づく検索実行を指示する「OK」ボタン37等より構成されている。
文字入力ボタン31は、該当情報を検索するための文字の入力情報を発信する処理を行う。文字入力ボタン31としては、たとえば平仮名のキーボードを模したGUI(Graphical User Interface)画面を表示部20に表示し、ユーザがGUI画面上で平仮名を1文字ずつカーソルあるいは指で選択していくことで、所望の文字列の入力を行なうものとすることができる。
図2において、文字入力ボタン31は、あ行、か行、さ行・・・わ行の各種文字ボタン、句点「。」を入力するためのボタン、読点「、」を入力するためのボタン、「−」を入力するためのボタンにより構成されている。
また、表示部20には、文字入力ボタン31より入力された文字情報を出力・表示する表示欄21が表示されたものとなっている。
図2において、表示欄21には、「醤油醸造元 新井屋」といった検索のための文字列が表示されている。
図3は、本装置10の一例を示すブロック構成図である。
本装置10は、図3に示すように、サービス情報記憶部F1と、サービス索引情報記憶部F2と、文字情報分割部11と、文字情報抽出部12と、文字情報連結部13と、文字列特定部14と、索引情報作成部15と、文字列情報受付部16と、検索位置情報特定部17と、サービス情報検索部18と、サービス情報出力部19と、制御部Cと、を少なくとも有している。なお、図中の符号Bは、本装置10において制御信号、データ等を伝送するバスである。
本装置10は、情報処理装置であればよく、たとえば、モバイルタイプのパーソナルコンピュータをはじめ、PND(Portable Navigation Device)や専用デバイス、携帯電話機などで実現される。また、本装置10は、図示しないが、CPU(中央処理装置)、プログラム記憶部、補助記憶装置、OS(オペレーティング・システム)、等を有する。
CPUは、プログラム記憶部に記憶されたコンピュータプログラムに従い、本装置10の各構成要素を統制制御し、プログラム処理を実行する手段である。プログラム記憶部は、ROM(Read Only Memory)やRAM(Random Access Memory)等で構成され、本装置10が使用する各種コンピュータプログラムを記憶している手段である。
サービス情報記憶部F1は、サービス情報を記憶し、その記憶位置を特定する検索位置特定情報と、前記サービス情報と、を互いに関連付けて記憶する手段である。サービス情報は、ガソリンスタントやコンビニエンスストア、ラーメン店、ホテル・旅館といった店舗や、有名な施設、行楽地といったPOI(Point Of Interest)に関する情報をいう。また、このサービス情報は、POIの名称や住所、ジャンル、紹介文といった属性区分ごとに分けられている。なお、ジャンルとは、ラーメン、和食、喫茶、ショーパブ、カラオケ、ディスコ、ゴルフ練習場、旅館、ビジネスホテル、水族館、ペット・ペット用品、工芸品・民芸品、といった施設の種類や目的等によってPOIを分類する区分をいう。また、検索位置特定情報は、いわゆるオフセット情報である。
したがって、本装置10では、この検索位置特定情報に基づきサービス情報を特定する検索を行うことができる。
図4は、サービス情報記憶部F1に記憶されている情報の例を示す図である。
たとえば、図4に示すサービス情報ファイルでは、検索位置特定情報と、POIの名称や住所、電話番号、ジャンル、紹介文(テキスト記事)、といった属性情報と、を関連付けてファイルを構成することを示している。なお、ここでの紹介文には、web上の口コミ情報等を含めることもできる。
したがって、本装置10では、このサービス情報記憶部F1により、検索位置特定情報から検索対象物のサービス情報が分かるものとなる。
サービス索引情報記憶部F2は、文字列特定部14で特定した文字列と、文字情報分割部11で分割したサービス情報のサービス情報記憶部F1での記憶位置を特定する検索位置特定情報と、を互いに関連付けて記憶する手段である。ここで、文字列特定部14で特定した文字列は、たとえば文字情報連結部13において、文字情報分割部11において分割した文字情報のサービス情報内での属性区分を判定し、この属性区分が紹介記事であるとき、文字情報分割部11において適宜分割した分割文字情報同士の連続性に基づいた連結を行って複合語とした文字情報とする。
図5は、サービス索引情報記憶部F2に記憶されている情報の例を示す図である。
たとえば、図5に示すサービス索引情報ファイルでは、文字列情報と検索位置特定情報(オフセット情報)とを関連付けてファイルを構成することを示している。
したがって、本装置10では、このサービス索引情報記憶部F2により、サービス情報を検索するために入力した文字列から、サービス情報の記憶位置を特定する検索位置特定情報が分かるものとなる。具体的には、たとえばサービス情報の紹介記事に含まれるPOIの特徴を示す単語を検索用の文字列とし、この単語を含む紹介記事に該当するサービス情報の記憶位置を特定する検索位置特定情報が分かるものとなる。
文字情報分割部11は、サービス情報に含まれる文字情報を適宜分割する処理を行う。適宜分割する解析手法としては、たとえば形態素解析を挙げることができる。
文字情報分割部11は、分割した文字情報を文字情報抽出部12及び索引情報作成部15へ送信する。
また、文字情報分割部11においては、たとえばサービス情報の紹介記事を形態素解析して得られた形態素を文字列として抽出するものとしても良い。
文字情報抽出部12は、文字情報分割部11において分割した後の各文字情報である分割文字情報の品詞を特定し、所定の品詞である分割文字情報を抽出する処理を行う。ここで、所定の品詞とは、たとえば名詞及び形容詞を挙げることができる。
文字情報抽出部12での処理は、たとえばサービス情報の紹介記事を文字情報分割部11において適宜分割した後の各文字情報を対象とすると望ましい。
文字情報抽出部12は、特定した品詞情報を文字情報連結部13及び文字列特定部14へ送信する。
文字情報連結部13は、文字情報抽出部12において抽出した分割文字情報同士の連続性を判定し、連続する分割文字情報同士は連結して複合語とする処理を行う。
文字情報連結部13は、複合語とした文字情報を文字列特定部14へ送信する。
また、文字情報連結部13は、文字情報分割部11において分割した文字情報のサービス情報内での属性区分を判定し、この属性区分が紹介記事であるとき、分割文字情報同士の連続性に基づいた連結を行う機能を備える。
文字列特定部14は、文字情報連結部13で複合語とした分割文字情報を含み、文字情報抽出部12において抽出した分割文字情報の文字数を算出し、2文字以上の分割文字情報を索引用の文字列として特定する処理を行う。
文字列特定部14は、特定した文字列情報を索引情報作成部15へ送信する。
索引情報作成部15は、文字情報分割部11で分割したサービス情報のサービス情報記憶部F1での記憶位置を特定する検索位置特定情報を特定し、文字列特定部14で特定した文字列と、特定したこの検索位置特定情報と、を互いに関連付けて記憶するサービス索引情報記憶部F2を作成する処理を行う。
文字列情報受付部16は、サービス情報を検索するための文字列の入力を受け付ける処理を行う。なお、文字列情報受付部16では、片仮名、アルファベット、数字についての揺らぎを排除するため、事前に、半角文字を全角文字に変換、小文字を大文字に変換する処理を行なった文字列を取得するようにすると良い。
文字列情報受付部16は、受け付けた文字列情報を検索位置情報特定部17へ送信する。
検索位置情報特定部17は、文字列情報受付部16で受け付けた文字列に基づき、索引情報作成部15で作成したサービス索引情報記憶部F2を参照して検索位置特定情報を特定する処理を行う。
検索位置情報特定部17は、特定した検索位置特定情報をサービス情報検索部18へ送信する。
サービス情報検索部18は、検索位置情報特定部17で特定した検索位置特定情報に基づき、サービス情報記憶部F1を参照してサービス情報を特定し、抽出する処理を行う。
サービス情報検索部18は、抽出したサービス情報をサービス情報出力部19へ送信する。
サービス情報出力部19は、サービス情報検索部18で抽出したサービス情報を表示部30へ出力する処理を行う。
制御部Cは、CPU、ROM、RAM等を具備し、プログラム記憶部に記憶されたプログラムに従い、本装置10の各構成要素を統制制御し、プログラム処理を実行する。
次に、上述した本装置10により実行される情報検索方法を実施する本装置10の動作の一例を、図6を参照しながら説明する。図6は、本装置10での情報検索処理の一例を示すフローチャートである。
まず、文字情報分割部11が、サービス情報に含まれる文字情報を適宜分割する(S10)。
次いで、文字情報抽出部12が、文字情報分割部11において分割した後の各文字情報である分割文字情報の品詞を特定する(S20)。
引き続き、文字情報抽出部12が、所定の品詞である分割文字情報を特定して抽出する(S30)。
また、文字情報連結部13が、文字情報抽出部12において抽出した分割文字情報同士が連続するか否かその連続性を判定する(S40)。
その結果、文字情報連結部13が、分割文字情報同士が連続すると判定した場合(Y)、引き続き、文字情報連結部13が、連続する分割文字情報同士を連結して複合語を生成する(S50)。
ここで、文字情報連結部13は、文字情報分割部11において分割した文字情報のサービス情報内での属性区分を判定し、この属性区分が紹介記事であるとき、分割文字情報同士の連続性に基づいた連結を行って複合語を生成するようにすると良い。
一方、文字情報連結部13が、分割文字情報同士が連続しないと判定した場合(N)、文字情報連結部13は、連続しないと判定した分割文字情報の特定を解除し除外する(S60)。
次に、文字列特定部14が、文字情報連結部13で複合語とした分割文字情報と、文字情報抽出部12において抽出した分割文字情報の文字数を算出し、2文字以上の分割文字情報を索引用の文字列として特定する(S70)。すなわち、文字列特定部14では、適宜分割した後の分割文字情報の中で、1文字からなる分割文字情報は索引用の文字列から除外する。なお、1文字からなる分割文字情報でも、他の分割文字情報と連続する場合は、文字情報連結部13において複合語として残って索引用の文字列となる。
ここで、適宜分割して得られた文字情報を索引用の文字列とする一例は、図7に示すことができる。図7は、検索対象物としてPOIの紹介記事を形態素解析し、複合語とした場合の文字列を示す模式図である。
図7において、文字情報として「新井屋」の紹介記事である「江戸の町並みが残る引田の町で目をひく、ベンガラ色の蔵が醤油醸造元の新井屋。土・日曜、祝日はうどん屋を営業。うどん、サードメニューともに無添加を守る。」がある。これを文字情報分割部11において形態素解析した場合は、「江戸」「の」「町並み」「が」「残る」「引田」「の」「町」「で」「目」「を」「ひく」「、」「ベンガラ」「色」「の」「蔵」「が」「醤油」「醸造」「元」「の」「新井」「屋」「。」「土」「・」「日曜」「、」「祝日」「は」「うどん」「屋」「を」「営業」「。」「うどん」「、」「サイド」「メニュー」「とも」「に」「無」「添加」「を」「守る」「。」といった複数の形態素に分割されるものとなる。
次いで、文字情報抽出部12において、所定の品詞として名詞又は形容詞である「江戸」「町並み」「引田」「町」「目」「ベンガラ」「色」「蔵」「醤油」「醸造」「元」「新井」「屋」「土」「日曜」「祝日」「うどん」「屋」「営業」「うどん」「サイド」「メニュー」「とも」「無」「添加」といった文字情報を抽出する。
引き続き、文字情報連結部13において、抽出した文字情報同士が連続するか否かその連続性を判定すると、「ベンガラ」と「色」、「醤油」と「醸造」と「元」、「新井」と「屋」、「うどん」と「屋」、「サイド」と「メニュー」と「とも」、「無」と「添加」がそれぞれ互いに連続していると判定できる。そうすると、文字情報連結部13は、互いに連続する文字情報同士を連結し、「ベンガラ色」「醤油醸造元」「新井屋」「うどん屋」「サイドメニューとも」「無添加」といった複合語を生成する。一方、「町」「目」「蔵」「土」といった文字情報は他の文字情報と連続していないので、除外されるものとなる。
そして、文字列特定部14が、文字情報連結部13で複合語とした文字情報を含め、文字情報抽出部12において抽出した文字情報の文字数を算出し、2文字以上の文字情報である「江戸」「町並み」「引田」「ベンガラ色」「醤油醸造元」「新井屋」「日曜」「祝日」「うどん屋」「営業」「うどん」「サイドメニューとも」「無添加」といった13の形態素を索引用の文字列として特定する。したがって、これらの文字列からは何れも、「新井屋」のサービス情報を検索するための検索位置特定情報を特定することができることになる。
これにより、連続した文字列が途中で分割されてしまったとしても、所定の条件によって複合語を生成することで、POIの特徴を示す索引となり得る適切な検索用の文字列とすることができる。また、1文字で区切られた文字情報といった索引とはなり得ない文字列の存在を除外し、データサイズを小さく抑えることができる。
そして、索引情報作成部15が、文字情報分割部11で分割したサービス情報のサービス情報記憶部F1での記憶位置を特定する検索位置特定情報を特定する(S80)。
さらに、索引情報作成部15が、文字列特定部14で特定した文字列と、先に特定したこの検索位置特定情報と、を互いに関連付けて記憶するサービス索引情報記憶部F2を作成する(S90)。
また、文字列情報受付部16が、サービス情報を検索するための文字列の入力を受け付ける(S100)。
次いで、検索位置情報特定部17が、文字列情報受付部16で受け付けた文字列に基づき、索引情報作成部15において作成したサービス索引情報記憶部F2を参照して検索位置特定情報を特定する検索を行なう(S110)。
引き続き、サービス情報検索部18が、検索位置情報特定部17で特定した検索位置特定情報に基づき、サービス情報記憶部F1を参照してサービス情報を特定し、抽出する(S120)。
そして、サービス情報出力部19が、サービス情報検索部18で抽出したサービス情報を表示部30へ出力する(S130)。
これにより、本装置10での一連の動作が終了する。
なお、これら一連の処理は、制御部Cでの統制制御により実行される。
以上のように本実施の形態では、サービス情報に含まれる文字情報を適宜分割し、分割した後の各文字情報の品詞を特定し、所定の品詞である分割文字情報を抽出した後、抽出した分割文字情報同士の連続性を判定して、連続する分割文字情報同士は連結して複合語を生成する。そして、この複合語を含めて2文字以上の文字情報を、サービス情報を検索するための文字列として採用した索引を作成し、この索引を用いてサービス情報の検索を行なう。これにより、形態素解析等による文字情報の適宜分割において、連続した文字列(単語)が途中で分割され1文字で区切られてしまうことによるキーワードの雑音の低減を行い、なおかつ容量の削減を行うことができる。
したがって、サイズや操作性に制約が多いカーナビ等においてデータサイズが大きくなってしまうことがなく、ユーザインタフェースの向上を図ることが可能となると共に、ユーザの満足度を高めることができる。しかも、所望のサービス情報を効率良く円滑に探し出すことができるので、表示部が小さくても検索結果を効果的に表示することができる。
また、本装置10は、ナビゲーション機能を兼ね備えた装置としても良い。この場合、本装置10は、図示しないが、地図情報を記憶する手段や、この地図上の領域若しくはPOIを特定する位置情報と、POIのサービス情報とを互いに関連付けて記憶する手段をさらに備える。また、地図情報は、CD−ROMやDVD−ROM等の記憶媒体に格納されたものすることができる。
これにより、POI情報に基づき位置情報を特定し、さらに、特定した位置情報に基づき該当する道路地図情報を特定、抽出し、この道路地図上にサービス情報が表示されるように、サービス情報と道路地図情報とを重ね合わせて出力することができる。
本発明は、所定の情報群より、ユーザが求めているサービス情報の検索が可能なデバイスを扱う業種において産業上有用であり、検索によって電子地図上に所望のPOI情報の表示を可能とするカーナビゲーション装置等の電化製品市場においても有用である。
本発明に係る情報検索装置を用いた情報検索システムの一例を示す概略図である。 本発明に係る情報検索装置を情報検索システムに用いることにより実現されるナビゲーション装置を示す概略図である。 本発明に係る情報検索装置の実施形態の一例を示すブロック構成図である。 本発明に係る情報検索装置が備える記憶部に記憶されているサービス情報ファイルの構造を示す一例である。 本発明に係る情報検索装置が備える記憶部に記憶されているサービス索引情報ファイルの構造を示す一例である。 本発明に係る情報検索装置での情報検索処理の一例を示すフローチャートである。 本発明に係る情報検索装置において、検索対象物としてPOIの紹介記事を形態素解析し、複合語とした場合の文字列を示す模式図である。
符号の説明
F1 サービス情報記憶部(第1記憶部)、F2 サービス索引情報記憶部(第2記憶部)、10 情報検索装置、11 文字情報分割部、12 文字情報抽出部、13 文字情報連結部、14 文字列特定部、15 索引情報作成部、16 文字列情報受付部、17 検索位置情報特定部、18 サービス情報検索部、19 サービス情報出力部、20 表示部、30 入力部。

Claims (6)

  1. 検索対象となる所定の情報群より、指定された文字列に対応するサービス情報を効率良く円滑に探し出す検索を行う情報検索装置であって、
    前記サービス情報を記憶し、その記憶位置を特定する検索位置特定情報と、前記サービス情報と、を互いに関連付けて記憶する第1記憶手段と、
    前記サービス情報に含まれる文字情報を適宜分割する文字情報分割手段と、
    前記文字情報分割手段において分割した後の各文字情報(以下、「分割文字情報」という。)の品詞を特定し、所定の品詞である分割文字情報を抽出する文字情報抽出手段と、
    前記文字情報抽出手段において抽出した分割文字情報同士の連続性を判定し、連続する分割文字情報同士は連結して複合語とする文字情報連結手段と、
    前記文字情報連結手段で複合語とした分割文字情報を含み、前記文字情報抽出手段において抽出した分割文字情報の文字数を算出し、2文字以上の分割文字情報を索引用の文字列として特定する文字列特定手段と、
    前記文字情報分割手段で分割した前記サービス情報の前記第1記憶手段での記憶位置を特定する検索位置特定情報を特定し、前記文字列特定手段で特定した文字列と、特定したこの検索位置特定情報と、を互いに関連付けて記憶する第2記憶手段を作成する索引情報作成手段と、
    前記サービス情報を検索するための文字列の入力を受け付ける文字列情報受付手段と、
    前記文字列情報受付手段で受け付けた文字列に基づき、前記索引情報作成手段で作成した前記第2記憶手段を参照して検索位置特定情報を特定する検索位置情報特定手段と、
    前記検索位置情報特定手段で特定した検索位置特定情報に基づき、前記第1記憶手段を参照してサービス情報を特定し、抽出するサービス情報検索手段と、
    前記サービス情報検索手段で抽出したサービス情報を出力するサービス情報出力手段と、
    を備えることを特徴とする情報検索装置。
  2. 前記文字情報連結手段は、前記文字情報分割手段において分割した文字情報の前記サービス情報内での属性区分を判定し、この属性区分が紹介記事であるとき、前記分割文字情報同士の連続性に基づいた連結を行う、
    ことを特徴とする請求項1に記載の情報検索装置。
  3. サービス情報を記憶し、その記憶位置を特定する検索位置特定情報と、前記サービス情報と、を互いに関連付けて記憶する第1記憶手段、を備え、情報検索装置において、検索対象となる所定の情報群より、指定された文字列に対応するサービス情報を効率良く円滑に探し出す検索を行う情報検索方法であって、
    前記情報検索装置が、前記サービス情報に含まれる文字情報を適宜分割する第1ステップと、
    前記情報検索装置において、前記第1ステップにおいて分割した後の各文字情報(以下、「分割文字情報」という。)の品詞を特定し、所定の品詞である分割文字情報を抽出する第2ステップと、
    前記情報検索装置において、前記第2ステップにおいて抽出した分割文字情報同士の連続性を判定し、連続する分割文字情報同士は連結して複合語とする第3ステップと、
    前記情報検索装置において、前記第3ステップで複合語とした分割文字情報を含み、前記第2ステップにおいて抽出した分割文字情報の文字数を算出し、2文字以上の分割文字情報を索引用の文字列として特定する第4ステップと、
    前記情報検索装置において、前記第1ステップで分割した前記サービス情報の前記第1記憶手段での記憶位置を特定する検索位置特定情報を特定し、前記第4ステップで特定した文字列と、特定したこの検索位置特定情報と、を互いに関連付けて記憶する第2記憶手段を作成する第5ステップと、
    前記情報検索装置において、前記サービス情報を検索するための文字列の入力を受け付ける第6ステップと、
    前記情報検索装置において、前記第6ステップで受け付けた文字列に基づき、前記第5ステップで作成した前記第2記憶手段を参照して検索位置特定情報を特定する第7ステップと、
    前記情報検索装置において、前記第7ステップで特定した検索位置特定情報に基づき、前記第1記憶手段を参照してサービス情報を特定し、抽出する第8ステップと、
    前記第8ステップで抽出したサービス情報を前記情報検索装置より出力する第9ステップと、
    を含むことを特徴とする情報検索方法。
  4. 前記第3ステップは、前記第1ステップにおいて分割した文字情報の前記サービス情報内での属性区分を判定し、この属性区分が紹介記事であるとき、前記分割文字情報同士の連続性に基づいた連結を行う、
    ことを特徴とする請求項3に記載の情報検索方法。
  5. サービス情報を記憶し、その記憶位置を特定する検索位置特定情報と、前記サービス情報と、を互いに関連付けて記憶する第1記憶手段、を備え、検索対象となる所定の情報群より、指定された文字列に対応するサービス情報を効率良く円滑に探し出す検索を行うことを実行させるためにコンピュータを、
    前記サービス情報に含まれる文字情報を適宜分割する手段、
    分割した後の前記各文字情報(以下、「分割文字情報」という。)の品詞を特定し、所定の品詞である分割文字情報を抽出する手段、
    抽出した前記分割文字情報同士の連続性を判定し、連続する分割文字情報同士は連結して複合語とする手段、
    前記複合語とした分割文字情報を含み、抽出した前記分割文字情報の文字数を算出し、2文字以上の分割文字情報を索引用の文字列として特定する手段、
    分割した前記サービス情報の前記第1記憶手段での記憶位置を特定する検索位置特定情報を特定し、特定した前記文字列と、特定したこの検索位置特定情報と、を互いに関連付けて記憶する第2記憶手段を作成する手段、
    前記サービス情報を検索するための文字列の入力を受け付ける手段、
    受け付けた前記文字列に基づき、作成した前記第2記憶手段を参照して検索位置特定情報を特定する手段、
    特定した前記検索位置特定情報に基づき、前記第1記憶手段を参照してサービス情報を特定し、抽出する手段、
    抽出した前記サービス情報を出力する手段、
    として機能させることを特徴とするコンピュータプログラム。
  6. 前記コンピュータを、
    分割した前記文字情報の前記サービス情報内での属性区分を判定し、この属性区分が紹介記事であるとき、前記分割文字情報同士の連続性に基づいた連結を行う手段、
    としてさらに機能させることを特徴とする請求項5に記載のコンピュータプログラム。
JP2008124048A 2008-05-09 2008-05-09 情報検索装置、情報検索方法、及びコンピュータプログラム Pending JP2009271869A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008124048A JP2009271869A (ja) 2008-05-09 2008-05-09 情報検索装置、情報検索方法、及びコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008124048A JP2009271869A (ja) 2008-05-09 2008-05-09 情報検索装置、情報検索方法、及びコンピュータプログラム

Publications (1)

Publication Number Publication Date
JP2009271869A true JP2009271869A (ja) 2009-11-19

Family

ID=41438334

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008124048A Pending JP2009271869A (ja) 2008-05-09 2008-05-09 情報検索装置、情報検索方法、及びコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP2009271869A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112860866A (zh) * 2021-02-09 2021-05-28 北京百度网讯科技有限公司 语义检索方法、装置、设备以及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112860866A (zh) * 2021-02-09 2021-05-28 北京百度网讯科技有限公司 语义检索方法、装置、设备以及存储介质
JP2022050379A (ja) * 2021-02-09 2022-03-30 ペキン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド 意味検索方法、装置、電子機器、記憶媒体およびコンピュータプログラム
JP7301922B2 (ja) 2021-02-09 2023-07-03 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 意味検索方法、装置、電子機器、記憶媒体およびコンピュータプログラム
CN112860866B (zh) * 2021-02-09 2023-09-19 北京百度网讯科技有限公司 语义检索方法、装置、设备以及存储介质

Similar Documents

Publication Publication Date Title
JP2007310734A (ja) 検索装置
JP2008129687A (ja) 特殊文字入力支援装置及びこれを備える電子機器
JP2007334534A (ja) 文字列入力装置、文字列入力方法、および、プログラム
JP2010225035A (ja) 情報検索装置、情報検索方法、及び情報検索プログラム
JP4524327B1 (ja) 情報検索装置、及び情報検索プログラム
US9875298B2 (en) Automatic generation of a search query
JP5383825B2 (ja) 入力支援装置
WO2015188437A1 (zh) 一种拼音输入方法及装置
JP2009140287A (ja) 検索結果表示装置
JP2009271869A (ja) 情報検索装置、情報検索方法、及びコンピュータプログラム
WO2012015021A1 (en) Stroke and structure input method and system
JP4469410B1 (ja) 情報検索装置、情報検索方法、及びコンピュータプログラム
JP6002328B2 (ja) 検索システム、検索プログラム、および検索条件入力方法
JP2010282507A (ja) 辞書機能を備えた電子機器およびプログラム
JP2009271867A (ja) 情報検索装置、情報検索方法、及びコンピュータプログラム
JP2013205854A (ja) 当て字変換人名入力装置、人名入力方法および人名入力プログラム
JPWO2012101700A1 (ja) UI(UserInterface)作成支援装置、UI作成支援方法及びプログラム
JP2009271868A (ja) 情報検索装置、情報検索方法、及びコンピュータプログラム
JPWO2018078751A1 (ja) 施設検索装置、施設検索方法、コンピュータプログラム及びコンピュータプログラムを記録した記録媒体
JP2009271593A (ja) 情報検索装置、情報検索方法、及びコンピュータプログラム
JP5532936B2 (ja) 電子機器及び情報表示プログラム
JP2011141725A (ja) ナビゲーション装置
JP2010020590A (ja) スケジュール管理装置およびスケジュール管理プログラム
JP5397199B2 (ja) 電子機器及び情報表示プログラム
JP2011034261A (ja) 電子機器及びプログラム