JP5300576B2 - SEARCH DEVICE, SEARCH METHOD, AND SEARCH PROGRAM - Google Patents
SEARCH DEVICE, SEARCH METHOD, AND SEARCH PROGRAM Download PDFInfo
- Publication number
- JP5300576B2 JP5300576B2 JP2009104474A JP2009104474A JP5300576B2 JP 5300576 B2 JP5300576 B2 JP 5300576B2 JP 2009104474 A JP2009104474 A JP 2009104474A JP 2009104474 A JP2009104474 A JP 2009104474A JP 5300576 B2 JP5300576 B2 JP 5300576B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- search condition
- common meaning
- text
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 17
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 title 1
- 230000000877 morphologic effect Effects 0.000 claims description 11
- 239000000284 extract Substances 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、テキストまたは音声で入力された検索文に基づいて検索する検索装置、検索方法、および検索プログラムに関する。 The present invention relates to a search device, a search method, and a search program for searching based on a search sentence input by text or voice.
ユーザが入力した検索条件に基づいて、所定のデータベースやネットワーク上の情報を検索する検索システム・検索エンジンが存在する。検索エンジンを提供するサービスとして、例えば、非特許文献1などがある。 There are search systems and search engines that search information on a predetermined database or network based on a search condition input by a user. As a service for providing a search engine, for example, there is Non-Patent Document 1.
キーボード等の入力デバイスを用いてテキストで検索条件を入力する場合、キーボードの操作に不慣れなユーザにとっては、テキストの入力に時間を要し、また入力ミスなどが発生するなどし、ユーザの入力負荷が大きい。 When entering search conditions with text using an input device such as a keyboard, users who are unfamiliar with keyboard operations need time to input text, and input errors may occur. Is big.
また、マイクなどの入力デバイスを用いて音声で検索条件を入力する場合、音声を認識する際に誤認識が発生しやすく、誤認識された検索条件で検索されることにより、ユーザが意図しない検索結果が提示されるという問題がある。 In addition, when a search condition is input by voice using an input device such as a microphone, erroneous recognition is likely to occur when the voice is recognized, and the search is performed by the erroneously recognized search condition. There is a problem that results are presented.
本発明は上記事情に鑑みてなされたものであり、本発明の目的は、ユーザの入力負荷を軽減するとともに、ユーザが意図する検索条件をより容易に入力させ、ユーザの利便性をより向上させることにある。 The present invention has been made in view of the above circumstances, and an object of the present invention is to reduce a user's input load and more easily input search conditions intended by the user, thereby further improving the convenience of the user. There is.
上記課題を解決するために、本発明は、検索装置であって、テキスト検索文の入力を受け付けるテキスト入力受付手段と、前記テキスト検索文を形態素解析して、解析結果の各形態素に共通意味IDを付与し、共通意味ID付テキストデータを生成する形態素解析手段と、音声検索文の入力を受け付ける音声入力受付手段と、前記音声検索文を音声認識してテキストに変換するとともに、前記変換されたテキストの各形態素に共通意味IDを付与し、共通意味ID付テキストデータを生成する音声認識手段と、前記形態素解析手段または前記音声認識手段が生成した共通意味ID付テキストデータを解析し、検索条件と当該検索条件に対応する共通意味IDを抽出する検索条件解析手段と、前記検索条件および対応する共通意味IDを検索条件記憶手段に記憶する検索条件管理手段と、前記検索条件記憶手段に記憶された検索条件を提示する提示手段と、前記検索条件を用いて検索し、検索結果を出力する検索手段と、を有する。 In order to solve the above-described problem, the present invention provides a search device, a text input receiving unit that receives an input of a text search sentence, and a morphological analysis of the text search sentence, and a common semantic ID for each morpheme of the analysis result Morphological analysis means for generating text data with a common meaning ID, voice input acceptance means for accepting input of a voice search sentence, voice recognition of the voice search sentence and converting it into text, and the converted A speech recognition unit that assigns a common meaning ID to each morpheme of text and generates text data with a common meaning ID, and analyzes the text data with a common meaning ID generated by the morpheme analysis unit or the speech recognition unit, and a search condition Search condition analysis means for extracting a common meaning ID corresponding to the search condition, the search condition and the corresponding common meaning ID as a search condition. Has a search condition management means for storing in the storage means, and presenting means for presenting the search conditions stored in the search condition storage means, and searching using the search condition, a search means for outputting a search result.
また、本発明は、コンピュータが行う検索方法であって、テキスト検索文の入力、または、音声検索文の入力を受け付ける入力受付ステップと、前記テキスト検索文の入力を受け付けた場合、前記テキスト検索文を形態素解析して、解析結果の各形態素に共通意味IDを付与し、共通意味ID付テキストデータを生成するとともに、前記音声検索文を受け付けた場合、前記音声検索文を音声認識してテキストに変換するとともに、前記変換されたテキストの各形態素に共通意味IDを付与し、共通意味ID付テキストデータを生成する生成ステップと、前記生成ステップで生成した共通意味ID付テキストデータを解析し、検索条件と当該検索条件に対応する共通意味IDを抽出する検索条件解析ステップと、前記検索条件および対応する共通意味IDを検索条件記憶部に記憶する検索条件管理ステップと、前記検索条件記憶部に記憶された検索条件を提示する提示ステップと、前記検索条件を用いて検索し、検索結果を出力する検索ステップと、を行う。 In addition, the present invention is a search method performed by a computer, wherein an input receiving step for receiving an input of a text search sentence or an input of a voice search sentence, and when the input of the text search sentence is received, the text search sentence Morphological analysis is performed, a common meaning ID is assigned to each morpheme of the analysis result, text data with a common meaning ID is generated, and when the voice search sentence is received, the voice search sentence is recognized and converted into text. A conversion step is performed, a common meaning ID is assigned to each morpheme of the converted text, and text data with common meaning ID is generated, and the text data with common meaning ID generated in the generation step is analyzed and searched. A search condition analysis step for extracting a common semantic ID corresponding to the search condition and the search condition; A search condition management step for storing a semantic ID in a search condition storage unit, a presentation step for presenting the search condition stored in the search condition storage unit, and a search step for performing a search using the search condition and outputting a search result And do.
また、本発明は、コンピュータが実行する検索プログラムであって、前記コンピュータに、テキスト検索文の入力、または、音声検索文の入力を受け付ける入力受付ステップと、前記テキスト検索文の入力を受け付けた場合、前記テキスト検索文を形態素解析して、解析結果の各形態素に共通意味IDを付与し、共通意味ID付テキストデータを生成するとともに、前記音声検索文を受け付けた場合、前記音声検索文を音声認識してテキストに変換するとともに、前記変換されたテキストの各形態素に共通意味IDを付与し、共通意味ID付テキストデータを生成する生成ステップと、前記生成ステップで生成した共通意味ID付テキストデータを解析し、検索条件と当該検索条件に対応する共通意味IDを抽出する検索条件解析ステップと、前記検索条件および対応する共通意味IDを検索条件記憶部に記憶する検索条件管理ステップと、前記検索条件記憶部に記憶された検索条件を提示する提示ステップと、前記検索条件を用いて検索し、検索結果を出力する検索ステップと、を実行させる。 Further, the present invention is a search program executed by a computer, wherein the computer receives an input of a text search sentence or an input of a voice search sentence, and an input of the text search sentence is received The text search sentence is morphologically analyzed, a common meaning ID is assigned to each morpheme of the analysis result, text data with a common meaning ID is generated, and when the voice search sentence is accepted, the voice search sentence is Recognizing and converting to text, adding a common meaning ID to each morpheme of the converted text to generate text data with common meaning ID, and text data with common meaning ID generated in the generating step A search condition analysis step for extracting a search condition and a common semantic ID corresponding to the search condition; A search condition management step for storing the search condition and the corresponding common meaning ID in a search condition storage unit, a presentation step for presenting the search condition stored in the search condition storage unit, and a search using the search condition, And a search step for outputting a search result.
本発明により、ユーザの入力負荷を軽減するとともに、ユーザが意図する検索条件をより容易に入力させ、ユーザの利便性をより向上させることができる。 According to the present invention, it is possible to reduce a user's input load, to more easily input a search condition intended by the user, and to further improve user convenience.
以下、本発明の実施の形態について説明する。 Embodiments of the present invention will be described below.
図1は、本発明の一実施形態である検索装置の構成を示す構成図である。本実施形態の検索装置1は、インターネットなどのネットワークを介してPC(Personal computer)3から音声またはテキストで入力された入力情報(検索文)を解析して検索条件を生成し、当該検索条件で検索された検索結果をPC3に送信する。 FIG. 1 is a configuration diagram showing a configuration of a search device according to an embodiment of the present invention. The search device 1 according to the present embodiment analyzes input information (search text) input by voice or text from a PC (Personal computer) 3 via a network such as the Internet, generates a search condition, and uses the search condition. The retrieved search result is transmitted to the PC 3.
図示する検索装置1は、テキスト入力受付部11と、形態素解析部12と、音声入力受付部13と、音声認識部14と、検索条件解析部15と、検索条件管理部16と、検索条件記憶部17と、検索条件表示部18と、検索部19と、検索データベース(検索DB)20と、検索結果出力部21と、共通辞書22とを有する。
The illustrated search apparatus 1 includes a text
テキスト入力受付部11は、PC3からテキストで入力された検索文の入力を受け付け、音声入力受付部13は、PC3から音声で入力された検索文の入力を受け付ける。形態素解析部12は、テキスト入力受付部11が受け付けたテキストの検索文を形態素解析して、解析結果の各形態素に共通辞書22を参照して共通意味IDを付与し、共通意味ID付テキストデータを生成する。
The text
音声認識部14は、音声入力受付部13が受け付けた音声の検索文を音声認識してテキストに変換するとともに、変換されたテキストの各形態素に共通意味IDを付与し、共通意味ID付テキストデータを生成する。
The
検索条件解析部15は、形態素解析部12および音声認識部14が生成した共通意味ID付テキストデータを解析し、検索条件と当該検索条件に対応する共通意味IDを抽出する。検索条件管理部16は、検索条件解析部15が解析した検索条件および対応する共通意味IDを検索条件記憶部17に記憶する。
The search
検索条件表示部18は、検索条件記憶部17に記憶された検索条件をPC3に送信し、PC3のディスプレイに表示させることにより、ユーザに提示する。検索部19は、検索条件記憶部17に記憶された検索条件を用いて、様々な情報が格納された検索DB20またはネットワーク上に存在するデータベースを検索し、検索結果を検索結果出力部21に出力する。検索結果出力部21は、検索部19の検索結果をPC3に送信し、PC3のディスプレイに表示させることにより、ユーザに提示する。共通辞書22は、共通意味IDが割り当てられた単語(形態素)と、当該単語の読みおよび表記とが対応付けて格納されたものである。
The search
以上説明した検索装置1は、CPUと、メモリと、外部記憶装置と、入力装置と、出力装置と、ネットワークと接続するための通信制御装置とを備えた汎用的なコンピュータシステムを用いることができる。このコンピュータシステムにおいて、CPUがメモリ上にロードされた所定のプログラムを実行することにより、検索装置1の各機能が実現される。 The search device 1 described above can use a general-purpose computer system including a CPU, a memory, an external storage device, an input device, an output device, and a communication control device for connecting to a network. . In this computer system, each function of the search device 1 is realized by the CPU executing a predetermined program loaded on the memory.
次に、本実施形態の検索処理について説明する。 Next, the search process of this embodiment will be described.
図2は、本実施形態の検索処理を示すフローチャートである。まず、検索装置1は、PC3からの検索要求を受け付けて、音声またはテキストの検索文の入力の受け付けを開始する(S11)。ユーザは、PC3に備えられたマイクなどの音声入力装置に音声で検索文を入力するか、または、キーボードなどのテキスト入力装置を用いてテキスト(文字)で検索文を入力する。このように、本実施形態では、ユーザが任意に選択した所望の方法(音声入力またはテキスト入力)で検索文の入力を行うことができる。 FIG. 2 is a flowchart showing search processing according to the present embodiment. First, the search device 1 accepts a search request from the PC 3 and starts accepting input of a voice or text search sentence (S11). The user inputs a search sentence by voice to a voice input device such as a microphone provided in the PC 3 or inputs a search sentence by text (characters) using a text input device such as a keyboard. As described above, in the present embodiment, a search sentence can be input by a desired method (speech input or text input) arbitrarily selected by the user.
テキストの検索文が入力された場合、テキスト入力受付部11が検索文の入力を受け付け、音声の検索文が入力された場合、音声入力受付部13が検索文の入力を受け付ける(S12)。
When a text search sentence is input, the text
音声とテキストの同時入力を防止するために、テキストの検索文が入力された場合(S13:テキスト)、音声入力受付部13は音声での検索文の入力を停止し(S14)、音声の検索文が入力された場合(S13:音声)、テキスト入力受付部11はテキストでの検索文の入力を停止する(S15)。このように、音声入力とテキスト入力の排他制御を行う。
In order to prevent simultaneous input of voice and text, when a text search sentence is input (S13: text), the voice
そして、音声の検索文が入力された場合(S13:音声)、音声認識部14は、音声認識技術により、音声内容を分析してテキストに変換するとともに、変換されたテキストの各形態素(単語)に共通辞書22を参照して共通意味IDを付与して共通意味ID付テキストデータを生成する(S16)。すなわち、音声認識部14は、音声認識処理により音声をテキストに変換し、当該音声認識処理の最中に認識した各形態素に、共通意味IDを付加する。なお、形態素については、後述する。
When a voice search sentence is input (S13: voice), the
音声認識技術は、人の話す音声言語をコンピュータによって解析し、話している内容を文字データとして取り出す処理であって、隠れマルコフモデル、音響モデルなどの様々な技術が存在する。音声認識部14は、例えば「VoiceRex」などの音声認識エンジンを用い、音声を形態素毎(単語)に認識して、テキストに変換することが考えられる。
The speech recognition technology is a process of analyzing a spoken language spoken by a person by a computer and extracting the content being spoken as character data, and there are various technologies such as a hidden Markov model and an acoustic model. The
「VoiceRex」については「http://www.ntt.co.jp/RD/OFIS/active/2007pdf/pdf/g_ct07.pdf#search='VoiceRex'」に記載されている。 “VoiceRex” is described in “http://www.ntt.co.jp/RD/OFIS/active/2007pdf/pdf/g_ct07.pdf#search='VoiceRex '”.
具体的には、例えば「あー、平成20年に起きた火事の情報を知りたいです」の音声による検索文がS12で入力されたものとする。この場合、音声認識部14は、「平成20年/に/起き/た/火事/の/情報/を/知り/たい」のように形態素に分割し、各形態素に共通辞書22から取得した共通意味IDを付加する。
Specifically, for example, it is assumed that a search sentence with a voice “Ah, I want to know information on a fire that occurred in 2008” is input in S12. In this case, the
図3は、共通辞書22の一例を示すものである。共通辞書22は、音声の検索文およびテキストの検索文の両方に使用される辞書である。共通辞書は、同じ意味を有する形態素毎に、共通意味IDと、意味IDと、読みと、表記とを有する。図3では、具体例として年を表現する単語として「2008年」および「平成20年」を示している。
FIG. 3 shows an example of the
音声入力時には「表記」という概念がなく「ニセンハチネン」または「ヘイセイニジュウネン」のどちらで入力されても「2008年」と認識できればよいため、辞書として音声用データ221の部分(2レコード)を有すればよい。一方、テキスト入力時には、同様に、辞書としてテキスト用データ222(2レコード)の部分を有すればよい。
Since there is no concept of “notation” at the time of voice input, it is sufficient that it can be recognized as “2008” regardless of whether “Nisenhachinen” or “Heisei Nijuunen” is input. Therefore, there is a portion (2 records) of the
本実施形態の共通辞書22では、音声用データ221と、テキスト用データ222とを包含・統合する辞書として図示するように3レコードを有し、音声入力された検索文をテキストで修正またはテキスト入力された検索文を音声で修正可能なように、音声・テキスト共通の共通意味ID(Y2008)を割り当てることとした。このような共通辞書を用いることにより、様々な入力方法の揺れ(同じ意味に対する異なった複数の入力)に対応することができる。
The
音声認識部14は、共通辞書22を参照し、認識した形態素が「平成20年」の場合、音声用データ221を用いて当該単語の共通意味ID(Y2008)を取得し、他の形態素についても同様に共通意味IDを取得する。そして、形態素に分割したテキストデータに、各形態素の共通意味IDを付加した共通意味ID付テキストデータを生成する。
The
共通意味ID付テキストデータの具体例としては、例えば「平成20年/に/起き/た/火事/の/情報/を/知り/たい:Y2008/IDXX/IDYY/・・・・」などである。 Specific examples of text data with a common meaning ID include, for example, “2008 / In / Wake / Ta / Fire / No / Information / To know / want: Y2008 / IDXX / IDYY /... .
一方、テキストの検索文が入力された場合(S13:テキスト)、形態素解析部12は、S12で入力されたテキストの検索文の形態素解析を行う(S17)。形態素解析(Morphological Analysis)は、対象言語の文法のルールや辞書(品詞等の情報付きの単語リスト)を用いて、自然言語で記述された文を、形態素(言語で意味を持つ最小の言語単位)に分割する。そして、形態素解析部12は、共通辞書22(テキスト用データ222)を参照して、分割した形態素の各々に共通意味IDを付与し、共通意味ID付テキストデータを生成する(S18)。
On the other hand, when a text search sentence is input (S13: text), the
そして、検索条件解析部15は、構文解析、自然言語処理技術を用いて、S16またはS18で生成された共通意味ID付テキストデータを解析し、当該テキストデータに含まれる検索条件および対応する意味IDを抽出する(S19)。自然言語処理(Natural language processing)は、自然言語をコンピュータに入力し、所定の目的に応じた情報処理を行う技術である。
Then, the search
図2に示す具体例では、災害に関する情報を検索する処理であるため、検索条件解析部15は、時期に関する検索条件、災害種別に関する検索条件、地域に関する検索条件などを共通意味ID付テキストデータから抽出する。
In the specific example shown in FIG. 2, the process is a process for searching for information related to disasters. Therefore, the search
この場合、検索条件解析部15は、以下の検索条件と当該検索条件に対応する共通意味IDを抽出する。
In this case, the search
<検索条件> 時期 :2008年[Y2008]
災害種別:火災[FIRE]
なお、S12で入力された音声(読み)は「平成20年(ヘイセイニジュウネン)」であるが、共通辞書22の表記は「2008年」であるため、検索条件は「2008年」となる。
<Search conditions> Time: 2008 [Y2008]
Disaster type: Fire [FIRE]
Note that the speech (reading) input in S12 is “2008 (Heisei Jiunen)”, but the notation of the
検索条件管理部16は、検索条件解析部15が解析した検索条件および共通意味IDを、検索条件記憶部17に登録または更新する(S20)。そして、検索条件表示部18は、検索条件記憶部17に登録・更新された検索条件をPC3に送信し、PC3の表示装置に表示させる(S21)。
The search
PC3を使用するユーザは、表示装置に表示された検索条件を閲覧し、検索条件が意図したものでない場合、または、新たな検索条件を追加したい場合には、追加修正指示をPC3に入力する。これにより、検索条件の追加修正指示が有りになり(S22:有り)、S11に戻り、音声またはテキストの検索文の入力の受け付けを開始する。 The user using the PC 3 browses the search conditions displayed on the display device, and inputs an additional correction instruction to the PC 3 when the search conditions are not intended or when a new search condition is to be added. As a result, there is a search condition addition / correction instruction (S22: present), and the process returns to S11 to start accepting input of a voice or text search sentence.
本実施形態では、検索条件記憶部17に検索条件とともに共通意味IDを登録することにより、最初に音声で検索文を入力した後に、音声での追加修正指示の入力だけでなくテキストでの追加修正指示の入力を行うことができ、また、最初にテキストで検索文を入力した後に、テキストでの追加修正指示の入力だけでなく音声での追加修正指示の入力を行うことができる(S12)。
In this embodiment, by registering the common meaning ID together with the search condition in the search
ここで、ユーザはPC3を用いてテキストでの追加修正指示(例えば「2008年ではなく2007年の情報が知りたい」)を入力するものとする。この場合、音声での検索文の入力を停止し(S14)、形態素解析部12は、形態素解析を行い(S17)、共通辞書22を参照して各形態素に共通意味IDを付与し、共通意味ID付テキストデータ(例えば、「2008年/では/なく/2007/・・・・ :Y2008/IDaa/IDbb/・・・・」)を生成する(S18)。
Here, it is assumed that the user inputs an additional correction instruction in text using the PC 3 (for example, “I want to know information on 2007, not 2008”). In this case, the input of the search sentence by voice is stopped (S14), and the
そして、検索条件解析部15は、追加修正指示の共通意味ID付テキストデータを解析し、検索条件記憶部17に登録された検索条件および共通意味IDを更新するための更新情報(例えば、「時期(変更):2008年[Y2008]→2007年[Y2007]」を生成する(S19)。
Then, the search
検索条件管理部16は、検索条件解析部15が生成した更新情報に基づいて、検索条件記憶部17に登録された検索条件および共通意味IDを更新する(S20)。これにより、検索条件記憶部17には以下の検索条件および共通意味IDが記憶される。
The search
<検索条件> 時期 :2007年[Y2007]
災害種別:火災[FIRE]
そして、検索条件表示部18は、更新された検索条件をPC3に送信し、PC3の表示装置に表示させ(S21)、検索条件の追加修正指示がない場合(S22:無し)、検索部19は、当該検索条件で所定の検索DB20を検索し(S23)、検索結果出力部21は、検索結果をPC3に送信する(S24)。なお、検索DB20は、検索装置1が備える場合だけでなく、ネットワーク上に存在するデータベースであってもよい。
<Search conditions> Time: 2007 [Y2007]
Disaster type: Fire [FIRE]
Then, the search
以上説明した本実施形態では、ユーザは任意の入力方法(テキスト入力、音声入力)を選択して検索文を入力することができる。これにより、キーボードの操作に不慣れなユーザは音声で入力し、キーボードの操作に慣れているユーザはテキストで入力するなど、ユーザは自身の特性や状況に応じて自由に入力方式を選択でき、ユーザの検索文の入力負荷を軽減するとともに、ユーザの利便性を向上することができる。 In the present embodiment described above, the user can select an arbitrary input method (text input, voice input) and input a search sentence. This allows users who are unfamiliar with keyboard operation to input by voice, users who are accustomed to keyboard operation input by text, etc., so that the user can freely select the input method according to his / her characteristics and situation. It is possible to reduce the input load of the search sentence and improve user convenience.
例えば、PC3が置かれている場所において、キーボードの配置スペースがない場合はマイクを用いて音声入力し、また、騒音が大きな場所ではテキスト入力をすることが考えられる。また、最初は音声で検索文を入力し、検索条件が提示された後、誤認識により意図しない検索条件なっている部分のみテキストで追加修正指示を入力することが考えらる。また、基本的には入力が容易な音声で検索文を入力し、読み方がわからない地名など音声での入力が困難な場合にテキストで入力することが考えられる。 For example, in a place where the PC 3 is placed, if there is no space for the keyboard, it is conceivable that voice input is performed using a microphone, and text input is performed in a place where noise is high. In addition, it is conceivable that a search sentence is first input by voice, and after a search condition is presented, an additional correction instruction is input in text only for a part that has an unintended search condition due to misrecognition. Basically, it is conceivable that a search sentence is input by voice that is easy to input, and text is input when it is difficult to input by voice, such as a place name that is not understood.
また、本実施形態では、検索部19が検索を行う前に、検索条件をPC3に送信し、ユーザに提示する。これにより、ユーザは、検索条件を確認した上で、必要に応じて検索条件の修正および追加を行うことができる。すなわち、ユーザが意図した検索条件で検索を行うため、ユーザの利便性を向上させることができ、より効率の良い検索処理を実現することができる。
In this embodiment, before the
また、本実施形態では、ユーザに提示される検索条件は、ユーザが入力した検索文そのものではなく、検索装置が解析した検索条件であるため、ユーザは、一目で意図した検索条件か否かを判断することができる。 In the present embodiment, the search condition presented to the user is not the search sentence itself input by the user, but the search condition analyzed by the search device. Therefore, the user determines whether the search condition is intended at a glance. Judgment can be made.
また、本実施形態では、共通辞書を用いて、テキスト入力されて検索文の各形態素と音声入力された検索文の各形態素に、共通意味IDを付与する。これにより、テキスト入力であっても、音声入力であっても、同じ意味を有する形態素(単語)には同じ共通意味IDが付与され、検索条件記憶部に記憶される。これにより、音声入力された検索文の検索条件をテキスト入力で追加修正すること、または、テキスト入力された検索文の検索条件を音声入力で追加修正することができる。 In this embodiment, a common meaning ID is assigned to each morpheme of a search sentence that is input by text and each of the search sentences that are input by voice using a common dictionary. As a result, the same common meaning ID is assigned to the morphemes (words) having the same meaning regardless of whether the input is text input or voice input, and is stored in the search condition storage unit. Thereby, the search condition of the search sentence inputted by voice can be additionally corrected by text input, or the search condition of the search sentence inputted by text can be additionally corrected by voice input.
なお、本発明は上記の実施形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。 In addition, this invention is not limited to said embodiment, Many deformation | transformation are possible within the range of the summary.
1 :検索装置
11:テキスト入力受付部
12:形態素解析部
13:音声入力受付部
14:音声認識部
15:検索条件解析部
16:検索条件管理部
17:検索条件記憶部
18:検索条件表示部
19:検索部
20:検索結果出力部
21:検索DB
22:共通辞書
3 :PC
DESCRIPTION OF SYMBOLS 1: Search apparatus 11: Text input reception part 12: Morphological analysis part 13: Speech input reception part 14: Speech recognition part 15: Search condition analysis part 16: Search condition management part 17: Search condition storage part 18: Search condition display part 19: Search unit 20: Search result output unit 21: Search DB
22: Common dictionary 3: PC
Claims (9)
テキスト検索文の入力を受け付けるテキスト入力受付手段と、
前記テキスト検索文を形態素解析して、解析結果の各形態素に共通意味IDを付与し、共通意味ID付テキストデータを生成する形態素解析手段と、
音声検索文の入力を受け付ける音声入力受付手段と、
前記音声検索文を音声認識してテキストに変換するとともに、前記変換されたテキストの各形態素に共通意味IDを付与し、共通意味ID付テキストデータを生成する音声認識手段と、
前記形態素解析手段または前記音声認識手段が生成した共通意味ID付テキストデータを解析し、検索条件と当該検索条件に対応する共通意味IDを抽出する検索条件解析手段と、
前記検索条件および対応する共通意味IDを検索条件記憶手段に記憶する検索条件管理手段と、
前記検索条件記憶手段に記憶された検索条件を提示する提示手段と、
前記検索条件を用いて検索し、検索結果を出力する検索手段と、を有すること
を特徴とする検索装置。 A search device,
Text input accepting means for accepting input of a text search sentence;
Morphological analysis of the text search sentence, assigning a common meaning ID to each morpheme of the analysis result, and generating text data with a common meaning ID;
Voice input receiving means for receiving input of a voice search sentence;
Speech recognition means for recognizing the speech search sentence and converting it to text, giving a common meaning ID to each morpheme of the converted text, and generating text data with a common meaning ID;
A search condition analysis unit that analyzes the text data with common meaning ID generated by the morpheme analysis unit or the speech recognition unit, and extracts a search condition and a common meaning ID corresponding to the search condition;
Search condition management means for storing the search condition and the corresponding common meaning ID in the search condition storage means;
Presenting means for presenting the search conditions stored in the search condition storage means;
And a search unit that searches using the search condition and outputs a search result.
前記テキスト入力受付手段および前記音声入力受付手段は、前記提示手段が提示した検索条件の修正指示を、テキストまたは音声で受け付け、
前記形態素解析手段は、前記テキスト入力された修正指示を形態素解析して、解析結果の各形態素に共通意味IDを付与し、共通意味ID付テキストデータを生成し、
前記音声認識手段は、前記音声入力された修正指示を音声認識してテキストに変換するとともに、前記変換されたテキストの各形態素に共通意味IDを付与し、共通意味ID付テキストデータを生成し、
前記検索条件解析手段は、前記形態素解析手段または前記音声認識手段が生成した修正指示の共通意味ID付テキストデータを解析し、修正指示の検索条件と当該検索条件に対応する共通意味IDを抽出し、
前記検索条件管理手段は、検索条件記憶手段に記憶された検索条件および対応する共通意味IDを、修正指示の検索条件と対応する共通意味IDに更新すること
を特徴とする検索装置。 The search device according to claim 1,
The text input receiving means and the voice input receiving means receive a search condition correction instruction presented by the presenting means in text or voice,
The morpheme analyzing means performs a morphological analysis on the correction instruction inputted with the text, gives a common meaning ID to each morpheme of the analysis result, generates text data with a common meaning ID,
The voice recognition means recognizes the correction instruction inputted by voice and converts it into text, assigns a common meaning ID to each morpheme of the converted text, generates text data with a common meaning ID,
The search condition analysis unit analyzes the text data with the common meaning ID of the correction instruction generated by the morpheme analysis unit or the voice recognition unit, and extracts the search condition of the correction instruction and the common meaning ID corresponding to the search condition. ,
The search condition management means updates the search condition and the corresponding common meaning ID stored in the search condition storage means to a common meaning ID corresponding to the search condition of the correction instruction.
同じ意味を有する形態素に対して、読みと、表記と、共通意味IDとを対応付けた共通辞書を、さらに有し、
前記形態素解析手段および前記音声認識手段は、前記共通辞書を用いて各形態素に共通意味IDを付与すること
を特徴とする検索装置。 The search device according to claim 1 or 2, wherein
For a morpheme having the same meaning, further has a common dictionary that associates reading, notation, and common meaning ID,
The morpheme analyzing unit and the speech recognition unit assign a common meaning ID to each morpheme using the common dictionary.
テキスト検索文の入力、または、音声検索文の入力を受け付ける入力受付ステップと、
前記テキスト検索文の入力を受け付けた場合、前記テキスト検索文を形態素解析して、解析結果の各形態素に共通意味IDを付与し、共通意味ID付テキストデータを生成するとともに、前記音声検索文を受け付けた場合、前記音声検索文を音声認識してテキストに変換するとともに、前記変換されたテキストの各形態素に共通意味IDを付与し、共通意味ID付テキストデータを生成する生成ステップと、
前記生成ステップで生成した共通意味ID付テキストデータを解析し、検索条件と当該検索条件に対応する共通意味IDを抽出する検索条件解析ステップと、
前記検索条件および対応する共通意味IDを検索条件記憶部に記憶する検索条件管理ステップと、
前記検索条件記憶部に記憶された検索条件を提示する提示ステップと、
前記検索条件を用いて検索し、検索結果を出力する検索ステップと、を行うこと
を特徴とする検索方法。 A search method performed by a computer,
An input receiving step for receiving input of a text search sentence or input of a voice search sentence;
When the input of the text search sentence is accepted, the text search sentence is subjected to morphological analysis, a common meaning ID is assigned to each morpheme of the analysis result, and text data with a common meaning ID is generated. If accepted, the speech search sentence is recognized and converted into text, a common meaning ID is assigned to each morpheme of the converted text, and a generation step of generating text data with a common meaning ID;
A search condition analysis step of analyzing the text data with common meaning ID generated in the generation step and extracting a search condition and a common meaning ID corresponding to the search condition;
A search condition management step of storing the search condition and the corresponding common meaning ID in a search condition storage unit;
A presenting step of presenting search conditions stored in the search condition storage unit;
And a search step of performing a search using the search condition and outputting a search result.
前記入力受付ステップは、前記提示ステップで提示した検索条件の修正指示をテキストまたは音声で受け付け、
前記生成ステップは、前記修正指示がテキストで入力された場合、当該修正指示を形態素解析して、解析結果の各形態素に共通意味IDを付与し、共通意味ID付テキストデータを生成するとともに、前記修正指示が音声で入力された場合、当該音声入力された修正指示を音声認識してテキストに変換するとともに、変換されたテキストの各形態素に共通意味IDを付与し、共通意味ID付テキストデータを生成し、
前記検索条件解析ステップは、前記生成ステップで生成した修正指示の共通意味ID付テキストデータを解析し、修正指示の検索条件と当該検索条件に対応する共通意味IDを抽出し、
前記検索条件管理ステップは、検索条件記憶部に記憶された検索条件および対応する共通意味IDを、修正指示の検索条件と対応する共通意味IDに更新すること
を特徴とする検索方法。 The search method according to claim 4,
The input receiving step receives a search condition correction instruction presented in the presenting step in text or voice,
In the generation step, when the correction instruction is input as text, the correction instruction is morphologically analyzed, a common meaning ID is given to each morpheme of the analysis result, and text data with a common meaning ID is generated. When a correction instruction is input by voice, the correction instruction input by voice is recognized and converted into text, a common meaning ID is assigned to each morpheme of the converted text, and text data with a common meaning ID is Generate
The search condition analysis step analyzes the text data with the common meaning ID of the correction instruction generated in the generation step, extracts the search condition of the correction instruction and the common meaning ID corresponding to the search condition,
The search condition management step updates the search condition and the corresponding common meaning ID stored in the search condition storage unit to a common meaning ID corresponding to the search condition of the correction instruction.
前記コンピュータは、同じ意味を有する形態素に対して、読みと、表記と、共通意味IDとを対応付けた共通辞書を、有し、
前記生成ステップは、前記共通辞書を用いて各形態素に共通意味IDを付与すること
を特徴とする検索方法。 The search method according to claim 4 or 5, wherein:
The computer has a common dictionary in which readings, notations, and common meaning IDs are associated with morphemes having the same meaning,
The generating step assigns a common meaning ID to each morpheme using the common dictionary.
前記コンピュータに、
テキスト検索文の入力、または、音声検索文の入力を受け付ける入力受付ステップと、
前記テキスト検索文の入力を受け付けた場合、前記テキスト検索文を形態素解析して、解析結果の各形態素に共通意味IDを付与し、共通意味ID付テキストデータを生成するとともに、前記音声検索文を受け付けた場合、前記音声検索文を音声認識してテキストに変換するとともに、前記変換されたテキストの各形態素に共通意味IDを付与し、共通意味ID付テキストデータを生成する生成ステップと、
前記生成ステップで生成した共通意味ID付テキストデータを解析し、検索条件と当該検索条件に対応する共通意味IDを抽出する検索条件解析ステップと、
前記検索条件および対応する共通意味IDを検索条件記憶部に記憶する検索条件管理ステップと、
前記検索条件記憶部に記憶された検索条件を提示する提示ステップと、
前記検索条件を用いて検索し、検索結果を出力する検索ステップと、を実行させること
を特徴とする検索プログラム。 A search program executed by a computer,
In the computer,
An input receiving step for receiving input of a text search sentence or input of a voice search sentence;
When the input of the text search sentence is accepted, the text search sentence is subjected to morphological analysis, a common meaning ID is assigned to each morpheme of the analysis result, and text data with a common meaning ID is generated. If accepted, the speech search sentence is recognized and converted into text, a common meaning ID is assigned to each morpheme of the converted text, and a generation step of generating text data with a common meaning ID;
A search condition analysis step of analyzing the text data with common meaning ID generated in the generation step and extracting a search condition and a common meaning ID corresponding to the search condition;
A search condition management step of storing the search condition and the corresponding common meaning ID in a search condition storage unit;
A presenting step of presenting search conditions stored in the search condition storage unit;
A search step for performing a search using the search condition and outputting a search result.
前記入力受付ステップは、前記提示ステップで提示した検索条件の修正指示をテキストまたは音声で受け付け、
前記生成ステップは、前記修正指示がテキストで入力された場合、当該修正指示を形態素解析して、解析結果の各形態素に共通意味IDを付与し、共通意味ID付テキストデータを生成するとともに、前記修正指示が音声で入力された場合、当該音声入力された修正指示を音声認識してテキストに変換するとともに、変換されたテキストの各形態素に共通意味IDを付与し、共通意味ID付テキストデータを生成し、
前記検索条件解析ステップは、前記生成ステップで生成した修正指示の共通意味ID付テキストデータを解析し、修正指示の検索条件と当該検索条件に対応する共通意味IDを抽出し、
前記検索条件管理ステップは、検索条件記憶部に記憶された検索条件および対応する共通意味IDを、修正指示の検索条件と対応する共通意味IDに更新すること
を特徴とする検索プログラム。 The search program according to claim 7,
The input receiving step receives a search condition correction instruction presented in the presenting step in text or voice,
In the generation step, when the correction instruction is input as text, the correction instruction is morphologically analyzed, a common meaning ID is given to each morpheme of the analysis result, and text data with a common meaning ID is generated. When a correction instruction is input by voice, the correction instruction input by voice is recognized and converted into text, a common meaning ID is assigned to each morpheme of the converted text, and text data with a common meaning ID is Generate
The search condition analysis step analyzes the text data with the common meaning ID of the correction instruction generated in the generation step, extracts the search condition of the correction instruction and the common meaning ID corresponding to the search condition,
The search condition management step updates the search condition and the corresponding common meaning ID stored in the search condition storage unit to a common meaning ID corresponding to the search condition of the correction instruction.
前記コンピュータは、同じ意味を有する形態素に対して、読みと、表記と、共通意味IDとを対応付けた共通辞書を、有し、
前記生成ステップは、前記共通辞書を用いて各形態素に共通意味IDを付与すること
を特徴とする検索プログラム。 A search program according to claim 7 or claim 8, wherein
The computer has a common dictionary in which readings, notations, and common meaning IDs are associated with morphemes having the same meaning,
The generating step assigns a common meaning ID to each morpheme using the common dictionary.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009104474A JP5300576B2 (en) | 2009-04-22 | 2009-04-22 | SEARCH DEVICE, SEARCH METHOD, AND SEARCH PROGRAM |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009104474A JP5300576B2 (en) | 2009-04-22 | 2009-04-22 | SEARCH DEVICE, SEARCH METHOD, AND SEARCH PROGRAM |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010257085A JP2010257085A (en) | 2010-11-11 |
JP5300576B2 true JP5300576B2 (en) | 2013-09-25 |
Family
ID=43317948
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009104474A Active JP5300576B2 (en) | 2009-04-22 | 2009-04-22 | SEARCH DEVICE, SEARCH METHOD, AND SEARCH PROGRAM |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5300576B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9633019B2 (en) * | 2015-01-05 | 2017-04-25 | International Business Machines Corporation | Augmenting an information request |
JP7102710B2 (en) * | 2017-11-22 | 2022-07-20 | 富士通株式会社 | Information generation program, word extraction program, information processing device, information generation method and word extraction method |
CN111241400B (en) * | 2020-01-14 | 2023-04-25 | 北京字节跳动网络技术有限公司 | Information searching method and device |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0765013A (en) * | 1993-08-26 | 1995-03-10 | Toshiba Corp | Document retrieving device |
JP2006277676A (en) * | 2005-03-30 | 2006-10-12 | Toshiba Corp | Information search device, information search method, and information search program |
-
2009
- 2009-04-22 JP JP2009104474A patent/JP5300576B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010257085A (en) | 2010-11-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9754592B2 (en) | Methods and systems for speech-enabling a human-to-machine interface | |
JP4058071B2 (en) | Example translation device, example translation method, and example translation program | |
US10672391B2 (en) | Improving automatic speech recognition of multilingual named entities | |
US20060149551A1 (en) | Mobile dictation correction user interface | |
US9442920B2 (en) | Speech translation system, dictionary server, and program | |
US7742924B2 (en) | System and method for updating information for various dialog modalities in a dialog scenario according to a semantic context | |
KR20130018205A (en) | Method for disambiguating multiple readings in language conversion | |
JP2015026057A (en) | Interactive character based foreign language learning device and method | |
KR100881334B1 (en) | Apparatus and Method of Dialogue Service for Providing Information | |
KR20160029587A (en) | Method and apparatus of Smart Text Reader for converting Web page through TTS | |
JPWO2011033834A1 (en) | Speech translation system, speech translation method, and recording medium | |
JP5068225B2 (en) | Audio file search system, method and program | |
JP5300576B2 (en) | SEARCH DEVICE, SEARCH METHOD, AND SEARCH PROGRAM | |
JP2005249829A (en) | Computer network system performing speech recognition | |
JP2013050742A (en) | Speech recognition device and speech recognition method | |
JP6233867B2 (en) | Dictionary registration system for speech recognition, speech recognition system, speech recognition service system, method and program | |
KR20170008357A (en) | System for Translating Using Crowd Sourcing, Server and Method for Web toon Language Automatic Translating | |
US20210149900A1 (en) | Method, system and computer program for semantic triple-based knowledge extension | |
JP2010231149A (en) | Terminal using kana-kanji conversion system for voice recognition, method and program | |
JP5998298B1 (en) | Speech translation device, speech translation method, and speech translation program | |
JP2010197709A (en) | Voice recognition response method, voice recognition response system and program therefore | |
JP2007164732A (en) | Computer executable program and information processing device | |
CN114586021B (en) | Information output device, information output method, and recording medium | |
JP2007213109A (en) | Dictionary preparation system, dictionary server, portable terminal, dictionary preparation method and dictionary preparation program | |
JP6298806B2 (en) | Speech translation system, control method therefor, and speech translation program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130528 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130618 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5300576 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |