JP2017059014A - Analysis device and data retrieval device, as well as control method of analysis device and data retrieval device - Google Patents

Analysis device and data retrieval device, as well as control method of analysis device and data retrieval device Download PDF

Info

Publication number
JP2017059014A
JP2017059014A JP2015183883A JP2015183883A JP2017059014A JP 2017059014 A JP2017059014 A JP 2017059014A JP 2015183883 A JP2015183883 A JP 2015183883A JP 2015183883 A JP2015183883 A JP 2015183883A JP 2017059014 A JP2017059014 A JP 2017059014A
Authority
JP
Japan
Prior art keywords
word
predicate
search
data
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015183883A
Other languages
Japanese (ja)
Inventor
富久 白石
Tomihisa Shiraishi
富久 白石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
I Business Center Corp
Original Assignee
I Business Center Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by I Business Center Corp filed Critical I Business Center Corp
Priority to JP2015183883A priority Critical patent/JP2017059014A/en
Publication of JP2017059014A publication Critical patent/JP2017059014A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide an analysis device, data retrieval device, a control method of the analysis device and data retrieval device, and a program thereof that can show the way to facilities and the like meeting desires of retrievers even when an address, name, telephone number and the like are not known.SOLUTION: A query is received from a microphone 15 of a smart phone 10. Voice data representing the query is transmitted from the smart phone 10 to a voice recognition device 2, where the voice data is converted to character string data. A query of the character string data is next transmitted to an analysis device 3, where the query is determined whether at least two words representing an object and predicate respectively are included in the query. When the given query includes, for example, only one word, and the word is the object, a word representing the predicate is inquired, and on the contrary, when the word is a word representing the predicate, a word expressing the object is inquired. A query including words representing the object and predicate respectively is obtained. In a retrieval device 4, data retrieval is conducted using both the object and the predicate.SELECTED DRAWING: Figure 7

Description

この発明は解析装置およびデータ検索装置,ならびにこれらの制御方法に関する。   The present invention relates to an analysis device, a data search device, and a control method thereof.

目的地までの経路を誘導するナビゲーション装置では,名称検索,住所エリア検索,電話番号検索などの複数の検索手法が用意されることがある。はじめに検索手法が設定(選択)され,その後に具体的なデータ入力に進む。名称検索であればはじめに名称検索が設定(選択)され,次に具体的な施設名称などが入力される。住所エリア検索であればはじめに住所エリア検索が設定(選択)され,次に具体的な住所の入力に進む。電話番号検索であればはじめに電話番号検索が設定(選択)され,次に具体的な電話番号の入力に進む。特許文献1は,キーワードと上記検索手法とを対応付けて記憶しておくことで,あらかじめの検索手法の設定を経ることなしに,キーワードのみで検索を行うものを記載する。   In a navigation device that guides a route to a destination, a plurality of search methods such as name search, address area search, and telephone number search may be prepared. First, the search method is set (selected), and then it proceeds to specific data input. If it is a name search, a name search is set (selected) first, and then a specific facility name is input. If it is an address area search, the address area search is first set (selected), and then the process proceeds to input of a specific address. If it is a phone number search, the phone number search is set (selected) first, and then the process proceeds to input of a specific phone number. Japanese Patent Laid-Open No. 2004-151867 describes a technique in which a keyword is searched for by using only a keyword without having to set the search method in advance by storing the keyword and the search method in association with each other.

特開2009−258805号公報JP 2009-258805 A

特許文献1に記載のナビゲーション装置では,名称,住所,電話番号等の施設を特定するキーワード等を入力することができれば,そのキーワードを含む,またはそのキーワードに関連する施設等を検索することができる。しかしながら,特に周辺地理に不案内な場合にはキーワードの入力自体が難しいことがある。   In the navigation device described in Patent Document 1, if a keyword specifying a facility such as a name, an address, and a telephone number can be input, it is possible to search for a facility that includes the keyword or is related to the keyword. . However, it may be difficult to enter keywords, especially when it is unfamiliar with the surrounding geography.

この発明は,名称,住所,電話番号等を知らなくても,検索者のクエリ(問い合わせ,要望,要求,質問)に沿う施設等を案内することができるようにすることを目的とする。   An object of the present invention is to be able to guide a facility or the like along a searcher's query (inquiry, request, request, question) without knowing the name, address, telephone number, or the like.

この発明はまた,話し言葉をクエリとして用いることができるようにすることを目的とする。   Another object of the present invention is to make it possible to use spoken words as queries.

この発明による解析装置は,与えられるクエリを表す文字列データに目的語および述語のそれぞれに相当する少なくとも2つの単語が含まれているかどうかを判定する単語充足判定手段,ならびに目的語に相当する単語または述語に相当する単語が含まれていないと判定された場合に,含まれていない目的語に相当する単語または述語に相当する単語の入力を要求する単語充足要求手段を備えている。   The analysis apparatus according to the present invention includes a word satisfaction determination means for determining whether or not character string data representing a given query includes at least two words corresponding to the object and the predicate, and a word corresponding to the object Or it is provided with a word satisfaction request means for requesting input of a word corresponding to an object not included or a word corresponding to a predicate when it is determined that a word corresponding to the predicate is not included.

この発明は上記解析装置に適する制御方法も提供する。この発明による解析装置の制御方法は,単語充足判定手段および単語充足要求手段を備える解析装置を制御する方法であって,単語充足判定手段によって,与えられるクエリを表す文字列データに目的語および述語のそれぞれに相当する少なくとも2つの単語が含まれているかどうかを判定し,単語充足要求手段によって,目的語に相当する単語または述語に相当する単語が上記文字列データに含まれていないと判定された場合に,含まれていない目的語に相当する単語または述語に相当する単語の入力を要求するものである。   The present invention also provides a control method suitable for the analysis apparatus. An analysis apparatus control method according to the present invention is a method for controlling an analysis apparatus including a word satisfaction determination means and a word satisfaction request means, wherein the word satisfaction determination means adds an object and a predicate to character string data representing a given query. It is determined whether or not at least two words corresponding to each of the above are included, and it is determined by the word satisfaction request means that a word corresponding to the object or a word corresponding to the predicate is not included in the character string data. In this case, it is requested to input a word corresponding to an object not included or a word corresponding to a predicate.

この発明はさらに,上述した解析装置の処理をコンピュータに実行させるためのプログラムも提供する。この発明による解析プログラムは,与えられるクエリを表す文字列データに目的語および述語のそれぞれに相当する少なくとも2つの単語が含まれているかどうかを判定する単語充足判定処理,ならびに目的語に相当する単語または述語に相当する単語が含まれていないと判定された場合に,含まれていない目的語に相当する単語または述語に相当する単語の入力を要求する単語充足要求処理をコンピュータに実行させるものである。この発明は上記プログラムを記録したコンピュータ読み取り可能な記録媒体(CD−ROM,DVD−ROM,ハードディスクなど)も提供する。   The present invention further provides a program for causing a computer to execute the processing of the analysis apparatus described above. The analysis program according to the present invention includes a word satisfaction determination process for determining whether or not character string data representing a given query includes at least two words corresponding to the object and the predicate, and a word corresponding to the object Or, when it is determined that a word corresponding to the predicate is not included, the computer executes word satisfaction request processing for requesting input of a word corresponding to the object not included or a word corresponding to the predicate. is there. The present invention also provides a computer-readable recording medium (CD-ROM, DVD-ROM, hard disk, etc.) on which the program is recorded.

この発明は解析システムも提供する。この発明による解析システムは,与えられるクエリを表す文字列データに目的語および述語のそれぞれに相当する少なくとも2つの単語が含まれているかどうかを判定する単語充足判定装置,ならびに目的語に相当する単語または述語に相当する単語が上記文字列データに含まれていないと判定された場合に,含まれていない目的語に相当する単語または述語に相当する単語の入力を要求する単語充足要求装置を備えている。   The present invention also provides an analysis system. The analysis system according to the present invention includes a word satisfaction determination device that determines whether or not character string data representing a given query includes at least two words corresponding to the object and the predicate, and a word corresponding to the object. Or, when it is determined that a word corresponding to a predicate is not included in the character string data, a word satisfaction requesting device that requests input of a word corresponding to an object not included or a word corresponding to a predicate is provided. ing.

この発明による解析装置および解析システムは,与えられるクエリを表す文字列データに目的語および述語のそれぞれに相当する少なくとも2つの単語が含まれているかどうかを判定することによって,与えられるクエリがデータ検索に適する内容を含むかどうかを解析する。目的語と述語とが分かれば,データ検索を行う検索者が何をどうしたいかが分かるからである。   The analysis apparatus and analysis system according to the present invention determines whether a given query is a data search by determining whether or not character string data representing the given query includes at least two words corresponding to an object and a predicate. Analyzes whether or not it contains content suitable for. This is because if the object and the predicate are known, the searcher who performs the data search knows what the user wants to do.

この発明によると,与えられるクエリに目的語に相当する単語または述語に相当する単語が含まれていないと判定された場合に,含まれていない目的語に相当する単語または述語に相当する単語の入力が要求される。検索者がこの要求に応じることで,目的語および述語のそれぞれを必ず少なくとも一つずつ含むクエリが与えられることになり,検索者の要望に合致するデータ検索結果が得られやすくなる。   According to the present invention, when it is determined that a word corresponding to an object or a word corresponding to a predicate is not included in a given query, a word corresponding to an object not included or a word corresponding to a predicate is not included. Input is required. When the searcher responds to this request, a query including at least one of each of the object and the predicate is given, and it becomes easy to obtain a data search result that matches the searcher's request.

好ましくは,解析装置は,与えられるクエリを表す文字列データを形態素解析処理し,文字列データに含まれる一または複数の単語と各単語の品詞を判別する形態素解析手段,ならびに上記形態素解析手段によって名詞と判別された単語を上記目的語に相当する単語に割り当て,かつ動詞,形容詞および形容動詞のいずれかと判別された単語を上記述語に相当する単語に割り当てる割り当て手段をさらに備えている。与えられるクエリとして自然文を用いることができる。   Preferably, the analysis device performs morphological analysis processing on character string data representing a given query, and determines morphological analysis means for determining one or more words included in the character string data and the part of speech of each word, and the morphological analysis means described above. An assignment unit is further provided for assigning a word determined to be a noun to a word corresponding to the object and assigning a word determined to be a verb, an adjective, or an adjective verb to a word corresponding to the above description word. Natural sentences can be used as the given query.

好ましくは,上記解析装置は,音声によって上記クエリの入力を受け付ける音声入力手段,および音声データを文字列データに変換する音声認識手段をさらに備えている。人が話す話し言葉をクエリに用いることができる。   Preferably, the analysis device further includes voice input means for receiving the input of the query by voice, and voice recognition means for converting voice data into character string data. Spoken words spoken by people can be used for queries.

この発明はデータ検索装置も提供する。この発明によるデータ検索装置は,クエリを表す文字列データの入力を受け付けるクエリ入力手段,受け付けられるクエリに目的語および述語のそれぞれに相当する少なくとも2つの単語が含まれているかどうかを判定する単語充足判定手段,受け付けられるクエリに目的語および述語に相当する少なくとも2つの単語が含まれていると判定された場合に,その目的語に相当する単語および述語に相当する単語を検索キーワードとして用いてデータ検索する検索手段,ならびに受け付けられるクエリに目的語に相当する単語または述語に相当する単語が含まれていないと判定された場合に,クエリに含まれていない目的語に相当する単語または述語に相当する単語の入力を要求する単語充足要求手段を備えている。   The present invention also provides a data retrieval apparatus. A data search apparatus according to the present invention includes query input means for receiving input of character string data representing a query, and word satisfaction for determining whether or not at least two words corresponding to an object and a predicate are included in the accepted query. When it is determined that the determination means includes at least two words corresponding to the object and the predicate in the accepted query, the word corresponding to the object and the word corresponding to the predicate are used as search keywords. Corresponds to the word or predicate corresponding to the object not included in the query when it is determined that the search means to search and the accepted query do not include the word corresponding to the object or the word corresponding to the predicate Word satisfaction requesting means for requesting input of a word to be processed.

この発明は,データ検索装置に適する制御方法も提供する。この発明によるデータ検索装置の制御方法は,クエリ入力手段,単語充足判定手段,検索手段および単語充足要求手段を備えるデータ検索装置を制御する方法であって,上記クエリ入力手段によってクエリを表す文字列データの入力を受け付け,上記単語充足判定手段によって目的語および述語のそれぞれに相当する少なくとも2つの単語が上記文字列データに含まれているかどうかを判定し,目的語および述語に相当する少なくとも2つの単語が上記文字列データに含まれていると判定された場合に,上記検索手段によってその目的語に相当する単語および述語に相当する単語を検索キーワードとして用いてデータ検索し,目的語に相当する単語または述語に相当する単語が上記文字列データに含まれていないと判定された場合に,上記単語充足要求手段によって含まれていない目的語に相当する単語または述語に相当する単語の入力を要求するものである。   The present invention also provides a control method suitable for the data retrieval apparatus. A method for controlling a data search apparatus according to the present invention is a method for controlling a data search apparatus comprising query input means, word satisfaction determination means, search means, and word satisfaction request means, and a character string representing a query by the query input means. Accepts data input, determines whether or not at least two words corresponding to the object and predicate are included in the character string data by the word satisfaction determination means, and at least two corresponding to the object and predicate When it is determined that the word is included in the character string data, the search means searches the data using the word corresponding to the object and the word corresponding to the predicate as the search keyword, and corresponds to the object. When it is determined that the character string data does not contain a word or a word corresponding to a predicate, Is a request for input of a word corresponding to the word or the predicate corresponding to object that is not contained by satisfaction requesting means.

この発明は上述したデータ検索装置の処理をコンピュータに実行させるプログラム,およびこのプログラムを記録したコンピュータ読み取り可能な記録媒体(CD−ROM,DVD−ROM,ハードディスクなど)も提供する。   The present invention also provides a program for causing a computer to execute the processing of the above-described data search device, and a computer-readable recording medium (CD-ROM, DVD-ROM, hard disk, etc.) on which the program is recorded.

この発明によると,与えられるクエリに目的語に相当する単語および述語に相当する単語が含まれる場合にはデータ検索に進み,他方,目的語に相当する単語または述語に相当する単語が含まれていないと判定された場合に,含まれていない目的語に相当する単語または述語に相当する単語の入力が要求される。目的語と述語とが分かれば,検索者が何をどうしたいのか(検索者の要望,要求)が分かるからである。検索者がこの要求に応じることで,目的語および述語のそれぞれを必ず少なくとも一つずつ含むクエリが与えられることになり,検索者の要望に合致するデータ検索結果が得られやすくなる。   According to the present invention, when a given query includes a word corresponding to an object and a word corresponding to a predicate, the process proceeds to data search, and on the other hand, a word corresponding to the object or a word corresponding to a predicate is included. If it is determined that there is no such word, input of a word corresponding to an object not included or a word corresponding to a predicate is requested. This is because if the object and predicate are known, the searcher knows what he / she wants to do (request and request of the searcher). When the searcher responds to this request, a query including at least one of each of the object and the predicate is given, and it becomes easy to obtain a data search result that matches the searcher's request.

目的語に相当する単語と述語に相当する単語の両方が検索キーワードとして用いられることでデータ検索が行われる。検索キーワードとして用いられる目的語および述語はそれぞれ複数であってもよい。いずれにしても,目的語に相当する単語および述語に相当する単語は少なくともそれぞれ一つずつはクエリに含まれることが要求され,この要求を満たさないクエリの場合には要求を満たすことが求められる。   Data search is performed by using both the word corresponding to the object and the word corresponding to the predicate as search keywords. There may be a plurality of objects and predicates used as search keywords. In any case, at least one word corresponding to the object and one word corresponding to the predicate are required to be included in the query, and if the query does not satisfy this requirement, the requirement is required to be satisfied. .

一実施態様では,上記文字列データを形態素解析処理し,文字列データに含まれる一または複数の単語と各単語の品詞を判別する形態素解析手段,ならびに上記形態素解析手段によって名詞と判別された単語を上記目的語に相当する単語に割り当て,かつ動詞,形容詞および形容動詞のいずれかと判別された単語を上記述語に相当する単語に割り当てる手段をさらに備えている。自然文をクエリに用いることができる。   In one embodiment, the character string data is subjected to a morphological analysis process, and one or a plurality of words included in the character string data and a part of speech of each word are determined, and a word identified as a noun by the morphological analysis means Is assigned to the word corresponding to the object, and a word determined as one of a verb, an adjective and an adjective verb is further assigned to a word corresponding to the above description word. Natural sentences can be used for queries.

好ましくは,音声によって上記クエリの入力を受け付ける音声入力手段,および音声データを文字列データに変換する音声認識手段をさらに備えている。人が話す話し言葉をクエリに用いることができる。   Preferably, voice input means for receiving the query input by voice and voice recognition means for converting voice data into character string data are further provided. Spoken words spoken by people can be used for queries.

一実施態様では,記憶装置に複数の施設のそれぞれについての複数の説明文データが記憶されており,上記記憶装置に記憶されている複数の説明文データの中から,上記目的語に相当する単語および述語に相当する単語を検索キーワードとして用いて一または複数の説明文データが検索される。検索によって見つけられた説明文データに対応する施設情報(施設名称,施設の場所など)は上記クエリに対する検索結果として出力手段から出力される。検索結果の出力は音声出力であってもよいし(出力手段はスピーカである),表示画面上の文字表示または画像表示であってもよい(出力手段は表示装置である)。検索者の要望に沿う施設を検索者に紹介することができる。施設は,駅,観光地,公園,美術館,博物館,水族館,店舗などであってもよいし,より狭い範囲,たとえば一つの店舗内の複数の売り場のそれぞれであってもよい。   In one embodiment, a plurality of explanatory text data for each of a plurality of facilities is stored in the storage device, and a word corresponding to the object is selected from the plurality of explanatory text data stored in the storage device. One or a plurality of explanatory text data is searched using a word corresponding to the predicate as a search keyword. Facility information (facility name, facility location, etc.) corresponding to the explanatory text data found by the search is output from the output means as a search result for the query. The output of the search result may be an audio output (the output means is a speaker), or may be a character display or an image display on the display screen (the output means is a display device). Facilities that meet the searcher's needs can be introduced to the searcher. The facility may be a station, a sightseeing spot, a park, an art museum, a museum, an aquarium, a store, or the like, or may be a narrower range, for example, each of a plurality of sales floors in one store.

一実施態様では,上記検索手段は,複数の説明文データのそれぞれを処理対象にして,上記目的語に相当する単語および上記述語に相当する単語を含む複数の検索キーワードのそれぞれについて,すべての処理対象の説明文データの数を基準とした,説明文データ中の検索キーワードの存在割合を表す出現度を算出する出現度算出手段,複数の説明文データのそれぞれを処理対象にして,上記複数の検索キーワードのそれぞれについて,説明文データ中における検索キーワードの集中の程度を表す密度を算出する密度算出手段,ならびに複数の説明文データのそれぞれにおいて,複数の検索キーワードのそれぞれについて算出された出現度と密度を乗算し,乗算によって得られた値を説明文データごとに加算することによって説明文データの複数の検索キーワードに対する合致度を算出する合致度算出手段を備え,上記合致度算出手段によって算出された合致度の大きさが上記クエリに対する検索結果に用いられる。複数の検索キーワードについての出現度および密度を乗算した値の大きい説明文データ,すなわち複数の検索キーワード(目的語および述語)を適度に含む説明文データに大きい合致度が付与されやすくなり,この合致度の大きさをクエリに対する検索結果に用いることができる。たとえば合致度の最も大きい説明文データに対応する施設情報がクエリに対する検索結果として出力される。   In one embodiment, the search means performs processing for each of a plurality of search keywords including a word corresponding to the object word and a word corresponding to the above description word, with each of the plurality of explanatory text data being processed. Appearance degree calculating means for calculating the degree of occurrence representing the presence ratio of the search keyword in the explanatory text data based on the number of target explanatory text data, and each of the plurality of explanatory text data as processing targets, For each search keyword, density calculating means for calculating the density representing the degree of concentration of the search keyword in the description text data, and the appearance degree calculated for each of the plurality of search keywords in each of the plurality of description text data Multiply the density and add the value obtained by multiplication for each explanation data. Comprises a matching degree calculation means for calculating a coincidence degree for the search term number, the size of the matching degrees calculated by the matching degree calculating unit is used in search results for the query. A large degree of match is easily given to explanatory text data having a large value obtained by multiplying the appearance degree and density of a plurality of search keywords, that is, explanatory text data appropriately including a plurality of search keywords (objects and predicates). The magnitude of the degree can be used as a search result for the query. For example, the facility information corresponding to the explanatory text data having the highest degree of match is output as a search result for the query.

好ましくは,上記記憶装置に記憶される複数の施設についての説明文データは,施設に対する人の行動を表す述語データを含む。たとえば,水族館施設であれば,その説明文データには,「見る」,「遊ぶ」,「鑑賞する」など,水族館に対する人の行動を表す述語データ(動詞,形容詞または形容動詞)が含まれる。温泉施設であればその説明文データには,「入る」,「入浴する」など,温泉に対する人の行動を表す述語データが含まれる。たとえば水族館に行こうとする場合には,クエリには「水族館」は当然に含まれるであろうし,水族館でやりたいこと,典型的には魚を「見る」,「鑑賞する」といった述語も上記クエリに含まれる可能性が高い。施設に対する人の行動を表す述語データを検索対象の説明文データに含ませておくことによって,特に話し言葉によってクエリを受付けたときに,クエリに対する検索結果の精度を高めることができる。   Preferably, the descriptive text data for the plurality of facilities stored in the storage device includes predicate data representing a human action on the facility. For example, in the case of an aquarium facility, the explanatory text data includes predicate data (verb, adjective or adjective verb) representing a person's action on the aquarium, such as “see”, “play”, “appreciate”. In the case of a hot spring facility, the explanatory text data includes predicate data representing a person's action on the hot spring, such as “enter” or “take a bath”. For example, if you are going to an aquarium, the query will naturally include “Aquarium”, and what you want to do in the aquarium, typically predicates such as “see” and “appreciate” fish Is likely to be included. By including the predicate data representing the behavior of the person with respect to the facility in the explanatory text data to be searched, it is possible to improve the accuracy of the search result for the query, particularly when the query is accepted by spoken language.

一実施態様では,上記クエリに含まれている単語が辞書データに含まれているかどうかを判定する誤認識判定手段,上記誤認識判定手段によってクエリに含まれている単語が辞書データに含まれていず,誤認識されていると判定された場合に,誤認識を正した単語の候補を提示する修正候補提示手段を備えている。音声入力によってクエリを受け付ける場合には特に誤認識が生じやすい。誤認識が発生した場合に修正候補が提示されるので誤認識を正すことができる。正された単語によってデータ検索を行うことができる。   In one embodiment, erroneous recognition determination means for determining whether or not a word included in the query is included in the dictionary data, and the word included in the query by the erroneous recognition determination means is included in the dictionary data. First, correction candidate presenting means for presenting word candidates with correct misrecognition when it is determined that they are misrecognized is provided. When a query is received by voice input, misrecognition is particularly likely to occur. When a recognition error occurs, a correction candidate is presented so that the recognition error can be corrected. Data retrieval can be performed with the corrected words.

データ検索システムのハードウエア構成を示すブロック図である。It is a block diagram which shows the hardware constitutions of a data search system. データ検索システムのハードウエア構成の他の例を示すブロック図である。It is a block diagram which shows the other example of the hardware constitutions of a data search system. データ検索システムのハードウエア構成のさらに他の例を示すブロック図である。It is a block diagram which shows the further another example of the hardware constitutions of a data search system. データ検索システムのハードウエア構成のさらに他の例を示すブロック図である。It is a block diagram which shows the further another example of the hardware constitutions of a data search system. データ検索システムのハードウエア構成のさらに他の例を示すブロック図である。It is a block diagram which shows the further another example of the hardware constitutions of a data search system. スマートフォンを示す。Indicates a smartphone. データ検索システムのハードウエア構成を,スマートフォンの電気的構成とともに示すブロック図である。It is a block diagram which shows the hardware constitutions of a data search system with the electrical constitution of a smart phone. データ検索システムの処理を示すフローチャートである。It is a flowchart which shows the process of a data search system. データ検索システムの処理を示すフローチャートである。It is a flowchart which shows the process of a data search system. データ検索システムの処理を示すフローチャートである。It is a flowchart which shows the process of a data search system. 検索処理の処理結果を表形式にまとめて示す。The processing results of the search process are summarized in a table format. 検索対象データを示す。Indicates search target data.

(1)ハードウエア構成
図1から図5は,データ検索システムのハードウエア構成を概略的に示すブロック図である。図1から図5に示すデータ検索システムは,いずれも音声によって与えられるクエリ(問い合わせ,要望,要求,質問)の入力を受付け,受け付けたクエリに応じたデータ検索を行い,データ検索の結果を出力するものである。
(1) Hardware Configuration FIGS. 1 to 5 are block diagrams schematically showing the hardware configuration of the data search system. Each of the data retrieval systems shown in FIGS. 1 to 5 accepts input of a query (inquiry, request, request, question) given by voice, performs data retrieval according to the accepted query, and outputs a data retrieval result. To do.

図1に示すデータ検索システムは,入出力端末1と,音声認識装置2と,解析装置3と,検索装置4とを含む。   The data search system shown in FIG. 1 includes an input / output terminal 1, a voice recognition device 2, an analysis device 3, and a search device 4.

入出力端末1,音声認識装置2,解析装置3および検索装置4は,いずれも専用プログラムがインストールされたコンピュータ装置によって実現される。たとえば,入出力端末1は,CPU,メモリ,記憶装置,通信装置等を備え,記憶装置に記憶されている専用プログラムをCPUによって実行することで入出力端末1として機能する。音声認識装置2,解析装置3および検索装置4も同様である。プログラムは有形の記録媒体(CD−ROM,DVD−ROM,ハードディスクなど)(図示略)に記録することができる。記録媒体に記録されたプログラムが,入出力端末1,音声認識装置2,解析装置3および検索装置4がそれぞれ備える記憶装置にインストールされる。   The input / output terminal 1, the speech recognition device 2, the analysis device 3, and the search device 4 are all realized by a computer device in which a dedicated program is installed. For example, the input / output terminal 1 includes a CPU, a memory, a storage device, a communication device, and the like, and functions as the input / output terminal 1 by the CPU executing a dedicated program stored in the storage device. The same applies to the speech recognition device 2, the analysis device 3, and the search device 4. The program can be recorded on a tangible recording medium (CD-ROM, DVD-ROM, hard disk, etc.) (not shown). The program recorded on the recording medium is installed in a storage device provided in each of the input / output terminal 1, the speech recognition device 2, the analysis device 3, and the search device 4.

入出力端末1,音声認識装置2,解析装置3および検索装置4は,一箇所に存在してもよいし,別々の場所に存在してもよい。別々の場所に存在する場合には,インターネットなどのネットワークを介して入出力端末1,音声認識装置2,解析装置3および検索装置4は相互に接続される(クラウドコンピューティング)。入出力端末1,音声認識装置2,解析装置3および検索装置4は,いずれもデータを送受信するための通信装置を備える。   The input / output terminal 1, the speech recognition device 2, the analysis device 3, and the search device 4 may exist in one place or may exist in different places. When they exist in different places, the input / output terminal 1, the speech recognition device 2, the analysis device 3, and the search device 4 are connected to each other via a network such as the Internet (cloud computing). The input / output terminal 1, the speech recognition device 2, the analysis device 3 and the search device 4 are all equipped with a communication device for transmitting and receiving data.

入出力端末1が備えるマイクロフォン6からクエリが入力される。マイクロフォン6によって受け付けられるクエリ,すなわちクエリの内容を含む音声データ(音声クエリ)は入出力端末1からネットワークを通じて音声認識装置2に送信され,ここで音声データが文字列データに変換される。   A query is input from the microphone 6 provided in the input / output terminal 1. A query accepted by the microphone 6, that is, voice data (voice query) including the contents of the query is transmitted from the input / output terminal 1 to the voice recognition device 2 through the network, where the voice data is converted into character string data.

クエリを表す文字列データ(文字列クエリ)は次に音声認識装置2から解析装置3に与えられる。解析装置3は,形態素解析部3A,単語充足判定部3Bおよび単語充足要求部3Cを含む。形態素解析部3Aにおいて文字列データに対して形態素解析処理が行われる。形態素解析処理は,上記文字列データによって表される文字列(文,文章)を形態素(言語において意味を持つ最小単位の単語)に分割し,そのそれぞれの品詞を判別する処理である。単語充足判定部3Bでは,詳細は後述するが,文字列データによって表される文字列中に,目的語に相当する単語および述語に相当する単語が含まれているかどうかが判定される。目的語に相当する単語および述語に相当する単語は,いずれも少なくとも一つは上記文字列に含まれていることが,後段の検索装置4において検索処理が実行される要件とされる。目的語に相当する単語および述語に相当する単語の少なくとも一方が文字列中に含まれていないことが判定された場合,単語充足要求部3Cは,含まれていない目的語に相当する単語または述語に相当する単語を問い合わせる(尋ねる)充足要求処理(逆クエリ)も行う。逆クエリは,たとえば入出力端末1が備えるスピーカ7から音声出力される。   Character string data representing a query (character string query) is then given from the speech recognition device 2 to the analysis device 3. The analysis device 3 includes a morphological analysis unit 3A, a word satisfaction determination unit 3B, and a word satisfaction request unit 3C. Morphological analysis processing is performed on the character string data in the morphological analysis unit 3A. The morpheme analysis process is a process of dividing a character string (sentence, sentence) represented by the character string data into morphemes (minimum unit words that have meaning in the language) and determining their respective parts of speech. As will be described in detail later, the word satisfaction determination unit 3B determines whether the character string represented by the character string data includes a word corresponding to the object and a word corresponding to the predicate. At least one of the word corresponding to the object and the word corresponding to the predicate is included in the character string as a requirement for the search processing to be executed in the subsequent search device 4. When it is determined that at least one of the word corresponding to the object and the word corresponding to the predicate is not included in the character string, the word satisfaction request unit 3C selects the word or predicate corresponding to the object not included. A satisfaction request process (reverse query) for inquiring (inquiring) a word corresponding to is also performed. The reverse query is output from the speaker 7 provided in the input / output terminal 1, for example.

文字列クエリ中に目的語に相当する単語および述語に相当する単語の両方が含まれている場合,それらの目的語に相当する単語および述語に相当する単語は検索装置4に入力する。検索装置4は,目的語に相当する単語および述語に相当する単語を検索キーワードとして用いて,データ検索処理を実行する。検索装置4におけるデータ検索処理によって見つかったデータ(検索結果)が,検索装置4から入出力端末1に送信される。   When both the word corresponding to the object and the word corresponding to the predicate are included in the character string query, the word corresponding to the object and the word corresponding to the predicate are input to the search device 4. The search device 4 executes data search processing using a word corresponding to the object and a word corresponding to the predicate as search keywords. Data (search result) found by the data search process in the search device 4 is transmitted from the search device 4 to the input / output terminal 1.

検索装置4から検索結果を受信した入出力端末1は,検索結果を出力する処理を実行する。最も簡単には,検索装置4から送信された検索結果をそのまま音声によってスピーカ7から音声出力する,または入出力端末1が備える表示装置の表示画面上に画像出力する処理を実行することができる。検索装置4から送信された検索結果をそのまま出力するのに代えて,検索装置4から送信された検索結果を用いた所定の処理を入出力端末1において実行し,その実行結果を入出力端末1において出力することもできる。たとえば,検索装置4から送信される検索結果が住所データ(特定の施設の所在を示す緯度および経度)であれば,入出力端末1において現在地からその住所データによって特定される地点までの道順を出力する(表示画面に表示する)ことができる。   The input / output terminal 1 that has received the search result from the search device 4 executes processing for outputting the search result. Most simply, it is possible to execute a process of outputting the search result transmitted from the search device 4 as it is from the speaker 7 by voice, or outputting an image on the display screen of the display device included in the input / output terminal 1. Instead of outputting the search result transmitted from the search device 4 as it is, a predetermined process using the search result transmitted from the search device 4 is executed in the input / output terminal 1, and the execution result is input to the input / output terminal 1. Can also be output. For example, if the search result transmitted from the search device 4 is address data (latitude and longitude indicating the location of a specific facility), the input / output terminal 1 outputs a route from the current location to the point specified by the address data. (Display on the display screen).

図2に示すデータ検索システムは,入出力端末1と,音声認識装置2と,コンピュータ・システム5Aとから構成される。コンピュータ・システム5Aは,CPU,メモリ,記憶装置,入力装置,表示装置,CD−ROMドライブ,入出力インターフェース等を含むシステム(パーソナル・コンピュータ,ワークステーションなど)である。   The data search system shown in FIG. 2 includes an input / output terminal 1, a voice recognition device 2, and a computer system 5A. The computer system 5A is a system (personal computer, workstation, etc.) including a CPU, memory, storage device, input device, display device, CD-ROM drive, input / output interface, and the like.

コンピュータ・システム5Aの記憶装置に,上述した解析装置3の処理および検索装置4の処理を実行するプログラム(解析プログラム,検索プログラム)が記憶されている。コンピュータ・システム5AのCPUによって解析プログラムおよび検索プログラムが実行されることで,コンピュータ・システム5Aが,上述した解析装置3および検索装置4として機能する。解析装置3の処理および検索装置4の処理を実行するコンピュータ・システム5Aを,データ検索装置として位置づけることもできる。   A program (analysis program, search program) for executing the processing of the analysis device 3 and the processing of the search device 4 is stored in the storage device of the computer system 5A. When the analysis program and the search program are executed by the CPU of the computer system 5A, the computer system 5A functions as the analysis device 3 and the search device 4 described above. The computer system 5A that executes the processing of the analysis device 3 and the processing of the search device 4 can also be positioned as a data search device.

図3に示すデータ検索システムは,入出力端末1と,コンピュータ・システム5Bとを含む。上述した音声認識装置2,解析装置3および検索装置4の処理を実行するプログラム(音声認識プログラム,解析プログラムおよび検索プログラム)が,コンピュータ・システム5Bの記憶装置に記憶されている。コンピュータ・システム5Bが,上述した音声認識装置2,解析装置3および検索装置4として機能する。音声認識装置2の処理,解析装置3の処理,および検索装置4の処理を実行するコンピュータ・システム5Bを,データ検索装置として位置づけることもできる。   The data search system shown in FIG. 3 includes an input / output terminal 1 and a computer system 5B. Programs (speech recognition program, analysis program, and search program) for executing the processes of the voice recognition device 2, the analysis device 3, and the search device 4 described above are stored in the storage device of the computer system 5B. The computer system 5B functions as the voice recognition device 2, the analysis device 3, and the search device 4 described above. The computer system 5B that executes the processing of the speech recognition device 2, the processing of the analysis device 3, and the processing of the search device 4 can also be positioned as a data search device.

図4に示すデータ検索システムは,入出力端末1と,コンピュータ・システム5Cとを含む。図3に示すデータ検索システムとは,音声認識プログラムが,コンピュータ・システム5Cの記憶装置ではなく,入出力端末1の記憶装置に記憶されている点が異なる。入出力端末1はマイクロフォン6から入力される音声クエリを音声認識処理し,文字列クエリを生成する。入出力端末1において生成された文字列クエリが,ネットワークを介してコンピュータ・システム5Cに送信される。   The data retrieval system shown in FIG. 4 includes an input / output terminal 1 and a computer system 5C. 3 is different from the data retrieval system shown in FIG. 3 in that the voice recognition program is stored in the storage device of the input / output terminal 1 instead of the storage device of the computer system 5C. The input / output terminal 1 performs voice recognition processing on the voice query input from the microphone 6 to generate a character string query. The character string query generated in the input / output terminal 1 is transmitted to the computer system 5C via the network.

図5に示すデータ検索システムは入出力端末1を備え,入出力端末1の記憶装置に,音声認識プログラム,解析プログラム,および検索プログラムが記憶されている。入出力端末1それ自体がデータ検索システムとして機能する態様である。データ検索の対象となるデータについては,入出力端末1の記憶装置ではなく,ネットワークを通じて接続可能な記憶装置に記憶させてもよい。   The data search system shown in FIG. 5 includes an input / output terminal 1, and a speech recognition program, an analysis program, and a search program are stored in the storage device of the input / output terminal 1. This is a mode in which the input / output terminal 1 itself functions as a data search system. The data to be retrieved may be stored not in the storage device of the input / output terminal 1 but in a storage device that can be connected through a network.

データ検索システムは,上述のように,一または複数のハードウエアによって構成される。図1から図5のそれぞれに示すように,データ検索システムにおいて行われる複数の処理のそれぞれを別々のハードウエアにおいて実行することもできるし,複数の処理のうちのいくつかまたは全部を単一のハードウエアにおいて実行することもできる。   As described above, the data retrieval system is constituted by one or a plurality of hardware. As shown in each of FIGS. 1 to 5, each of a plurality of processes performed in the data retrieval system can be executed on separate hardware, or some or all of the plurality of processes can be performed in a single manner. It can also be executed in hardware.

(2)データ検索システムの具体例
以下,データ検索システムの具体例を説明する。ここでは,図1に示すハードウエア構成を備えるデータ検索システムを例示することにする。
(2) Specific Example of Data Search System Hereinafter, a specific example of the data search system will be described. Here, a data search system having the hardware configuration shown in FIG. 1 will be exemplified.

図6は,入出力端末1として用いられるスマートフォン(携帯電話)10を示している。図7は,データ検索システムのブロック図を,スマートフォン10の電気的構成の詳細とともに示している。   FIG. 6 shows a smartphone (mobile phone) 10 used as the input / output terminal 1. FIG. 7 shows a block diagram of the data search system together with details of the electrical configuration of the smartphone 10.

スマートフォン10は電話(通話)に用いることができるとともに,インストールされるアプリケーション・プログラムに応じて様々な機能を利用者に提供する。スマートフォン10にインストールされるアプリケーション・プログラムの一つにナビゲーション・プログラムがある。図6はナビゲーション・プログラムが実行されているスマートフォン10の表示画面に表示される画面例を示している。   The smartphone 10 can be used for calls (calls) and provides various functions to users according to installed application programs. One of application programs installed on the smartphone 10 is a navigation program. FIG. 6 shows an example of a screen displayed on the display screen of the smartphone 10 on which the navigation program is executed.

ナビゲーション・プログラムは,スマートフォン10の利用者に対して現在地を示し,かつ目的地まで進むべき道案内をするプログラムである。現在地(緯度および経度)はたとえばGPS(グローバル・ポジショニング・システム)を利用して決定される。   The navigation program is a program for showing the current location to the user of the smartphone 10 and guiding the route to the destination. The current location (latitude and longitude) is determined using, for example, GPS (Global Positioning System).

ナビゲーション・プログラムが起動されると,スマートフォン10の表示画面に道路地図が表示されるとともに,GPSによって決定される現在地が道路地図に重ね合わされて示される。道路地図を表すデータはネットワークを介してスマートフォン10にダウンロードされる。目的地までの道案内は,道路地図に含まれる道路表示上に道順を示す記号を重ね合わせることで示される。   When the navigation program is activated, a road map is displayed on the display screen of the smartphone 10, and the current location determined by the GPS is superimposed on the road map. Data representing the road map is downloaded to the smartphone 10 via the network. The route guidance to the destination is indicated by superimposing a symbol indicating the route on the road display included in the road map.

図7を参照して,スマートフォン10はCPU11を備え,CPU11によってスマートフォン10の動作が全体的に統括される。CPU11には,道路地図データ,音声案内データ等を一時的に記憶するメモリ12,ナビゲーション・プログラム,オペレーティング・システム(OS)プログラム,その他のプログラムおよびデータを記憶したハードディスク(HD)13,音声通信およびネットワーク(インターネットなど)を通じたデータ通信のための通信装置14,音声を入力するためのマイクロフォン15,道路地図等を表示するための表示装置16,音声を出力するためのスピーカ18,上述したGPSを利用するためのGPS装置19などを備えている。表示装置16の表示画面にはタッチパネル17が形成され,タッチパネル17をタッチすることで目的地などを入力することができる。   With reference to FIG. 7, the smartphone 10 includes a CPU 11, and the operation of the smartphone 10 is totally controlled by the CPU 11. The CPU 11 includes a memory 12 for temporarily storing road map data, voice guidance data, etc., a navigation program, an operating system (OS) program, a hard disk (HD) 13 for storing other programs and data, voice communication and A communication device 14 for data communication through a network (such as the Internet), a microphone 15 for inputting sound, a display device 16 for displaying a road map, a speaker 18 for outputting sound, and the GPS described above A GPS device 19 for use is provided. A touch panel 17 is formed on the display screen of the display device 16, and a destination can be input by touching the touch panel 17.

上述したように,ナビゲーション・プログラムは現在地から目的地までの道案内を行うことを基本機能として備え,このためには目的地をスマートフォン10に入力しなければならない。目的地が分かっている場合には,その住所,電話番号,施設名称,道路地図における目的地の指定(画面タッチ)などによって目的地をスマートフォン10に入力することができる。しかしながら,特に周辺地理に不案内な場合には,目的地の入力に時間が掛かるまたは手間取ることがある。   As described above, the navigation program has a basic function of guiding the route from the current location to the destination. For this purpose, the destination must be input to the smartphone 10. If the destination is known, the destination can be input to the smartphone 10 by its address, telephone number, facility name, designation of the destination on the road map (screen touch), and the like. However, especially when it is unfamiliar with the surrounding geography, it may take time or trouble to enter the destination.

以下に説明するように,データ検索システムを利用することで,目的地それ自体をスマートフォン10に入力しなくても,ネットワークを介して接続される施設情報データベース22(詳細は後述する)に格納されている複数の施設情報データの中から,一または複数の施設をスマートフォン10の利用者に紹介することができる。以下に説明するように,クエリが音声によって入力され,そのクエリに合致した(クエリに沿う)施設が紹介される。   As will be described below, by using the data search system, it is stored in the facility information database 22 (details will be described later) connected via the network without inputting the destination itself into the smartphone 10. One or a plurality of facilities can be introduced to the user of the smartphone 10 from the plurality of facility information data. As explained below, a query is entered by voice, and facilities that match the query (along the query) are introduced.

入力されるクエリには,以下に説明するように,「目的語」および「述語」が含まれていることが要求される(目的語および述語が検索キーワードとして用いることが必須とされる)。主語は必要とされない。これはスマートフォン10の場合,その主体はスマートフォン10の利用者であり,クエリの主語はその利用者であることがあらかじめ決まっているからである。またそのクエリの時期(いつ)についても必要とされない。クエリが入力されたときがその時期であるからである。もっとも,言語によってはクエリに主語が含まれることもあるが,主語を表す単語はデータ検索システムでは用いられない。   The input query is required to include “object” and “predicate” as described below (the object and predicate are required to be used as search keywords). No subject is required. This is because in the case of the smartphone 10, the subject is the user of the smartphone 10, and it is determined in advance that the subject of the query is the user. Nor is it required for the time of the query (when). This is because the time when the query is input is the time. Of course, the subject may be included in the query depending on the language, but the word representing the subject is not used in the data retrieval system.

上述したように,データ検索システムは,スマートフォン10のみならず,音声認識装置2,解析装置3および検索装置4を備えている。解析装置3は辞書データベース21を備え,検索装置4は施設情報データベース22を備えている。   As described above, the data search system includes not only the smartphone 10 but also the voice recognition device 2, the analysis device 3, and the search device 4. The analysis device 3 includes a dictionary database 21, and the search device 4 includes a facility information database 22.

図8から図10はクエリが受け付けられて検索処理が行われるまでの間に,スマートフォン10,音声認識装置2,解析装置3および検索装置4において行われる処理を示すフローチャートである。フローチャートの各処理に対応づけて,各処理を実行するハードウエアを示す。   FIG. 8 to FIG. 10 are flowcharts showing processing performed in the smartphone 10, the speech recognition device 2, the analysis device 3, and the search device 4 from when a query is received until search processing is performed. The hardware for executing each process is shown in association with each process in the flowchart.

はじめにスマートフォン10にクエリが受け付けられる(ステップ31)。スマートフォン10が備えるマイクロフォン15に向けて声(言葉)を発することによってクエリは受け付けられる。   First, a query is received by the smartphone 10 (step 31). The query is accepted by uttering a voice (word) toward the microphone 15 included in the smartphone 10.

音声クエリ(音声データ)はスマートフォン10からネットワークを介して音声認識装置2に送信され,音声認識装置2において文字列データに変換される(音声認識処理,ステップ32)。   The voice query (voice data) is transmitted from the smartphone 10 to the voice recognition device 2 via the network, and converted into character string data in the voice recognition device 2 (voice recognition processing, step 32).

文字列データが,音声認識装置2から解析装置3に与えられる。解析装置3は文字列データに対して形態素解析処理を行う(ステップ33)。形態素解析処理において,文字列データは単語(形態素)に分割され,かつ各単語の品詞(名詞,動詞,形容詞,形容動詞,助詞,冠詞など)が判別される。各単語には判別された品詞が割り当てられる(対応付けられる)。   Character string data is given from the speech recognition device 2 to the analysis device 3. The analysis device 3 performs a morphological analysis process on the character string data (step 33). In the morphological analysis process, the character string data is divided into words (morphemes), and the part of speech (noun, verb, adjective, adjective verb, particle, article, etc.) of each word is determined. Each word is assigned (associated) with the determined part of speech.

形態素解析処理において分割されかつ品詞が判別された単語のうち,名詞と,動詞と,形容詞と,形容動詞のいずれかの品詞を持つ単語が選択(抽出)される(ステップ34)。助詞,冠詞,前置詞などその他の品詞の単語は以下の処理では用いられない。たとえばクエリが「パスタのおいしい店に行きたい」であれば,「パスタ」(名詞),「の」(助詞),「おいしい」(形容詞),「店」(名詞),「に」(助詞),「行く」(動詞),「たい」(助動詞)に分割される。「パスタ」(名詞),「おいしい」(形容詞),「店」(名詞)および「行く」(動詞)の4つの単語が以下の処理に用いられ,「の」,「に」および「たい」は以下の処理では用いられない(無視されるまたは破棄される)。   Of the words that have been divided in the morphological analysis process and whose part of speech has been identified, words having part of speech of noun, verb, adjective, and adjective verb are selected (extracted) (step 34). Other part-of-speech words such as particles, articles, and prepositions are not used in the following processing. For example, if the query is “I want to go to a delicious pasta restaurant”, “pasta” (noun), “no” (particle), “delicious” (adjective), “store” (noun), “ni” (particle) , “Go” (verb), “tai” (auxiliary verb). The four words "pasta" (noun), "delicious" (adjective), "store" (noun), and "go" (verb) are used for the following processing: "no", "ni", and "tai" Is not used in the following process (ignored or discarded).

クエリが英語の場合,たとえばクエリが「I want to go to a delicious shop of pasta.」であれば,「go」(動詞),「delicious」(形容詞),「shop」(名詞)および「pasta」(名詞)の4つの単語が以下の処理に用いられる。 主語を表す「I」,定冠詞の「a」,前置詞の「of」は以下の処理では用いられない。クエリ自体が要望を表すことが分かっているので,「want」についても基本的には以下の処理では用いられない。また,英語の場合には「to」も基本的には以下の処理では用いられない。   If the query is in English, for example, if the query is “I want to go to a delicious shop of pasta.”, “Go” (verb), “delicious” (adjective), “shop” (noun), and “pasta” The four words (noun) are used for the following processing. The subject “I”, the definite article “a”, and the preposition “of” are not used in the following processing. Since it is known that the query itself represents a request, “want” is basically not used in the following processing. In English, “to” is basically not used in the following processing.

次に,抽出された単語のそれぞれについて,その単語が,解析装置3が備える辞書データベース21に記憶されている単語であるかどうかが判断される(ステップ35)。辞書データベース21に記憶されていない単語である場合,上述の音声認識で誤認識が生じた可能性がある。たとえば,利用者は「パスタが食べたい」と発話したにもかかわらず,「パサタが食べたい」として音声認識された場合である。「パサタ」が辞書データベース21に記憶されていない単語の場合,誤認識修正処理に進む(ステップ35でN0)。   Next, for each of the extracted words, it is determined whether the word is a word stored in the dictionary database 21 provided in the analysis device 3 (step 35). If the word is not stored in the dictionary database 21, there is a possibility that erroneous recognition has occurred in the speech recognition described above. For example, the user has spoken as “I want to eat pasta”, but has been voice-recognized as “I want to eat pasta”. If “Pasata” is a word that is not stored in the dictionary database 21, the process proceeds to a false recognition correction process (N0 in step 35).

辞書データベース21に記憶されていない単語が入力されたときに,その単語に類似する単語(修正候補)が,解析装置3からスマートフォン10に送信され,一覧に表示装置16の表示画面に表示される(ステップ36)。一覧に表示された修正候補の中から正しい単語が,たとえば表示画面をタップすることで選択される(ステップ37)。選択された正しい単語はスマートフォン10から解析装置3に送信され,これにより「パサタ」が「パスタ」に修正される。上述の場合,「パサタが食べたい」ではなく,「パスタが食べたい」がクエリとして受け付けられたものとして扱われる。この処理には,たとえば,本件出願人による特願2014−240350号に記載の誤認識修正処理を利用することができる。   When a word not stored in the dictionary database 21 is input, a word (correction candidate) similar to the word is transmitted from the analysis device 3 to the smartphone 10 and displayed on the display screen of the display device 16 in a list. (Step 36). A correct word is selected from the correction candidates displayed in the list by, for example, tapping the display screen (step 37). The selected correct word is transmitted from the smartphone 10 to the analysis device 3, whereby “Pasata” is corrected to “Pasta”. In the above case, “I want to eat pasta” is treated as a query accepted instead of “I want to eat pasata”. For this process, for example, a misrecognition correction process described in Japanese Patent Application No. 2014-240350 by the applicant can be used.

クエリに含まれる単語(誤認識修正処理で修正された単語を含む)が,一つであるか複数であるかによって次の処理が分岐する(ステップ38)。   The next process branches depending on whether the query includes one or more words (including words corrected by the misrecognition correction process) (step 38).

はじめにクエリに一つの単語(名詞,動詞,形容詞または形容動詞のいずれかの品詞を持つ単語)だけが含まれている場合を説明する(図9)。たとえば「パスタ」,「水族館」,「食事」または「食べたい」などが,クエリとして受け付けられた場合である。   First, a case where only one word (a word having a part of speech of noun, verb, adjective or adjective verb) is included in the query will be described (FIG. 9). For example, “pasta”, “aquarium”, “meal” or “want to eat” are accepted as queries.

クエリに含まれる一つの単語が名詞であるかどうかが判断される(ステップ41)。なお,名詞であるか,それ以外(動詞,形容詞,形容動詞)であるかは形態素解析処理(ステップ33)において既に判別された品詞が用いられる。   It is determined whether one word included in the query is a noun (step 41). The part of speech that has already been determined in the morphological analysis process (step 33) is used to determine whether it is a noun or other (verb, adjective, adjective verb).

クエリとして受け付けられた単語が名詞である場合(ステップ41でYES )(たとえば,「パスタ」),その単語は「目的語」として位置づけられる。検索処理における検索キーワードとして必要とされる上述した「目的語」と「述語」のうち,「目的語」が充足されたことになり,「述語」が欠けている状態である。   If the word accepted as a query is a noun (YES in step 41) (eg, “pasta”), the word is positioned as the “object”. Of the above-mentioned “object” and “predicate” required as search keywords in the search process, “object” is satisfied, and “predicate” is missing.

述語が尋ねられる(ステップ42)。クエリに含まれる名詞「パスタ」を用いて,たとえば「パスタをどうしますか?」と言った問い合わせ(質問を表す音声データ)が,解析装置3において作成されてスマートフォン10に送信され,スピーカ18から出力される(逆クエリ)。問い合わせに対する回答,たとえば「食べたい」(述語)が発話され,それがスマートフォン10のマイクロフォン15で受け付けられる(ステップ43)。受け付けられる述語についても,それが辞書データベース21に記憶されているかどうかを判断し,記憶されていない場合には上述した誤認識修正処理(ステップ35,36,37)を行ってもよい。   A predicate is asked (step 42). Using the noun “pasta” included in the query, for example, an inquiry (voice data representing the question) such as “What do you want to do with the pasta?” Is created in the analysis device 3 and transmitted to the smartphone 10 from the speaker 18. Output (reverse query). An answer to the inquiry, for example, “I want to eat” (a predicate) is uttered and accepted by the microphone 15 of the smartphone 10 (step 43). It is also determined whether the accepted predicate is stored in the dictionary database 21, and if not stored, the above-described erroneous recognition correction process (steps 35, 36, 37) may be performed.

以上の処理で「目的語」と「述語」が揃ったので,検索装置4における検索処理に進むことができる(ステップ46)。検索処理の詳細は後述する。   Since the “object” and “predicate” have been prepared by the above processing, the search device 4 can proceed to the search processing (step 46). Details of the search process will be described later.

クエリとして受け付けられた単語が一つであり,かつその単語が名詞でない(動詞,形容動詞または形容動詞である)場合(ステップ41でNO)(たとえば「食べたい」が発話されたときの「食べる」),その単語は述語として位置づけられる。検索処理において必要な「目的語」と「述語」のうち,「述語」が充足され,「目的語」が欠けている状態である。   If a single word is accepted as a query and the word is not a noun (verb, adjective verb or adjective verb) (NO in step 41) (for example, “eat” when “I want to eat” is spoken) "), The word is positioned as a predicate. Of the “object” and “predicate” necessary for the search processing, the “predicate” is satisfied and the “object” is missing.

目的語が尋ねられる(ステップ44)。たとえば,クエリに含まれる述語「食べる」が用いられて,「何を食べるのですか?」と言った問い合わせ(質問を表す音声データ)が,解析装置3において作成されてスマートフォン10に送信され,スピーカ18から出力される(逆クエリ)。問い合わせに対する回答,たとえば「パスタ」(目的語)が発話され,それがスマートフォン10のマイクロフォン15で受け付けられる(ステップ45)。受け付けられる目的語についても,それが辞書データベース21に記憶されているかどうかを判断し,記憶されていない場合には上述した誤認識修正処理を行ってもよい。目的語と述語とが揃うことで検索処理(ステップ46)に進む。目的語を表す単語および述語を表す単語が解析装置3から検索装置4に与えられる。   The object is asked (step 44). For example, the predicate “eating” included in the query is used, and an inquiry (voice data representing the question) that says “What do you eat?” Is created in the analysis device 3 and transmitted to the smartphone 10. Output from the speaker 18 (reverse query). An answer to the inquiry, for example, “pasta” (object) is spoken and accepted by the microphone 15 of the smartphone 10 (step 45). It is also determined whether or not the accepted object is stored in the dictionary database 21, and if it is not stored, the above-described misrecognition correction process may be performed. When the object and the predicate are prepared, the search process (step 46) is performed. A word representing an object and a word representing a predicate are given from the analysis device 3 to the search device 4.

次にクエリに複数の単語が含まれている場合を説明する(図10)。たとえば,「パスタ,店」「パスタを食べたい」,「パスタのおいしい店」,「イルカが見たい」,「おいしい日本食を食べたい」などが,クエリとして受け付けられた場合である。   Next, a case where a query includes a plurality of words will be described (FIG. 10). For example, “pasta, store”, “I want to eat pasta”, “Delicious pasta”, “I want to see dolphins”, “I want to eat delicious Japanese food”, etc. are accepted as queries.

クエリに含まれている複数の単語に2つ以上の名詞のみが含まれているか,名詞と述語とが含まれているかによって処理が分岐する。   The processing branches depending on whether a plurality of words included in the query include only two or more nouns or whether a noun and a predicate are included.

たとえば,「パスタ,店」がスマートフォン10のマイクロフォン15に向けて発せられると,形態素解析処理(ステップ33)によって「パスタ」(名詞)と「店」(名詞)が識別される。複数の名詞のみがクエリに含まれている場合である。はじめに,その複数の名詞のそれぞれが辞書データベース21に記憶されている単語であるかどうかが判断される(ステップ35)。辞書データベース21に記憶されていない場合には上述と同様にしてその単語に類似する単語(修正候補)がスマートフォン10の表示装置16の表示画面に一覧に表示され,その中から正しい単語が選択される(ステップ35でNO,ステップ36,37)。   For example, when “pasta, store” is issued toward the microphone 15 of the smartphone 10, “pasta” (noun) and “store” (noun) are identified by the morphological analysis process (step 33). This is the case when only multiple nouns are included in the query. First, it is determined whether or not each of the plurality of nouns is a word stored in the dictionary database 21 (step 35). If it is not stored in the dictionary database 21, words similar to the word (correction candidates) are displayed in a list on the display screen of the display device 16 of the smartphone 10 as described above, and the correct word is selected from the list. (NO in step 35, steps 36 and 37).

クエリに複数の名詞のみが含まれている場合(ステップ51でYES ),複数の名詞のうち最初に認識された名詞,たとえば「パスタ,店」であれば「パスタ」を用いて述語が尋ねられる(ステップ52)。たとえば「パスタをどうしますか?」という問い合わせが,スマートフォン10のスピーカ18から出力される(逆クエリ)。クエリが「店,パスタ」の順番であれば「店をどうしますか?」という問い合わせがスピーカ18から出力される。「食べたい」,「行きたい」などが発話されることで述語が受け付けられる(ステップ53)。2つの目的語「パスタ」および「店」と,一つの述語(たとえば「食べる」または「行く」)が揃うことで,検索処理(ステップ54)に進む。目的語を表す単語および述語を表す単語が,解析装置3から検索装置4に与えられる。   If the query contains only multiple nouns (YES in step 51), the predicate is asked using the first noun recognized among the multiple nouns, for example "pasta, store" (Step 52). For example, an inquiry “What do you do with pasta?” Is output from the speaker 18 of the smartphone 10 (reverse query). If the query is in the order of “store, pasta”, an inquiry “What do you do with the store?” Is output from the speaker 18. A predicate is accepted by uttering “I want to eat”, “I want to go” or the like (step 53). When two object words “pasta” and “store” and one predicate (for example, “eat” or “go”) are arranged, the process proceeds to the search process (step 54). A word representing the object and a word representing the predicate are given from the analysis device 3 to the search device 4.

クエリが名詞と名詞でない単語(動詞,形容詞,形容動詞)の両方を含む場合(ステップ51でNO),クエリに含まれる名詞が目的語を充足し,名詞でない単語が述語を充足すると扱われる。たとえば上述した「パスタのおいしい店に行きたい」がスマートフォン10のマイクロフォン15に向けて発せられた場合,2つの目的語(「パスタ」,「店」)と2つの述語(「おいしい」,「行く」)が含まれているので,これらの4つの単語を用いた検索処理に進む(ステップ54)。   If the query includes both a noun and a non-noun word (verb, adjective, adjective verb) (NO in step 51), the noun included in the query is treated as satisfying the object and the non-noun word as satisfying the predicate. For example, if the above-mentioned “I want to go to a delicious pasta restaurant” is issued to the microphone 15 of the smartphone 10, two objects (“pasta”, “store”) and two predicates (“delicious”, “go” ”) Is included, the search process using these four words is performed (step 54).

図11は検索装置4において実行される検索処理(ステップ46,ステップ54)の処理結果を表形式にまとめて示すものである。図12は検索装置4が備える施設情報データベース22(図7参照)に記憶されている検索対象データ(施設情報データ)を示している。   FIG. 11 shows the processing results of the search processing (step 46, step 54) executed in the search device 4 in a tabular form. FIG. 12 shows search target data (facility information data) stored in the facility information database 22 (see FIG. 7) included in the search device 4.

分かりやすくするために,施設情報データベース22に記憶されている検索対象の施設情報データは,ここでは施設A〜施設Lの12個の施設に関するデータであるとする。施設情報データは説明文(記事,文章)データを含む。検索装置4における検索処理では,施設A〜施設Lの12個の施設情報データが,上述した目的語と述語とを含む検索キーワードに応じた検索結果として適していると考えられる順番に順位付けされる。得られた順位に応じて,最も高い順位の施設が利用者に紹介される(スピーカ18から施設名が出力される,表示装置16に施設名が表示される)。もちろん,たとえば上位3つの施設を紹介するようにしてもよい。さらに最も高い順位の施設までの道案内を始めるようにしてもよい。   In order to make it easy to understand, it is assumed that the facility information data to be searched stored in the facility information database 22 is data relating to twelve facilities A to L here. The facility information data includes explanatory text (article, text) data. In the search processing in the search device 4, the 12 pieces of facility information data of the facilities A to L are ranked in the order considered to be suitable as a search result corresponding to the search keyword including the above-described object and predicate. The In accordance with the obtained ranking, the facility with the highest ranking is introduced to the user (the facility name is output from the speaker 18 and the facility name is displayed on the display device 16). Of course, for example, the top three facilities may be introduced. In addition, route guidance to the highest ranking facility may be started.

図11を参照して,ここでは,3つの単語(○○○,×××,△△△△)が検索キーワードとして用いられている。これらの検索キーワードが,上述した処理で得られた目的語および述語である。検索キーワードとして用いられる目的語は一つであることもあるし,複数である場合もある。述語についても同様である。上述したように,少なくとも一つの目的語と少なくとも一つの述語とが検索キーワードには必ず含まれる。   Referring to FIG. 11, here, three words (XXX, XXX, .DELTA..DELTA..DELTA.) Are used as search keywords. These search keywords are the object and predicate obtained by the above-described processing. There may be one or more object words used as search keywords. The same applies to predicates. As described above, at least one object and at least one predicate are always included in the search keyword.

3つの検索キーワードのそれぞれについて,検索対象の施設情報データA〜Lのそれぞれを対象にして,出現度,密度および合致度が算出される。   For each of the three search keywords, the appearance degree, density, and degree of match are calculated for each of the facility information data A to L to be searched.

「出現度」は,すべての施設情報データA〜Lにおいて特定の検索キーワードがどの程度の割合で含まれているかを表す値である。出現度は次式によって算出される。   The “appearance degree” is a value that indicates how much a specific search keyword is included in all the facility information data A to L. The degree of appearance is calculated by the following equation.

出現度=特定施設情報データに含まれる特定キーワードの数/すべての施設情報データに含まれる特定キーワードの存在平均値   Appearance level = number of specific keywords included in specific facility information data / average value of specific keywords included in all facility information data

「特定施設情報データに含まれる特定キーワードの数」,たとえば施設情報データAに含まれる特定キーワード「○○○」の数は,施設情報データAに含まれるキーワード「○○○」の数をカウントすることによって得られる。「すべての施設情報データに含まれる特定キーワードの存在平均値」,たとえば施設情報データA〜施設情報データLの12個の施設情報データに含まれる特定キーワード「○○○」の存在平均値は,施設情報データA〜施設情報データLのすべてに含まれる特定キーワード「○○○」の数をカウントし,これをすべての施設情報データの数,ここでは12によって除算することによって得られる。   “Number of specific keywords included in specific facility information data”, for example, the number of specific keywords “XXX” included in facility information data A counts the number of keywords “XXX” included in facility information data A It is obtained by doing. “Existence average value of specific keywords included in all facility information data”, for example, the presence average value of specific keywords “XX” included in 12 facility information data of facility information data A to facility information data L is It is obtained by counting the number of specific keywords “XXX” included in all of the facility information data A to facility information data L and dividing this by the number of all facility information data, here twelve.

「密度」は,施設情報データのそれぞれにおいて,特定の検索キーワードがどの程度集中して存在しているかを表す値である。密度は次式によって算出される。   “Density” is a value representing how concentrated a specific search keyword exists in each piece of facility information data. The density is calculated by the following formula.

密度=特定施設情報データに含まれる特定キーワードの数/特定施設情報データの文字数   Density = number of specific keywords included in specific facility information data / number of characters in specific facility information data

「特定施設情報データに含まれる特定キーワードの数」,たとえば施設情報データAに含まれる特定キーワード「○○○」の数は,施設情報データAに含まれるキーワード「○○○」の数をカウントすることによって得られる。「特定施設情報データの文字数」,たとえば施設情報データAの文字数は,施設情報データAの文字数をカウントすることによって得られる。   “Number of specific keywords included in specific facility information data”, for example, the number of specific keywords “XXX” included in facility information data A counts the number of keywords “XXX” included in facility information data A It is obtained by doing. The “number of characters of the specific facility information data”, for example, the number of characters of the facility information data A is obtained by counting the number of characters of the facility information data A.

特定施設情報データにおける特定キーワードについて,上述した出現度および密度が算出されると,その特定施設情報データにおける特定キーワードについての合致度が,次式によって算出される。   When the above-described appearance degree and density are calculated for the specific keyword in the specific facility information data, the degree of coincidence for the specific keyword in the specific facility information data is calculated by the following equation.

特定施設情報データにおける特定キーワードについての合致度=出現度×密度   Consistency for specific keywords in specific facility information data = appearance level x density

出現度によって,すべての施設情報データの数を基準とする,特定施設情報データ中の特定キーワードについての存在割合が分かる。密度によって,特定施設情報データのそれぞれを基準とする,特定キーワードの集中の程度が分かる。出現度と密度を乗算した結果である合致度は,特定キーワードについて,複数の検索対象の施設情報データの全体に占める割合と,検索対象の施設情報データ自体に占める割合のいずれもが考慮された値となる。   Depending on the degree of appearance, the existence ratio of specific keywords in specific facility information data based on the number of all facility information data is known. The density indicates the degree of concentration of specific keywords based on each specific facility information data. The degree of match, which is the result of multiplying the appearance level and the density, takes into account both the ratio of the specific keyword to the entire number of facility information data to be searched and the ratio to the facility information data itself to be searched. Value.

一の検索キーワードについての合致度が大きい施設情報データであっても,他の検索キーワードについての合致度は低い施設情報データも存在する。図11に示すように,検索処理では,上述の特定施設情報データのそれぞれについて検索キーワードごとに算出される合致度を加算したものが,施設合致度として算出される(c+c+c)。そして施設合致度が大きい順に,検索対象の施設情報データの順位付けが行われる。複数の検索キーワードについて平均的に(バランスよく)合致度が大きい施設情報データに対して高順位が付与される。 Even if the facility information data has a high degree of matching with respect to one search keyword, there is also facility information data with a low degree of matching with respect to other search keywords. As shown in FIG. 11, in the search process, the sum of the matching degrees calculated for each search keyword for each of the above-mentioned specific facility information data is calculated as the facility matching degree (c 1 + c 2 + c 3 ). . Then, the facility information data to be searched is ranked in descending order of the facility matching degree. High ranking is given to facility information data having a large degree of coincidence on average (with good balance) for a plurality of search keywords.

図12を参照して,施設情報データは,施設名,大分類,中分類,小分類,行動分類,分類特徴および特徴に関する説明文データを含む。大分類,中分類および小分類によって施設情報データがおおよそ分類される。「行動分類」はその施設に対してユーザが行う行動を表す述語(一般には動詞)である。「分類特徴」はその施設に関する概略的な説明であり,「特徴」はその施設の詳細な説明である。「行動分類」には,特に,分類特徴および特徴に含まれていない,その施設に対してユーザが行う行動を表す述語を表すデータを含ませておくとよい。施設情報データは施設情報データベース22(図7)にあらかじめ登録される。   Referring to FIG. 12, the facility information data includes facility name, major classification, middle classification, minor classification, action classification, classification feature, and explanatory text data related to the feature. Facility information data is roughly classified by major classification, middle classification, and minor classification. The “behavior classification” is a predicate (generally a verb) that represents the action performed by the user for the facility. “Classification feature” is a general description of the facility, and “Feature” is a detailed description of the facility. In particular, the “behavior classification” may include data representing a classification feature and a predicate that is not included in the feature and represents a behavior performed by the user on the facility. The facility information data is registered in advance in the facility information database 22 (FIG. 7).

たとえば「富士山が見えるところで食事をしたい」というクエリが与えられると,そのクエリから目的語「富士山」,「ところ」および「食事」と,述語「見える」および「したい」とを含む5つの検索キーワードが抽出され,抽出された5つの検索キーワードをバランスよく含む施設情報データが決定されることになる(順位付けされる)。複数の検索キーワードのいずれかを含まない施設情報データであっても順位付けをすることができる。決定された施設情報データ中の施設名が検索装置4からスマートフォン10に送信される。スマートフォン10では,実行されているナビゲーション・プログラムによって,受信された施設名を用いて,たとえば「レストラン○○をお勧めします」といった案内がスピーカ18から出力される。検索装置4から施設名のみならず,その施設の住所(緯度および経度)を表すデータを送信することによって,その施設までの道案内をスマートフォン10の表示装置16の表示画面上に表示することができる。   For example, if a query “I want to eat where Mt. Fuji can be seen” is given, five search keywords including the objects “Mt. Fuji”, “Place” and “Meal”, and the predicates “Visible” and “I want to” from that query. Is extracted, and facility information data including the five extracted search keywords in a balanced manner is determined (ranked). Even facility information data not including any of a plurality of search keywords can be ranked. The determined facility name in the facility information data is transmitted from the search device 4 to the smartphone 10. In the smartphone 10, a guidance such as “I recommend restaurant XX” is output from the speaker 18 by using the received facility name by the navigation program being executed. By transmitting data representing the facility address (latitude and longitude) as well as the facility name from the search device 4, the route guidance to the facility can be displayed on the display screen of the display device 16 of the smartphone 10. it can.

絞り込み処理を事前に行って,絞り込み処理によって絞り込まれた施設情報データについて上述した施設合致度を算出するようにしてもよい。たとえば,現在地から所定距離(たとえば2km範囲)内にある施設情報データをあらかじめ施設情報データベース22から抽出し,抽出された施設情報データについて,上述した施設合致度に基づく順位を算出することもできる。   The facility matching degree described above may be calculated for the facility information data narrowed down by the narrowing-down process in advance. For example, facility information data within a predetermined distance (for example, 2 km range) from the current location can be extracted from the facility information database 22 in advance, and the rank based on the above-mentioned facility matching degree can be calculated for the extracted facility information data.

上述した実施例では,道案内を行うナビゲーション・プログラムを例にして検索処理を説明したが,たとえば一つの店舗内における売り場検索等においても,上述したデータ検索処理を利用することができる。   In the above-described embodiment, the search process has been described by taking a navigation program for performing route guidance as an example. However, the above-described data search process can also be used in, for example, sales floor search in one store.

1,1A,1B 入出力端末
6,15 マイクロフォン(音声入力手段)
7,18 スピーカ(出力手段)
2 音声認識装置(音声認識手段)
3 解析装置(単語充足判定手段,単語充足要求手段,形態素解析手段,割り当て手段)
4 検索装置(検索手段)
5A,5B,5C コンピュータ・システム(データ検索装置,データ検索システム)
10 スマートフォン(入力手段,出力手段)
11 CPU
12 メモリ
13 ハードディスク
14 通信装置
16 表示装置(出力手段)
17 タッチパネル
22 施設情報データベース
1,1A, 1B I / O terminal 6,15 Microphone (voice input means)
7, 18 Speaker (output means)
2 Voice recognition device (voice recognition means)
3. Analysis device (word satisfaction determination means, word satisfaction request means, morpheme analysis means, allocation means)
4. Search device (search means)
5A, 5B, 5C Computer system (data search device, data search system)
10 Smartphone (input means, output means)
11 CPU
12 memory
13 Hard disk
14 Communication equipment
16 Display device (output means)
17 Touch panel
22 Facility information database

Claims (16)

与えられるクエリを表す文字列データに目的語および述語のそれぞれに相当する少なくとも2つの単語が含まれているかどうかを判定する単語充足判定手段,ならびに
目的語に相当する単語または述語に相当する単語が上記文字列データに含まれていないと判定された場合に,含まれていない目的語に相当する単語または述語に相当する単語の入力を要求する単語充足要求手段を備えている,
解析装置。
Word satisfaction determination means for determining whether or not at least two words corresponding to the object and the predicate are included in the character string data representing the given query, and a word corresponding to the object or a word corresponding to the predicate A word satisfaction request means for requesting input of a word corresponding to an object not included or a word corresponding to a predicate when it is determined not to be included in the character string data;
Analysis device.
与えられるクエリを表す文字列データを形態素解析処理し,文字列データに含まれる一または複数の単語と各単語の品詞を判別する形態素解析手段,ならびに
上記形態素解析手段によって名詞と判別された単語を上記目的語に相当する単語に割り当て,かつ動詞,形容詞および形容動詞のいずれかと判別された単語を上記述語に相当する単語に割り当てる割り当て手段をさらに備えている,
請求項1に記載の解析装置。
Character string data representing a given query is subjected to morphological analysis processing, and morpheme analysis means for determining one or more words included in the character string data and the part of speech of each word; Assignment means for assigning to a word corresponding to the object and assigning a word determined to be a verb, an adjective or an adjective verb to a word corresponding to the above descriptive word;
The analysis device according to claim 1.
単語充足判定手段および単語充足要求手段を備える解析装置の制御方法であって,
単語充足判定手段によって,与えられるクエリを表す文字列データに目的語および述語のそれぞれに相当する少なくとも2つの単語が含まれているかどうかを判定し,
単語充足要求手段によって,目的語に相当する単語または述語に相当する単語が上記文字列データに含まれていないと判定された場合に,含まれていない目的語に相当する単語または述語に相当する単語の入力を要求する,
解析装置の制御方法。
A control method for an analysis apparatus comprising a word satisfaction determination means and a word satisfaction request means,
The word satisfaction determination means determines whether the character string data representing the given query contains at least two words corresponding to the object and the predicate,
Corresponding to a word or predicate corresponding to an object not included when the word satisfaction request means determines that a word corresponding to the object or a word corresponding to a predicate is not included in the character string data Require input of words,
Control method of analysis device.
与えられるクエリを表す文字列データに目的語および述語のそれぞれに相当する少なくとも2つの単語が含まれているかどうかを判定する単語充足判定処理,ならびに
目的語に相当する単語または述語に相当する単語が上記文字列データに含まれていないと判定された場合に,含まれていない目的語に相当する単語または述語に相当する単語の入力を要求する単語充足要求処理,
をコンピュータに実行させる解析プログラム。
A word satisfaction determination process for determining whether or not at least two words corresponding to the object and the predicate are included in the character string data representing the given query, and a word corresponding to the object or a word corresponding to the predicate A word satisfaction request process for requesting input of a word corresponding to an object not included or a word corresponding to a predicate when it is determined not to be included in the character string data;
Analysis program that causes a computer to execute.
与えられるクエリを表す文字列データに目的語および述語のそれぞれに相当する少なくとも2つの単語が含まれているかどうかを判定する単語充足判定装置,ならびに
目的語に相当する単語または述語に相当する単語が上記文字列データに含まれていないと判定された場合に,含まれていない目的語に相当する単語または述語に相当する単語の入力を要求する単語充足要求装置を備えている,
解析システム。
A word satisfaction determination device for determining whether or not character string data representing a given query includes at least two words corresponding to the object and the predicate, and a word corresponding to the object or a word corresponding to the predicate A word satisfaction requesting device for requesting input of a word corresponding to an object not included or a word corresponding to a predicate when it is determined not to be included in the character string data;
Analysis system.
クエリを表す文字列データの入力を受け付けるクエリ入力手段,
目的語および述語のそれぞれに相当する少なくとも2つの単語が上記文字列データに含まれているかどうかを判定する単語充足判定手段,
目的語および述語に相当する少なくとも2つの単語が上記文字列データに含まれていると判定された場合に,その目的語に相当する単語および述語に相当する単語を検索キーワードとして用いてデータ検索する検索手段,ならびに
目的語に相当する単語または述語に相当する単語が上記文字列データに含まれていないと判定された場合に,含まれていない目的語に相当する単語または述語に相当する単語の入力を要求する単語充足要求手段を備えている,
データ検索装置。
Query input means that accepts input of character string data representing a query,
Word satisfaction determination means for determining whether or not at least two words corresponding to each of an object and a predicate are included in the character string data;
When it is determined that at least two words corresponding to the object and predicate are included in the character string data, data search is performed using the word corresponding to the object and the word corresponding to the predicate as search keywords. When it is determined that the character string data does not include the word corresponding to the search means and the word or predicate corresponding to the object, the word corresponding to the word or predicate corresponding to the object not included A word satisfaction requesting means for requesting input,
Data retrieval device.
上記クエリ入力手段によって入力されたクエリを表す文字列データを形態素解析処理し,文字列データに含まれる一または複数の単語と各単語の品詞を判別する形態素解析手段,ならびに
上記形態素解析手段によって名詞と判別された単語を上記目的語に相当する単語に割り当て,かつ動詞,形容詞および形容動詞のいずれかと判別された単語を上記述語に相当する単語に割り当てる割り当て手段をさらに備えている,
請求項6に記載のデータ検索装置。
Character string data representing the query input by the query input means is subjected to morphological analysis processing, and morpheme analysis means for discriminating one or more words contained in the character string data and the part of speech of each word; Assignment means for assigning a word determined to be a word corresponding to the object and assigning a word determined to be a verb, an adjective, or an adjective verb to a word corresponding to the above descriptive word,
The data search device according to claim 6.
音声によって上記クエリの入力を受け付ける音声入力手段,および
音声データを文字列データに変換する音声認識手段をさらに備えている,
請求項6に記載のデータ検索装置。
Voice input means for receiving the query input by voice; and voice recognition means for converting voice data into character string data.
The data search device according to claim 6.
複数の施設のそれぞれについての複数の説明文データが記憶された記憶装置を備え,
上記検索手段は,上記記憶装置に記憶されている複数の説明文データの中から,上記目的語に相当する単語および上記述語に相当する単語を検索キーワードとして用いて一または複数の説明文データを検索するものである,
請求項6から8のいずれか一項に記載のデータ検索装置。
A storage device storing a plurality of explanatory data for each of a plurality of facilities;
The search means uses the word corresponding to the target word and the word corresponding to the upper description word as search keywords from among the plurality of description text data stored in the storage device as one or more description text data. Is to search,
The data search device according to any one of claims 6 to 8.
検索によって見つかった説明文データに対応する施設情報を上記クエリに対する検索結果として出力する出力手段を備えている,
請求項9に記載のデータ検索装置。
An output means for outputting facility information corresponding to the explanatory text data found by the search as a search result for the query;
The data search device according to claim 9.
上記検索手段は,
複数の説明文データのそれぞれを処理対象にして,上記目的語に相当する単語および上記述語に相当する単語を含む複数の検索キーワードのそれぞれについて,すべての処理対象の説明文データの数を基準とした,説明文データ中の検索キーワードの存在割合を表す出現度を算出する出現度算出手段,
複数の説明文データのそれぞれを処理対象にして,上記複数の検索キーワードのそれぞれについて,説明文データ中における検索キーワードの集中の程度を表す密度を算出する密度算出手段,ならびに
複数の説明文データのそれぞれにおいて,複数の検索キーワードのそれぞれについて算出された出現度と密度を乗算し,乗算によって得られた値を説明文データごとに加算することによって説明文データの複数の検索キーワードに対する合致度を算出する合致度算出手段を備え,
上記合致度算出手段によって算出された合致度の大きさが上記クエリに対する検索結果に用いられる,
請求項9に記載のデータ検索装置。
The search means is
Using each of a plurality of explanatory text data as a processing target, for each of a plurality of search keywords including a word corresponding to the object word and a word corresponding to the above description word, the number of explanatory text data of all processing targets is used as a reference. A degree-of-appearance calculating means for calculating a degree of appearance representing the presence ratio of the search keyword in the explanatory text data;
Density calculation means for calculating the density indicating the degree of concentration of the search keyword in the description text data for each of the plurality of search keywords, and a plurality of description text data In each case, the degree of coincidence of the explanation text data for the plurality of search keywords is calculated by multiplying the appearance degree and density calculated for each of the search keywords and adding the value obtained by the multiplication for each explanation text data. A matching degree calculation means for
The degree of match calculated by the match level calculation means is used in the search result for the query.
The data search device according to claim 9.
上記記憶装置に記憶される複数の施設についての説明文データは,施設に対する人の行動を表す述語データを含む,
請求項9に記載のデータ検索装置。
The descriptive text data for the plurality of facilities stored in the storage device includes predicate data representing human behavior with respect to the facilities.
The data search device according to claim 9.
クエリ入力手段,単語充足判定手段,検索手段および単語充足要求手段を備えるデータ検索装置を制御する方法であって,
上記クエリ入力手段によってクエリを表す文字列データの入力を受け付け,
上記単語充足判定手段によって目的語および述語のそれぞれに相当する少なくとも2つの単語が上記文字列データに含まれているかどうかを判定し,
目的語および述語に相当する少なくとも2つの単語が上記文字列データに含まれていると判定された場合に,上記検索手段によってその目的語に相当する単語および述語に相当する単語を検索キーワードとして用いてデータ検索し,
目的語に相当する単語または述語に相当する単語が上記文字列データに含まれていないと判定された場合に,上記単語充足要求手段によって含まれていない目的語に相当する単語または述語に相当する単語の入力を要求する,
データ検索装置の制御方法。
A method for controlling a data search apparatus comprising query input means, word satisfaction determination means, search means and word satisfaction request means,
Accepts input of character string data representing a query by the query input means,
Determining whether or not at least two words corresponding to the object and the predicate are included in the character string data by the word satisfaction determination means;
When it is determined that at least two words corresponding to the object and the predicate are included in the character string data, the word corresponding to the object and the word corresponding to the predicate are used as search keywords by the search means. Search for data,
When it is determined that a word corresponding to an object or a word corresponding to a predicate is not included in the character string data, it corresponds to a word or a predicate corresponding to an object not included by the word satisfaction request means Require input of words,
Control method of data retrieval apparatus.
与えられるクエリを表す文字列データに目的語および述語のそれぞれに相当する少なくとも2つの単語が含まれているかどうかを判定する単語充足判定処理,
目的語および述語に相当する少なくとも2つの単語が上記文字列データに含まれていると判定した場合に,その目的語に相当する単語および述語に相当する単語を検索キーワードとして用いてデータ検索するデータ検索処理,ならびに
目的語に相当する単語または述語に相当する単語が上記文字列データに含まれていないと判定した場合に,含まれていない目的語に相当する単語または述語に相当する単語の入力を要求する単語充足要求処理,
をコンピュータに実行させるプログラム。
Word satisfaction determination processing for determining whether character string data representing a given query includes at least two words corresponding to the object and the predicate,
Data for data retrieval using the word corresponding to the object and the word corresponding to the predicate as the search keyword when it is determined that at least two words corresponding to the object and the predicate are included in the character string data Search processing and input of a word corresponding to an object not included or a word corresponding to a predicate when it is determined that a word corresponding to an object or a word corresponding to a predicate is not included in the character string data Word satisfaction request processing that requires
A program that causes a computer to execute.
クエリを表す文字列データの入力を受け付けるクエリ入力装置,
受け付けられるクエリに目的語および述語のそれぞれに相当する少なくとも2つの単語が含まれているかどうかを判定する単語充足判定装置,
受け付けられるクエリに目的語および述語に相当する少なくとも2つの単語が含まれていると判定された場合に,その目的語に相当する単語および述語に相当する単語を検索キーワードとして用いてデータ検索する検索装置,ならびに
受け付けられるクエリに目的語に相当する単語または述語に相当する単語が含まれていないと判定された場合に,含まれていない目的語に相当する単語または述語に相当する単語の入力を要求する単語充足要求装置を備えている,
データ検索システム。
Query input device that accepts input of character string data representing a query,
A word satisfaction determination device for determining whether or not at least two words corresponding to an object and a predicate are included in an accepted query,
A search that searches for data using the word corresponding to the object and the word corresponding to the predicate as the search keyword when it is determined that the accepted query includes at least two words corresponding to the object and the predicate. When it is determined that the device and the accepted query do not contain the word corresponding to the object or the word corresponding to the predicate, the input of the word corresponding to the object or the predicate not included is input. Equipped with requesting word satisfaction request device,
Data retrieval system.
請求項4または14に記載のプログラムを記録した,コンピュータ読み取り可能な記録媒体。   The computer-readable recording medium which recorded the program of Claim 4 or 14.
JP2015183883A 2015-09-17 2015-09-17 Analysis device and data retrieval device, as well as control method of analysis device and data retrieval device Pending JP2017059014A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015183883A JP2017059014A (en) 2015-09-17 2015-09-17 Analysis device and data retrieval device, as well as control method of analysis device and data retrieval device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015183883A JP2017059014A (en) 2015-09-17 2015-09-17 Analysis device and data retrieval device, as well as control method of analysis device and data retrieval device

Publications (1)

Publication Number Publication Date
JP2017059014A true JP2017059014A (en) 2017-03-23

Family

ID=58390360

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015183883A Pending JP2017059014A (en) 2015-09-17 2015-09-17 Analysis device and data retrieval device, as well as control method of analysis device and data retrieval device

Country Status (1)

Country Link
JP (1) JP2017059014A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019003319A (en) * 2017-06-13 2019-01-10 株式会社野村総合研究所 Interactive business support system and interactive business support program
JP2019105904A (en) * 2017-12-11 2019-06-27 トヨタ自動車株式会社 Service providing apparatus, service providing program and method for providing service by speech recognition
JPWO2019102527A1 (en) * 2017-11-21 2020-10-08 株式会社ぐるなび Server control methods, servers, and server control programs

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003108584A (en) * 2001-09-28 2003-04-11 Casio Comput Co Ltd Information retrieving system and program
JP2008287324A (en) * 2007-05-15 2008-11-27 Just Syst Corp Retrieval method, retrieval program, and retrieval device
JP2010055375A (en) * 2008-08-28 2010-03-11 Toshiba Corp Electronic apparatus operation instruction device and operating method thereof
JP2010231344A (en) * 2009-03-26 2010-10-14 Ntt Docomo Inc Device for preparing reference data for retrieval, information retrieval device, method of preparing reference data for retrieval and information retrieval method
JP2011076348A (en) * 2009-09-30 2011-04-14 Rakuten Inc Accommodation introducing system
JP2013029909A (en) * 2011-07-27 2013-02-07 Jvc Kenwood Corp Information browsing method, information browsing system, server device and client device
CN104239481A (en) * 2014-09-04 2014-12-24 百度在线网络技术(北京)有限公司 Search method, system and network robot
JP2015087796A (en) * 2013-10-28 2015-05-07 株式会社Nttドコモ Questioning field determination device and questioning field determination method

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003108584A (en) * 2001-09-28 2003-04-11 Casio Comput Co Ltd Information retrieving system and program
JP2008287324A (en) * 2007-05-15 2008-11-27 Just Syst Corp Retrieval method, retrieval program, and retrieval device
JP2010055375A (en) * 2008-08-28 2010-03-11 Toshiba Corp Electronic apparatus operation instruction device and operating method thereof
JP2010231344A (en) * 2009-03-26 2010-10-14 Ntt Docomo Inc Device for preparing reference data for retrieval, information retrieval device, method of preparing reference data for retrieval and information retrieval method
JP2011076348A (en) * 2009-09-30 2011-04-14 Rakuten Inc Accommodation introducing system
JP2013029909A (en) * 2011-07-27 2013-02-07 Jvc Kenwood Corp Information browsing method, information browsing system, server device and client device
JP2015087796A (en) * 2013-10-28 2015-05-07 株式会社Nttドコモ Questioning field determination device and questioning field determination method
CN104239481A (en) * 2014-09-04 2014-12-24 百度在线网络技术(北京)有限公司 Search method, system and network robot

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019003319A (en) * 2017-06-13 2019-01-10 株式会社野村総合研究所 Interactive business support system and interactive business support program
JP6998680B2 (en) 2017-06-13 2022-01-18 株式会社野村総合研究所 Interactive business support system and interactive business support program
JPWO2019102527A1 (en) * 2017-11-21 2020-10-08 株式会社ぐるなび Server control methods, servers, and server control programs
JP7103221B2 (en) 2017-11-21 2022-07-20 株式会社ぐるなび Server control methods, servers, and server control programs
JP2019105904A (en) * 2017-12-11 2019-06-27 トヨタ自動車株式会社 Service providing apparatus, service providing program and method for providing service by speech recognition
JP7004955B2 (en) 2017-12-11 2022-01-21 トヨタ自動車株式会社 How to provide services by service providing equipment, service providing programs and voice recognition

Similar Documents

Publication Publication Date Title
US11494427B2 (en) Generating a personal database entry for a user based on natural language user interface input of the user and generating output based on the entry in response to further natural language user interface input of the user
CN111104496B (en) Retrieving context from previous sessions
JP2018077858A (en) System and method for conversation-based information search
US9484034B2 (en) Voice conversation support apparatus, voice conversation support method, and computer readable medium
US9230543B2 (en) Method and apparatus for providing contents about conversation
JP6983118B2 (en) Dialogue system control methods, dialogue systems and programs
JP2015511746A5 (en)
JP2017068845A (en) Computer implementation method for selecting language for information source of information source, computer system, and computer program product
JP2009217585A (en) Information-retrieving device, information-retrieving system, and information-retrieving method
CN105874531B (en) Terminal device, server device, and computer-readable recording medium
JP6073881B2 (en) Function execution instruction system, function execution instruction method, and function execution instruction program
CN105488096B (en) Dynamic summary generator
EP3647968A1 (en) System and method for performing an intelligent cross-domain search
JP2020516980A (en) Contextual deep bookmarking
JPWO2016178337A1 (en) Information processing apparatus, information processing method, and computer program
JP2008234427A (en) Device, method, and program for supporting interaction between user
JP2017059014A (en) Analysis device and data retrieval device, as well as control method of analysis device and data retrieval device
JP5341548B2 (en) Voice recognition device
JP2011123530A (en) Device and method for recommending subject, and program
CN111143659A (en) System and method for performing intelligent cross-domain search
JP6549441B2 (en) INPUT SUPPORT DEVICE, PROGRAM, AND INPUT SUPPORT METHOD
CN114036373B (en) Searching method and device, electronic equipment and storage medium
US11281736B1 (en) Search query mapping disambiguation based on user behavior
JP2022024615A (en) Information output system
CN113903335A (en) User intention identification method, user intention identification device and storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180905

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190821

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191001

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200324