JP2017161815A - Response system and response program - Google Patents

Response system and response program Download PDF

Info

Publication number
JP2017161815A
JP2017161815A JP2016048016A JP2016048016A JP2017161815A JP 2017161815 A JP2017161815 A JP 2017161815A JP 2016048016 A JP2016048016 A JP 2016048016A JP 2016048016 A JP2016048016 A JP 2016048016A JP 2017161815 A JP2017161815 A JP 2017161815A
Authority
JP
Japan
Prior art keywords
response
external
local
database
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016048016A
Other languages
Japanese (ja)
Inventor
順也 高橋
Junya Takahashi
順也 高橋
泰 上澤
Yasushi Kamisawa
泰 上澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aisin AW Co Ltd
Original Assignee
Aisin AW Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aisin AW Co Ltd filed Critical Aisin AW Co Ltd
Priority to JP2016048016A priority Critical patent/JP2017161815A/en
Publication of JP2017161815A publication Critical patent/JP2017161815A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a technique capable of effectively using both of locally obtained information and externally obtained information.SOLUTION: A response system includes: an input receiving part for receiving an input of a user; a local response generating part for generating a local response which is a response to the input, on the basis of a local database recorded in a local storage medium; a local response outputting part for outputting the local response; an external response obtaining part for obtaining an external response, which is a response to the input, generated based on an external database recorded in an external storage medium; a difference outputting part for extracting a difference between the external response and the local response, adding the difference to an output of the local response, and outputting it.SELECTED DRAWING: Figure 1

Description

本発明は、応答システムおよび応答プログラムに関する。   The present invention relates to a response system and a response program.

従来、利用者が入力した音声を認識し、入力された音声に対して回答を行う音声対話システムが知られている。例えば、特許文献1においては、端末とサーバによって音声認識を行い、端末側認識結果に基づいて第1応答文を生成して音声出力部から出力し、サーバ側認識結果に基づいて第2応答文を生成して音声出力部から出力する構成が開示されている。また、第1応答文と第2応答文とが異なる場合に、第2応答文が正しいと見なして第1応答文の誤りを訂正する構成が開示されている。   2. Description of the Related Art Conventionally, a voice dialogue system that recognizes a voice input by a user and answers the input voice is known. For example, in Patent Document 1, voice recognition is performed by a terminal and a server, a first response sentence is generated based on the terminal-side recognition result and output from the voice output unit, and a second response sentence is generated based on the server-side recognition result. The structure which produces | generates and outputs from an audio | voice output part is disclosed. Also, a configuration is disclosed in which when the first response sentence and the second response sentence are different, the second response sentence is regarded as correct and the error in the first response sentence is corrected.

特開2014−191030号公報JP 2014-191030 A

上述した従来技術においては、端末側の認識結果とサーバ側の認識結果との双方を有効利用することができなかった。すなわち、従来技術においては、第1応答文が誤りであった場合に第2応答文を利用しているが、第1応答文と第2応答文との双方が正しい場合もある。従来技術においては、このように両者が補完関係にある場合が想定されておらず、端末側の認識結果とサーバ側の認識結果との双方を有効利用することができなかった。
本発明は、前記課題にかんがみてなされたもので、ローカルで得られる情報と外部から得られる情報との双方を有効利用することが可能な技術を提供することを目的とする。
In the above-described conventional technology, it is impossible to effectively use both the recognition result on the terminal side and the recognition result on the server side. That is, in the prior art, the second response text is used when the first response text is incorrect. However, both the first response text and the second response text may be correct. In the prior art, it is not assumed that the two are in a complementary relationship as described above, and it has been impossible to effectively use both the recognition result on the terminal side and the recognition result on the server side.
The present invention has been made in view of the above problems, and an object of the present invention is to provide a technique capable of effectively using both locally obtained information and externally obtained information.

前記の目的を達成するため、利用者の入力を受け付ける入力受付部と、ローカル記憶媒体に記録されたローカルデータベースに基づいて前記入力に対する応答であるローカル応答を生成するローカル応答生成部と、前記ローカル応答を出力するローカル応答出力部と、外部記憶媒体に記録された外部データベースに基づいて生成された前記入力に対する応答である外部応答を取得する外部応答取得部と、前記外部応答と前記ローカル応答との差分を抽出し、当該差分を前記ローカル応答の出力に追加して出力する差分出力部と、を備える応答システムが構成される。   In order to achieve the above object, an input receiving unit that receives user input, a local response generating unit that generates a local response that is a response to the input based on a local database recorded in a local storage medium, and the local A local response output unit that outputs a response, an external response acquisition unit that acquires an external response that is a response to the input generated based on an external database recorded in an external storage medium, the external response, and the local response And a difference output unit that extracts the difference and outputs the difference in addition to the output of the local response.

さらに、前記の目的を達成するため、コンピュータを、利用者の入力を受け付ける入力受付部、ローカル記憶媒体に記録されたローカルデータベースに基づいて前記入力に対する応答であるローカル応答を生成するローカル応答生成部、前記ローカル応答を出力するローカル応答出力部、外部記憶媒体に記録された外部データベースに基づいて生成された前記入力に対する応答である外部応答を取得する外部応答取得部、前記外部応答と前記ローカル応答との差分を抽出し、当該差分を前記ローカル応答の出力に追加して出力する差分出力部、として機能させる応答プログラムが構成される。   Furthermore, in order to achieve the above object, the computer includes an input receiving unit that receives user input, and a local response generating unit that generates a local response that is a response to the input based on a local database recorded in a local storage medium. A local response output unit that outputs the local response; an external response acquisition unit that acquires an external response that is a response to the input generated based on an external database recorded in an external storage medium; the external response and the local response And a response program that functions as a difference output unit that outputs the difference in addition to the output of the local response.

すなわち、応答システム、応答プログラムが実施されている状況下では、利用者の入力に対する応答がローカルデータベースおよび外部データベースの双方に基づいて生成され、ローカル応答が先に出力され、さらに、外部応答とローカル応答との差分が追加で出力される。ローカルデータベースと外部データベースとのそれぞれに基づいてローカル応答と外部応答とが生成される場合、一般的にはローカル応答の方が早期に生成される。   That is, in a situation where a response system and a response program are implemented, a response to a user input is generated based on both the local database and the external database, the local response is output first, and the external response and the local program are further output. The difference from the response is additionally output. When the local response and the external response are generated based on the local database and the external database, respectively, the local response is generally generated earlier.

一方、外部データベースは、利用者が利用する応答システムの外部に存在し、利用者自身が所有する必要がないため、複数の応答システムからアクセス可能なシステム内に構成することが可能である。従って、システム運用者が外部データベースを集中管理する構成とすることができ、応答システムが複数の利用者に配布された後(製造販売開始後等)であっても外部データベースの内容を更新、追加等することが容易である。このため、一般的には、外部データベースの方がローカルデータベースよりも情報量が多く、より詳細な内容の応答を生成することが可能である。   On the other hand, since the external database exists outside the response system used by the user and does not need to be owned by the user, the external database can be configured in a system accessible from a plurality of response systems. Therefore, the system operator can be configured to centrally manage the external database, and the contents of the external database are updated and added even after the response system is distributed to multiple users (after the start of production and sales, etc.) It is easy to equalize. Therefore, in general, the external database has a larger amount of information than the local database, and it is possible to generate a more detailed response.

そこで、応答システム、応答プログラムにおいては、まず、ローカル応答を出力し、外部応答が取得されたら両者の差分を抽出し、追加で出力する。従って、利用者が入力を行うとローカル応答がすぐに生成されて出力され、利用者の入力に対して早期に応答を行うことができる。さらに、外部応答が取得されると、ローカル応答と外部応答との差分が抽出されて出力されるため、利用者はローカル応答のみからは知り得なかった情報を取得することができる。従って、応答システム、応答プログラムにおいては、ローカル応答と外部応答との双方を利用者に対する回答に利用しており、ローカルで得られる情報と外部から得られる情報との双方を有効利用することが可能である。   Therefore, in the response system and response program, first, a local response is output, and when an external response is acquired, the difference between the two is extracted and additionally output. Therefore, when a user inputs, a local response is immediately generated and output, and an early response can be made to the user's input. Further, when the external response is acquired, the difference between the local response and the external response is extracted and output, so that the user can acquire information that cannot be known only from the local response. Therefore, in the response system and response program, both the local response and the external response are used for the answer to the user, and it is possible to effectively use both the information obtained locally and the information obtained from the outside. It is.

ナビゲーションシステムを示すブロック図である。It is a block diagram which shows a navigation system. 図2Aは応答処理を示すフローチャート、図2Bは外部応答生成処理を示すフローチャートである。FIG. 2A is a flowchart showing response processing, and FIG. 2B is a flowchart showing external response generation processing. 図3Aはローカル応答の表示例、図3Bは差分の追加例を示す図である。3A is a display example of a local response, and FIG. 3B is a diagram showing an example of adding a difference.

ここでは、下記の順序に従って本発明の実施の形態について説明する。
(1)ナビゲーションシステムの構成:
(2)応答処理:
(3)外部応答生成処理:
(4)他の実施形態:
Here, embodiments of the present invention will be described in the following order.
(1) Configuration of navigation system:
(2) Response processing:
(3) External response generation processing:
(4) Other embodiments:

(1)ナビゲーションシステムの構成:
図1は、本発明の一実施形態であるナビゲーションシステム10の構成を示すブロック図である。ナビゲーションシステム10は、CPU、RAM、ROM等を備える制御部20を備えており、制御部20は、当該ROMやローカル記憶媒体30に記録された所望のプログラムを実行することができる。本実施形態においては、このプログラムの一つとしてナビゲーションプログラムを実行可能である。当該ナビゲーションプログラムは、表示部に現在地と現在地周辺の地図を表示する機能と目的地までの経路を探索して案内する機能を制御部20に実現させることができる。
(1) Configuration of navigation system:
FIG. 1 is a block diagram showing a configuration of a navigation system 10 according to an embodiment of the present invention. The navigation system 10 includes a control unit 20 including a CPU, a RAM, a ROM, and the like, and the control unit 20 can execute a desired program recorded in the ROM or the local storage medium 30. In this embodiment, a navigation program can be executed as one of the programs. The navigation program can cause the control unit 20 to realize a function of displaying a current location and a map around the current location on the display unit and a function of searching and guiding a route to the destination.

また、ナビゲーションプログラムは、応答プログラムを含んでおり、制御部20は、応答プログラム21の処理により、利用者とナビゲーションシステム10とで音声による対話を行う機能を実行する。対話は、利用者の発話音声による入力と、ナビゲーションシステム10からの応答とが1回以上実行されることによって実現される。   In addition, the navigation program includes a response program, and the control unit 20 executes a function of performing a voice conversation between the user and the navigation system 10 by the processing of the response program 21. The dialogue is realized by executing the input by the user's uttered voice and the response from the navigation system 10 at least once.

ナビゲーションシステム10が使用される車両は、GPS受信部41と車速センサ42とジャイロセンサ43とユーザI/F部44と通信部45とを備えている。GPS受信部41は、GPS衛星からの電波を受信し、図示しないインタフェースを介して車両の現在地を算出するための信号を出力する。車速センサ42は、車両が備える車輪の回転速度に対応した信号を出力する。制御部20は、図示しないインタフェースを介してこの信号を取得し、車速を取得する。ジャイロセンサ43は、車両の水平面内の旋回についての角加速度を検出し、車両の向きに対応した信号を出力する。   The vehicle in which the navigation system 10 is used includes a GPS receiver 41, a vehicle speed sensor 42, a gyro sensor 43, a user I / F unit 44, and a communication unit 45. The GPS receiver 41 receives radio waves from GPS satellites and outputs a signal for calculating the current location of the vehicle via an interface (not shown). The vehicle speed sensor 42 outputs a signal corresponding to the rotational speed of the wheels provided in the vehicle. The control unit 20 acquires this signal via an interface (not shown) and acquires the vehicle speed. The gyro sensor 43 detects angular acceleration about turning in the horizontal plane of the vehicle, and outputs a signal corresponding to the direction of the vehicle.

制御部20は、この信号を取得して車両の進行方向を取得する。制御部20は、車速センサ42およびジャイロセンサ43等の出力信号に基づいて車両の走行軌跡を特定することで車両の現在地を取得する。GPS受信部41の出力信号は、車速センサ42およびジャイロセンサ43等から特定される車両の現在地を補正するなどのために利用される。   The control unit 20 acquires this signal and acquires the traveling direction of the vehicle. The control unit 20 acquires the current location of the vehicle by specifying the travel locus of the vehicle based on output signals from the vehicle speed sensor 42 and the gyro sensor 43 and the like. The output signal of the GPS receiver 41 is used for correcting the current location of the vehicle specified by the vehicle speed sensor 42, the gyro sensor 43, and the like.

ユーザI/F部44は、利用者に種々の情報を提供し、また、利用者から種々の入力を受け付けるためのインタフェース部であり、図示しない表示部や操作入力部、スピーカー、マイク等を備えている。制御部20は、ナビゲーションプログラムの機能により、当該車両の現在地周辺の地図や経路、施設の検索結果等を表示部に表示することができる。また、制御部20は、マイクによって利用者の発話音声を取得することが可能であり、各種の音データに基づいてスピーカーから音声を含む任意の音を出力することが可能である。   The user I / F unit 44 is an interface unit for providing various information to the user and receiving various inputs from the user, and includes a display unit, an operation input unit, a speaker, a microphone, and the like (not shown). ing. The control unit 20 can display, on the display unit, a map and route around the current location of the vehicle, a facility search result, and the like by the function of the navigation program. Moreover, the control part 20 can acquire a user's speech sound with a microphone, and can output arbitrary sounds including a sound from a speaker based on various sound data.

通信部45は、外部システム50と無線通信するための回路を備えており、制御部20と外部システム50の間では、通信部45を介して任意の情報が授受される。本実施形態において、制御部20は、利用者の発話音声を示す情報を、通信部45を介して外部システム50に対して送信することができる。   The communication unit 45 includes a circuit for wirelessly communicating with the external system 50, and arbitrary information is exchanged between the control unit 20 and the external system 50 via the communication unit 45. In the present embodiment, the control unit 20 can transmit information indicating the user's uttered voice to the external system 50 via the communication unit 45.

外部システム50は図示しない外部記憶媒体を備えており、当該外部記憶媒体には外部データベース50aが記録されている。外部システム50が、当該発話音声を示す情報を取得すると、外部システム50は、外部データベース50aに基づいて音声認識を行い、認識結果としての文字列に対する応答である外部応答を生成する。外部応答が生成されると、外部システム50は、外部応答を示す情報をナビゲーションシステム10に対して送信する。制御部20は、通信部45を介して、当該外部応答を示す情報を受信することができる。   The external system 50 includes an external storage medium (not shown), and an external database 50a is recorded on the external storage medium. When the external system 50 acquires information indicating the uttered voice, the external system 50 performs voice recognition based on the external database 50a, and generates an external response that is a response to the character string as a recognition result. When the external response is generated, the external system 50 transmits information indicating the external response to the navigation system 10. The control unit 20 can receive information indicating the external response via the communication unit 45.

ローカル記憶媒体30には、ローカルデータベース30aが記録されている。ローカルデータベース30aには、地図情報30a1と音声データベース30a2とが含まれている。地図情報30a1は、現在地の特定や施設の検索等に利用される情報であり、道路上に設定されたノードの位置等を示すノードデータ,ノード間の道路の形状を特定するための形状補間点データ,ノード同士の連結を示すリンクデータ,道路やその周辺に存在する施設の位置、属性および名称等を示す施設データ等を含んでいる。   A local database 30a is recorded in the local storage medium 30. The local database 30a includes map information 30a1 and a voice database 30a2. The map information 30a1 is information used for specifying the current location, searching for facilities, and the like, node data indicating the positions of nodes set on the road, and shape interpolation points for specifying the shape of the road between the nodes. It includes data, link data indicating the connection between nodes, facility data indicating the location, attributes, names, etc. of facilities existing on and around the road.

従って、施設データは、複数個の施設のそれぞれに関するレコードによって構成され、各レコードに対して位置、属性、名称等の複数の項目毎の情報が対応づけられたデータである。なお、本実施形態において各施設の属性には、施設の種類、例えば、レストラン、コンビニエンスストア、公共施設等を示す情報が対応づけられている。   Therefore, the facility data is data in which records for each of a plurality of facilities are configured, and information for each of a plurality of items such as a position, an attribute, and a name is associated with each record. In the present embodiment, the attributes of each facility are associated with information indicating the type of facility, for example, a restaurant, a convenience store, a public facility, and the like.

音声データベース30a2は、利用者の発話音声を認識して文字列化する際に参照される情報である。音声データベース30a2は、音声認識を実行するためのアルゴリズムに応じて種々の情報とすることができる。例えば、制御部20が、発話音声の波形から音素に対応した特徴量を調べて音素列を作成し、音響モデルおよび言語モデルと比較することによって音素列に対応する尤も確からしい文字列を取得する構成を有している場合、音声データベース30a2には、音響モデルおよび言語モデルを示す情報が含まれる。   The voice database 30a2 is information that is referred to when a user's uttered voice is recognized and converted into a character string. The voice database 30a2 can be various information according to an algorithm for executing voice recognition. For example, the control unit 20 creates a phoneme string by examining a feature amount corresponding to a phoneme from the waveform of a speech voice, and obtains a character string that is likely to correspond to the phoneme string by comparing the phoneme string with an acoustic model and a language model. When having the configuration, the voice database 30a2 includes information indicating the acoustic model and the language model.

応答プログラム21は、利用者の入力に対する応答を出力するために、入力受付部21aとローカル応答生成部21bとローカル応答出力部21cと外部応答取得部21dと差分出力部21eとを備えている。入力受付部21aは、利用者の入力を受け付ける機能を制御部20に実現させるプログラムモジュールである。本実施形態においては、利用者の発話音声に基づいて利用者が応答を望む内容を特定する構成が採用されており、制御部20は、マイクを介して利用者の発話音声を取得する。   The response program 21 includes an input reception unit 21a, a local response generation unit 21b, a local response output unit 21c, an external response acquisition unit 21d, and a difference output unit 21e in order to output a response to a user input. The input receiving unit 21a is a program module that causes the control unit 20 to realize a function of receiving user input. In this embodiment, the structure which specifies the content which a user desires to respond based on a user's speech sound is employ | adopted, and the control part 20 acquires a user's speech sound via a microphone.

ローカル応答生成部21bは、ローカル記憶媒体30に記録されたローカルデータベース30aに基づいて入力に対する応答であるローカル応答を生成する機能を制御部20に実現させるプログラムモジュールである。すなわち、制御部20は、入力受付部21aの処理によって受け付けた発話音声とローカルデータベース30aに記憶された音声データベース30a2とを比較して発話音声を認識し、当該発話音声の認識結果に基づいてローカル応答を特定する。   The local response generation unit 21 b is a program module that causes the control unit 20 to realize a function of generating a local response that is a response to an input based on the local database 30 a recorded in the local storage medium 30. That is, the control unit 20 compares the uttered voice received by the process of the input receiving unit 21a with the voice database 30a2 stored in the local database 30a, recognizes the uttered voice, and determines the local voice based on the recognition result of the uttered voice. Identify the response.

入力と応答の態様は種々の態様が想定可能である。例えば、入力と応答が、情報の要求と情報の提示である例や、命令と実行である例が想定される。本実施形態においては、入力が検索要求(検索条件の指定)であり、応答が検索結果の出力である例を想定する。音声認識は、例えば、制御部20が、入力受付部21aの処理によって受け付けた発話音声の波形から音素に対応した特徴量を調べて音素列を作成し、音声データベース30a2として記録された音響モデルおよび言語モデルと音素列とを比較することによって音素列に対応する尤も確からしい文字列を取得することによって実現可能である。   Various modes of input and response can be assumed. For example, an example in which the input and response are a request for information and presentation of information, or an example in which an instruction and execution are performed is assumed. In the present embodiment, an example is assumed in which the input is a search request (designation of search conditions) and the response is an output of a search result. In the speech recognition, for example, the control unit 20 creates a phoneme string by examining the feature amount corresponding to the phoneme from the waveform of the uttered speech accepted by the processing of the input accepting unit 21a, and the acoustic model recorded as the speech database 30a2. This can be realized by comparing the language model with the phoneme sequence to obtain a character string that is likely to correspond to the phoneme sequence.

文字列が取得されると、制御部20は、当該文字列から検索対象及び検索条件を特定する。例えば、「おすすめのレストランを教えて」という文字列である場合、地図情報30a1に記録された施設が検索対象であり、レストラン属性の施設であることと、おすすめのレストランであることが検索条件となる。ただし、制御部20は、文字列から検索条件の全てを認識できるとは限らない。   When the character string is acquired, the control unit 20 specifies a search target and a search condition from the character string. For example, in the case of the character string “Tell me a recommended restaurant”, the facility recorded in the map information 30a1 is a search target, and the search condition is that it is a restaurant attribute facility and a recommended restaurant. Become. However, the control unit 20 cannot recognize all the search conditions from the character string.

具体的には、本実施形態にかかる地図情報30a1においては、施設の属性がレストランであるか否かを示す情報は対応づけられているが、レストランのおすすめ度(例えば、口コミ評価)を示す情報は対応づけられていない。すなわち、本実施形態においてローカルデータベース30aは、ナビゲーションシステム10の販売段階でローカル記憶媒体30に記録されており、更新が行われるとしても外部システム50における外部データベース50aよりも更新の頻度が低い。   Specifically, in the map information 30a1 according to the present embodiment, information indicating whether or not the facility attribute is a restaurant is associated, but information indicating a restaurant recommendation level (for example, word-of-mouth evaluation). Are not associated. That is, in the present embodiment, the local database 30a is recorded in the local storage medium 30 at the sales stage of the navigation system 10, and even if updated, the frequency of updating is lower than that of the external database 50a in the external system 50.

そこで、動的に変更し得るとともに、頻繁に更新されることに価値のある情報であるおすすめ度は、本実施形態において、ローカルデータベース30aには記録されず、外部データベース50aに記録される。すなわち、本実施形態において、外部データベース50aは、地図情報30a1と同等の情報に対して検索条件となり得る項目についての情報がさらに追加されたデータベースである。   Therefore, in this embodiment, the recommendation degree that can be changed dynamically and is valuable information that is frequently updated is not recorded in the local database 30a, but is recorded in the external database 50a. That is, in the present embodiment, the external database 50a is a database in which information about items that can be search conditions is further added to information equivalent to the map information 30a1.

従って、外部データベース50aにおいては、複数個の施設のそれぞれに関するレコードであって、各レコードに対して位置、属性、名称、おすすめ度等の複数の項目毎の情報が対応づけられた施設データを含む。ただし、外部データベース50aに含まれる施設データの項目は、ローカルデータベース30aに含まれる施設データの項目よりも項目が多い。   Therefore, the external database 50a includes records relating to each of a plurality of facilities, each of which includes facility data in which information for each of a plurality of items such as a position, an attribute, a name, and a recommendation level is associated with each record. . However, the facility data items included in the external database 50a have more items than the facility data items included in the local database 30a.

さらに、本実施形態において、音声データベース30a2には「おすすめの」を高い確率で認識するためのデータは含まれていない。すなわち、地図情報30a1に含まれる施設データにはおすすめ度を示す情報が含まれておらず、ローカル記憶媒体30の記憶容量も限られているため、地図情報30a1に含まれる施設データの各項目を検索条件とする単語については、高い確率で認識するためのデータが定義され、音声データベース30a2に含められる。一方、地図情報30a1に含まれる施設データの各項目に関連しない単語を高い確率で認識する必要はなく、このような単語を高い確率で認識するためのデータは、音声データベース30a2に含められていない。   Further, in the present embodiment, the voice database 30a2 does not include data for recognizing “recommended” with a high probability. That is, since the facility data included in the map information 30a1 does not include information indicating the recommendation level and the storage capacity of the local storage medium 30 is limited, each item of the facility data included in the map information 30a1 is changed. For a word used as a search condition, data for recognition with a high probability is defined and included in the speech database 30a2. On the other hand, it is not necessary to recognize a word that is not related to each item of facility data included in the map information 30a1 with a high probability, and data for recognizing such a word with a high probability is not included in the voice database 30a2. .

一方、外部システム50は、複数のナビゲーションシステム10と通信を行うことが可能であるため、外部データベース50aのメンテナンスを行えば、その効果を複数のナビゲーションシステム10で享受することが可能である。このため、外部データベース50aには、「おすすめの」など、おすすめ度を検索項目とする指示である単語を文字列から高い確率で認識するためのデータが含まれている。すなわち、本実施形態において、外部データベース50aは、音声データベース30a2と同等の情報に対して、より高度な文字列を検索可能にするための情報が追加されたデータベースである。   On the other hand, since the external system 50 can communicate with a plurality of navigation systems 10, if the maintenance of the external database 50 a is performed, the effect can be enjoyed by the plurality of navigation systems 10. For this reason, the external database 50a includes data for recognizing a word that is an instruction using a recommendation degree as a search item, such as “recommended”, from a character string with a high probability. That is, in the present embodiment, the external database 50a is a database in which information for enabling a search for a more advanced character string is added to information equivalent to the speech database 30a2.

以上のように、本実施形態におけるローカルデータベース30aは、外部データベース50aよりも情報量が少ないため、制御部20が「おすすめのレストランを教えて」という発話音声を認識すると、「レストランを教えて」が高い確率で認識され、「おすすめの」は未知語となり得る。この結果、制御部20は、文字列「レストランを教えて」に基づいて、地図情報30a1を参照し、レストラン属性が対応づけられた施設を検索する。そして、制御部20は、検索された施設の名称、位置を示す情報をローカル応答とする。   As described above, since the local database 30a in the present embodiment has a smaller amount of information than the external database 50a, when the control unit 20 recognizes an utterance voice “tell a recommended restaurant”, “tell a restaurant” Are recognized with a high probability, and “recommended” can be an unknown word. As a result, the control unit 20 refers to the map information 30a1 based on the character string “Tell me a restaurant” and searches for a facility associated with the restaurant attribute. And the control part 20 makes the information which shows the name and position of the searched facility a local response.

ローカル応答出力部21cは、ローカル応答を出力する機能を制御部20に実現させるプログラムモジュールである。本実施形態において、制御部20は、ユーザI/F部44に対して制御信号を出力し、検索結果として得られた施設を表示させる。なお、本実施形態においては、利用者からの距離の順序で施設を表示する態様がデフォルトとなるように設定されている。そこで、制御部20は、地図情報30a1を参照し、利用者の現在地から各施設までの距離を特定する。そして、距離によってソートされた順序で各施設の名称と現在地からの距離を表示部に表示させる。   The local response output unit 21c is a program module that causes the control unit 20 to realize a function of outputting a local response. In the present embodiment, the control unit 20 outputs a control signal to the user I / F unit 44 to display the facility obtained as a search result. In the present embodiment, the mode for displaying the facilities in the order of the distance from the user is set to be the default. Therefore, the control unit 20 refers to the map information 30a1 and specifies the distance from the current location of the user to each facility. Then, the name of each facility and the distance from the current location are displayed on the display unit in the order sorted by the distance.

外部応答取得部21dは、外部記憶媒体に記録された外部データベースに基づいて生成された、利用者による入力に対する応答である外部応答を取得する機能を制御部20に実現させるプログラムモジュールである。本実施形態において、制御部20は、入力受付部21aの処理によって受け付けた発話音声に基づいて、外部システム50に外部応答を生成させる。   The external response acquisition unit 21d is a program module that causes the control unit 20 to realize a function of acquiring an external response, which is a response to an input by a user, generated based on an external database recorded in an external storage medium. In the present embodiment, the control unit 20 causes the external system 50 to generate an external response based on the uttered voice received by the process of the input receiving unit 21a.

このため、制御部20は、通信部45を介して発話音声を示す情報を外部システム50に対して送信する。外部システム50が当該発話音声を示す情報を取得すると、外部システム50は、外部データベース50aに基づいて外部応答を生成する。外部応答の生成は種々の処理で実行可能である。例えば、外部システム50が、発話音声の波形から音素に対応した特徴量を調べて音素列を作成し、外部データベース50aとして記録された音響モデルおよび言語モデルと音素列とを比較することによって音素列に対応する尤も確からしい文字列を取得する。   For this reason, the control unit 20 transmits information indicating the speech voice to the external system 50 via the communication unit 45. When the external system 50 acquires information indicating the uttered voice, the external system 50 generates an external response based on the external database 50a. The generation of the external response can be executed by various processes. For example, the external system 50 creates a phoneme string by examining a feature amount corresponding to a phoneme from the waveform of a speech voice, and compares the phoneme string with an acoustic model and a language model recorded as the external database 50a. A character string that is likely to correspond to is obtained.

文字列が取得されると、外部システム50は、当該文字列から検索対象及び検索条件を特定する。例えば、発話音声が「おすすめのレストランを教えて」という文字列である場合、外部システム50は、高い確率で「おすすめの」を含めた文字列を認識する。本実施形態において、外部データベース50aには、地図情報30a1と同様に施設データが含まれており、当該施設データに対して、動的に変動し得る(利用者の投稿等によって日々変動し得る)おすすめ度を示す情報が対応づけられている。   When the character string is acquired, the external system 50 specifies a search target and a search condition from the character string. For example, when the uttered voice is a character string “tell me a recommended restaurant”, the external system 50 recognizes a character string including “recommended” with a high probability. In the present embodiment, facility data is included in the external database 50a in the same manner as the map information 30a1, and can be dynamically changed with respect to the facility data (can be changed every day depending on a user's posting, etc.). Information indicating the recommendation level is associated.

そこで、当該おすすめ度を示す情報など、地図情報30a1に記録されていない項目についての検索も可能にするため、外部データベース50aには、音声データベース30a2と同様のデータに加え、「おすすめの」などの文字列を高い確率で認識するためのデータが含まれている。従って、外部システム50において、外部データベース50aに基づいて発話音声の音声認識を行うと、制御部20における認識率よりも高い認識率で文字列が認識される。例えば、外部システム50が「おすすめのレストランを教えて」という発話音声を認識すると、「おすすめの」が未知語とならずに認識される可能性が高い。   Therefore, in order to enable searching for items that are not recorded in the map information 30a1, such as information indicating the degree of recommendation, in the external database 50a, in addition to data similar to the voice database 30a2, "recommended" Data for recognizing character strings with high probability is included. Therefore, when the external system 50 performs speech recognition of the uttered speech based on the external database 50a, the character string is recognized at a recognition rate higher than the recognition rate in the control unit 20. For example, when the external system 50 recognizes an utterance voice “tell me a recommended restaurant”, there is a high possibility that “recommended” is recognized as an unknown word.

この結果、外部システム50は、文字列「おすすめのレストランを教えて」に基づいて、外部データベース50aを参照し、レストラン属性が対応づけられた施設を検索する。すなわち、外部システム50は、ローカルデータベース30aでの認識で未知語とされた単語も未知語とならない状態で検索を行う。そして、外部システム50は、検索された施設の名称、位置およびおすすめ度を示す情報を外部応答とする。外部応答が生成されると、外部システム50は、図示しない通信部を介して外部応答を送信し、制御部20は、通信部45を介して当該外部応答を取得する。   As a result, the external system 50 refers to the external database 50a based on the character string “Tell me a recommended restaurant” and searches for facilities associated with restaurant attributes. That is, the external system 50 performs a search in a state in which a word that is an unknown word by recognition in the local database 30a does not become an unknown word. Then, the external system 50 sets information indicating the searched facility name, position, and recommendation level as an external response. When the external response is generated, the external system 50 transmits the external response via a communication unit (not shown), and the control unit 20 acquires the external response via the communication unit 45.

差分出力部21eは、外部応答とローカル応答との差分を抽出し、当該差分をローカル応答の出力に追加して出力する機能を制御部20に実現させるプログラムモジュールである。すなわち、外部データベース50aに基づいて生成された外部応答は、ローカルデータベース30aに基づいて生成されたローカル応答よりも詳細な検索結果が含まれている可能性がある。   The difference output unit 21e is a program module that causes the control unit 20 to realize a function of extracting a difference between an external response and a local response and adding the difference to the output of the local response. In other words, the external response generated based on the external database 50a may include a more detailed search result than the local response generated based on the local database 30a.

そこで、制御部20は、ローカル応答の出力が行われても利用者に伝達されなかった情報の追加や処理内容の補足等が行われるように、外部応答とローカル応答との差分を出力する。差分は、早期の生成可能であるローカル応答に対して追加することによってローカル応答の価値を高めたり、情報を補完したりすることができるように抽出されればよいが、本実施形態においては、上述のように検索が想定されているため、制御部20は、ローカル応答に含まれてなかった検索結果が外部応答に存在する場合、その差分を抽出する。   Therefore, the control unit 20 outputs the difference between the external response and the local response so that information that is not transmitted to the user even when the local response is output is added or the processing content is supplemented. The difference may be extracted so that the value of the local response can be increased by adding to the local response that can be generated early, or the information can be supplemented. Since the search is assumed as described above, the control unit 20 extracts the difference when the search result that is not included in the local response exists in the external response.

例えば、上述の例においては、ローカル応答が、検索された施設の名称、位置を示す情報であり、外部応答が、検索された施設の名称、位置およびおすすめ度を示す情報であるため、制御部20は、おすすめ度を差分として抽出する。制御部20は、ローカル応答出力部21cの処理による出力に対し、おすすめ度を追加して出力することができればよいが、本実施形態においては、おすすめ度に基づいてソートを行って出力を修正する。   For example, in the above example, since the local response is information indicating the name and position of the searched facility, and the external response is information indicating the name, position, and recommendation level of the searched facility, the control unit 20 extracts the recommendation level as a difference. The control unit 20 only needs to be able to output the recommendation level with respect to the output by the processing of the local response output unit 21c, but in this embodiment, the output is corrected by sorting based on the recommendation level. .

すなわち、制御部20は、ローカル応答に含まれていた各施設の名称および位置におすすめ度を対応付け、おすすめ度によってソートされた順序で各施設の名称と現在地からの距離とおすすめ度を表示するための制御信号をユーザI/F部44に出力する。この結果、ユーザI/F部44の出力部においては、おすすめ度によってソートされた検索結果が出力される。   That is, the control unit 20 associates the recommendation level with the name and position of each facility included in the local response, and displays the name of each facility, the distance from the current location, and the recommendation level in the order sorted by the recommendation level. Control signal for output to the user I / F unit 44. As a result, in the output unit of the user I / F unit 44, the search results sorted according to the recommendation level are output.

以上の構成によれば、利用者の入力に対する応答がローカルデータベース30aおよび外部データベース50aの双方に基づいて生成され、ローカル応答が先に出力され、さらに、外部応答とローカル応答との差分が追加で出力される。この構成にかかる本実施形態において、外部応答の生成および取得には通信が介在し、また、相対的に容量の大きいデータベースの参照が必要になるため、一般的にはローカル応答の方が早期に生成される。従って、本実施形態によれば、利用者の入力に対して早期に応答を行うことができる。   According to the above configuration, a response to a user input is generated based on both the local database 30a and the external database 50a, the local response is output first, and the difference between the external response and the local response is added. Is output. In this embodiment according to this configuration, communication is involved in the generation and acquisition of the external response, and it is necessary to refer to a database with a relatively large capacity. Generated. Therefore, according to this embodiment, it is possible to respond quickly to the user's input.

一方、外部データベース50aは、利用者が利用するナビゲーションシステム10の外部である外部システム50に存在し、当該外部システム50は複数のナビゲーションシステム10からアクセス可能である。従って、システム運用者が外部データベース50aを集中管理する構成とすることができ、ナビゲーションシステム10が複数の利用者に配布された後(製造販売開始後等)であっても外部データベースの内容を更新、追加等することが容易である。このため、一般的には、外部データベースの方がローカルデータベース30aよりも情報量が多く、より詳細な内容の応答を生成することが可能である。   On the other hand, the external database 50 a exists in the external system 50 that is external to the navigation system 10 used by the user, and the external system 50 can be accessed from a plurality of navigation systems 10. Therefore, the system operator can be configured to centrally manage the external database 50a, and the contents of the external database are updated even after the navigation system 10 is distributed to a plurality of users (after the start of manufacturing and sales, etc.). It is easy to add. For this reason, in general, the external database has a larger amount of information than the local database 30a, and it is possible to generate a response with more detailed contents.

従って、外部応答が取得され、ローカル応答と外部応答との差分が抽出されて出力されると、利用者はローカル応答のみからは知り得なかった情報を取得することができる。この結果、本実施形態においてはローカル応答と外部応答との双方を利用者に対する回答に利用することになり、ローカルで得られる情報と外部から得られる情報との双方を有効利用することが可能である。   Therefore, when an external response is acquired and the difference between the local response and the external response is extracted and output, the user can acquire information that cannot be known only from the local response. As a result, in this embodiment, both the local response and the external response are used for the answer to the user, and it is possible to effectively use both the information obtained locally and the information obtained from the outside. is there.

さらに、上述の例においては、ローカル応答出力部21cの処理において未知語であった「おすすめの」が、外部データベース50aに基づいて認識された認識結果が外部応答に含まれる。従って、この例においては、未知語に基づいて生成された部分が差分として抽出されることになり、差分の追加出力の価値を高めることができる。   Furthermore, in the above-described example, the external response includes a recognition result in which “recommended”, which was an unknown word in the processing of the local response output unit 21c, is recognized based on the external database 50a. Therefore, in this example, the part generated based on the unknown word is extracted as a difference, and the value of the additional output of the difference can be increased.

さらに、上述の例においては、ローカルデータベース30aに存在しない項目であるおすすめ度に関して外部データベース50aに基づいて検索された結果が差分となっている。従って、本実施形態においては、ローカル応答としての検索結果で得られなかった情報を追加することができる。このため、早期にレスポンスが得られ、かつ、少し待つことによって詳細な検索結果が得られる応答システムを提供することができる。   Furthermore, in the above-mentioned example, the result searched based on the external database 50a regarding the recommendation degree which is an item which does not exist in the local database 30a is a difference. Therefore, in this embodiment, information that could not be obtained from the search result as a local response can be added. Therefore, it is possible to provide a response system in which a response can be obtained early and a detailed search result can be obtained by waiting for a while.

(2)応答処理:
次に、ナビゲーションシステム10が実行する応答処理を説明する。ナビゲーションシステム10においては、利用者の操作やマイクによる既定のワードの検出など種々のトリガによって図2Aに示す応答処理が開始される。応答処理において、制御部20は、入力受付部21aの処理により、発話音声による入力を受け付ける(ステップS100)。すなわち、制御部20は、ユーザI/F部44のマイクを介して利用者の発話音声を示す波形情報を取得する。図3Aにおいては、利用者Uが「おすすめのレストランを教えて」と発話した例を示している。
(2) Response processing:
Next, response processing executed by the navigation system 10 will be described. In the navigation system 10, the response process shown in FIG. 2A is started by various triggers such as a user operation and detection of a predetermined word by a microphone. In the response process, the control unit 20 receives an input by the uttered voice by the process of the input receiving unit 21a (step S100). That is, the control unit 20 acquires waveform information indicating the user's uttered voice via the microphone of the user I / F unit 44. FIG. 3A shows an example in which the user U speaks “Tell me a recommended restaurant”.

次に、制御部20は、外部応答取得部21dの処理により、発話音声を外部システム50に送信する(ステップS105)。すなわち、制御部20は、ステップS100の処理によって取得した発話音声を示す波形情報を、通信部45を介して、外部システム50に対して送信する。   Next, the control unit 20 transmits the uttered voice to the external system 50 by the processing of the external response acquisition unit 21d (step S105). That is, the control unit 20 transmits the waveform information indicating the uttered voice acquired by the process of step S <b> 100 to the external system 50 via the communication unit 45.

次に、制御部20は、ローカル応答生成部21bの処理により、ローカルデータベース30aに基づいて音声認識を行う(ステップS110)。すなわち、制御部20は、音声データベース30a2を参照し、ステップS100の処理によって取得した発話音声を予め決められた音声認識アルゴリズムで解析し、発話音声の内容として尤も確率の高い文字列を取得する。図3Aに示す例において、本実施形態に示す音声データベース30a2には、「おすすめの」を高確率で認識するための情報が含まれないため、多くの場合、「おすすめの」は未知語となり、「レストランを教えて」が文字列として認識される。   Next, the control unit 20 performs voice recognition based on the local database 30a by the processing of the local response generation unit 21b (step S110). That is, the control unit 20 refers to the voice database 30a2, analyzes the uttered voice acquired by the process of step S100 using a predetermined voice recognition algorithm, and acquires a character string having a high probability as the content of the uttered voice. In the example shown in FIG. 3A, the speech database 30a2 shown in the present embodiment does not include information for recognizing “recommended” with a high probability, so in many cases “recommended” is an unknown word, “Tell me a restaurant” is recognized as a character string.

次に、制御部20は、ローカル応答生成部21bの処理により、ローカルデータベース30aに基づいて検索結果を取得する(ステップS115)。すなわち、制御部20は、ステップS110の処理で取得した文字列から検索対象と検索条件とを特定する。例えば、図3Aに示す例において「レストランを教えて」という文字列が音声認識結果として得られた場合、制御部20は、施設を検索対象とし、レストラン属性が対応づけられていることを検索条件とする。   Next, the control part 20 acquires a search result based on the local database 30a by the process of the local response generation part 21b (step S115). That is, the control unit 20 specifies a search target and a search condition from the character string acquired in the process of step S110. For example, in the example shown in FIG. 3A, when the character string “tell me a restaurant” is obtained as a speech recognition result, the control unit 20 sets the facility as a search target and associates the restaurant attribute with the search condition. And

そして、制御部20は、地図情報30a1を参照して検索条件に合致する検索対象を取得する。図3Aに示す例であれば、レストラン属性の施設を検索する。本実施形態においては、利用者からの距離の順序で施設を表示する態様がデフォルトであるため、制御部20は、施設の検索の際に、GPS受信部41、車速センサ42、ジャイロセンサ43の出力に基づいて現在地を特定し、当該現在地から各施設までの距離が近い順に規定の数の施設を検索する。検索結果が得られると、制御部20は、検索された施設の名称、位置を示す情報を特定し、ローカル応答とする。   Then, the control unit 20 refers to the map information 30a1 and acquires a search target that matches the search condition. In the example shown in FIG. 3A, a facility having a restaurant attribute is searched. In the present embodiment, since the mode of displaying the facilities in the order of distance from the user is the default, the control unit 20 uses the GPS receiving unit 41, the vehicle speed sensor 42, and the gyro sensor 43 when searching for the facility. The current location is identified based on the output, and a specified number of facilities are searched in order of increasing distance from the current location to each facility. When the search result is obtained, the control unit 20 specifies information indicating the name and position of the searched facility and sets it as a local response.

次に、制御部20は、ローカル応答出力部21cの処理により、ローカル応答としての検索結果を出力する(ステップS120)。すなわち、制御部20は、デフォルトの表示態様で検索結果を表示するための制御信号をユーザI/F部44に対して出力する。この結果、ユーザI/F部44の表示部においては、検索結果をデフォルトの表示態様で表示する。また、制御部20は、デフォルトの音声を出力するための制御信号をユーザI/F部44に対して出力する。この結果、ユーザI/F部44のスピーカーからデフォルトの音声が出力される。   Next, the control part 20 outputs the search result as a local response by the process of the local response output part 21c (step S120). That is, the control unit 20 outputs a control signal for displaying the search result in the default display mode to the user I / F unit 44. As a result, the search result is displayed in the default display mode on the display unit of the user I / F unit 44. Further, the control unit 20 outputs a control signal for outputting a default sound to the user I / F unit 44. As a result, the default sound is output from the speaker of the user I / F unit 44.

図3Aにおいては、ユーザI/F部44の表示部の画面例44aを示している。この例においては、利用者からの距離の順序で施設を表示する態様がデフォルトであるため、制御部20は、ローカル応答として取得された複数の施設の位置と現在地とに基づいて現在地から各施設までの距離を取得する。そして、制御部20は、距離によって各施設をソートし、ソートされた順序で各施設の名称と現在地からの距離を表示するための制御信号を出力する。図3Aの画面例44aにおいては、名称がレストランA,B,C,D,Eのそれぞれが現在地から0.5km,1.2km,2.2km,2.4km,2.7kmである例を示している。さらに、図3Aにおいては、デフォルトの音声の例である「距離が近い順にレストランを表示します」が、ナビゲーションシステム10から出力される状態を模式的に示している。   FIG. 3A shows a screen example 44 a of the display unit of the user I / F unit 44. In this example, since the mode in which the facilities are displayed in the order of the distance from the user is the default, the control unit 20 determines each facility from the current location based on the positions and current locations of the plurality of facilities acquired as local responses. Get the distance to. Then, the control unit 20 sorts each facility according to the distance, and outputs a control signal for displaying the name of each facility and the distance from the current location in the sorted order. 3A shows an example in which the names of restaurants A, B, C, D, and E are 0.5 km, 1.2 km, 2.2 km, 2.4 km, and 2.7 km from the current location, respectively. ing. Further, FIG. 3A schematically shows a state in which “the restaurant is displayed in order of distance”, which is an example of the default sound, is output from the navigation system 10.

次に、制御部20は、外部応答取得部21dの処理により、外部応答を受信したか否かを判定する(ステップS125)。すなわち、ステップS105によって送信された発話音声が外部システム50で受信されると、外部システム50において外部応答生成処理が行われ、外部応答が生成されると、外部応答を示す情報が外部システム50からナビゲーションシステム10に対して送信される。そこで、制御部20は、外部システム50が送信した外部応答が通信部45を介して取得されたか否かを判定する。ステップS125において、外部応答を受信したと判定されない場合、制御部20は、外部応答を受信したと判定されるまで待機する。   Next, the control unit 20 determines whether or not an external response has been received by the processing of the external response acquisition unit 21d (step S125). That is, when the utterance voice transmitted in step S105 is received by the external system 50, an external response generation process is performed in the external system 50. When an external response is generated, information indicating the external response is received from the external system 50. Sent to the navigation system 10. Therefore, the control unit 20 determines whether or not the external response transmitted by the external system 50 has been acquired via the communication unit 45. If it is not determined in step S125 that an external response has been received, the control unit 20 waits until it is determined that an external response has been received.

ステップS125において、外部応答を受信したと判定された場合、制御部20は、差分出力部21eの処理により、ローカル応答と外部応答との差分を抽出する(ステップS130)。すなわち、制御部20は、ステップS125の処理を経て取得された外部応答とステップS115で取得されたローカル応答とを比較し、異なる検索結果を差分として抽出する。例えば、図3Aに示す例において、外部データベース50aには「おすすめの」を高い確率で認識可能な音声データベースが含まれているため、外部応答には高い確率でレストランのおすすめ度を示す情報が含まれている。この場合、制御部20は、ステップS130において、各施設のおすすめ度を差分として抽出する。   If it is determined in step S125 that an external response has been received, the control unit 20 extracts the difference between the local response and the external response by the process of the difference output unit 21e (step S130). That is, the control unit 20 compares the external response acquired through the process of step S125 and the local response acquired in step S115, and extracts different search results as differences. For example, in the example shown in FIG. 3A, since the external database 50a includes a voice database capable of recognizing “recommended” with a high probability, the external response includes information indicating the recommendation degree of the restaurant with a high probability. It is. In this case, the control unit 20 extracts the recommendation level of each facility as a difference in step S130.

次に、制御部20は、差分出力部21eの処理により、差分を出力する(ステップS135)。本実施形態において、制御部20は、ステップS120における出力に差分を追加する修正を行う。また、制御部20は、差分を強調する音声を出力するための制御信号をユーザI/F部44に対して出力する。この結果、ユーザI/F部44のスピーカーから差分を強調する音声が出力される。   Next, the control part 20 outputs a difference by the process of the difference output part 21e (step S135). In the present embodiment, the control unit 20 performs correction to add a difference to the output in step S120. In addition, the control unit 20 outputs a control signal for outputting a sound that emphasizes the difference to the user I / F unit 44. As a result, a sound that emphasizes the difference is output from the speaker of the user I / F unit 44.

図3Bにおいては、図3Aが示す例に対して差分が追加された画面例44aを示している。この例においては、制御部20は、おすすめ度によって各施設をソートし、ソートされた順序で各施設の名称とおすすめ度と現在地からの距離を表示するための制御信号を出力する。図3Bの画面例44aにおいては、各レストランのおすすめ度が5段階で示され、黒色の星の数が多いほどおすすめ度が高い例を示している。むろん、この例は一例であり、おすすめ度でソートするのではなく、おすすめ度を単に追記する構成であってもよい。さらに、図3Bにおいては、差分を強調する音声の例である「おすすめ順にレストランを表示します」が、ナビゲーションシステム10から出力される状態を模式的に示している。   FIG. 3B shows a screen example 44a in which a difference is added to the example shown in FIG. 3A. In this example, the control unit 20 sorts each facility according to the recommendation level, and outputs a control signal for displaying the name, recommendation level, and distance from the current location of each facility in the sorted order. In the screen example 44a of FIG. 3B, the recommendation level of each restaurant is shown in five levels, and the recommendation level increases as the number of black stars increases. Of course, this example is merely an example, and the configuration may be such that the recommendation level is simply added instead of sorting by the recommendation level. Further, FIG. 3B schematically shows a state in which “display restaurants in order of recommendation”, which is an example of a voice emphasizing the difference, is output from the navigation system 10.

(3)外部応答生成処理:
次に、外部システム50が実行する外部応答生成処理を説明する。外部システム50は、ナビゲーションシステム10から発話音声の送信要求が行われた場合に、図2Bに示す外部応答生成処理を実行する。外部応答生成処理が開始されると、外部システム50は、入力内容を受信する(ステップS200)。すなわち、外部システム50は、ナビゲーションシステム10から送信される、発話音声を示す情報を図示しない通信部によって取得する。
(3) External response generation processing:
Next, an external response generation process executed by the external system 50 will be described. The external system 50 executes the external response generation process shown in FIG. 2B when a transmission request for the spoken voice is made from the navigation system 10. When the external response generation process is started, the external system 50 receives the input content (step S200). That is, the external system 50 acquires information indicating the speech voice transmitted from the navigation system 10 by a communication unit (not shown).

次に、外部システム50は、外部データベース50aに基づいて音声認識を行う(ステップS205)。すなわち、外部システム50は、外部データベース50aを参照し、ステップS200で受信された情報が示す発話音声を予め決められた音声認識アルゴリズムで解析し、発話音声の内容として尤も確率の高い文字列を取得する。図3Aに示す例において発話音声が外部システム50に送信された場合、本実施形態に示す外部データベース50aには、「おすすめの」を高確率で認識するための情報が含まれるため、多くの場合、未知語が発生することなく「おすすめのレストランを教えて」が文字列として認識される。   Next, the external system 50 performs voice recognition based on the external database 50a (step S205). That is, the external system 50 refers to the external database 50a, analyzes the utterance voice indicated by the information received in step S200 with a predetermined voice recognition algorithm, and obtains a character string having a high probability as the content of the utterance voice. To do. In the example shown in FIG. 3A, when the uttered voice is transmitted to the external system 50, the external database 50a shown in the present embodiment includes information for recognizing “recommended” with high probability. , "Tell me a recommended restaurant" is recognized as a character string without any unknown words.

次に、外部システム50は、外部データベース50aに基づいて検索結果を取得する(ステップS210)。すなわち、外部システム50は、外部データベース50aを参照し、ステップS205の処理で取得した文字列から検索対象と検索条件とを特定する。例えば、図3Aに示す例において発話音声が外部システム50に送信された場合、「おすすめのレストランを教えて」という文字列が音声認識結果として得られているため、外部システム50は、施設を検索対象とし、レストラン属性およびおすすめ度が対応づけられていることを検索条件とする。   Next, the external system 50 acquires a search result based on the external database 50a (step S210). That is, the external system 50 refers to the external database 50a, and specifies a search target and a search condition from the character string acquired in the process of step S205. For example, in the example shown in FIG. 3A, when the speech voice is transmitted to the external system 50, since the character string “tell me a recommended restaurant” is obtained as a voice recognition result, the external system 50 searches for a facility. A search condition is that a restaurant attribute and recommendation level are associated with each other.

そして、外部システム50は、外部データベース50aを参照して検索条件に合致する検索対象を取得する。図3Aに示す例において発話音声が外部システム50に送信された場合、レストラン属性の施設を検索する。また、外部システム50は、検索された施設に対応づけられたおすすめ度を取得する。検索結果が得られると、外部システム50は、検索された施設の名称、位置、おすすめ度を示す情報を特定し、外部応答とする。   Then, the external system 50 refers to the external database 50a and acquires a search target that matches the search condition. In the example shown in FIG. 3A, when the uttered voice is transmitted to the external system 50, a restaurant attribute facility is searched. In addition, the external system 50 acquires a recommendation level associated with the found facility. When the search result is obtained, the external system 50 specifies information indicating the name, position, and recommendation level of the searched facility, and sets it as an external response.

外部応答が生成されると、外部システム50は、外部応答をナビゲーションシステム10に送信する(ステップS215)。すなわち、外部システム50は、ステップS210の処理によって取得した外部応答を示す情報を、通信部を介して、ナビゲーションシステム10に対して送信する。   When the external response is generated, the external system 50 transmits the external response to the navigation system 10 (step S215). That is, the external system 50 transmits information indicating the external response acquired by the process of step S210 to the navigation system 10 via the communication unit.

(4)他の実施形態:
以上の実施形態は本発明を実施するための一例であり、外部応答とローカル応答との差分を抽出し、当該差分をローカル応答の出力に追加して出力する限りにおいて、他にも種々の実施形態を採用可能である。例えば、ナビゲーションシステム10とともに移動する移動体は任意であり、車両であっても良いし、歩行者であっても良く、種々の例が想定される。また、応答システムは、車両等に搭載された装置であっても良いし、可搬型の端末によって実現される装置であっても良いし、複数の装置(例えば、クライアントとサーバ)によって実現されるシステムであっても良い。
(4) Other embodiments:
The above embodiment is an example for carrying out the present invention. As long as the difference between the external response and the local response is extracted and the difference is added to the output of the local response and output, various other implementations are possible. A form can be adopted. For example, the moving body that moves together with the navigation system 10 is arbitrary, and may be a vehicle or a pedestrian, and various examples are assumed. The response system may be a device mounted on a vehicle or the like, a device realized by a portable terminal, or realized by a plurality of devices (for example, a client and a server). It may be a system.

さらに、応答システムを構成する入力受付部21a、ローカル応答生成部21b、ローカル応答出力部21c、外部応答取得部21d、差分出力部21eの少なくとも一部が複数の装置に分かれて存在していても良い。例えば、制御部20が音声データベース30a2に基づいて音声認識を行った後、音声認識後の文字列を外部システム50に送信し、外部システム50において生成した外部応答を取得する構成等であってもよい。むろん、上述の実施形態の一部の構成が省略されてもよいし、処理の順序が変動または省略されてもよい。例えば、ステップS105は、ステップS110以降の処理と並列で実行されてもよいし、ステップS120の後に実行されてもよい。   Furthermore, even if at least some of the input reception unit 21a, local response generation unit 21b, local response output unit 21c, external response acquisition unit 21d, and difference output unit 21e constituting the response system are divided into a plurality of devices. good. For example, after the control unit 20 performs voice recognition based on the voice database 30a2, the character string after the voice recognition is transmitted to the external system 50, and an external response generated in the external system 50 is acquired. Good. Of course, a part of the configuration of the above-described embodiment may be omitted, and the processing order may be changed or omitted. For example, step S105 may be executed in parallel with the processing after step S110, or may be executed after step S120.

入力受付部は、利用者の入力を受け付けることができればよい。すなわち、応答システムは利用者の入力に対する応答を実行するシステムであり、入力受付部は、利用者が応答を望む内容を特定できるように、利用者の入力を受け付けることができればよい。入力は種々の態様を想定可能であり、例えば、利用者が操作部を操作することによって実現されても良いし、利用者の発話音声がマイク等によって取得されることによって実現されても良い。   The input reception part should just be able to receive a user's input. That is, the response system is a system that executes a response to the user's input, and the input receiving unit only needs to be able to receive the user's input so that the user can specify the content that the user wants to respond to. Various modes can be assumed for the input. For example, the input may be realized by the user operating the operation unit, or may be realized by acquiring the user's uttered voice using a microphone or the like.

ローカル応答生成部は、ローカル記憶媒体に記録されたローカルデータベースに基づいて入力に対する応答であるローカル応答を生成することができればよい。すなわち、利用者の入力内容は、応答システムへの応答を要求する内容であるため、ローカル応答生成部は、ローカルデータベースに基づいて利用者による入力内容を解析し、当該入力内容に対する応答を生成することができればよい。ローカルデータベースは、応答内容を生成するための情報の集合体であれば良く、例えば、音声認識を行うための比較対象となる音声データベースや、応答としての検索結果を取得するための検索データベース、再生対象の音楽を示す音楽データベース等が挙げられる。   The local response generation unit only needs to be able to generate a local response that is a response to an input based on a local database recorded in the local storage medium. That is, since the user input content is content requesting a response to the response system, the local response generation unit analyzes the input content by the user based on the local database and generates a response to the input content. I can do it. The local database may be a collection of information for generating response contents. For example, a voice database to be compared for voice recognition, a search database for obtaining a search result as a response, and playback For example, a music database showing the target music.

ローカル応答生成部は、応答システムに備えられているが、その処理の一部が外部のシステムに存在する制御部で実行されてもよいし、外部記憶媒体に記憶された情報を利用してローカル応答が生成されてもよい。例えば、ローカルデータベースに基づいて入力の音声認識等が行われ、音声認識結果が天候情報の取得である場合に、外部記憶媒体に記録された天候情報を取得する構成等が挙げられる。   Although the local response generation unit is provided in the response system, a part of the processing may be executed by a control unit existing in an external system, or the local response generation unit may be locally used by using information stored in an external storage medium. A response may be generated. For example, a configuration in which weather information recorded in an external storage medium is acquired when speech recognition of input is performed based on a local database and the speech recognition result is acquisition of weather information.

入力と応答の態様は種々の態様が想定可能である。例えば、入力と応答が、情報の要求と情報の提示である例や、命令と実行である例が想定される。入力と応答が情報の要求と情報の提示である場合の、より具体的な例としては、施設情報や天候情報、交通情報等の要求と要求された情報の提示である例や、検索条件に合致する情報の要求と検索結果を示す情報の提示である例等が挙げられる。むろん、提供対象となる情報は、他にも種々の情報を想定可能であり、新規開店した店舗の情報や店舗の価格帯や口コミ評価、おすすめの店舗等の情報等であってもよく、種々の情報が想定される。入力と応答が命令と実行である場合の、より具体的な例としては、記憶媒体に記憶されたファイルの再生(音楽や動画等の再生)命令と、その再生が挙げられる。   Various modes of input and response can be assumed. For example, an example in which the input and response are a request for information and presentation of information, or an example in which an instruction and execution are performed is assumed. More specific examples when the input and response are information requests and information presentations are examples of requesting facility information, weather information, traffic information, etc. and requested information, and search conditions. An example is a request for matching information and presentation of information indicating a search result. Of course, the information to be provided can assume various other information, such as information on newly opened stores, store price ranges, word-of-mouth evaluation, recommended stores, etc. Information is assumed. As a more specific example in the case where the input and response are an instruction and an execution, a command for reproducing a file stored in a storage medium (reproduction of music, moving images, etc.) and its reproduction can be mentioned.

ローカル応答は、ローカル記憶媒体に記録されたローカルデータベースに基づいて生成されれば良い。例えば、応答の生成は、入力内容の認識と認識結果に対応した応答内容の生成とによって実現可能であり、入力内容の認識は、入力内容の文字列化や入力からの命令抽出など、入力内容の解析によって実現可能であり、当該解析にローカルデータベースが使用されても良い。例えば、ローカル応答生成部が、入力としての発話音声とローカルデータベースに記憶された音声データベースとを比較して発話音声を認識する構成等を採用可能である。   The local response may be generated based on a local database recorded on the local storage medium. For example, a response can be generated by recognizing the input content and generating a response content corresponding to the recognition result, and the input content can be recognized by converting the input content into a character string or extracting an instruction from the input. And a local database may be used for the analysis. For example, a configuration in which the local response generation unit recognizes the uttered voice by comparing the uttered voice as the input with the voice database stored in the local database can be employed.

認識結果に対応した応答内容の生成は、入力内容の文字列や命令等が示す処理結果の取得(検索結果の取得等)や、入力内容の文字列や命令等が示す処理の特定(再生音楽の特定等)等によって実現可能である。なお、入力が発話音声であり、当該発話音声の認識結果に基づいてローカル応答としての音声が生成される構成であれば、音声対話システムとしての応答システムが提供される。   The response content corresponding to the recognition result is generated by acquiring the processing result indicated by the character string or command of the input content (acquisition of search results, etc.) or specifying the processing indicated by the character string of the input content or the command (reproduced music) Etc.). In addition, if the input is an uttered voice and a voice is generated as a local response based on the recognition result of the uttered voice, a response system as a voice interactive system is provided.

ローカル応答出力部は、ローカル応答を出力することができればよい。ローカル応答の出力態様は種々の態様を想定可能であり、情報の出力や命令の実行等であっても良い。前者としては、例えば、ディスプレイ等の出力部に対する表示やスピーカー等の出力部からの音声出力がローカル応答の出力である例が挙げられ、後者としては、例えば、スピーカー等の出力部によって音楽が出力される構成が挙げられる。   The local response output unit only needs to be able to output a local response. Various modes of output of the local response can be assumed, and information output, command execution, or the like may be used. Examples of the former include an example in which display on an output unit such as a display or audio output from an output unit such as a speaker is an output of a local response, and examples of the latter include music output by an output unit such as a speaker. The structure which is made is mentioned.

外部応答取得部は、外部記憶媒体に記録された外部データベースに基づいて生成された、利用者による入力に対する応答である外部応答を取得することができればよい。すなわち、外部応答取得部は、応答システムの外部に存在する外部記憶媒体に記録された外部データベースに基づいて生成された外部応答を取得する。外部応答の生成処理は全てが応答システムの外部に存在する外部システムで実行されてもよいし、一部が応答システムで実行され、残りの一部が外部システムで実行されてもよい。後者としては、例えば、入力としての発話音声の認識を応答システムで行って、認識結果に対する応答の生成(情報の検索等)を外部システムで実行する構成等が挙げられる。   The external response acquisition unit only needs to be able to acquire an external response that is a response to the input by the user, generated based on the external database recorded in the external storage medium. That is, the external response acquisition unit acquires an external response generated based on an external database recorded in an external storage medium that exists outside the response system. The external response generation process may be executed entirely by an external system existing outside the response system, or a part thereof may be executed by the response system and the remaining part may be executed by the external system. Examples of the latter include a configuration in which a speech system as an input is recognized by a response system, and a response to the recognition result is generated (information retrieval or the like) by an external system.

なお、外部応答の生成も、外部データベースに基づいて利用者による入力内容を解析し、当該入力内容に対する応答を生成することができればよい。外部データベースは、応答内容を生成するための情報の集合体であり、例えば、音声認識を行うための比較対象となる音声データベースや、応答としての検索結果を取得するための検索データベース、再生対象の音楽を示す音楽データベース等が挙げられる。なお、外部データベースは、ローカルデータベースと異なる応答が取得され得るように構成されている。従って、外部データベースには、ローカルデータベースに含まれない情報が含まれている。   It should be noted that the external response may be generated as long as the input content by the user can be analyzed based on the external database and a response to the input content can be generated. The external database is a collection of information for generating response contents. For example, a speech database to be compared for performing speech recognition, a search database for obtaining a search result as a response, and a reproduction target A music database showing music is listed. The external database is configured so that a response different from that of the local database can be acquired. Therefore, the external database includes information that is not included in the local database.

外部応答についても、入力と応答が種々の組み合わせによって実現可能であることは上述のローカル応答と同様である。外部応答が、外部記憶媒体に記録された外部データベースに基づいて生成されれば良いことも上述のローカル応答と同様であり、例えば、入力内容の認識と認識結果に対応した応答内容の生成とによって外部応答が生成される構成等を採用可能である。音声対話システムを構成するのであれば、入力としての発話音声と外部データベースに記憶された外部音声データベースとを比較して発話音声を認識する構成と、当該発話音声の認識結果に基づいて外部応答としての音声が生成される構成とが採用される。   As for the external response, the input and the response can be realized by various combinations similarly to the above-described local response. The external response may be generated based on an external database recorded in an external storage medium, as in the case of the above-described local response. For example, by recognizing input content and generating response content corresponding to the recognition result A configuration in which an external response is generated can be employed. If configuring a spoken dialogue system, a configuration for recognizing a speech by comparing a speech as an input with an external speech database stored in an external database, and an external response based on the recognition result of the speech A configuration is used in which the voice of the above is generated.

差分出力部は、外部応答とローカル応答との差分を抽出し、当該差分をローカル応答の出力に追加して出力することができればよい。すなわち、差分出力部が差分を出力することにより、ローカル応答の出力が行われても利用者に伝達されなかった情報の追加や処理内容の補足等が行われればよい。差分は、早期の生成可能であるローカル応答に対して追加することによってローカル応答の価値を高めたり、情報を補完したりすることができるように抽出されればよい。従って、ローカル応答に追加することによって利用者の種々の要望に応えることができるように差分を抽出する構成としてよい。   The difference output unit only needs to extract the difference between the external response and the local response and add the difference to the output of the local response. That is, the difference output unit outputs the difference, and it is only necessary to add information that has not been transmitted to the user even if the local response is output, or to supplement the processing content. The difference may be extracted so that the value of the local response can be increased or the information can be supplemented by adding to the local response that can be generated early. Therefore, it is good also as a structure which extracts a difference so that it can respond to a user's various requests by adding to a local response.

例えば、差分の追加は情報の追加であってもよいし、態様の異なる応答の追加であってもよい。後者としては、例えば、ローカル応答によって音楽再生が行われ、外部応答として曲名や歌詞等が得られ、曲名や歌詞等が差分としてディスプレイに出力される構成等であってもよいし、音楽再生中のアーティストの関連ニュースや関連画像が再生される構成等であってもよい。なお、差分の出力態様も種々の態様を想定可能であり、ディスプレイ等の出力部に対する表示やスピーカー等の出力部からの音声出力、音楽の出力等が挙げられる。   For example, the addition of the difference may be an addition of information or an addition of a response having a different aspect. The latter may be, for example, a configuration in which music playback is performed by a local response, a song title or lyrics are obtained as an external response, and the song title or lyrics are output to the display as a difference. The related news and related images of other artists may be reproduced. Various output modes can be assumed for the difference, and examples include display on an output unit such as a display, audio output from an output unit such as a speaker, and music output.

さらに、種々の内容が差分となり得る。例えば、発話音声の中にローカル応答生成部において認識されなかった未知語が含まれ、当該未知語に基づいて外部応答が生成されたことによって外部応答に含まれる情報が差分となってもよい。すなわち、入力としての発話音声がローカルデータベースに基づいて音声認識され、文字列化等がなされることによって入力内容が特定される構成においては、発話音声の個人差や雑音等の影響を受けて認識率が変動し得る。また、ローカルデータベースが更新されない(または更新頻度が外部データベースより少ない)場合、ローカルデータベースに基づいて認識できない単語が外部データベースに基づく音声認識よりも高頻度で存在する。   Furthermore, various contents can be differences. For example, an unknown word that is not recognized by the local response generation unit is included in the uttered voice, and information included in the external response may be a difference due to the generation of the external response based on the unknown word. In other words, in a configuration in which the input content is specified by speech recognition as input based on a local database and characterizing, etc., it is recognized under the influence of individual differences in speech speech, noise, etc. The rate can vary. Further, when the local database is not updated (or the update frequency is less than that of the external database), words that cannot be recognized based on the local database are present more frequently than voice recognition based on the external database.

このように、認識できなかった単語は未知語となるが、同一の発話音声を入力として、外部データベースに基づく認識が行われた場合、未知語が認識され、文字列化等が可能である場合がある。このような場合、未知語の認識結果に応じた応答が外部応答に含まれる。そこで、この場合に未知語に基づいて生成された部分を差分として抽出すれば、ローカル応答に含まれなかった応答を差分として出力することができ、差分の追加出力の価値を高めることができる。   In this way, a word that could not be recognized becomes an unknown word, but when recognition based on an external database is performed using the same utterance as an input, the unknown word is recognized and can be converted into a character string, etc. There is. In such a case, a response according to the recognition result of the unknown word is included in the external response. Therefore, in this case, if a portion generated based on an unknown word is extracted as a difference, a response not included in the local response can be output as a difference, and the value of the additional output of the difference can be increased.

さらに、ローカルデータベースおよび外部データベースが複数の項目を有するレコードを複数個有しており、利用者による入力が示す検索対象についての検索結果を示す応答がローカル応答および外部応答である構成、すなわち、入力が検索指示であり応答の出力が検索結果の出力である構成を想定可能である。この構成において、ローカルデータベースに存在しない項目に関して外部データベースに基づいて検索された結果が差分であると見なす構成が採用されてもよい。   Further, the local database and the external database have a plurality of records having a plurality of items, and the response indicating the search result for the search target indicated by the input by the user is the local response and the external response, that is, the input It is possible to assume a configuration in which is a search instruction and a response output is an output of a search result. In this configuration, a configuration may be adopted in which the result searched based on the external database for items that do not exist in the local database is regarded as a difference.

この構成によれば、ローカル応答としての検索結果で得られなかった情報を、外部応答としての検索結果を取得することによって追加することが可能になり、早期にレスポンスが得られ、かつ、少し待つことによって詳細な検索結果が得られる応答システムを提供することができる。   According to this configuration, it becomes possible to add information that was not obtained in the search result as the local response by acquiring the search result as the external response, and the response can be obtained early and wait a little. Thus, it is possible to provide a response system that can obtain a detailed search result.

さらに、本発明のように、外部応答とローカル応答との差分を抽出し、当該差分をローカル応答の出力に追加して出力する手法は、プログラムや方法としても適用可能である。また、以上のようなシステム、プログラム、方法は、単独の装置として実現される場合や、複数の装置によって実現される場合が想定可能であり、各種の態様を含むものである。例えば、以上のような手段を備えたナビゲーションシステムや方法、プログラムを提供することが可能である。また、一部がソフトウェアであり一部がハードウェアであったりするなど、適宜、変更可能である。さらに、システムを制御するプログラムの記録媒体としても発明は成立する。むろん、そのソフトウェアの記録媒体は、磁気記録媒体であってもよいし光磁気記録媒体であってもよいし、今後開発されるいかなる記録媒体においても全く同様に考えることができる。   Further, the method of extracting the difference between the external response and the local response and adding the difference to the output of the local response as in the present invention is also applicable as a program or method. The system, program, and method as described above can be realized as a single device or can be realized as a plurality of devices, and include various aspects. For example, it is possible to provide a navigation system, method, and program provided with the above means. Further, some changes may be made as appropriate, such as a part of software and a part of hardware. Furthermore, the invention can be realized as a recording medium for a program for controlling the system. Of course, the software recording medium may be a magnetic recording medium, a magneto-optical recording medium, or any recording medium to be developed in the future.

10…ナビゲーションシステム、20…制御部、21…応答プログラム、21a…入力受付部、21b…ローカル応答生成部、21c…ローカル応答出力部、21d…外部応答取得部、21e…差分出力部、30…ローカル記憶媒体、30a…ローカルデータベース、30a1…地図情報、30a2…音声データベース、41…GPS受信部、42…車速センサ、43…ジャイロセンサ、44…ユーザI/F部、45…通信部、50…外部システム、50a…外部データベース   DESCRIPTION OF SYMBOLS 10 ... Navigation system, 20 ... Control part, 21 ... Response program, 21a ... Input reception part, 21b ... Local response generation part, 21c ... Local response output part, 21d ... External response acquisition part, 21e ... Difference output part, 30 ... Local storage medium, 30a ... local database, 30a1 ... map information, 30a2 ... voice database, 41 ... GPS receiver, 42 ... vehicle speed sensor, 43 ... gyro sensor, 44 ... user I / F unit, 45 ... communication unit, 50 ... External system, 50a ... external database

Claims (5)

利用者の入力を受け付ける入力受付部と、
ローカル記憶媒体に記録されたローカルデータベースに基づいて前記入力に対する応答であるローカル応答を生成するローカル応答生成部と、
前記ローカル応答を出力するローカル応答出力部と、
外部記憶媒体に記録された外部データベースに基づいて生成された前記入力に対する応答である外部応答を取得する外部応答取得部と、
前記外部応答と前記ローカル応答との差分を抽出し、当該差分を前記ローカル応答の出力に追加して出力する差分出力部と、
を備える応答システム。
An input reception unit for receiving user input;
A local response generator for generating a local response that is a response to the input based on a local database recorded in a local storage medium;
A local response output unit for outputting the local response;
An external response acquisition unit that acquires an external response that is a response to the input generated based on an external database recorded in an external storage medium;
A difference output unit that extracts a difference between the external response and the local response, adds the difference to the output of the local response, and outputs the difference,
A response system comprising:
前記入力は、
前記利用者の発話音声であり、
前記ローカル応答および前記外部応答は、
前記発話音声を認識した結果に基づいて生成される、
請求項1に記載の応答システム。
The input is
The spoken voice of the user,
The local response and the external response are:
Generated based on the recognition result of the speech,
The response system according to claim 1.
前記差分は、
前記発話音声の中に前記ローカル応答生成部において認識されなかった未知語が含まれ、当該未知語に基づいて前記外部応答が生成されたことによって前記外部応答に含まれる情報である、
請求項2に記載の応答システム。
The difference is
An unknown word that is not recognized by the local response generation unit is included in the utterance voice, and the external response is generated based on the unknown word, and is included in the external response.
The response system according to claim 2.
前記ローカルデータベースおよび前記外部データベースは、
複数の項目を有するレコードを複数個有しており、
前記ローカル応答および前記外部応答は、
前記入力が示す検索対象についての検索結果を示し、
前記差分は、
前記ローカルデータベースに存在しない前記項目に関して前記外部データベースに基づいて検索された結果である、
請求項1〜請求項3のいずれかに記載の応答システム。
The local database and the external database are:
Have multiple records with multiple items,
The local response and the external response are:
A search result for the search target indicated by the input;
The difference is
A search result based on the external database for the item not present in the local database;
The response system according to any one of claims 1 to 3.
コンピュータを、
利用者の入力を受け付ける入力受付部、
ローカル記憶媒体に記録されたローカルデータベースに基づいて前記入力に対する応答であるローカル応答を生成するローカル応答生成部、
前記ローカル応答を出力するローカル応答出力部、
外部記憶媒体に記録された外部データベースに基づいて生成された前記入力に対する応答である外部応答を取得する外部応答取得部、
前記外部応答と前記ローカル応答との差分を抽出し、当該差分を前記ローカル応答の出力に追加して出力する差分出力部、
として機能させる応答プログラム。
Computer
An input reception unit for receiving user input,
A local response generation unit that generates a local response that is a response to the input based on a local database recorded in a local storage medium;
A local response output unit for outputting the local response;
An external response acquisition unit that acquires an external response that is a response to the input generated based on an external database recorded in an external storage medium;
A difference output unit that extracts a difference between the external response and the local response, adds the difference to the output of the local response, and outputs the difference.
As a response program to function as.
JP2016048016A 2016-03-11 2016-03-11 Response system and response program Pending JP2017161815A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016048016A JP2017161815A (en) 2016-03-11 2016-03-11 Response system and response program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016048016A JP2017161815A (en) 2016-03-11 2016-03-11 Response system and response program

Publications (1)

Publication Number Publication Date
JP2017161815A true JP2017161815A (en) 2017-09-14

Family

ID=59857084

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016048016A Pending JP2017161815A (en) 2016-03-11 2016-03-11 Response system and response program

Country Status (1)

Country Link
JP (1) JP2017161815A (en)

Similar Documents

Publication Publication Date Title
US11676575B2 (en) On-device learning in a hybrid speech processing system
US10176801B2 (en) System and method of improving speech recognition using context
US8538759B2 (en) Speech recognition system and data updating method
US20180052824A1 (en) Task identification and completion based on natural language query
US20080288252A1 (en) Speech recognition of speech recorded by a mobile communication facility
US10838954B1 (en) Identifying user content
JP6597527B2 (en) Speech recognition apparatus and speech recognition method
US8583441B2 (en) Method and system for providing speech dialogue applications
US10515634B2 (en) Method and apparatus for searching for geographic information using interactive voice recognition
JP2013088477A (en) Speech recognition system
CN110956955B (en) Voice interaction method and device
US20180052658A1 (en) Information processing device and information processing method
US20220299335A1 (en) Content-aware navigation instructions
US20130226990A1 (en) Information processing system and information processing device
US20200365139A1 (en) Information processing apparatus, information processing system, and information processing method, and program
US10769186B2 (en) System and method for contextual reasoning
US10593323B2 (en) Keyword generation apparatus and keyword generation method
US11862187B2 (en) Systems and methods for jointly estimating sound sources and frequencies from audio
JP2002150039A (en) Service intermediation device
JP2017161815A (en) Response system and response program
US10754902B2 (en) Information processing system and information processing device
JP2017181631A (en) Information controller
US11790898B1 (en) Resource selection for processing user inputs
JP6324249B2 (en) Electronic device, voice recognition system, and voice recognition program
JP6115202B2 (en) Speech recognition system, method and program