JP6223739B2 - Function execution instruction system and function execution instruction method - Google Patents

Function execution instruction system and function execution instruction method Download PDF

Info

Publication number
JP6223739B2
JP6223739B2 JP2013153624A JP2013153624A JP6223739B2 JP 6223739 B2 JP6223739 B2 JP 6223739B2 JP 2013153624 A JP2013153624 A JP 2013153624A JP 2013153624 A JP2013153624 A JP 2013153624A JP 6223739 B2 JP6223739 B2 JP 6223739B2
Authority
JP
Japan
Prior art keywords
function
category
word
execution
task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013153624A
Other languages
Japanese (ja)
Other versions
JP2015025856A (en
Inventor
公亮 角野
公亮 角野
孝輔 辻野
孝輔 辻野
拓 藤本
拓 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2013153624A priority Critical patent/JP6223739B2/en
Publication of JP2015025856A publication Critical patent/JP2015025856A/en
Application granted granted Critical
Publication of JP6223739B2 publication Critical patent/JP6223739B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、1つ以上の機能の実行を指示することができる機能実行指示システム、機能実行指示方法及び機能実行指示プログラムに関する。   The present invention relates to a function execution instruction system, a function execution instruction method, and a function execution instruction program that can instruct execution of one or more functions.

従来から、ユーザの音声を認識して、認識した音声に基づいて機能を実行するシステムが知られている。例えば特許文献1には、カーナビゲーション装置において認識した音声に基づいて、登録地を目的地として設定したり、登録地の地図を見たりといった機能が実行されることが記載されている。   Conventionally, a system that recognizes a user's voice and executes a function based on the recognized voice is known. For example, Patent Document 1 describes that functions such as setting a registered location as a destination and viewing a map of the registered location are executed based on voice recognized by the car navigation device.

特開2006−23444号公報JP 2006-23444 A

ここで、複数の機能(タスク)を実行可能で、かつユーザが複数回に渡って発話指示(音声による指示)が可能な音声エージェントシステムを考える。従来のこうしたシステムにおいては、発話された内容がそれまでのタスクにおける条件付加や変更の発話であるのか、あるいはそれまでのタスクと関係のない、新しい要件の発話であるのかが判断できない。   Here, a voice agent system is considered in which a plurality of functions (tasks) can be executed and a user can give an utterance instruction (instruction by voice) multiple times. In such a conventional system, it cannot be determined whether the uttered content is an utterance of condition addition or change in the previous task or an utterance of a new requirement unrelated to the previous task.

例えば、ユーザが「東京までの乗換」とシステムに対して発話した場合、システムではユーザの最寄り駅から東京駅までの乗換が調べられる(乗換案内のアプリケーションが起動される)。その後、ユーザが、東京駅までの乗換ではなく横浜駅までの乗換を知りたいため「やっぱり横浜」と発話したものとする。このとき、ユーザの発話内容から新たに実行されるタスクが判断されるものとすると、「やっぱり横浜」という発話に「乗換」という乗換を調べるタスクを実行するためのキーワードが含まれていないため、乗換を調べるタスクではなく、例えば、地名のみから起動される横浜の地図を調べるタスクが実行されてしまうこととなる。   For example, if the user speaks to the system as “transfer to Tokyo”, the system checks the transfer from the user's nearest station to Tokyo station (a transfer guidance application is activated). After that, it is assumed that the user speaks “Yokohama” because he wants to know the transfer to Yokohama Station instead of the transfer to Tokyo Station. At this time, if the task to be newly executed is determined from the user's utterance content, the utterance “Yokohama” does not include the keyword for executing the task of checking the transfer “transfer”. For example, a task of examining a map of Yokohama that is activated only from a place name is executed instead of a task of examining a transfer.

一方で、以前のタスクである乗換を調べるタスクが引き継がれたとすると、ユーザの希望通り、横浜駅までの乗換が調べられることが可能となる。しかし、このように一律にタスクを引き継ぐものとすると、「東京までの乗換」との発話の後にユーザが乗換ではなく、カレーの店舗を調べたいため「カレー」と発話した場合であっても、再度、乗換を調べるタスクが実行されてしまうこととなる。上記のように単に入力された単語によってタスクを実行することとすると、連続して入力された単語により適切なタスクを実行することができない。   On the other hand, if the task for checking the transfer, which is the previous task, has been taken over, it is possible to check the transfer to Yokohama Station as desired by the user. However, if the task is to be taken over uniformly in this way, even if the user says `` curry '' because he wants to check the curry store after uttering `` transfer to Tokyo '', The task for checking the transfer is executed again. As described above, if a task is simply executed by a word that is input, an appropriate task cannot be executed by a word that is continuously input.

本発明は、上記の問題点に鑑みてなされたものであり、連続して入力された単語による機能の実行を適切に行うことができる機能実行指示システム及び機能実行指示方法を提供することを目的とする。   The present invention has been made in view of the above problems, and an object of the present invention is to provide a function execution instruction system and a function execution instruction method that can appropriately execute a function using words that are continuously input. And

上記の目的を達成するために、本発明に係る機能実行指示システムは、機能毎に予め設定されたカテゴリに関連する1つ以上の機能の実行を指示する機能実行指示手段と、単語を含む情報を入力する単語入力手段と、単語入力手段によって入力された情報に含まれる単語のカテゴリを、当該情報に含まれる当該単語以外の単語に基づいて特定するカテゴリ特定手段と、カテゴリ特定手段によって特定されたカテゴリに応じて、1つ以上の機能から機能実行指示手段によって実行が指示される機能を決定する実行機能決定手段と、を備え、実行機能決定手段は、カテゴリ特定手段によって特定されたカテゴリ、及び過去に機能実行指示手段によって実行が指示された機能に関連するカテゴリに基づいて、当該過去に機能実行指示手段によって実行が指示された機能の実行をこれから指示するか否か判断し、当該過去に前記機能実行指示手段によって実行が指示された機能の実行をこれから指示しないと判断した場合に、前記単語入力手段によって入力された情報に含まれる単語に基づいて、これから実行が指示される機能を新たに決定する。 In order to achieve the above object, a function execution instruction system according to the present invention includes a function execution instruction means for instructing execution of one or more functions related to a category preset for each function, and information including words A word input means for inputting a word, a category specifying means for specifying a category of a word included in the information input by the word input means based on a word other than the word included in the information, and a category specifying means An execution function determination unit that determines a function that is instructed to be executed by the function execution instruction unit from one or more functions according to the category, and the execution function determination unit includes a category identified by the category identification unit, And based on the category related to the function that has been instructed by the function execution instructing means in the past, Input but if the execution of the indicated function is determined whether an instruction therefrom, it is determined that execution to the past by the function execution instruction means does not now instruct the execution of the indicated function, by the word input means Based on the word included in the information, the function to be instructed for execution is newly determined .

本発明に係る機能実行指示システムでは、機能に関連するカテゴリと入力された単語のカテゴリとに基づいて、過去に実行が指示された機能の実行をこれから指示するか否かが判断される。これにより、例えば、過去に実行された機能を引き続いて実行すべきか、新たな機能を実行すべきか適切に判断される。また、本発明に係る機能実行指示システムでは、入力された単語のカテゴリが、当該単語が含まれる情報に含まれる当該単語以外の単語に基づいて特定されるため、適切にカテゴリが特定される。即ち、本発明に係る機能実行指示システムによれば、連続して入力された単語による機能の実行を適切に行うことができる。   In the function execution instruction system according to the present invention, it is determined whether to instruct execution of a function that has been instructed in the past based on the category related to the function and the category of the input word. Accordingly, for example, it is appropriately determined whether a function executed in the past should be executed subsequently or a new function should be executed. Further, in the function execution instruction system according to the present invention, the category of the input word is specified based on the word other than the word included in the information including the word, and thus the category is appropriately specified. That is, according to the function execution instructing system according to the present invention, it is possible to appropriately execute the function by the continuously input words.

カテゴリ特定手段は、単語入力手段によって入力された情報に含まれる特定対象の単語と当該情報に含まれる当該単語以外の単語とが同一の情報に含まれる度合いを示す情報に基づいて、特定対象の単語のカテゴリを特定することとしてもよい。この構成によれば、特定対象の単語以外の単語を用いて確実に特定対象の単語のカテゴリを特定することができ、確実かつ適切に本発明を実施することができる。   The category specifying means is based on information indicating the degree to which a word to be specified included in the information input by the word input means and a word other than the word included in the information are included in the same information. It is good also as specifying the category of a word. According to this configuration, the category of the word to be specified can be reliably specified using a word other than the word to be specified, and the present invention can be implemented reliably and appropriately.

機能実行指示システムは、機能実行指示手段によって実行が指示された機能を記憶する実行機能記憶手段を更に備え、実行機能決定手段は、カテゴリ特定手段によって特定されたカテゴリ、及び実行機能記憶手段によって記憶された過去に機能実行指示手段によって実行が指示された機能に関連するカテゴリに基づいて、当該過去に機能実行指示手段によって実行が指示された機能の実行をこれから指示するか否か判断する、こととしてもよい。   The function execution instruction system further includes an execution function storage means for storing a function instructed to be executed by the function execution instruction means, and the execution function determination means stores the category specified by the category specification means and the execution function storage means. Determining whether or not to instruct execution of a function that has been instructed to be executed by the function execution instructing means in the past based on a category related to the function that has been instructed to be executed by the function execution instructing means in the past. It is good.

実行機能決定手段は、カテゴリ特定手段によって特定されたカテゴリに応じて、当該カテゴリに係る単語が単語入力手段によって入力される直前に機能実行指示手段によって実行が指示された機能の実行を指示するか否か判断することとしてもよい。この構成によれば、例えば、直前に実行された機能を引き続いて実行すべきか、新たな機能を実行すべきか適切に判断され、連続して入力された単語による機能の実行を適切に行うことができる。   Whether the execution function determining means instructs the execution of the function instructed to be executed by the function execution instructing means immediately before a word related to the category is input by the word input means according to the category specified by the category specifying means. It may be determined whether or not. According to this configuration, for example, it is appropriately determined whether the function executed immediately before should be executed continuously or a new function should be executed, and the function can be appropriately executed by continuously input words. it can.

機能実行指示手段によって実行が指示される機能には、単語入力手段によって入力された情報に含まれると共に当該機能に関連するカテゴリの単語を入力する機能が含まれており、実行機能決定手段は、カテゴリ特定手段によって特定されたカテゴリの単語が、過去に機能実行指示手段によって実行が指示された機能への入力が可能か否かを判断して、当該判断に応じて当該過去に機能実行指示手段によって実行が指示された機能の実行を指示するか否かを判断する、こととしてもよい。この構成によれば、機能の実行と合わせて、入力された単語を当該機能への入力とすることができ、ユーザの利便性を向上させることができる。例えば、上述した乗換案内の機能の実行と合わせて、入力された駅名による案内を行うことができる。また、より適切に過去に実行された機能を実行するか否かを判断することができ、より適切に本発明の一実施形態を実施することができる。   The function that is instructed to be executed by the function execution instructing unit includes a function that is included in the information input by the word input unit and that inputs a word of a category related to the function. It is determined whether or not the words of the category specified by the category specifying means can be input to the function for which execution has been instructed by the function execution instructing means in the past, and the function execution instructing means in the past according to the determination It is also possible to determine whether or not to instruct execution of the function instructed to execute by. According to this configuration, together with the execution of the function, the input word can be used as an input to the function, and the convenience for the user can be improved. For example, in combination with the execution of the transfer guidance function described above, guidance based on the input station name can be performed. Further, it is possible to determine whether or not to execute a function executed in the past more appropriately, and it is possible to more appropriately implement an embodiment of the present invention.

また、実行機能決定手段は、カテゴリ特定手段によって特定されたカテゴリと、過去に実行が指示された機能への入力とされた単語のカテゴリとが一致するか否かを判断して、一致すると判断した場合に当該機能の実行をこれから指示すると判断することとしてもよい。この構成によれば、更に適切に本発明の一実施形態を実施することができる。   In addition, the execution function determining means determines whether the category specified by the category specifying means matches the category of the word that has been input to the function for which execution has been instructed in the past. In such a case, it may be determined that the execution of the function will be instructed. According to this configuration, the embodiment of the present invention can be more appropriately implemented.

機能実行指示システムは、音声を入力して、入力した音声に対して音声認識を行って、音声認識を行った結果を単語入力手段に入力する音声認識手段を更に備えることとしてもよい。この構成によれば、ユーザの音声によって機能を実行することが可能となる。   The function execution instruction system may further include voice recognition means for inputting voice, performing voice recognition on the input voice, and inputting the result of voice recognition to the word input means. According to this configuration, the function can be executed by the user's voice.

ところで、本発明は、上記のように機能実行指示システムの発明として記述できる他に、以下のように機能実行指示方法の発明としても記述することができる。これはカテゴリが異なるだけで、実質的に同一の発明であり、同様の作用及び効果を奏する。   By the way, the present invention can be described as the invention of the function execution instruction system as described above, as well as the invention of the function execution instruction method as follows. This is substantially the same invention only in different categories, and has the same operations and effects.

即ち、本発明に係る機能実行指示方法は、機能実行指示システムの動作方法である機能実行指示方法であって、機能毎に予め設定されたカテゴリに関連する1つ以上の機能の実行を指示する機能実行指示ステップと、単語を含む情報を入力する単語入力ステップと、単語入力ステップにおいて入力された情報に含まれる単語のカテゴリを、当該情報に含まれる当該単語以外の単語に基づいて特定するカテゴリ特定ステップと、カテゴリ特定ステップにおいて特定されたカテゴリに応じて、1つ以上の機能から機能実行指示ステップにおいて実行が指示される機能を決定する実行機能決定ステップと、を含み、実行機能決定ステップにおいて、カテゴリ特定ステップにおいて特定されたカテゴリ、及び過去に機能実行指示ステップにおいて実行が指示された機能に関連するカテゴリに基づいて、当該過去に機能実行指示ステップにおいて実行が指示された機能の実行をこれから指示するか否か判断し、当該過去に前記機能実行指示ステップにおいて実行が指示された機能の実行をこれから指示しないと判断した場合に、前記単語入力ステップにおいて入力された情報に含まれる単語に基づいて、これから実行が指示される機能を新たに決定する。 That is, the function execution instruction method according to the present invention is a function execution instruction method that is an operation method of the function execution instruction system, and instructs execution of one or more functions related to a preset category for each function. A function execution instruction step, a word input step for inputting information including a word, and a category for specifying a category of words included in the information input in the word input step based on a word other than the word included in the information An execution function determination step for determining a function to be executed in the function execution instruction step from one or more functions according to the category specified in the category specification step; , The category specified in the category specifying step, and executed in the function execution instruction step in the past Based on the categories associated with the indicated function, it determines whether to now direct the execution of the functions executed in the function execution instruction step in the past has been instructed, executed in the function execution instruction step to the last instruction When it is determined that the execution of the performed function is not instructed from now on, a function to be instructed for execution is newly determined based on the word included in the information input in the word input step .

本発明では、機能に関連する(対応付けられた)カテゴリと入力された単語のカテゴリとに基づいて、過去に実行が指示された機能の実行をこれから指示するか否かが判断される。これにより、例えば、過去に実行された機能を引き続いて実行すべきか、新たな機能を実行すべきか適切に判断される。また、本発明では、入力された単語のカテゴリが、当該単語が含まれる情報に含まれる当該単語以外の単語に基づいて特定されるため、適切にカテゴリが特定される。即ち、本発明によれば、連続して入力された単語による機能の実行を適切に行うことができる。   In the present invention, based on the category related to (associated with) the function and the category of the input word, it is determined whether or not to instruct execution of the function that has been instructed in the past. Accordingly, for example, it is appropriately determined whether a function executed in the past should be executed subsequently or a new function should be executed. In the present invention, since the category of the input word is specified based on a word other than the word included in the information including the word, the category is appropriately specified. In other words, according to the present invention, it is possible to appropriately perform the function by the continuously input words.

本発明の実施形態に係る機能実行指示システムの構成を示す図である。It is a figure which shows the structure of the function execution instruction | indication system which concerns on embodiment of this invention. 機能実行指示システムにおいて実行されるタスクとスロットとの対応関係を示す図である。It is a figure which shows the correspondence of the task and slot which are performed in a function execution instruction system. 単語からカテゴリを特定するための情報を示す表である。It is a table | surface which shows the information for specifying a category from a word. ユーザの発話が「東京までの乗換」というものであった場合のタスク毎のスコアを示す表である。It is a table | surface which shows the score for every task when a user's utterance is what is "transfer to Tokyo." ユーザの発話が「やっぱり横浜」というものであった場合のタスク毎のスコアを示す表である。It is a table | surface which shows the score for every task when a user's utterance is what is still "Yokohama." ユーザの発話が「カレー」というものであった場合のタスク毎のスコアを示す表である。It is a table | surface which shows the score for every task when a user's utterance is what is "curry." 機能実行指示システムに記憶される共起確率を示すテーブルである。It is a table which shows the co-occurrence probability memorize | stored in a function execution instruction | indication system. 本発明の実施形態に係る機能実行指示システムを構成する機能実行指示サーバ及び音声認識サーバのハードウェア構成を示す図である。It is a figure which shows the hardware constitutions of the function execution instruction | indication server and speech recognition server which comprise the function execution instruction | indication system which concerns on embodiment of this invention. 本発明の実施形態に係る機能実行指示システムで実行される処理(機能実行指示方法)を示すフローチャートである。It is a flowchart which shows the process (function execution instruction method) performed with the function execution instruction system which concerns on embodiment of this invention. 単語のカテゴリの特定の処理を示すフローチャートである。It is a flowchart which shows the specific process of the category of a word.

以下、図面と共に本発明に係る機能実行指示システム及び機能実行指示方法の実施形態について詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。   DESCRIPTION OF EMBODIMENTS Hereinafter, embodiments of a function execution instruction system and a function execution instruction method according to the present invention will be described in detail with reference to the drawings. In the description of the drawings, the same elements are denoted by the same reference numerals, and redundant description is omitted.

図1に本実施形態に係る機能実行指示システム1を示す。機能実行指示システム1は、機能実行指示サーバ10と音声認識サーバ20とを備えて構成される。機能実行指示システム1は、通信端末30に対して予め設定された1つ以上の機能の実行を指示するシステムである。機能実行指示システム1から通信端末30に対して実行が指示される機能は、例えば、乗換案内、電話帳検索、グルメ検索、画像検索、音楽検索、音楽プレーヤ、スケジューラ、メール、メモ、ルート案内、地図検索が相当する。なお、本実施形態では、実行される機能をタスクと呼ぶ。具体的には、乗換案内、電話帳検索、グルメ検索、画像検索、音楽検索、地図検索に関しては、例えば、通信端末30において案内や検索結果の情報が表示出力される。   FIG. 1 shows a function execution instruction system 1 according to this embodiment. The function execution instruction system 1 includes a function execution instruction server 10 and a voice recognition server 20. The function execution instruction system 1 is a system that instructs the communication terminal 30 to execute one or more preset functions. Functions to be instructed to be executed from the function execution instruction system 1 to the communication terminal 30 are, for example, transfer guidance, telephone directory search, gourmet search, image search, music search, music player, scheduler, mail, memo, route guidance, Map search is equivalent. In the present embodiment, the function to be executed is called a task. Specifically, with regard to transfer guidance, telephone directory search, gourmet search, image search, music search, and map search, for example, information on the guidance and search results is displayed and output at the communication terminal 30.

また、メール作成、音楽プレーヤ、スケジューラ、電話の発着信、カメラ等に関しては、通信端末30においてそれらのタスクを実行するためのアプリケーションプログラムが起動される。更に指示の内容によっては、アプリケーションプログラム起動後の動作も行われる。例えば、メール作成のタスクでは、メール本文や宛先への情報の入力が行われる。   In addition, with regard to mail creation, music player, scheduler, incoming / outgoing calls, cameras, etc., application programs for executing these tasks are started in the communication terminal 30. Further, depending on the content of the instruction, an operation after the application program is started is also performed. For example, in the mail creation task, information is entered into the mail text and destination.

通信端末30は、通信網(例えば、移動体通信網)を介して機能実行指示サーバ10及び音声認識サーバ20等と通信を行うことができる装置であり、例えば、携帯電話機やPC(Personal Computer)に相当する。また、通信端末30は、自動車等の車両で用いられるカーナビゲーション機能を搭載する端末であってもよい。本実施形態では、通信端末30がカーナビゲーション機能を搭載する端末として説明する。例えば、通信端末30は、車両に対して着脱可能に構成されており、車両に装着されて搭載された場合にカーナビゲーション機能を発揮することができる。なお、通信端末30は、車両に装着されない場合(例えば、単に車両内に置かれる場合や車両に乗車しているユーザが携帯している場合)であっても、カーナビゲーション機能を発揮できてもよい。   The communication terminal 30 is a device that can communicate with the function execution instruction server 10 and the voice recognition server 20 through a communication network (for example, a mobile communication network), such as a mobile phone or a PC (Personal Computer). It corresponds to. The communication terminal 30 may be a terminal equipped with a car navigation function used in a vehicle such as an automobile. In the present embodiment, the communication terminal 30 will be described as a terminal having a car navigation function. For example, the communication terminal 30 is configured to be detachable from the vehicle, and can exhibit a car navigation function when mounted and mounted on the vehicle. Note that the communication terminal 30 may be able to exhibit the car navigation function even when it is not attached to the vehicle (for example, when it is simply placed in the vehicle or carried by a user who is on the vehicle). Good.

上記のタスクは、ユーザの音声をトリガとして実行されるため、通信端末30はユーザの音声を入力する機能を有している。また、通信端末30は、機能実行指示システム1からの指示を受けてタスクを実行する機能、例えば、情報の受信機能、情報処理機能及び表示機能等を有している。   Since the above task is executed with the user's voice as a trigger, the communication terminal 30 has a function of inputting the user's voice. In addition, the communication terminal 30 has a function of executing a task in response to an instruction from the function execution instruction system 1, for example, an information reception function, an information processing function, a display function, and the like.

即ち、通信端末30は、1つ以上の(あるいは複数の)タスクを実行する機能実行手段を有している。具体的には、通信端末30は、タスクに対応するアプリケーションプログラムを予め記憶しておき、記憶したアプリケーションプログラムを実行(起動)することによってタスクを実行する。通信端末30によって実行されるタスクは、後述するように機能実行指示サーバ10によって指示される。また、タスクの実行は、アプリケーションを実行する以外にも、ネットワークからタスクに応じた情報を取得することで行われてもよい。   That is, the communication terminal 30 has a function execution unit that executes one or more (or a plurality of) tasks. Specifically, the communication terminal 30 stores an application program corresponding to the task in advance, and executes the task by executing (starting) the stored application program. The task executed by the communication terminal 30 is instructed by the function execution instruction server 10 as described later. In addition to executing the application, the task may be executed by acquiring information corresponding to the task from the network.

機能実行指示システム1による通信端末30に対するタスクの実行の指示は、次のように行われる。まず、通信端末30がユーザの音声を入力する。入力された音声は、通信端末30から音声認識サーバ20に送信される。音声認識サーバ20は、通信端末30から音声を受信し、受信した音声に対して音声認識を行う。音声認識サーバ20は、音声認識の結果である文章あるいは単語の集合を通信端末30に送信する。通信端末30は、音声認識の結果を受信して、更に機能実行指示サーバ10に送信する。機能実行指示サーバ10は、当該音声認識の結果を受信して、その音声認識の結果に基づいて実行すべきタスクを決定して、当該タスクを実行するように通信端末30に指示する。例えば、機能実行指示サーバ10は、実行すべきタスクを示す情報を通信端末30に送信する。通信端末30は、機能実行指示サーバ10からの指示を受信して、当該指示に応じたタスクを実行する。なお、音声認識の結果である文章あるいは単語の集合はいったん通信端末30に送られることなく、音声認識サーバ20から機能実行指示サーバ10へ直接送信されてもよい。更に、機能実行指示サーバ10と音声認識サーバ20は一体であってもよい。   The function execution instruction system 1 instructs the communication terminal 30 to execute a task as follows. First, the communication terminal 30 inputs a user's voice. The input voice is transmitted from the communication terminal 30 to the voice recognition server 20. The voice recognition server 20 receives voice from the communication terminal 30 and performs voice recognition on the received voice. The voice recognition server 20 transmits a sentence or a set of words as a result of the voice recognition to the communication terminal 30. The communication terminal 30 receives the result of voice recognition and further transmits it to the function execution instruction server 10. The function execution instruction server 10 receives the result of the voice recognition, determines a task to be executed based on the result of the voice recognition, and instructs the communication terminal 30 to execute the task. For example, the function execution instruction server 10 transmits information indicating a task to be executed to the communication terminal 30. The communication terminal 30 receives an instruction from the function execution instruction server 10 and executes a task according to the instruction. Note that a set of sentences or words as a result of voice recognition may be directly transmitted from the voice recognition server 20 to the function execution instruction server 10 without being sent to the communication terminal 30 once. Furthermore, the function execution instruction server 10 and the voice recognition server 20 may be integrated.

例えば、通信端末30のユーザが「東京駅の乗換」と発話した場合には、機能実行指示サーバ10において、通信端末30の現在位置の最寄り駅から東京駅までの乗換案内のタスクが実行されるものと判断されて、乗換案内のタスクの実行が通信端末30に指示される。なお、上記のように乗換案内のタスクが実行される場合には、そのタスクの実行の際に通信端末30の現在位置の取得が行われる。このように、タスクによっては必要に応じて付加的な情報の取得が行われる。以上が、本実施形態に係る機能実行指示システム1の概要である。   For example, when the user of the communication terminal 30 speaks “Transfer at Tokyo Station”, the function execution instruction server 10 executes the task of transfer guidance from the nearest station to the Tokyo station at the current position of the communication terminal 30. The communication terminal 30 is instructed to execute the transfer guidance task. When the transfer guidance task is executed as described above, the current position of the communication terminal 30 is acquired when the task is executed. As described above, additional information is acquired as necessary depending on the task. The above is the outline of the function execution instruction system 1 according to the present embodiment.

引き続いて、本実施形態に係る機能実行指示システム1の機能について説明する。音声認識サーバ20は、音声を入力して、入力した音声に対して音声認識を行い、音声認識を行った結果を出力する音声認識手段である装置である。具体的には、上述したように音声認識サーバ20は、通信端末30から音声データを受信する。音声認識サーバ20は、音声認識エンジンを有しており、当該音声認識エンジンを用いて音声認識を行う。音声認識自体は、従来の任意の音声認識方法を利用することができる。音声認識サーバ20は、音声認識結果を単語の集合(1以上の単語からなる単語群)あるいは文章として取得して、通信端末30に送信する。   Subsequently, functions of the function execution instruction system 1 according to the present embodiment will be described. The voice recognition server 20 is a device that is a voice recognition unit that inputs voice, performs voice recognition on the input voice, and outputs a result of the voice recognition. Specifically, as described above, the voice recognition server 20 receives voice data from the communication terminal 30. The voice recognition server 20 has a voice recognition engine, and performs voice recognition using the voice recognition engine. For speech recognition itself, any conventional speech recognition method can be used. The voice recognition server 20 acquires the voice recognition result as a set of words (a group of words including one or more words) or a sentence and transmits the result to the communication terminal 30.

図1に示すように、機能実行指示サーバ10は、機能実行指示部11と、単語入力部12と、カテゴリ特定部13と、実行機能決定部14と、実行機能記憶部15とを備えて構成される。   As shown in FIG. 1, the function execution instruction server 10 includes a function execution instruction unit 11, a word input unit 12, a category identification unit 13, an execution function determination unit 14, and an execution function storage unit 15. Is done.

機能実行指示部11は、通信端末30に対して、1つあるいは複数のタスクの実行を指示する機能実行指示手段である。具体的には、機能実行指示部11は、タスクを実行させるコマンドを通信端末30に送信することでタスクの実行を指示する。機能実行指示部11によって実行が指示されるタスクは、後述するように実行機能決定部14によって決定される。   The function execution instructing unit 11 is a function execution instructing unit that instructs the communication terminal 30 to execute one or more tasks. Specifically, the function execution instructing unit 11 instructs the execution of the task by transmitting a command for executing the task to the communication terminal 30. The task whose execution is instructed by the function execution instructing unit 11 is determined by the execution function determining unit 14 as described later.

タスクは、タスク毎に予め設定されたカテゴリに関連する(対応付けられている)。カテゴリは、例えば、単語を属性毎に区分けするものである。例えば、カテゴリは、「駅(駅名)」、「商業施設名」、「海外旅行」、「料理名」及び「人名」である。例えば、乗換案内のタスクであれば、「駅」のカテゴリに関連する(対応付けられている)。また、グルメ検索のタスクであれば、「料理名」のカテゴリに関連する(対応付けられている)。また、電話帳検索のタスクであれば、「人名」のカテゴリに関連する(対応付けられている)。また、タスクは、予め設定した単語に対応付けられていてもよい。例えば、乗換案内のタスクであれば、「乗換」という単語に対応付けられている。これらの対応付けは、例えば、予め機能実行指示システム1の管理者等によって機能実行指示サーバ10に入力されて記憶されている。これらの関連及び対応付けは、後述するように実行が指示されるタスクの判断に用いられる。具体的にどのように用いられるかは後述する。   A task is related to (associated with) a category set in advance for each task. The category, for example, classifies words for each attribute. For example, the categories are “station (station name)”, “commercial facility name”, “overseas travel”, “dishes name”, and “person name”. For example, in the case of a transfer guidance task, it is related to (associated with) the category of “station”. Further, if it is a gourmet search task, it is related to (associated with) the category of “dishes name”. In the case of a telephone directory search task, it is related to (associated with) the “person name” category. The task may be associated with a preset word. For example, a task of transfer guidance is associated with the word “transfer”. These associations are input and stored in the function execution instruction server 10 in advance by, for example, an administrator of the function execution instruction system 1 or the like. These associations and associations are used to determine a task to be executed as will be described later. The specific usage will be described later.

また、実行が指示されるタスクには、単語を入力(引数)とする機能がある。これをタスクのスロットと呼ぶ。スロットは予め定められている。例えば、図2に示すように乗換案内のタスクであれば、発駅や着駅をスロットへの入力としてタスクが実行される。あるいは、グルメ検索のタスクであれば、料理名をスロットへの入力として、入力された料理に関しての店舗が検索される。また、電話帳検索のタスクであれば、人名をスロットへの入力として、入力された人名に対応付けられた電話番号等の情報が検索される。なお、タスクには0個以上のスロットが定義されている。即ち、スロットがないタスクもある。   In addition, the task instructed to execute has a function of inputting words (arguments). This is called a task slot. The slot is predetermined. For example, as shown in FIG. 2, in the case of a transfer guidance task, the task is executed with the departure station and arrival station as inputs to the slot. Alternatively, in the case of a gourmet search task, a store relating to the input dish is searched using the dish name as an input to the slot. In the case of a telephone directory search task, information such as a telephone number associated with the input person name is searched using the person name as an input to the slot. Note that zero or more slots are defined for the task. That is, some tasks do not have slots.

図2に示すように、スロットには、それぞれ「スロット型」、「サイズ」、「必須?」、「引き継ぐ?」の情報が対応付けられている。「スロット型」は、スロットに入力されるカテゴリ(スロットに受け入れることができる単語の型)を特定する情報等であり、例えばカテゴリIDの情報等を示している(保持している)。即ち、スロットには、単語のカテゴリが対応付けられる。図2の例では、着駅及び発駅に対応するスロットのスロット型として「type_station」が保持されているが、これは当該スロットに対して、単語のカテゴリとして「駅」が入力可能であることを表している。また、スロット型は、単語が特定の表現だった場合に単語を入力可能とするものとしてもよい。例えば「〜まで」(図2の着駅のto.*type_stationに相当)や「〜から」(図2の着駅のfrom.*type_stationに相当)等の表現の場合に「〜」に対応する単語をスロットに入力するものであってもよい。また、「スロット型」は、特定のカテゴリを特定するものでなくてもよく、任意のカテゴリの単語が入力できるようになっていてもよい。「サイズ」は、スロットに入力される単語の数を示している。「必須?」は、当該タスクを実行する際に単語の入力が必須であるか否かを示している。もし、「必須?」の欄のTrueのスロットに入力される単語が無い場合には、タスクを実行せずにスロット内容を聞き返して、ユーザに対して当該スロットへの入力を促すこととしてもよい。   As shown in FIG. 2, each slot is associated with information of “slot type”, “size”, “essential?”, And “takeover?”. The “slot type” is information specifying a category (a type of a word that can be accepted in the slot) input to the slot, and indicates (holds), for example, category ID information. That is, a word category is associated with the slot. In the example of FIG. 2, “type_station” is held as the slot type of the slot corresponding to the arrival station and the departure station. This means that “station” can be input as the word category for the slot. Represents. The slot type may be configured such that a word can be input when the word is a specific expression. For example, “to” corresponds to “to” in the case of expressions such as “to” (equivalent to to. * Type_station of the arrival station in FIG. 2) and “to from” (equivalent to from. * Type_station of the arrival station in FIG. 2). A word may be input into a slot. Further, the “slot type” does not have to specify a specific category, and a word of an arbitrary category may be input. “Size” indicates the number of words input to the slot. “Mandatory?” Indicates whether or not input of a word is essential when executing the task. If there is no word to be input to the True slot in the “required?” Field, the slot content may be returned without executing the task, and the user may be prompted to input to the slot. .

「引き継ぐ?」は、後述するように当該タスクが引き続き実行される場合にスロットへの入力も引き継ぐか否かを示している。また、各スロットには、スロットへの単語の入力が無かった場合に予め設定された単語(デフォルトの単語)が入力されるかを示す情報が対応付けられていてもよい。例えば、乗換案内の場合は、発駅については、GPS(Global Positioning System)等で取得されるユーザの現在位置から最も近い駅の駅名をデフォルトの単語として入力することとしてもよい。   “Takeover?” Indicates whether or not the input to the slot is taken over when the task is continuously executed, as will be described later. Each slot may be associated with information indicating whether a preset word (default word) is input when no word is input to the slot. For example, in the case of transfer guidance, for the departure station, the station name of the station closest to the current position of the user acquired by GPS (Global Positioning System) or the like may be input as a default word.

単語入力部12は、単語を含む情報を入力する単語入力手段である。具体的には、単語入力部12は、通信端末30から、音声認識サーバ20による音声認識の結果である1つ以上の単語を示す情報を受信することで上記の情報を入力する。あるいは、音声認識サーバ20による音声認識の結果が文章(入力文)である場合には、単語入力部12は、文章を受信して、文章から単語を抽出する、又は文書を単語に切り分けることで単語を取得する。なお、文章から単語を取得する方法は、形態素辞書を用いた形態素解析等の従来の任意の方法を用いることができる。単語入力部12に入力される単語は、通信端末30に対するユーザの発話単位である。即ち、一回の発話に含まれる単語群を一つの単位として扱う。単語入力部12は、取得した単語を示す情報をカテゴリ特定部13に入力する。   The word input unit 12 is word input means for inputting information including words. Specifically, the word input unit 12 receives the information from the communication terminal 30 by receiving information indicating one or more words as a result of speech recognition by the speech recognition server 20. Alternatively, when the result of speech recognition by the speech recognition server 20 is a sentence (input sentence), the word input unit 12 receives the sentence and extracts the word from the sentence, or cuts the document into words. Get a word. In addition, the method of acquiring a word from sentences can use arbitrary conventional methods, such as a morpheme analysis using a morpheme dictionary. The word input to the word input unit 12 is a user's utterance unit for the communication terminal 30. That is, a word group included in one utterance is treated as one unit. The word input unit 12 inputs information indicating the acquired word to the category specifying unit 13.

カテゴリ特定部13は、単語入力部12から入力された単語のカテゴリを特定するカテゴリ特定手段である。具体的には例えば、カテゴリ特定部13は、図3に示すように単語のカテゴリを特定するための情報(辞書)を予め記憶しておき、その情報に基づいてカテゴリの特定を行う。この情報は、例えば、予め機能実行指示システム1の管理者等によって機能実行指示サーバ10に入力されて記憶されている。この情報は、図3に示すようにカテゴリを特定する情報であるカテゴリID及びカテゴリタグ(カテゴリ名)に単語が対応付けられたものである。1つのカテゴリID及びカテゴリタグには、1つ以上の単語が対応付けられている。例えば、カテゴリIDが「type_station」でカテゴリタグが「駅」というカテゴリには、「大阪」、「大阪駅」、「東京」、「東京駅」、「横浜」及び「横浜駅」という単語が対応付けられている。   The category specifying unit 13 is a category specifying unit that specifies the category of the word input from the word input unit 12. Specifically, for example, the category specifying unit 13 stores information (dictionary) for specifying the category of the word in advance as shown in FIG. 3, and specifies the category based on the information. This information is previously input and stored in the function execution instruction server 10 by, for example, an administrator of the function execution instruction system 1 or the like. In this information, as shown in FIG. 3, a word is associated with a category ID and a category tag (category name) that are information for specifying a category. One category ID and category tag are associated with one or more words. For example, for the category whose category ID is “type_station” and whose category tag is “station”, the words “Osaka”, “Osaka Station”, “Tokyo”, “Tokyo Station”, “Yokohama”, and “Yokohama Station” correspond. It is attached.

なお、上記の辞書においては、同一の単語が複数のカテゴリに対応付けられていてもよい。例えば、「駅」カテゴリには、東京、渋谷、品川、横浜…といった単語が対応付けられている。また、「人名」カテゴリには、笹本、小林、渋谷…といった単語が対応付けられている。上記の例のように、渋谷との単語が、「駅」カテゴリ及び「人名」カテゴリの両方に対応付けられていてもよい。   In the above dictionary, the same word may be associated with a plurality of categories. For example, words such as Tokyo, Shibuya, Shinagawa, Yokohama, etc. are associated with the “station” category. In addition, words such as Enomoto, Kobayashi, Shibuya, etc. are associated with the “person name” category. As in the above example, the word “Shibuya” may be associated with both the “station” category and the “person name” category.

カテゴリ特定部13は、単語入力部12から入力された単語それぞれについて、図3に示す情報に含まれる単語と一致しているか否かを判断して、一致していた場合にはその単語に対応付けられたカテゴリを、単語入力部12から入力された単語のカテゴリと特定する。また、カテゴリ特定部13は、図3に示すようなカテゴリと単語との対応関係を示す情報を用いずに、例えば、固有表現抽出(Named Entity Extraction)の技術によってカテゴリを特定することとしてもよい。また、チャンキング(chunking)によってカテゴリを特定することとしてもよい。また、カテゴリ特定部13は、予め正規表現を記憶しておき、単語が記憶した正規表現に合致するか否かでカテゴリを特定することとしてもよい。例えば、単語がある正規表現に合致した場合は、その単語はその正規表現に合致するカテゴリであると特定される。あるいは、カテゴリ特定部13は、通信端末30が記憶した電話帳データを取得し、単語が電話帳データに含まれる単語か否かを判断することでカテゴリを特定することとしてもよい。例えば、単語が電話帳データに含まれる場合は、その単語は電話帳データに存在する単語のカテゴリであると特定される。カテゴリ特定部13は、単語入力部12から入力された単語、及び特定した当該単語のカテゴリを示す情報を実行機能決定部14に出力する。なお、必ずしも全て単語についてカテゴリを特定する必要はなく、カテゴリが特定されていない単語があってもよい。   The category specifying unit 13 determines whether or not each word input from the word input unit 12 matches the word included in the information shown in FIG. The attached category is specified as the category of the word input from the word input unit 12. Further, the category specifying unit 13 may specify the category by, for example, a technique of named expression extraction (Named Entity Extraction) without using the information indicating the correspondence between the category and the word as shown in FIG. . Moreover, it is good also as specifying a category by chunking (chunking). Further, the category specifying unit 13 may store a regular expression in advance and specify the category depending on whether or not the word matches the stored regular expression. For example, if a word matches a regular expression, the word is identified as a category that matches the regular expression. Alternatively, the category specifying unit 13 may acquire the phone book data stored in the communication terminal 30 and specify the category by determining whether or not the word is a word included in the phone book data. For example, when a word is included in the phone book data, the word is specified as a category of words existing in the phone book data. The category identification unit 13 outputs information indicating the word input from the word input unit 12 and the category of the identified word to the execution function determination unit 14. Note that it is not always necessary to specify a category for each word, and there may be a word for which no category is specified.

実行機能決定部14は、カテゴリ特定部13によって特定されたカテゴリに応じて、機能実行指示部11によって実行が指示されるタスクを決定する実行機能決定手段である。例えば、実行機能決定部14は、上述したようなタスクとカテゴリとの関連(対応付け)に基づいて実行が指示されるタスクを決定する。具体的には、タスク毎にカテゴリのスコアを記憶しておき、ユーザの発話単位で入力された単語のスコアを特定して、特定したスコアに基づいて実行が指示されるタスクを決定する。各カテゴリのスコアは、タスクとの関連度合に応じて定められている。   The execution function determination unit 14 is an execution function determination unit that determines a task whose execution is instructed by the function execution instruction unit 11 according to the category specified by the category specification unit 13. For example, the execution function determination unit 14 determines a task that is instructed to be executed based on the association (association) between a task and a category as described above. Specifically, the score of the category is stored for each task, the score of the word input in the user's utterance unit is specified, and the task to be instructed to execute is determined based on the specified score. The score of each category is determined according to the degree of association with the task.

例えば、ユーザの発話が「東京までの乗換」というものであったとする。この場合、図4に示すように、ユーザの発話は、「東京」、「まで」、「の」、「乗換」という単語に分けられる。そして、タスク毎に各単語に対応づけられたカテゴリのスコアを求め、それらが合計されてタスク毎のスコアが算出される。図4に示すように各単語のスコアを特定し、それらを合計することで各タスク(図4の例では「乗換案内」、「グルメ検索」、「地図検索」のタスク)のスコアが合計される。スコアは、カテゴリだけでなく単語単位で定められていてもよい。例えば、「乗換」という単語は「乗換案内」のタスクに強く関連付けられるので、「乗換案内」のタスクには「乗換」という単語自体のスコアが対応付けられている。このように、単語入力部12によって入力された単語及び予め設定した単語にも基づいて、実行が指示されるタスクが決定されてもよい。   For example, it is assumed that the user's utterance is “transfer to Tokyo”. In this case, as shown in FIG. 4, the user's utterance is divided into the words “Tokyo”, “To”, “No”, and “Transfer”. And the score of the category matched with each word for every task is calculated | required, and those are totaled and the score for every task is calculated. As shown in FIG. 4, the score of each word is specified, and by summing them, the score of each task (in the example of FIG. 4, "transfer guide", "gourmet search", "map search" tasks) is totaled. The The score may be determined not only for the category but also for each word. For example, since the word “transfer” is strongly associated with the task “transfer guidance”, the task “transfer guide” is associated with the score of the word “transfer” itself. In this way, a task to be instructed to execute may be determined based on a word input by the word input unit 12 and a preset word.

実行機能決定部14は、例えば、スコアが最も高いタスクを、機能実行指示部11によって実行が指示されるタスクとして決定する。実行機能決定部14は、機能実行指示部11に対して、決定したタスクを通知する。この通知がされると、機能実行指示部11から通信端末30に対してタスクの実行が指示される。また、この通知の際に、単語入力部12によって入力された単語のうち、実行されるタスクのスロットへの入力となる単語(カテゴリがスロットのカテゴリと一致する単語)も合わせて通知することとしてもよい。スロットへの入力となる単語も、機能実行指示部11から通信端末30に対してタスクの実行の指示と合わせて送信される。例えば、「東京までの乗換」という発話によって「乗換案内」のタスクが実行される場合には、「駅」カテゴリである「東京」という単語が、「駅」カテゴリの単語に対応付けられた着駅のスロットの入力とされる。この場合、発駅のスロットには、ユーザの現在位置から最も近い駅の駅名がデフォルトの単語として入力される。これにより、ユーザの現在位置から最も近い駅から東京駅までの乗換が検索されて、その結果がユーザに提示される。なお、タスクの実行の上でスロットへの入力が不足している場合には、その時点でユーザにスロットへの入力を促して、改めてスロットに入力する単語を入力することとしてもよい。   For example, the execution function determination unit 14 determines a task having the highest score as a task whose execution is instructed by the function execution instruction unit 11. The execution function determination unit 14 notifies the function execution instruction unit 11 of the determined task. When this notification is given, the function execution instructing unit 11 instructs the communication terminal 30 to execute the task. In addition, at the time of this notification, among the words input by the word input unit 12, a word that is input to the slot of the task to be executed (a word whose category matches the category of the slot) is also notified. Also good. A word to be input to the slot is also transmitted from the function execution instruction unit 11 to the communication terminal 30 together with the task execution instruction. For example, when the “transfer guide” task is executed by the utterance “transfer to Tokyo”, the word “Tokyo” in the “station” category is associated with the word in the “station” category. It is used as an input for a station slot. In this case, in the slot of the departure station, the station name of the station closest to the current position of the user is input as a default word. Thereby, the transfer from the nearest station to the Tokyo station from the current position of the user is searched, and the result is presented to the user. In addition, when the input to the slot is insufficient in executing the task, the user may be prompted to input to the slot at that time, and the word to be input to the slot may be input again.

上記のように、実行機能決定部14は、これから機能実行指示部11によって実行が指示されるタスクを決定するが、このタスクの決定を過去に機能実行指示部11によって実行が指示されたタスクに基づくこととしてもよい。具体的には、過去に実行が指示されたタスクを引き続いて実行するか否かを判断する。例えば、過去に「乗換案内」のタスクの実行が指示されて(当該タスクが実行されて)おり、その後、ユーザの発話に基づく単語の入力が機能実行指示サーバ10に対してあった場合、「乗換案内」のタスクの実行を引き続いて指示するか否かを判断する。そのための構成を以下に説明する。   As described above, the execution function determining unit 14 determines a task to be instructed to be executed by the function execution instructing unit 11 from now on. The determination of this task is assigned to the task instructed to be executed by the function execution instructing unit 11 in the past. It may be based on. Specifically, it is determined whether or not a task for which execution has been instructed in the past is to be executed subsequently. For example, if execution of the task of “transfer guidance” has been instructed in the past (the task has been executed), and then a word input based on the user's utterance has been input to the function execution instruction server 10, It is determined whether to instruct the execution of the task of “transfer guidance” continuously. A configuration for this will be described below.

実行機能記憶部15は、機能実行指示部11によって実行が指示されたタスクを記憶する実行機能記憶手段である。例えば、実行機能記憶部15は、機能実行指示部11から実行が指示されたタスクを示す情報(例えば、タスク名)を入力して、入力したタスクを示す情報を記憶する。この際、タスクの実行指示時刻を合わせて記憶しておいてもよい。また、実行機能記憶部15は、タスクの実行指示の際にスロットに入力された単語も合わせて機能実行指示部11から入力して、当該単語も実行されたタスクと合わせて記憶しておいてもよい。実行機能記憶部15に記憶された情報は、以下のように実行機能決定部14によって適宜参照される。   The execution function storage unit 15 is an execution function storage unit that stores a task instructed to be executed by the function execution instruction unit 11. For example, the execution function storage unit 15 inputs information (for example, task name) indicating a task for which execution has been instructed from the function execution instruction unit 11, and stores information indicating the input task. At this time, the task execution instruction time may be stored together. The execution function storage unit 15 also inputs a word input to the slot at the time of task execution instruction from the function execution instruction unit 11, and stores the word together with the executed task. Also good. The information stored in the execution function storage unit 15 is appropriately referred to by the execution function determination unit 14 as follows.

実行機能決定部14は、カテゴリ特定部13によって特定されたカテゴリ、及び実行機能記憶部15によって記憶された過去に機能実行指示部11によって実行が指示されたタスクに関連する(対応付いた)カテゴリに基づいて、当該過去に機能実行指示部11によって実行が指示されたタスクをこれから実行指示するか否か判断する。このとき、引き続いて実行指示するか否かを判断するタスクは、単語の入力が機能実行指示サーバ10に対してなされた直前に機能実行指示部11によって実行が指示されたタスク(1回前に実行が指示されたタスク)の実行を指示するか否か判断することとしてもよい。即ち、2回以上前に実行が指示されたタスクは、引き続き実行が指示されるタスクの対象とならないこととしてもよい。更に、単語の入力から遡って予め設定した一定時間以内(例えば、1時間以内)に実行が指示されたタスクのみを引き続いて実行が指示される候補のタスクとすることとしてもよい。   The execution function determination unit 14 is a category related to (associated with) the category specified by the category specification unit 13 and the task stored in the execution function storage unit 15 and instructed to be executed by the function execution instruction unit 11 in the past. Based on the above, it is determined whether or not to instruct execution of a task for which execution has been instructed by the function execution instructing unit 11 in the past. At this time, the task for determining whether or not to instruct execution is the task that is instructed to be executed by the function execution instructing unit 11 immediately before a word is input to the function execution instructing server 10 (one time before. It may be determined whether or not to instruct execution of a task for which execution is instructed. That is, a task for which execution has been instructed two or more times before may not be a target of a task for which execution is instructed continuously. Furthermore, only tasks that are instructed to be executed within a predetermined time (for example, within 1 hour) set in advance from the word input may be set as candidate tasks to be instructed to be executed subsequently.

具体的には、実行機能決定部14は、実行機能記憶部15によって記憶された過去に機能実行指示部11によって実行が指示されたタスクに関連する(対応付いた)カテゴリと、カテゴリ特定部13によって特定されたカテゴリとが一致しているか否かを判断して、当該判断に応じて当該過去に機能実行指示部11によって実行が指示された機能の実行を指示するか否かを判断する。例えば、実行機能決定部14は、カテゴリ特定部13によって特定された単語のカテゴリが、過去に機能実行指示部11によって実行が指示されたタスクのスロットに対応付いたカテゴリと一致している(カテゴリ特定部13によって特定された単語がタスクのスロットに入力可能である)か否かを判断することで上記の判断を行う。カテゴリ特定部13によって特定された単語のカテゴリが、過去に機能実行指示部11によって実行が指示されたタスクのスロットに対応付いたカテゴリと一致していると判断された場合、当該過去に実行指示されたタスクを引き続いて実行指示すると判断し、一致していないと判断された場合、タスクの引き続きの実行指示が行われない、即ち、新たなタスクの実行を指示すると判断する。   Specifically, the execution function determination unit 14 includes a category related to (associated with) a task that has been instructed by the function execution instruction unit 11 in the past and stored in the execution function storage unit 15, and a category specification unit 13. It is determined whether or not the category specified by (1) matches, and according to the determination, it is determined whether or not to instruct execution of the function that has been instructed by the function execution instructing unit 11 in the past. For example, the execution function determining unit 14 matches the category of the word specified by the category specifying unit 13 with the category associated with the slot of the task whose execution has been instructed by the function execution instructing unit 11 in the past (category The above determination is made by determining whether the word specified by the specifying unit 13 can be input to the task slot. If it is determined that the category of the word specified by the category specifying unit 13 matches the category associated with the slot of the task for which execution has been instructed by the function execution instructing unit 11 in the past, the execution instruction in the past If it is determined that the task to be executed is instructed to be executed continuously, and it is determined that the tasks do not coincide with each other, it is determined that the instruction to continue execution of the task is not performed, that is, the execution of a new task is instructed.

このとき、カテゴリ特定部13によって特定された単語のカテゴリが、過去に機能実行指示部11によって実行が指示されたタスクのスロットに対応付いたカテゴリ全てと一致する場合のみ引き続いてタスクの実行を指示するとしてもよいし、スロットの一部に対応付いたカテゴリと一致する場合に引き続いてタスクの実行を指示するとしてもよい。また、カテゴリ特定部13によって特定された単語のカテゴリ全てが、過去に機能実行指示部11によって実行が指示されたタスクのスロットの何れかに対応付いたカテゴリと一致する場合のみ引き続いてタスクの実行を指示する(即ち、カテゴリ特定部13によって特定された単語のカテゴリ全てが、過去に機能実行部11によって実行が指示されたタスクのスロットの何れかに対応付いたカテゴリと一致し、かつ、入力文の中に、いずれのカテゴリとも対応づいておらず、従っていずれのスロットと対応づかない名詞がひとつも存在しない場合のみ引き続いてタスクを実行指示する)としてもよいし、カテゴリ特定部13によって特定された単語の一部のカテゴリが、過去に機能実行指示部11によって実行が指示されたタスクのスロットの何れかに対応付いたカテゴリと一致する場合に引き続いてタスクの実行を指示するとしてもよい。なお、過去に機能実行指示部11によって実行が指示されたタスクのスロットが、カテゴリを特定するタイプでない場合(任意のカテゴリの単語を入力できるタイプである場合、例えば、「画像検索」のタスクに対する「検索ワード」のスロット)には、どのカテゴリの単語が入力されても常に引き続きのタスクの実行が指示されてしまうおそれがあるため、上記の判断を行わないこととしてもよい。   At this time, the execution of the task is instructed only when the category of the word specified by the category specifying unit 13 coincides with all the categories associated with the task slots instructed to be executed by the function execution instructing unit 11 in the past. It may be possible to instruct the execution of the task when it matches the category associated with a part of the slot. Further, only when the category of the word specified by the category specifying unit 13 matches the category associated with any of the task slots instructed to be executed by the function execution instructing unit 11 in the past, the task execution is continued. (That is, all the categories of the words specified by the category specifying unit 13 match the category corresponding to any of the task slots for which execution has been instructed by the function executing unit 11 in the past, and are input. The task may be instructed to continue only when there is no noun that does not correspond to any category in the sentence and therefore does not correspond to any slot. Some categories of the designated words are slotted for tasks for which execution has been instructed by the function execution instructing unit 11 in the past. May instruct the execution of the tasks subsequent when matching the categories marked with corresponding to any one of. If the slot of the task whose execution has been instructed in the past by the function execution instructing unit 11 is not of a type that specifies a category (if it is a type in which words of an arbitrary category can be input, for example, for the task of “image search” The “search word” slot) may be instructed to always execute a task regardless of which category of word is input, so the above determination may not be performed.

但し、この場合であっても、入力された単語のカテゴリが、過去に機能実行指示部11によって実行が指示されたタスクのスロットに入力された単語のカテゴリと一致するか否かを判断して、それらが一致したと判断された場合(直前の発話の単語のカテゴリと入力された単語のカテゴリとが一致した場合)には、引き続いてタスクの実行を指示するとしてもよい。この構成によれば、スロットに任意のカテゴリの単語を入力できるタスクであっても適切にタスクの引き継ぎを判断することができる。   However, even in this case, it is determined whether or not the category of the input word matches the category of the word input to the slot of the task for which execution has been instructed by the function execution instructing unit 11 in the past. When it is determined that they match (when the category of the word of the immediately preceding utterance matches the category of the input word), the execution of the task may be instructed subsequently. According to this configuration, it is possible to appropriately determine whether to take over a task even if the task can input a word of an arbitrary category in the slot.

また、実行機能決定部14は、過去に機能実行指示部11によって実行が指示されたタスクをこれから実行指示する(タスクを引き続き実行する)と判断した場合に、カテゴリがスロットに対応付けられたカテゴリと一致した単語をスロットへの入力として機能実行指示部11に実行を指示させる。また、実行機能決定部14は、タスクのスロットの一部(あるいは全部)について、実行機能記憶部15によって記憶された過去のスロットへの入力とされた単語を当該タスクへの入力とすることとしてもよい。この場合、図2に示すタスクの各スロットにおいて、「引き継ぐ?」の欄の情報が、単語の入力を引き継ぐこと示すもの(True)であった場合のみに単語の入力の引き継ぎが行われてもよい。実行機能決定部14は、上記の判断によってタスクの引き続きの実行が行われないと判断した場合には、上述したスコアによるタスクの実行の指示を判断する。   Further, when the execution function determination unit 14 determines that a task for which execution has been instructed in the past by the function execution instruction unit 11 is to be executed (to continue the task), the category associated with the slot The function execution instructing unit 11 is instructed to execute the word that matches with the input to the slot. In addition, the execution function determination unit 14 sets, as a part of (or all) a task slot, the word input to the past slot stored by the execution function storage unit 15 as an input to the task. Also good. In this case, in each slot of the task shown in FIG. 2, even if the input of the word is performed only when the information in the “takeover?” Column is information indicating that the input of the word is inherited (True). Good. If the execution function determination unit 14 determines that the task is not continuously executed by the above determination, the execution function determination unit 14 determines an instruction to execute the task based on the score described above.

上述した例のように「東京までの乗換」という発話によって「乗換案内」のタスクの実行が指示された場合、実行機能記憶部15に、過去に実行が指示されたタスクとして「乗換案内」が記憶されており、着駅のスロットの入力として「東京」という単語が記憶されている。その後のユーザの発話が「やっぱり横浜」というものであったとする。この場合、「横浜」という単語が「駅」カテゴリであるため、過去に実行された「乗換案内」のタスクの着駅のスロットに対応付いたカテゴリと一致すると判断される。従って、過去に実行された「乗換案内」のタスクが引き続いて再度実行が指示されるものと判断される。その際、着駅のスロットには「横浜」が入力される。なお、発駅については、「東京までの乗換」の際と同様にユーザの現在位置から最も近い駅の駅名が引き継がれる(図2に示すように発駅の「引き継ぐ」の欄はTrueになっている)。   When the execution of the “transfer guidance” task is instructed by the utterance “transfer to Tokyo” as in the example described above, “transfer guidance” is displayed in the execution function storage unit 15 as a task for which execution has been instructed in the past. The word “Tokyo” is stored as an input of the arrival station slot. Assume that the user's utterance after that is “Yokohama”. In this case, since the word “Yokohama” is the “station” category, it is determined that it matches the category associated with the slot of the arrival station of the “transfer guidance” task executed in the past. Therefore, it is determined that the “transfer guidance” task executed in the past is continuously instructed to be executed again. At that time, “Yokohama” is entered in the slot of the arrival station. As for the departure station, the station name of the nearest station from the current position of the user is inherited as in the case of “transfer to Tokyo” (the “takeover” column of the departure station is True as shown in FIG. 2). ing).

一方で上述のような実行機能決定部14によるタスクを引き続き実行指示するか否かの判断を行わず、「やっぱり横浜」という発話によってスコアを決定する場合について説明する。この場合、図5に示すように、ユーザの発話は、「やっぱり」、「横浜」という単語に分けられる。そして、上述した例と同様にタスク毎に各単語のスコアが特定されて、それらが合計されてタスク毎のスコアが算出される。この場合、ユーザの発話には「乗換案内」に関連が高い単語が含まれていないため、最も高いスコアは、「乗換案内」ではなく「横浜」という地名だけでスコアが高くなる「地図検索」となる。「東京までの乗換」とユーザが発話した後、「やっぱり横浜」とユーザが発話した場合には、ユーザは横浜駅までの乗換を知りたいと考えられる。上述したようにタスクの引き継ぎを判断した場合、適切に「乗換案内」のタスクの実行が指示される。一方で、(本実施形態とは異なり)上記のようにユーザの発話から独立して実行されるタスクを判断すると、ユーザの意図とは異なる「地図検索」というタスクが実行されることとなる。   On the other hand, a case will be described in which the score is determined by the utterance “Yokohama” without determining whether or not the execution function determination unit 14 continues to instruct execution of the task as described above. In this case, as shown in FIG. 5, the user's utterance is divided into the words “after all” and “Yokohama”. Then, as in the above-described example, the score of each word is specified for each task, and these are added together to calculate the score for each task. In this case, since the user's utterance does not include a word that is highly related to “transfer guidance”, the highest score is “map search” in which the score is high only by the place name “Yokohama”, not “transfer guidance”. It becomes. If the user utters “Yokohama” after the user utters “transfer to Tokyo”, the user wants to know the transfer to Yokohama station. When it is determined to take over the task as described above, the execution of the “transfer guidance” task is appropriately instructed. On the other hand, when a task to be executed independently of the user's utterance is determined as described above (unlike this embodiment), a task called “map search” that is different from the user's intention is executed.

また、「東京までの乗換」との発話後のユーザの発話が「カレー」というものであったとする。この場合、「カレー」という単語が「料理名」カテゴリであるため、過去に実行の指示がされた「乗換案内」のタスクのスロットに対応付いたカテゴリと一致しないと判断される。従って、過去に実行が指示された「乗換案内」のタスクが引き続いて再度実行されないと判断される。   Further, it is assumed that the user's utterance after the utterance “transfer to Tokyo” is “curry”. In this case, since the word “curry” is the “cooking name” category, it is determined that the category does not match the category associated with the “transfer guidance” task slot for which execution has been instructed in the past. Accordingly, it is determined that the “transfer guidance” task that has been instructed to be executed in the past is not executed again.

この場合、実行機能決定部14は、「カレー」という発話によるスコアを計算することで、実行を指示するタスクを決定する。図6に示すように、ユーザの発話は、「カレー」という単語のみから構成される。そして、上述した例と同様にタスク毎に各単語に対応付けられたカテゴリのスコアが特定されて、それらが合計されてタスク毎のスコアが算出される。この場合、「グルメ検索」が最も高いスコアとなり、「グルメ検索」のタスクが実行されるものと判断される。「東京までの乗換」とユーザが発話した後、「カレー」とユーザが発話した場合には、全く異なる話題であるため、「乗換案内」ではなく「カレー」に関する情報を知りたいと考えられる。上述したように、この場合はタスクを引き継ぐものとは判断されずに、ユーザの発話からタスクのスコアが算出されて「グルメ検索」のタスクの実行が指示されることとなる。   In this case, the execution function determination unit 14 determines a task instructing execution by calculating a score based on an utterance “curry”. As shown in FIG. 6, the user's utterance is composed only of the word “curry”. Then, as in the example described above, the score of the category associated with each word is specified for each task, and these are added together to calculate the score for each task. In this case, “gourmet search” has the highest score, and it is determined that the task of “gourmet search” is executed. If the user utters “curry” after the user utters “transfer to Tokyo”, it is a completely different topic, so he would like to know information about “curry” instead of “transfer guidance”. As described above, in this case, the task score is not determined to be taken over, but the task score is calculated from the user's utterance, and the execution of the task of “gourmet search” is instructed.

別の例として、過去に実行が指示されたタスクがカレーに関する「グルメ検索」であり、グルメ検索の対象となる地域を示すスロットに「東京」が入力されていた場合には、「やっぱ大阪」との入力があった場合には、「東京」の部分が「大阪」で上書きされてカレーに関する「グルメ検索」の実行が指示されるものと判断される。   As another example, if the task that was instructed in the past was “Gourmet Search” for curry, and “Tokyo” was entered in the slot indicating the target area for the gourmet search, “Yappa Osaka” When “Tokyo” is overwritten with “Osaka”, it is determined that execution of “gourmet search” regarding curry is instructed.

なお、タスクの遷移については、特定の場合には強制的に行うことができるようにしておくこととしてもよい。例えば、通信端末30に対するユーザの操作によって通信端末30から新たなタスクに遷移させる旨の情報を受信した場合には、タスクの遷移を強制的に行わせることとしてもよい(タスクの引き継ぎを行わない)。   Note that task transition may be forcibly performed in a specific case. For example, when information indicating that a transition is made to a new task is received from the communication terminal 30 by a user operation on the communication terminal 30, the task transition may be forcibly performed (the task is not taken over). ).

実行機能決定部14による実行が指示されるタスクの判断は、以下のように行われてもよい。入力される単語群(ユーザの発話)から、実行が指示されるタスクを判断する場合、上述したようにタスク毎に単語に応じたスコアを出していたが、必ずしもスコアを算出する必要はない。例えば、タスクと単語(カテゴリ)とを対応付けておき、タスク毎に入力された単語群にタスクに対応付けられた単語(カテゴリ)が含まれているか否かを判断して、含まれていると判断された場合当該タスクの実行を指示することとしてもよい。   The determination of the task instructed to be executed by the execution function determination unit 14 may be performed as follows. When determining a task to be executed from an input word group (user's utterance), the score corresponding to the word is given for each task as described above, but it is not always necessary to calculate the score. For example, a task is associated with a word (category), and it is determined whether or not the word (category) associated with the task is included in the word group input for each task. If it is determined, the execution of the task may be instructed.

また、入力した単語や文章中に特定のタスクと強い関連性を持つキーワード(強いキーワード)があると判断した場合(スコアが極めて大きい値となる場合)には、過去に実行を指示したタスクを引き継ぐことはせず、新たに入力した単語や文章から実行を指示するタスクを判断してもよい。即ち、強制的にタスク遷移させてもよい。例えば、「乗換」という単語が含まれていたら、関連性の強い「乗換案内」のタスクを実行するようにする。   If it is determined that there is a keyword (strong keyword) that is strongly related to a specific task in the input word or sentence (when the score is extremely high), the task that has been instructed to be executed in the past Instead of taking over, a task instructing execution may be determined from a newly input word or sentence. In other words, task transition may be forced. For example, if the word “transfer” is included, a highly relevant “transfer guidance” task is executed.

また、タスクを引き継がずに新たなタスクの実行を指示した場合、即ち、タスクが遷移した場合であっても、スロットに入力される単語を引き継ぐこととしてもよい。この場合、タスク遷移前のスロット内容から引継ぎ可能な単語を全て取り出す。切り替え後のタスクにおいては、スロット内容は一旦全て空になっている。上記の取り出された引継ぎ可能な単語を、切り替え後のタスクのスロットに入力する(埋める)ことを試みる(入力できない単語は捨てる)。入力された単語をスロット入力のルールに従ってスロットに入力する。   In addition, even when the execution of a new task is instructed without taking over the task, that is, when the task transitions, the word input to the slot may be taken over. In this case, all words that can be taken over are extracted from the slot contents before task transition. In the task after switching, all slot contents are once empty. An attempt is made to input (fill) the taken-out transferable word into the slot of the task after switching (those words that cannot be input are discarded). The input word is input to the slot according to the slot input rules.

上記のようにタスクの引き継ぎを行う場合、タスクの引き継ぎを行うか否かを判断するための、発話内の単語が複数のカテゴリに属する場合(複数の属性を有する場合)、適切にタスクの引き継ぎが判断でいないおそれがある。例えば、以下のようなシチュエーションが考えられる。「笹本さんの電話番号」とのユーザの発話に基づき、本実施形態に係る機能実行指示システム1によって、電話帳検索のタスクが実行され、電話帳検索により笹本さんの電話番号が調べられる。ユーザは、その電話番号によって電話の発信を行う。ユーザは、その電話で笹本さんと渋谷で待ち合わせをしたので終話後、渋谷までの乗換案内を実行しようと思い、続けて「渋谷まで行く」と発話する。   When taking over tasks as described above, if words in an utterance belong to multiple categories (if they have multiple attributes) to determine whether or not to take over tasks, take over tasks appropriately. May not be a judgment. For example, the following situations can be considered. Based on the user's utterance of “Mr. Enomoto's phone number”, the function execution instruction system 1 according to the present embodiment executes a phone book search task, and Enomoto's phone number is checked by the phone book search. The user makes a call using the telephone number. The user waits for Ms. Enomoto in Shibuya on the phone, so after the end of the talk, he / she wants to execute the transfer guidance to Shibuya, and then utters “Go to Shibuya”.

この発話は、例えば、「渋谷:名詞(「人名」カテゴリ、「駅」カテゴリ)、まで:助詞、行く:動詞」というように単語に分けられる。本実施形態に係る機能実行指示システム1は、発話に含まれる「渋谷」を「人名」カテゴリの単語であると特定する。前に実行された電話帳検索のタスクには、「人名」カテゴリが関連付いているので、本実施形態に係る機能実行指示システム1は、電話帳検索のタスクを引き継ぐと判断し、「渋谷」を入力とした電話帳検索が実行されてしまう。なお、この場合、「渋谷」は、「駅」カテゴリ及び「人名」カテゴリの両方に属している。この場合、ユーザは乗換案内のタスクを実行したいので、再度電話帳検索のタスクが実行されることは望ましくない。   This utterance is divided into words such as “Shibuya: noun (“ person name ”category,“ station ”category”), up to: particle, go: verb ”. The function execution instruction system 1 according to the present embodiment identifies “Shibuya” included in the utterance as a word in the “person name” category. Since the “Person Name” category is associated with the previously executed phone book search task, the function execution instruction system 1 according to the present embodiment determines that it will take over the phone book search task, and “Shibuya”. Phonebook search is executed using In this case, “Shibuya” belongs to both the “station” category and the “person name” category. In this case, since the user wants to execute the task of transferring information, it is not desirable that the task of searching for the phone book is executed again.

上記のような場合に対応するため、カテゴリ特定部13は、単語入力部12から入力された単語のカテゴリを、当該単語と同じ発話(単語群)に含まれる当該単語以外の単語に基づいて特定する。即ち、単語のカテゴリを、その単語のみからではなく当該単語と同じ発話を考慮して特定する。   In order to deal with the above case, the category specifying unit 13 specifies the category of the word input from the word input unit 12 based on a word other than the word included in the same utterance (word group) as the word. To do. That is, the category of a word is specified in consideration of the same utterance as the word, not just the word.

具体的には、カテゴリ特定部13は、単語入力部12から入力された情報(発話)に含まれる特定対象の単語と当該情報に含まれる当該単語以外の単語とが同一の情報に含まれる度合いを示す情報に基づいて、特定対象の単語のカテゴリを特定する。更に具体的には、カテゴリ特定部13は、カテゴリ毎に当該カテゴリの単語と別の単語とが同一の情報(発話)に含まれる度合いを記憶しておき、当該度合いに基づいて特定対象の単語以外の単語を当該別の単語としたときの特定対象の単語についてのカテゴリ毎のスコアを特定して、当該スコアに基づいて特定対象の単語のカテゴリを特定する。上記の度合いは、共起確率のスコアを用いることができる。共起確率のスコアは、その値が高いほど、そのカテゴリの単語と別の単語とが同一の情報に含まれる度合いが高いことを示している。   Specifically, the category specifying unit 13 includes a degree to which a word to be specified included in information (utterance) input from the word input unit 12 and a word other than the word included in the information are included in the same information. The category of the word to be identified is identified based on the information indicating. More specifically, the category specifying unit 13 stores the degree that a word in the category and another word are included in the same information (utterance) for each category, and the word to be specified is determined based on the degree. A score for each category is specified for a word to be specified when another word is used as the other word, and a category of the word to be specified is specified based on the score. As the above-mentioned degree, a co-occurrence probability score can be used. The score of the co-occurrence probability indicates that the higher the value, the higher the degree that the word in the category and another word are included in the same information.

例えば、カテゴリ特定部13は、図7に示すようなテーブルを保持しており、当該テーブルに情報を格納することで共起確率のスコアを記憶しておく。このテーブルには、特定のカテゴリの単語と共起する(同一の発話に含まれる)要素と、それらの単語及び要素の共起確率のスコアとが対応付けられている。図7(a)は、「駅」カテゴリの単語と共起する(同一の発話に含まれる)要素の共起確率のスコアを示している。図7(b)は、「人名」カテゴリの単語と共起する(同一の発話に含まれる)要素の共起確率のスコアを示している。例えば、「行く」という単語については、「駅」カテゴリの単語に対しては共起確率のスコアは0.51、「人名」カテゴリの単語に対しては共起確率のスコアは0.04である。上記のように「行く」という単語については、「駅」カテゴリの単語の方が共起確率のスコアが高い。即ち、「行く」という単語が同一の発話に含まれる単語は、「駅」カテゴリの単語である可能性が高いことを示している。なお、共起する要素は、単語そのものであってもよいし、カテゴリ(そのカテゴリ全体の単語)であってもよい。また、共起する要素を複数組み合わせたものに対してスコアが対応付けられていてもよい。   For example, the category specifying unit 13 holds a table as shown in FIG. 7, and stores the score of the co-occurrence probability by storing information in the table. In this table, elements that co-occur with words of a specific category (included in the same utterance) are associated with the scores of co-occurrence probabilities of those words and elements. FIG. 7A shows a score of co-occurrence probabilities of elements that co-occur with words in the “station” category (included in the same utterance). FIG. 7B shows the score of the co-occurrence probability of an element that co-occurs with a word in the “person name” category (included in the same utterance). For example, for the word “go”, the co-occurrence probability score is 0.51 for words in the “station” category, and the co-occurrence probability score is 0.04 for words in the “person name” category. is there. As described above, for the word “go”, the word in the “station” category has a higher co-occurrence probability score. That is, it is shown that a word in which the word “go” is included in the same utterance is likely to be a word in the “station” category. The co-occurring element may be a word itself or a category (words in the entire category). A score may be associated with a combination of a plurality of co-occurring elements.

なお、このスコアは、例えば、予め機能実行指示システム1の管理者等によって機能実行指示サーバ10に入力されて記憶されている。また、機械学習によって得られたものであってもよい。   The score is input and stored in advance in the function execution instruction server 10 by, for example, an administrator of the function execution instruction system 1 or the like. Further, it may be obtained by machine learning.

カテゴリ特定部13は、上記のように図3に示す辞書あるいはチャンキング等により、単語のカテゴリの特定を行った結果、複数のカテゴリに特定された(属するものと判断された)単語について共起確率のスコアに基づくカテゴリの限定を行う。例えば、上記のように「渋谷まで行く」との発話の場合、「渋谷」という単語については、辞書あるいはチャンキング等によるカテゴリの特定では「駅」カテゴリと「人名」カテゴリとの2つのカテゴリに特定される。カテゴリ特定部13は、複数のカテゴリに特定された単語であるカテゴリ特定対象の単語と共起する単語から、図7に示す共起確率のスコアに基づいてカテゴリ毎のスコアを算出する。カテゴリ特定部13は、カテゴリ特定対象の単語と共起する単語の各カテゴリのスコアを、カテゴリ毎に合計することでカテゴリ毎のスコアを算出する。カテゴリ特定部13は、算出したスコアが最も高いカテゴリを、当該特定対象の単語のカテゴリと特定する。なお、共起する要素が動詞である場合には、動詞の活用が考慮されてもよい。例えば、「行き(たい)」との単語を「行く」と同様に扱ってもよい。   As described above, the category specifying unit 13 specifies the categories of words by using the dictionary or chunking shown in FIG. 3 and, as a result, co-occurs with respect to the words specified as belonging to a plurality of categories (determined to belong). Limit categories based on probability scores. For example, in the case of the utterance “go to Shibuya” as described above, the word “Shibuya” is classified into two categories of “station” category and “person name” category in the category specification by dictionary or chunking. Identified. The category specifying unit 13 calculates a score for each category based on the co-occurrence probability score shown in FIG. 7 from words that co-occur with a category specifying target word that is a word specified for a plurality of categories. The category specifying unit 13 calculates the score for each category by adding the scores of each category of the words that co-occur with the category specifying target word for each category. The category specifying unit 13 specifies the category having the highest calculated score as the category of the word to be specified. When the co-occurring element is a verb, the use of the verb may be considered. For example, the word “go” may be handled in the same manner as “go”.

なお、図7の共起確率のスコアは、上記のように図3に示す辞書あるいはチャンキング等により特定されたカテゴリについてのもののみを用いればよい。上記の「渋谷まで行く」の例の場合には、「渋谷」という単語は、「駅」カテゴリと「人名」カテゴリとのカテゴリに特定されるため、「駅」カテゴリと「人名」カテゴリとの共起確率のスコアを用いる。また、「渋谷」には、「まで」と「行く」との単語が共起しているので、それらのカテゴリ毎のスコアを図7のテーブルに基づいて特定する。「駅」カテゴリについては、「行く」のスコア0.51、「まで」のスコア0.34、及び「行く」と「まで」との組み合わせのスコア0.26が合計され、合計のスコアが1.11とされる。「人名」カテゴリについては、「行く」のスコア0.04、「まで」のスコア0.3、及び「行く」と「まで」との組み合わせのスコア0が合計され、合計のスコアが0.34とされる。「駅」カテゴリの合計のスコアの方が、「人名」カテゴリの合計のスコアよりも高いので、「渋谷」のカテゴリは「駅」であるものと特定(限定)される。   The co-occurrence probability score shown in FIG. 7 may be used only for the category specified by the dictionary or chunking shown in FIG. 3 as described above. In the case of “Going to Shibuya” above, the word “Shibuya” is specified in the “Station” category and the “Person Name” category, so the “Station” category and the “Person Name” category Co-occurrence probability score is used. Further, since the words “until” and “go” co-occur in “Shibuya”, the score for each category is specified based on the table of FIG. For the “Station” category, a score of 0.51 for “going”, a score of 0.34 for “to”, and a score of 0.26 for a combination of “going” and “to” are totaled, and the total score is 1. .11. For the “person name” category, the “go” score of 0.04, the “to” score of 0.3, and the score “0” of the combination of “go” and “to” are summed, and the total score is 0.34. It is said. Since the total score of the “station” category is higher than the total score of the “person name” category, the category of “Shibuya” is specified (limited) as “station”.

なお、カテゴリ特定部13は、辞書あるいはチャンキング等によるカテゴリの特定をせずに、共起確率のスコアのみに基づいて単語のカテゴリの特定を行うこととしてもよい。その場合、全てのカテゴリについて、共起確率のスコアに基づく単語のスコアを算出する。以上が、本実施形態に係る機能実行指示システム1の機能構成である。   The category specifying unit 13 may specify a word category based only on the co-occurrence probability score without specifying the category by a dictionary or chunking. In that case, word scores based on the co-occurrence probability scores are calculated for all categories. The above is the functional configuration of the function execution instruction system 1 according to the present embodiment.

図8に本実施形態に係る機能実行指示サーバ10及び音声認識サーバ20を構成するサーバ装置のハードウェア構成を示す。図8に示すように当該サーバ装置は、CPU(Central Processing Unit)101、主記憶装置であるRAM(RandomAccess Memory)102及びROM(Read Only Memory)103、通信を行うための通信モジュール104、並びにハードディスク等の補助記憶装置105等のハードウェアを備えるコンピュータを含むものとして構成される。これらの構成要素がプログラム等により動作することにより、上述した機能実行指示サーバ10及び音声認識サーバ20の機能が発揮される。以上が、本実施形態に係る機能実行指示システム1の構成である。   FIG. 8 shows a hardware configuration of a server device constituting the function execution instruction server 10 and the voice recognition server 20 according to the present embodiment. As shown in FIG. 8, the server device includes a central processing unit (CPU) 101, a random access memory (RAM) 102 and a read only memory (ROM) 103, which are main storage devices, a communication module 104 for communication, and a hard disk. The computer is configured to include a computer including hardware such as the auxiliary storage device 105. The functions of the function execution instruction server 10 and the voice recognition server 20 described above are exhibited by the operation of these components by a program or the like. The above is the configuration of the function execution instruction system 1 according to the present embodiment.

引き続いて、図9のフローチャートを用いて、本実施形態に係る機能実行指示システム1で実行される処理である機能実行指示方法を説明する。本処理では、まず、本実施形態に係る機能実行指示システム1による機能実行の指示を受けるための通信端末30に対するユーザの操作が行われて、通信端末30に、機能を実行させるためのユーザの音声(発話)が入力される。続いて、当該音声が通信端末30から音声認識サーバ20に送信される。音声認識サーバ20では、当該音声が受信されて入力される(S01、音声認識ステップ)。続いて、音声認識サーバ20では、入力された音声に対して音声認識が行われる(S02、音声認識ステップ)。音声認識結果である単語の集合あるいは文章を示す情報が音声認識サーバ20から通信端末30に送信される。通信端末30では、その情報が受信されて、機能実行指示サーバ10に送信される。   Subsequently, a function execution instruction method which is a process executed by the function execution instruction system 1 according to the present embodiment will be described with reference to the flowchart of FIG. In this process, first, a user operation on the communication terminal 30 for receiving a function execution instruction by the function execution instruction system 1 according to the present embodiment is performed, and the user's operation for causing the communication terminal 30 to execute the function is performed. Voice (utterance) is input. Subsequently, the voice is transmitted from the communication terminal 30 to the voice recognition server 20. The voice recognition server 20 receives and inputs the voice (S01, voice recognition step). Subsequently, the voice recognition server 20 performs voice recognition on the input voice (S02, voice recognition step). Information indicating a set of words or a sentence as a speech recognition result is transmitted from the speech recognition server 20 to the communication terminal 30. The communication terminal 30 receives the information and transmits it to the function execution instruction server 10.

機能実行指示サーバ10では、単語入力部12によって、音声認識結果である単語を含む情報が受信されて入力される(S03、単語入力ステップ)。入力された情報は、単語入力部12からカテゴリ特定部13に出力される。続いて、カテゴリ特定部13によって、単語入力部12から入力された情報に含まれる単語のカテゴリが特定される(S04、カテゴリ特定ステップ)。   In the function execution instruction server 10, the word input unit 12 receives and inputs information including a word that is a voice recognition result (S03, word input step). The input information is output from the word input unit 12 to the category specifying unit 13. Subsequently, the category specifying unit 13 specifies the category of the word included in the information input from the word input unit 12 (S04, category specifying step).

ここで、図10のフローチャートを用いて、単語のカテゴリの特定の処理(S04)について詳細に説明する。本処理では、まず、上述したように図3に示す辞書による方法、あるいはチャンキングによる方法により、単語のカテゴリが特定される(S41)。このカテゴリの特定において、複数のカテゴリに特定される単語がなかった場合には、単語のカテゴリの特定の処理(S04)は終了する。このカテゴリの特定において、複数のカテゴリに特定される単語があった場合には、その単語について、それらの複数のカテゴリの中から図7の共起確率のスコアに基づいてカテゴリが1つに特定(限定)される(S42)。特定されたカテゴリの情報は単語と共にカテゴリ特定部13から実行機能決定部14に出力される。   Here, with reference to the flowchart of FIG. 10, the word category specifying process (S04) will be described in detail. In this process, first, the category of the word is specified by the dictionary method shown in FIG. 3 or the chunking method as described above (S41). In this category specification, if there is no word specified in a plurality of categories, the word category specification processing (S04) ends. In this category specification, when there are words specified in a plurality of categories, one category is specified from the plurality of categories based on the co-occurrence probability score in FIG. (Limited) (S42). Information on the specified category is output from the category specifying unit 13 to the execution function determining unit 14 together with the word.

図9に戻り、続いて、実行機能決定部14によって、実行が指示されるタスクの候補が決定される(S05、実行機能決定ステップ)。タスク候補の決定は、図4〜図6を用いて説明したように入力された単語及び当該単語のカテゴリに基づいて、タスク毎にスコアが算出されることによって行われる。最も高いスコアのタスクが実行されるタスク候補となる。   Returning to FIG. 9, subsequently, the execution function determination unit 14 determines a candidate for a task to be executed (S 05, execution function determination step). The task candidate is determined by calculating a score for each task based on the input word and the category of the word as described with reference to FIGS. The task with the highest score is the task candidate to be executed.

続いて、実行機能決定部14によって、カテゴリ特定部13によって特定されたカテゴリ、及び実行機能記憶部15によって記憶された過去に機能実行指示部11によって実行が指示されたタスクのスロットに対応付いたカテゴリに基づいて、当該過去に機能実行指示部11によって実行が指示されたタスクの実行をこれから指示するか否かが判断される(S06、実行機能決定ステップ)。即ち、直前に実行が指示されたタスクを引き続いて実行指示するか、新たなタスクを実行指示するか(タスク遷移するか)が判断される。なお、過去に実行が指示されたタスクが無い場合や、過去に実行指示されたタスクがあっても、過去に実行指示されたタスクが一定期間以前の実行指示であるため判断に利用しないものである場合等には、上記の判断は行われなくてよい。この場合、S03で入力された単語に基づいて実行が指示されるタスクが決定される。   Subsequently, the execution function determining unit 14 corresponds to the category specified by the category specifying unit 13 and the slot of the task for which execution is instructed by the function execution instructing unit 11 in the past stored by the execution function storing unit 15. Based on the category, it is determined whether or not to instruct execution of a task that has been instructed to be executed by the function execution instructing unit 11 in the past (S06, execution function determining step). That is, it is determined whether to instruct execution of the task that has been instructed immediately before or to instruct execution of a new task (task transition). Note that if there is no task that has been instructed to be executed in the past, or there is a task that has been instructed to execute in the past, the task that has been instructed to execute in the past is not used for judgment because it is an execution instruction before a certain period. In some cases, the above determination need not be made. In this case, the task to be executed is determined based on the word input in S03.

直前に実行が指示されたタスクの実行を引き続いて指示すると判断した場合、当該タスクが実行指示されるタスクとして決定される(S07、実行機能決定ステップ)。一方で、タスク遷移すると判断された場合、S05においてタスク候補とされたタスクが実行指示されるタスクとして決定される(S07、実行機能決定ステップ)。続いて、決定したタスクの実行を指示するように実行機能決定部14から機能実行指示部11に指示が行われる。この際、タスクのスロットに入力される単語も合わせて機能実行指示部11に出力される。続いて、指示を受けた機能実行指示部11によって通信端末30に対してタスクの実行が指示される(S08、機能実行指示ステップ)。通信端末30では、この指示が受け付けられ、指示に係るタスクが実行される。   When it is determined that the execution of the task for which execution has been instructed immediately before is to be instructed, the task is determined as the task for which execution is instructed (S07, execution function determination step). On the other hand, if it is determined that the task is to be changed, the task determined as a task candidate in S05 is determined as a task that is instructed to be executed (S07, execution function determination step). Subsequently, the execution function determination unit 14 instructs the function execution instruction unit 11 to instruct execution of the determined task. At this time, the word input to the task slot is also output to the function execution instruction unit 11. Subsequently, the function execution instruction unit 11 that has received the instruction instructs the communication terminal 30 to execute the task (S08, function execution instruction step). The communication terminal 30 receives this instruction and executes a task related to the instruction.

続いて、機能実行指示部11によって実行が指示されたタスクを示す情報が、実行機能記憶部15によって記憶される(S09、実行機能記憶ステップ)。ここで記憶されたタスクを示す情報は、次にユーザの音声によってタスクの実行が指示される際に、実行が指示されるタスクの決定の際(S06)に参照される。音声によるタスクの実行(起動)の処理(S01〜S09の処理)は繰り返し行われえる。以上が本実施形態に係る機能実行指示システム1で実行される処理である機能実行指示方法である。   Subsequently, information indicating the task instructed to be executed by the function execution instruction unit 11 is stored in the execution function storage unit 15 (S09, execution function storage step). The information indicating the task stored here is referred to when the task to be instructed is determined (S06) when the task is instructed next by the user's voice. The task execution (start-up) processing by voice (the processing of S01 to S09) can be repeated. The above is the function execution instruction method which is the process executed by the function execution instruction system 1 according to the present embodiment.

上述したように本実施形態では、タスクに関連する(対応付けられた)カテゴリと入力された単語のカテゴリとに基づいて、過去に実行が指示されたタスクの実行をこれから指示するか否かが判断される。これにより、例えば、過去に実行されたタスクを引き続いて実行すべきか、新たなタスクを実行すべきか適切に判断される。   As described above, in the present embodiment, whether or not to instruct execution of a task that has been instructed in the past based on the category associated with (associated with) the task and the category of the input word is determined. To be judged. Thereby, for example, it is appropriately determined whether a task executed in the past should be executed subsequently or a new task should be executed.

上述した例のように「乗換案内」のタスクによって、東京駅までの乗換が調べられた後、「やっぱり横浜」と発話された場合には、タスクの引き継ぎが行われて横浜駅までの乗換が調べられる。一方で、「カレー」と発話された場合には、タスクの引き継ぎが行われず「グルメ検索」のタスクが実行される。本実施形態とは異なり、一律にタスクを引き継ぐとした場合は、「カレー」と発話された場合、「乗換案内」と「カレー」とが対応しないため、「カレー」が無視され、ユーザの意図とは異なり再度東京駅までの乗換が調べられてしまう。また、本実施形態とは異なり、一律にタスクを引き継がないとした場合は、「やっぱり横浜」と発話された場合、ユーザの意図とは異なり上述したように「地図検索」のタスクが実行されてしまう。上記のように本実施形態では、タスクの引き継ぎ、あるいはタスク遷移が、ユーザの意図に沿って適切に行われて適切なタスクが実行される。   As in the example above, after the transfer to Tokyo Station is examined by the task of “Transfer Information”, if “Yokohama” is spoken after all, the task is taken over and transfer to Yokohama Station is performed. Be examined. On the other hand, when “curry” is spoken, the task of “gourmet search” is executed without taking over the task. Unlike this embodiment, if the task is assumed to be taken over uniformly, if “Curry” is spoken, “Transfer” and “Curry” do not correspond, so “Curry” is ignored and the user ’s intention In contrast, transfer to Tokyo Station will be examined again. Also, unlike this embodiment, if it is assumed that the task is not handed over uniformly, when “Yokohama” is spoken, the “map search” task is executed as described above, unlike the user's intention. End up. As described above, in the present embodiment, task takeover or task transition is appropriately performed according to the user's intention, and an appropriate task is executed.

また、本実施形態においては、入力された単語のカテゴリが、当該単語が含まれる情報に含まれる当該単語以外の単語に基づいて特定されるため、適切にカテゴリが特定される。具体的には、上述したように図7に示す共起確率のスコアに基づいてカテゴリが特定される。上述した例のように「笹本さんの電話番号」とのユーザによる発話がなされて電話帳検索のタスクが実行された後(例えば、「笹本さんの電話番号はxxxxです」といったユーザへの通知が行われた後)、乗換案内のタスクの実行を意図して「渋谷に行きたい」とのユーザによる発話がなされた場合を考える。   In the present embodiment, since the category of the input word is specified based on a word other than the word included in the information including the word, the category is appropriately specified. Specifically, as described above, the category is specified based on the co-occurrence probability score shown in FIG. After the user utters “Mr. Enomoto's phone number” and the phone book search task is executed as in the above example (for example, “Mr. Enomoto's phone number is xxx”) Suppose the user utters “I want to go to Shibuya” with the intention of executing the task of transfer guidance.

図7に示す共起確率のスコアに基づくカテゴリの特定(限定)がなされない場合には、電話帳検索のタスクが引き継がれてしまう。しかし、本実施形態では、共起確率のスコアに基づくカテゴリの特定が行われ、「渋谷」との単語のカテゴリが「駅」カテゴリとして特定される。これにより、電話帳検索のタスクは引き継がれず、新たなタスクとして乗換案内のタスクが実行される(例えば、「渋谷駅までの乗換案内はこちらです」といったユーザへの通知が行われる)。このようにユーザの期待通りの動作が行われる。即ち、本実施形態によれば、連続して入力された単語による機能の実行を適切に行うことができる。   If the category is not specified (limited) based on the co-occurrence probability score shown in FIG. 7, the telephone directory search task is taken over. However, in this embodiment, the category is identified based on the co-occurrence probability score, and the category of the word “Shibuya” is identified as the “station” category. As a result, the task of searching for the phone book is not carried over, and the task of transfer guidance is executed as a new task (for example, notification to the user such as “Here is the transfer guide to Shibuya Station” is performed). In this way, the operation as expected by the user is performed. In other words, according to the present embodiment, it is possible to appropriately perform the function using the words that are continuously input.

また、本実施形態のように「乗換」といった特定タスクとの関連が強いキーワードを予め設定した単語として設定しておき、上記キーワードに基づいて実行されるタスクが決定されることとしてもよい。この構成によれば、例えば、機能に深く関連する単語に基づいて、適切にタスクを実行することができる。   Also, as in the present embodiment, a keyword that is strongly related to a specific task such as “transfer” may be set as a preset word, and a task to be executed may be determined based on the keyword. According to this configuration, for example, a task can be appropriately executed based on a word deeply related to a function.

また、上述した例のように直前に実行されたタスクを引き継いで実行するか判断することとしてもよい。この構成によれば、例えば、直前に実行されたタスクを引き続いて実行すべきか、新たなタスクを実行すべきか適切に判断され、連続して入力された単語による機能の実行を適切に行うことができる。但し、必ずしも、直前に実行されたタスクのみを引き継ぎの判断対象とする必要はなく、例えば、一定時間以内に実行された複数のタスクを引き継ぎの対象としてもよい。   In addition, as in the above-described example, it may be determined whether to execute the task executed immediately before. According to this configuration, for example, it is appropriately determined whether the task executed immediately before should be executed subsequently or a new task should be executed, and the function can be appropriately executed by continuously input words. it can. However, it is not always necessary to set only the task executed immediately before as a takeover determination target. For example, a plurality of tasks executed within a predetermined time may be set as takeover targets.

また、本実施形態のようにタスクにスロットを設けて、単語入力部12によって入力された単語をスロットに入力する構成としてもよい。この構成によれば、タスクの実行と合わせて、単語入力部12によって入力された単語を当該タスクへの入力とすることができ、適切なタスクの実行が可能となり、ユーザの利便性を向上させることができる。例えば、上述した「乗換案内」のタスクの実行と合わせて、入力された駅名による案内を行うことができる。   Moreover, it is good also as a structure which provides a slot in a task like this embodiment and inputs the word input by the word input part 12 into a slot. According to this configuration, together with the execution of the task, the word input by the word input unit 12 can be used as an input to the task, an appropriate task can be executed, and the convenience of the user is improved. be able to. For example, in combination with the execution of the task of “transfer guidance” described above, guidance based on the input station name can be performed.

また、本実施形態のようにタスクの引き継ぎの判断は、タスクに関連する(対応付いた)カテゴリ(スロットのカテゴリ)と、入力された単語のカテゴリとを比較して、それらが一致しているか判断することによって行うこととしてもよい。この構成によれば、より適切に過去に実行が指示されたタスクを実行指示するか否かを判断することができ、より適切に本発明を実施することができる。   In addition, as in this embodiment, the determination of task takeover is made by comparing the category (slot category) related to the task (the category of the slot) with the category of the input word, and whether they match. It may be performed by judging. According to this configuration, it is possible to determine whether or not to instruct execution of a task for which execution has been instructed in the past more appropriately, and it is possible to more appropriately implement the present invention.

また、スロットに入力した単語を記憶しておき、記憶した単語を次にタスクの実行が指示されるときのスロットへの入力とすることとしてもよい。この構成によれば、過去に実行が指示されたタスクで用いられた単語を新たに実行される機能への入力とすることができ、更にユーザの利便性を向上させることができる。例えば、上述した「乗換案内」のタスクにおいて、着駅のみを変更した案内を行うことができる。   Alternatively, the word input in the slot may be stored, and the stored word may be used as an input to the slot when the next task execution is instructed. According to this configuration, a word used in a task for which execution has been instructed in the past can be used as an input to a newly executed function, and user convenience can be further improved. For example, in the “transfer guidance” task described above, it is possible to provide guidance in which only the arrival station is changed.

また、本実施形態のように音声を入力して音声認識を行って、音声認識結果を入力される単語を含む情報とすることとしてもよい。この構成によれば、ユーザの音声によって機能を実行することが可能となる。   Further, as in the present embodiment, voice recognition may be performed by inputting voice, and the voice recognition result may be information including the input word. According to this configuration, the function can be executed by the user's voice.

但し、本実施形態においては、機能実行指示システム1において、音声認識サーバ20を含むこととしていたが、必ずしも音声認識サーバ20を含む必要はない。この場合、音声認識された結果、あるいは音声認識によらない単語群や文章が機能実行指示システム1に入力される。また、本実施形態では、機能実行指示サーバ10と音声認識サーバ20とが別体として構成されていたが、それらが一体として構成されていてもよい。この場合、音声認識結果を、通信端末30を介して送受信する必要がない。また、通信端末30等のユーザに用いられる端末に、機能実行指示サーバ10あるいは音声認識サーバ20の機能が備えられていてもよい。その場合、当該端末が本発明の一実施形態に係る機能実行指示システムとなる。あるいは、機能実行指示サーバ10がタスクを実行する機能を有しており、タスクの実行結果を通信端末30に提供する構成であってもよい。   However, in the present embodiment, the function execution instruction system 1 includes the voice recognition server 20, but the voice recognition server 20 is not necessarily included. In this case, a result of speech recognition or a word group or a sentence not based on speech recognition is input to the function execution instruction system 1. Further, in the present embodiment, the function execution instruction server 10 and the voice recognition server 20 are configured separately, but they may be configured as a single unit. In this case, it is not necessary to transmit / receive the voice recognition result via the communication terminal 30. Further, a function used by the function execution instruction server 10 or the voice recognition server 20 may be provided in a terminal used by a user such as the communication terminal 30. In that case, the terminal is a function execution instruction system according to an embodiment of the present invention. Alternatively, the function execution instruction server 10 may have a function of executing a task, and the task execution result may be provided to the communication terminal 30.

また、上述した実施形態では、機能実行指示部11によって実行が指示されたタスクを示す情報が、実行機能記憶部15に入力されて記憶されていた。しかしながら、実行機能記憶部15に記憶される情報は、機能実行指示部11からではなく、通信端末30から送信されて、機能実行指示サーバ10に受信されることとしてもよい。この場合、上述したような機能実行指示サーバ10の実行機能記憶部15の機能は必ずしも必要ない。   Further, in the above-described embodiment, information indicating a task for which execution is instructed by the function execution instructing unit 11 is input and stored in the execution function storage unit 15. However, the information stored in the execution function storage unit 15 may be transmitted from the communication terminal 30 instead of the function execution instruction unit 11 and received by the function execution instruction server 10. In this case, the function of the execution function storage unit 15 of the function execution instruction server 10 as described above is not necessarily required.

この場合、通信端末30は、機能実行指示サーバ10(の機能実行指示部11)から直前に実行を指示されたタスク(当該指示によって実行された、あるいは実行されているタスク)を示す情報を、上記の音声認識の結果と合わせて機能実行指示サーバ10に送信する。例えば、通信端末30は、「やっぱり横浜」あるいは「カレー」という発話の情報と、実行中のタスクを示す「乗換案内」の情報とを機能実行指示サーバ10に送信する。機能実行指示サーバ10では、当該情報が受信されて、実行機能決定部14が受信された情報に基づいて上記と同様に実行が指示される機能を決定する。また、機能実行指示サーバ10の実行機能決定部14は、上記の情報以外の実行機能記憶部15に記憶される情報(例えば、直前に実行されたタスクのスロットに入力された情報)を、通信端末30から受信して、実行が指示される機能の決定及び実行の指示に用いることとしてもよい。   In this case, the communication terminal 30 stores information indicating a task (task executed or executed in accordance with the instruction) instructed to be executed immediately from the function execution instruction server 10 (function execution instruction unit 11 thereof). The result is sent to the function execution instruction server 10 together with the result of the voice recognition. For example, the communication terminal 30 transmits the utterance information “Yokohama” or “curry” and the “transfer guidance” information indicating the task being executed to the function execution instruction server 10. In the function execution instruction server 10, the information is received, and the execution function determination unit 14 determines a function to be executed in the same manner as described above based on the received information. The execution function determination unit 14 of the function execution instruction server 10 communicates information stored in the execution function storage unit 15 other than the above information (for example, information input to the slot of the task executed immediately before). The function may be received from the terminal 30 and used to determine a function to be executed and to instruct execution.

1…機能実行指示システム、10…機能実行指示サーバ、11…機能実行指示部、12…単語入力部、13…カテゴリ特定部、14…実行機能決定部、15…実行機能記憶部、20…音声認識サーバ、101…CPU、102…RAM、103…ROM、104…通信モジュール、105…補助記憶装置、30…通信端末。   DESCRIPTION OF SYMBOLS 1 ... Function execution instruction system, 10 ... Function execution instruction server, 11 ... Function execution instruction part, 12 ... Word input part, 13 ... Category specification part, 14 ... Execution function determination part, 15 ... Execution function memory | storage part, 20 ... Voice Recognition server 101 ... CPU 102 ... RAM 103 ... ROM 104 ... Communication module 105 ... Auxiliary storage device 30 ... Communication terminal

Claims (8)

機能毎に予め設定されたカテゴリに関連する1つ以上の機能の実行を指示する機能実行指示手段と、
単語を含む情報を入力する単語入力手段と、
前記単語入力手段によって入力された情報に含まれる単語のカテゴリを、当該情報に含まれる当該単語以外の単語に基づいて特定するカテゴリ特定手段と、
前記カテゴリ特定手段によって特定されたカテゴリに応じて、前記1つ以上の機能から前記機能実行指示手段によって実行が指示される機能を決定する実行機能決定手段と、を備え、
前記実行機能決定手段は、前記カテゴリ特定手段によって特定されたカテゴリ、及び過去に前記機能実行指示手段によって実行が指示された機能に関連するカテゴリに基づいて、当該過去に前記機能実行指示手段によって実行が指示された機能の実行をこれから指示するか否か判断し、当該過去に前記機能実行指示手段によって実行が指示された機能の実行をこれから指示しないと判断した場合に、前記単語入力手段によって入力された情報に含まれる単語に基づいて、これから実行が指示される機能を新たに決定する機能実行指示システム。
Function execution instruction means for instructing execution of one or more functions related to a category set in advance for each function;
A word input means for inputting information including a word;
Category specifying means for specifying a category of words included in the information input by the word input means based on words other than the words included in the information;
Execution function determining means for determining a function to be instructed to be executed by the function execution instructing means from the one or more functions according to the category specified by the category specifying means,
The execution function determining means is executed by the function execution instructing means in the past based on the category specified by the category specifying means and the category related to the function instructed to be executed by the function execution instructing means in the past. Is input by the word input unit when it is determined that the execution of the function instructed in the past by the function execution instructing unit is not instructed from now on. A function execution instruction system for newly determining a function to be instructed to execute based on a word included in the information .
前記カテゴリ特定手段は、前記単語入力手段によって入力された情報に含まれる特定対象の単語と当該情報に含まれる当該単語以外の単語とが同一の情報に含まれる度合いを示す情報に基づいて、前記特定対象の単語のカテゴリを特定する請求項1に記載の機能実行指示システム。   The category specifying unit is based on information indicating a degree that a word to be specified included in the information input by the word input unit and a word other than the word included in the information are included in the same information. The function execution instruction system according to claim 1, wherein a category of a word to be specified is specified. 前記機能実行指示手段によって実行が指示された機能を記憶する実行機能記憶手段を更に備え、
前記実行機能決定手段は、前記カテゴリ特定手段によって特定されたカテゴリ、及び前記実行機能記憶手段によって記憶された過去に前記機能実行指示手段によって実行が指示された機能に関連するカテゴリに基づいて、当該過去に前記機能実行指示手段によって実行が指示された機能の実行をこれから指示するか否か判断する、請求項1又は2に記載の機能実行指示システム。
An execution function storage means for storing the function instructed to be executed by the function execution instruction means;
The execution function determining means is based on the category specified by the category specifying means and the category related to the function instructed to be executed by the function execution instruction means in the past stored by the execution function storage means. The function execution instruction system according to claim 1, wherein it is determined whether or not to instruct execution of a function that has been instructed to be executed by the function execution instruction means in the past.
前記実行機能決定手段は、前記カテゴリ特定手段によって特定されたカテゴリに応じて、当該カテゴリに係る単語が前記単語入力手段によって入力される直前に前記機能実行指示手段によって実行が指示された機能の実行を指示するか否か判断する請求項1〜3の何れか一項に記載の機能実行指示システム。   The execution function determining means executes the function instructed to be executed by the function execution instructing means immediately before a word related to the category is input by the word input means according to the category specified by the category specifying means. The function execution instruction system according to any one of claims 1 to 3, wherein it is determined whether or not to instruct the user. 前記機能実行指示手段によって実行が指示される機能には、前記単語入力手段によって入力された情報に含まれると共に当該機能に関連するカテゴリの単語を入力する機能が含まれており、
前記実行機能決定手段は、前記カテゴリ特定手段によって特定されたカテゴリの単語が、前記過去に前記機能実行指示手段によって実行が指示された機能への入力が可能か否かを判断して、当該判断に応じて当該過去に前記機能実行指示手段によって実行が指示された機能の実行を指示するか否かを判断する、請求項1〜4の何れか一項に記載の機能実行指示システム。
Functions that are instructed to be executed by the function execution instructing unit include a function that is included in the information input by the word input unit and that inputs a word of a category related to the function,
The execution function determining means determines whether or not the words of the category specified by the category specifying means can be input to the function for which execution has been instructed in the past by the function execution instructing means. 5. The function execution instruction system according to claim 1, wherein the function execution instruction system determines whether to instruct execution of a function that has been instructed by the function execution instruction unit in the past.
前記実行機能決定手段は、前記カテゴリ特定手段によって特定されたカテゴリと、前記過去に実行が指示された機能への入力とされた単語のカテゴリとが一致するか否かを判断して、一致すると判断した場合に当該機能の実行をこれから指示すると判断する請求項5に記載の機能実行指示システム。   The execution function determining means determines whether the category specified by the category specifying means matches the category of the word that has been input to the function for which execution has been instructed in the past. The function execution instruction system according to claim 5, wherein if it is determined, it is determined that the execution of the function is to be instructed. 音声を入力して、入力した音声に対して音声認識を行って、音声認識を行った結果を前記単語入力手段に入力する音声認識手段を更に備える請求項1〜6の何れか一項に記載の機能実行指示システム。   The speech recognition unit according to any one of claims 1 to 6, further comprising speech recognition means for inputting speech, performing speech recognition on the input speech, and inputting the result of speech recognition to the word input means. Function execution instruction system. 機能実行指示システムの動作方法である機能実行指示方法であって、
機能毎に予め設定されたカテゴリに関連する1つ以上の機能の実行を指示する機能実行指示ステップと、
単語を含む情報を入力する単語入力ステップと、
前記単語入力ステップにおいて入力された情報に含まれる単語のカテゴリを、当該情報に含まれる当該単語以外の単語に基づいて特定するカテゴリ特定ステップと、
前記カテゴリ特定ステップにおいて特定されたカテゴリに応じて、前記1つ以上の機能から前記機能実行指示ステップにおいて実行が指示される機能を決定する実行機能決定ステップと、を含み、
前記実行機能決定ステップにおいて、前記カテゴリ特定ステップにおいて特定されたカテゴリ、及び過去に前記機能実行指示ステップにおいて実行が指示された機能に関連するカテゴリに基づいて、当該過去に前記機能実行指示ステップにおいて実行が指示された機能の実行をこれから指示するか否か判断し、当該過去に前記機能実行指示ステップにおいて実行が指示された機能の実行をこれから指示しないと判断した場合に、前記単語入力ステップにおいて入力された情報に含まれる単語に基づいて、これから実行が指示される機能を新たに決定する機能実行指示方法。
A function execution instruction method that is an operation method of the function execution instruction system,
A function execution instruction step for instructing execution of one or more functions related to a preset category for each function;
A word input step for inputting information including the word;
A category specifying step for specifying a category of a word included in the information input in the word input step based on a word other than the word included in the information;
An execution function determining step for determining a function to be instructed in the function execution instruction step from the one or more functions according to the category specified in the category specifying step;
In the execution function determining step, based on the category specified in the category specifying step and the category related to the function that has been instructed in the function execution instructing step in the past, the function execution instructing step in the past Is input in the word input step when it is determined whether or not to instruct the execution of the function instructed in the function execution instruction step in the past. A function execution instructing method for newly determining a function to be instructed for execution based on a word included in the information .
JP2013153624A 2013-07-24 2013-07-24 Function execution instruction system and function execution instruction method Active JP6223739B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013153624A JP6223739B2 (en) 2013-07-24 2013-07-24 Function execution instruction system and function execution instruction method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013153624A JP6223739B2 (en) 2013-07-24 2013-07-24 Function execution instruction system and function execution instruction method

Publications (2)

Publication Number Publication Date
JP2015025856A JP2015025856A (en) 2015-02-05
JP6223739B2 true JP6223739B2 (en) 2017-11-01

Family

ID=52490579

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013153624A Active JP6223739B2 (en) 2013-07-24 2013-07-24 Function execution instruction system and function execution instruction method

Country Status (1)

Country Link
JP (1) JP6223739B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6481643B2 (en) * 2016-03-08 2019-03-13 トヨタ自動車株式会社 Audio processing system and audio processing method
EP3742301A1 (en) * 2018-01-17 2020-11-25 Sony Corporation Information processing device and information processing method

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4344418B2 (en) * 1999-03-31 2009-10-14 シャープ株式会社 Voice summarization apparatus and recording medium recording voice summarization program
JP2005327107A (en) * 2004-05-14 2005-11-24 Fuji Xerox Co Ltd Proper name category estimation device and program
JP4405370B2 (en) * 2004-11-15 2010-01-27 本田技研工業株式会社 Vehicle equipment control device
JP4131978B2 (en) * 2006-02-24 2008-08-13 本田技研工業株式会社 Voice recognition device controller
JP4412504B2 (en) * 2007-04-17 2010-02-10 本田技研工業株式会社 Speech recognition apparatus, speech recognition method, and speech recognition program

Also Published As

Publication number Publication date
JP2015025856A (en) 2015-02-05

Similar Documents

Publication Publication Date Title
JP6073881B2 (en) Function execution instruction system, function execution instruction method, and function execution instruction program
US11423888B2 (en) Predicting and learning carrier phrases for speech input
US9905228B2 (en) System and method of performing automatic speech recognition using local private data
KR102297394B1 (en) Automated assistant invocation of appropriate agent
US10331784B2 (en) System and method of disambiguating natural language processing requests
JP6280342B2 (en) Function execution instruction system and function execution instruction method
EP3195307B1 (en) Platform for creating customizable dialog system engines
US8775189B2 (en) Control center for a voice controlled wireless communication device system
JP5819261B2 (en) Function execution instruction system, function execution instruction method, and function execution instruction program
US7742922B2 (en) Speech interface for search engines
US9817809B2 (en) System and method for treating homonyms in a speech recognition system
CN111540353B (en) Semantic understanding method, device, equipment and storage medium
KR20210113696A (en) Contextual voice-driven deep bookmarking
JP2008234427A (en) Device, method, and program for supporting interaction between user
JP6223739B2 (en) Function execution instruction system and function execution instruction method
JP6085149B2 (en) Function execution instruction system, function execution instruction method, and function execution instruction program
CN107170447B (en) Sound processing system and sound processing method
JP5901694B2 (en) Dictionary database management device, API server, dictionary database management method, and dictionary database management program
CN114860910A (en) Intelligent dialogue method and system
JP2015102805A (en) Voice recognition system, electronic device, server, voice recognition method and voice recognition program
JP5958504B2 (en) COMMUNICATION PROCESSING DEVICE, COMMUNICATION PROCESSING SYSTEM, COMMUNICATION PROCESSING METHOD, AND COMMUNICATION PROCESSING PROGRAM

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160215

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170314

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170413

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170926

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171004

R150 Certificate of patent or registration of utility model

Ref document number: 6223739

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250