JP2015018327A - Terminal device, communication system, communication method, and program - Google Patents
Terminal device, communication system, communication method, and program Download PDFInfo
- Publication number
- JP2015018327A JP2015018327A JP2013143750A JP2013143750A JP2015018327A JP 2015018327 A JP2015018327 A JP 2015018327A JP 2013143750 A JP2013143750 A JP 2013143750A JP 2013143750 A JP2013143750 A JP 2013143750A JP 2015018327 A JP2015018327 A JP 2015018327A
- Authority
- JP
- Japan
- Prior art keywords
- information
- user
- server device
- communication
- terminal device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004891 communication Methods 0.000 title claims abstract description 126
- 238000000034 method Methods 0.000 title description 12
- 230000005540 biological transmission Effects 0.000 claims description 27
- 230000004044 response Effects 0.000 claims description 25
- 238000012545 processing Methods 0.000 description 22
- 230000006870 function Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 9
- 239000003795 chemical substances by application Substances 0.000 description 8
- 235000010724 Wisteria floribunda Nutrition 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 6
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000013500 data storage Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Landscapes
- Telephonic Communication Services (AREA)
Abstract
Description
本発明は、ユーザからの情報に応答する技術に関する。 The present invention relates to a technique for responding to information from a user.
特許文献1には、複数のエージェントによりサービスを受ける技術が開示されている。特許文献1に開示されたシステムにおいては、ローカルネットワークに接続されたPC(Personal Computer)でMYエージェントが動作する。また、ローカルネットワークが接続されたインターネットには、サービスエージェントが稼働する機器が接続されている。PCに対してユーザが発話すると、PCで稼働しているMYエージェントが応答する。また、PCに対してユーザが発話すると、必要に応じてインターネットに接続された機器で稼働しているサービスエージェントが応答する。 Patent Document 1 discloses a technique for receiving services by a plurality of agents. In the system disclosed in Patent Document 1, an MY agent operates on a PC (Personal Computer) connected to a local network. In addition, a device on which a service agent operates is connected to the Internet to which a local network is connected. When the user speaks to the PC, the MY agent operating on the PC responds. When the user speaks to the PC, a service agent operating on a device connected to the Internet responds as necessary.
ところで、特許文献1におけるPCがスマートフォンであり、移動体通信網を介してサービスエージェントと通信を行う場合、例えばスマートフォンが電車で移動中のときにはスマートフォンが圏外となり、インターネットに接続されている機器とスマートフォンとが通信を行えなくなる場合がある。この場合、ユーザが操作するスマートフォンが、インターネットに接続された機器で動作しているサービスエージェントと通信を行えなくなり、ユーザの発話に対して応答が得られないという事態が生じてしまう。 By the way, when PC in patent document 1 is a smart phone and communicates with a service agent via a mobile communication network, for example, when the smart phone is moving by train, the smart phone is out of service area, and the device and the smart phone connected to the Internet. May not be able to communicate with each other. In this case, the smartphone operated by the user cannot communicate with the service agent operating on the device connected to the Internet, and a situation in which a response to the user's utterance cannot be obtained occurs.
本発明は、上述した背景の下になされたものであり、端末装置が他の装置と通信を行えない状態にあっても、ユーザに対してコミュニケーションを継続する技術を提供することを目的とする。 The present invention has been made under the above-described background, and an object of the present invention is to provide a technology for continuing communication to a user even when a terminal device cannot communicate with other devices. .
本発明は、ユーザからの第1情報を取得する取得手段と、サーバ装置との通信が不可である場合、前記取得手段が前記第1情報を取得すると、前記ユーザとコミュニケーションを図る第2情報を出力する第1出力手段と、前記サーバ装置との通信が可である場合、前記取得手段が前記第1情報を取得すると、前記第1情報を前記サーバ装置へ送信する第1送信手段と、前記第1送信手段が送信した前記第1情報への応答として前記サーバ装置から送信された第3情報を受信し、受信した第3情報を出力する第2出力手段とを有する端末装置を提供する。 In the present invention, when the acquisition means for acquiring the first information from the user and communication with the server device are impossible, the second information for communicating with the user is obtained when the acquisition means acquires the first information. When communication between the first output means for outputting and the server apparatus is possible, when the acquisition means acquires the first information, the first transmission means for transmitting the first information to the server apparatus; There is provided a terminal device comprising: second output means for receiving third information transmitted from the server apparatus as a response to the first information transmitted by the first transmission means, and outputting the received third information.
また、本発明は、端末装置とサーバ装置とを備えるコミュニケーションシステムであって、前記端末装置は、ユーザからの第1情報を取得する取得手段と、前記サーバ装置との通信が不可である場合、前記取得手段が前記第1情報を取得すると、前記ユーザとコミュニケーションを図る第2情報を出力する第1出力手段と、前記サーバ装置との通信が可である場合、前記取得手段が前記第1情報を取得すると、前記第1情報を前記サーバ装置へ送信する第1送信手段と、前記第1送信手段が送信した前記第1情報への応答として前記サーバ装置から送信された第3情報を受信し、受信した第3情報を出力する第2出力手段とを有し、前記サーバ装置は、前記第1送信手段から送信された前記第1情報を受信する受信手段と、前記受信手段が受信した前記第1情報に対応した第3情報を生成する生成手段と、前記第3情報を前記端末装置へ送信する第2送信手段と、を有するコミュニケーションシステムを提供する。 Moreover, this invention is a communication system provided with a terminal device and a server apparatus, Comprising: When the said terminal device cannot communicate with the acquisition means which acquires the 1st information from a user, and the said server device, When the acquisition unit acquires the first information, when the first output unit that outputs second information for communicating with the user and communication with the server device are possible, the acquisition unit includes the first information. The first transmission means for transmitting the first information to the server apparatus, and the third information transmitted from the server apparatus as a response to the first information transmitted by the first transmission means. And second output means for outputting the received third information, wherein the server device receives the first information transmitted from the first transmission means, and the reception means receives the first information. Providing a communication system comprising generating means for generating a to third information corresponding to the first information, and second transmission means for transmitting the third information to the terminal device.
本発明においては、前記端末装置は、前記サーバ装置との通信が不可である場合、前記取得手段が前記第1情報を取得すると、当該第1情報を記憶手段に記憶させる制御手段を有し、前記第1送信手段は、前記サーバ装置との通信が不可の状態から可の状態に変化した場合、前記記憶手段に記憶された前記第1情報を前記サーバ装置へ送信する構成としてもよい。 In the present invention, the terminal device includes a control unit that stores the first information in the storage unit when the acquisition unit acquires the first information when communication with the server device is impossible. The first transmission unit may be configured to transmit the first information stored in the storage unit to the server device when communication with the server device is changed from a disabled state to an enabled state.
また、本発明においては、前記第1送信手段は、予め定められたタイミングで前記サーバ装置との通信が可である場合、予め定められた第1情報を前記サーバ装置へ送信する構成としてもよい。 In the present invention, the first transmission means may be configured to transmit predetermined first information to the server device when communication with the server device is possible at a predetermined timing. .
また、本発明においては、前記第1情報は、ユーザが発した音声を示す音声信号又は当該音声の音声認識結果を示すテキストデータである構成としてもよい。 In the present invention, the first information may be a voice signal indicating a voice uttered by a user or text data indicating a voice recognition result of the voice.
また、本発明においては、前記第1出力手段は、前記第2情報を音声で出力し、前記第2出力手段は、前記第3情報を音声で出力する構成としてもよい。 In the present invention, the first output unit may output the second information by voice, and the second output unit may output the third information by voice.
また、本発明においては、前記第1出力手段が出力する音声と前記第2出力手段が出力する音声とが異なる構成としてもよい。 In the present invention, the sound output from the first output means may be different from the sound output from the second output means.
また、本発明は、ユーザからの第1情報を取得する取得ステップと、サーバ装置との通信が不可である場合、前記取得ステップで前記第1情報を取得すると、前記ユーザとコミュニケーションを図る第2情報を出力する第1出力ステップと、前記サーバ装置との通信が可である場合、前記取得ステップで前記第1情報を取得すると、前記第1情報を前記サーバ装置へ送信する送信ステップと、前記送信ステップで送信した前記第1情報への応答として前記サーバ装置から送信された第3情報を受信し、受信した第3情報を出力する第2出力ステップとを有するコミュニケーション方法を提供する。 Further, according to the present invention, when the acquisition step of acquiring the first information from the user and the communication with the server device are impossible, the second step of communicating with the user is acquired when the first information is acquired in the acquisition step. A first output step for outputting information; and a transmission step for transmitting the first information to the server device upon acquiring the first information in the obtaining step when communication with the server device is possible; There is provided a communication method including a second output step of receiving third information transmitted from the server device as a response to the first information transmitted in the transmitting step and outputting the received third information.
また、本発明は、コンピュータを、ユーザからの第1情報を取得する取得手段と、サーバ装置との通信が不可である場合、前記取得手段が前記第1情報を取得すると、前記ユーザとコミュニケーションを図る第2情報を出力する第1出力手段と、前記サーバ装置との通信が可である場合、前記取得手段が前記第1情報を取得すると、前記第1情報を前記サーバ装置へ送信する第1送信手段と、前記第1送信手段が送信した前記第1情報への応答として前記サーバ装置から送信された第3情報を受信し、受信した第3情報を出力する第2出力手段として機能させるためのプログラムを提供する。 Further, according to the present invention, when communication between the acquisition unit for acquiring the first information from the user and the server device is impossible, the computer communicates with the user when the acquisition unit acquires the first information. When communication between the first output means for outputting the second information and the server device is possible, when the acquisition means acquires the first information, the first information is transmitted to the server device. To function as transmission means and second output means for receiving third information transmitted from the server device as a response to the first information transmitted by the first transmission means and outputting the received third information Provide a program.
本発明によれば、端末装置が他の装置と通信を行えない状態にあっても、ユーザに対してコミュニケーションを継続することができる。 ADVANTAGE OF THE INVENTION According to this invention, even if it is in the state which a terminal device cannot communicate with another apparatus, communication can be continued with respect to a user.
[実施形態]
(全体構成)
図1は、本発明の一実施形態に係るコミュニケーションシステム1を構成する装置を示した図である。コミュニケーションシステム1は、ユーザから与えられた情報に応答し、与えられた情報に対応した情報をユーザに提示するシステムである。本実施形態に係るコミュニケーションシステム1は、サーバ装置20と端末装置10とで構成されており、ユーザが端末装置10に話しかけた音声(ユーザから与えられる情報の一例)に応答し、話しかけた音声の内容に対応した情報をユーザに提示する、即ち、ユーザと装置とが互いに情報を伝達してコミュニケーションを図るシステムである。
[Embodiment]
(overall structure)
FIG. 1 is a diagram showing an apparatus constituting a communication system 1 according to an embodiment of the present invention. The communication system 1 is a system that responds to information given by a user and presents information corresponding to the given information to the user. The communication system 1 according to the present embodiment includes a
通信網2は、スマートフォンなどの端末装置10に音声通信やデータ通信などの通信サービスを提供する通信網である。通信網2は、インターネットや固定電話網、公衆無線LAN(Local Area Network)なども含めることができる。サーバ装置20と端末装置10は、通信網2を介してデータ通信を行う。
The
端末装置10は、本実施形態においてはスマートフォンであり、通信網2を介して音声通信やデータ通信を行う。端末装置10は、スマートフォンに限定されるものではなく、通信網2を介してデータ通信を行う機能を備えているものであれば、タブレットPC、フィーチャーフォン又はPDA(Personal Digital Assistant)などであってもよい。本実施形態においては、端末装置10は、ユーザから与えられた情報に応答するソフトウェアエージェントの機能が実現する。なお、コミュニケーションシステム1においては、端末装置10は複数存在するが、図面が繁雑になるのを防ぐため、図1においては、一つの端末装置10のみを示している。
The
サーバ装置20は、端末装置10から送られた情報に対して応答するソフトウェアエージェントの機能を有する装置である。サーバ装置20は、端末装置10から送られた情報を解析し、送られた情報に対応した情報を取得して端末装置10へ送信する。
The
(端末装置10の構成)
図2は、端末装置10のハードウェア構成の一例を示したブロック図である。制御部101は、CPU(Central Processing Unit)やRAM(Random Access Memory)、不揮発性メモリを備えており。CPUが不揮発性メモリに記憶されているプログラムを実行すると、スマートフォンの基本的な機能が実現する。
(Configuration of terminal device 10)
FIG. 2 is a block diagram illustrating an example of a hardware configuration of the
表示部103は、液晶ディスプレイを備えており、端末装置10を操作するための画面や各種メッセージを表示する。操作部104は、端末装置10を操作するための複数のキーを備えている。また、操作部104は、表示部103の表面に設けられ、表示部103が表示した画像を透過し、指が触れた位置を検出するタッチパネルを備えている。通信部105は、通信網2を介して通信を行う通信インターフェースとして機能し、各種情報の受信や送信を行う。
The
音声処理部107は、マイクロホンとスピーカを有している。音声処理部107は、端末装置10同士が音声通話を行う場合、通話相手の音声に係るデジタル信号が通信部105から供給されると、供給されたデジタル信号をアナログ信号に変換する。このアナログ信号は、スピーカへ供給され、スピーカからは、通話相手の音声が放音される。また、音声処理部107は、マイクロホンが音声を収音すると、収音した音声をデジタル信号に変換する。音声処理部107は、端末装置10が音声通話を行う場合、ユーザの音声を変換したデジタル信号を通信部105へ供給する。このデジタル信号は、通信部105から通信網2へ送信され、通話相手の端末装置10へ送信される。また、音声処理部107は、制御部101が後述するアプリAを実行している場合には、マイクロホンが収音したユーザの音声をデジタル信号に変換し、このデジタル信号を制御部101へ供給する。
The
記憶部102は、不揮発性メモリであり、各種アプリケーションプログラムを記憶する。本実施形態においては、記憶部102は、ユーザから与えられた情報に応答するソフトウェアエージェントの機能を実現するアプリケーションプログラム(以下、アプリAと称する)を記憶している。制御部101のCPUが、記憶部102に記憶されているアプリAを実行すると、ユーザから与えられた情報に応答するソフトウェアエージェントの機能が実現する。ソフトウェアエージェントは、ユーザが端末装置10に話しかけた音声(情報)に応答し、話しかけた音声の内容に対応した情報をサーバ装置20と協働してユーザに提示する。
The
また、記憶部102は、ソフトウェアエージェントがユーザの音声を認識するときに用いる音響モデルMA1と、言語モデルMA2とを記憶している。音響モデルMA1は、音声の特徴量と音素との対応関係を示すモデルであり、音素がそれぞれどのような周波数特性を持っているかを表したものである。音響モデルとしては、周知の隠れマルコフモデルを用いている。言語モデルMA2は、形態素の前後間のつながりやすさや音素の並び方に関する制約を表したものである。
The
図3は、アプリAを実行した制御部101において実現する機能のうち、本発明に係る特徴的な機能の構成を示したブロック図である。取得手段1001は、音声処理部107が出力したデジタル信号、即ち、マイクロフォンが収音したユーザの音声を表す信号を取得する手段である。第1送信手段1002は、サーバ装置20との通信が可能な場合、取得手段1001が得たユーザの音声の信号を通信部105を制御してサーバ装置20へ送信する手段である。第1出力手段1003は、サーバ装置20との通信が不可の場合、ユーザとのコミュニケーションを図る音声や文字列を出力する手段である。第2出力手段1004は、第1送信手段が送信した信号への応答としてサーバ装置20から送信された情報を受信し、受信した情報を音声や文字で出力する手段である。
FIG. 3 is a block diagram showing a configuration of characteristic functions according to the present invention among functions realized by the
(サーバ装置20の構成)
図4は、サーバ装置20のハードウェア構成の一例を示したブロック図である。表示部203は、液晶ディスプレイを備えており、サーバ装置20を操作するための画面や記憶部202に記憶されている情報などを表示する。操作部204は、キーボードやマウスを備えており、サーバ装置20は、キーボードやマウスに行われた操作に応じて動作する。通信部205は、通信網2を介して通信を行う通信インターフェースとして機能する。通信部205は、通信網2を介して端末装置10と情報のやり取りを行う。なお、本実施形態においては、サーバ装置20は、表示部203と操作部204を備えているが、表示部203と操作部204を備えていない構成であってもよい。
(Configuration of server device 20)
FIG. 4 is a block diagram illustrating an example of a hardware configuration of the
記憶部202は、ハードディスク装置を有しており、端末装置10から送信された音声の情報に対応した情報を取得して端末装置10へ送信するソフトウェアエージェントの機能を実現するプログラムを記憶している。また、記憶部202は、ソフトウェアエージェントがユーザの音声を認識するときに用いる音響モデルMB1と、言語モデルMB2とを記憶している。音響モデルMB1も、音響モデルMA1と同じく音声の特徴量と音素との対応関係を示すモデルである。また、言語モデルMB2も、言語モデルMA2と同じく形態素の前後間のつながりやすさや音素の並び方に関する制約を表したものである。
The
制御部201は、CPU、ROM及びRAMを備えている。記憶部202に記憶されているプログラムが制御部201で実行されると、端末装置10から送信された音声の情報に対応した情報を取得して端末装置10へ送信するソフトウェアエージェントの機能が実現する。
The
図5は、サーバ装置20において実現する機能のうち、本発明に係る機能の構成を示したブロック図である。受信手段2001は、通信部205と協働し、端末装置10が送信したユーザの音声を表す信号を受信する手段である。生成手段2002は、受信手段2001が受信した信号を解析し、当該信号に対応した情報を生成する手段である。第2送信手段2003は、生成手段が生成した情報を端末装置10へ送信する手段である。
FIG. 5 is a block diagram showing the configuration of the functions according to the present invention among the functions realized in the
(実施形態の動作例)
次に本実施形態の動作例について説明する。なお、以下の説明においては、まず端末装置10とサーバ装置20とが通信可能な第1状態にあるときの動作例について説明する。次に端末装置10とサーバ装置20とが通信できない第2状態の動作例と、第2状態から第1状態に変化したときの動作例について説明する。
(Operation example of embodiment)
Next, an operation example of this embodiment will be described. In the following description, first, an operation example when the
(第1状態のときの動作例)
まず、端末装置10のユーザは、例えば調べたいことがある場合、調べたいことを端末装置10に話しかける。このユーザの音声は、音声処理部107のマイクロホンで収音される。音声処理部107は、マイクロホンが収音した音声をデジタル信号(以下、ユーザ音声信号と称する)に変換し、このユーザ音声信号を制御部101へ供給する。
(Operation example in the first state)
First, the user of the
図6は、制御部101が行う処理の流れを示したフローチャートである。制御部101(取得手段1001)は、音声処理部107から供給されたユーザ音声信号を取得する(ステップSA1)。制御部101は、ユーザ音声信号を取得すると、端末装置10が通信網2の無線基地局の圏内に位置しているか否かを判断する。制御部101は、無線基地局が送信する制御情報を通信部105が受信できている場合、端末装置10が通信網2の無線基地局の圏内に位置していると判断し、無線基地局が送信する制御情報を通信部105が受信できていない場合、端末装置10が通信網2の無線基地局の圏内に位置していないと判断する。制御部101(第1送信手段1002)は、端末装置10が通信網2の無線基地局の圏内に位置している場合(ステップSA2でYES)、音声処理部107から供給されたユーザ音声信号を、通信部105を介してサーバ装置20へ送信する(ステップSA3)。
FIG. 6 is a flowchart showing the flow of processing performed by the
サーバ装置20においては、端末装置10から送信されたユーザ音声信号を通信部205が受信すると、通信部205が受信したユーザ音声信号が制御部201へ供給される。制御部201(受信手段2001)は、ユーザ音声信号を取得する。制御部201は、ユーザ音声信号が供給されると、図8に示した処理を実行する。制御部201(生成手段2002)は、供給されたユーザ音声信号が表す音声を認識してテキストデータに変換する(ステップSB1)。音声信号をテキストデータに変換する方法としては、例えば、「端末機能やサービスの利便性向上のための音声認識技術とアプリケーション開発」、NTT DOCOMO テクニカルジャーナル、2012年1月、Vol19、No.4、p74−p76に記載されている周知の技術を用いる。制御部201は、ユーザ音声信号の周波数特性を分析し、音声の特徴量を抽出する。制御部201は、音声の特徴量を抽出すると、ユーザ音声信号が表す音声の音素を音響モデルMB1を用いて特定する。制御部201は、音素を特定すると、言語モデルMB2を用いてユーザ音声信号が表す音声の形態素列を特定する。制御部201は、特定した形態素列からユーザが発話した音声を文字列にしたテキストデータを生成する。
In the
制御部201(生成手段2002)は、ユーザが発話した音声のテキストデータを生成すると、テキストデータに基いてユーザの発話に対応した情報を生成する(ステップSB2)。なお、ユーザの発話に対応する情報の生成については、知識データベースや検索エンジンを使用する方法があり、例えば、「しゃべってコンシェルにおける質問応答技術」、NTT技術ジャーナル、2013年2月、Vol25、No.2、p56−p59や、「自然文質問への直接回答を実現する知識Q&A」、NTT DOCOMO テクニカルジャーナル、2013年1月、Vol20、No.4、p6−p11に記載されている周知の技術を用いる。
制御部201は、例えば、ユーザの発話の内容が「富士山の高さは」という質問であった場合、質問に対応した情報として、質問への回答となる「富士山の高さは3776mです」というテキストデータ(以下、回答データと称する)と、質問への回答となる「3776mです」という音声のデジタル信号(以下、回答音声信号と称する)を生成する。
When generating the text data of the voice uttered by the user, the control unit 201 (generating unit 2002) generates information corresponding to the user's utterance based on the text data (step SB2). In addition, there is a method using a knowledge database or a search engine for generating information corresponding to a user's utterance. For example, “Speaking and Concerning Question Answering Technology”, NTT Technical Journal, February 2013, Vol 25, No. . 2, p56-p59, “Knowledge Q & A for Realizing Direct Answers to Natural Sentence Questions”, NTT DOCOMO Technical Journal, January 2013, Vol20, No. 4, well-known techniques described in p6-p11 are used.
For example, when the content of the user's utterance is a question “the height of Mt. Fuji”, the
制御部201(第2送信手段2003)は、回答データと回答音声信号とを通信部205を介して端末装置10へ送信する(ステップSB3)。端末装置10においては、回答データと回答音声信号とを通信部105が受信すると、この回答データと回答音声信号とが制御部101へ供給される。制御部101(第2出力手段1004)は、回答データと回答音声信号とを取得する(ステップSA4)。制御部101(第2出力手段1004)は、取得した回答データが表す文字列が表示されるように表示部103を制御する(ステップSA5)。これにより、図9に例示したように、「富士山の高さは3776mです」という文字列が表示部103に表示される。また、制御部101は、回答音声信号を音声処理部107へ供給する。音声処理部107は、供給された回答音声信号をアナログ信号に変換する。このアナログ信号は、スピーカへ供給され、スピーカからは「3776mです」という音声が放音される(ステップSA6)。
The control unit 201 (second transmission unit 2003) transmits the answer data and the answer voice signal to the
このように本実施形態においては、ユーザが端末装置10に話しかけたときに端末装置10とサーバ装置20とが通信可能である場合、ユーザの音声に対してコミュニケーションシステム1が応答し、話しかけた音声に対応した情報をユーザに提供する。
As described above, in the present embodiment, when the
(第2状態のときの動作例)
次に、ユーザが端末装置10に話しかけたときに端末装置10とサーバ装置20とが通信できない状態である場合の動作例について説明する。例えば、電車での移動中においては、端末装置10は、一時的に無線基地局の圏外となり、通信網2を介した通信を行えなくなる場合がある。制御部101は、ユーザ音声信号が供給されたときに端末装置10が無線基地局の圏内に位置していない場合(ステップSA2でNO)、ユーザ音声信号を記憶部102に記憶させる(ステップSA7)。また、制御部101(第1出力手段1003)は、サーバ装置20と同様にユーザ音声信号が表す音声を認識してテキストデータを生成する(ステップSA8)。具体的には、制御部101は、ユーザ音声信号の周波数特性を分析し、音声の特徴量を抽出する。制御部101は、音声の特徴量を抽出すると、ユーザ音声信号が表す音声の音素を音響モデルMA1を用いて特定する。制御部101は、音素を特定すると、言語モデルMA2を用いてユーザ音声信号が表す音声の形態素列を特定する。制御部101は、特定した形態素列からユーザが発話した音声を文字列にしたテキストデータを生成する。
(Operation example in the second state)
Next, an operation example when the
制御部101(第1出力手段1003)は、ユーザが発話した音声のテキストデータを生成すると、ユーザの発話に対応する応答を生成する(ステップSA9)。ここで生成する応答としては、例えば、コミュニケーションの間を保つ自然文などがある。制御部101は、生成した自然文のテキストデータと、生成した自然文を発話したときの音声を表す応答音声信号を生成する。制御部101(第1出力手段1003)は、生成したテキストデータが表す文字列が表示されるように表示部103を制御する(ステップSA10)。また、制御部101(第1出力手段1003)は、応答音声信号を音声処理部107へ供給する。音声処理部107は、供給された応答音声信号をアナログ信号に変換する。このアナログ信号は、スピーカへ供給され、スピーカからは生成した自然文を発話したときの音声が放音される(ステップSA11)。
When the control unit 101 (first output unit 1003) generates text data of speech uttered by the user, the control unit 101 (first output unit 1003) generates a response corresponding to the user's utterance (step SA9). The response generated here includes, for example, a natural sentence that keeps communication. The
例えば、ユーザの発話の内容が「富士山の高さは?」という質問文であった場合、制御部101は、コミュニケーションの間を保つ文として「それについては・・・」という自然文のテキストデータと、この自然文を発話したときの音声を表す応答音声信号を生成する。制御部101は、生成したテキストデータが表す文字列が表示されるように表示部103を制御する。これにより、「それについては・・・」という文字列が表示部103に表示される。また、制御部101は、応答音声信号を音声処理部107へ供給する。音声処理部107は、供給された回答音声信号をアナログ信号に変換する。このアナログ信号は、スピーカへ供給され、スピーカからは「それについては」という音声が放音される。また、制御部101は、さらにコミュニケーションの間を保つ文として「少しまってね」という自然文のテキストデータと、この自然文を発話したときの応答音声信号を生成する。制御部101は、生成したテキストデータが表す文字列が表示されるように表示部103を制御する。これにより、「少しまってね」という文字列が表示部103に表示される。また、制御部101は、応答音声信号を音声処理部107へ供給する。これにより、スピーカからは「少しまってね」という音声が放音される。
For example, when the content of the user's utterance is a question sentence “What is the height of Mt. Fuji?”, The
なお、本実施形態においては、コミュニケーションの間を保つ文は、予めアプリAが記憶する構成であるが、この構成に限定されるものではない。例えば、コミュニケーションの間を保つ文のデータベースを記憶部102に記憶させ、ユーザの発話の内容に対応した文を制御部101がデータベースから取得する構成であってもよい。また、コミュニケーションの間を保つ文としては、挨拶や相槌などであってもよい。
In the present embodiment, the sentence for maintaining communication is a configuration stored in advance by the app A, but is not limited to this configuration. For example, a configuration may be adopted in which a database of sentences that keeps communication is stored in the
このように本実施形態においては、端末装置10が通信網2の無線基地局の圏外となってサーバ装置20との通信ができない状態にある場合、ユーザの音声に対して端末装置10が応答し、コミュニケーションを継続する。
As described above, in the present embodiment, when the
(第2状態から第1状態へ変化したときの動作例)
次に、上述したように第2状態でユーザの発話に対して端末装置10が応答した後、第1状態に変化したときの動作例について説明する。例えば、上述したように電車での移動中においては、端末装置10は、一時的に無線基地局の圏外となって第2状態になるが、さらに移動すると第2状態から第1状態に戻る。制御部101は、第2状態から第1状態になると、図7に示した処理を実行し、第2状態のときに記憶部102に記憶されたユーザ音声信号を、通信部105を介してサーバ装置20へ送信する(ステップSC1)。
(Operation example when changed from the second state to the first state)
Next, an operation example when the
例えば、上述したように第2状態においてユーザの発話の内容が「富士山の高さは?」という質問であった場合、記憶部102には、この発話のユーザ音声信号が記憶されている。制御部101は、第2状態から第1状態になると、このユーザ音声信号を通信部105を介してサーバ装置20へ送信する。
For example, as described above, when the content of the user's utterance is the question “What is the height of Mt. Fuji?” In the second state, the user voice signal of this utterance is stored in the
サーバ装置20においては、端末装置10から送信されたユーザ音声信号を通信部205が受信すると、上述した第1状態のときの動作例と同様に、制御部201が質問への回答となる回答データと回答音声信号を生成する。制御部201は、生成した回答データと回答音声信号とを通信部205を介して端末装置10へ送信する。制御部101は、サーバ装置20が送信した回答データと回答音声信号とを取得する(ステップSC2)。受信した回答データが表す文字列を表示部103に表示し(ステップSC3)、回答音声信号が示す音声をスピーカから放音する(ステップSC4)。
In the
以上説明したように本実施形態によれば、端末装置10とサーバ装置20とが一時的に通信を行えない状態となっても、端末装置10が音声を発してユーザとのコミュニケーションを継続するため、通信が行えずにサーバ装置20から情報を取得できない状態をユーザに意識させないことができる。また、本実施形態によれば、端末装置10とサーバ装置20とが通信を行えない状態から通信可能な状態に戻ると、端末装置10とサーバ装置20とが通信を行うため、ユーザの発話に対して端末装置10では回答できない情報をサーバ装置20からユーザに提示することができる。
As described above, according to the present embodiment, even if the
[変形例]
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限定されることなく、他の様々な形態で実施可能である。例えば、上述の実施形態を以下のように変形して本発明を実施してもよい。なお、上述した実施形態及び以下の変形例は、各々を組み合わせてもよい。
[Modification]
As mentioned above, although embodiment of this invention was described, this invention is not limited to embodiment mentioned above, It can implement with another various form. For example, the present invention may be implemented by modifying the above-described embodiment as follows. In addition, you may combine each of embodiment mentioned above and the following modifications.
上述した実施形態においては、ユーザが発話した音声のユーザ音声信号をサーバ装置20へ送信し、このユーザ音声信号の内容に対応した情報をサーバ装置20が端末装置10へ送信する構成となっているが、この構成に限定されるものではない。例えば、天気や交通機関の運行情報などは、日や時間によって変化するため、ユーザがよく質問するものである。端末装置10は、天気や運行情報などの予め定められた情報については、これらを問い合わせる質問文を予め定めた時間が経過する毎又は予め定めた時刻にサーバ装置20へ送信し、サーバ装置20から回答データと回答音声信号とを取得しておくようにしてもよい。そして、端末装置10とサーバ装置20とが通信不可の状態のときに、ユーザの発話の内容が天気や交通機関の運行情報などを質問するものである場合、予めサーバ装置20から取得した回答データと回答音声信号とに基いて、天気の情報や運行情報をユーザに提示してもよい。
なお、予め回答データと回答音声信号とを取得する構成においては、例えばユーザが端末装置10のWebブラウザを使用して検索エンジンで検索した文字列について、回答データと回答音声信号とを周期的又は予め定めた時刻に取得するようにしてもよい。
また、回数が多いユーザの質問を端末装置10がユーザの音声信号から解析し、回数が多いと特定した質問文を、予め定めた時間が経過する毎又は予め定めた時刻にサーバ装置20へ送信し、サーバ装置20から回答データと回答音声信号とを取得しておくようにしてもよい。例えば、端末装置10は、一日に同じ質問が3回以上された場合、この質問を回数が多い質問と特定する。そして、端末装置10とサーバ装置20とが通信不可の状態のときのユーザの発話の内容が、予め回数が多いと特定した質問文である場合、予めサーバ装置20から取得した回答データと回答音声信号とに基いて、質問文への回答をユーザに提示してもよい。例えば、株価の情報についての質問回数が多いユーザについては、端末装置10は、予め定められた時間(前場と後場の開始時間及び終了時間)に予め株価の情報をサーバ装置20から取得しておいてもよい。
また、端末装置10は、予め取得した回答データと回答音声信号とで第2状態において応答した後に第1状態となった場合、記憶部102に記憶しておいたユーザ音声信号をサーバ装置20へ送信し、サーバ装置20から取得した回答データと回答音声データとに基いて画面の表示と放音とを行うようにしてもよい。
なお、回答データと回答音声信号とを予め取得した時刻と、第2状態から第1状態になった時刻との差が予め定められた閾値未満である場合、記憶部102に記憶しておいたユーザ音声信号をサーバ装置20へ送信しないようにしてもよい。また、回答データと回答音声信号とを予め取得する構成においては、端末装置10は、第2状態にある場合、例えば近距離無線通信で近隣の端末装置10と通信を行い、他の携帯端末が取得している回答データと回答音声信号とを取得するようにしてもよい。
In the embodiment described above, the user voice signal of the voice spoken by the user is transmitted to the
In the configuration in which the answer data and the answer voice signal are acquired in advance, the answer data and the answer voice signal are periodically or for the character string searched by the search engine using the Web browser of the
Further, the
Further, when the
If the difference between the time when the answer data and the answer voice signal are acquired in advance and the time when the state changes from the second state to the first state is less than a predetermined threshold, it is stored in the
なお、ユーザがよくする質問について端末装置10が予めサーバ装置20から回答データと回答音声信号とを取得する構成においては、周期的又は予め定めた時刻に取得する構成に限定されるものではない。例えば、端末装置10は、無線基地局の電波強度を監視し、電波強度が予め定められた閾値未満となると、ユーザがよくする質問についてサーバ装置20から回答データと回答音声信号とを取得する構成としてもよい。また、端末装置10は、圏外となる位置をGPS(Global Positioning System)により予め特定しておき、第1状態のときに特定した位置から予め定められた範囲内の位置に入ると、ユーザがよくする質問についてサーバ装置20から回答データと回答音声信号とを取得する構成としてもよい。
また、例えばショッピングモールやデパートなどの大型の建物に入ると、端末装置10が第2状態となる虞があるため、端末装置10は、自身の位置を監視し、このような建物に近づいた場合には、ユーザがよくする質問についてはサーバ装置20から回答データと回答音声信号とを予め取得する構成としてもよい。
In addition, in the structure which the
In addition, for example, when entering a large building such as a shopping mall or a department store, the
上述した実施形態においては、端末装置10が第2状態の場合、端末装置10は、ユーザの発話に対してコミュニケーションの間を保つ自然文で応答するが、この構成に限定されるものではない。例えば、端末装置10は、発話の内容をユーザに詳細に問い合わせる構成であってもよい。例えば、ユーザが「ランチ食べたい」と発話した場合、「何を食べたい?」、「価格は?」、「場所は?」など、発話に対する回答を絞り込むのに有用な会話を端末装置10が行うようにしてもよい。
この場合、端末装置10は、各質問に対して発した音声のユーザ音声信号を記憶部102に記憶し、第1状態に戻ったときは、記憶した各ユーザ音声信号をサーバ装置20へ送信する。サーバ装置20は、各ユーザ音声信号に対して音声認識を行い、各音声認識結果から得られた文字列でユーザの発話に対応する情報を取得する構成としてもよい。
In the above-described embodiment, when the
In this case, the
上述した実施形態においては、端末装置10は、第2状態である場合にユーザの発話に対して応答しているが、この構成に限定されるものではない。例えば、端末装置10が無線基地局の圏内にあっても、通信網2又はサーバ装置20で障害が発生し、端末装置10がサーバ装置20と通信を行えない場合が生じ得る。端末装置10は、無線基地局の圏内にあるときにサーバ装置20と通信可能であるか周期的に検知し、圏内であっても通信不可の場合には、上述した実施形態と同様に、ユーザの発話に対して端末装置10が応答するようにしてもよい。
In the above-described embodiment, the
上述した実施形態においては、テキストデータが表す文字列を表示するときに、図10に例示したように、エージェントのアバターを表示し、表示したアバターからの吹き出しの中にテキストデータが表す文字列を表示してもよい。また、回答音声信号や応答音声信号の音声を放音するときに、アバターが発話しているようにアバターの口元をアニメーションで表示するようにしてもよい。
また、端末装置10は、サーバ装置20から取得した回答データを表示し、回答音声データの音声を放音する場合には、大人のアバターを表示し、第2状態においてコミュニケーションの間を保つ自然文の表示と音声の放音を行う場合には、子供のアバターを表示するようにしてもよい。また、この変形例にあっては、端末装置10は、大人のアバターを表示しているときには大人の音声で放音し、子供のアバターを表示しているときには子供の音声で放音するようにしてもよい。また、アバターを表示する構成においては、端末装置10は、アバターを複数種類有し、ユーザの会話の内容に応じてアバターを変更するようにしてもよい。
In the embodiment described above, when the character string represented by the text data is displayed, as illustrated in FIG. 10, the agent avatar is displayed, and the character string represented by the text data is displayed in the balloon from the displayed avatar. It may be displayed. Further, when the voice of the answer voice signal or the response voice signal is emitted, the mouth of the avatar may be displayed as an animation so that the avatar speaks.
In addition, the
上述した実施形態においては、第2状態においてコミュニケーションの間を保つ自然文の表示及び音声の放音が端末装置10で行われた後、ユーザが情報の取得を中止する発話した場合、端末装置10は、記憶部102に記憶されたユーザ音声信号をサーバ装置20へ送信しないようにしてもよい。
また、端末装置10は、第2状態においてコミュニケーションの間を保つ自然文の表示及び音声の放音が端末装置10で行われた後、第2状態の継続時間が予め定められた時間を越えた場合、ユーザの発話に対して直ぐに応答できないことを報知してもよい。また、この場合、端末装置10は、ユーザの発話に対して応答できないことを報知し、第1状態に戻っても、記憶したユーザ音声信号をサーバ装置20へ送信しないようにしてもよい。また、端末装置10は、第2状態においてコミュニケーションの間を保つ自然文の表示及び音声の放音が端末装置10で行われた後、第2状態の継続時間が予め定められた時間を越えてから第1状態となった場合、質問文への回答を行うか否かユーザに問い合わせる構成としてもよい。端末装置10は、ユーザが回答を希望した場合、ユーザ音声信号をサーバ装置20へ送信し、回答を希望しなかった場合、ユーザ音声信号をサーバ装置20へ送信しないようにしてもよい。
In the above-described embodiment, after the natural sentence display and the sound emission to keep the communication in the second state are performed by the
In addition, after the
上述した実施形態においては、端末装置10は、第2状態となってから経過した時間を計時し、計時した時間が予め定められた閾値以上のときにユーザが発話した場合、ユーザの発話に対して直ぐに応答できないことを報知してもよい。また、端末装置10は、第1状態から第2状態となったときには、ユーザの発話に対して直ぐに応答できないことを報知し、第2状態から第1状態となったときには、ユーザの発話に対して直ぐに応答できることを報知してもよい。
In the above-described embodiment, the
上述した実施形態においては、ユーザが発話した音声に対して端末装置10やサーバ装置20が応答しているが、ユーザからの入力は音声に限定されるものではない。例えば、ユーザが端末装置10において会話や質問の文章を入力し、入力された文章に対応した情報をユーザに提示するようにしてもよい。この構成によれば、チャットのように文字の入力でコミュニケーションを図ることができる。
In the embodiment described above, the
上述した実施形態においては、コミュニケーションシステム1は、端末装置10とサーバ装置20との構成に限定されるものではなく他の構成であってもよい。例えば、サーバ装置20については、上記の刊行物の「自然文質問への直接回答を実現する知識Q&A」に記載されているように、端末装置10から送信された音声信号を受信するフロントサーバと、データベース型Q&Aサーバと、検索型Q&Aサーバとで構成してもよい。
In the above-described embodiment, the communication system 1 is not limited to the configuration of the
フロントサーバは、端末装置10から送信されたユーザ音声信号を音声認識してテキストデータを生成する。フロントサーバは、生成したテキストデータをデータベース型Q&Aサーバへ送信し、データベース型Q&Aサーバで回答を得られた場合には、得られた回答を端末装置10へ送信する。また、フロントサーバは、データベース型Q&Aサーバで回答を得られなかった場合には、生成したテキストデータを検索型Q&Aサーバへ送信する。フロントサーバは、検索型Q&Aサーバで得られた回答を端末装置10へ送信する。
The front server recognizes the user voice signal transmitted from the
データベース型Q&Aサーバは、知識データベースを有するサーバである。データベース型Q&Aサーバは、フロントサーバから送られたテキストデータが表す質問を解析し、質問の対象と属性を抽出する。データベース型Q&Aサーバは、抽出した対象と属性を知識データベースにおいて検査する。例えば、質問の内容が「エベレストの高さは?」という質問である場合、データベース型Q&Aサーバは、「エベレスト」という対象と、「標高」という属性を抽出する。知識データベースにおいては、富士山やエベレスト、キリマンジャロなどの山の名称と標高とが対応付けて格納されており、データベース型Q&Aサーバは、知識データベースからエベレストの標高を抽出し、抽出した標高をフロントサーバへ送信する。 The database type Q & A server is a server having a knowledge database. The database type Q & A server analyzes the question represented by the text data sent from the front server, and extracts the question target and attributes. The database type Q & A server checks the extracted object and attribute in the knowledge database. For example, when the content of the question is a question “What is the height of Everest?”, The database type Q & A server extracts an object “Everest” and an attribute “Elevation”. In the knowledge database, the names of mountains such as Mt. Fuji, Everest, and Kilimanjaro are stored in association with the altitude. The database-type Q & A server extracts the altitude of Everest from the knowledge database and sends the extracted altitude to the front server. Send.
検索型Q&Aサーバは、検索エンジンを用いてユーザの発話に対する回答を得るサーバである。検索型Q&Aサーバは、フロントサーバから送られたテキストデータから検索エンジンへ送るキーワードを抽出し、抽出したキーワードを検索エンジンへ送る。検索型Q&Aサーバは、検索エンジンの検索結果からユーザの発話に対する回答を生成し、生成した回答をフロントサーバへ送信する。 The search-type Q & A server is a server that obtains an answer to a user's utterance using a search engine. The search-type Q & A server extracts keywords to be sent to the search engine from the text data sent from the front server, and sends the extracted keywords to the search engine. The search-type Q & A server generates an answer to the user's utterance from the search engine search result, and transmits the generated answer to the front server.
上述した実施形態においては、端末装置10は、第2状態の場合にコミュニケーションの間を保つ音声を放音するが、この構成に限定されるものではない。例えば、端末装置10に記憶されている楽曲のデータを再生してコミュニケーションの間を保つようにしてもよい。
In the embodiment described above, the
上述した実施形態においては、端末装置10は、第2状態のときにはコミュニケーションの間を保つ自然文を出力する構成となっているが、この構成に限定されるものではない。例えば、予め定めた時間帯や予め定めた位置など、所定の条件に合致する場合には第1状態であってもコミュニケーションの間を保つ自然文を出力する構成としてもよい。
In the embodiment described above, the
上述した実施形態においては、端末装置10内において仮想化ネットワークを構築し、ユーザ音声信号を仮想化ネットワークに構築されたデータ保管部に記憶させるようにしてもよい。この構成においては、端末装置10は、第2状態にある場合、ユーザ音声信号を仮想化ネットワークに構築されたデータ保管部に記憶させる。端末装置10は、第2状態から第1状態になった場合、データ保管部から仮想化ネットワークを介してユーザ音声信号を読み出し、読み出したユーザ音声信号をサーバ装置20へ送信する。
In the above-described embodiment, a virtual network may be constructed in the
上述した実施形態においては、ユーザ音声信号を端末装置10からサーバ装置20へ送信しているが、端末装置10においてユーザ音声信号を音声認識してテキストデータを生成し、生成したテキストデータをサーバ装置20へ送信する構成としてもよい。この構成においては、サーバ装置20は、送信されたテキストデータに基いて、ユーザの発話に対応する回答を生成する。
また、上述した実施形態においては、回答音声信号をサーバ装置20から端末装置10へ送信しているが、端末装置10が放音する音声を示すテキストデータをサーバ装置20から端末装置10へ送信する構成としてもよい。この構成においては、端末装置10は、サーバ装置20から送信されたテキストデータから音声合成を行い、テキストデータの内容を発話する。
また、端末装置10とサーバ装置20との間でやり取りする情報は、音声信号やテキストデータに限定されるものではなく、ユーザの音声やサーバ装置20からの回答を符号化してもよい。例えば、「おはよう」という挨拶を「A01」、「こんにちは」という挨拶を「A02」、「今晩は」という挨拶を「A03」と符号化し、符号化後のデータを通信先の装置へ送信してもよい。端末装置10とサーバ装置20は、符号化された情報と符号化される前の情報との対応関係を記憶しており、符号化された情報を取得した装置は、記憶している対応関係を参照し、取得した情報をテキストデータに変換して処理する。
また、質問に関する音声を符号化し、日時に関する音声をパラメータとするようにしてもよい。例えば、ユーザの音声が「今日の天気は?」という音声である場合、「今日」という日について「天気」の質問をしていることとなる。この場合、端末装置10は、天気の質問を「B01」と符号化し、「今日」という音声を「today」というパラメータに変換してサーバ装置20へ送信する。端末装置10とサーバ装置20は、符号化された情報及びパラメータと、符号化される前の情報との対応関係を記憶しており、符号化された情報やパラメータを取得した装置は、記憶している対応関係を参照し、取得した情報をテキストデータに変換して処理する。例えば、サーバ装置20は、「B01」という情報と「today」という情報を取得すると、今日の天気についての質問と解釈し、今日の天気についての情報を端末装置10へ送信する。
In the above-described embodiment, the user voice signal is transmitted from the
In the embodiment described above, the answer voice signal is transmitted from the
Further, the information exchanged between the
In addition, the voice related to the question may be encoded and the voice related to the date and time may be used as a parameter. For example, if the user's voice is “What is the weather today?”, The question “weather” is being asked about the day “Today”. In this case, the
上述した実施形態においては、ステップSA1とステップSA2の順番を逆にしてもよく、端末装置10は、無線基地局の圏内か否かを判断した後に、ユーザ音声信号を取得し、無線基地局の圏内の場合には、取得したユーザ音声信号をサーバ装置20へ送信し、無線基地局の圏外の場合には、取得したユーザ音声信号を記憶部102に記憶させるようにしてもよい。
In the above-described embodiment, the order of step SA1 and step SA2 may be reversed. After determining whether or not the
本発明に係る機能を実現するプログラムは、磁気記録媒体(磁気テープ、磁気ディスク(HDD(Hard Disk Drive)、FD(Flexible Disk))など)、光記録媒体(光ディスクなど)、光磁気記録媒体、半導体メモリなどのコンピュータ読取り可能な記録媒体に記憶した状態で提供し、各装置にインストールしてもよい。また、通信網2を介してプログラムをダウンロードして各装置にインストールしてもよい。
The program for realizing the functions according to the present invention includes a magnetic recording medium (magnetic tape, magnetic disk (HDD (Hard Disk Drive), FD (Flexible Disk)), etc.), optical recording medium (optical disk, etc.), magneto-optical recording medium, It may be provided in a state stored in a computer-readable recording medium such as a semiconductor memory and installed in each device. Alternatively, the program may be downloaded via the
1…コミュニケーションシステム、2…通信網、10…端末装置、20…サーバ装置、101…制御部、102…記憶部、103…表示部、104…操作部、105…通信部、107…音声処理部、201…制御部、202…記憶部、203…表示部、204…操作部、205…通信部、1001…取得手段、1002…第1送信手段、1003…第1出力手段、1004…第2出力手段、2001…受信手段、2002…生成手段、2003…第2送信手段
DESCRIPTION OF SYMBOLS 1 ... Communication system, 2 ... Communication network, 10 ... Terminal device, 20 ... Server apparatus, 101 ... Control part, 102 ... Memory | storage part, 103 ... Display part, 104 ... Operation part, 105 ... Communication part, 107 ... Voice processing part , 201 ... control unit, 202 ... storage unit, 203 ... display unit, 204 ... operation unit, 205 ... communication unit, 1001 ... acquisition unit, 1002 ... first transmission unit, 1003 ... first output unit, 1004 ...
Claims (9)
サーバ装置との通信が不可である場合、前記取得手段が前記第1情報を取得すると、前記ユーザとコミュニケーションを図る第2情報を出力する第1出力手段と、
前記サーバ装置との通信が可である場合、前記取得手段が前記第1情報を取得すると、前記第1情報を前記サーバ装置へ送信する第1送信手段と、
前記第1送信手段が送信した前記第1情報への応答として前記サーバ装置から送信された第3情報を受信し、受信した第3情報を出力する第2出力手段と
を有する端末装置。 Obtaining means for obtaining first information from a user;
A first output unit that outputs second information for communicating with the user when the acquisition unit acquires the first information when communication with the server device is impossible;
When communication with the server device is possible, when the acquisition unit acquires the first information, a first transmission unit that transmits the first information to the server device;
A terminal device comprising: second output means for receiving third information transmitted from the server apparatus as a response to the first information transmitted by the first transmission means, and outputting the received third information.
前記端末装置は、
ユーザからの第1情報を取得する取得手段と、
前記サーバ装置との通信が不可である場合、前記取得手段が前記第1情報を取得すると、前記ユーザとコミュニケーションを図る第2情報を出力する第1出力手段と、
前記サーバ装置との通信が可である場合、前記取得手段が前記第1情報を取得すると、前記第1情報を前記サーバ装置へ送信する第1送信手段と、
前記第1送信手段が送信した前記第1情報への応答として前記サーバ装置から送信された第3情報を受信し、受信した第3情報を出力する第2出力手段と
を有し、
前記サーバ装置は、
前記第1送信手段から送信された前記第1情報を受信する受信手段と、
前記受信手段が受信した前記第1情報に対応した第3情報を生成する生成手段と、
前記第3情報を前記端末装置へ送信する第2送信手段と、
を有する
コミュニケーションシステム。 A communication system comprising a terminal device and a server device,
The terminal device
Obtaining means for obtaining first information from a user;
When communication with the server device is impossible, when the acquisition unit acquires the first information, a first output unit that outputs second information for communicating with the user;
When communication with the server device is possible, when the acquisition unit acquires the first information, a first transmission unit that transmits the first information to the server device;
Second output means for receiving third information transmitted from the server device as a response to the first information transmitted by the first transmission means and outputting the received third information;
The server device
Receiving means for receiving the first information transmitted from the first transmitting means;
Generating means for generating third information corresponding to the first information received by the receiving means;
Second transmission means for transmitting the third information to the terminal device;
Having a communication system.
前記第1送信手段は、前記サーバ装置との通信が不可の状態から可の状態に変化した場合、前記記憶手段に記憶された前記第1情報を前記サーバ装置へ送信する
請求項2に記載のコミュニケーションシステム。 The terminal device includes a control unit that stores the first information in the storage unit when the acquisition unit acquires the first information when communication with the server device is impossible.
The said 1st transmission means transmits the said 1st information memorize | stored in the said memory | storage means to the said server apparatus, when the communication with the said server apparatus changes from the impossible state to the enabled state. Communication system.
請求項2又は請求項3に記載のコミュニケーションシステム。 The communication according to claim 2, wherein the first transmission unit transmits predetermined first information to the server device when communication with the server device is possible at a predetermined timing. system.
請求項2乃至請求項4のいずれか一項に記載のコミュニケーションシステム。 The communication system according to any one of claims 2 to 4, wherein the first information is a voice signal indicating a voice uttered by a user or text data indicating a voice recognition result of the voice.
前記第2出力手段は、前記第3情報を音声で出力する
請求項2乃至請求項5のいずれか一項に記載のコミュニケーションシステム。 The first output means outputs the second information by voice,
The communication system according to any one of claims 2 to 5, wherein the second output means outputs the third information by voice.
サーバ装置との通信が不可である場合、前記取得ステップで前記第1情報を取得すると、前記ユーザとコミュニケーションを図る第2情報を出力する第1出力ステップと、
前記サーバ装置との通信が可である場合、前記取得ステップで前記第1情報を取得すると、前記第1情報を前記サーバ装置へ送信する送信ステップと、
前記送信ステップで送信した前記第1情報への応答として前記サーバ装置から送信された第3情報を受信し、受信した第3情報を出力する第2出力ステップと
を有するコミュニケーション方法。 An acquisition step of acquiring first information from a user;
A first output step for outputting second information for communicating with the user when the first information is obtained in the obtaining step when communication with the server device is impossible;
When communication with the server device is possible, when the first information is acquired in the acquiring step, the transmitting step of transmitting the first information to the server device;
A second output step of receiving third information transmitted from the server device as a response to the first information transmitted in the transmitting step and outputting the received third information.
ユーザからの第1情報を取得する取得手段と、
サーバ装置との通信が不可である場合、前記取得手段が前記第1情報を取得すると、前記ユーザとコミュニケーションを図る第2情報を出力する第1出力手段と、
前記サーバ装置との通信が可である場合、前記取得手段が前記第1情報を取得すると、前記第1情報を前記サーバ装置へ送信する第1送信手段と、
前記第1送信手段が送信した前記第1情報への応答として前記サーバ装置から送信された第3情報を受信し、受信した第3情報を出力する第2出力手段
として機能させるためのプログラム。 Computer
Obtaining means for obtaining first information from a user;
A first output unit that outputs second information for communicating with the user when the acquisition unit acquires the first information when communication with the server device is impossible;
When communication with the server device is possible, when the acquisition unit acquires the first information, a first transmission unit that transmits the first information to the server device;
The program for functioning as 2nd output means which receives the 3rd information transmitted from the said server apparatus as a response to the said 1st information which the said 1st transmission means transmitted, and outputs the received 3rd information.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013143750A JP6120708B2 (en) | 2013-07-09 | 2013-07-09 | Terminal device and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013143750A JP6120708B2 (en) | 2013-07-09 | 2013-07-09 | Terminal device and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015018327A true JP2015018327A (en) | 2015-01-29 |
JP6120708B2 JP6120708B2 (en) | 2017-04-26 |
Family
ID=52439278
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013143750A Active JP6120708B2 (en) | 2013-07-09 | 2013-07-09 | Terminal device and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6120708B2 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109568973A (en) * | 2017-09-27 | 2019-04-05 | 卡西欧计算机株式会社 | Interface, dialogue method, server unit and computer readable storage medium |
JP2020067785A (en) * | 2018-10-24 | 2020-04-30 | 本田技研工業株式会社 | Control device, agent apparatus, and program |
JP2020160135A (en) * | 2019-03-25 | 2020-10-01 | 本田技研工業株式会社 | Agent device, agent device control method and program |
JP2022101663A (en) * | 2021-08-18 | 2022-07-06 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | Human-computer interaction method, device, electronic apparatus, storage media and computer program |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006003696A (en) * | 2004-06-18 | 2006-01-05 | Toyota Motor Corp | Voice recognition device, voice recognition method and voice recognition program |
JP2012256001A (en) * | 2011-06-10 | 2012-12-27 | Alpine Electronics Inc | Device and method for voice recognition in mobile body |
JP2013088477A (en) * | 2011-10-13 | 2013-05-13 | Alpine Electronics Inc | Speech recognition system |
WO2013132615A1 (en) * | 2012-03-07 | 2013-09-12 | パイオニア株式会社 | Navigation device, server, navigation method and program |
JP2014174485A (en) * | 2013-03-12 | 2014-09-22 | Panasonic Corp | Information communication terminal and dialogue method |
-
2013
- 2013-07-09 JP JP2013143750A patent/JP6120708B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006003696A (en) * | 2004-06-18 | 2006-01-05 | Toyota Motor Corp | Voice recognition device, voice recognition method and voice recognition program |
JP2012256001A (en) * | 2011-06-10 | 2012-12-27 | Alpine Electronics Inc | Device and method for voice recognition in mobile body |
JP2013088477A (en) * | 2011-10-13 | 2013-05-13 | Alpine Electronics Inc | Speech recognition system |
WO2013132615A1 (en) * | 2012-03-07 | 2013-09-12 | パイオニア株式会社 | Navigation device, server, navigation method and program |
JP2014174485A (en) * | 2013-03-12 | 2014-09-22 | Panasonic Corp | Information communication terminal and dialogue method |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109568973A (en) * | 2017-09-27 | 2019-04-05 | 卡西欧计算机株式会社 | Interface, dialogue method, server unit and computer readable storage medium |
JP2019061098A (en) * | 2017-09-27 | 2019-04-18 | カシオ計算機株式会社 | Dialogue device, server device, dialogue method and program |
CN109568973B (en) * | 2017-09-27 | 2021-02-12 | 卡西欧计算机株式会社 | Conversation device, conversation method, server device, and computer-readable storage medium |
JP2020067785A (en) * | 2018-10-24 | 2020-04-30 | 本田技研工業株式会社 | Control device, agent apparatus, and program |
JP2020160135A (en) * | 2019-03-25 | 2020-10-01 | 本田技研工業株式会社 | Agent device, agent device control method and program |
JP7274903B2 (en) | 2019-03-25 | 2023-05-17 | 本田技研工業株式会社 | AGENT DEVICE, CONTROL METHOD OF AGENT DEVICE, AND PROGRAM |
JP2022101663A (en) * | 2021-08-18 | 2022-07-06 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | Human-computer interaction method, device, electronic apparatus, storage media and computer program |
Also Published As
Publication number | Publication date |
---|---|
JP6120708B2 (en) | 2017-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2637874C2 (en) | Generation of interactive recommendations for chat information systems | |
JP6129134B2 (en) | Voice dialogue apparatus, voice dialogue system, terminal, voice dialogue method, and program for causing computer to function as voice dialogue apparatus | |
JP6790234B2 (en) | Interpreters and methods (DEVICE AND METHOD OF TRANSLATING A LANGUAGE INTO ANOTHER LANGUAGE) | |
US20090198497A1 (en) | Method and apparatus for speech synthesis of text message | |
KR20070026452A (en) | Method and apparatus for voice interactive messaging | |
JP2015521404A (en) | Instant translation system | |
JP6120708B2 (en) | Terminal device and program | |
CN102292766A (en) | Method, apparatus and computer program product for providing compound models for speech recognition adaptation | |
KR20190029237A (en) | Apparatus for interpreting and method thereof | |
KR20150017662A (en) | Method, apparatus and storing medium for text to speech conversion | |
JP2022101663A (en) | Human-computer interaction method, device, electronic apparatus, storage media and computer program | |
US10002611B1 (en) | Asynchronous audio messaging | |
JP7095684B2 (en) | Information processing equipment, information processing method, program | |
KR101959439B1 (en) | Method for interpreting | |
KR100367579B1 (en) | Internet utilization system using voice | |
KR100380829B1 (en) | System and method for managing conversation -type interface with agent and media for storing program source thereof | |
US20220208190A1 (en) | Information providing method, apparatus, and storage medium, that transmit related information to a remote terminal based on identification information received from the remote terminal | |
JP5423970B2 (en) | Voice mail realization system, voice mail realization server, method and program thereof | |
JP2016091195A (en) | Information transmission/reception program and system | |
KR20220107052A (en) | Listening device, how to adjust the listening device | |
JP2001251429A (en) | Voice translation system using portable telephone and portable telephone | |
KR20210121818A (en) | Method for Provide Real-Time Simultaneous Interpretation Service between Conversators | |
US20170185587A1 (en) | Machine translation method and machine translation system | |
KR20200090579A (en) | Method and System for Interpreting and Translating using Smart Device | |
WO2024090007A1 (en) | Program, method, information processing device, and system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160219 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170117 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170303 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170314 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170328 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6120708 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |