JP6120708B2 - 端末装置およびプログラム - Google Patents
端末装置およびプログラム Download PDFInfo
- Publication number
- JP6120708B2 JP6120708B2 JP2013143750A JP2013143750A JP6120708B2 JP 6120708 B2 JP6120708 B2 JP 6120708B2 JP 2013143750 A JP2013143750 A JP 2013143750A JP 2013143750 A JP2013143750 A JP 2013143750A JP 6120708 B2 JP6120708 B2 JP 6120708B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- user
- terminal device
- communication
- server device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004891 communication Methods 0.000 claims description 110
- 230000004044 response Effects 0.000 claims description 21
- 230000005540 biological transmission Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 description 22
- 230000006870 function Effects 0.000 description 18
- 238000000034 method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 239000003795 chemical substances by application Substances 0.000 description 8
- 235000010724 Wisteria floribunda Nutrition 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 6
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000013500 data storage Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Landscapes
- Telephonic Communication Services (AREA)
Description
(全体構成)
図1は、本発明の一実施形態に係るコミュニケーションシステム1を構成する装置を示した図である。コミュニケーションシステム1は、ユーザから与えられた情報に応答し、与えられた情報に対応した情報をユーザに提示するシステムである。本実施形態に係るコミュニケーションシステム1は、サーバ装置20と端末装置10とで構成されており、ユーザが端末装置10に話しかけた音声(ユーザから与えられる情報の一例)に応答し、話しかけた音声の内容に対応した情報をユーザに提示する、即ち、ユーザと装置とが互いに情報を伝達してコミュニケーションを図るシステムである。
図2は、端末装置10のハードウェア構成の一例を示したブロック図である。制御部101は、CPU(Central Processing Unit)やRAM(Random Access Memory)、不揮発性メモリを備えており。CPUが不揮発性メモリに記憶されているプログラムを実行すると、スマートフォンの基本的な機能が実現する。
図4は、サーバ装置20のハードウェア構成の一例を示したブロック図である。表示部203は、液晶ディスプレイを備えており、サーバ装置20を操作するための画面や記憶部202に記憶されている情報などを表示する。操作部204は、キーボードやマウスを備えており、サーバ装置20は、キーボードやマウスに行われた操作に応じて動作する。通信部205は、通信網2を介して通信を行う通信インターフェースとして機能する。通信部205は、通信網2を介して端末装置10と情報のやり取りを行う。なお、本実施形態においては、サーバ装置20は、表示部203と操作部204を備えているが、表示部203と操作部204を備えていない構成であってもよい。
次に本実施形態の動作例について説明する。なお、以下の説明においては、まず端末装置10とサーバ装置20とが通信可能な第1状態にあるときの動作例について説明する。次に端末装置10とサーバ装置20とが通信できない第2状態の動作例と、第2状態から第1状態に変化したときの動作例について説明する。
まず、端末装置10のユーザは、例えば調べたいことがある場合、調べたいことを端末装置10に話しかける。このユーザの音声は、音声処理部107のマイクロホンで収音される。音声処理部107は、マイクロホンが収音した音声をデジタル信号(以下、ユーザ音声信号と称する)に変換し、このユーザ音声信号を制御部101へ供給する。
制御部201は、例えば、ユーザの発話の内容が「富士山の高さは」という質問であった場合、質問に対応した情報として、質問への回答となる「富士山の高さは3776mです」というテキストデータ(以下、回答データと称する)と、質問への回答となる「3776mです」という音声のデジタル信号(以下、回答音声信号と称する)を生成する。
次に、ユーザが端末装置10に話しかけたときに端末装置10とサーバ装置20とが通信できない状態である場合の動作例について説明する。例えば、電車での移動中においては、端末装置10は、一時的に無線基地局の圏外となり、通信網2を介した通信を行えなくなる場合がある。制御部101は、ユーザ音声信号が供給されたときに端末装置10が無線基地局の圏内に位置していない場合(ステップSA2でNO)、ユーザ音声信号を記憶部102に記憶させる(ステップSA7)。また、制御部101(第1出力手段1003)は、サーバ装置20と同様にユーザ音声信号が表す音声を認識してテキストデータを生成する(ステップSA8)。具体的には、制御部101は、ユーザ音声信号の周波数特性を分析し、音声の特徴量を抽出する。制御部101は、音声の特徴量を抽出すると、ユーザ音声信号が表す音声の音素を音響モデルMA1を用いて特定する。制御部101は、音素を特定すると、言語モデルMA2を用いてユーザ音声信号が表す音声の形態素列を特定する。制御部101は、特定した形態素列からユーザが発話した音声を文字列にしたテキストデータを生成する。
次に、上述したように第2状態でユーザの発話に対して端末装置10が応答した後、第1状態に変化したときの動作例について説明する。例えば、上述したように電車での移動中においては、端末装置10は、一時的に無線基地局の圏外となって第2状態になるが、さらに移動すると第2状態から第1状態に戻る。制御部101は、第2状態から第1状態になると、図7に示した処理を実行し、第2状態のときに記憶部102に記憶されたユーザ音声信号を、通信部105を介してサーバ装置20へ送信する(ステップSC1)。
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限定されることなく、他の様々な形態で実施可能である。例えば、上述の実施形態を以下のように変形して本発明を実施してもよい。なお、上述した実施形態及び以下の変形例は、各々を組み合わせてもよい。
なお、予め回答データと回答音声信号とを取得する構成においては、例えばユーザが端末装置10のWebブラウザを使用して検索エンジンで検索した文字列について、回答データと回答音声信号とを周期的又は予め定めた時刻に取得するようにしてもよい。
また、回数が多いユーザの質問を端末装置10がユーザの音声信号から解析し、回数が多いと特定した質問文を、予め定めた時間が経過する毎又は予め定めた時刻にサーバ装置20へ送信し、サーバ装置20から回答データと回答音声信号とを取得しておくようにしてもよい。例えば、端末装置10は、一日に同じ質問が3回以上された場合、この質問を回数が多い質問と特定する。そして、端末装置10とサーバ装置20とが通信不可の状態のときのユーザの発話の内容が、予め回数が多いと特定した質問文である場合、予めサーバ装置20から取得した回答データと回答音声信号とに基いて、質問文への回答をユーザに提示してもよい。例えば、株価の情報についての質問回数が多いユーザについては、端末装置10は、予め定められた時間(前場と後場の開始時間及び終了時間)に予め株価の情報をサーバ装置20から取得しておいてもよい。
また、端末装置10は、予め取得した回答データと回答音声信号とで第2状態において応答した後に第1状態となった場合、記憶部102に記憶しておいたユーザ音声信号をサーバ装置20へ送信し、サーバ装置20から取得した回答データと回答音声データとに基いて画面の表示と放音とを行うようにしてもよい。
なお、回答データと回答音声信号とを予め取得した時刻と、第2状態から第1状態になった時刻との差が予め定められた閾値未満である場合、記憶部102に記憶しておいたユーザ音声信号をサーバ装置20へ送信しないようにしてもよい。また、回答データと回答音声信号とを予め取得する構成においては、端末装置10は、第2状態にある場合、例えば近距離無線通信で近隣の端末装置10と通信を行い、他の携帯端末が取得している回答データと回答音声信号とを取得するようにしてもよい。
また、例えばショッピングモールやデパートなどの大型の建物に入ると、端末装置10が第2状態となる虞があるため、端末装置10は、自身の位置を監視し、このような建物に近づいた場合には、ユーザがよくする質問についてはサーバ装置20から回答データと回答音声信号とを予め取得する構成としてもよい。
この場合、端末装置10は、各質問に対して発した音声のユーザ音声信号を記憶部102に記憶し、第1状態に戻ったときは、記憶した各ユーザ音声信号をサーバ装置20へ送信する。サーバ装置20は、各ユーザ音声信号に対して音声認識を行い、各音声認識結果から得られた文字列でユーザの発話に対応する情報を取得する構成としてもよい。
また、端末装置10は、サーバ装置20から取得した回答データを表示し、回答音声データの音声を放音する場合には、大人のアバターを表示し、第2状態においてコミュニケーションの間を保つ自然文の表示と音声の放音を行う場合には、子供のアバターを表示するようにしてもよい。また、この変形例にあっては、端末装置10は、大人のアバターを表示しているときには大人の音声で放音し、子供のアバターを表示しているときには子供の音声で放音するようにしてもよい。また、アバターを表示する構成においては、端末装置10は、アバターを複数種類有し、ユーザの会話の内容に応じてアバターを変更するようにしてもよい。
また、端末装置10は、第2状態においてコミュニケーションの間を保つ自然文の表示及び音声の放音が端末装置10で行われた後、第2状態の継続時間が予め定められた時間を越えた場合、ユーザの発話に対して直ぐに応答できないことを報知してもよい。また、この場合、端末装置10は、ユーザの発話に対して応答できないことを報知し、第1状態に戻っても、記憶したユーザ音声信号をサーバ装置20へ送信しないようにしてもよい。また、端末装置10は、第2状態においてコミュニケーションの間を保つ自然文の表示及び音声の放音が端末装置10で行われた後、第2状態の継続時間が予め定められた時間を越えてから第1状態となった場合、質問文への回答を行うか否かユーザに問い合わせる構成としてもよい。端末装置10は、ユーザが回答を希望した場合、ユーザ音声信号をサーバ装置20へ送信し、回答を希望しなかった場合、ユーザ音声信号をサーバ装置20へ送信しないようにしてもよい。
また、上述した実施形態においては、回答音声信号をサーバ装置20から端末装置10へ送信しているが、端末装置10が放音する音声を示すテキストデータをサーバ装置20から端末装置10へ送信する構成としてもよい。この構成においては、端末装置10は、サーバ装置20から送信されたテキストデータから音声合成を行い、テキストデータの内容を発話する。
また、端末装置10とサーバ装置20との間でやり取りする情報は、音声信号やテキストデータに限定されるものではなく、ユーザの音声やサーバ装置20からの回答を符号化してもよい。例えば、「おはよう」という挨拶を「A01」、「こんにちは」という挨拶を「A02」、「今晩は」という挨拶を「A03」と符号化し、符号化後のデータを通信先の装置へ送信してもよい。端末装置10とサーバ装置20は、符号化された情報と符号化される前の情報との対応関係を記憶しており、符号化された情報を取得した装置は、記憶している対応関係を参照し、取得した情報をテキストデータに変換して処理する。
また、質問に関する音声を符号化し、日時に関する音声をパラメータとするようにしてもよい。例えば、ユーザの音声が「今日の天気は?」という音声である場合、「今日」という日について「天気」の質問をしていることとなる。この場合、端末装置10は、天気の質問を「B01」と符号化し、「今日」という音声を「today」というパラメータに変換してサーバ装置20へ送信する。端末装置10とサーバ装置20は、符号化された情報及びパラメータと、符号化される前の情報との対応関係を記憶しており、符号化された情報やパラメータを取得した装置は、記憶している対応関係を参照し、取得した情報をテキストデータに変換して処理する。例えば、サーバ装置20は、「B01」という情報と「today」という情報を取得すると、今日の天気についての質問と解釈し、今日の天気についての情報を端末装置10へ送信する。
Claims (2)
- ユーザからの第1情報を取得する取得手段と、
サーバ装置との通信が不可である場合、前記取得手段が前記第1情報を取得すると、前記ユーザとコミュニケーションを図る第2情報を出力する第1出力手段と、
前記サーバ装置との通信が不可である場合、前記取得手段が前記第1情報を取得すると、当該第1情報を記憶手段に記憶させる制御手段と、
前記サーバ装置との通信が可である場合、前記取得手段が前記第1情報を取得すると、前記第1情報を前記サーバ装置へ送信し、前記サーバ装置との通信が不可の状態から可の状態に変化した場合、前記記憶手段に記憶された前記第1情報を前記サーバ装置へ送信し、予め定められたタイミングで前記サーバ装置との通信が可である場合、予め定められた第1情報を前記サーバ装置へ送信する第1送信手段と、
前記第1送信手段が送信した前記第1情報への応答として前記サーバ装置から送信された第3情報を受信し、受信した第3情報を出力する第2出力手段と
を有する端末装置。 - コンピュータを、
ユーザからの第1情報を取得する取得手段と、
サーバ装置との通信が不可である場合、前記取得手段が前記第1情報を取得すると、前記ユーザとコミュニケーションを図る第2情報を出力する第1出力手段と、
前記サーバ装置との通信が不可である場合、前記取得手段が前記第1情報を取得すると、当該第1情報を記憶手段に記憶させる制御手段と、
前記サーバ装置との通信が可である場合、前記取得手段が前記第1情報を取得すると、前記第1情報を前記サーバ装置へ送信し、前記サーバ装置との通信が不可の状態から可の状態に変化した場合、前記記憶手段に記憶された前記第1情報を前記サーバ装置へ送信し、予め定められたタイミングで前記サーバ装置との通信が可である場合、予め定められた第1情報を前記サーバ装置へ送信する第1送信手段と、
前記第1送信手段が送信した前記第1情報への応答として前記サーバ装置から送信された第3情報を受信し、受信した第3情報を出力する第2出力手段
として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013143750A JP6120708B2 (ja) | 2013-07-09 | 2013-07-09 | 端末装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013143750A JP6120708B2 (ja) | 2013-07-09 | 2013-07-09 | 端末装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015018327A JP2015018327A (ja) | 2015-01-29 |
JP6120708B2 true JP6120708B2 (ja) | 2017-04-26 |
Family
ID=52439278
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013143750A Active JP6120708B2 (ja) | 2013-07-09 | 2013-07-09 | 端末装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6120708B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6962105B2 (ja) * | 2017-09-27 | 2021-11-05 | カシオ計算機株式会社 | 対話装置、サーバ装置、対話方法及びプログラム |
JP2020067785A (ja) * | 2018-10-24 | 2020-04-30 | 本田技研工業株式会社 | 制御装置、エージェント装置及びプログラム |
JP7274903B2 (ja) * | 2019-03-25 | 2023-05-17 | 本田技研工業株式会社 | エージェント装置、エージェント装置の制御方法、およびプログラム |
CN113674742B (zh) * | 2021-08-18 | 2022-09-27 | 北京百度网讯科技有限公司 | 人机交互方法、装置、设备以及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4554285B2 (ja) * | 2004-06-18 | 2010-09-29 | トヨタ自動車株式会社 | 音声認識システム、音声認識方法、及び音声認識プログラム |
JP2012256001A (ja) * | 2011-06-10 | 2012-12-27 | Alpine Electronics Inc | 移動体における音声認識装置および方法 |
JP2013088477A (ja) * | 2011-10-13 | 2013-05-13 | Alpine Electronics Inc | 音声認識システム |
JP5698864B2 (ja) * | 2012-03-07 | 2015-04-08 | パイオニア株式会社 | ナビゲーション装置、サーバ、ナビゲーション方法及びプログラム |
JP6052610B2 (ja) * | 2013-03-12 | 2016-12-27 | パナソニックIpマネジメント株式会社 | 情報通信端末、およびその対話方法 |
-
2013
- 2013-07-09 JP JP2013143750A patent/JP6120708B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015018327A (ja) | 2015-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9864745B2 (en) | Universal language translator | |
JP6129134B2 (ja) | 音声対話装置、音声対話システム、端末、音声対話方法およびコンピュータを音声対話装置として機能させるためのプログラム | |
RU2637874C2 (ru) | Генерирование диалоговых рекомендаций для чатовых информационных систем | |
JP6790234B2 (ja) | 通訳装置及び方法(device and method of translating a language into another language) | |
US20090198497A1 (en) | Method and apparatus for speech synthesis of text message | |
JP2023022150A (ja) | 双方向音声翻訳システム、双方向音声翻訳方法及びプログラム | |
WO2011048826A1 (ja) | 音声翻訳システム、制御装置、および制御方法 | |
KR20070026452A (ko) | 음성 인터랙티브 메시징을 위한 방법 및 장치 | |
JP2008083376A (ja) | 音声翻訳装置、音声翻訳方法、音声翻訳プログラムおよび端末装置 | |
JP6120708B2 (ja) | 端末装置およびプログラム | |
JP2015521404A (ja) | 即時翻訳システム | |
CN102292766A (zh) | 用于提供用于语音识别自适应的复合模型的方法、装置和计算机程序产品 | |
KR20190029237A (ko) | 통역장치 및 그 방법 | |
US10002611B1 (en) | Asynchronous audio messaging | |
JP7095684B2 (ja) | 情報処理装置、情報処理方法、プログラム | |
KR101959439B1 (ko) | 통역방법 | |
JP2004096171A (ja) | 通話活性化システム | |
KR100367579B1 (ko) | 음성을 이용한 인터넷사용시스템 | |
KR100380829B1 (ko) | 에이전트를 이용한 대화 방식 인터페이스 운영 시스템 및방법과 그 프로그램 소스를 기록한 기록 매체 | |
JP5423970B2 (ja) | 音声メール実現システム、音声メール実現サーバ、その方法及びそのプログラム | |
KR20220107052A (ko) | 청취 디바이스, 청취 디바이스의 조정 방법 | |
JP2016091195A (ja) | 情報送受信プログラム及びシステム | |
KR20210121818A (ko) | 대화자간 실시간 동시통역 서비스 제공방법 | |
US20170185587A1 (en) | Machine translation method and machine translation system | |
JP2002132291A (ja) | 自然言語対話処理装置およびその方法並びにその記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160219 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170117 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170303 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170314 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170328 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6120708 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |