JP6536018B2 - 音声制御システム、音声制御方法、及び音声制御プログラム - Google Patents

音声制御システム、音声制御方法、及び音声制御プログラム Download PDF

Info

Publication number
JP6536018B2
JP6536018B2 JP2014235916A JP2014235916A JP6536018B2 JP 6536018 B2 JP6536018 B2 JP 6536018B2 JP 2014235916 A JP2014235916 A JP 2014235916A JP 2014235916 A JP2014235916 A JP 2014235916A JP 6536018 B2 JP6536018 B2 JP 6536018B2
Authority
JP
Japan
Prior art keywords
voice
control
input
information
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014235916A
Other languages
English (en)
Other versions
JP2016099479A (ja
Inventor
宏也 八代
宏也 八代
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aisin AW Co Ltd
Original Assignee
Aisin AW Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aisin AW Co Ltd filed Critical Aisin AW Co Ltd
Priority to JP2014235916A priority Critical patent/JP6536018B2/ja
Publication of JP2016099479A publication Critical patent/JP2016099479A/ja
Application granted granted Critical
Publication of JP6536018B2 publication Critical patent/JP6536018B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Navigation (AREA)

Description

本発明は、音声制御システム、音声制御方法、及び音声制御プログラムに関する。
従来、車載用のナビゲーション装置において、地図等の表示情報におけるスクロールの速度調整等の指示を受け付けるシステムが提案されている。このような従来のシステムでは、スクロールボタンをユーザが指で継続的に押圧している時間や、タッチパネルをユーザがフリックした長さ等に応じて、スクロールの速度調整を行っていた。しかし、この従来のシステムにおいては、指での操作が煩わしく、また、両手が塞がっている場合には操作が出来なかった。そこで、スクロールの速度調整等をより容易に行うことを可能とするシステムとして、ユーザの音声を認識してスクロール操作を行うシステムが提案されていた(例えば、特許文献1参照)。具体的には、このシステムでは、速度が複数の段階(例えば、「スピード極高」、「スピード高」、「スピード中」、「スピード低」、「スピード極低」)に区分されており、ユーザが、十字キーやタッチパネル等を操作して地図をスクロールしている間に、「速く」という音声を発した場合には、システムがこの音声を認識して解析し、当該解析した音声に応じて、スクロールの速度を一段階(例えば、「スピード中」から「スピード高」へ)速くすることを可能としていた。
特開2005−221244号公報
しかし、特許文献1のような音声による入力システムでは、指での操作による煩わしさが解消されるという利点や、両手が塞がっている場合であっても操作が可能になるという利点があるが、操作対象のパラメータの種類によっては、ユーザが所望の制御を容易に行えない可能性があった。すなわち、特許文献1に係る技術では、速度等のパラメータを複数の段階に区分する必要があるが、スクロールのスピードやスクロールの移動量のような連続性のあるパラメータを複数の段階に区分してしまうと、パラメータの連続性が損なわれてしまう結果、ユーザが所望の制御を容易に行えない可能性があった。例えば、特許文献1に係る技術において、速度を比較的多くの段階に区分すると、ユーザの所望の速さとするまでに何度も音声入力しなければならないために容易な入力が行えず、一方、速度を比較的少ない段階に区分すると、ユーザの所望の速さに設定する事が出来ない可能性があった。そこで、音声入力の利点を活かしつつ、ユーザの所望の制御を容易に行う事が可能なシステムが要望されていた。
本発明は、上記に鑑みてなされたものであって、音声入力によって、ユーザの所望の制御を容易に行う事が可能な音声制御システム、音声制御方法、及び音声制御プログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明に係る音声制御システムは、音声の入力を受け付ける音声入力受付手段と、前記音声入力受付手段にて受け付けられた音声の語尾の長さに応じて、同一の制御を継続する制御手段と、前記音声入力受付手段にて受け付けられた音声を解析する音声解析手段と、を備え、前記制御手段は、前記音声解析手段にて前記音声が制御内容であって、設定されているコマンドモードに対応する制御内容を含む制御音声であると解析された場合、当該制御音声が示す制御内容を、当該制御音声の語尾の長さに応じて継続し、前記音声解析手段は、複数の相互に異なるコマンドモードに対応する情報と前記制御音声を特定する情報とが相互に関連付けられている制御音声情報に基づいて、前記音声入力受付手段にて受け付けられた音声が、設定されているコマンドモードに対応する前記制御内容を含む前記制御音声であると解析する
また、本発明に係る音声制御方法は、音声の入力を受け付ける音声入力受付工程と、
前記音声入力受付工程にて受け付けられた音声の語尾の長さに応じて、同一の制御を継続する制御工程と、前記音声入力受付工程にて受け付けられた音声を解析する音声解析工程と、を含み、前記制御工程は、前記音声解析工程にて前記音声が制御内容であって、設定されているコマンドモードに対応する制御内容を含む制御音声であると解析された場合、当該制御音声が示す制御内容を、当該制御音声の語尾の長さに応じて継続し、前記音声解析工程は、複数の相互に異なるコマンドモードに対応する情報と前記制御音声を特定する情報とが相互に関連付けられている制御音声情報に基づいて、前記音声入力受付工程にて受け付けられた音声が、設定されているコマンドモードに対応する前記制御内容を含む前記制御音声であると解析する
また、本発明に係る音声制御プログラムは、音声の入力を受け付ける音声入力受付工程と、前記音声入力受付工程にて受け付けられた音声の語尾の長さに応じて、同一の制御を継続する制御工程と、前記音声入力受付工程にて受け付けられた音声を解析する音声解析工程と、をコンピュータに実行させ、前記制御工程は、前記音声解析工程にて前記音声が制御内容であって、設定されているコマンドモードに対応する制御内容を含む制御音声であると解析された場合、当該制御音声が示す制御内容を、当該制御音声の語尾の長さに応じて継続し、前記音声解析工程は、複数の相互に異なるコマンドモードに対応する情報と前記制御音声を特定する情報とが相互に関連付けられている制御音声情報に基づいて、前記音声入力受付工程にて受け付けられた音声が、設定されているコマンドモードに対応する前記制御内容を含む前記制御音声であると解析する
本発明に係る音声制御システム、音声制御方法、及び音声制御プログラムによれば、音声の語尾の長さに応じて、同一の制御を継続るので、音声入力によって、ユーザの所望の制御を容易に行う事が可能となる。特に、スクロールのスピードやスクロールの移動量のような連続性のあるパラメータを制御する場合においても、パラメータを複数の段階に区分する必要がないので、パラメータの連続性を損ねることがなく、ユーザの所望の制御を容易に行う事が可能となる。
本発明の実施の形態に係る音声制御システムを例示するブロック図である。 制御音声テーブルに格納されている制御音声情報を示す表である。 音声制御処理のフローチャートである。
以下、本発明に係る音声制御システム、音声制御方法、及び音声制御プログラムの実施の形態について図面を参照しつつ詳細に説明する。ただし、実施の形態によって本発明が限定されるものではない。
〔実施の形態の基本的概念〕
まず、実施の形態の基本的概念を説明する。この実施の形態は、概略的に、ユーザの音声入力を受け付けて制御を行う音声制御システムに関する。なお、当該音声制御システムは、ユーザの音声入力に基づいて制御可能な様々な機器に適用できるが、本実施の形態では、車両に搭載された車載用ナビゲーション装置(以下、車載装置)に適用されるものとして説明する。ただし、例えば、スマートフォン、携帯用ナビゲーション装置、空調機器、映像機器、又は音響機器のような車載装置とは一切異なる分野の機器に対しても同様の音声制御システムを好適に適用する事ができる。
ここで、本実施の形態では、ユーザが制御内容の音声入力を行う際において、語尾を伸ばして発声を行う場合があるが、この場合には伸ばされた語尾の部分を「〜」と表記して説明する。ここで、「語尾」とは、ユーザが発声した最後の語(音節)であるが、最後の語が複数の音(例えば、子音や母音)によって構成される場合には、これら複数の音のうちの最後の音を意味する。例えば、日本語の単語の場合には、1つの語の最後の音は母音であるため、この母音が「語尾」になる。具体的には、ユーザが日本語の「右」の語尾を伸ばして発声を行った場合、「右」に対応する音は「みぎ」であり、ユーザが発声した最後の語(音節)は「ぎ」である。そして、この「ぎ」の最後の音は母音「い」であるため、語尾は「い」になる。この場合には「右〜」と表記する。
〔実施の形態の具体的内容〕
次に、実施の形態の具体的内容について説明する。
(構成)
本実施の形態では、車載装置に音声制御プログラムをインストールすることにより、車載装置が音声制御システムとして機能する場合について説明する。なお、上述したように、この他にも、例えば、スマートフォン、携帯用ナビゲーション装置、空調機器、映像機器、又は音響機器を含む任意の装置に音声制御プログラムをインストールすることによって音声制御システムを構成してもよい。また、音声制御システムにおける車載装置としての機能については、公知の車載装置と同様の構成により得ることができるので、その説明は省略することとし、以下では、特に音声制御を達成するための構成について説明する。なお、以下では、この音声制御システムを搭載した特定の車両(車載装置を操作するユーザが搭乗する車両)を単に「車両」と称して説明する。なお、「車両」には、自動四輪車、自動二輪車、及び自転車が含まれるが、以下では、車両が自動四輪車である場合について説明する。
(構成)
最初に、車載装置1の構成を説明する。図1は、本実施の形態に係る音声制御システムを例示するブロック図である。図1に示すように、車載装置1は、概略的に、スピーカ2、マイク3、タッチパネル4、ディスプレイ5、現在位置取得部6、通信部7、制御部8、及びデータ記録部9を備えている。
(構成−スピーカ)
スピーカ2は、制御部8の制御に基づいて情報を音声にて出力する音声出力手段である。このスピーカ2から出力される音声の具体的な態様は任意であり、必要に応じて生成された合成音声や、予め録音された音声を出力することができる。
(構成−マイク)
マイク3は、各種の入力を受け付ける複数の入力手段のうちの1つであって、音声の入力を受け付ける音声入力受付手段である。このマイク3としては、公知のマイクロフォンを用いることができる。
(構成−タッチパネル)
タッチパネル4は、ユーザの指等で押圧されることにより、当該ユーザから各種手動入力を受け付けるものである。このタッチパネル4は、透明又は半透明状に形成され、ディスプレイ5の前面において当該ディスプレイ5の表示面と重畳するように設けられている。このタッチパネル4としては、例えば、抵抗膜方式や静電容量方式等による操作位置検出手段を備えた公知のタッチパネルを使用することができる。
(構成−ディスプレイ)
ディスプレイ5は、音声制御システムによって案内された画像を表示する表示手段であり、特に、後述する地図データベース(以下、データベースを「DB」と称する)9aに格納された地図情報に基づいて地図を表示する表示手段である。このディスプレイ5の具体的な構成は任意であり、公知の液晶ディスプレイや有機ELディスプレイの如きフラットパネルディスプレイを使用することができる。
(構成−現在位置取得部)
現在位置取得部6は、車両の現在位置を取得する現在位置取得手段である。例えば、現在位置取得部6は、GPS、地磁気センサ、距離センサ、又はジャイロセンサ(いずれも図示省略)の少なくとも一つにより検出した現在の車載装置1の位置(座標)及び方位等を、公知の方法にて取得する。
(構成−通信部)
通信部7は、センター装置(図示省略)との間でネットワークを介した通信を行う通信手段である。この通信手段の具体的な種類や構成は任意であるが、例えば、公知の移動体無線通信手段や、FM多重放送やビーコンを介した公知のVICS(登録商標)システム用の無線通信手段を用いることができる。
(構成−制御部)
制御部8は、車載装置1を制御する制御手段であり、特に、マイク3にて受け付けられた音声の語尾の長さに応じて、同一の制御を継続し、又は制御の種類を切換える制御手段である。具体的には、CPU、当該CPU上で解釈実行される各種のプログラム(OSなどの基本制御プログラムや、OS上で起動され特定機能を実現するアプリケーションプログラムを含む)、及びプログラムや各種のデータを格納するためのRAMの如き内部メモリを備えて構成されるコンピュータである。特に、本実施の形態に係る音声制御プログラムは、任意の記録媒体又はネットワークを介して車載装置1にインストールされることで、制御部8の各部を実質的に構成する。
この制御部8は、機能概念的に、定常判断制御部8a、及び音声解析部8bを備えて構成されている。定常判断制御部8aは、マイク3にて音声が定常的に入力されているか否かを判断する定常判断制御手段である。音声解析部8bは、マイク3にて受け付けられた音声を解析する音声解析手段である。なお、これら制御部8の各部により行われる具体的な処理については後述する。
(構成−データ記録部)
データ記録部9は、車載装置1の動作に必要なプログラム及び各種のデータを記録する記録手段であり、例えば、外部記録装置としてのハードディスク(図示省略)を用いて構成されている。ただし、ハードディスクに代えてあるいはハードディスクと共に、磁気ディスクの如き磁気的記録媒体、又はDVDやブルーレイディスクの如き光学的記録媒体を含む、その他の任意の記録媒体を用いることができる。このデータ記録部9は、地図DB9a、発話例DB9b、及び、制御音声テーブル9cを備えている。
地図DB9aは、地図情報を格納する地図情報格納手段である。ここで、「地図情報」とは、道路、道路構造物、施設等を含む各種の位置の特定に必要な情報であり、例えば、道路上に設定された各ノードに関するノードデータ(ノード番号、座標)や、道路上に設定された各リンクに関するリンクデータ(リンクID、リンク名、始点側接続ノード番号、終点側接続ノード番号、道路座標、道路種別(例えば、有料道路、一般道路等)、道路情報、地物データ(信号機、道路標識、ガードレール、施設等)、及び地形データ等を含んで構成されている。
発話例DB9bは、ユーザの入力音声の内容を特定するための発話例情報を格納する発話例格納手段である。具体的に、この発話例DB9bは、制御音声のスペクトル情報と、各スペクトル情報を一意に特定するスペクトルIDとを相互に関連付けて格納している。ここで、「スペクトル情報」とは、音声解析部8bの音声解析に使用される情報であって、例えば、音声情報(WAV情報)をフーリエ解析して導出された情報である。また、「制御音声」とは、車載装置1に対する詳細な制御の内容(例えば、「上」、「下」等。以下、「制御内容」)を含む、語尾を伸ばした音声であり、例えば、「上〜」、「下〜」、「右〜」、「左〜」、「拡大〜」、「縮小〜」、「左回り〜」、「右回り〜」、「左回転〜」、「右回転〜」等の言葉が該当する。すなわち、従来技術においては、通常ユーザは語尾を伸ばして発声することはないので、ユーザの入力音声を特定するために語尾を伸ばさない音声のスペクトル情報を格納しているが、本実施の形態においては、ユーザが語尾を伸ばして発声した際の入力音声の内容を特定するので、このように語尾を伸ばした音声のスペクトル情報を格納している。なお、入力音声の内容を特定する具体的な方法については後述する。また、「スペクトルID」は、各制御音声(「上〜」、「下〜」、「右〜」等)に対してそれぞれ割り当てられた識別情報であり、例えば、「0001」、「0002」、「0003」等といった通し番号である。なお、これらの発話例情報を発話例DB9bに格納するタイミングは任意で、例えば、工場出荷時に予め格納しても良いし、プログラムのアップデート時等に送信センター(図示省略)から通信部7を介して情報を受信して格納しても良い。また、ユーザによる音声入力を参照して学習し、発話例DB9bに格納されたスペクトル情報をユーザに適した情報に修正したり、新たなスペクトル情報を追加したりしても良い。
制御音声テーブル9cは、制御音声情報を格納する制御音声格納手段である。図2は、制御音声テーブル9cに格納されている制御音声情報を示す表である。この図2に示すように、制御音声テーブル9cには、項目「コマンド名称」、項目「スペクトルID」、及び項目「制御音声」に対応する情報が相互に関連付けられて格納されている。
ここで、項目「コマンド名称」に対応して格納される情報は、音声制御システムが実行する制御の種類(コマンド)を示す情報であって、図2に示すように、ディスプレイ5に表示された地図を特定の方向へスクロールさせるコマンドである「地図スクロール」、ディスプレイ5に表示された地図の縮尺を変化させるコマンドである「地図縮尺」、ディスプレイ5に表示された地図の方位を回転させるコマンドである「地図方位」、目的地候補等のリストをスクロールさせるコマンドである「リストスクロール」、及びスピーカ2のボリュームを変化させるコマンドである「ボリューム」が格納されている。
また、項目「スペクトルID」に対応して格納される情報は、発話例DB9bに格納されたスペクトルIDのうち項目「コマンド名称」に対応する複数のスペクトルIDである。
また、項目「制御音声」に対応して格納される情報は、各スペクトルIDにより一意に特定される制御音声である。なお、これらの制御音声情報を制御音声テーブル9cに格納するタイミングは任意で、例えば、工場出荷時に予め格納しても良いし、プログラムのアップデート時等に送信センター(図示省略)から通信部7を介して情報を受信して格納しても良い。
(音声制御処理)
次に、このように構成される音声制御システムによって実行される音声制御処理について説明する。
この音声制御処理は、概略的に、ユーザが入力した音声の語尾の長さに応じて、同一の制御を継続し、又は制御の種類を切換える処理であって、本実施の形態では特に、語尾の長さに応じて車載装置1のディスプレイ5の表示内容を制御する処理について説明する。なお、この音声制御処理を実行するタイミングは任意であり、例えば、本実施の形態では車載装置1の電源がオンとなり、ユーザによって特定のコマンドモードに設定された際に、自動的に実行されるものとして説明する。なお、このコマンドモードとは、特定のコマンドを実行するためのモードであって、例えば、制御音声テーブル9cの項目「コマンド名称」に対応する5つのモードである「スクロールモード」、「地図縮尺モード」、「地図方位モード」、「リストスクロールモード」、及び「ボリュームモード」の中からユーザに選択されて設定される。このコマンドモードを設定する方法は任意で、例えば、ユーザがタッチパネル4を指で操作して設定しても良い。また、ユーザがマイク3を介して「スクロールモード」、又は「地図縮尺モード」等を音声で入力し、入力された音声を制御部8が解析することにより、特定されたコマンドモードに設定しても良い。なお、このようにコマンドモードの設定を行うための音声解析の具体的な構成や方法については公知であるため、詳細な説明を省略する。以下では、コマンドモードが「スクロールモード」に設定されているものとして説明を行う。
図3は、音声制御処理のフローチャートである。まず、SA1において制御部8は、マイク3に入力された音声の振幅が閾値以上となったか否かを判定する。この判定の具体的な方法は任意であるが、例えば、車載装置1に公知のデジタル振動センサを設け、このデジタル振動センサにてマイク3を介して入力された音の振幅を測定しても良い。なお、閾値は任意の値に設定できるが、例えば、人の通常の会話時における音声の振幅と同程度の振幅に設定しても良い。
そして、振幅が閾値以上でない場合(SA1、No)、ユーザによる音声入力が無いものとし、SA1を繰り返すことにより、振幅が閾値以上となるまで待機する。また、振幅が閾値以上である場合(SA1、Yes)、ユーザによる音声入力が有ったものとし、SA2に移行する。
そして、SA2において制御部8は、音声入力記録を開始する。具体的には、ユーザによってマイク3を介して入力された音声を、データ記録部9に随時記録する。この記録の具体的な方法は任意であるが、例えば、音声情報(例えば、WAV情報)をデータ記録部9に記録する。
次に、SA3において定常判断制御部8aは、ユーザの音声が定常となったか否かを判定する。「定常」とは、略同一の音が基準時間(例えば、0.5秒)を超えて連続で繰り返されている状態の事を指し、例えば、「上〜」というように音声の語尾が基準時間伸ばされている状態が該当する。この判定には公知の方法を採用でき、例えば、データ記録部9に記録された音声情報をフーリエ解析してスペクトル情報を導出し、当該導出したスペクトル情報に同一音声のスペクトルが現在時刻から直近の基準時間連続で繰り返されている場合に、音声の語尾が基準時間伸ばされている(すなわち、ユーザの音声が定常となった)と判定してもよい。なお、基準時間の具体的な決定方法や数値は任意であるが、例えば、音声の語尾を伸ばすことを意図することなくユーザが音声を発した場合において、同一音声が連続で繰り返される最長時間を実験等で求め、この最長時間を超える時間を基準時間として設定する。また、上記のスペクトル情報以外の情報に基づいて、定常となったか否かの判定を行っても良く、例えばフーリエ解析される以前の音声情報(例えば、WAV情報)に基づいて判定を行っても良い。例えば、音声情報そのものの振幅が例えば基準時間(例えば、0.5秒)収束状態にある場合、定常となったと判定しても良い。
そして、定常となっていない場合(SA3、No)、例えば、「上〜」という音声においては「う」や「え」の音声が入力されている場合等は、SA3を繰り返すことにより、定常となるまで待機する。一方、定常となった場合(SA3、Yes)、例えば、「上〜」という音声において「〜」という語尾の部分の音声が入力されている場合には、SA4に移行する。
SA4において音声解析部8bは、データ記録部9に記録された音声情報を解析し、ユーザによる入力音声を特定する。具体的には、音声解析部8bは、マイク3を介して入力された音声情報を解析してスペクトル情報を求め、このスペクトル情報における語頭の部分(音声入力が開始されてから、SA3にて定常となったと判断されるまでの部分)と、発話例DB9bに格納されている制御音声のスペクトル情報とを比較し、略一致する音声を探索することにより、入力音声を特定する。このように、従来は、音声が入力されてから音声が途切れるまでの部分を解析するのが通常であったのに対し、本実施の形態においては音声が入力されてから音声が定常となるまでの部分を解析するが、発話例DB9bには語尾を伸ばした制御音声のスペクトル情報が格納されているので、好適に入力音声を特定する事ができる。なお、音声情報の解析は、上述のようにスペクトル情報の比較ではなく、WAV情報の比較によって行ってもよい。
次に、SA5において音声解析部8bは、ユーザによる入力音声が、設定されたコマンドに対応する制御音声であるか否かを判定する。具体的には、まず音声解析部8bは、発話例DB9bを参照して、SA4にて特定した音声のスペクトルIDを特定する。次に音声解析部8bは、制御音声テーブル9cを参照し、設定されたモード(本実施の形態ではスクロールモード)のコマンドに対応するスクロールIDとして、上述のように特定したスペクトルIDが含まれるか否かを判定する。そして、音声解析部8bは、設定されたコマンドに対応するスペクトルIDが含まれないと判定した場合、ユーザによる入力音声が、設定されたコマンドに対応する制御音声でないものとし(SA5、No)、音声制御処理を終了する。また、音声解析部8bは、設定されたコマンドに対応するスペクトルIDが含まれると判定した場合、ユーザによる入力音声が、設定されたコマンドに対応する制御音声であるものとし(SA5、Yes)、SA6に移行する。
SA6において制御部8は、制御を実行する。具体的には制御部8は、設定されたコマンドモード(本実施の形態では「スクロールモード」)を特定し、SA4にて特定した制御音声が示す制御内容(本実施の形態では「上」)を特定し、これらの2つに基づいて具体的な制御を実行する。例えば、本実施の形態では、制御部8は、ディスプレイ5に表示された地図を、基準の速度で、基準の量だけ、上方向にスクロールさせる。
次に、SA7において定常判断制御部8aは、ユーザの音声が未だに定常であるか否かを判定する。例えば、「上〜」という音声の語尾の部分が、未だに定常的に繰り返されているか否かを判定する。ただし、この判定の具体的な方法については、SA3と同様に説明できるので、説明を省略する。そして、定常であると判定した場合(SA7、Yes)、SA6において再度同様の制御を実行した後、SA7において再度定常であるか否かの判定を行う。すなわち、ユーザが語尾を伸ばし続けている限り、SA6及びSA7の処理を繰り返し実行することによって、SA6において同様の制御を連続的に実行し続ける。このことにより、例えば、ディスプレイ5に表示された地図を上方向へと移動し続ける事ができる。なお、本実施の形態においては2回目以降のスクロールも、1回目のスクロールと同様の速度で移動させるが、これに限らず、2回目以降は制御を重ねる度に速度を上昇又は下降させていっても構わない。以上にて、音声制御処理の説明を終了する。
〔実施の形態に対する変形例〕
以上、本発明に係る実施の形態について説明したが、本発明の具体的な構成及び手段は、特許請求の範囲に記載した本発明の技術的思想の範囲内において、任意に改変及び改良することができる。以下、このような変形例について説明する。
(解決しようとする課題や発明の効果について)
まず、発明が解決しようとする課題や発明の効果は、上述の内容に限定されるものではなく、発明の実施環境や構成の細部に応じて異なる可能性があり、上述した課題の一部のみを解決したり、上述した効果の一部のみを奏することがある。例えば、音声入力によって、ユーザの所望の制御を容易に行う事が出来ない場合であっても、従来と異なる技術によりユーザの所望の制御を行う事が出来ている場合には、本願発明の課題が解決されている。
(分散や統合について)
また、上述した各電気的構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各部の分散や統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散又は統合して構成できる。例えば、車載装置1を、相互に通信可能に構成された複数の装置に分散して構成し、これら複数の装置の一部に定常判断制御部8aを設けると共に、これら複数の装置の他の一部に音声解析部8bを設けてもよい。
(形状、数値、構造、時系列について)
実施の形態や図面において例示した構成要素に関して、形状、数値、又は複数の構成要素の構造若しくは時系列の相互関係については、本発明の技術的思想の範囲内において、任意に改変及び改良することができる。
(制御内容について)
本実施の形態では、制御内容として上方向のスクロールを行うものとして説明したが、他の制御内容についても同様に、ユーザの入力音声の語尾の長さに応じて処理を継続する事ができる。例えば、下方向、左方向、右方向、右上方向、左上方向等についても実施の形態と同様に説明する事ができる。また、他のコマンドについても同様に説明する事ができ、例えば、地図縮尺コマンドについては、ユーザの「拡大〜」や「縮小〜」という音声入力があった場合に、語尾の長さに応じて一定の速度で地図縮尺を拡大や縮小していく制御を行う事ができる。なお、この際に、語尾の長さに応じて拡大していく速度や縮小していく速度を上昇させていっても構わない。また、音声制御システムとして構成される装置(本実施の形態では、車載装置1)以外の装置を制御するシステムとして構成しても構わない。例えば、車載装置1と車両に搭載された空調機器とを相互にリンクさせて、ユーザの「上げて〜」という入力音声の語尾の長さに応じて、一定の速度で空調機器の送風温度や風量を上昇させていく制御を行う事としても良い。
また、本実施の形態では、5種類のコマンドのみを明記したが、その他のコマンドについても、適宜制御音声テーブル9cに追加して、同様に説明する事が可能である。例えば、「上〜」、「下〜」等の音声入力に応じてディスプレイ5の輝度を調節する「輝度調節コマンド」や、「暑い〜」、「寒い〜」等の音声入力に応じて空調機器の風量を調節する「風量調節コマンド」や、「開けて〜」、「閉めて〜」等の音声入力に応じて車両の窓の開度を調節する「窓調節コマンド」等を適用しても構わない。
また、本実施の形態では、ユーザによる音声入力の語尾の長さに応じて、同一の制御を継続するものとして説明したが、これに限らず、音声入力の語尾の長さに応じて制御の種類を切換えるものとしても良い。例えば、「モード〜」という音声入力に応じて、設定されたコマンドモードを所定時刻間隔で切換えていっても構わない。すなわち、連続性のあるパラメータを制御する場合に限定されず、非連続的なパラメータやコマンドを制御しても良い。
(制御音声について)
また、本実施の形態ではコマンドモードの設定を行った後に、音声入力を行うものとしたが、これらを同時に行うものとしても良い。具体的には、発話例DB9bに制御音声として「スクロール上〜」や「スクロール下〜」といった音声を格納しておき、ユーザによって同様の音声入力が行われた場合には、スクロールモードに設定しつつ、上方向へのスクロールを語尾の長さに応じて継続しても良い。このような制御によれば、コマンドモードの設定を省略する事が可能となる。
また、本実施の形態では、制御音声として「上〜」、「下〜」等といった制御内容の語尾を伸ばした音声を適用したが、これに限られない。例えば、制御内容を含まない単なる音声「あ〜」や「い〜」等の語尾に応じて制御を継続したり制御の種類を切換えたりしても良い。具体的には、「あ〜」という音声が入力された場合、語尾の長さに応じて上方向に地図をスクロールするように構成し、「い〜」という音声が入力された場合、語尾の長さに応じて下方向に地図をスクロールするように構成しても良い。
〔実施の形態の特徴と効果の一部〕
最後に、これまでに説明した実施の形態の特徴と効果の一部を、以下に例示する。ただし、実施の形態の特徴と効果は、以下の内容に限定されず、以下の特徴の一部のみを具備することによって以下の効果の一部のみを奏する場合や、以下の特徴以外の他の特徴を具備することによって以下の効果以外の他の効果を奏する場合がある。
実施の形態の1つの側面1に係る音声制御システムは、音声の入力を受け付ける音声入力受付手段と、前記音声入力受付手段にて受け付けられた音声の語尾の長さに応じて、同一の制御を継続し、又は制御の種類を切換える制御手段と、を備える。
上記側面1に係る音声制御システムによれば、音声の語尾の長さに応じて、同一の制御を継続し、又は制御の種類を切換えるので、音声入力によって、ユーザが所望の制御を容易に行う事が可能となる。特に、スクロールのスピードやスクロールの移動量のような連続性のあるパラメータを制御する場合においても、パラメータを複数の段階に区分する必要がないので、パラメータの連続性を損ねることがなく、ユーザの所望の制御を容易に行う事が可能となる。
実施の形態の他の側面2に係る音声制御システムは、上記側面1に係る音声制御システムにおいて、前記制御手段は、前記音声入力受付手段にて前記音声が定常的に入力されているか否かを判断する定常判断制御手段を備え、前記制御手段は、前記定常判断制御手段にて前記音声が定常的に入力されていると判断されてから、前記定常判断制御手段にて前記音声が定常的に入力されていないと判断されるまでの間、前記同一の制御を継続する。
上記側面2に係る音声制御システムによれば、制御内容を含む制御音声が入力された場合に、当該制御音声が示す制御内容を、当該制御音声の語尾の長さに応じて継続するので、ユーザが制御内容を他の手段で入力する手間等を省略する事ができ、より簡素に制御内容を指示する事が可能となる。
実施の形態の他の側面3に係る音声制御システムは、上記側面1又は側面2に係る音声制御システムにおいて、前記音声入力受付手段にて受け付けられた音声を解析する音声解析手段を備え、前記制御手段は、前記音声解析手段にて前記音声が制御内容を含む制御音声であると解析された場合、当該制御音声が示す制御内容を、当該制御音声の語尾の長さに応じて継続する。
上記側面3に係る音声制御システムによれば、音声が定常的に入力されていると判断されてから、音声が定常的に入力されていないと判断されるまでの間、同一の制御を継続するので、音声が定常的に繰り返されている時間に応じて同一の制御を継続する事ができ、ユーザにとって容易な制御が可能となる。
実施の形態の他の側面4に係る音声制御システムは、上記側面1から側面4のいずれかに係る音声制御システムにおいて、前記制御手段は、車両に搭載された車載装置を制御する。
上記側面4に係る音声制御システムによれば、制御手段は、車両に搭載された車載装置を制御するので、車両の運転時等の手が離せない場合等においても、ユーザが音声を発する事で、語尾の長さに応じた容易な操作が可能となる。
実施の形態の他の側面5に係る音声制御方法は、音声の入力を受け付ける音声入力受付工程と、前記音声入力受付工程にて受け付けられた音声の語尾の長さに応じて、同一の制御を継続し、又は制御の種類を切換える制御工程と、を含む。
上記側面5に係る音声制御方法によれば、音声の語尾の長さに応じて、同一の制御を継続し、又は制御の種類を切換えるので、音声入力によって、ユーザの所望の制御を容易に行う事が可能となる。特に、スクロールのスピードやスクロールの移動量のような連続性のあるパラメータを制御する場合においても、パラメータを複数の段階に区分する必要がないので、パラメータの連続性を損ねることがなく、ユーザの所望の制御を容易に行う事が可能となる。
実施の形態の他の側面6に係る音声制御プログラムは、音声の入力を受け付ける音声入力受付工程と、前記音声入力受付工程にて受け付けられた音声の語尾の長さに応じて、同一の制御を継続し、又は制御の種類を切換える制御工程と、をコンピュータに実行させる。
上記側面6に係る音声制御プログラムによれば、音声の語尾の長さに応じて、同一の制御を継続し、又は制御の種類を切換えるので、音声入力によって、ユーザの所望の制御を容易に行う事が可能となる。特に、スクロールのスピードやスクロールの移動量のような連続性のあるパラメータを制御する場合においても、パラメータを複数の段階に区分する必要がないので、パラメータの連続性を損ねることがなく、ユーザの所望の制御を容易に行う事が可能となる。
1 車載装置
2 スピーカ
3 マイク
4 タッチパネル
5 ディスプレイ
6 現在位置取得部
7 通信部
8 制御部
8a 定常判断制御部
8b 音声解析部
9 データ記録部
9a 地図DB
9b 発話例DB
9c 制御音声テーブル

Claims (6)

  1. 音声の入力を受け付ける音声入力受付手段と、
    前記音声入力受付手段にて受け付けられた音声の語尾の長さに応じて、同一の制御を継続する制御手段と、
    前記音声入力受付手段にて受け付けられた音声を解析する音声解析手段と、を備え、
    前記制御手段は、前記音声解析手段にて前記音声が制御内容であって、設定されているコマンドモードに対応する制御内容を含む制御音声であると解析された場合、当該制御音声が示す制御内容を、当該制御音声の語尾の長さに応じて継続し、
    前記音声解析手段は、複数の相互に異なるコマンドモードに対応する情報と前記制御音声を特定する情報とが相互に関連付けられている制御音声情報に基づいて、前記音声入力受付手段にて受け付けられた音声が、設定されているコマンドモードに対応する前記制御内容を含む前記制御音声であると解析する、
    音声制御システム。
  2. 前記制御手段は、
    前記音声入力受付手段にて前記音声が定常的に入力されているか否かを判断する定常判断制御手段を備え、
    前記制御手段は、前記定常判断制御手段にて前記音声が定常的に入力されていると判断されてから、前記定常判断制御手段にて前記音声が定常的に入力されていないと判断されるまでの間、前記同一の制御を継続する、
    請求項1に記載の音声制御システム。
  3. 前記制御手段は、前記音声解析手段にて前記音声が複数の制御内容を特定する1つのコマンドモードと1つの制御内容とを含む制御音声であると解析された場合、当該制御音声が示す1つのコマンドモードに設定しつつ、当該制御音声が示す1つの制御内容を、当該制御音声の語尾の長さに応じて継続する、
    請求項1又は2に記載の音声制御システム。
  4. 前記制御手段は、車両に搭載された車載装置を制御する、
    請求項1から3のいずれか一項に記載の音声制御システム。
  5. 音声の入力を受け付ける音声入力受付工程と、
    前記音声入力受付工程にて受け付けられた音声の語尾の長さに応じて、同一の制御を継続する制御工程と、
    前記音声入力受付工程にて受け付けられた音声を解析する音声解析工程と、を含み、
    前記制御工程は、前記音声解析工程にて前記音声が制御内容であって、設定されているコマンドモードに対応する制御内容を含む制御音声であると解析された場合、当該制御音声が示す制御内容を、当該制御音声の語尾の長さに応じて継続し、
    前記音声解析工程は、複数の相互に異なるコマンドモードに対応する情報と前記制御音声を特定する情報とが相互に関連付けられている制御音声情報に基づいて、前記音声入力受付工程にて受け付けられた音声が、設定されているコマンドモードに対応する前記制御内容を含む前記制御音声であると解析する、
    音声制御方法。
  6. 音声の入力を受け付ける音声入力受付工程と、
    前記音声入力受付工程にて受け付けられた音声の語尾の長さに応じて、同一の制御を継続する制御工程と、
    前記音声入力受付工程にて受け付けられた音声を解析する音声解析工程と、をコンピュータに実行させ、
    前記制御工程は、前記音声解析工程にて前記音声が制御内容であって、設定されているコマンドモードに対応する制御内容を含む制御音声であると解析された場合、当該制御音声が示す制御内容を、当該制御音声の語尾の長さに応じて継続し、
    前記音声解析工程は、複数の相互に異なるコマンドモードに対応する情報と前記制御音声を特定する情報とが相互に関連付けられている制御音声情報に基づいて、前記音声入力受付工程にて受け付けられた音声が、設定されているコマンドモードに対応する前記制御内容を含む前記制御音声であると解析する、
    音声制御プログラム。
JP2014235916A 2014-11-20 2014-11-20 音声制御システム、音声制御方法、及び音声制御プログラム Expired - Fee Related JP6536018B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014235916A JP6536018B2 (ja) 2014-11-20 2014-11-20 音声制御システム、音声制御方法、及び音声制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014235916A JP6536018B2 (ja) 2014-11-20 2014-11-20 音声制御システム、音声制御方法、及び音声制御プログラム

Publications (2)

Publication Number Publication Date
JP2016099479A JP2016099479A (ja) 2016-05-30
JP6536018B2 true JP6536018B2 (ja) 2019-07-03

Family

ID=56077766

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014235916A Expired - Fee Related JP6536018B2 (ja) 2014-11-20 2014-11-20 音声制御システム、音声制御方法、及び音声制御プログラム

Country Status (1)

Country Link
JP (1) JP6536018B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101808161B1 (ko) * 2016-06-27 2017-12-12 주식회사지앤지커머스 모바일 광고 제공 시스템 및 방법
IT201600085079A1 (it) * 2016-08-12 2018-02-12 Intendime Srls Dispositivo di segnalazione per allarmi sonori e simili

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58130392A (ja) * 1982-01-29 1983-08-03 株式会社東芝 音声認識装置
JPS63158595A (ja) * 1986-12-22 1988-07-01 日本電気株式会社 音声認識装置
JP3034872B2 (ja) * 1987-09-21 2000-04-17 株式会社東芝 音声命令認識装置及び音声命令認識方法
JP3399674B2 (ja) * 1994-12-19 2003-04-21 エヌイーシーインフロンティア株式会社 画面制御装置とその方法
JP2001195231A (ja) * 2000-01-12 2001-07-19 Ricoh Co Ltd 音声入力装置
JP2003131695A (ja) * 2001-10-25 2003-05-09 Hitachi Ltd 音声認識機器、音声認識機器制御装置、及び音声認識機器制御方法
JP4107093B2 (ja) * 2003-01-30 2008-06-25 株式会社日立製作所 対話型端末装置及び対話アプリケーション提供方法
JP2008003474A (ja) * 2006-06-26 2008-01-10 Funai Electric Co Ltd 電子機器

Also Published As

Publication number Publication date
JP2016099479A (ja) 2016-05-30

Similar Documents

Publication Publication Date Title
KR101999182B1 (ko) 사용자 단말 장치 및 그의 제어 방법
JP5762660B2 (ja) 音声認識装置、認識結果表示装置および表示方法
US10274336B2 (en) Context aware map application
US8996386B2 (en) Method and system for creating a voice recognition database for a mobile device using image processing and optical character recognition
JP6400109B2 (ja) 音声認識システム
JP5921722B2 (ja) 音声認識装置および表示方法
US20190311712A1 (en) Selection system and method
KR20180070970A (ko) 음성 인식 방법 및 장치
JP5893217B2 (ja) 音声認識装置および表示方法
CN105355202A (zh) 语音识别装置、具有语音识别装置的车辆及其控制方法
JP2004126413A (ja) 車載制御装置、並びにその操作説明方法をコンピュータに実行させるプログラム
JP2013134302A (ja) 音声認識装置
US20220299335A1 (en) Content-aware navigation instructions
JP6536018B2 (ja) 音声制御システム、音声制御方法、及び音声制御プログラム
JP5005491B2 (ja) 車載機、その出力態様設定方法
JP6522009B2 (ja) 音声認識システム
JP2008040373A (ja) 音声ガイダンスシステム
US11966664B2 (en) Terminal and vehicle
JP6987447B2 (ja) 音声認識装置
JP2020152298A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2008233009A (ja) カーナビゲーション装置及びカーナビゲーション装置用プログラム
JP5500647B2 (ja) 動的音声認識辞書の生成方法及びその生成装置
AU2013272253B2 (en) Context aware map application
KR101724734B1 (ko) 음성 인식 장치
CN111724777A (zh) 智能体装置、智能体装置的控制方法及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170427

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180306

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180419

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181002

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190507

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190520

R150 Certificate of patent or registration of utility model

Ref document number: 6536018

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees