JP2014202800A - 音声認識制御装置 - Google Patents
音声認識制御装置 Download PDFInfo
- Publication number
- JP2014202800A JP2014202800A JP2013076538A JP2013076538A JP2014202800A JP 2014202800 A JP2014202800 A JP 2014202800A JP 2013076538 A JP2013076538 A JP 2013076538A JP 2013076538 A JP2013076538 A JP 2013076538A JP 2014202800 A JP2014202800 A JP 2014202800A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- voice recognition
- information
- control
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】操作をしてすぐに発話ができるようにする音声認識制御装置を提供する。【解決手段】マイク12が、使用者の発話音声を集音する。マイコン16が、音声による操作を開始する旨の開始命令を受け付けると、音声記憶部14にマイク12により集音された発話音声を音声情報として記憶させるとともに、発話音声により操作可能なナビゲーション装置1やスマートホン2に対して音声認識動作を開始させるように制御する。マイコン16が、ナビゲーション装置1やスマートホン2から音声認識動作が可能である旨の情報を受けると、音声記憶部14された音声情報をそのナビゲーション装置1やスマートホン2へ送信する。【選択図】図1
Description
本発明は、音声認識制御装置、音声認識制御方法、制御プログラム及び制御プログラムを記録した記録媒体に関するものである。
近年、音声認識技術の発達により、カーナビやスマートホンなどの様々な電子機器に音声認識機能が備えられている(例えば特許文献1)。
従来の音声認識機能を備えた電子機器(音声認識装置)は、音声による操作を開始させる操作キーを押してから音声認識のアプリケーションが立ち上がり、立ち上がりが完了して初めて発話が可能となる。しかしながら、上記音声認識のアプリケーションは立ち上がるまでに時間がかかり、このため、使用者が操作キーを押してから発話が可能になるまで時間がかかる、という問題が一例として挙げられる。また、複数の音声認識装置がある場合、それぞれを異なる操作で立ち上げて音声認識機能を使う必要がある、という問題が一例として挙げられる。
そこで、本発明は、例えば、操作をしてすぐに発話ができるようにする音声認識制御装置、音声認識制御方法、制御プログラム及び制御プログラムを記録した記録媒体、を提供することを課題の一例とする。また、1回の操作で複数台の音声認識装置を操作できる音声認識制御装置、音声認識制御方法、制御プログラム及び制御プログラムを記録した記録媒体、を提供することを課題の一例とする。
上記課題を解決するために、請求項1に記載された発明は、使用者の発話音声を集音するマイクと、前記マイクにより集音された発話音声を音声情報として記憶する記憶手段と、音声による操作を開始する旨の開始命令を受け付けると、前記記憶手段に前記音声情報を記憶させるとともに、発話音声により操作可能な音声認識装置に対して音声認識動作を開始させるように制御する制御手段と、を備えることを特徴とする音声認識制御装置である。
請求項7に記載された発明は、音声による操作を開始する旨の開始命令を受け付けると、記憶手段にマイクにより集音された発話音声を音声情報として記憶させるとともに、前記発話音声により操作可能な音声認識装置に対して音声認識動作を開始させるように制御する制御工程を備えることを特徴とする音声認識制御方法である。
以下、本発明の一実施形態にかかる音声認識制御装置を説明する。マイクが、使用者の発話音声を集音する。制御手段が、音声による操作を開始する旨の開始命令を受け付けると、記憶手段にマイクにより集音された発話音声を音声情報として記憶させるとともに、発話音声により操作可能な音声認識装置に対して音声認識動作を開始させるように制御する。
これにより、開始命令を受け付けると、音声認識装置の音声認識動作が立ち上がるのを待たずにすぐに発話できる。
また、制御手段が、開始命令を受け付けると、音声認識装置の音声認識動作の状態に関わらず使用者に対してマイクへの発話を促す旨の報知をさせるようにしてもよい。これにより、開始命令を受け付けると、音声認識装置の音声認識動作が立ち上がるのを待たずにすぐに使用者に対して発話を促すことができる。
また、制御手段が、音声認識装置から音声認識動作が可能である旨の情報を受けると、記憶手段に記憶された音声情報を当該音声認識装置へ送信するようにしてもよい。これにより、音声認識装置の音声認識動作が立ち上がると、音声情報を送信することができる。
また、制御手段が、複数の音声認識装置を制御する場合、記憶手段に記憶された音声情報を複数の音声認識装置それぞれに送信してもよい。これにより、1回の操作で複数台の音声認識装置を操作できる。
また、制御手段が、複数の音声認識装置を制御する場合、音声認識装置に順次、音声情報を送信し、音声認識装置から音声情報が受け付けられない情報を受けると、次の音声認識装置に音声情報を送信し、音声認識装置から音声情報が受け付けられた情報を受けると、次の音声認識装置への音声情報の送信を行わないようにしてもよい。これにより、複数の音声認識装置の1つだけに音声認識させることができる。
また、制御手段は、予め定めた音声認識装置の優先度順に、音声情報を送信するようにしてもよい。これにより、優先度が高い音声認識装置に音声認識させることができる。
また、本発明の一実施形態にかかる音声認識制御方法は、制御工程で、音声による操作を開始する旨の開始命令を受け付けると、記憶手段にマイクにより集音された発話音声を音声情報として記憶させるとともに、発話音声により操作可能な音声認識装置に対して音声認識動作を開始させるように制御する。これにより、開始命令を受け付けると、音声認識装置の音声認識動作が立ち上がるのを待たずにすぐに発話できる。
また、上述した音声認識制御方法をコンピュータにより実行させる制御プログラムとしてもよい。コンピュータにより実行されるプログラムであるので、専用のハードウェア等が不要となり、汎用の情報処理装置にインストールして機能させることができる。
また、上記制御プログラムをコンピュータ読み取り可能な記録媒体に格納してもよい。このようにすることにより、当該プログラムを機器に組み込む以外に単体でも流通させることができ、バージョンアップ等も容易に行える。
次に、上述した音声認識制御装置及び制御方法について、図1を参照して以下説明する。図1は、本発明の音声認識制御装置と音声認識装置とを内蔵したナビゲーション装置の一例を示すブロック図である。同図に示すナビゲーション装置1は、音声を認識する音声認識機能を有し、音声により目的地の設定など各種操作が行えるようになっている。また、ナビゲーション装置1は、ブルートゥース(以下BT)などの無線によりスマートホン2と無線接続されている。このスマートホン2も、音声を認識する音声認識機能を有し、音声により電話などの各種操作が行えるようになっている。
本実施例では、ナビゲーション装置1とスマートホン2とが無線接続されている例について説明するが、ナビゲーション装置1とスマートホン2とは通信できればよく、有線接続されていてもよい。
上記ナビゲーション装置1は、操作スイッチ11と、マイク12と、A/D変換器13と、記憶手段としての音声記憶部14と、ブルートゥース(以下BT)モジュール15と、制御手段としてのマイクロコンピュータ(以下マイコン)16と、を備えている。また、ナビゲーション装置1は、図示しないが、GPS受信機や地図データベースなどナビゲーションを行うための機器をさらに備えている。
上記操作スイッチ11は、使用者の操作により、音声による操作を開始する旨の開始命令を受け付けるためのものである。使用者は、音声操作したいときにこの操作スイッチ11を操作する。マイク12は、使用者の発話音声を集音するものであり、集音した発話音声をA/D変換器13に出力する。A/D変換器13は、マイク12が集音した発話音声をデジタルデータである音声情報にA/D変換する。
音声記憶部14は、A/D変換された音声情報を記憶するメモリであり、例えば、ハードディスクやフラッシュメモリなどから構成されている。BTモジュール15は、外部の電子機器とBT無線通信を行うためのモジュールであり、これによりスマートホン2とも無線通信できる。マイコン16は、例えばRAM(Randam Access Memory)やROM(Read Only Memory)などのメモリを備えたCPU(Central Processing Unit)で構成され、ナビゲーション装置1全体の制御を司る。
マイコン16は、図2に示すように、音声を認識して、その音声に対応した動作を開始させる音声認識部16Aと、操作スイッチ11が操作されると、音声記憶部14に音声情報を記憶させると共に、発話音声により操作可能な自身の音声認識部16Aやスマートホン2に対して音声認識動作を開始させるように制御する制御部16Bと、を備えている。
次に、上述した構成のナビゲーション装置1の動作について図3のフローチャートを参照して以下説明する。音声認識制御処理においてマイコン16は、使用者が操作スイッチ11を押すと(ステップS1)、音声による操作を開始する旨の開始命令を受け付け、A/D変換器13にマイク12が集音した発話音声を音声情報に変換させ、変換させた音声情報を音声記憶部14に記憶させる(ステップS2)。
その後、マイコン16は、マイク12への発話を促す旨の報知を行う(ステップS3)。ステップS3の報知としては、「発話してください」などの音声を出力してもよいし、応答電子音を出力するようにしてもよい。
また、マイコン16は、自身の音声認識部16Aに対して音声認識動作を開始させると共に、BTモジュール15を用いてスマートホン2に対して音声認識動作を開始させる命令を送信する(ステップS4)。なお、ステップS2とステップS4とは同時に行ってもよいし、ステップS4を先にステップS2を後に行うようにしてもよい。
マイコン16は、再び使用者が操作スイッチ11を押すと(ステップS5でY)、発話終了を受け付け、音声情報の音声記憶部14への記憶を停止させる(ステップS6)。
上記ステップS4の動作に応じて、マイコン16は、図3に示す音声認識制御処理と並列に、音声認識動作を行うためのアプリケーション(以下音声認識アプリ)を立ち上げる。マイコン16は、音声認識アプリが立ち上がり、音声認識動作が可能になるとその旨を示すフラグ(情報)を立てる。また、スマートホン2は、ナビゲーション装置1から音声認識動作を開始させる命令を受信すると、音声認識アプリを立ち上げる。スマートホン2は、音声認識アプリが立ち上がり、音声認識動作が可能になるとその旨の信号(情報)をナビゲーション装置1に送信する。
マイコン16は、音声認識動作が可能になる旨の信号やフラグから自身やスマートホン2からの音声認識動作が可能になると、音声記憶部14に記憶された音声情報を音声認識部16Aやスマートホン2に送信して、音声認識を開始させて(ステップS7)、ステップS1に戻る。
ステップS7においては、マイコン16は、音声認識アプリの立ち上げが完了し、音声認識動作が可能になった順に、それぞれ音声情報を送信させるようにしてもよい。例えば、スマートホン2よりも先に、自身の音声認識アプリが立ち上がると、マイコン16は、音声認識部16Aに音声情報を送信し、その後、スマートホン2から音声認識動作が可能になった旨の信号を受信すると、スマートホン2に対して音声情報を送信する。逆に、自身よりも先にスマートホン2から音声認識動作が可能になった旨の信号を受信すると、マイコン16は、スマートホン2に対して音声情報を送信し、その後自身の音声認識アプリが立ち上がると、音声認識部16Aに対して音声情報を送信する。
上述した場合、音声認識はナビゲーション装置1とスマートホン2との双方で行われるが、音声認識をナビゲーション装置1とスマートホン2の何れか一方だけに行わせたい場合には、下記に示す方法が考えられる。
まず、マイコン16は、自身(ナビゲーション装置1)やスマートホン2の音声認識アプリが立ち上がったと判断すると、音声認識部16A及びスマートホン2に順次、音声情報を送信する。例えば、スマートホン2の優先度を1位、ナビゲーション装置1の優先度を2位と予め定められていれば、マイコン16は、まずスマートホン2に対して音声情報を送信する。その後、スマートホン2から音声情報を受け付けられない応答(情報)を受けると、次の優先度2位である自身の音声認識部16Aに音声情報を送信する。一方、スマートホン2から音声情報を受け付けたとの応答を受けると、優先度2位である音声認識部16Aには音声情報を送信せず、自身の音声認識アプリを終了させる。
これにより、使用者としてはどの音声認識装置を使用するかといった意識を持たなくても、複数のナビゲーション装置1やスマートホン2といった音声認識装置の1つだけに音声認識させることができる。また、優先度順に、音声情報を送信することにより、ナビゲーション装置1やスマートホン2のうち優先度が高い方に優先的に音声認識させることができる。なお、上記実施例では、予め定めた優先度順に送信する例について説明したが、これに限らず、ランダムに順次送信するようにしてもよい。
また、マイコン16は、自身やスマートホン2の音声認識アプリが立ち上がり音声認識動作が可能になると、音声認識部16Aやスマートホン2に同時に音声情報を送信するようにしてもよい。この場合も、優先度を決めて、スマートホン2から音声情報を受け付けられるとの応答を受けると、マイコン16は、ナビゲーション装置1に対して音声認識のアプリを終了させて、スマートホン2のみに音声認識を行わせるようにしてもよい。即ち、マイコン16は、音声情報を受け付けられると応答してきた音声認識装置のうち、優先度の最も高いものに音声認識を行わせ、その他のものには音声認識を停止させるようにしてもよい。
上述した実施例によれば、マイク12が、使用者の発話音声を集音し、マイコン16が、音声による操作を開始する旨の開始命令を受け付けると、音声記憶部14にマイク12により集音された発話音声を音声情報として記憶させるとともに、発話音声により操作可能な音声認識装置(本実施例では、ナビゲーション装置1自身、スマートホン2)に対して音声認識動作を開始させるように制御する。これにより、開始命令を受け付けると、ナビゲーション装置1自身やスマートホン2の音声認識アプリが立ち上がるのを待たずにすぐに発話できる。
また、上述した実施例によれば、マイコン16が、開始命令を受け付けると、ナビゲーション装置1やスマートホン2の音声認識動作の状態に関わらず使用者に対してマイク12への発話を促す旨の報知をさせている。これにより、開始命令を受け付けると、ナビゲーション装置1やスマートホン2の音声認識動作が立ち上がるのを待たずにすぐに使用者に対して発話を促すことができる。
また、上述した実施例によれば、マイコン16が、ナビゲーション装置1やスマートホン2から音声認識動作が可能である旨の情報を受けると、音声記憶部14に記憶された音声情報を当該ナビゲーション装置1やスマートホン2へ送信するようにしてもよい。これにより、ナビゲーション装置1やスマートホン2の音声認識アプリが立ち上がると、音声情報を送信することができる。
また、上述した実施例によれば、マイコン16が、ナビゲーション装置1やスマートホン2といった複数の音声認識装置を制御する場合、音声記憶部14に記憶された音声情報をナビゲーション装置1やスマートホン2といった音声認識装置にそれぞれに送信している。これにより、1回の操作で複数台の音声認識装置を操作できる。
なお、上述した実施例によれば、音声認識制御装置はナビゲーション装置1内に内蔵されていたが、本発明はこれに限ったものではない。音声認識制御装置としては、図4に示すようにナビゲーション装置1やスマートホン2といった音声認識装置とは別に設けてもよい。同図に示すように、音声認識制御装置3は、操作スイッチ31と、マイク32と、A/D変換器33と、音声記憶部34と、BTモジュール35と、制御手段としてのマイコン36と、を備えている。これらは、上記実施例の操作スイッチ11、マイク12、A/D変換器13、音声記憶部14、BTモジュール15、マイコン16に相当している。この音声認識制御装置3は、BTなどの無線によりナビゲーション装置1やスマートホン2と無線接続され、音声認識動作の開始命令、音声認識可能になった旨の信号、音声情報の送信が互いに可能になっている。
また、上述した実施例では、音声認識装置として、ナビゲーション装置1やスマートホン2を例に挙げて説明していたが、これに限ったものではない。音声認識装置としては、音声認識機能を有する装置であればよい。
また、上述した実施例では、音声認識装置としては、ナビゲーション装置1とスマートホン2との複数台が接続されていたが、これに限ったものではない。音声認識装置は1台であってもよく、1台であっても音声認識動作が立ち上がるのを待たずにすぐに使用者に対して発話を促すことができる、という効果を得ることができる。
また、上述した実施例では、マイコン16は、発話が終了したときに操作スイッチ11が操作されると、発話終了を受け付けていたが、これに限ったものではない。マイク12から所定時間継続して集音できなかったときに発話終了と判断するようにしてもよい。
また、前述した実施例は本発明の代表的な形態を示したに過ぎず、本発明は、実施形態に限定されるものではない。即ち、本発明の骨子を逸脱しない範囲で種々変形して実施することができる。
1 ナビゲーション装置(音声認識制御装置、音声認識装置)
2 スマートホン(音声認識装置)
3 音声認識制御装置
12、32 マイク
14、34 音声記憶部(記憶手段)
16、36 マイコン(制御手段)
2 スマートホン(音声認識装置)
3 音声認識制御装置
12、32 マイク
14、34 音声記憶部(記憶手段)
16、36 マイコン(制御手段)
Claims (9)
- 使用者の発話音声を集音するマイクと、
前記マイクにより集音された発話音声を音声情報として記憶する記憶手段と、
音声による操作を開始する旨の開始命令を受け付けると、前記記憶手段に前記音声情報を記憶させるとともに、発話音声により操作可能な音声認識装置に対して音声認識動作を開始させるように制御する制御手段と、を備えることを特徴とする音声認識制御装置。 - 前記制御手段は、前記開始命令を受け付けると、前記音声認識装置の音声認識動作の状態に関わらず前記使用者に対して前記マイクへの発話を促す旨の報知をさせることを特徴とする請求項1に記載の音声認識制御装置。
- 前記制御手段は、前記音声認識装置の音声認識動作が可能である旨の情報を受けると、前記記憶手段に記憶された前記音声情報を当該音声認識装置へ送信することを特徴とする請求項1又は2に記載の音声認識制御装置。
- 前記制御手段は、複数の前記音声認識装置を制御する場合、前記記憶手段に記憶された前記音声情報を前記複数の音声認識装置それぞれに送信することを特徴とする請求項3に記載の音声認識制御装置。
- 前記制御手段は、複数の前記音声認識装置を制御する場合、前記音声認識装置に順次、前記音声情報を送信し、前記音声認識装置から前記音声情報が受け付けられない情報を受けると、次の前記音声認識装置に前記音声情報を送信し、前記音声認識装置から前記音声情報を受け付けた情報を受けると、次の前記音声認識装置への前記音声情報の送信を行わない
ことを特徴とする請求項3に記載の音声認識制御装置。 - 前記制御手段は、予め定めた音声認識装置の優先度順に、前記音声情報を送信する
ことを特徴とする請求項5に記載の音声認識制御装置。 - 音声による操作を開始する旨の開始命令を受け付けると、記憶手段にマイクにより集音された発話音声を音声情報として記憶させるとともに、前記発話音声により操作可能な音声認識装置に対して音声認識動作を開始させるように制御する制御工程を備えることを特徴とする音声認識制御方法。
- 請求項7に記載の音声認識制御方法を、コンピュータにより実行させることを特徴とする制御プログラム。
- 請求項8に記載の制御プログラムを格納したことを特徴とするコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013076538A JP2014202800A (ja) | 2013-04-02 | 2013-04-02 | 音声認識制御装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013076538A JP2014202800A (ja) | 2013-04-02 | 2013-04-02 | 音声認識制御装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014202800A true JP2014202800A (ja) | 2014-10-27 |
Family
ID=52353296
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013076538A Pending JP2014202800A (ja) | 2013-04-02 | 2013-04-02 | 音声認識制御装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2014202800A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109658937A (zh) * | 2017-10-10 | 2019-04-19 | 苏州宝时得电动工具有限公司 | 智能割草机的语音控制方法、装置、系统和智能割草机 |
JP2021081482A (ja) * | 2019-11-14 | 2021-05-27 | 株式会社日立ビルシステム | 演算装置、記録媒体、音声入力装置 |
-
2013
- 2013-04-02 JP JP2013076538A patent/JP2014202800A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109658937A (zh) * | 2017-10-10 | 2019-04-19 | 苏州宝时得电动工具有限公司 | 智能割草机的语音控制方法、装置、系统和智能割草机 |
JP2021081482A (ja) * | 2019-11-14 | 2021-05-27 | 株式会社日立ビルシステム | 演算装置、記録媒体、音声入力装置 |
JP7465075B2 (ja) | 2019-11-14 | 2024-04-10 | 株式会社日立ビルシステム | 演算装置、記録媒体、音声入力装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2904486B1 (en) | Handsfree device with continuous keyword recognition | |
US9728187B2 (en) | Electronic device, information terminal system, and method of starting sound recognition function | |
JP5433782B2 (ja) | 車両内において電子カレンダー・アプリケーションのハンズフリー操作を実行するシステム及び方法 | |
US9953653B2 (en) | Configurable speech recognition system using multiple recognizers | |
US20180204569A1 (en) | Voice Assistant Tracking And Activation | |
US20100332236A1 (en) | Voice-triggered operation of electronic devices | |
US20130132084A1 (en) | System and method for performing dual mode speech recognition | |
US20100330908A1 (en) | Telecommunications device with voice-controlled functions | |
JP2009300537A (ja) | 音声作動システム、音声作動方法および車載装置 | |
EP3157003A1 (en) | Terminal control method and device, voice control device and terminal | |
WO2016157782A1 (ja) | 音声認識システム、音声認識装置、音声認識方法、および制御プログラム | |
JP2017138536A (ja) | 音声処理装置 | |
KR102552486B1 (ko) | 차량의 음성인식 장치 및 방법 | |
US20120021729A1 (en) | Application Audio Announcements Using Wireless Protocols | |
KR20210044509A (ko) | 음성 인식의 향상을 지원하는 전자 장치 | |
JP2014202800A (ja) | 音声認識制御装置 | |
JP6673243B2 (ja) | 音声認識装置 | |
JP2014062944A (ja) | 情報処理装置 | |
WO2014108981A1 (ja) | 車載情報システムおよび音声認識適応方法 | |
US20210233516A1 (en) | Agent system, agent server, and computer readable recording medium | |
US11735187B2 (en) | Hybrid routing for hands-free voice assistant, and related systems and methods | |
EP3089160B1 (en) | Method and apparatus for voice control of a mobile device | |
US9973604B2 (en) | Framework for user-created device applications | |
WO2018207482A1 (ja) | 発話制御装置、電子機器、プログラムおよび発話制御装置の制御方法 | |
CN111369972A (zh) | 引导声音输出控制系统及引导声音输出控制方法 |