JP2019176431A - 音声認識装置 - Google Patents

音声認識装置 Download PDF

Info

Publication number
JP2019176431A
JP2019176431A JP2018065658A JP2018065658A JP2019176431A JP 2019176431 A JP2019176431 A JP 2019176431A JP 2018065658 A JP2018065658 A JP 2018065658A JP 2018065658 A JP2018065658 A JP 2018065658A JP 2019176431 A JP2019176431 A JP 2019176431A
Authority
JP
Japan
Prior art keywords
speaker
unit
voice recognition
voice
volume
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018065658A
Other languages
English (en)
Inventor
塚本 淳
Atsushi Tsukamoto
淳 塚本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2018065658A priority Critical patent/JP2019176431A/ja
Publication of JP2019176431A publication Critical patent/JP2019176431A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】スピーカからの音響出力中において、音響出力を継続しながら良好な音声認識を可能とする音声認識装置を提供する。【解決手段】音声認識装置10は、スピーカ23を有する車両に搭載される音声認識装置10であって、スピーカ23に入力されるオーディオ信号の信号強度を測定する測定部17と、測定部17により測定された信号強度が所定の閾値より大きいとき、スピーカ23の音量を低下させる音量調整指示部18とを備える。【選択図】図1

Description

本発明は、音声認識装置に関する。
一般的に、車両にはオーディオ装置が搭載され、搭乗者は、CD、磁気ディスクもしくは半導体メモリ等の記憶媒体から再生された音楽、または、ラジオもしくはテレビ放送の音声等を、オーディオ装置のスピーカを介して視聴することが多い。このため、車両において音声認識装置により音声認識を行おうとすると、オーディオ装置のスピーカから出力される音楽等が、音声認識装置のマイクから認識対象の発話者の声と共に取り込まれ、適切な音声認識ができないことがある。
そこで、特許文献1に記載される音声認識装置では、オーディオ装置のスピーカに入力されるオーディオ信号に基づいて、雑音除去信号を生成し、マイクから取得される音声信号に含まれる雑音成分を除去している。また、特許文献1に記載される音声認識装置では、音声認識が開始される際にオーディオ装置のスピーカから出力される音響の音圧をγ倍に設定した後、音声認識処理を行っている。さらに、特許文献1では、雑音除去後の音声信号に基づいて、利用者の発生音量を評価し、音圧の平均値を算出して履歴データファイルに書き込み、その履歴データファイルから音圧平均を算出することで、次回に設定すべきγ値を設定している。また、特許文献1に開示される音声認識装置は、発話者の発話音量が小さく、音声認識がうまく動作しない場合に、オーディオ装置の音量を上げることで、いわゆるロンバート効果により発話者の発話音量が大きくなるように誘導している。同様に、引用文献2には、音声対話装置において、発話者の発話音量が小さく音声認識がうまく動作しないとき、発話を行うユーザの音声を大きくするように誘導するため、音楽等の背景音を大きくすることが記載されている。
特開2009−169445号公報 特開2006−317556号公報
しかしながら、雑音除去信号による雑音成分の除去は、スピーカに入力されるオーディオ信号により生成される雑音除去信号が、マイクから集音される音声に含まれる実際のオーディオ装置からの雑音と整合せず、正確に行われない場合がある。このような場合に、さらにスピーカの音量を上げると、雑音の除去が不十分なためかえって音声認識の成功率が低下することが懸念される。さらに、スピーカの音量を上げることで発話者の音声が大きくなるか否かには個人差があり、音声認識の成功率の向上に必ずしも結びつかない。
かかる事情に鑑みてなされた本発明の目的は、スピーカからの音響出力中において、音響出力を継続しながら良好な音声認識を可能とする音声認識装置を提供することにある。
上記課題を解決する本開示の一実施形態に係る音声認識装置は、スピーカを有する車両に搭載される音声認識装置であって、前記スピーカに入力されるオーディオ信号の信号強度を測定する測定部と、前記測定部により測定された前記信号強度が所定の閾値より大きいとき、前記スピーカの音量を低下させる音量調整指示部とを備えることを特徴とするものである。
本発明によれば、スピーカからの音響出力中において、音響出力を継続しながら良好な音声認識を可能とする音声認識装置を提供することができる。
本発明の一実施形態に係る音声認識装置の概略構成を示すブロック図である。 図1の音声認識装置の処理フローの一例を示すフローチャートである。
以下、本発明の実施の形態について、図面を参照して説明する。
(音声認識装置の構成)
図1は、本発明の一実施形態に係る音声認識装置10の概略構成を示す機能ブロック図である。音声認識装置10は、人の話す音声を取得し発話内容を認識し、認識結果をテキストデータ等で出力する。音声認識装置10は、車両に搭載することができる。本願において、車両には乗用車、トラック、バス、大型・小型特殊自動車等を含むが、これらに限られない。音声認識装置10を車両に搭載する場合、音声認識装置10は、ダッシュボードの中、車室内の天井、ラゲッジルーム等に配置することができる。
音声認識装置10は、音声認識起動部11と、音声処理部12と、音量調整部13とを含む。音声認識装置10は、さらに、音声を電気信号に変換するマイク14を含むことができる。マイク14は必ずしも音声認識装置10に含まれなくてもよい。その場合、音声認識装置10は、音声認識装置10の外部に設けられたマイク14から、音声信号を受信してよい。
音声認識装置10が設けられた車両は、オーディオ装置20を有することができる。オーディオ装置20は、記憶媒体に記憶された音響データを再生すること、ネットワーク経由で伝送される音響データを再生すること、および、放送信号を受信して再生すること等の少なくとも一つ以上が可能である。記憶媒体は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、ブルーレイディスク(登録商標)、ハードディスク、半導体メモリ等を含む。ネットワークは、例えば、LTE(Long Term Evolution)、WiMAX(登録商標)、Wi−Fi(登録商標)等の通信方式により接続されるインターネット、または、VPN(Virtual Private Network)等の専用ネットワーク等のネットワークを含む。放送は、例えば、AMラジオ放送、FMラジオ放送、地上波テレビ放送、衛星放送等を含む。なお、本願において、「音響」は音楽、環境音、放送番組における会話等の種々の音を含むものとし、「音声」は、人から発せられた声を意味するものとする。
オーディオ装置20は、音声認識装置10と異なる装置であってよい。あるいは、オーディオ装置20は、音声認識装置10と一体の装置であってよい。後者の場合、オーディオ装置20を含む装置を、音声認識装置10とみなすことができる。例えば、音楽再生機能および音声認識機能を有するカーナビゲーション装置は、オーディオ装置20と音声認識装置10とが一体となったものとみなすことができる。
音声処理部12および音量調整部13は、単一の、または、複数のプロセッサを含んで構成される。プロセッサには、特定のプログラムを読み込ませることにより、プログラムされた機能を実行する汎用プロセッサおよび、特定の処理に特化した専用プロセッサが含まれる。専用プロセッサとしては、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)およびFPGA(Field-Programmable Gate Array)等を採用しうる。プロセッサは、演算中の情報を記憶するための1つまたは複数のメモリを有することができる。メモリは、ROM(read only memory)、RAM(Random Access Memory)、フラッシュメモリ、磁気ディスク、光学ディスク等を含みうる。
以下に、音声認識装置10の構成をさらに詳細に説明する。音声認識起動部11は、音声認識装置10の音声処理部12を起動して、音声認識を開始させる。音声認識起動部11は、さらに、音量調整部13を起動する。音声認識起動部11は、運転者等の利用者により操作される押しボタン等のスイッチを含むことができる。利用者は、音声認識機能を起動したいとき、このスイッチを操作する。音声認識起動部11は、スイッチによらず、利用者によりマイク14から予め定められたキーワードの音声入力があったとき、音声処理部12を起動するようにしてよい。この場合、音声認識処理のほとんどが停止した状態で、音声処理部12は、音声認識処理を起動させるために予め定められたキーワードの入力を待ち受ける。キーワードの音声入力を受けるため、音声処理部12とは別のモジュールを設けてもよい。
音声認識処理は、音声認識起動部11のスイッチの操作、および、利用者による音声による指示のみならず、他の方法で起動されてよい。例えば、音声認識装置10において実行されるプログラムから音声認識処理が起動されることもできる。音声認識装置10は、オーディオ装置20または他の装置のプログラムから音声認識処理を実行する要求を受けて音声認識処理を起動し、音声認識処理の結果を、当該音声認識処理を要求した装置へテキストデータ等として出力してよい。
音声処理部12は、マイク14からの音声信号を取得する音声信号入力部15と、音声信号に基づいて音声認識処理を行う音声認識部16とを備えることができる。
音声信号入力部15は、有線インタフェースおよび無線のインタフェースが含まれる。有線のインタフェースには、アナログ音声端子、HDMI(登録商標)(High-Definition Multimedia Interface)、IEEE802.3、USB(Universal Serial Bus)、IEEE1394等を含む種々の規格に準拠する通信インタフェースを含むが、これらに限られない。無線インタフェースにはBluetooth(登録商標)、IEEE802.11等に準拠する通信インタフェースを含むが、これらに限られない。音声信号入力部15は、アナログ音声信号をデジタル信号に変換するA/D変換器を備えることができる。音声信号入力部15は、マイク14から受信したアナログ音声信号を、デジタル音声信号に変換して音声認識部16に受け渡すことができる。
音声認識部16は、音声信号入力部15から取得した音声信号に対して、音声認識処理を実行する。音声認識結果は、例えばテキストデータとして出力される。または、音声認識結果は、コマンドの実行、予め定められた選択肢からの選択などに反映されてよい。音声認識処理には、種々の公知の技術を採用することができる。具体的には、音声認識部16は、短い時間区間ごとに音声信号に対して周波数分析を行うことにより、特徴量を抽出する。音声認識部16は、抽出した特徴量の時系列のパターンに対して、隠れマルコフモデルなどの音響モデルにより音を識別する。さらに、音声認識部16は、発話辞書およびN−gram等の言語モデルを用いて、蓄積されている単語の中から最も妥当な単語を選択する。音声認識部16は、音声認識処理プログラムを実行する音声認識エンジンと、音声およびテキストのデータベースとを含む。音声認識処理プログラムとしては、公知の一般的なソフトウェアを用いることができる。音声認識部16は、音声およびテキストのデータベースとして、ネットワークで接続された車両外部のデータベースを使用してもよい。
音声認識部16は、音声認識処理を終了させることができる。例えば、音声認識部16は、利用者から音声認識処理終了の指示を音声で受けたとき、音声認識処理を終了させてよい。音声認識部16は、音声認識処理の開始後一定時間以上音声の入力がない状態が続いたとき、音声認識処理を終了させてよい。また、音声認識部16は、音声認識装置10のプログラム、または、他の装置からの要求により音声認識処理を実行したときは、必要な入力が得られた後、音声認識処理を終了させてよい。音声処理を終了させたとき、音声認識部16は、音量調整部13に対して音量調整を終了させる信号を送ることができる。
次に、音量調整部13について説明する前に、オーディオ装置20について説明する。オーディオ装置20は、音源部21、アンプ22およびスピーカ23を備える。
音源部21は、音響データに基づいてオーディオ信号を生成する。音響データは、例えば、記憶媒体、通信ネットワーク、または、放送により音源部21に提供される。音源部21としては、一般的に使用されている公知の音源を採用することができる。音源部21は、CDプレーヤ、DVDプレーヤ、ブルーレイ・プレイヤ、ハードディスクドライブ、AMチューナ、FMチューナ、TVチューナ、オーディオデコーダ等の何れか1つ以上を含むことができる。
アンプ22は、音源部21の生成したオーディオ信号を増幅して、後段のスピーカ23に出力する。アンプ22は、オーディオ信号の増幅率を調整することができる。アンプ22は、1つまたは複数のスピーカ23に対してオーディオ信号を出力することができる。アンプ22は、一般的なアンプを用いることができ、スピーカ23から出力される音響の音量を調整することができる。
スピーカ23は、アンプ22からのオーディオ信号により駆動され、オーディオ信号を車両内に音として出力する。スピーカ23は、車両のドアトリム等に配置される。スピーカ23から出力される音響の音量は、アンプ22から出力されるオーディオ信号の電気信号強度(信号強度)に依存する。スピーカ23としては、公知の一般的なスピーカを使用することができる。
次に、音量調整部13について説明する。音量調整部13は、スピーカ23の音量に対応する電気信号強度を測定し、測定された電気信号強度に基づいて、スピーカ23の音量を調整する。音量調整部13は、測定部17と音量調整指示部18を備える。
測定部17は、音声認識起動部11により音声認識処理が起動されると、オーディオ装置20のアンプ22からスピーカ23への出力ライン24の電気信号強度を測定する。測定部17は、例えば、出力ライン24から分岐した信号線25から得られる信号に基づいて電気信号強度を測定することができる。信号線25から得られる電気信号強度は、スピーカ23の音量に対応する。このように、アンプ22の増幅率に対応する設定音量ではなく、スピーカ23に入力されるオーディオ信号の電気信号強度を測定することによって、再生されるオーディオ信号の録音レベルによらず、実際のスピーカ23から出力される音響の音量を得ることができる。
測定部17は、上記出力ライン24のオーディオ信号の電気信号強度の測定に付加して、または、代替して、スピーカ23から出力された音をマイク14で集音し、マイク14から出力される電気信号強度を測定することができる。測定部17は、マイク14から出力される電気信号強度の情報を、音声信号入力部15から得ることができる。音声信号入力部15から得られる電気信号強度は、スピーカ23から出力される音響の音量に対応する。
音量調整指示部18は、測定部17で測定した電気信号強度に基づいて、アンプ22に対してスピーカ23の音量調整を指示することができる。具体的には、音量調整指示部18は、測定部17により測定された電気信号強度が所定の閾値よりも大きい場合は、スピーカ23の音量が大きすぎるため音声認識の成功率を低化させるものとして、アンプ22の増幅率を低下させスピーカ23の音量を低下させる。所定の閾値は、スピーカ23から出力されマイク14から取り込まれた音響が、音声認識処理にどの程度影響を与えるかを考慮して、予め設定することができる。音声認識装置10を使用する利用者は、それぞれ発話する音量または音声処理部12による認識の成功率が異なるの。このため、閾値は、音声認識装置10を使用する個人ごとに、異なる値に設定されてよい。
(音声処理のフロー)
以下に、音声認識装置10が実行する音声認識処理のフローを、図2を用いて説明する。本明細書で開示される方法は、音声認識装置10に搭載されるプロセッサがプログラムに従って実行することができる。そのようなプログラムは、非一時的なコンピュータ可読媒体において記憶されることが可能である。非一時的なコンピュータ可読媒体の例としては、ハードディスク、RAM、ROM、フラッシュメモリ、CD−ROM、光記憶デバイス、磁気記憶デバイス等を含むが、これらに限定されない。
前提として、音声認識装置10による音声認識の起動前に、車両に搭載されたオーディオ装置20が稼働しており、音源部21からのオーディオ信号がアンプ22で増幅され、スピーカ23から継続的に出力されている。すなわち、車両に搭載される音声認識装置10の利用者は、音楽プレーヤまたはラジオ等のオーディオ装置20を使って、音楽コンテンツまたは放送の視聴をしているものとする。
まず、音声認識装置10の音声処理部12は、音声認識起動部11により起動される(ステップS01)。音声認識起動部11は、例えば、利用者がスイッチを操作することにより、音声処理部12を起動する。音声処理部12が起動されると、音声処理部12は音声信号入力部15を経由してマイク14から音声の入力を受け、入力された音声の音声認識処理を音声認識部16により行う動作を、継続的に実行する。
音声認識起動部11は、音声処理部12とともに音量調整部13を起動させる。音量調整部13の測定部17は、スピーカ23から出力される音響の音量を測定する(ステップS02)。具体的には、アンプ22からスピーカ23へ向かう出力ライン24から分岐した信号線25をモニターして、スピーカ23に入力されるオーディオ信号の電気信号強度を測定する。測定部17は、利用者の発話前または発話間にマイク14を介して検出されるスピーカ23の出力による電気信号強度を、音声信号入力部15から取得することにより、スピーカ23から出力される音響の音量を測定してもよい。
次に、測定部17で測定された電気信号強度に基づいて、音量調整指示部18は、スピーカ23の音量が所定の閾値よりも大きいか否かを判断する(ステップS03)。より具体的には、音量調整指示部18は、測定部17で測定した電気信号強度が、所定の閾値よりも大きいか否かを判断する。
電気信号強度が閾値よりも大きい場合(ステップS03:Yes)、音量調整指示部18はアンプ22に指示を出してスピーカ23からの音響の音量を調整する(ステップS04)。具体的には、音量調整指示部18は、電気信号強度が所定の閾値以下となるように、アンプ22から出力するオーディオ信号を小さくする。これにより、スピーカ23からの音響の音量が、音声認識に影響を与えない程度まで低下される。
ステップS03で、電気信号強度が閾値よりも大きくはないとき(ステップS03:No)、および、上記ステップS04におけるスピーカ23の音量の調整が終了したとき、音量調整部13は、音声認識処理が終了したか確認する(ステップS05)。音声認識処理の終了は、音声認識部16から音量調整部13へ通知される。
ステップS05で、音声認識処理が終了していないとき(ステップS05:No)、音量調整部13はステップS02に戻る。すなわち、測定部17がその時点のスピーカ23の出力を測定する。以降、音声認識部16が音声認識処理の終了を音量調整部13に通知するまで、音量調整部13は、ステップS02〜S05の処理を繰り返して、スピーカ23の音量を調整する。音量調整部13によるステップS02〜S05の処理の繰り返しは、所定の頻度となるように調整されてよい。
ステップS05において、音声認識処理が終了したとき(ステップS05:Yes)、音量調整指示部18は、アンプ22に対して指示を送り、オーディオ信号の増幅率を音声認識起動前の状態に戻させる。これにより、スピーカ23から出力される音響の音量が、音声認識起動前の状態に戻る(ステップS06)。
以上説明したように、本実施の形態によれば、音量調整部13の測定部17が、スピーカに入力されるオーディオ信号の電気信号強度を測定し、音量調整指示部18が測定された電気信号強度が所定の閾値以下となるように、スピーカ23の音量を調整する。これによって、スピーカ23からのオーディオ等の音響出力中において、音響出力を継続しながら良好に音声認識を行うことができる。すなわち、音声認識装置10によれば、オーディオ再生中に、オーディオ装置20からの音響の音量を完全に0にする(ミュートする)ことなく、自動的にオーディオ装置20からの音響の音量を調整することができる。これによって、オーディオの視聴と音声認識とを両立させることが可能になる。さらに、音声認識装置10は、ノイズキャンセル信号を生成する必要が無いため、単純な構成とすることができ誤動作も少ない。
また、本実施形態によれば、音量調整部13が音声認識を行っている間、継続的にスピーカ23の出力を監視し、スピーカ23の音量に対応する電気信号強度を所定の閾値以下になるよう制御する。そのため、音量調整しない場合のオーディオ装置20の音量が大きく変化する場合でも、スピーカ23からの音響出力を、音声認識が妨げられない範囲に抑制することができる。
雑音除去を行いながらオーディオの音量を上げることで発話者の発話量が大きくなるように誘導する方法では、音声認識の認識率が向上するか否かは、個人により効果にバラツキが大きい。これに対し、本開示の音声認識装置10は、スピーカ23の出力に対応する電気信号強度を閾値と比較してオーディオ信号を調整するので、発話者の個人差によらず、音声認識の認識率を高めることができる。
上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。
例えば、音声認識装置10を構成する各機能ブロックは、図1に図示したものに限られない。図1に図示した各機能ブロックは、複数のブロックを1つに統合すること、1つのブロックを複数に分解すること、複数のブロック間で組み換えを行うこと等、本発明の範囲内で種々の変更が可能である。また、図2に示した音声認識処理の手順は、本発明の範囲内で順序を変更しまたは組み代えを行うことが可能である。
オーディオ装置20は、音声認識装置10の一部として構成されていてよい。オーディオ装置20は、音声認識装置10と同一のハードウェアまたは異なるハードウェア上に搭載されてよい。音量調整部13は、音声認識装置10側ではなく、オーディオ装置20側に搭載され、音声認識装置10から音声認識処理の起動および終了を示す信号を受け取るように構成されてよい。音声認識装置10は、オーディオ装置20の入力手段としてオーディオ装置20に付加されたものであってもよい。音声処理部および音量調整部の機能を有するものは、本発明の音声認識装置であると理解しうる。
10 音声認識装置
11 音声認識起動部
12 音声処理部
13 音量調整部
14 マイク
15 音声信号入力部
16 音声認識部
17 測定部
18 音量調整指示部
20 オーディオ装置
21 音源部
22 アンプ
23 スピーカ

Claims (1)

  1. スピーカを有する車両に搭載される音声認識装置であって、
    前記スピーカに入力されるオーディオ信号の信号強度を測定する測定部と、
    前記測定部により測定された前記信号強度が所定の閾値より大きいとき、前記スピーカの音量を低下させる音量調整指示部と
    を備える音声認識装置。
JP2018065658A 2018-03-29 2018-03-29 音声認識装置 Pending JP2019176431A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018065658A JP2019176431A (ja) 2018-03-29 2018-03-29 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018065658A JP2019176431A (ja) 2018-03-29 2018-03-29 音声認識装置

Publications (1)

Publication Number Publication Date
JP2019176431A true JP2019176431A (ja) 2019-10-10

Family

ID=68169784

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018065658A Pending JP2019176431A (ja) 2018-03-29 2018-03-29 音声認識装置

Country Status (1)

Country Link
JP (1) JP2019176431A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114554263A (zh) * 2022-01-25 2022-05-27 北京数字众智科技有限公司 一种远程影音播放控制设备及方法
WO2023149015A1 (ja) * 2022-02-03 2023-08-10 パナソニックIpマネジメント株式会社 音声処理装置、音声処理方法、音声処理プログラム、および音声処理システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114554263A (zh) * 2022-01-25 2022-05-27 北京数字众智科技有限公司 一种远程影音播放控制设备及方法
WO2023149015A1 (ja) * 2022-02-03 2023-08-10 パナソニックIpマネジメント株式会社 音声処理装置、音声処理方法、音声処理プログラム、および音声処理システム

Similar Documents

Publication Publication Date Title
US9934780B2 (en) Method and system for using sound related vehicle information to enhance spoken dialogue by modifying dialogue's prompt pitch
CN109273006B (zh) 车载系统的语音控制方法、车载系统、车辆及存储介质
US20050216271A1 (en) Speech dialogue system for controlling an electronic device
JP2008256802A (ja) 音声認識装置および音声認識方法
CN112397065A (zh) 语音交互方法、装置、计算机可读存储介质及电子设备
JP7023823B2 (ja) 車載装置及び音声認識方法
JP2019176431A (ja) 音声認識装置
US20190237092A1 (en) In-vehicle media vocal suppression
JP6459330B2 (ja) 音声認識装置、音声認識方法、及び音声認識プログラム
JP6759058B2 (ja) 音声認識装置および音声認識方法
JP6902049B2 (ja) 発話信号を含むオーディオ信号のラウドネスレベル自動修正
JP2009175179A (ja) 音声認識装置、プログラム、及び発話信号抽出方法
WO2016017229A1 (ja) 発話区間検出装置、音声処理システム、発話区間検出方法およびプログラム
WO2019202351A1 (ja) 機器制御装置及び機器を制御する制御方法
JP2007043356A (ja) 音量自動調節装置および音量自動調節方法
US11276404B2 (en) Speech recognition device, speech recognition method, non-transitory computer-readable medium storing speech recognition program
US20200380992A1 (en) Hybrid routing for hands-free voice assistant, and related systems and methods
WO2015093013A1 (ja) スピーチ認識装置及びスピーチ認識のためのコンピュータプログラム製品
JP6811865B2 (ja) 音声認識装置および音声認識方法
JP2004184803A (ja) 車両用音声認識装置
WO2024009465A1 (ja) 音声認識装置、プログラム、音声認識方法、及び音声認識システム
JP6610195B2 (ja) 端末装置、通信方法
CN210575092U (zh) 一种车载听歌识曲装置
JP6822540B2 (ja) 端末装置、通信方法及び通信プログラム
JP2019028160A (ja) 電子装置および情報端末システム