JP2019028160A - 電子装置および情報端末システム - Google Patents

電子装置および情報端末システム Download PDF

Info

Publication number
JP2019028160A
JP2019028160A JP2017145387A JP2017145387A JP2019028160A JP 2019028160 A JP2019028160 A JP 2019028160A JP 2017145387 A JP2017145387 A JP 2017145387A JP 2017145387 A JP2017145387 A JP 2017145387A JP 2019028160 A JP2019028160 A JP 2019028160A
Authority
JP
Japan
Prior art keywords
voice
voice recognition
electronic device
setting
priority
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017145387A
Other languages
English (en)
Other versions
JP6910721B2 (ja
Inventor
文彦 青山
Fumihiko Aoyama
文彦 青山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alpine Electronics Inc
Original Assignee
Alpine Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alpine Electronics Inc filed Critical Alpine Electronics Inc
Priority to JP2017145387A priority Critical patent/JP6910721B2/ja
Publication of JP2019028160A publication Critical patent/JP2019028160A/ja
Application granted granted Critical
Publication of JP6910721B2 publication Critical patent/JP6910721B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】 接続された情報端末の音声認識機能を適切に利用することができる電子装置を提供する。【解決手段】 本発明の車載装置110は、入力された発話音声を音声信号に変換し、変換された音声信号を出力する音声入力部310と、音声入力部310から出力された音声信号に基づき音声認識を行う音声認識モジュール220と、音声認識機能を提供可能なスマートフォン130、140を接続可能な接続部と、複数の音声認識機能の性能要求を反映した優先度を設定する優先度設定部と、優先度に従い音声入力部310のADC314の動作条件を設定信号SETを介して設定する動作条件設定部とを有する。【選択図】 図3

Description

本発明は、複数の情報端末を接続可能な電子装置に関し、特に、複数の情報端末の各音声認識機能を利用する方法に関する。
近年、多機能型情報端末に代表されるスマートフォンの普及とともに音声認識機能の普及も進んでいる。また、スマートフォンと車載機との接続も可能となり、スマートフォンの音声認識機能を車載機で利用することも可能である。
特許文献1では、車載装置に複数のスマートフォンが接続されたとき、車載装置が、ユーザーの発話音声に含まれる特定のキーワードに基づきスマートフォンの音声認識機能を選択する方法を開示している。また、特許文献2では、車載端末と音声認識サーバとの間を中継する音声データ中継装置が、車載端末から音声データの入力が無いときにテスト用のデータを音声認識サーバに送り、その認識結果を用いて音声データの雑音処理などに使うパラメータを最適値に設定する方法を開示している。
特開2016−151608号公報 特開2013−007764号公報
車載装置と複数のスマートフォンとの接続が可能になり、車載装置に組み込まれている音声認識機能およびスマートフォンの音声認識機能が共存する環境が発生する。スマートフォンによる音声認識機能は、通常、発話音声の音声データを音声認識サーバに送信し、音声認識サーバで認識処理を行い、その処理結果をスマートフォンで受け取る。音声認識サーバによる音声認識は、自然言語解析を行うため音声認識の汎用性が高い特徴がある。一方、車載装置に組み込まれた音声認識機能は、車載装置の機能に特化したキーワードまたはキーフレーズ等の定型句の音声認識に強い特徴がある。
車載装置にスマートフォンが接続された環境では、運転中、スマートフォンを所持した通話が禁止されるため、ユーザーの発話音声は、車載装置のマイクロフォンから取り込まれる。ユーザーは、例えば、ハンドルに取り付けられた選択キーを長押しまたは短押しすることで、車載装置の音声認識機能またはスマートフォンの音声認識機能のいずれかを選択することができる。
図7(A)に、車載装置の音声入力部の内部構成を示す。音声入力部10は、発話音声を入力し、これをアナログ音声信号に変換するマイクロフォン12と、マイクロフォン12から出力されたアナログ音声信号をデジタル音声信号に変換するアナログ/デジタル変換器(ADC)14と、変換されたデジタル音声信号に含まれるノイズを除去するノイズリダクション(NR)16と、NR16から出力されたデジタル音声信号を、選択キーにより選択された車載装置の音声認識エンジンまたはスマートフォンへ送信する送信制御部18とを有する。
ここで、車載装置やスマートフォンの各音声認識機能は、それぞれ規格が異なり、それぞれの音声認識機能を利用する前に、各音声認識機能の規格(フォーマット)に合わせた動作条件(設定値)をADC14およびNR16に設定する必要がある。図7(B)に、車載装置と2つのスマートフォンA、Bの動作条件を設定するための設定項目と性能要求の一例を示す。設定項目は、例えば、ADC14のサンプリング周波数、量子化ビット数、モノラルまたはステレオの設定を含む。また、音声認識機能の性能要求は、音声認識機能の起動から音声認識を行うまでの音声認識開始時間、NR(ノイズリダクション)設定の有無を含む。もし、車載装置の音声認識機能を使用する場合には、ADC14のサンプリング周波数を8kHZまたは16kHZ、量子化ビット数を16ビット、音声信号をモノラルに設定する必要があり、NRを有効に設定する必要がある。
従来の車載装置では、音声入力部10のADC14およびNR16には、車載装置の音声認識機能の規格に合わせた動作条件が設定されている。音声入力部10の動作条件を変更する場合、マイクロフォン12の遅延時間が約10ms、ADC14の設定の切り替えに要する時間が約60ms、NRの設定の切り替えに要する時間が約10msであり、合計で約80msを要する。ADC14の設定を切り替えた場合、バイアスが安定するためには一定時間が必要となり、この間、原則として発話音声を入力することができない。
各音声認識機能を利用するためには、それぞれの音声認識機能の性能要求(特に、音声認識開始時間)を満たす必要があるが、音声入力部10の動作条件の設定変更に要する時間が、性能要求である音声認識開始時間を超えると、発話音声の先頭部分を音声認識することができない、または発話音声を誤認識してしまう、といった課題がある。
図7(C)は、性能要求が一番厳しいスマートフォンAを利用するとき、音声認識を正確に行うことができない例を示している。時刻t1において、ユーザーが選択キーによりスマートフォンAの音声認識機能の選択/起動を指示すると、図示しない制御部は、ADC14の動作条件(設定値)を、スマートフォンAの規格に一致するように切り替える。上記したように、音声入力部10の設定変更に要する実時間は、時刻t1から約80ms経過後の時刻t2である。一方、スマートフォンAの音声認識開始時間は、音声認識機能が起動される時刻t1から60ms経過後の時刻t3である。このため、発話音声の先頭の20msに対応する部分を取り込むことができず、その先頭部分の音声認識をすることができなくなってしまい、結果として、発話音声を誤認識するおそれがある。
本発明は、このような従来の課題を解決するものであり、接続された情報端末が提供する音声認識機能を適切に利用することができる電子装置および情報端末システムを提供することを目的とする。
本発明に係る電子装置は、発話音声を入力し、入力された発話音声を音声信号に変換し、変換された音声信号を出力する音声入力手段と、前記音声入力手段から出力された音声信号に基づき音声認識を行う音声認識手段と、音声認識機能を提供可能な情報端末を接続可能な接続手段と、前記音声認識手段および前記情報端末の音声認識機能の性能要求を反映した優先度を設定する優先度設定手段と、前記優先度に従い前記音声入力手段の動作条件を設定する動作条件設定手段と、を有する。
好ましくは前記音声入力手段は、アナログ音声信号をデジタル音声信号に変換するアナログ/デジタル変換器を含み、前記動作条件設定手段は、前記アナログ/デジタル変換器の動作条件を設定する。好ましくは前記音声認識機能の性能要求は、音声認識機能が起動されてから音声を認識するまでの時間である。好ましくは電子装置はさらに、電子装置の音声認識手段、または前記情報端末の音声認識機能を選択する選択手段を含み、前記動作条件設定手段は、前記選択手段により選択された音声認識手段または音声認識機能に応じた動作条件を設定する。好ましくは電子装置はさらに、前記接続手段を介して情報端末が接続されたか否かを検出する検出手段を含み、前記優先度設定手段は、前記検出手段の検出結果に基づき前記優先度を変更する。
本発明に係る情報端末システムは、上記構成の電子装置と、前記電子装置に接続された1つまたは複数の情報端末とを含むものであって、前記情報端末は、前記電子装置から音声信号を受け取り、当該音声信号の音声認識結果を前記電子装置へ出力するものである。
本発明によれば、複数の音声認識機能を利用可能な環境において、複数の音声認識機能の性能要求を反映した優先度を設定し、当該優先度に従い音声入力手段の動作条件を設定するようにしたので、性能要求が厳しい音声認識機能を利用する場合にも当該性能要求を満足させた音声認識を行うことができる。
本発明の情報端末システムの全体構成を示す図である。 本発明の実施例に係る車載装置の構成を示すブロック図である。 本発明の実施例に係る車載装置の音声入力部の概略構成を示しブロック図である。 本発明の実施例に係る音声入力部の設定を行う設定プログラムの機能的な構成を示す図である。 本実施例の優先度設定部が保持する優先度テーブルの一例を示す図である。 本発明の実施例に係る車載装置の設定動作を説明するためのフローチャートである。 従来の車載装置の音声入力部と、スマートフォンの音声認識機能を使用するときの課題を説明する図である。
次に、本発明の実施の形態について図面を参照して詳細に説明する。本発明の実施の形態に係る電子装置は、例えば、車両に予め搭載された車載装置、あるいは車両に持ち込まれたものである。電子装置は、コンピュータ、電子処理装置、情報処理装置等であることができる。電子装置は、例えば、音声認識機能、外部機器と通信する機能、ナビゲーション機能、オーディオ・ビデオデータを再生する機能、テレビ・ラジオ放送を受信する機能等を備えることができる。
本発明の実施の形態に係る情報端末は、例えば、スマートフォン、携帯電話機、タブレット型端末、ラップトップ型端末であることができる。情報端末は、例えば、車内に持ち込まれたとき、車内の電子装置に無線または有線により接続され、電子装置と連携した動作を行う。情報端末は、音声認識機能を有し、情報端末が電子装置に接続されたとき、電子装置の音声認識機能および情報端末の音声認識機能が共存する環境が生成される。また、情報端末がナビゲーション機能、オーディオ・ビデオデータを再生する機能等を備えている場合には、電子装置は、情報端末のそれらの機能を利用することができる。
次に、本発明の実施例について説明する。図1は、複数のスマートフォン(情報端末)が車載装置(電子装置)に接続された情報端末システムを示している。情報端末システム100は、車載装置110と、車載装置110に通信手段120を介して接続されたスマートフォン130、140とを含む。ここには、2つのスマートフォンが接続される例を示しているが、接続されるスマートフォンの数は任意である。本実施例の情報端末システム100では、車載装置110に組み込まれた音声認識機能と、車載装置110に接続されたスマートフォン130、140の音声認識機能とが共存する環境において、ユーザーが選択する音声認識機能を適切に利用できるようにする。なお、スマートフォン130、140の音声認識機能は、スマートフォン自身の音声認識機能であってもよいし、あるいは、音声認識サーバ150、160と協働し、音声認識サーバ150、160により認識された結果を利用するものであってもよい。
図2は、車載装置110の内部構成を示すブロック図である。車載装置100は、入力部210、音声認識モジュール220、接続部230、ナビゲーション部240、マルチメディア再生部250、音声出力部260、表示部270、記憶部280、および制御部290を含んで構成される。なお、この構成は一例であり、車載装置110は、他の構成であってもよい。
入力部210は、入力キーデバイス、リモコン、タッチパネルなどにより、ユーザーからの指示を受け取り、これを制御部290へ提供する。また、入力部210は、図3に示すように、車載装置110に組み込まれた音声認識モジュール220またはスマートフォン130、140が提供する音声認識機能を選択するための選択キー300を含む。例えば、選択キー300が短押されたとき、制御部290は、車載装置110の音声認識機能が選択されたものと判定し、選択キー300が長押しされたとき、スマートフォンの音声認識機能が選択されたものと判定する。2つのスマートフォン130、140が接続されている場合には、例えば、選択キーが2度押しされたとき、スマートフォン130の音声認識機能が選択されたものと判定し、選択キーが長押しされたとき、スマートフォン140の音声認識機能が選択されたものと判定する。選択キー300は、例えば、車両のステアリングに取り付けられたハードキーであってもよいし、タッチパネルに表示されるソフトキーであってもよい。
さらに入力部210は、運転者等の発話音声を入力するための音声入力部310を含む。音声入力部310は、発話音声を入力し、入力された発話音声のアナログ音声信号を出力するマイクロフォン312と、マイクロフォン312から出力されたアナログ音声信号をデジタル音声信号に変換するアナログ/デジタル変換器(ADC)314と、デジタル音声信号のノイズを除去するノイズリダクション(NR)316と、デジタル音声信号を選択された音声認識機能へ送信する送信制御部318とを含む。
制御部290は、選択キー300の操作に応答して選択された音声認識機能を判定し、判定結果に基づき選択信号SELを送信制御部318へ提供する。送信制御部318は、選択信号SELに従い、入力されたデジタル音声信号を、車載装置110に組み込まれた音声認識モジュール220、スマートフォン130、またはスマートフォン140へ送信する。また、制御部290は、後述するように、設定信号SETによりADC314およびNR316の動作条件を設定する。
音声認識モジュール220は、音声入力部310から出力されたデジタル音声信号を受け取り、これの音声認識を行う。例えば、発話音声に含まれる五十音やアルファベット等の認識を行う。この認識結果は、制御部290へ提供され、制御部290は、認識結果に応じた処理を実行する。
接続部230は、車載装置110と外部機器との接続を可能にし、例えば、図1に示すような通信手段120によりスマートフォン130、140を接続する。接続部230は、例えば、近距離無線通信、無線LAN、その他の通信手段、あるいは有線接続により、1つまたは複数のスマートフォン接続をする。例えば、近距離無線通信により2つのスマートフォン130、140を同時に接続する場合には、2つの通信チャンネルを用い、3つ以上のスマートフォンを同時に接続する場合には、3つ以上の通信チャンネルを用いる。
ナビゲーション部240は、GPS衛星から送信されるGPS信号等に基づき自車位置を算出し、自車位置周辺の地図を案内する。マルチメディア再生部250は、DVD、CD、ブルーレイディスク等の記録媒体に記録されたビデオデータ、オーディオデータを再生する。再生されたビデオデータは表示部270に表示され、オーディオデータは音声出力部260から出力される。
音声出力部260は、マルチメディア再生部250により再生されたオーディオデータ以外に、接続されたスマートフォン130、140から接続部230を介して受け取ったオーディオデータを出力することが可能である。表示部270は、マルチメディア再生部250により再生されたビデオデータ以外に、接続された接続されたスマートフォン130、140から接続部230を介して受け取ったビデオデータを出力することが可能である。
記憶部280は、制御部290が実行するアプリケーションソフトウエアやプログラム、ナビゲーション部240やマルチメディア再生部250のための種々のデータを記憶することができる。
制御部290は、好ましい態様では、ROM、RAMなどを含むマイクロコントローラ等を含み、ROMまたはRAMは、車載装置110の各部の動作を制御するための種々のプログラムを実行することができる。本実施例では、制御部290は、接続されたスマートフォンの音声認識機能の性能要求に合致するように音声入力部の設定を行うための設定プログラム400を実行する。設定プログラム400の詳細は後述する。
車載装置110に接続されるスマートフォンについて説明する。スマートフォンは、典型的に、通話機能、通信機能、音声認識機能、表示部、音声出力部、記憶部、制御部等を含んで構成される。スマートフォンは、図1に示すように、通信手段120を介して車載装置110と接続され、車載装置110と連携する。上記したように、選択キー300によってスマートフォンの音声認識機能が選択されたとき、スマートフォンは、送信制御部318から送信されたデジタル音声信号を受け取り、音声認識機能を実行する。スマートフォンによる音声認識は、それ自身の音声認識機能を使用するものであってもよいし、図1に示すような音声認識サーバ150、160を利用するものであってもよい。スマートフォンにより音声認識された結果は、通信手段120を介して車載装置110へ送信される。
次に、車載装置110の制御部290により実行される設定プログラム400について説明する。図4は、本実施例の設定プログラム400の機能的な構成を示す図であり、設定プログラム400は、優先度設定部410、デバイス接続検出部420、デバイス識別部430、動作条件設定部440、優先度変更部450を含む。
優先度設定部400は、各音声認識機能の性能要件(音声認識機能が起動されてから音声認識を行うまでの音声認識開始時間)を基に音声認識機能の規格に合わせた動作条件を設定するときの優先度または優先順位を定義し、これを保持する。好ましくは、優先度は、音声認識機能の性能要件の厳しいものほど、優先度が高くなるような設定を行う。図7の例で言えば、音声認識開始時間が一番短いスマートフォンAの音声認識機能の優先度が最も高く、次に、スマートフォンB、車載装置の順序である。優先度設定部400は、ユーザー入力によって設定するようにしてもよいし、あるいは、音声認識機能の性能要求(特に、音声認識開始時間)に関する情報を取得することができるのであれば、自動的に優先度を設定するようにしてもよい。あるいは、スマートフォンの機種またはアプリケーションに関連付けされた性能要求に関する情報を保持しておき、スマートフォンが接続されたときに、スマートフォンを識別することで音声認識機能の優先度を自動的に設定するようにしてもよい。優先度設定部400は、例えば、図4に示すような、デバイスの識別情報と優先度との関係を規定した優先度テーブルを用意し、これを記憶部280に格納する。
デバイス接続検出部420は、車載装置110の接続部230にスマートフォンが接続されているか否かを検出する。デバイス識別部430は、デバイス接続検出部420によりスマートフォンの接続が検出されたとき、検出されたデバイスを識別する。デバイス識別部430は、例えば、デバイスに固有の情報またはデバイスの機種名などを識別する。
動作条件設定部440は、設定プログラム400が起動されたとき、優先度設定部410に設定された優先度に従い、音声入力部310のADC314やNR316の動作条件を設定する。設定プログラム400は、ACC電源オン時、車載装置110の電源投下時、初期化時等に起動される。また、動作条件設定部440は、動作中に、ユーザーが選択キー300を介して選択される音声認識機能を変更させたとき、変更された音声認識機能に適合する動作条件を音声入力部310に設定する。動作条件は、具体的には、図7に示す設定項目であり、ADC314のサンプリング周波数、量子化ビット数、モノラルまたはステレオの設定、NR316のオン/オフの設定である。ADC314およびNR316への設定は、制御部290からの設定信号SETを介して行われる(図3を参照)。優先度変更部450は、デバイス接続検出部420の検出結果に基づきデバイスの接続状況に応じて優先度設定部410により設定された優先度を変更する。
次に、本実施例の車載装置の動作を図6のフローチャートを参照して説明する。なお、以下の説明は、車載装置110にスマートフォン130、140が接続される場合を想定したものである。また、車載装置110に組み込まれた音声認識機能を「SR機能1」、スマートフォン130による音声認識機能を「SR機能2」、スマートフォン140による音声認識機能を「SR機能3」とし、SR機能2、SR機能3は、図7に示すスマートフォンA、Bの音声認識機能にそれぞれ対応するものとする。
設定プログラム400は、好ましくは、車載装置110が起動されたとき、またはACC電源がオンされたときに実行される。まず、デバイス接続検出部420により、車載装置200にスマートフォン130、140が接続されているか否かが検出される(S100)。スマートフォンの接続が検出されると、デバイス識別部430は、接続されたスマートフォン130、140の識別を行う。
次に、動作条件設定部440は、優先度設定部410により設定された優先度(図4に示す優先度テーブル)に従い、スマートフォン130のSR機能2が利用できるか否かを判定する(S102)。1つの例では、動作条件設定部440は、スマートフォン130が車載装置110と連携するアプリケーションを起動させているか否かによりSR機能2が利用できるか否かを判定する。当該アプリケーションが起動されていれば、スマートフォン130の音声認識機能を起動させ、音声認識機能が利用することが可能である。他方、アプリケーションが起動されていなければ、車載装置110からスマートフォン130への音声認識機能を起動させる命令等は、スマートフォン130において有効に処理されず、それ故、SR機能2を利用することができない。上記以外にも、動作条件設定部440は、スマートフォン130において音声認識機能を利用する/利用しないの設定が行われている場合には、その設定情報を取得して、SR機能2が利用可能か否かを判定するようにしてもよい。
SR機能2が利用可能であれば、動作条件設定部440は、SR機能2の動作条件を音声入力部310に設定する(S104)。図7の例で言えば、動作条件設定部440は、サンプリング周波数として24kHz、量子化ビット数として16ビット、モノラル設定を設定信号SETを介してADC314に設定し、NR有効をNR316に設定する。
性能要件が最も厳しい動作条件を音声入力部310に設定するため、ユーザーが選択キー300を介してSR機能2を選択しても、音声入力部310の設定変更が不要であり、SR機能2の性能要求である音声認識開始時間(60ms)を満たすことができる。仮に、ユーザーがSR機能3を選択しても、この音声認識開始時間は70msであり、音声入力部310の設定切り替えに要する時間は70ms(NR設定が無効であるため)であるため、SR3の性能要求を満たすことができる。また、SR機能1が選択された場合にも、音声認識開始時間は300msであり、音声入力部310の設定切り替えに要する時間は80msであるため、SR1の性能要求は満たされる。
SR機能2が利用不可と判定された場合、動作条件設定部440は、優先度テーブルに従い、次に優先度が高いSR機能3が利用可能か否かを判定する(S106)。この判定は、SR機能2のときと同様に行われる。SR機能3が利用可能であれば、動作条件設定部440は、SR機能3の動作条件を規定する設定値を音声入力部310に設定する(S108)。この例で言えば、動作条件設定部440は、サンプリング周波数として16kHz、量子化ビット数として16ビット、モノラル設定を設定信号SETを介してADC314に設定し、NR無効をNR316に設定する。
仮に、ユーザーが選択キー300を介してSR機能3を選択した場合、音声入力部310には、SR機能3の動作条件が設定されているため、音声入力部310の設定変更は不要であり、SR機能3の性能要求は満たされる。また、SR機能1が選択された場合にも、音声入力部310の設定切り替えに要する時間が80msであり、これは音声認識開始時間300msよりも短いため、SR機能1の性能要求は満たされる。
次に、デバイス接続検出部420によりスマートフォン130、140の接続が検出されない場合、または、スマートフォン130、140が接続されているが、SR機能2、SR機能3が利用可能出ない場合、動作条件設定部440は、車載装置110に組み込まれたSR機能1(音声認識モジュール220)が有効か否かを判定する(S110)。車載装置110は、ユーザーの指示に従い、音声認識モジュール220のオン/オフを設定することが可能であり、動作条件設定部440は、このオン/オフの設定に基づきSR機能1が有効か否かを判定する。
SR機能1が有効であれば、動作条件設定部440は、SR機能1の動作条件を規定する設定値を音声入力部310に設定する(S112)。この例で言えば、動作条件設定部440は、サンプリング周波数として8kHzまたは16kHz、量子化ビット数として16ビット、モノラル設定を設定信号SETを介してADC314に設定し、NR有効をNR316に設定する。
SR機能1が有効でない場合、すなわち、SR機能1ないしSR機能3の全てが利用可能でない場合、動作条件設定部440は、設定された優先度(優先度テーブル)を参照し(S114)、優先度が最も高いSR機能2の動作条件を音声入力部310に設定する(S116)。
次に、優先度変更部450は、デバイス接続検出部420の検出結果に基づき、接続状況に応じて優先度の設定を変更する(S118)。例えば、図5(A)に示す優先度に従い設定を行い、スマートフォン130の接続が検出されなければ、優先度変更部450は、図5(B)に示すように音声認識機能の優先度を変更する。こうしてデバイス接続検出部420により検出されるデバイスに変更があった場合に優先度を変更し、例えば、スマートフォン130が再接続された場合には、図5(A)に示すような優先度に変更される。図6に示すS100からS118までの処理が車載装置110の動作中に繰り返され、ACC電源がオフされると(S120)、処理が終了される。
このように本実施例によれば、音声認識機能の性能要件の厳しいものほど優先度が高くなるように設定し、この優先度に応じて音声入力部の動作条件を設定するようにしたので、車載装置が起動されたとき、性能要件の厳しい音声認識機能を使用することができる。従来の場合、車載装置110に組み込まれた音声認識モジュール220の動作条件を音声入力部310に設定しておき、ユーザーが性能要件の厳しい音声認識機能を選択するとき、その動作条件の設定を変更するが、動作条件の設定変更に要する実時間が音声認識機能により求められている音声認識開始時間よりも長くなり、音声認識を正確に行えないことがある。これに対し、本実施例では、性能要件が厳しい優先度に従い音声認識機能の動作条件を設定するため、ユーザーが性能要求が厳しい音声認識機能を選択しても、これに対処することができる。
上記実施例では、車載装置に接続される情報端末としてスマートフォンを例示したが、本発明は、スマートフォンに限定されず、車載装置と協働することができる音声認識機能を提供可能な他の端末装置であってもよい。
以上、本発明の好ましい実施の形態について詳述したが、本発明は、特定の実施形態に限定されるものではなく、特許請求の範囲に記載された発明の要旨の範囲において、種々の変形、変更が可能である。
100:情報端末システム 110:車載装置
120:通信手段 130、140:スマートフォン
150、160:音声認識サーバ 300:選択キー
310:音声入力部 312:マイクロフォン
314:アナログ/デジタル変換器 316:ノイズリダクション
318:送信制御部

Claims (6)

  1. 発話音声を入力し、入力された発話音声を音声信号に変換し、変換された音声信号を出力する音声入力手段と、
    前記音声入力手段から出力された音声信号に基づき音声認識を行う音声認識手段と、
    音声認識機能を提供可能な情報端末を接続可能な接続手段と、
    前記音声認識手段および前記情報端末の音声認識機能の性能要求を反映した優先度を設定する優先度設定手段と、
    前記優先度に従い前記音声入力手段の動作条件を設定する動作条件設定手段と、
    を有する電子装置。
  2. 前記音声入力手段は、アナログ音声信号をデジタル音声信号に変換するアナログ/デジタル変換器を含み、
    前記動作条件設定手段は、前記アナログ/デジタル変換器の動作条件を設定する、請求項1に記載の電子装置。
  3. 前記音声認識機能の性能要求は、音声認識機能が起動されてから音声を認識するまでの時間である、請求項1に記載の電子装置。
  4. 電子装置はさらに、電子装置の音声認識手段、または前記情報端末の音声認識機能を選択する選択手段を含み、
    前記動作条件設定手段は、前記選択手段により選択された音声認識手段または音声認識機能に応じた動作条件を設定する、請求項1に記載の電子装置。
  5. 電子装置はさらに、前記接続手段を介して情報端末が接続されたか否かを検出する検出手段を含み、
    前記優先度設定手段は、前記検出手段の検出結果に基づき前記優先度を変更する、請求項1に記載の電子装置。
  6. 請求項1ないし5いずれか1つに記載の電子装置と、前記電子装置に接続された1つまたは複数の情報端末とを含む情報端末システムであって、
    前記情報端末は、前記電子装置から音声信号を受け取り、当該音声信号の音声認識結果を前記電子装置へ出力する、情報端末システム。
JP2017145387A 2017-07-27 2017-07-27 電子装置および情報端末システム Active JP6910721B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017145387A JP6910721B2 (ja) 2017-07-27 2017-07-27 電子装置および情報端末システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017145387A JP6910721B2 (ja) 2017-07-27 2017-07-27 電子装置および情報端末システム

Publications (2)

Publication Number Publication Date
JP2019028160A true JP2019028160A (ja) 2019-02-21
JP6910721B2 JP6910721B2 (ja) 2021-07-28

Family

ID=65476150

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017145387A Active JP6910721B2 (ja) 2017-07-27 2017-07-27 電子装置および情報端末システム

Country Status (1)

Country Link
JP (1) JP6910721B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020160281A (ja) * 2019-03-27 2020-10-01 本田技研工業株式会社 端末装置、端末装置の制御方法、およびプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09212192A (ja) * 1996-02-07 1997-08-15 Ricoh Co Ltd 音声認識装置
JP2002182896A (ja) * 2000-12-12 2002-06-28 Canon Inc 音声認識システム及び音声認識装置ならびにそれらの方法
JP2005195834A (ja) * 2004-01-07 2005-07-21 Sony Corp 音声認識装置および方法、並びに、プログラムおよび記録媒体
JP2006079089A (ja) * 2004-09-07 2006-03-23 Lg Electronics Inc 音声認識用ベースバンドのモデムと、それを用いる移動通信端末機

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09212192A (ja) * 1996-02-07 1997-08-15 Ricoh Co Ltd 音声認識装置
JP2002182896A (ja) * 2000-12-12 2002-06-28 Canon Inc 音声認識システム及び音声認識装置ならびにそれらの方法
JP2005195834A (ja) * 2004-01-07 2005-07-21 Sony Corp 音声認識装置および方法、並びに、プログラムおよび記録媒体
JP2006079089A (ja) * 2004-09-07 2006-03-23 Lg Electronics Inc 音声認識用ベースバンドのモデムと、それを用いる移動通信端末機

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020160281A (ja) * 2019-03-27 2020-10-01 本田技研工業株式会社 端末装置、端末装置の制御方法、およびプログラム
JP7278830B2 (ja) 2019-03-27 2023-05-22 本田技研工業株式会社 端末装置、端末装置の制御方法、およびプログラム

Also Published As

Publication number Publication date
JP6910721B2 (ja) 2021-07-28

Similar Documents

Publication Publication Date Title
US11676601B2 (en) Voice assistant tracking and activation
US9728187B2 (en) Electronic device, information terminal system, and method of starting sound recognition function
US10452347B2 (en) Information processing device, information processing method, and terminal device for generating information shared between the information processing device and the terminal device
US20050216271A1 (en) Speech dialogue system for controlling an electronic device
US20100203830A1 (en) Systems and Methods for Implementing Hands Free Operational Environments
US9648155B2 (en) Mobile terminal, onboard device, control method, and control program
WO2018067639A1 (en) Vehicle-based remote control system and method
JP2009300537A (ja) 音声作動システム、音声作動方法および車載装置
KR20150043108A (ko) 음성 제어를 수행하는 디스플레이 장치 및 그 음성 제어 방법
EP2750026B1 (en) Audio device
JP6114915B2 (ja) 音声入力選択装置及び音声入力選択方法
US20160124882A1 (en) Electronic Device, System, and Operation-Mode Selection Program
JP6362875B2 (ja) 車載装置、車載情報システム
JP2017138536A (ja) 音声処理装置
US9234764B2 (en) Navigation system initiating conversation with driver
JP6910721B2 (ja) 電子装置および情報端末システム
JP2015002394A (ja) 情報処理装置及びコンピュータプログラム
JP2001042891A (ja) 音声認識装置、音声認識搭載装置、音声認識搭載システム、音声認識方法、及び記憶媒体
KR20180005828A (ko) 사운드 크기를 직관적으로 조정하기 위한 방법 및 차량 제어기
CN107704172B (zh) 一种多媒体应用切换控制方法、系统及存储装置
JP2015148831A (ja) 車載情報システム、情報端末、アプリケーション実行方法
US11735187B2 (en) Hybrid routing for hands-free voice assistant, and related systems and methods
CN113160811A (zh) 代理系统、服务器及计算机可读记录介质
JP6509077B2 (ja) 情報処理装置
JP6325231B2 (ja) 情報表示システム、情報表示システムの制御方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200306

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201223

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210706

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210706

R150 Certificate of patent or registration of utility model

Ref document number: 6910721

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150