JP2020160281A

JP2020160281A - 端末装置、端末装置の制御方法、およびプログラム

Info

Publication number: JP2020160281A
Application number: JP2019059873A
Authority: JP
Inventors: 慎一菊池; Shinichi Kikuchi; 昌宏暮橋; Masahiro Kurehashi; 正樹栗原; Masaki Kurihara; 本田　裕; Yutaka Honda; 裕本田
Original assignee: Honda Motor Co Ltd
Current assignee: Honda Motor Co Ltd
Priority date: 2019-03-27
Filing date: 2019-03-27
Publication date: 2020-10-01
Anticipated expiration: 2039-03-27
Also published as: CN111755007A; CN111755007B; JP7278830B2

Abstract

【課題】音声認識機能を有し、互いに異なる複数のサーバ装置を有効に活用することができる端末装置、端末装置の制御方法、およびプログラムを提供すること。【解決手段】車両に搭載される端末装置であって、マイクによって収音された車室内の音声に対して、音声認識機能を有する複数のサーバ装置のうち二以上のサーバ装置のそれぞれに応じた前処理を行う二以上の前処理部と、前記二以上の前処理部のそれぞれにより前処理が行われた音声を、通信部を用いて、対応するサーバ装置に送信する通信制御部と、を備える端末装置。【選択図】図２

Description

本発明は、端末装置、端末装置の制御方法、およびプログラムに関する。

従来、車両において乗員により発せられた音声を認識する技術について研究が進められている。特許文献１には、ユーザーの発話に基づく音声信号が入力される音声信号入力部と、ユーザーの手動操作に基づく操作信号が入力される操作信号入力部と、音声信号に含まれるノイズに関する指標であるノイズ指標を算出するＳＮ比算出部と、音声信号または操作信号のいずれかを入力信号として受け付け、入力信号に基づく制御を実行する制御部と、を備え、制御部は、ＳＮ比算出部が算出するノイズ指標に基づいて、次の操作入力において音声信号、または操作信号のいずれを入力信号として受け付けるかを決定する車載装置の発明が開示されている。

特開２０１７−１０２８２２号公報

音声認識の分野では、端末装置からネットワークを介してサーバ装置に音声が送信され、サーバ装置において音声認識が行われ、その結果が端末装置に返信される仕組みが主流である。しかしながら、従来の技術では、複数のサーバ装置に対して選択的に、或いは並行して音声認識を依頼するための仕組みについて十分に検討されていなかった。このため、従来の技術では、音声認識機能を有する複数のサーバ装置を有効に活用することができない場合があった。

本発明は、このような事情を考慮してなされたものであり、音声認識機能を有し、互いに異なる複数のサーバ装置を有効に活用することができる端末装置、端末装置の制御方法、およびプログラムを提供することを目的の一つとする。

この発明に係る端末装置、端末装置の制御方法、およびプログラムは、以下の構成を採用した。

（１）：本発明の一態様に係る端末装置は、車両に搭載される端末装置であって、マイクによって収音された車室内の音声に対して、音声認識機能を有する複数のサーバ装置のうち二以上のサーバ装置のそれぞれに応じた前処理を行う二以上の前処理部と、前記二以上の前処理部のそれぞれにより前処理が行われた音声を、通信部を用いて、対応するサーバ装置に送信する通信制御部と、を備えるものである。

（２）：上記（１）の態様において、前記通信制御部は、前記複数のサーバ装置のうち第１のサーバ装置に対しては、少なくとも、前記前処理部による前処理が行われなかった音声を送信するものである。

（３）：上記（２）の態様において、前記二以上の前処理部のうち、前記第１のサーバ装置以外のサーバ装置に応じた前処理を行う前処理部を実現する第１のＯＳと、前記前処理部による前処理が行われなかった音声を取り出すための第２のＯＳと、を搭載しているものである。

（４）：上記（１）から（３）の態様において、前記二以上の前処理部のうち一部または全部は、シーケンシャルに処理を行うものである。

（５）：上記（１）から（４）の態様において、前記複数のサーバ装置のそれぞれに対応した複数の前記通信制御部を備えるものである。

（６）：本発明の他の態様に係る端末装置の制御方法は、車両に搭載される端末装置の制御方法であって、前記端末装置が備える二以上の前処理部のそれぞれが、マイクによって収音された車室内の音声に対して、音声認識機能を有する複数のサーバ装置のうち二以上のサーバ装置のそれぞれに応じた前処理を行い、前記二以上の前処理部のそれぞれにより前処理が行われた音声を、通信部を用いて、対応するサーバ装置に送信するものである。

（７）：本発明の他の態様に係るプログラムは、車両に搭載される端末装置により実行されるプログラムであって、前記端末装置に、マイクによって収音された車室内の音声に対して、音声認識機能を有する複数のサーバ装置のうち二以上のサーバ装置のそれぞれに応じた前処理を行わせ、前記複数のサーバ装置のそれぞれに応じた前処理が行われた音声を、通信部を用いて、対応するサーバ装置に送信させるものである。

上記（１）〜（７）の態様によれば、音声認識機能を有し、互いに異なる複数のサーバ装置を有効に活用することができる。

端末装置１００を含むサービスシステム１の構成図である。第１実施形態に係る端末装置１００の構成と、車両Ｍに搭載された機器とを示す図である。表示・操作装置２０の配置例を示す図である。スピーカユニット３０の配置例を示す図である。サーバ装置２００の構成の一例を示す図である。前処理部により実行される処理について説明するための図である。

以下、図面を参照し、本発明の端末装置、端末装置の制御方法、およびプログラムの実施形態について説明する。端末装置は、サービスシステムの一部または全部を実現する装置である。端末装置は、例えば、車両（以下、車両Ｍ）に搭載される。サービスシステムとは、車両Ｍの車室内で収集された音声をサーバ装置に送信し、サーバ装置で音声認識を含めた情報処理が行われた結果を車両Ｍに返信し、車両Ｍで何らかのサービス（情報提供、機器制御など、如何なるものでもよい）が提供されるシステムである。

サービスシステムでは、例えば、乗員の音声を認識する音声認識機能（音声をテキスト化する機能）、自然言語処理機能（テキストの構造や意味を理解する機能）、その他各種サービス機能等を統合的に利用して実現される。これらの機能の一部または全部は、ＡＩ（Artificial Intelligence）技術によって実現されてよい。

［全体構成］
図１は、端末装置１００を含むサービスシステム１の構成図である。サービスシステム１は、例えば、端末装置１００と、複数のサーバ装置２００−１、２００−２、２００−３、２００−４…とを備える。符号の末尾のハイフン以下数字は、サービスを区別するための識別子であるものとする。いずれのサーバ装置であるかを区別しない場合、単にサーバ装置２００と称する場合がある。図１では３つのサーバ装置２００を示しているが、サーバ装置２００の数は２つ以下であってもよいし、３つ以上であってもよい。それぞれのサーバ装置２００は、互いに異なるサービスの提供者が運営するものである。従って、本発明におけるサービスは、互いに異なる提供者により実現されるものである。任意の主体（法人、団体、個人等）がサービスの提供者となり得る。

端末装置１００は、ネットワークＮＷを介してサーバ装置２００と通信する。ネットワークＮＷは、例えば、インターネット、セルラー網、Ｗｉ−Ｆｉ網、ＷＡＮ（Wide Area Network）、ＬＡＮ（Local Area Network）、公衆回線、電話回線、無線基地局などのうち一部または全部を含む。

端末装置１００は、車両Ｍの乗員により発せられた音声をサーバ装置２００に送信し、サーバ装置２００から返信された情報に基づいて乗員に任意のサービスを提供する。サービスは、単に音声認識された内容を表示するものであってもよいし、任意の言語に翻訳するものであってもよいし、その他、如何なるサービスであってもよい。

［車両］
図２は、第１実施形態に係る端末装置１００の構成と、車両Ｍに搭載された機器とを示す図である。車両Ｍには、例えば、一以上のマイク１０と、表示・操作装置２０と、スピーカユニット３０と、車載通信装置６０と、端末装置１００とが搭載される。また、スマートフォンなどの汎用通信装置７０が車室内に持ち込まれ、通信装置として使用される場合がある。これらの装置は、ＣＡＮ（Controller Area Network）通信線等の多重通信線やシリアル通信線、無線通信網等によって互いに接続される。なお、図２に示す構成はあくまで一例であり、構成の一部が省略されてもよいし、更に別の構成が追加されてもよい。

マイク１０は、車室内で発せられた音声を収集する収音部である。表示・操作装置２０は、画像を表示すると共に、入力操作を受付可能な装置（或いは装置群）である。表示・操作装置２０は、例えば、タッチパネルとして構成されたディスプレイ装置を含む。表示・操作装置２０は、更に、ＨＵＤ（Head Up Display）や機械式の入力装置を含んでもよい。スピーカユニット３０は、例えば、車室内の互いに異なる位置に配設された複数のスピーカ（音出力部）を含む。表示・操作装置２０は、端末装置１００とナビゲーション装置４０とで共用されてもよい。

車載通信装置６０は、例えば、セルラー網やＷｉ−Ｆｉ網を利用してネットワークＮＷにアクセス可能な無線通信装置である。

図３は、表示・操作装置２０の配置例を示す図である。表示・操作装置２０は、例えば、第１ディスプレイ２２と、第２ディスプレイ２４と、操作スイッチＡＳＳＹ２６とを含む。表示・操作装置２０は、更に、ＨＵＤ２８を含んでもよい。

車両Ｍには、例えば、ステアリングホイールＳＷが設けられた運転席ＤＳと、運転席ＤＳに対して車幅方向（図中Ｙ方向）に設けられた助手席ＡＳとが存在する。第１ディスプレイ２２は、インストルメントパネルにおける運転席ＤＳと助手席ＡＳとの中間辺りから、助手席ＡＳの左端部に対向する位置まで延在する横長形状のディスプレイ装置である。第２ディスプレイ２４は、運転席ＤＳと助手席ＡＳとの車幅方向に関する中間あたり、且つ第１ディスプレイの下方に設置されている。例えば、第１ディスプレイ２２と第２ディスプレイ２４は、共にタッチパネルとして構成され、表示部としてＬＣＤ（Liquid Crystal Display）や有機ＥＬ（Electroluminescence）、プラズマディスプレイなどを備えるものである。操作スイッチＡＳＳＹ２６は、ダイヤルスイッチやボタン式スイッチなどが集積されたものである。表示・操作装置２０は、乗員によってなされた操作の内容を端末装置１００に出力する。第１ディスプレイ２２または第２ディスプレイ２４が表示する内容は、端末装置１００によって決定されてよい。

図４は、スピーカユニット３０の配置例を示す図である。スピーカユニット３０は、例えば、スピーカ３０Ａ〜３０Ｈを含む。スピーカ３０Ａは、運転席ＤＳ側の窓柱（いわゆるＡピラー）に設置されている。スピーカ３０Ｂは、運転席ＤＳに近いドアの下部に設置されている。スピーカ３０Ｃは、助手席ＡＳ側の窓柱に設置されている。スピーカ３０Ｄは、助手席ＡＳに近いドアの下部に設置されている。スピーカ３０Ｅは、右側後部座席ＢＳ１側に近いドアの下部に設置されている。スピーカ３０Ｆは、左側後部座席ＢＳ２側に近いドアの下部に設置されている。スピーカ３０Ｇは、第２ディスプレイ２４の近傍に設置されている。スピーカ３０Ｈは、車室の天井（ルーフ）に設置されている。

係る配置において、例えば、専らスピーカ３０Ａおよび３０Ｂに音を出力させた場合、音像は運転席ＤＳ付近に定位することになる。また、専らスピーカ３０Ｃおよび３０Ｄに音を出力させた場合、音像は助手席ＡＳ付近に定位することになる。また、専らスピーカ３０Ｅに音を出力させた場合、音像は右側後部座席ＢＳ１付近に定位することになる。また、専らスピーカ３０Ｆに音を出力させた場合、音像は左側後部座席ＢＳ２付近に定位することになる。また、専らスピーカ３０Ｇに音を出力させた場合、音像は車室の前方付近に定位することになり、専らスピーカ３０Ｈに音を出力させた場合、音像は車室の上方付近に定位することになる。これに限らず、スピーカユニット３０は、ミキサーやアンプを用いて各スピーカの出力する音の配分を調整することで、車室内の任意の位置に音像を定位させることができる。

［端末装置］
図２に戻り、端末装置１００は、例えば、第１管理部１１０と、第２管理部１２０と、通信制御部１５０−１〜１５０−３と、ペアリングアプリ実行部１５２とを備える。第１管理部１１０は、前処理部１１２−１、１１２−２と、表示制御部１１６と、音声制御部１１８とを備える。第２管理部１２０は、前処理部１２２−３と、表示制御部１２６と、音声制御部１２８とを備える。いずれの通信制御部であるか区別しない場合、単に通信制御部１５０と称する。３つの通信制御部１５０を示しているのは、図１におけるサーバ装置２００の数に対応させた一例に過ぎず、通信制御部１５０の数は、２つであってもよいし、４つ以上であってもよい。図２に示すソフトウェア配置は説明のために簡易に示しており、実際には、例えば、通信制御部１５０と車載通信装置６０の間に管理部１１０が介在してもよいように、任意に改変することができる。

端末装置１００の各構成要素は、例えば、ＣＰＵ（Central Processing Unit）などのハードウェアプロセッサがプログラム（ソフトウェア）を実行することにより実現される。これらの構成要素のうち一部または全部は、ＬＳＩ（Large Scale Integration）やＡＳＩＣ（Application Specific Integrated Circuit）、ＦＰＧＡ（Field-Programmable Gate Array）、ＧＰＵ（Graphics Processing Unit）などのハードウェア（回路部；circuitryを含む）によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めＨＤＤ（Hard Disk Drive）やフラッシュメモリなどの記憶装置（非一過性の記憶媒体を備える記憶装置）に格納されていてもよいし、ＤＶＤやＣＤ−ＲＯＭなどの着脱可能な記憶媒体（非一過性の記憶媒体）に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。

管理部１１０は、ＯＳ（Operating System）やミドルウェアなどのプログラムが実行されることで機能する。管理部１２０も同様であり、端末装置１００は、管理部１１０を実現するためのＯＳと、管理部１２０を実現するためのＯＳとを別々に搭載してもよい。

前処理部１１２−１および通信制御部１５０−１は、サーバ装置２００−１に対応した処理を行う。前処理部１１２−２および通信制御部１５０−２は、サーバ装置２００−２に対応した処理を行う。前処理部１２２−３および通信制御部１５０−３は、サーバ装置２００−３に対応した処理を行う。各前処理部は、対応するサーバ装置２００が音声認識を行うのに適した状態となるように、音声に対する音響処理などを行ったり、行わなかったりする。通信制御部１５０は、対応する前処理部から出力される音声或いは音声処理が行われた結果を、対応するサーバ装置２００に送信する。これらの詳細については後述する。

通信制御部１５０には、ペアリングアプリ実行部１５２を介して汎用通信装置７０と連携し、サーバ装置２００と通信するものがあってよい。通信制御部１５０−１は、車載通信装置６０を用いてサーバ装置２００−１と通信する。通信制御部１５０−２は、車載通信装置６０を用いてサーバ装置２００−２と通信する。通信制御部１５０−３は、ペアリングアプリ実行部１５２を介して汎用通信装置７０と連携し、サーバ装置２００−３と通信する。車載通信装置６０および汎用通信装置７０のそれぞれは、「通信部」の一例である。ペアリングアプリ実行部１５２は、例えば、Ｂｌｕｅｔｏｏｔｈ（登録商標）によって汎用通信装置７０とペアリングを行い、通信制御部１５０−３と汎用通信装置７０とを接続させる。なお、通信制御部１５０−３は、ＵＳＢ（Universal Serial Bus）などを利用した有線通信によって汎用通信装置７０に接続されるようにしてもよい。

表示制御部１１６および１２６は、サーバ装置２００から返信された情報に基づく画像を第１ディスプレイ２２または第２ディスプレイ２４に表示させる。

音声制御部１１８および１２８は、サーバ装置２００から返信された情報に基づく音声を、スピーカユニット３０に含まれるスピーカのうち一部または全部に音声を出力させる。

［サーバ装置］
図５は、サーバ装置２００の構成の一例を示す図である。ここでは、端末装置１００からネットワークＮＷまでの物理的な通信についての説明を省略する。

サーバ装置２００は、通信部２１０を備える。通信部２１０は、例えばＮＩＣ（Network Interface Card）などのネットワークインターフェースである。更に、サーバ装置２００は、例えば、音声認識部２２０と、自然言語処理部２２２と、返信情報生成部２２４とを備える。これらの構成要素は、例えば、ＣＰＵなどのハードウェアプロセッサがプログラム（ソフトウェア）を実行することにより実現される。これらの構成要素のうち一部または全部は、ＬＳＩやＡＳＩＣ、ＦＰＧＡ、ＧＰＵなどのハードウェア（回路部；circuitryを含む）によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めＨＤＤやフラッシュメモリなどの記憶装置（非一過性の記憶媒体を備える記憶装置）に格納されていてもよいし、ＤＶＤやＣＤ−ＲＯＭなどの着脱可能な記憶媒体（非一過性の記憶媒体）に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。

サーバ装置２００は、記憶部２５０を備える。記憶部２５０は、上記の各種記憶装置により実現される。記憶部２５０には、辞書ＤＢ（データベース）２５２などのデータやプログラムが格納される。

通信部２１０が端末装置から音声或いは音声処理が行われた結果を取得すると、音声認識部２２０が音声認識を行ってテキスト化された文字情報を出力し、自然言語処理部２２２が文字情報に対して辞書ＤＢ２５２を参照しながら意味解釈を行う。辞書ＤＢ２５２は、文字情報に対して抽象化された意味情報が対応付けられたものである。辞書ＤＢ２５２は、同義語や類義語の一覧情報を含んでもよい。音声認識部２２０の処理と、自然言語処理部２２２の処理は、段階が明確に分かれるものではなく、自然言語処理部２２２の処理結果を受けて音声認識部２２０が認識結果を修正するなど、相互に影響し合って行われてよい。返信情報生成部２２４は、自然言語処理部２２２の処理結果に基づいて、端末装置１００に返信する情報（返信情報）を生成する。返信情報は、如何なるものであってもよく、例えば、音声を別の言語に変換したものであってよい。なお、自然言語処理部２２２が省略され、サーバ装置２００は単にテキスト化された文字情報を出力するものであってもよい。

［前処理］
以下、端末装置１００において前処理部により実行される前処理について説明する。図６は、前処理部により実行される処理について説明するための図である。マイク１０により収音された音声は、例えば、前処理部１１２−１と、少なくとも通信制御部１５０−３とに供給される。なお、図６に示す例はあくまで一例であり、マイク１０により収音された音声は、各前処理部に並行して供給されてよい。

前処理部１１２−１は、例えば、入力された音声に対してビームフォーミング、ノイズキャンセル、イコライジングなどの処理を行った処理済音声（１）を含む処理結果（１）を通信制御部１５０−１に出力する。また、前処理部１１２−１は、処理済音声（１）に対して簡易な音声認識を行い、その結果を処理結果（１）に含めて通信制御部１５０−１に出力してもよい。通信制御部１５０−１は、車載通信装置６０を用いて処理結果（１）をサーバ装置２００−１に送信させる。処理済音声（１）は、前処理部１１２−２に出力される。

前処理部１１２−２は、例えば、入力された処理済音声（１）に対して、前処理部１１２−１の処理だけでは不足する分の処理を行った処理済音声（２）を含む処理結果（２）を通信制御部１５０−２に出力する。また、前処理部１１２−２は、処理済音声（２）に対して簡易な音声認識を行い、その結果を処理結果（２）に含めて通信制御部１５０−１に出力してもよい。通信制御部１５０−２は、車載通信装置６０を用いて処理結果（２）をサーバ装置２００−２に送信させる。

前処理部１２２−３は省略されてもよく、前処理部１２２−３が存在する場合も、存在しない場合も、通信制御部１５０−３には、マイク１０により収音された音声が入力される。前処理部１２２−３が存在する場合、前処理部１２２−３は、入力された音声に対してビームフォーミング、ノイズキャンセル、イコライジングなどの処理を行った処理済音声（３）を含む処理結果（３）を通信制御部１５０−３に出力する。また、前処理部１１２−１は、処理済音声（３）に対して簡易な音声認識を行い、その結果を処理結果（３）に含めて通信制御部１５０−３に出力してもよい。通信制御部１５０−３は、ペアリングアプリ実行部１５２を介して汎用通信装置７０に指示し、少なくともマイク１０により収音された音声をサーバ装置２００−３に送信する。また、通信制御部１５０−３は、更に、処理結果（３）をサーバ装置２００−３に送信してもよい。サーバ装置２００−３は、「第１のサーバ装置」の一例である。

このように、実施形態の端末装置１００によれば、音声認識機能を有する複数のサーバ装置２００のうち二以上のサーバ装置２００のそれぞれに応じた前処理を行う二以上の前処理部を備え、二以上の前処理部のそれぞれにより前処理が行われた音声を、通信制御部１５０が対応するサーバ装置２００に送信する。これによって、サーバ装置２００の特性に応じた前処理がなされた処理結果を、それぞれのサーバ装置２００に送信することができる。例えば、あるサーバ装置２００はノイズ耐性が強く、別のサーバ装置２００はノイズ耐性が弱い場合、前者に対してはマイク１０により収音された音声に近いデータを送信し、後者に対しては強めのノイズキャンセルを行ったデータを送信することで、いずれのサーバ装置２００に対しても要求品質に近いデータを送信することができる。この結果、音声認識機能を有し、互いに異なる複数のサーバ装置２００を有効に活用することができる。

また、端末装置１００において、通信制御部１５０−３は、サーバ装置２００−３に対しては、少なくとも、前処理部１２２−３による前処理が行われなかった音声を送信する。これによって、前処理が行われていない音声を要求するサーバ装置２００−３に対しても音声認識のための適切なデータを送信することができる。

また、端末装置１００において、サーバ装置２００−３以外のサーバ装置２００に応じた前処理を行う前処理部を実現する第１のＯＳと、サーバ装置２００−３に送信するために前処理部による前処理が行われなかった音声を取り出すための第２のＯＳとを搭載している。これによって、同一のソフトウェアで処理を行う場合に必要となる調停等の煩わしさを解消することができる。

また、端末装置１００において、前処理部１１２−１と前処理部１１２−２はシーケンシャルに（直列に、連続的に）処理を行う。これによって、両者に共通する処理がある場合に、前処理部１１２−１のみが共通する処理に係る機能を実装すればよいため、メモリ資源を節約することができる。また、並列に処理を行うのではないため、両者に排他的な処理結果が生じるような懸念も解消されている。

以上説明した実施形態の端末装置１００によれば、音声認識機能を有し、互いに異なる複数のサーバ装置を有効に活用することができる。

以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。

１０マイク
２０表示・操作装置
３０スピーカユニット
６０車載通信装置
７０汎用通信装置
１００端末装置
１１０第１管理部
１１２−１、１１２−２、１２２−３前処理部
１１６、１２６表示制御部
１１８、１２８音声制御部
１２０第２管理部
１５０−１、１５０−２、１５０−３通信制御部
１５２ペアリングアプリ実行部
２００−１、２００−２、２００−３サーバ装置

Claims

車両に搭載される端末装置であって、
マイクによって収音された車室内の音声に対して、音声認識機能を有する複数のサーバ装置のうち二以上のサーバ装置のそれぞれに応じた前処理を行う二以上の前処理部と、
前記二以上の前処理部のそれぞれにより前処理が行われた音声を、通信部を用いて、対応するサーバ装置に送信する通信制御部と、
を備える端末装置。
前記通信制御部は、前記複数のサーバ装置のうち第１のサーバ装置に対しては、少なくとも、前記前処理部による前処理が行われなかった音声を送信する、
請求項１記載の端末装置。
前記二以上の前処理部のうち、前記第１のサーバ装置以外のサーバ装置に応じた前処理を行う前処理部を実現する第１のＯＳと、
前記前処理部による前処理が行われなかった音声を取り出すための第２のＯＳと、
を搭載している、請求項２記載の端末装置。
前記二以上の前処理部のうち一部または全部は、シーケンシャルに処理を行う、
請求項１から３のうちいずれか１項記載の端末装置。
前記複数のサーバ装置のそれぞれに対応した複数の前記通信制御部を備える、
請求項１から４のうちいずれか１項記載の端末装置。
車両に搭載される端末装置の制御方法であって、
前記端末装置が備える二以上の前処理部のそれぞれが、マイクによって収音された車室内の音声に対して、音声認識機能を有する複数のサーバ装置のうち二以上のサーバ装置のそれぞれに応じた前処理を行い、
前記二以上の前処理部のそれぞれにより前処理が行われた音声を、通信部を用いて、対応するサーバ装置に送信する、
端末装置の制御方法。
車両に搭載される端末装置により実行されるプログラムであって、
前記端末装置に、
マイクによって収音された車室内の音声に対して、音声認識機能を有する複数のサーバ装置のうち二以上のサーバ装置のそれぞれに応じた前処理を行わせ、
前記複数のサーバ装置のそれぞれに応じた前処理が行われた音声を、通信部を用いて、対応するサーバ装置に送信させる、
プログラム。