JP2022088528A

JP2022088528A - 車載通話方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム

Info

Publication number: JP2022088528A
Application number: JP2022053429A
Authority: JP
Inventors: イーチョウ; Yi Zhou; ゼンチェン; Zheng Chen
Original assignee: Apollo Intelligent Connectivity Beijing Technology Co Ltd
Current assignee: Apollo Intelligent Connectivity Beijing Technology Co Ltd
Priority date: 2021-06-08
Filing date: 2022-03-29
Publication date: 2022-06-14
Also published as: KR20220045114A; CN113329372B; EP4040764A2; CN113329372A; EP4040764A3; US20220284888A1

Abstract

【課題】車載通話の柔軟性を向上させる車載通話方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラを提供する。【解決手段】方法は、対象車両中の各位置領域のオーディオデータを取得するステップ２０１と、各オーディオデータのオーディオパラメータに基づいて、各オーディオデータから目標オーディオデータを決定するステップ２０２と、目標オーディオデータに対応する目標位置領域を決定するステップ２０３と、目標位置領域のオーディオデータによって車載通話を行うように、目標位置領域に基づいて対象車両の車載通話パラメータを設定するステップ２０４と、を含む。【選択図】図２

Description

本開示はコンピュータの分野に関し、さらに車のインターネットの技術分野に関し、特に車載通話方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラムに関する。

現在、スマートカーは常にマルチオーディオゾーン技術を使用して、異なる位置にいる乗員が発する音声命令を正確に区別する。例えば、運転席のドライバーが話すと、ほかの座席のユーザーが発する音声を抑制し、運転席のドライバーが発する音声のみを受信する。

実際に使用したところ、マルチオーディオゾーン技術を使用するスマートカーで車載通話を行う場合、１つの座席にのみ通話システムを割り当て、単一位置からの音声のピックアップを実現するしかできず、ユーザーの要望に応じて通話位置を動的に切り替える使用需要を満たすことができないことを見出した。従って、現在の車載通話方法は通話の柔軟性が低いという問題を抱えている。

本開示は車載通話方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラムを提供する。

第１態様によれば、対象車両中の各位置領域のオーディオデータを取得するステップと、各オーディオデータのオーディオパラメータに基づいて、各オーディオデータから目標オーディオデータを決定するステップと、目標オーディオデータに対応する目標位置領域を決定するステップと、目標位置領域のオーディオデータによって車載通話を行うように、目標位置領域に基づいて対象車両の車載通話パラメータを設定するステップと、を含む車載通話方法を提供する。

第２態様によれば、対象車両中の各位置領域のオーディオデータを取得するように構成されるオーディオ取得ユニットと、各オーディオデータのオーディオパラメータに基づいて、各オーディオデータから目標オーディオデータを決定するように構成されるオーディオ決定ユニットと、目標オーディオデータに対応する目標位置領域を決定するように構成される領域決定ユニットと、目標位置領域のオーディオデータによって車載通話を行うように、目標位置領域に基づいて対象車両の車載通話パラメータを設定するように構成される設定ユニットと、を備える車載通話装置を提供する。

第３態様によれば、１つ又は複数のプロセッサと、１つ又は複数のプログラムを記憶するためのメモリと、を備え、１つ又は複数のプログラムが１つ又は複数のプロセッサによって実行されると、１つ又は複数のプロセッサに前記いずれかの車載通話方法を実現させる車載通話方法を実行する電子機器を提供する。

第４態様によれば、コンピュータに前記いずれかの車載通話方法を実行させるためのコンピュータ命令が記憶される非一時的コンピュータ可読記憶媒体を提供する。

第５態様によれば、プロセッサによって実行されると前記いずれかの車載通話方法を実現するコンピュータプログラムを提供する。

本願の技術によれば、車載通話方法を提供し、マルチオーディオゾーン技術を使用するスマートカーに適用でき、車両の各位置領域のオーディオデータのオーディオパラメータに基づいて、通話意向が最も強い目標オーディオデータを決定し、目標オーディオデータに対応する目標位置領域に基づいて車載通話パラメータを設定し、目標位置領域のオーディオデータを車載通話の通話者とすることを実現する。このプロセスはオーディオパラメータに基づいて車載通話を行う位置領域を柔軟に決定し、対応して車載通話パラメータを設定することができ、ユーザーの要望に応じて通話位置を動的に切り替えることを実現し、車載通話の柔軟性を向上させる。

理解できるように、この部分に記載の内容は本開示の実施例の肝心又は重要な特徴を特定することを意図するものでもなく、本開示の範囲を限定するものではない。本開示のほかの特徴は以下の明細書によって容易に理解されるようになる。

図面は本手段をよりよく理解することに用いられ、本開示を限定するものではない。
本願の一実施例を適用できる例示的なシステムアーキテクチャ図である。本願に係る車載通話方法の一実施例のフローチャートである。本願に係る車載通話方法の１つの適用シナリオの模式図である。本願に係る車載通話方法の別の実施例のフローチャートである。本願に係る車載通話装置の一実施例の構造模式図である。本開示の実施例における車載通話方法を実現するための電子機器のブロック図である。

以下、図面を参照しながら本開示の例示的な実施例を説明し、理解を助けるように本開示の実施例の様々な細部が含まれているが、単なる例示的なものであると考えられる。従って、当業者が理解できるように、本開示の範囲及び趣旨を逸脱せずに、ここで説明される実施例に対して種々の変更や修正を行うことができる。同様に、明確化及び簡明化のために、以下の説明では公知の機能及び構造についての説明は省略される。

なお、矛盾しない限り、本願の実施例及び実施例の特徴を互いに組み合わせることができる。以下、図面及び実施例を参照しながら本願を詳細に説明する。

図１に示すように、システムアーキテクチャ１００は端末機器１０１、１０２、１０３、ネットワーク１０４及びサーバ１０５を備えてもよい。ネットワーク１０４は端末機器１０１、１０２、１０３とサーバ１０５との間で通信リンクを提供するための媒体である。ネットワーク１０４は、例えば、有線、無線通信リンク又は光ファイバケーブル等の様々な接続タイプを含んでもよい。

ユーザーは端末機器１０１、１０２、１０３を使用してネットワーク１０４を介してサーバ１０５と対話して、メッセージ等を受信又は送信するようにしてもよい。端末機器１０１、１０２、１０３は対象車両中の車載端末であってもよく、具体的には、携帯電話、コンピュータ及びタブレットパソコン等の電子機器を含んでもよいが、これらに限定されず、端末機器１０１、１０２、１０３は対象車両のマイクロフォン機器と対話して、マイクロフォン機器により収集されるオーディオデータを取得するようにしてもよい。対象車両はマルチオーディオゾーン技術を使用する車両であってもよく、対象車両中に複数の位置領域が含まれ、各位置領域は相応なマイクロフォン機器に対応する。各位置領域のマイクロフォン機器により収集されるオーディオデータに基づいて、各位置領域のオーディオデータを得ることができる。

端末機器１０１、１０２、１０３はハードウェアであってもよく、ソフトウェアであってもよい。端末機器１０１、１０２、１０３がハードウェアである場合、様々な電子機器であってもよく、テレビ、スマートフォン、タブレットパソコンコンピュータ、電子書籍リーダー、車載コンピュータ、ラップトップ型ポータブルコンピュータ及びデスクトップコンピュータ等を含むが、これらに限定されない。端末機器１０１、１０２、１０３がソフトウェアである場合、上記列挙された電子機器に取り付けられてもよい。複数のソフトウェア又はソフトウェアモジュール（例えば、分散型サービスを提供することに用いられる）として実現されてもよく、単一のソフトウェア又はソフトウェアモジュールとして実現されてもよい。ここでは特に限定しない。

サーバ１０５は様々なサービスを提供するサーバであってもよく、例えば、端末機器１０１、１０２、１０３が対象車両中の各位置領域のオーディオデータを取得した後、サーバ１０５は各オーディオデータのオーディオパラメータに基づいて、各オーディオデータから目標オーディオデータを決定し、目標位置領域のオーディオデータによって車載通話を行うように、目標オーディオデータに対応する目標位置領域に基づいて対象車両の車載通話パラメータを設定することができる。サーバ１０５が車載通話パラメータを設定した後、端末機器１０１、１０２、１０３は目標位置領域に対応するマイクロフォン機器から伝送される目標オーディオデータを受信し、サーバ１０５が目標オーディオデータを、車載通話を行う別の端末機器に伝送するように、目標オーディオデータをサーバ１０５に伝送することができる。

なお、サーバ１０５はハードウェアであってもよく、ソフトウェアであってもよい。サーバ１０５がハードウェアである場合、複数のサーバからなる分散型サーバクラスターとして実現されてもよく、単一のサーバとして実現されてもよい。サーバ１０５がソフトウェアである場合、複数のソフトウェア又はソフトウェアモジュール（例えば、分散型サービスを提供することに用いられる）として実現されてもよく、単一のソフトウェア又はソフトウェアモジュールとして実現されてもよい。ここでは特に限定しない。

なお、本願の実施例に係る車載通話方法は、端末機器１０１、１０２、１０３によって実行されてもよく、サーバ１０５によって実行されてもよい。対応して、車載通話装置は端末機器１０１、１０２、１０３内に設置されてもよく、サーバ１０５内に設置されてもよい。

理解できるように、図１中の端末機器、ネットワーク及びサーバの数は単なる例示的なものである。実現の需要に応じて、任意数の端末機器、ネットワーク及びサーバを備えてもよい。

続いて、図２に参照されるように、本願に係る車載通話方法の一実施例のプロセス２００を示す。本実施例における車載通話方法は以下のステップを含む。

ステップ２０１、対象車両中の各位置領域のオーディオデータを取得する。

本実施例では、実行主体（図１中のサーバ１０５又は端末機器１０１、１０２、１０３）は対象車両を複数の位置領域に分割してもよく、各位置領域は独立し、ほかの位置領域の音声に干渉されず、それにより異なる位置領域の音声命令を正確に区別することを実現する。実行主体は対象車両の座席に応じて位置領域に分割してもよく、例えば、各座席は１つの位置領域に対応し、対象車両が５つの座席を有するものである場合、対応して５つの位置領域がある。また、実行主体は対象車両の現在の画像情報を取得し、現在の画像情報に対して画像認識を行い、対象車両の現在の乗員位置情報を得て、各位置領域が１つの乗員の位置に対応するように現在の乗員位置情報に基づいて各位置領域を決定するようにしてもよい。また、実行主体は対象車両中の各マイクロフォンにより収集される音声情報を取得し、音源定位技術に基づいて、対象車両の現在の乗員位置情報を決定し、現在の乗員位置情報に基づいて各位置領域を決定するようにしてもよい。

さらに、実行主体は対象車両中のマイクロフォン機器と接続を確立し、マイクロフォン機器から伝送される対象車両中の各位置領域のオーディオデータを受信するようにしてもよい。マイクロフォン機器の数は通常、複数であり、異なる位置領域に対応する。例えば、各マイクロフォン機器は１つの位置領域に対応し、該位置領域のオーディオを収集することに用いられ、このとき、実行主体は各位置領域のマイクロフォン機器に基づいてオーディオデータを収集するようにしてもよい。また、実行主体は対象車両中の音声情報を直接収集し、音声情報を分析して、各位置領域に対応するオーディオデータを得るようにしてもよい。

ステップ２０２、各オーディオデータのオーディオパラメータに基づいて、各オーディオデータから目標オーディオデータを決定する。

本実施例では、オーディオパラメータはオーディオデータのオーディオ状態を記述するためのパラメータであり、オーディオデシベル、オーディオエネルギー、オーディオ振幅、及びオーディオチャネル等を含んでもよいが、これらに限定されず、本実施例ではこれを限定しない。実行主体は各オーディオデータのオーディオパラメータに基づいて、各オーディオデータから車載通話を行うための目標オーディオデータをスクリーニングするようにしてもよい。具体的には、実行主体は予め訓練されたオーディオ処理モデルに基づいて、各オーディオデータのオーディオパラメータを該オーディオ処理モデルに入力し、目標オーディオデータを得るようにしてもよい。オーディオ処理モデルは、訓練オーディオサンプルセット、及び訓練オーディオサンプルセット中の各訓練オーディオサンプルに対応するラベル情報を取得するステップであって、ラベル情報は通話オーディオ又は非通話オーディオを含むステップと、訓練オーディオサンプルセット及び訓練すべきニューラルネットワークモデルに基づいて、各訓練オーディオサンプルに対応する予測ラベルを得るステップと、予め設定された訓練収束条件を満たすまで、予測ラベル及び予め設定されたラベル情報に基づいて訓練すべきニューラルネットワークモデルのモデルパラメータを調整し、訓練済みのニューラルネットワークモデルを得るステップと、によって得られる。

本実施例のいくつかの選択可能な実現形態では、各オーディオデータのオーディオパラメータに基づいて、各オーディオデータから目標オーディオデータを決定するステップは、各オーディオデータのセマンティック情報を取得するステップと、各オーディオデータのオーディオパラメータ及びセマンティック情報に基づいて、各オーディオデータから目標オーディオデータを決定するステップと、を含む。

本実現形態では、実行主体はさらに各オーディオデータのセマンティック情報を取得してもよく、具体的には、音声認識技術によって、各オーディオデータに対応するセマンティック情報を決定してもよい。セマンティック情報はオーディオデータに対応するセマンティックコンテンツを記述することに用いられる。目標オーディオデータを決定する際に、オーディオパラメータ及びセマンティック情報の両方に基づいて目標オーディオデータを決定してもよい。例えば、各位置領域の乗員がいずれも話し合っている場合、車載通話を行う必要がある位置領域の乗員を認識し、互いに話し合う位置領域の乗員を認識し、ほかの様々な非車載通話シナリオで会話を行う乗員を認識する必要がある。実行主体は、まず、各オーディオデータのオーディオパラメータに基づいて、少なくとも１つの候補オーディオデータを決定し、次に、セマンティック情報に基づいて少なくとも１つの候補オーディオデータから目標オーディオデータを決定するようにしてもよい。選択可能に、車載通話を行うキーワードを予め設定するようにしてもよく、セマンティック情報から該キーワードが検出されると、該セマンティック情報に対応するオーディオデータを目標オーディオデータとして決定する。

ステップ２０３、目標オーディオデータに対応する目標位置領域を決定する。

本実施例では、各オーディオデータと位置領域は対応関係を有する。実行主体は目標オーディオデータを決定した後、さらに該目標オーディオデータに対応する目標位置領域を決定してもよい。各オーディオデータと位置領域との対応関係は、オーディオデータを収集するマイクロフォン機器と位置領域との対応関係に基づいて決定されてもよく、オーディオデータの音声測位情報と位置領域との対応関係に基づいて決定されてもよく、本実施例ではこれを限定しない。

ステップ２０４、目標位置領域のオーディオデータによって車載通話を行うように、目標位置領域に基づいて対象車両の車載通話パラメータを設定する。

本実施例では、車載通話パラメータは車載通話のオーディオ受信データを設定することに用いられる。目標位置領域に基づいて対象車両の車載通話パラメータを設定するステップは、対象車両中の車載通話を行うオーディオチャネルを目標位置領域に対応するオーディオチャネルとして設定するステップ、又は、対象車両中のすべてのオーディオデータを受信し、目標位置領域に対応するオーディオデータを除く各オーディオデータに対してノイズ低減処理を行い、ノイズ低減処理後のオーディオデータに基づいて音声を対象車両と車載通話を行う電子機器に送信するステップを含んでもよい。車載通話は車載音声通話であってもよく、車載ビデオ通話であってもよく、本実施例ではこれを限定しない。

選択可能に、目標位置領域のオーディオデータによって車載通話を行うように、目標位置領域に基づいて対象車両の車載通話パラメータを設定するステップは、対象車両中のマイクロフォン機器、カメラ機器と接続を確立するステップと、マイクロフォン機器が目標位置領域に対応する目標ユーザーが発する音声を収集し、カメラ機器が目標位置領域に対応する目標ユーザーに対応する画像を収集するように制御ステップと、該音声及び該画像に基づいて合成を行い、リアルタイム伝送情報フローを得るステップと、リアルタイム伝送情報フローを、車載通話を行う電子機器に伝送するステップと、を含んでもよい。さらに選択可能に、該電子機器からフィードバックされる通話データを受信することに応答して、該通話データに対応する画像通話データ及び音声通話データを決定し、目標位置領域に対応する表示機器が画像通話データを出力し、目標位置領域に対応する音響機器が音声通話データを出力するように制御する。

続いて、図３に参照されるように、本願に係る車載通話方法の１つの適用シナリオの模式図を示す。図３の適用シナリオでは、対象車両３０１中に座席Ａ、座席Ｂ、座席Ｃ及び座席Ｄが含まれ、座席Ａは第１位置領域に対応し、座席Ｂは第２位置領域に対応し、座席Ｃは第３位置領域に対応し、座席Ｄは第４位置領域に対応する。実行主体はそれぞれ第１位置領域の第１オーディオデータ、第２位置領域の第２オーディオデータ、第３位置領域の第３オーディオデータ及び第４位置領域の第４オーディオデータを取得するようにしてもよい。さらに、各オーディオデータのオーディオパラメータに基づいて、各オーディオデータから目標オーディオデータを決定する。目標オーディオデータが第１オーディオデータであるとすると、第１位置領域を目標位置領域として決定し、第１オーディオデータによって車載通話を行うように第１位置領域に基づいて対象車両３０１の車載通話パラメータを設定し、つまり、第１オーディオデータを対象車両３０１との車載通話を行っている端末機器３０２に伝送する。

本願の上記実施例に係る車載通話方法は、マルチオーディオゾーン技術を使用するスマートカーに適用でき、車両の各位置領域のオーディオデータのオーディオパラメータに基づいて、通話の意向が最も強い目標オーディオデータを決定し、目標オーディオデータに対応する目標位置領域に基づいて車載通話パラメータを設定し、目標位置領域のオーディオデータを車載通話の通話者とすることを実現する。このプロセスはオーディオパラメータに基づいて車載通話を行う位置領域を柔軟に決定し、対応して車載通話パラメータを設定することができ、ユーザーの要望に応じて通話位置を動的に切り替えることを実現し、車載通話の柔軟性を向上させる。

続いて、図４に参照されるように、本願に係る車載通話方法の別の実施例のプロセス４００を示す。図４に示すように、本実施例における車載通話方法は以下のステップを含んでもよい。

ステップ４０１、対象車両中の各位置領域に対して、該位置領域に対応するマイクロフォン機器を決定する。

本実施例では、対象車両中の各位置領域には、該位置領域におけるオーディオデータを収集するための少なくとも１つのマイクロフォン機器が対応してもよい。実行主体には、各位置領域と各マイクロフォン機器との対応関係が予め記憶されてもよい。

ステップ４０２、各位置領域に対応するマイクロフォン機器に基づいて、各位置領域のオーディオデータを取得する。

本実施例では、実行主体は各マイクロフォン機器と接続を確立し、各マイクロフォン機器から伝送される各位置領域のオーディオデータを受信するようにしてもよい。選択可能に、各位置領域のオーディオデータを取得する際に、初期収集したオーディオデータを処理し、オーディオデータ中の人間の声でない部分をフィルタリングし、フィルタリング後のオーディオデータを各位置領域のオーディオデータとするようにしてもよい。

ステップ４０３、各オーディオデータのオーディオエネルギーを決定する。

本実施例では、オーディオパラメータはオーディオエネルギーを含む。実行主体は各オーディオデータに対して、該オーディオデータ中の音声の周波数、振幅、及び音波速度を決定し、さらに音声の周波数、振幅、音波速度及び予め設定された媒体密度に基づいて、各オーディオデータに対応するオーディオエネルギーを計算するようにしてもよい。さらに又は、実行主体は予め設定されたオーディオエネルギー決定インターフェースを呼び出し、オーディオエネルギー決定インターフェースに基づいて、各オーディオデータのオーディオエネルギーを得るようにしてもよい。

ステップ４０４、オーディオエネルギーの降順で、各オーディオデータから目標オーディオデータを決定する。

本実施例では、実行主体はオーディオエネルギーが高いオーディオデータを目標オーディオデータとして選択してもよく、好ましくは、実行主体は各オーディオデータからオーディオエネルギーが最も高いオーディオデータを目標オーディオデータとして選択する。

本実施例のいくつかの選択可能な実現形態では、オーディオエネルギーの降順で、各オーディオデータから目標オーディオデータを決定するステップは、予め設定されたエネルギー閾値を取得するステップと、オーディオエネルギーの降順で、各オーディオデータからオーディオエネルギーが予め設定されたエネルギー閾値よりも大きいオーディオデータを目標オーディオデータとして選択するステップと、を含む。

本実現形態では、実行主体はさらにエネルギー閾値を予め設定してもよく、エネルギー閾値はオーディオエネルギーが低すぎるか否かを決定することに用いられ、それによりオーディオエネルギーが予め設定されたエネルギー閾値よりも大きいオーディオデータを目標オーディオデータとして選択する。具体的には、実行主体は、オーディオエネルギーの降順で、各オーディオデータからオーディオエネルギーが予め設定されたエネルギー閾値よりも大きいオーディオデータを選択してもよく、好ましくは、オーディオエネルギーが予め設定されたエネルギー閾値よりも大きく、且つオーディオエネルギーが最も高いオーディオデータを目標オーディオデータとする。選択可能に、少なくとも２つのオーディオデータのオーディオエネルギーが予め設定されたエネルギー閾値よりも大きく、且つオーディオエネルギーが同じであると決定することに応答して、該少なくとも２つのオーディオデータを候補オーディオデータとし、さらに各候補オーディオデータのセマンティック情報を取得し、セマンティック情報に対してセマンティック認識及びキーワードマッチングを行い、候補オーディオデータから予め設定された通話キーワードとの一致度が最も高いオーディオデータを、目標オーディオデータとして決定する。

ステップ４０５、目標オーディオデータに対応する目標位置領域を決定する。

本実施例では、ステップ４０５の詳細な説明について、ステップ２０３の詳細な説明を参照できるため、ここでは重複説明を省略する。

ステップ４０６、目標位置領域のオーディオデータによって車載通話を行うように、目標位置領域に基づいて対象車両の車載通話パラメータを設定する。

本実施例では、ステップ４０６の詳細な説明について、ステップ２０４の詳細な説明を参照できるため、ここでは重複説明を省略する。

ステップ４０７、対象車両中の各位置領域のオーディオ変化データを監視する。

本実施例では、実行主体は、オーディオ変化データをリアルタイムに検出してもよく、予め設定された検出周期でオーディオ変化データを定期的に検出してもよく、本実施例ではこれを限定しない。オーディオ変化データは、各位置領域のオーディオデータの変化状況を記述することに用いられ、例えば、オーディオエネルギー変化状況が挙げられ、具体的には、現在の時刻における変化後の各オーディオデータのオーディオエネルギーを含んでもよい。

ステップ４０８、オーディオ変化データに基づいて車載通話パラメータを更新する。

本実施例では、実行主体は、現在の時刻におけるオーディオエネルギーが最も大きいオーディオデータによって車載通話を行うように、オーディオ変化データに基づいて車載通話パラメータを更新する。例えば、過去の車載通話パラメータは、目標位置領域のオーディオデータによって車載通話を行うように設定されてもよく、今回、オーディオ変化データを監視するときに、目標位置領域のオーディオデータのオーディオエネルギーが最も大きいオーディオエネルギーではないと検出すると、オーディオ変化データに基づいて現在のオーディオエネルギーが最も大きいオーディオデータを、車載通話を行うオーディオデータとして設定する。

本願の上記実施例に係る車載通話方法はさらに、オーディオデータのオーディオエネルギーの順序に基づいて車載通話を行う目標オーディオデータを選択することができ、オーディオエネルギーに基づいてユーザーが車載通話を行う意図を決定することを実現し、車載通話パラメータの設定はより通話の要件に合致する。また、選択される目標オーディオデータのオーディオエネルギーは予め設定されたエネルギー閾値よりも大きくてもよいことで、オーディオエネルギーが低いため通話効果が悪いという現象が発生する確率を低下させ、さらに通話効果を向上させる。オーディオ変化データに応じて車載通話パラメータを更新できることで、通話オーディオの動的更新を実現する。さらにオーディオデータのセマンティック情報及びオーディオパラメータの両方と組み合わせて目標オーディオデータを決定できることで、目標オーディオデータの正確度を向上させる。

さらに図５に参照されるように、上記各図に示す方法の実現として、本願は車載通話装置の一実施例を提供し、該装置実施例は図２に示す方法実施例に対応し、該装置は具体的には様々なサーバ又は端末機器に適用できる。

図５に示すように、本実施例における車載通話装置５００は、オーディオ取得ユニット５０１、オーディオ決定ユニット５０２、領域決定ユニット５０３、及び設定ユニット５０４を備える。

オーディオ取得ユニット５０１は、対象車両中の各位置領域のオーディオデータを取得するように構成される。

オーディオ決定ユニット５０２は、各オーディオデータのオーディオパラメータに基づいて、各オーディオデータから目標オーディオデータを決定するように構成される。

領域決定ユニット５０３は、目標オーディオデータに対応する目標位置領域を決定するように構成される。

設定ユニット５０４は、目標位置領域のオーディオデータによって車載通話を行うように、目標位置領域に基づいて対象車両の車載通話パラメータを設定するように構成される。

本実施例のいくつかの選択可能な実現形態では、オーディオパラメータはオーディオエネルギーを含み、オーディオ決定ユニット５０２はさらに、各オーディオデータのオーディオエネルギーを決定し、オーディオエネルギーの降順で、各オーディオデータから目標オーディオデータを決定するように構成される。

本実施例のいくつかの選択可能な実現形態では、オーディオ決定ユニット５０２はさらに、予め設定されたエネルギー閾値を取得し、オーディオエネルギーの降順で、各オーディオデータからオーディオエネルギーが予め設定されたエネルギー閾値よりも大きいオーディオデータを目標オーディオデータとして選択するように構成される。

本実施例のいくつかの選択可能な実現形態では、オーディオ取得ユニット５０１はさらに、対象車両中の各位置領域に対して、該位置領域に対応するマイクロフォン機器を決定し、各位置領域に対応するマイクロフォン機器に基づいて、各位置領域のオーディオデータを取得するように構成される。

本実施例のいくつかの選択可能な実現形態では、設定ユニット５０４はさらに、対象車両中の各位置領域のオーディオ変化データを監視し、オーディオ変化データに基づいて車載通話パラメータを更新するように構成される。

本実施例のいくつかの選択可能な実現形態では、オーディオ決定ユニット５０２はさらに、各オーディオデータのセマンティック情報を取得し、各オーディオデータのオーディオパラメータ及びセマンティック情報に基づいて、各オーディオデータから目標オーディオデータを決定するように構成される。

理解できるように、車載通話装置５００用の上記ユニット５０１～ユニット５０４はそれぞれ図２で説明された方法の各ステップを対応して参照できる。従って、以上車載通話方法について説明された操作及び特徴は同様に装置５００及びそれに備えられるユニットに適用でき、ここでは重複説明を省略する。

本出願の実施例によれば、本開示は、電子機器、可読記憶媒体及びコンピュータプログラム製品を更に提供する。

図６は、本開示の実施例に係る車載通話方法を実行するための電子機器６００のブロック図である。電子機器は、例えば、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及びその他の適切なコンピュータなど、様々な形式のデジタルコンピュータを表すことを意図している。電子機器は、例えば、パーソナルデジタルアシスタント、セルラー電話、スマートフォン、ウェアラブル機器、及びその他の類似の計算装置など、様々な形式の移動装置を示してもよい。本明細書に示されている部材、それらの接続と関係、及びそれらの機能は単なる例であるが、本明細書の説明及び／又は要求される本開示の実現を制限することを意図はしない。

図６に示すように、機器６００は、読み取り専用（ＲＯＭ）６０２に記憶されたコンピュータプログラム又は記憶ユニット６０８からランダムアクセスメモリ（ＲＡＭ）６０３にロードされたコンピュータプログラムに従って、様々な適切な動作及び処理を実行することができる計算ユニット６０１を含む。ＲＡＭ６０３には、機器６００の操作に必要な様々なプログラム及びデータが記憶されてもよい。計算ユニット６０１、ＲＯＭ６０２及びＲＡＭ６０３は、バス６０４を介して互いに接続されている。入力／出力（Ｉ／Ｏ）インターフェース６０５もバス６０４に接続されている。

機器６００の複数の部材はＩ／Ｏインターフェース６０５に接続され、マウス、キーボード等の入力ユニット６０６、たとえば、様々なタイプのディスプレイ、スピーカー等の出力ユニット６０７、磁気ディスク、光ディスク等の記憶ユニット６０８、及びネットワークカード、モデム、無線通信トランシーバ等の通信ユニット６０９を含む。通信ユニット６０９は、機器６００が例えばインターネットのコンピュータネットワーク及び／又は各種の電信ネットワークを介して他の機器と情報／データを交換することを可能とする。

計算ユニット６０１は、処理能力及び計算能力を有する様々な汎用及び／又は専用の車載通話であってもよい。計算ユニット６０１のいくつかの例には、中央処理ユニット（ＣＰＵ）、グラフィック処理ユニット（ＧＰＵ）、様々な専用人工知能（ＡＩ）計算チップ、機械学習モデルアルゴリズムを実行する様々な計算ユニット、デジタル信号プロセッサ（ＤＳＰ）、及び任意の適切なプロセッサ、コントローラ、マイクロコントローラなどが含まれるが、これらに限定されるものではない。計算ユニット６０１は、上述した様々な方法及び処理、例えば、車載通話方法を実行する。例えば、いくつかの実施例では、車載通話方法は、記憶ユニット６０８などの機械読み取り可能な媒体に物理的に含まれるコンピュータソフトウェアプログラムとして実現されてもよい。いくつかの実施例では、コンピュータプログラムの一部又は全部を、ＲＯＭ６０２及び／又は通信ユニット６０９を介して機器６００にロード及び／又はインストールすることができる。コンピュータプログラムがＲＡＭ６０３にロードされ、計算ユニット６０１によって実行されると、上述した車載通話方法の１つ又は複数のステップを実行することができる。オプションとして、別の実施例では、計算ユニット６０１は、他の任意の適切な方式で（例えば、ファームウェアによって）、車載通話方法を実行するように構成されてもよい。

本明細書に記載のシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）、特定用途向け標準製品（ＡＳＳＰ）、システムオンチップシステム（ＳＯＣ）、ロードプログラマブルロジック機器（ＣＰＬＤ）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／又はそれらの組み合わせにおいて実現することができる。これらの様々な実施形態は、１つ又は複数のコンピュータプログラムにおいて実施され、この１つ又は複数のコンピュータプログラムは、少なくとも１つのプログラム可能なプロセッサを含むプログラム可能なシステムで実行及び／又は解釈され得、このプログラム可能なプロセッサは専用又は汎用のプログラム可能なプロセッサであってもよく、ストレージシステム、少なくとも１つの入力装置、及び少なくとも１つの出力装置からデータ及び命令を受信し、データ及び命令をこのストレージシステム、この少なくとも１つの入力装置、及びこの少なくとも１つの出力装置に送信することができる。

本開示の方法を実施するためのプログラムコードは１つ又は複数のプログラミング言語の任意の組み合わせで作成することができる。これらのプログラムコードは汎用コンピュータ、専用コンピュータ又は他のプログラム可能なデータ処理装置のプロセッサ又はコントローラに提供することができ、それによりプログラムコードはプロセッサ又はコントローラにより実行されると、フローチャート及び／又はブロック図に規定された機能／動作が実施される。プログラムコードは機械で完全に実行されてもよく、部分的に機械で実行されてもよく、独立したソフトウェアパッケージとして一部が機械で実行されかつ一部が遠隔機械で実行されるか、又は完全に遠隔機械又はサーバで実行されてもよい。

本開示の文脈において、機械読み取り可能な媒体はプログラムを含む又は記憶した有形媒体であってもよく、このプログラムは、命令実行システム、装置又は機器により使用されるか、又はそれらと組み合わせて使用されてもよい。機械読み取り可能な媒体は、機械読み取り可能な信号媒体又は機械読み取り可能な記憶媒体であってもよい。機械読み取り可能な媒体は、例えば電子的、磁気的、光学的、電磁的、赤外線、又は半導体のシステム、装置又は機器、又は以上の任意の組み合わせを含むことができるが、これらに限られない。機械読み取り可能な記憶媒体のより具体的な例は、１つ又は複数のワイヤによる電気接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、消去可能プログラム可読み取り専用メモリ（ＥＰＲＯＭ又はフラッシュメモリ）、光ファイバ、ポータブルコンパクトディスク読み取り専用メモリ（ＣＤ－ＲＯＭ）、光記憶機器、磁気記憶機器、又は上記の任意の適切な組み合わせを含む。

ユーザと対話できるように、ここで記載されるシステム及び技術をコンピュータに実施することができ、このコンピュータは、ユーザに情報を表示するための表示装置（例えば、ＣＲＴ（陰極線管）又はＬＣＤ（液晶ディスプレイ）モニター）、ユーザがコンピュータに入力することを可能とするキーボード及びポインティング装置（例えば、マウスやトラックボール）を有する。他の種類の装置も、ユーザとの対話を提供することができ、例えば、ユーザに提供するフィードバックは、任意の形式の感覚フィードバック（例えば、視覚的フィードバック、聴覚的フィードバック、又は触覚的フィードバック）であってもよく、そして、ユーザからの入力は、任意の形式（音響入力、音声入力、又は触覚入力を含む）で受信できる。

ここで記載されるシステム及び技術は、バックエンドコンポーネントを含むコンピューティングシステム（例えば、データサーバとして）、又はミドルウェアコンポーネントを含むコンピューティングシステム（例えば、アプリケーションサーバ）、又はフロントエンドコンポーネントを含むコンピューティングシステム（例えば、グラフィカルユーザインターフェース又はネットワークブラウザーを備えたユーザコンピュータが挙げられ、ユーザはこのグラフィカルユーザインターフェース又はこのネットワークブラウザーを介してここで記載されるシステム及び技術の実施形態と対話できる）、又はこのようなバックエンドコンポーネント、ミドルウェアコンポーネント、又はフロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムにおいて実施できる。システムのコンポーネントは、任意の形式又は媒体のデジタルデータ通信（例えば、通信ネットワーク）を介して相互に接続できる。通信ネットワークの例には、ローカルエリアネットワーク（ＬＡＮ）、ワイドエリアネットワーク（ＷＡＮ）、及びインターネットが含まれる。

コンピュータシステムには、クライアントとサーバを含むことができる。クライアントとサーバは通常、互いに遠く離れており、通信ネットワークを介してインタラクションする。クライアントとサーバの関係は、対応するコンピュータで実行され互いにクライアント－サーバの関係を持つコンピュータプログラムによって生成される。

なお、上記の様々な形式のプロセスを用いて、ステップを改めて並べ替えたり、追加したり、削除したりすることができる。例えば、本開示に記載の各ステップは、本開示で開示された技術案の所望の結果が達成できる限り、並行して実施しても、順次実施しても、異なる順次で実施してもよく、本明細書ではそれについて限定しない。

上記の具体的な実施形態は、本開示の保護範囲を制限するものではない。当業者にとって自明なように、設計要件及び他の要因に従って様々な修正、組み合わせ、サブコンビネーション及び置換を行うことができる。本開示の精神及び原則の範囲内で行われた修正、同等の置き換え及び改善等は、本開示の保護範囲に含まれるものとする。

Claims

車載通話方法であって、
対象車両中の各位置領域のオーディオデータを取得するステップと、
各オーディオデータのオーディオパラメータに基づいて、各オーディオデータから目標オーディオデータを決定するステップと、
前記目標オーディオデータに対応する目標位置領域を決定するステップと、
前記目標位置領域のオーディオデータによって車載通話を行うように、前記目標位置領域に基づいて前記対象車両の車載通話パラメータを設定するステップと、を含む車載通話方法。
オーディオパラメータはオーディオエネルギーを含み、
前記各オーディオデータのオーディオパラメータに基づいて、各オーディオデータから目標オーディオデータを決定する前記ステップは、
各オーディオデータのオーディオエネルギーを決定するステップと、
前記オーディオエネルギーの降順で、各オーディオデータから前記目標オーディオデータを決定するステップと、を含む請求項１に記載の方法。
前記オーディオエネルギーの降順で、各オーディオデータから前記目標オーディオデータを決定する前記ステップは、
予め設定されたエネルギー閾値を取得するステップと、
前記オーディオエネルギーの降順で、各オーディオデータからオーディオエネルギーが前記予め設定されたエネルギー閾値よりも大きいオーディオデータを、前記目標オーディオデータとして選択するステップと、を含む請求項２に記載の方法。
対象車両中の各位置領域のオーディオデータを取得する前記ステップは、
前記対象車両中の各位置領域に対して、該位置領域に対応するマイクロフォン機器を決定するステップと、
各位置領域に対応するマイクロフォン機器に基づいて、各位置領域のオーディオデータを取得するステップと、を含む請求項１に記載の方法。
前記対象車両中の各位置領域のオーディオ変化データを監視するステップと、
前記オーディオ変化データに基づいて前記車載通話パラメータを更新するステップと、をさらに含む請求項１に記載の方法。
各オーディオデータのオーディオパラメータに基づいて、各オーディオデータから目標オーディオデータを決定する前記ステップは、
各オーディオデータのセマンティック情報を取得するステップと、
各オーディオデータのオーディオパラメータ及びセマンティック情報に基づいて、各オーディオデータから前記目標オーディオデータを決定するステップと、を含む請求項１に記載の方法。
車載通話装置であって、
対象車両中の各位置領域のオーディオデータを取得するように構成されるオーディオ取得ユニットと、
各オーディオデータのオーディオパラメータに基づいて、各オーディオデータから目標オーディオデータを決定するように構成されるオーディオ決定ユニットと、
前記目標オーディオデータに対応する目標位置領域を決定するように構成される領域決定ユニットと、
前記目標位置領域のオーディオデータによって車載通話を行うように、前記目標位置領域に基づいて前記対象車両の車載通話パラメータを設定するように構成される設定ユニットと、を備える車載通話装置。
前記オーディオパラメータはオーディオエネルギーを含み、
前記オーディオ決定ユニットはさらに、
各オーディオデータのオーディオエネルギーを決定し、
前記オーディオエネルギーの降順で、各オーディオデータから前記目標オーディオデータを決定するように構成される請求項７に記載の装置。
前記オーディオ決定ユニットはさらに、
予め設定されたエネルギー閾値を取得し、
前記オーディオエネルギーの降順で、各オーディオデータからオーディオエネルギーが前記予め設定されたエネルギー閾値よりも大きいオーディオデータを、前記目標オーディオデータとして選択するように構成される請求項８に記載の装置。
前記オーディオ取得ユニットはさらに、
前記対象車両中の各位置領域に対して、該位置領域に対応するマイクロフォン機器を決定し、
各位置領域に対応するマイクロフォン機器に基づいて、各位置領域のオーディオデータを取得するように構成される請求項７に記載の装置。
前記設定ユニットはさらに、
前記対象車両中の各位置領域のオーディオ変化データを監視し、
前記オーディオ変化データに基づいて前記車載通話パラメータを更新するように構成される請求項７に記載の装置。
前記オーディオ決定ユニットはさらに、
各オーディオデータのセマンティック情報を取得し、
各オーディオデータのオーディオパラメータ及びセマンティック情報に基づいて、各オーディオデータから前記目標オーディオデータを決定するように構成される請求項７に記載の装置。
車載通話方法を実行する電子機器であって、
少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサと通信可能に接続されるメモリと、を備え、
前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶され、前記命令が前記少なくとも１つのプロセッサによって実行されると、前記少なくとも１つのプロセッサが請求項１－６のいずれか一項に記載の方法を実行できる電子機器。
前記コンピュータに請求項１－６のいずれか一項に記載の方法を実行させるためのコンピュータ命令が記憶される非一時的コンピュータ可読記憶媒体。
プロセッサによって実行されると請求項１－６のいずれか一項に記載の方法を実現するコンピュータプログラム。