JP2022116285A - 車両に対する音声処理方法、装置、電子機器、記憶媒体及びコンピュータプログラム - Google Patents
車両に対する音声処理方法、装置、電子機器、記憶媒体及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2022116285A JP2022116285A JP2022090504A JP2022090504A JP2022116285A JP 2022116285 A JP2022116285 A JP 2022116285A JP 2022090504 A JP2022090504 A JP 2022090504A JP 2022090504 A JP2022090504 A JP 2022090504A JP 2022116285 A JP2022116285 A JP 2022116285A
- Authority
- JP
- Japan
- Prior art keywords
- data
- sub
- audio
- voice
- vehicle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 30
- 238000004590 computer program Methods 0.000 title claims abstract description 15
- 238000012545 processing Methods 0.000 claims abstract description 45
- 238000000034 method Methods 0.000 claims abstract description 37
- 230000004044 response Effects 0.000 claims abstract description 22
- 238000000926 separation method Methods 0.000 claims description 17
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60R—VEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
- B60R16/00—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
- B60R16/02—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
- B60R16/037—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
- B60R16/0373—Voice control
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D41/00—Electrical control of supply of combustible mixture or its constituents
- F02D41/02—Circuit arrangements for generating control signals
- F02D41/021—Introducing corrections for particular conditions exterior to the engine
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D2200/00—Input parameters for engine control
- F02D2200/60—Input parameters for engine control said parameters being related to the driver demands or status
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mechanical Engineering (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Chemical & Material Sciences (AREA)
- Combustion & Propulsion (AREA)
- General Engineering & Computer Science (AREA)
- Traffic Control Systems (AREA)
- Navigation (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
Abstract
Description
車両内部における複数の領域からの初期音声データを受信したことに応じて、前記初期音声データを分離処理して、前記複数の領域と一対一で対応する複数の音声サブデータと、複数の領域のうち前記音声サブデータに対応する領域を示す、各音声サブデータに対する説明情報とを取得することと、
前記複数の音声サブデータに基づいて、前記車両の音声動作モードを特定することとを含む。
第1態様の音声処理方法において、
前記複数の音声サブデータに基づいて、前記車両の音声動作モードを特定することは、
前記複数の音声サブデータをそれぞれ音声認識して、前記複数の音声サブデータと一対一で対応する複数の音声認識結果を取得することと、
前記複数の音声認識結果に基づいて、前記車両の音声動作モードを特定することとを含む。
第2態様の音声処理方法において、
前記複数の領域は、運転席領域と助手席領域とを含み、前記複数の音声サブデータは、第1の音声サブデータと第2の音声サブデータとを含み、第1の音声サブデータに対する説明情報は、前記第1の音声サブデータが前記運転席領域に由来することを示し、第2の音声サブデータに対する説明情報は、前記第2の音声サブデータが前記助手席領域に由来することを示し、
前記複数の音声認識結果に基づいて、前記車両の音声動作モードを特定することは、
前記第1の音声サブデータに対応する音声認識結果に第1のウェイクアップコンテンツが含まれることに応じて、前記車両の音声動作モードを第1の音声動作モードとして特定することと、
前記第2の音声サブデータに対応する音声認識結果に第2のウェイクアップコンテンツが含まれることに応じて、前記車両の音声動作モードを第2の音声動作モードとして特定することとの少なくとも1つを含む。
第3態様の音声処理方法において、
前記車両を第1の音声動作モードに基づいて操作を実行するように制御することをさらに含み、
前記車両を第1の音声動作モードに基づいて操作を実行するように制御することは、
受信した第1の目標音声データから、前記運転席領域からの第3の音声サブデータを抽出することと、
前記第3の音声サブデータを音声認識して、前記運転席領域に関連する第1の操作コマンドを取得することと、
前記第1の操作コマンドに基づいて操作を実行することとを含む。
第3態様の音声処理方法において、
前記車両を第2の音声動作モードに基づいて操作を実行するように制御することをさらに含み、
前記車両を第2の音声動作モードに基づいて操作を実行するように制御することは、
受信した第2の目標音声データから、前記助手席領域からの第4の音声サブデータを抽出することと、
前記第4の音声サブデータを音声認識して、前記助手席領域に関連する第2の操作コマンドを取得することと、
前記第2の操作コマンドに基づいて操作を実行することとを含む。
第3態様の音声処理方法において、
前記車両は、メインウェイクアップエンジンとサブウェイクアップエンジンとを含み、
前記複数の音声サブデータをそれぞれ音声認識して、複数の音声認識結果を取得することは、
前記メインウェイクアップエンジンを利用して前記第1の音声サブデータを認識して、前記第1の音声サブデータに対する音声認識結果を取得することと、
前記サブウェイクアップエンジンを利用して前記第2の音声サブデータを認識して、前記第2の音声サブデータに対する音声認識結果を取得することとを含む。
第1態様から第6態様のいずれか1つの音声処理方法において、
前記音声データを分離処理することは、
ブラインドソース分離アルゴリズムで前記初期音声データを分離処理することを含む。
車両内部における複数の領域からの初期音声データを受信したことに応じて、前記初期音声データを分離処理して、前記複数の領域と一対一で対応する複数の音声サブデータと、複数の領域のうち前記音声サブデータに対応する領域を示す、各音声サブデータに対する説明情報とを取得するための処理モジュールと、
前記複数の音声サブデータに基づいて、前記車両の音声動作モードを特定するための特定モジュールとを含む。
第8態様の音声処理装置において、
前記特定モジュールは、
前記複数の音声サブデータをそれぞれ音声認識して、前記複数の音声サブデータと一対一で対応する複数の音声認識結果を取得するための第1の認識サブモジュールと、
前記複数の音声認識結果に基づいて、前記車両の音声動作モードを特定するための特定サブモジュールとを含む。
第9態様の音声処理装置において、
前記複数の領域は、運転席領域と助手席領域とを含み、前記複数の音声サブデータは、第1の音声サブデータと第2の音声サブデータとを含み、第1の音声サブデータに対する説明情報は、前記第1の音声サブデータが前記運転席領域に由来することを示し、第2の音声サブデータに対する説明情報は、前記第2の音声サブデータが前記助手席領域に由来することを示し、
前記特定サブモジュールは、
前記第1の音声サブデータに対応する音声認識結果に第1のウェイクアップコンテンツが含まれることに応じて、前記車両の音声動作モードを第1の音声動作モードとして特定するための第1の特定手段と、
前記第2の音声サブデータに対応する音声認識結果に第2のウェイクアップコンテンツが含まれることに応じて、前記車両の音声動作モードを第2の音声動作モードとして特定するための第2の特定手段との少なくとも1つを含む。
第10態様の音声処理装置において、
前記車両を第1の音声動作モードに基づいて操作を実行するように制御するための第1の制御モジュールをさらに含み、
前記第1の制御モジュールは、
受信した第1の目標音声データから、前記運転席領域からの第3の音声サブデータを抽出するための第1の抽出サブモジュールと、
前記第3の音声サブデータを音声認識して、前記運転席領域に関連する第1の操作コマンドを取得するための第2の認識サブモジュールと、
前記第1の操作コマンドに基づいて操作を実行するための第1の実行サブモジュールとを含む。
第10態様の音声処理装置において、
前記車両を第2の音声動作モードに基づいて操作を実行するように制御するための第2の制御モジュールをさらに含み、
前記第2の制御モジュールは、
受信した第2の目標音声データから、前記助手席領域からの第4の音声サブデータを抽出するための第2の抽出サブモジュールと、
前記第4の音声サブデータを音声認識して、前記助手席領域に関連する第2の操作コマンドを取得するための第3の認識サブモジュールと、
前記第2の操作コマンドに基づいて操作を実行するための第2の実行サブモジュールとを含む。
第10態様の音声処理装置において、
前記車両は、メインウェイクアップエンジンとサブウェイクアップエンジンとを含み、
前記第1の認識サブモジュールは、
前記メインウェイクアップエンジンを利用して前記第1の音声サブデータを認識して、前記第1の音声サブデータに対する音声認識結果を取得するための第1の認識手段と、
前記サブウェイクアップエンジンを利用して前記第2の音声サブデータを認識して、前記第2の音声サブデータに対する音声認識結果を取得するための第2の認識手段とを含む。
第8態様から第13態様のいずれか1つの音声処理装置において、
前記処理モジュールは、さらに、
ブラインドソース分離アルゴリズムで前記初期音声データを分離処理するために用いられる。
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信接続されたメモリとを備え、
前記メモリには、前記少なくとも1つのプロセッサにより実行可能な命令を記憶しており、
前記命令は、前記少なくとも1つのプロセッサが第1態様から第7態様のいずれか1つに記載の方法を実行することができるように、前記少なくとも1つのプロセッサにより実行される。
コンピュータ命令が記憶された非一時的なコンピュータ読取可能な記憶媒体であって、
前記コンピュータ命令は、コンピュータに第1態様から第7態様のいずれか1つに記載の方法を実行させる。
プロセッサにより実行された場合に、第1態様から第7態様のいずれか1つに記載の方法を実現する。
Claims (17)
- 車両内部における複数の領域からの初期音声データを受信したことに応じて、前記初期音声データを分離処理して、前記複数の領域と一対一で対応する複数の音声サブデータと、複数の領域のうち前記音声サブデータに対応する領域を示す、各音声サブデータに対する説明情報とを取得することと、
前記複数の音声サブデータに基づいて、前記車両の音声動作モードを特定することとを含む、
車両に対する音声処理方法。 - 前記複数の音声サブデータに基づいて、前記車両の音声動作モードを特定することは、
前記複数の音声サブデータをそれぞれ音声認識して、前記複数の音声サブデータと一対一で対応する複数の音声認識結果を取得することと、
前記複数の音声認識結果に基づいて、前記車両の音声動作モードを特定することとを含む、
請求項1に記載の方法。 - 前記複数の領域は、運転席領域と助手席領域とを含み、前記複数の音声サブデータは、第1の音声サブデータと第2の音声サブデータとを含み、第1の音声サブデータに対する説明情報は、前記第1の音声サブデータが前記運転席領域に由来することを示し、第2の音声サブデータに対する説明情報は、前記第2の音声サブデータが前記助手席領域に由来することを示し、
前記複数の音声認識結果に基づいて、前記車両の音声動作モードを特定することは、
前記第1の音声サブデータに対応する音声認識結果に第1のウェイクアップコンテンツが含まれることに応じて、前記車両の音声動作モードを第1の音声動作モードとして特定することと、
前記第2の音声サブデータに対応する音声認識結果に第2のウェイクアップコンテンツが含まれることに応じて、前記車両の音声動作モードを第2の音声動作モードとして特定することとの少なくとも1つを含む、
請求項2に記載の方法。 - 前記車両を第1の音声動作モードに基づいて操作を実行するように制御することをさらに含み、
前記車両を第1の音声動作モードに基づいて操作を実行するように制御することは、
受信した第1の目標音声データから、前記運転席領域からの第3の音声サブデータを抽出することと、
前記第3の音声サブデータを音声認識して、前記運転席領域に関連する第1の操作コマンドを取得することと、
前記第1の操作コマンドに基づいて操作を実行することとを含む、
請求項3に記載の方法。 - 前記車両を第2の音声動作モードに基づいて操作を実行するように制御することをさらに含み、
前記車両を第2の音声動作モードに基づいて操作を実行するように制御することは、
受信した第2の目標音声データから、前記助手席領域からの第4の音声サブデータを抽出することと、
前記第4の音声サブデータを音声認識して、前記助手席領域に関連する第2の操作コマンドを取得することと、
前記第2の操作コマンドに基づいて操作を実行することとを含む、
請求項3に記載の方法。 - 前記車両は、メインウェイクアップエンジンとサブウェイクアップエンジンとを含み、
前記複数の音声サブデータをそれぞれ音声認識して、複数の音声認識結果を取得することは、
前記メインウェイクアップエンジンを利用して前記第1の音声サブデータを認識して、前記第1の音声サブデータに対する音声認識結果を取得することと、
前記サブウェイクアップエンジンを利用して前記第2の音声サブデータを認識して、前記第2の音声サブデータに対する音声認識結果を取得することとを含む
請求項3に記載の方法。 - 前記音声データを分離処理することは、
ブラインドソース分離アルゴリズムで前記初期音声データを分離処理することを含む、
請求項1に記載の方法。 - 車両内部における複数の領域からの初期音声データを受信したことに応じて、前記初期音声データを分離処理して、前記複数の領域と一対一で対応する複数の音声サブデータと、複数の領域のうち前記音声サブデータに対応する領域を示す、各音声サブデータに対する説明情報とを取得するための処理モジュールと、
前記複数の音声サブデータに基づいて、前記車両の音声動作モードを特定するための特定モジュールとを含む、
車両に対する音声処理装置。 - 前記特定モジュールは、
前記複数の音声サブデータをそれぞれ音声認識して、前記複数の音声サブデータと一対一で対応する複数の音声認識結果を取得するための第1の認識サブモジュールと、
前記複数の音声認識結果に基づいて、前記車両の音声動作モードを特定するための特定サブモジュールとを含む、
請求項8に記載の装置。 - 前記複数の領域は、運転席領域と助手席領域とを含み、前記複数の音声サブデータは、第1の音声サブデータと第2の音声サブデータとを含み、第1の音声サブデータに対する説明情報は、前記第1の音声サブデータが前記運転席領域に由来することを示し、第2の音声サブデータに対する説明情報は、前記第2の音声サブデータが前記助手席領域に由来することを示し、
前記特定サブモジュールは、
前記第1の音声サブデータに対応する音声認識結果に第1のウェイクアップコンテンツが含まれることに応じて、前記車両の音声動作モードを第1の音声動作モードとして特定するための第1の特定手段と、
前記第2の音声サブデータに対応する音声認識結果に第2のウェイクアップコンテンツが含まれることに応じて、前記車両の音声動作モードを第2の音声動作モードとして特定するための第2の特定手段との少なくとも1つを含む、
請求項9に記載の装置。 - 前記車両を第1の音声動作モードに基づいて操作を実行するように制御するための第1の制御モジュールをさらに含み、
前記第1の制御モジュールは、
受信した第1の目標音声データから、前記運転席領域からの第3の音声サブデータを抽出するための第1の抽出サブモジュールと、
前記第3の音声サブデータを音声認識して、前記運転席領域に関連する第1の操作コマンドを取得するための第2の認識サブモジュールと、
前記第1の操作コマンドに基づいて操作を実行するための第1の実行サブモジュールとを含む、
請求項10に記載の装置。 - 前記車両を第2の音声動作モードに基づいて操作を実行するように制御するための第2の制御モジュールをさらに含み、
前記第2の制御モジュールは、
受信した第2の目標音声データから、前記助手席領域からの第4の音声サブデータを抽出するための第2の抽出サブモジュールと、
前記第4の音声サブデータを音声認識して、前記助手席領域に関連する第2の操作コマンドを取得するための第3の認識サブモジュールと、
前記第2の操作コマンドに基づいて操作を実行するための第2の実行サブモジュールとを含む、
請求項10に記載の装置。 - 前記車両は、メインウェイクアップエンジンとサブウェイクアップエンジンとを含み、
前記第1の認識サブモジュールは、
前記メインウェイクアップエンジンを利用して前記第1の音声サブデータを認識して、前記第1の音声サブデータに対する音声認識結果を取得するための第1の認識手段と、
前記サブウェイクアップエンジンを利用して前記第2の音声サブデータを認識して、前記第2の音声サブデータに対する音声認識結果を取得するための第2の認識手段とを含む、
請求項10に記載の装置。 - 前記処理モジュールは、さらに、
ブラインドソース分離アルゴリズムで前記初期音声データを分離処理するために用いられる、
請求項8~13のいずれか一項に記載の装置。 - 少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信接続されたメモリとを備え、
前記メモリには、前記少なくとも1つのプロセッサにより実行可能な命令を記憶しており、
前記命令は、前記少なくとも1つのプロセッサが請求項1~7のいずれか一項に記載の方法を実行することができるように、前記少なくとも1つのプロセッサにより実行される電子機器。 - コンピュータ命令が記憶された非一時的なコンピュータ読取可能な記憶媒体であって、
前記コンピュータ命令は、コンピュータに請求項1~7のいずれか一項に記載の方法を実行させる記憶媒体。 - プロセッサにより実行された場合に、請求項1~7のいずれか一項に記載の方法を実現するコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110621889.5A CN113327608B (zh) | 2021-06-03 | 2021-06-03 | 针对车辆的语音处理方法、装置、电子设备和介质 |
CN202110621889.5 | 2021-06-03 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022116285A true JP2022116285A (ja) | 2022-08-09 |
JP7383761B2 JP7383761B2 (ja) | 2023-11-20 |
Family
ID=77419608
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022090504A Active JP7383761B2 (ja) | 2021-06-03 | 2022-06-02 | 車両に対する音声処理方法、装置、電子機器、記憶媒体及びコンピュータプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220293103A1 (ja) |
EP (1) | EP4030424B1 (ja) |
JP (1) | JP7383761B2 (ja) |
KR (1) | KR20220082789A (ja) |
CN (1) | CN113327608B (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7186375B2 (ja) * | 2018-03-29 | 2022-12-09 | パナソニックIpマネジメント株式会社 | 音声処理装置、音声処理方法および音声処理システム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006082764A1 (en) * | 2005-02-01 | 2006-08-10 | Matsushita Electric Industrial Co., Ltd. | Method and system for controlling a vehicle using voice commands |
JP2009020423A (ja) * | 2007-07-13 | 2009-01-29 | Fujitsu Ten Ltd | 音声認識装置および音声認識方法 |
JP2017009701A (ja) * | 2015-06-18 | 2017-01-12 | 本田技研工業株式会社 | 音声認識装置、および音声認識方法 |
WO2020079733A1 (ja) * | 2018-10-15 | 2020-04-23 | 三菱電機株式会社 | 音声認識装置、音声認識システム、及び音声認識方法 |
WO2020240789A1 (ja) * | 2019-05-30 | 2020-12-03 | 三菱電機株式会社 | 音声対話制御装置及び音声対話制御方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109509465B (zh) * | 2017-09-15 | 2023-07-25 | 阿里巴巴集团控股有限公司 | 语音信号的处理方法、组件、设备及介质 |
US20190237067A1 (en) * | 2018-01-31 | 2019-08-01 | Toyota Motor Engineering & Manufacturing North America, Inc. | Multi-channel voice recognition for a vehicle environment |
CN109841214B (zh) * | 2018-12-25 | 2021-06-01 | 百度在线网络技术(北京)有限公司 | 语音唤醒处理方法、装置和存储介质 |
US10917717B2 (en) * | 2019-05-30 | 2021-02-09 | Nuance Communications, Inc. | Multi-channel microphone signal gain equalization based on evaluation of cross talk components |
US11170790B2 (en) * | 2019-06-27 | 2021-11-09 | Bose Corporation | User authentication with audio reply |
CN110648663A (zh) * | 2019-09-26 | 2020-01-03 | 科大讯飞(苏州)科技有限公司 | 车载音频管理方法、装置、设备、汽车及可读存储介质 |
CN111402877B (zh) * | 2020-03-17 | 2023-08-11 | 阿波罗智联(北京)科技有限公司 | 基于车载多音区的降噪方法、装置、设备和介质 |
CN111599357A (zh) * | 2020-04-07 | 2020-08-28 | 宁波吉利汽车研究开发有限公司 | 一种车内多音区拾音方法、装置、电子设备及存储介质 |
CN112017659A (zh) * | 2020-09-01 | 2020-12-01 | 北京百度网讯科技有限公司 | 多音区语音信号的处理方法、装置、设备以及存储介质 |
-
2021
- 2021-06-03 CN CN202110621889.5A patent/CN113327608B/zh active Active
-
2022
- 2022-05-31 EP EP22176533.2A patent/EP4030424B1/en active Active
- 2022-05-31 KR KR1020220067069A patent/KR20220082789A/ko unknown
- 2022-06-02 US US17/831,052 patent/US20220293103A1/en not_active Abandoned
- 2022-06-02 JP JP2022090504A patent/JP7383761B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006082764A1 (en) * | 2005-02-01 | 2006-08-10 | Matsushita Electric Industrial Co., Ltd. | Method and system for controlling a vehicle using voice commands |
JP2009020423A (ja) * | 2007-07-13 | 2009-01-29 | Fujitsu Ten Ltd | 音声認識装置および音声認識方法 |
JP2017009701A (ja) * | 2015-06-18 | 2017-01-12 | 本田技研工業株式会社 | 音声認識装置、および音声認識方法 |
WO2020079733A1 (ja) * | 2018-10-15 | 2020-04-23 | 三菱電機株式会社 | 音声認識装置、音声認識システム、及び音声認識方法 |
WO2020240789A1 (ja) * | 2019-05-30 | 2020-12-03 | 三菱電機株式会社 | 音声対話制御装置及び音声対話制御方法 |
Also Published As
Publication number | Publication date |
---|---|
EP4030424B1 (en) | 2024-02-07 |
KR20220082789A (ko) | 2022-06-17 |
CN113327608A (zh) | 2021-08-31 |
JP7383761B2 (ja) | 2023-11-20 |
CN113327608B (zh) | 2022-12-09 |
EP4030424A2 (en) | 2022-07-20 |
EP4030424A3 (en) | 2022-11-02 |
US20220293103A1 (en) | 2022-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6683234B2 (ja) | 音声データ処理方法、装置、設備及びプログラム | |
JP7213943B2 (ja) | 車載機器の音声処理方法、装置、機器及び記憶媒体 | |
JP2016520879A (ja) | 地方なまりを区別する音声データ認識方法、装置及びサーバ | |
CN113674742B (zh) | 人机交互方法、装置、设备以及存储介质 | |
CN107943834B (zh) | 人机对话的实现方法、装置、设备及存储介质 | |
CN107240396B (zh) | 说话人自适应方法、装置、设备及存储介质 | |
JP2022120020A (ja) | マルチサウンドゾーン音声ウェイクアップ・認識方法及び装置、電子機器、記憶媒体、コンピュータプログラム | |
CN113674746B (zh) | 人机交互方法、装置、设备以及存储介质 | |
CN113053368A (zh) | 语音增强方法、电子设备和存储介质 | |
JP7383761B2 (ja) | 車両に対する音声処理方法、装置、電子機器、記憶媒体及びコンピュータプログラム | |
KR102599948B1 (ko) | 전자 장치 및 그의 와이파이 연결 방법 | |
CN113658586A (zh) | 语音识别模型的训练方法、语音交互方法及装置 | |
JP7352680B2 (ja) | 指令実行方法、装置、電子機器、記憶媒体およびコンピュータプログラム | |
CN114399992B (zh) | 语音指令响应方法、装置及存储介质 | |
JP2024537258A (ja) | 音声ウェイクアップ方法、装置、電子機器、記憶媒体及びコンピュータプログラム | |
CN112669839B (zh) | 语音交互方法、装置、设备及存储介质 | |
CN114220430A (zh) | 多音区语音交互方法、装置、设备以及存储介质 | |
CN114882879A (zh) | 音频降噪方法、确定映射信息的方法、装置及电子设备 | |
CN113744726A (zh) | 语音识别方法、装置、电子设备和存储介质 | |
CN114119972A (zh) | 模型获取及对象处理方法、装置、电子设备及存储介质 | |
CN115312042A (zh) | 用于处理音频的方法、装置、设备以及存储介质 | |
CN109036379B (zh) | 语音识别方法、设备及存储介质 | |
US20220343400A1 (en) | Method and apparatus for providing state information of taxi service order, and storage medium | |
EP4123639A2 (en) | Wake-up control for a speech controlled device | |
CN114495923A (zh) | 智能控制系统实现方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220602 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230419 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230509 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230804 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231031 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231108 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7383761 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |