JP7258083B2 - 車両ベースの音声処理方法、音声プロセッサ、車載プロセッサ - Google Patents
車両ベースの音声処理方法、音声プロセッサ、車載プロセッサ Download PDFInfo
- Publication number
- JP7258083B2 JP7258083B2 JP2021111578A JP2021111578A JP7258083B2 JP 7258083 B2 JP7258083 B2 JP 7258083B2 JP 2021111578 A JP2021111578 A JP 2021111578A JP 2021111578 A JP2021111578 A JP 2021111578A JP 7258083 B2 JP7258083 B2 JP 7258083B2
- Authority
- JP
- Japan
- Prior art keywords
- audio
- channel
- processor
- sound zone
- transmitting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims description 84
- 230000005236 sound signal Effects 0.000 claims description 99
- 238000012545 processing Methods 0.000 claims description 53
- 238000000034 method Methods 0.000 claims description 42
- 230000009977 dual effect Effects 0.000 claims description 33
- 238000013507 mapping Methods 0.000 claims description 31
- 230000008569 process Effects 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 11
- 230000005540 biological transmission Effects 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 28
- 238000004891 communication Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 230000009467 reduction Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 5
- 230000003993 interaction Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 241001074085 Scophthalmus aquosus Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W50/00—Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
- B60W50/08—Interaction between the driver and the control system
- B60W50/10—Interpretation of driver requests or demands
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60R—VEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
- B60R16/00—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
- B60R16/02—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
- B60R16/037—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
- B60R16/0373—Voice control
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2540/00—Input parameters relating to occupants
- B60W2540/01—Occupants other than the driver
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2540/00—Input parameters relating to occupants
- B60W2540/043—Identity of occupants
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Automation & Control Theory (AREA)
- Mechanical Engineering (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Transportation (AREA)
- Mobile Radio Communication Systems (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
Description
Claims (40)
- 車両ベースの音声処理方法であって、車両における音声プロセッサに適用され、前記車両には、前記音声プロセッサ及び車載プロセッサが配置されており、前記音声プロセッサは、複数のマルチサウンドゾーンタイプのオーディオ処理方法をサポートし、前記音声処理方法は、
前記車載プロセッサが複数のオーディオチャネルに基づいて伝送し、前記複数のオーディオチャネルの識別子を携帯した音声メッセージを受信するステップと、
前記音声メッセージ中の各オーディオチャネルの識別子に基づき、前記音声メッセージに対応するマルチサウンドゾーンタイプを決定するステップと、
前記音声メッセージに対応するマルチサウンドゾーンタイプに対応するオーディオ処理方法を呼び出して、前記音声メッセージを処理し、処理結果を得るステップと、を含み、
前記音声メッセージは、マルチチャネルオーディオ信号及びマルチチャネル基準信号を含み、オーディオ信号を伝送するためのオーディオチャネルの隣接するオーディオチャネルは、基準信号を伝送するためのオーディオチャネルである、音声処理方法。 - 前記音声メッセージ中の各オーディオチャネルの識別子に基づき、前記音声メッセージに対応するマルチサウンドゾーンタイプを決定するステップは、
予め設定されたマッピング関係に基づき、前記音声メッセージ中の各オーディオチャネルの識別子により構成される組み合わせに対応するマルチサウンドゾーンタイプを決定するステップを含み、前記マッピング関係は、異なるオーディオチャネルの識別子により構成される組み合わせと異なるマルチサウンドゾーンタイプとの間のマッピング関係である、請求項1に記載の音声処理方法。 - 前記音声メッセージ中の各オーディオチャネルの識別子に基づき、前記音声メッセージに対応するマルチサウンドゾーンタイプを決定するステップは、
前記音声メッセージ中のオーディオチャネルの識別子の総数に基づき、前記総数に対応するマルチサウンドゾーンタイプを決定するステップを含む、請求項1に記載の音声処理方法。 - 1つのチャネルの信号は1つのオーディオチャネルにより伝送され、前記音声メッセージ中の各オーディオチャネルの識別子に基づき、前記音声メッセージに対応するマルチサウンドゾーンタイプを決定するステップは、
前記マルチチャネルオーディオ信号を伝送するための各オーディオチャネルの識別子に基づき、前記音声メッセージに対応するマルチサウンドゾーンタイプを決定するステップ、及び/又は、
前記マルチチャネル基準信号を伝送するための各オーディオチャネルの識別子に基づき、前記音声メッセージに対応するマルチサウンドゾーンタイプを決定するステップを含む、請求項1に記載の音声処理方法。 - 前記マルチチャネルオーディオ信号を伝送するための各オーディオチャネルの識別子に基づき、前記音声メッセージに対応するマルチサウンドゾーンタイプを決定するステップは、
前記マルチチャネルオーディオ信号を伝送する各オーディオチャネルの識別子の数量に基づき、前記音声メッセージに対応するマルチサウンドゾーンタイプを決定するステップを含む、請求項4に記載の音声処理方法。 - 前記マルチチャネル基準信号を伝送するための各オーディオチャネルの識別子に基づき、前記音声メッセージに対応するマルチサウンドゾーンタイプを決定するステップは、
前記マルチチャネル基準信号を伝送する各オーディオチャネルの識別子の数量に基づき、前記音声メッセージに対応するマルチサウンドゾーンタイプを決定するステップを含む、請求項4に記載の音声処理方法。 - 前記車載プロセッサによりサポートされるマルチサウンドゾーンタイプがデュアルサウンドゾーンタイプである場合、前記複数のオーディオチャネルは、数量が4個であり、且つ、第1のオーディオチャネル及び第3のオーディオチャネルは、オーディオ信号を伝送するために用いられ、第2のオーディオチャネル及び第4のオーディオチャネルは、基準信号を伝送するために用いられる、請求項1~5のいずれか1項に記載の音声処理方法。
- 前記車載プロセッサによりサポートされるマルチサウンドゾーンタイプがフォーサウンドゾーンタイプである場合、前記複数のオーディオチャネルは、数量が8個であり、且つ、第1のオーディオチャネル、第3のオーディオチャネル、第5のオーディオチャネル、及び第7のオーディオチャネルは、オーディオ信号を伝送するために用いられ、第2のオーディオチャネル、第4のオーディオチャネル、第6のオーディオチャネル、及び第8のオーディオチャネルは、基準信号を伝送するために用いられる、請求項1~5のいずれか1項に記載の音声処理方法。
- 前記車載プロセッサと前記音声プロセッサとの間のオーディオチャネルの総数は、最高レベルのマルチサウンドゾーンタイプに対応するオーディオチャネルの数より大きいか、又は等しい、請求項1~5のいずれか1項に記載の音声処理方法。
- 車両ベースの音声処理方法であって、車両における車載プロセッサに適用され、前記車両には、音声プロセッサ及び前記車載プロセッサが配置されており、前記音声プロセッサは、複数のマルチサウンドゾーンタイプをサポートし、前記音声処理方法は、
前記車載プロセッサによりサポートされるマルチサウンドゾーンタイプに基づき、受信された音声メッセージを伝送するための複数のオーディオチャネルを決定するステップと、
前記複数のオーディオチャネルに基づいて前記音声メッセージを音声プロセッサに伝送するステップと、を含み、
前記音声メッセージは、前記音声メッセージ中の各オーディオチャネルの識別子に基づき、前記音声メッセージに対応するマルチサウンドゾーンタイプを決定するために用いられ、前記音声メッセージに対応するマルチサウンドゾーンタイプは、前記音声メッセージに対応するマルチサウンドゾーンタイプに対応するオーディオ処理方法に基づき、前記音声メッセージを処理し、処理結果を得るために用いられ、
前記音声メッセージは、マルチチャネルオーディオ信号及びマルチチャネル基準信号を含み、オーディオ信号を伝送するためのオーディオチャネルの隣接するオーディオチャネルは、基準信号を伝送するためのオーディオチャネルである、音声処理方法。 - それぞれのオーディオチャネルは、1つの唯一のオーディオチャネルの識別子に対応し、前記車載プロセッサによりサポートされるマルチサウンドゾーンタイプに基づき、受信された音声メッセージを伝送するための複数のオーディオチャネルを決定する前記ステップは、
予め設定されたマッピング関係に基づき、前記車載プロセッサによりサポートされるマルチサウンドゾーンタイプに対応する、前記音声メッセージを伝送するための各オーディオチャネルの識別子により構成される組み合わせを決定し、構成される組み合わせに基づいて前記音声メッセージを伝送するための複数のオーディオチャネルを決定するステップを含み、前記マッピング関係は、異なるオーディオチャネルの識別子により構成される組み合わせと異なるマルチサウンドゾーンタイプとの間のマッピング関係である、請求項10に記載の音声処理方法。 - 前記車載プロセッサによりサポートされるマルチサウンドゾーンタイプに基づき、受信された音声メッセージを伝送するための複数のオーディオチャネルを決定するステップは、
前記車載プロセッサによりサポートされるマルチサウンドゾーンタイプに基づき、前記音声メッセージを伝送するためのオーディオチャネルの数量を決定し、オーディオチャネルの数量に基づき、予め設定された複数のオーディオチャネルから、前記音声メッセージを伝送するための複数のオーディオチャネルを選定するステップを含む、請求項10に記載の音声処理方法。 - 1つのチャネルの信号は1つのオーディオチャネルにより伝送され、前記車載プロセッサによりサポートされるマルチサウンドゾーンタイプに基づき、受信された音声メッセージを伝送するための複数のオーディオチャネルを決定するステップは、
前記車載プロセッサによりサポートされるマルチサウンドゾーンタイプに基づき、前記マルチチャネルオーディオ信号を伝送するための各オーディオチャネルを決定し、前記マルチチャネル基準信号を伝送するための各オーディオチャネルを決定するステップを含む、請求項10に記載の音声処理方法。 - 前記車載プロセッサによりサポートされるマルチサウンドゾーンタイプに基づき、前記マルチチャネルオーディオ信号を伝送するための各オーディオチャネルを決定するステップは、
前記車載プロセッサによりサポートされるマルチサウンドゾーンタイプに基づき、前記マルチチャネルオーディオ信号を伝送するためのオーディオチャネルの数量を決定するステップと、
前記マルチチャネルオーディオ信号を伝送するためのオーディオチャネルの数量に基づき、前記マルチチャネルオーディオ信号を伝送するためのオーディオチャネルの識別子を決定し、決定された識別子に基づいて各オーディオチャネルから前記マルチチャネルオーディオ信号を伝送するための各オーディオチャネルを選定するステップとを含む、請求項13に記載の音声処理方法。 - 前記車載プロセッサによりサポートされるマルチサウンドゾーンタイプに基づき、前記マルチチャネル基準信号を伝送するための各オーディオチャネルを決定するステップは、
前記車載プロセッサによりサポートされるマルチサウンドゾーンタイプに基づき、前記マルチチャネル基準信号を伝送するためのオーディオチャネルの数量を決定するステップと、
前記マルチチャネル基準信号を伝送するためのオーディオチャネルの数量に基づき、前記マルチチャネル基準信号を伝送するためのオーディオチャネルの識別子を決定し、決定された識別子に基づいて各オーディオチャネルから前記マルチチャネル基準信号を伝送するための各オーディオチャネルを選定するステップとを含む、請求項13に記載の音声処理方法。 - 前記車載プロセッサによりサポートされるマルチサウンドゾーンタイプがデュアルサウンドゾーンタイプである場合、前記複数のオーディオチャネルは、数量が4個であり、且つ、第1のオーディオチャネル及び第3のオーディオチャネルは、オーディオ信号を伝送するために用いられ、第2のオーディオチャネル及び第4のオーディオチャネルは、基準信号を伝送するために用いられる、請求項10~15のいずれか1項に記載の音声処理方法。
- 前記車載プロセッサによりサポートされるマルチサウンドゾーンタイプがフォーサウンドゾーンタイプである場合、前記複数のオーディオチャネルは、数量が8個であり、且つ、第1のオーディオチャネル、第3のオーディオチャネル、第5のオーディオチャネル、及び第7のオーディオチャネルは、オーディオ信号を伝送するために用いられ、第2のオーディオチャネル、第4のオーディオチャネル、第6のオーディオチャネル、及び第8のオーディオチャネルは、基準信号を伝送するために用いられる、請求項10~15のいずれか1項に記載の音声処理方法。
- 前記車載プロセッサと前記音声プロセッサとの間のオーディオチャネルの総数は、最高レベルのマルチサウンドゾーンタイプに対応するオーディオチャネルの数より大きいか、又は等しい、請求項10~15のいずれか1項に記載の音声処理方法。
- 音声プロセッサであって、前記音声プロセッサは、車両に配置され、前記車両には、さらに、車載プロセッサが配置されており、前記音声プロセッサは、複数のマルチサウンドゾーンタイプのオーディオ処理方法をサポートし、前記音声プロセッサは、
前記車載プロセッサが複数のオーディオチャネルに基づいて伝送する、前記複数のオーディオチャネルの識別子を携帯した音声メッセージを受信するための受信モジュールと、
前記音声メッセージ中の各オーディオチャネルの識別子に基づき、前記音声メッセージに対応するマルチサウンドゾーンタイプを決定するための第1の決定モジュールと、
前記音声メッセージに対応するマルチサウンドゾーンタイプに対応するオーディオ処理方法を呼び出すための呼び出しモジュールと、
呼び出されたオーディオ処理方法に基づいて前記音声メッセージを処理し、処理結果を得るための処理モジュールとを含み、
前記音声メッセージは、マルチチャネルオーディオ信号及びマルチチャネル基準信号を含み、オーディオ信号を伝送するためのオーディオチャネルの隣接するオーディオチャネルは、基準信号を伝送するためのオーディオチャネルである、音声プロセッサ。 - 前記第1の決定モジュールは、予め設定されたマッピング関係に基づき、前記音声メッセージ中の各オーディオチャネルの識別子により構成される組み合わせに対応するマルチサウンドゾーンタイプを決定するために用いられ、前記マッピング関係は、異なるオーディオチャネルの識別子により構成される組み合わせと異なるマルチサウンドゾーンタイプとの間のマッピング関係である、請求項19に記載の音声プロセッサ。
- 前記第1の決定モジュールは、前記音声メッセージ中のオーディオチャネルの識別子の総数に基づき、前記総数に対応するマルチサウンドゾーンタイプを決定するために用いられる、請求項19に記載の音声プロセッサ。
- 1つのチャネルの信号は1つのオーディオチャネルにより伝送され、前記第1の決定モジュールは、前記マルチチャネルオーディオ信号を伝送するための各オーディオチャネルの識別子に基づき、前記音声メッセージに対応するマルチサウンドゾーンタイプを決定するために用いられ、及び/又は、
前記マルチチャネル基準信号を伝送するための各オーディオチャネルの識別子に基づき、前記音声メッセージに対応するマルチサウンドゾーンタイプを決定するために用いられる、請求項19に記載の音声プロセッサ。 - 前記第1の決定モジュールは、前記マルチチャネルオーディオ信号を伝送する各オーディオチャネルの識別子の数量に基づき、前記音声メッセージに対応するマルチサウンドゾーンタイプを決定するために用いられる、請求項22に記載の音声プロセッサ。
- 前記第1の決定モジュールは、前記マルチチャネル基準信号を伝送する各オーディオチャネルの識別子の数量に基づき、前記音声メッセージに対応するマルチサウンドゾーンタイプを決定するために用いられる、請求項22に記載の音声プロセッサ。
- 前記車載プロセッサによりサポートされるマルチサウンドゾーンタイプがデュアルサウンドゾーンタイプである場合、前記複数のオーディオチャネルは、数量が4個であり、且つ、第1のオーディオチャネル及び第3のオーディオチャネルは、オーディオ信号を伝送するために用いられ、第2のオーディオチャネル及び第4のオーディオチャネルは、基準信号を伝送するために用いられる、請求項19~24のいずれか1項に記載の音声プロセッサ。
- 前記車載プロセッサによりサポートされるマルチサウンドゾーンタイプがフォーサウンドゾーンタイプである場合、前記複数のオーディオチャネルは、数量が8個であり、且つ、第1のオーディオチャネル、第3のオーディオチャネル、第5のオーディオチャネル、及び第7のオーディオチャネルは、オーディオ信号を伝送するために用いられ、第2のオーディオチャネル、第4のオーディオチャネル、第6のオーディオチャネル、及び第8のオーディオチャネルは、基準信号を伝送するために用いられる、請求項19~24のいずれか1項に記載の音声プロセッサ。
- 前記車載プロセッサと前記音声プロセッサとの間のオーディオチャネルの総数は、最高レベルのマルチサウンドゾーンタイプに対応するオーディオチャネルの数より大きいか、又は等しい、請求項19~24のいずれか1項に記載の音声プロセッサ。
- 車載プロセッサであって、前記車載プロセッサは車両に配置され、前記車両には、さらに、音声プロセッサが配置されており、前記音声プロセッサは、複数のマルチサウンドゾーンタイプをサポートし、前記車載プロセッサは、
前記車載プロセッサによりサポートされるマルチサウンドゾーンタイプに基づき、受信された音声メッセージを伝送するための複数のオーディオチャネルを決定するための第2の決定モジュールと、
前記複数のオーディオチャネルに基づいて前記音声メッセージを音声プロセッサに伝送するための伝送モジュールと、を含み、
前記音声メッセージは、前記音声メッセージ中の各オーディオチャネルの識別子に基づき、前記音声メッセージに対応するマルチサウンドゾーンタイプを決定するために用いられ、前記音声メッセージに対応するマルチサウンドゾーンタイプは、前記音声メッセージに対応するマルチサウンドゾーンタイプに対応するオーディオ処理方法に基づき、前記音声メッセージを処理し、処理結果を得るために用いられ、
前記音声メッセージは、マルチチャネルオーディオ信号及びマルチチャネル基準信号を含み、オーディオ信号を伝送するためのオーディオチャネルの隣接するオーディオチャネルは、基準信号を伝送するためのオーディオチャネルである、車載プロセッサ。 - それぞれのオーディオチャネルは、1つの唯一のオーディオチャネルの識別子に対応し、前記第2の決定モジュールは、
予め設定されたマッピング関係に基づき、前記車載プロセッサによりサポートされるマルチサウンドゾーンタイプに対応する、前記音声メッセージを伝送するための各オーディオチャネルの識別子により構成される組み合わせを決定するための組み合わせ決定サブモジュール、
構成される組み合わせに基づいて前記音声メッセージを伝送するための複数のオーディオチャネルを決定するためのチャネル決定サブモジュール、を含み、
前記マッピング関係は、異なるオーディオチャネルの識別子により構成される組み合わせと異なるマルチサウンドゾーンタイプとの間のマッピング関係である、請求項28に記載の車載プロセッサ。 - 前記第2の決定モジュールは、
前記車載プロセッサによりサポートされるマルチサウンドゾーンタイプに基づき、前記音声メッセージを伝送するためのオーディオチャネルの数量を決定するための数量決定サブモジュールと、
オーディオチャネルの数量に基づき、予め設定された複数のオーディオチャネルから、前記音声メッセージを伝送するための複数のオーディオチャネルを選定するための選定サブモジュールとを含む、請求項28に記載の車載プロセッサ。 - 1つのチャネルの信号は1つのオーディオチャネルにより伝送され、前記第2の決定モジュールは、
前記車載プロセッサによりサポートされるマルチサウンドゾーンタイプに基づき、前記マルチチャネルオーディオ信号を伝送するための各オーディオチャネルを決定するためのオーディオ信号チャネル決定サブモジュールと、
前記車載プロセッサによりサポートされるマルチサウンドゾーンタイプに基づき、前記マルチチャネル基準信号を伝送するための各オーディオチャネルを決定するための基準信号チャネル決定サブモジュールとを含む、請求項28に記載の車載プロセッサ。 - 前記オーディオ信号チャネル決定サブモジュールは、前記車載プロセッサによりサポートされるマルチサウンドゾーンタイプに基づき、前記マルチチャネルオーディオ信号を伝送するためのオーディオチャネルの数量を決定し、前記マルチチャネルオーディオ信号を伝送するためのオーディオチャネルの数量に基づき、前記マルチチャネルオーディオ信号を伝送するためのオーディオチャネルの識別子を決定し、決定された識別子に基づいて各オーディオチャネルから前記マルチチャネルオーディオ信号を伝送するための各オーディオチャネルを選定するために用いられる、請求項31に記載の車載プロセッサ。
- 前記基準信号チャネル決定サブモジュールは、前記車載プロセッサによりサポートされるマルチサウンドゾーンタイプに基づき、前記マルチチャネル基準信号を伝送するためのオーディオチャネルの数量を決定し、前記マルチチャネル基準信号を伝送するためのオーディオチャネルの数量に基づき、前記マルチチャネル基準信号を伝送するためのオーディオチャネルの識別子を決定し、且つ、決定された識別子に基づいて各オーディオチャネルから前記マルチチャネル基準信号を伝送するための各オーディオチャネルを選定するために用いられる、請求項31に記載の車載プロセッサ。
- 前記車載プロセッサによりサポートされるマルチサウンドゾーンタイプがデュアルサウンドゾーンタイプである場合、前記複数のオーディオチャネルは、数量が4個であり、且つ、第1のオーディオチャネル及び第3のオーディオチャネルは、オーディオ信号を伝送するために用いられ、第2のオーディオチャネル及び第4のオーディオチャネルは、基準信号を伝送するために用いられる、請求項28~33のいずれか1項に記載の車載プロセッサ。
- 前記車載プロセッサによりサポートされるマルチサウンドゾーンタイプがフォーサウンドゾーンタイプである場合、前記複数のオーディオチャネルは、数量が8個であり、且つ、第1のオーディオチャネル、第3のオーディオチャネル、第5のオーディオチャネル、及び第7のオーディオチャネルは、オーディオ信号を伝送するために用いられ、第2のオーディオチャネル、第4のオーディオチャネル、第6のオーディオチャネル、及び第8のオーディオチャネルは、基準信号を伝送するために用いられる、請求項28~33のいずれか1項に記載の車載プロセッサ。
- 前記車載プロセッサと前記音声プロセッサとの間のオーディオチャネルの総数は、最高レベルのマルチサウンドゾーンタイプに対応するオーディオチャネルの数より大きいか、又は等しい、請求項28~33のいずれか1項に記載の車載プロセッサ。
- 電子機器であって、
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信可能に接続されるメモリと、を含み、
前記メモリには、前記少なくとも1つのプロセッサにより実行可能な命令が記憶されており、前記命令は、前記少なくとも1つのプロセッサが請求項1~9のいずれか1項に記載の方法を実行できるように、または、前記少なくとも1つのプロセッサが請求項10~18のいずれか1項に記載の方法を実行できるように、前記少なくとも1つのプロセッサにより実行される、電子機器。 - コンピュータ命令が記憶された非一時的なコンピュータ読み取り可能な記憶媒体であって、前記コンピュータ命令は、コンピュータに請求項1~9のいずれか1項に記載の方法を実行させるために用いられるか、または、
前記コンピュータ命令は、前記コンピュータに請求項10~18のいずれか1項に記載の方法を実行させるために用いられる、読み取り可能な記憶媒体。 - コンピュータプログラムであって、前記コンピュータプログラムは、プロセッサにより実行されると、請求項1~9のいずれか1項に記載の方法を実現するか、または、
前記コンピュータプログラムは、プロセッサにより実行されると、請求項10~18のいずれか1項に記載の方法を実現する、コンピュータプログラム。 - 請求項19~27のいずれか1項に記載の音声プロセッサと、
請求項28~36のいずれか1項に記載の車載プロセッサと、を含む車両。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011476872.7A CN112599133A (zh) | 2020-12-15 | 2020-12-15 | 基于车辆的语音处理方法、语音处理器、车载处理器 |
CN202011476872.7 | 2020-12-15 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022014907A JP2022014907A (ja) | 2022-01-20 |
JP7258083B2 true JP7258083B2 (ja) | 2023-04-14 |
Family
ID=75195716
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021111578A Active JP7258083B2 (ja) | 2020-12-15 | 2021-07-05 | 車両ベースの音声処理方法、音声プロセッサ、車載プロセッサ |
Country Status (5)
Country | Link |
---|---|
US (1) | US20210316745A1 (ja) |
EP (1) | EP3876229A3 (ja) |
JP (1) | JP7258083B2 (ja) |
KR (1) | KR20210099533A (ja) |
CN (1) | CN112599133A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7424676B2 (ja) | 2017-03-06 | 2024-01-30 | 株式会社坪田ラボ | マウス近視誘導モデル及び近視予防・抑制のための小胞体ストレス抑制剤 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112599133A (zh) * | 2020-12-15 | 2021-04-02 | 北京百度网讯科技有限公司 | 基于车辆的语音处理方法、语音处理器、车载处理器 |
CN113301525B (zh) * | 2021-05-07 | 2024-08-06 | 上海小鹏汽车科技有限公司 | 通话控制方法、装置、电子控制器以及车辆 |
CN114071318B (zh) * | 2021-11-12 | 2023-11-14 | 阿波罗智联(北京)科技有限公司 | 语音处理方法、终端设备及车辆 |
CN116225359A (zh) * | 2021-12-06 | 2023-06-06 | 华为终端有限公司 | 音频通道选择方法、装置、存储介质和车辆 |
WO2023149488A1 (ja) | 2022-02-02 | 2023-08-10 | 東洋インキScホールディングス株式会社 | 分散組成物の製造方法 |
CN114678026B (zh) * | 2022-05-27 | 2022-10-14 | 广州小鹏汽车科技有限公司 | 语音交互方法、车机终端、车辆及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005115267A (ja) | 2003-10-10 | 2005-04-28 | Nippon Telegr & Teleph Corp <Ntt> | 多チャネル符号化方法、復号方法、これらの装置、プログラムおよびその記録媒体 |
JP2006126424A (ja) | 2004-10-28 | 2006-05-18 | Matsushita Electric Ind Co Ltd | 音声入力装置 |
US20070116297A1 (en) | 2005-11-21 | 2007-05-24 | Broadcom Corporation | Multiple channel audio system supporting data channel replacement |
JP2011527763A (ja) | 2008-07-11 | 2011-11-04 | サムスン エレクトロニクス カンパニー リミテッド | マルチチャネルの符号化及び復号化方法並びに装置 |
US20200219493A1 (en) | 2019-01-07 | 2020-07-09 | 2236008 Ontario Inc. | Voice control in a multi-talker and multimedia environment |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07162384A (ja) * | 1993-12-06 | 1995-06-23 | Mitsubishi Electric Corp | テレビジョン受信機及びその音声信号の出力方法 |
US7099821B2 (en) * | 2003-09-12 | 2006-08-29 | Softmax, Inc. | Separation of target acoustic signals in a multi-transducer arrangement |
KR100714453B1 (ko) * | 2006-07-11 | 2007-05-04 | 한국전자통신연구원 | 초광대역 무선통신방식을 이용한 무선오디오 송수신 장치와오디오신호의 송수신 방법 |
US9203533B2 (en) * | 2008-07-24 | 2015-12-01 | Line 6, Inc. | System and method for real-time wireless transmission of digital audio at multiple radio frequencies |
CN105340300B (zh) * | 2013-06-18 | 2018-04-13 | 杜比实验室特许公司 | 用于音频呈现的低音管理 |
US10199035B2 (en) * | 2013-11-22 | 2019-02-05 | Nuance Communications, Inc. | Multi-channel speech recognition |
US20160275961A1 (en) * | 2015-03-18 | 2016-09-22 | Qualcomm Technologies International, Ltd. | Structure for multi-microphone speech enhancement system |
CN205862794U (zh) * | 2016-06-30 | 2017-01-04 | 杭州罗孚音响有限公司 | 一种数字网络音频播放系统 |
JP2018116130A (ja) * | 2017-01-18 | 2018-07-26 | アルパイン株式会社 | 車内音声処理装置および車内音声処理方法 |
WO2019058453A1 (ja) * | 2017-09-20 | 2019-03-28 | 三菱電機株式会社 | 音声対話制御装置および音声対話制御方法 |
CN109994106B (zh) * | 2017-12-29 | 2023-06-23 | 阿里巴巴集团控股有限公司 | 一种语音处理方法及设备 |
CN109754803B (zh) * | 2019-01-23 | 2021-06-22 | 上海华镇电子科技有限公司 | 车载多音区语音交互系统及方法 |
US11315556B2 (en) * | 2019-02-08 | 2022-04-26 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification |
US20200312315A1 (en) * | 2019-03-28 | 2020-10-01 | Apple Inc. | Acoustic environment aware stream selection for multi-stream speech recognition |
CN110001558A (zh) * | 2019-04-18 | 2019-07-12 | 百度在线网络技术(北京)有限公司 | 用于控制车辆的方法和装置 |
CN110475180A (zh) * | 2019-08-23 | 2019-11-19 | 科大讯飞(苏州)科技有限公司 | 车载多音区音频处理系统及方法 |
CN110366156B (zh) * | 2019-08-26 | 2021-03-26 | 科大讯飞(苏州)科技有限公司 | 通讯处理方法、装置、设备、存储介质及音频管理系统 |
US11567788B1 (en) * | 2019-10-18 | 2023-01-31 | Meta Platforms, Inc. | Generating proactive reminders for assistant systems |
US11257346B1 (en) * | 2019-12-12 | 2022-02-22 | Amazon Technologies, Inc. | Contextual response to motion-based event |
US11562744B1 (en) * | 2020-02-13 | 2023-01-24 | Meta Platforms Technologies, Llc | Stylizing text-to-speech (TTS) voice response for assistant systems |
CN111816189B (zh) * | 2020-07-03 | 2023-12-26 | 斑马网络技术有限公司 | 一种车辆用多音区语音交互方法及电子设备 |
CN112599133A (zh) * | 2020-12-15 | 2021-04-02 | 北京百度网讯科技有限公司 | 基于车辆的语音处理方法、语音处理器、车载处理器 |
US20220337651A1 (en) * | 2021-04-15 | 2022-10-20 | Palomar Products, Inc. | Intercommunication system |
-
2020
- 2020-12-15 CN CN202011476872.7A patent/CN112599133A/zh active Pending
-
2021
- 2021-06-21 EP EP21180611.2A patent/EP3876229A3/en not_active Ceased
- 2021-06-22 KR KR1020210081132A patent/KR20210099533A/ko unknown
- 2021-06-23 US US17/355,662 patent/US20210316745A1/en active Pending
- 2021-07-05 JP JP2021111578A patent/JP7258083B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005115267A (ja) | 2003-10-10 | 2005-04-28 | Nippon Telegr & Teleph Corp <Ntt> | 多チャネル符号化方法、復号方法、これらの装置、プログラムおよびその記録媒体 |
JP2006126424A (ja) | 2004-10-28 | 2006-05-18 | Matsushita Electric Ind Co Ltd | 音声入力装置 |
US20070116297A1 (en) | 2005-11-21 | 2007-05-24 | Broadcom Corporation | Multiple channel audio system supporting data channel replacement |
JP2011527763A (ja) | 2008-07-11 | 2011-11-04 | サムスン エレクトロニクス カンパニー リミテッド | マルチチャネルの符号化及び復号化方法並びに装置 |
US20200219493A1 (en) | 2019-01-07 | 2020-07-09 | 2236008 Ontario Inc. | Voice control in a multi-talker and multimedia environment |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7424676B2 (ja) | 2017-03-06 | 2024-01-30 | 株式会社坪田ラボ | マウス近視誘導モデル及び近視予防・抑制のための小胞体ストレス抑制剤 |
Also Published As
Publication number | Publication date |
---|---|
CN112599133A (zh) | 2021-04-02 |
EP3876229A3 (en) | 2022-01-12 |
KR20210099533A (ko) | 2021-08-12 |
JP2022014907A (ja) | 2022-01-20 |
US20210316745A1 (en) | 2021-10-14 |
EP3876229A2 (en) | 2021-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7258083B2 (ja) | 車両ベースの音声処理方法、音声プロセッサ、車載プロセッサ | |
US10733384B2 (en) | Emotion detection and expression integration in dialog systems | |
US11270690B2 (en) | Method and apparatus for waking up device | |
JP7312229B2 (ja) | ノイズ除去アルゴリズムのデバッグ方法、装置及び電子機器 | |
EP4040764A2 (en) | Method and apparatus for in-vehicle call, device, computer readable medium and product | |
CN114157701B (zh) | 一种任务测试方法、装置、设备以及存储介质 | |
CN108600344A (zh) | 一种网络访问请求调度方法、装置和存储介质 | |
WO2022228067A1 (zh) | 语音处理方法、装置和电子设备 | |
JP2024073501A (ja) | キュー内で待機する呼に関する最適化 | |
CN114937478A (zh) | 用于训练模型的方法、用于生成分子的方法和装置 | |
CN113012695B (zh) | 智能控制方法、装置、电子设备及计算机可读存储介质 | |
US20230010735A1 (en) | Method for processing audio data based on vehicle networking | |
CN115268821B (zh) | 音频播放方法及装置、设备和介质 | |
CN113691937B (zh) | 用于确定位置信息的方法、云手机和终端设备 | |
CN114301789B (zh) | 数据传输方法及装置、存储介质、电子设备 | |
CN111770236A (zh) | 一种对话处理方法、装置、系统、服务器和存储介质 | |
CN117040938B (zh) | 一种异常ip检测方法及装置、电子设备及存储介质 | |
CN109542646A (zh) | 用于调用应用程序编程接口的方法和装置 | |
CN108845879A (zh) | 一种机器人资源调用方法、装置、服务器和存储介质 | |
US11789928B2 (en) | Dynamic namespace modification for virtual agents | |
EP4056424B1 (en) | Audio signal playback delay estimation for smart rearview mirror | |
CN116978375A (zh) | 用户界面控制方法、装置、设备及存储介质 | |
CN114684167A (zh) | 基于多控制器域网控制车辆的方法、设备及自动驾驶车辆 | |
CN114582339A (zh) | 语音交互方法、装置、电子设备和介质 | |
CN114063969A (zh) | 音频数据处理方法、装置、设备、存储介质及程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210705 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220726 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220830 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221118 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230322 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230404 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7258083 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |