JP2022127584A - 音声処理方法、装置、電子機器および読み取り可能な記憶媒体 - Google Patents
音声処理方法、装置、電子機器および読み取り可能な記憶媒体 Download PDFInfo
- Publication number
- JP2022127584A JP2022127584A JP2022008378A JP2022008378A JP2022127584A JP 2022127584 A JP2022127584 A JP 2022127584A JP 2022008378 A JP2022008378 A JP 2022008378A JP 2022008378 A JP2022008378 A JP 2022008378A JP 2022127584 A JP2022127584 A JP 2022127584A
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- audio
- processing
- processing method
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 22
- 230000005236 sound signal Effects 0.000 claims abstract description 131
- 238000012545 processing Methods 0.000 claims abstract description 116
- 238000000034 method Methods 0.000 claims abstract description 29
- 238000004590 computer program Methods 0.000 claims description 12
- 238000004891 communication Methods 0.000 description 20
- 238000010586 diagram Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/162—Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/04—Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Otolaryngology (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】方法は、第1のオーディオ信号を収集するステップと、予め設定されたアルゴリズムを使用して前記第1のオーディオ信号を処理し、第2のオーディオ信号を取得するステップと、前記第1の機器が前記第2のオーディオ信号を音声処理するように、前記第2のオーディオ信号を第1の機器に送信するステップと、を含む。
【効果】第1の機器に外部接続された音声処理機器を介してオーディオ信号の収集を行い、第1の機器自体でオーディオ信号の収集を行う必要がなく音声処理を実現することができ、第1の機器が音声処理を行う時のステップを簡略化し、第1の機器の音声処理効率を向上させる。
【選択図】図1
Description
S101、第1のオーディオ信号を収集する。
S102、予め設定されたアルゴリズムを使用して第1のオーディオ信号を処理し、第2のオーディオ信号を取得する。
S103、第1の機器が第2のオーディオ信号を音声処理するように、第2のオーディオ信号を第1の機器に送信する。
S201、第1の機器によって送信された第3のオーディオ信号を受信する。
S202、第3のオーディオ信号を第2の機器に送信して再生する。
その中の電源モジュール301は充電器、充電可能なリチウム電池、および電圧変換チップを含み、ユーザは電源モジュールのスイッチによって音声処理機器のオンまたはオフを実現することができ、マイクロフォンアレイモジュール302は複数のデジタル/アナログマイクロフォンを含み、それは全方向360°方向のオーディオ信号の収集を行うことができ、信号処理モジュール303は信号プロセッサとフラッシュメモリを含み、フラッシュメモリは予め設定されたアルゴリズムを記憶し、信号プロセッサは記憶された予め設定されたアルゴリズムに基づいて収集されたオーディオ信号を処理し、変換モジュール304はデジタルからアナログへの変換器とアナログからデジタルへの変換器を含み、デジタルからアナログへの変換器は、オーディオ信号をアナログ信号に変換するために用いられ、アナログからデジタルへの変換器は、オーディオ信号をデジタル信号に変換するために用いられ、インターフェースモジュール305は、充電インターフェース、録音インターフェース、および再生インターフェースを含み、録音インターフェースは第1の機器に接続され、再生インターフェースは第2の機器に接続される。
第1のオーディオ信号を収集するための収集ユニット401と、
予め設定されたアルゴリズムを使用して第1のオーディオ信号を処理し、第2のオーディオ信号を取得するための処理ユニット402と、
第1の機器が第2のオーディオ信号を音声処理するように、第2のオーディオ信号を第1の機器に送信するための送信ユニット403と、を含む。
Claims (11)
- 音声処理方法であって、
第1のオーディオ信号を収集するステップと、
予め設定されたアルゴリズムを使用して前記第1のオーディオ信号を処理し、第2のオーディオ信号を取得するステップと、
第1の機器が前記第2のオーディオ信号を音声処理するように、前記第2のオーディオ信号を前記第1の機器に送信するステップと、を含む、
音声処理方法。 - 前記第1のオーディオ信号を収集するステップは、
前記第1の機器によって送信された録音命令を受信した後、第1のオーディオ信号の収集を開始するステップを含み、
前記録音命令は、前記第1の機器によって前記第1の機器が予め設定されたアプリケーションを開いたことを検出した時に音声処理機器に送信される、
請求項1に記載の音声処理方法。 - 前記第1の機器によって送信された制御命令を受信するステップであって、前記制御命令には集音の角度範囲が含まれるステップと、
前記制御命令に含まれる前記角度範囲に基づいて、集音方向を調整するステップと、をさらに含む、
請求項1または2に記載の音声処理方法。 - 前記第1の機器によって送信された第3のオーディオ信号を受信するステップと、
前記第3のオーディオ信号を第2の機器に送信して再生するステップと、をさらに含む、
請求項1から3のいずれか一項に記載の音声処理方法。 - 音声処理装置であって、
第1のオーディオ信号を収集するための収集ユニットと、
予め設定されたアルゴリズムを使用して前記第1のオーディオ信号を処理し、第2のオーディオ信号を取得するための処理ユニットと、
第1の機器が前記第2のオーディオ信号を音声処理するように、前記第2のオーディオ信号を前記第1の機器に送信するための送信ユニットと、を含む、
音声処理装置。 - 前記収集ユニットが第1のオーディオ信号を収集する時、具体的に、
前記第1の機器によって送信された録音命令を受信した後、第1のオーディオ信号の収集を開始することを実行し、
前記録音命令は、前記第1の機器によって前記第1の機器が予め設定されたアプリケーションを開いたことを検出した時に音声処理機器に送信される、
請求項5に記載の音声処理装置。 - 調整ユニットをさらに含み、
前記調整ユニットは、
前記第1の機器によって送信された制御命令を受信し、前記制御命令には集音の角度範囲が含まれ、
前記制御命令に含まれる前記角度範囲に基づいて、集音方向を調整することを実行するために用いられる、
請求項5または6に記載の音声処理装置。 - 再生ユニットをさらに含み、
前記再生ユニットは、
前記第1の機器によって送信された第3のオーディオ信号を受信し、
前記第3のオーディオ信号を第2の機器に送信して再生することを実行するために用いられる、
請求項5から7のいずれか一項に記載の音声処理装置。 - 電子機器であって、
少なくとも一つのプロセッサと、
前記少なくとも一つのプロセッサと通信接続されたメモリと、を含み、
前記メモリに前記少なくとも一つのプロセッサにより実行可能な命令が記憶されており、前記命令が前記少なくとも一つのプロセッサにより実行されると、前記少なくとも一つのプロセッサが請求項1から4のいずれか一項に記載の音声処理方法を実行する、
電子機器。 - コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令は、コンピュータに請求項1から4のいずれか一項に記載の音声処理方法を実行させる、
コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体。 - プロセッサによって実行される時に請求項1から4のいずれか一項に記載の音声処理方法を実現する、
コンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110195343.8A CN113031901B (zh) | 2021-02-19 | 2021-02-19 | 语音处理方法、装置、电子设备以及可读存储介质 |
CN202110195343.8 | 2021-02-19 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022127584A true JP2022127584A (ja) | 2022-08-31 |
Family
ID=76461436
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022008378A Pending JP2022127584A (ja) | 2021-02-19 | 2022-01-24 | 音声処理方法、装置、電子機器および読み取り可能な記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11659325B2 (ja) |
EP (1) | EP4047470B1 (ja) |
JP (1) | JP2022127584A (ja) |
KR (1) | KR20220118904A (ja) |
CN (1) | CN113031901B (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113726936B (zh) * | 2021-08-30 | 2023-10-24 | 联想(北京)有限公司 | 一种音频数据处理方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007336232A (ja) * | 2006-06-15 | 2007-12-27 | Nippon Telegr & Teleph Corp <Ntt> | 特定方向収音装置、特定方向収音プログラム、記録媒体 |
JP2020112692A (ja) * | 2019-01-11 | 2020-07-27 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 方法、制御装置、及びプログラム |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9071900B2 (en) * | 2012-08-20 | 2015-06-30 | Nokia Technologies Oy | Multi-channel recording |
KR20140127508A (ko) * | 2013-04-25 | 2014-11-04 | 삼성전자주식회사 | 음성처리장치 및 음성처리방법 |
EP2840807A1 (en) * | 2013-08-19 | 2015-02-25 | Oticon A/s | External microphone array and hearing aid using it |
US9167333B2 (en) * | 2013-10-18 | 2015-10-20 | Plantronics, Inc. | Headset dictation mode |
CN105718236A (zh) * | 2014-12-02 | 2016-06-29 | 中兴通讯股份有限公司 | 一种录音装置和方法 |
JP2017107482A (ja) | 2015-12-11 | 2017-06-15 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
CN105653233B (zh) * | 2015-12-30 | 2019-06-04 | 芜湖美智空调设备有限公司 | 关联语音信号与控制指令的方法及控制终端 |
CN107680593A (zh) * | 2017-10-13 | 2018-02-09 | 歌尔股份有限公司 | 一种智能设备的语音增强方法及装置 |
CN109286875B (zh) * | 2018-09-29 | 2021-01-01 | 百度在线网络技术(北京)有限公司 | 用于定向拾音的方法、装置、电子设备和存储介质 |
CN109462794B (zh) * | 2018-12-11 | 2021-02-12 | Oppo广东移动通信有限公司 | 智能音箱及用于智能音箱的语音交互方法 |
CN109817206A (zh) * | 2018-12-20 | 2019-05-28 | 航天信息股份有限公司 | 一种用于自动终端设备的语音交互装置及方法 |
CN112349282A (zh) * | 2019-08-09 | 2021-02-09 | 北京声智科技有限公司 | 语音控制系统、语音处理方法及外部设备 |
CN111724805A (zh) * | 2020-06-29 | 2020-09-29 | 北京百度网讯科技有限公司 | 用于处理信息的方法和装置 |
CN111986669A (zh) * | 2020-08-20 | 2020-11-24 | 北京声智科技有限公司 | 信息处理方法及装置 |
-
2021
- 2021-02-19 CN CN202110195343.8A patent/CN113031901B/zh active Active
- 2021-12-17 EP EP21215645.9A patent/EP4047470B1/en active Active
- 2021-12-23 US US17/560,418 patent/US11659325B2/en active Active
-
2022
- 2022-01-12 KR KR1020220004728A patent/KR20220118904A/ko not_active Application Discontinuation
- 2022-01-24 JP JP2022008378A patent/JP2022127584A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007336232A (ja) * | 2006-06-15 | 2007-12-27 | Nippon Telegr & Teleph Corp <Ntt> | 特定方向収音装置、特定方向収音プログラム、記録媒体 |
JP2020112692A (ja) * | 2019-01-11 | 2020-07-27 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 方法、制御装置、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
EP4047470B1 (en) | 2024-01-31 |
CN113031901B (zh) | 2023-01-17 |
KR20220118904A (ko) | 2022-08-26 |
US11659325B2 (en) | 2023-05-23 |
CN113031901A (zh) | 2021-06-25 |
US20220272442A1 (en) | 2022-08-25 |
EP4047470A1 (en) | 2022-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6713035B2 (ja) | ファーフィールド音声機能の実現方法、設備、システム、記憶媒体及びプログラム | |
US10431211B2 (en) | Directional processing of far-field audio | |
US10728656B1 (en) | Audio device and audio processing method | |
CN109543198A (zh) | 翻译方法、装置、系统及存储介质 | |
CN107240396A (zh) | 说话人自适应方法、装置、设备及存储介质 | |
EP3635533B1 (en) | Electronic apparatus for processing user utterance for controlling an external electronic apparatus and controlling method thereof | |
JP2022127584A (ja) | 音声処理方法、装置、電子機器および読み取り可能な記憶媒体 | |
US20200293460A1 (en) | Electronic device for controlling external conversion device | |
CN113014978A (zh) | 提高电视远场语音激活率的方法、计算机设备、存储介质 | |
CN112243182B (zh) | 拾音电路、方法及装置 | |
CN113810814B (zh) | 耳机模式切换的控制方法及装置、电子设备和存储介质 | |
CN213547829U (zh) | 麦克风的电路结构及终端 | |
CN108235185A (zh) | 音源输入客户端设备、遥控器,以及播放音乐的系统 | |
CN211089936U (zh) | 一种控制电路、充电电路、耳机及充电线 | |
KR20220125026A (ko) | 오디오 처리 방법 및 이를 포함하는 전자 장치 | |
CN113721753A (zh) | 功率放大器控制方法及装置、存储介质和电子设备 | |
WO2021104085A1 (zh) | 语音交互控制器、系统以及机器人 | |
KR20220016552A (ko) | 음성 데이터 처리 방법 및 이를 지원하는 전자 장치 | |
JP2021110945A (ja) | スマートオーディオ装置、方法、電子デバイスおよびコンピュータ可読媒体 | |
CN110956951A (zh) | 一种语音增强采集配件、方法、系统、设备及存储介质 | |
EP3544312B1 (en) | Electronic device mainboard with audio processing function | |
WO2024016793A1 (zh) | 语音信号的处理方法、装置、设备及计算机可读存储介质 | |
KR20220118224A (ko) | 오디오 데이터 처리 방법 및 이를 지원하는 전자 장치 | |
CN116137150A (zh) | 物联网设备控制方法、装置、存储介质、电子设备及系统 | |
KR20230018833A (ko) | 전자 장치 및 무선 오디오 장치의 연결 전환을 제공하는 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220124 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230221 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230519 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20230919 |