CN108986831B - 语音干扰滤除的方法、电子装置及计算机可读存储介质 - Google Patents

语音干扰滤除的方法、电子装置及计算机可读存储介质 Download PDF

Info

Publication number
CN108986831B
CN108986831B CN201710396430.3A CN201710396430A CN108986831B CN 108986831 B CN108986831 B CN 108986831B CN 201710396430 A CN201710396430 A CN 201710396430A CN 108986831 B CN108986831 B CN 108986831B
Authority
CN
China
Prior art keywords
audio signal
sequence
background
background audio
interval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710396430.3A
Other languages
English (en)
Other versions
CN108986831A (zh
Inventor
林燕星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanning Fulian Fugui Precision Industrial Co Ltd
Original Assignee
Nanning Fugui Precision Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanning Fugui Precision Industrial Co Ltd filed Critical Nanning Fugui Precision Industrial Co Ltd
Priority to CN201710396430.3A priority Critical patent/CN108986831B/zh
Priority to US15/665,965 priority patent/US10643635B2/en
Priority to TW107111700A priority patent/TWI663595B/zh
Publication of CN108986831A publication Critical patent/CN108986831A/zh
Application granted granted Critical
Publication of CN108986831B publication Critical patent/CN108986831B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0224Processing in the time domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information

Abstract

一种语音干扰滤除方法,其特征在于,所述方法包括步骤:通过音频采集单元获取外部环境中的第一音频信号,所述第一音频信号中包括用户语音信号;获取音频输出单元输出的第二音频信号;过滤所述第一音频信号中的语音音区以得到第一背景音频信号,过滤所述第二音频信号中的语音音区以得到第二背景音频信号;通过对比第一背景音频信号和第二背景音频信号,得到时间差T和扩音参数X;对所述第二音频信号进行时间补偿、放大和反相操作以得到第三音频信号;合成所述第一音频信号与所述第三音频信号,得到与用户语音信号接近的第四音频信号。本发明还提供一种电子装置、计算机可读存储介质。本发明可以避免用户的控制语音受到音频输出单元声源干扰的情况。

Description

语音干扰滤除的方法、电子装置及计算机可读存储介质
技术领域
本发明涉及语音处理技术领域,尤其是涉及一种语音干扰滤除的方法、电子装置及计算机可读存储介质。
背景技术
随着科技的发展,具有播放功能的电子装置(如智能电视、电脑、手机等)因具备丰富的功能与复杂的选项,传统的控制方法(如遥控器控制、触摸控制、键鼠控制)已不足以带来便捷的控制与直觉式使用者体验,因此多数产品开始导入语音控制。
然而,使用者在利用所述电子装置播放电影或音乐时,若想要通过语音控制所述电子装置,则必须关闭正在播放的电影或音乐,否则使用者所发出的控制语音容易受到所述电子装置所产生的音源干扰,其控制语音无法被所述电子装置精确识别,降低了使用者语音控制的控制效率和准确率。
发明内容
鉴于以上内容,有必要提供一种语音干扰滤除的方法、电子装置及计算机可读存储介质,可以让使用者所发出的控制语音不会受到所述电子装置输出的音源干扰,使得控制语音被所述电子装置精确识别,提高了使用者语音控制的控制效率。
本发明实施方式提供一种语音干扰滤除的方法,包括步骤:通过所述音频采集单元获取外部环境中的第一音频信号,所述第一音频信号中包括用户语音信号;获取所述音频输出单元输出的第二音频信号;过滤所述第一音频信号中的语音音区以得到第一背景音频信号,过滤所述第二音频信号中的语音音区以得到第二背景音频信号;通过对比所述第一背景音频信号和所述第二背景音频信号,得到所述第一音频信号和所述第二音频信号之间的时间差T和扩音参数X;依据所述时间差T及所述扩音参数X,对所述第二音频信号进行时间补偿、放大和反相操作以得到第三音频信号;合成所述第一音频信号与所述第三音频信号,得到与所述用户语音信号接近的第四音频信号。
本发明实施方式还提供一种电子装置,所述电子装置包括存储器、处理器、音频采集单元、音频输出单元及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如所述语音干扰滤除的方法的步骤。
进一步地,本发明实施方式还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如所述语音干扰滤除的方法的步骤。
相较于现有技术,所述的语音干扰滤除的方法、电子装置及计算机可读存储介质,能够使得使用者的控制语音被所述电子装置精确识别,提高了使用者语音控制的控制效率。
附图说明
图1是本发明实施例之电子装置的架构图。
图2是本发明实施例之语音干扰滤除系统的程序模块图。
图3是本发明实施例之语音干扰滤除方法的步骤流程图。
主要元件符号说明
电子装置 2
语音干扰滤除系统 10
存储器 20
处理器 30
音频采集单元 40
音频输出单元 50
获取模块 100
过滤模块 200
对比模块 300
修改模块 400
合成模块 500
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
参阅图1所示,是本发明实施例之电子装置2的架构图。在本实施例中,所述电子装置2中包括语音干扰滤除系统10、存储器20、处理器30、音频采集单元40及音频输出单元50。所述电子装置2可以是智能家电、智能手机、电脑等。
其中,所述存储器20至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。所述处理器30可以是中央处理器(CentralProcessing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片等。
参阅图2所示,是所述语音干扰滤除系统10的程序模块图。
所述语音干扰滤除系统10包括获取模块100、过滤模块200、对比模块300、修改模块400以及合成模块500。所述模块被配置成由一个或多个处理器(本实施例为处理器30)执行,以完成本发明。本发明所称的模块是完成特定功能的计算机程序段。所述存储器20用于存储所述语音干扰滤除系统10的程序代码等资料。所述处理器30用于执行所述存储器20中存储的程序代码。
所述获取模块100用于通过所述音频采集单元40获取外部环境中的第一音频信号,所述第一音频信号中包括用户语音信号。
所述获取模块100还用于获取所述音频输出单元50输出的第二音频信号。在本实施例中,所述第二音频信号是从所述电子装置2内部获取,而不是在所述音频输出单元50输出时从外部采集。
所述过滤模块200用于过滤所述第一音频信号中的语音音区以得到第一背景音频信号,过滤所述第二音频信号中的语音音区以得到第二背景音频信号。在本实施例中,所述语音音区是指人类正常声音频率对应的音区,例如80-1000HZ音区。
所述对比模块300用于对比所述第一背景音频信号和所述第二背景音频信号,得到所述第一音频信号和所述第二音频信号之间的时间差T和扩音参数X。
在本实施例中,所述对比模块300取样所述第一背景音频信号以提取所述第一背景音频信号中多个取样点的第一特征值序列,及取样所述第二背景音频信号以提取所述第二背景音频信号中多个取样点的第二特征值序列。
其中,计算所述第一特征值序列与所述第二特征值序列的方法包括:
设定一固定区间作为计算能量值的时间区间,区间长度为t。
在所述第一背景音频信号与所述第二背景音频信号的相同时间点,以所述区间长度t设置连续n个所述固定区间。在本实施例中,以n=10为例。
计算所述第一背景音频信号中设置的10个固定区间的能量值,得到第一区间能量序列,记为E1[10]={E11,E12,…,E110}。依据各固定区间内音频信号的振幅大小为该固定区间计算一对应的能量值,其中,E11为第一个固定区间的能量值、E12为第二个固定区间的能量值,以此类推。
同样地,计算所述第二背景音频信号中设置的10个固定区间的能量值,得到第二区间能量序列,记为E2[10]={E21,E22,…,E210}。其中,E21为第一个固定区间的能量值、E22为第二个固定区间的能量值,以此类推。
针对所述第一背景音频信号和所述第二背景音频信号,依序将每一固定区间的能量值与后一固定区间的能量值进行比较,得到多个特征值。特征值的计算公式如下:
Figure BDA0001308635270000051
其中,Em为第m个所述固定区间的能量值。
根据所述第一区间能量序列计算得到多个特征值,以取得第一特征值序列。在本实施例中,所述第一特征值序列记为C1[9]。
根据所述第二区间能量序列计算得到多个特征值,以取得第二特征值序列。在本实施例中,所述第二特征值序列记为C2[9]。
所述对比模块300还用于对比所述第一特征值序列C1[9]与所述第二特征值序列C2[9],得到一数值k,使得C1m+k=C2m。例如,若C1[9]={0,1,0,-1,1,1,1,0,0},C2[9]={0,-1,1,1,1,0,0,1,0},可以看出C13=C21=0、C14=C22=-1、…、C19=C27=0,此时所述数值k为2。
所述时间差T等于所述区间长度t与所述数值k的乘积。
所述对比模块300还用于根据所述数值k计算所述扩音参数X。
计算所述扩音参数X的公式如下:
Figure BDA0001308635270000061
其中,E1n为所述第一背景音频信号中第n个所述固定区间的能量值,E2n为所述第二背景音频信号中第n个所述固定区间的能量值。例如:
E110={3.7,3.8,6.0,5.9,3.8,5.0,5.6,6.5,7.1,7.4},E210={5.0,4.9,3.2,4.2,4.7,5.4,5.9,6.2,6.8,7.3},当k=2时,
Figure BDA0001308635270000062
此时,所述扩音参数X=1.1971。
所述修改模块400用于依据所述时间差T及所述扩音参数X,对所述第二音频信号进行时间补偿、放大和反相操作以得到第三音频信号。公式如下:
S3(t)=-XS2(t-T)
其中,S3(t)为所述第三音频信号,S2(t)为所述第二音频信号。
所述合成模块500用于合成所述第一音频信号与所述第三音频信号,得到与所述用户语音信号接近的第四音频信号。
S4(t)=S1(t)+S3(t)
其中,S4(t)为所述第四音频信号,S1(t)为所述第一音频信号,S3(t)为所述第三音频信号。在本实施例中,所述第四音频信号为已经消除背景噪声的用户控制语音,可以直接输入至所述电子装置2语音辨识系统进行辨识进而控制所述电子装置2。
参阅图3所示,是本发明实施例之语音干扰滤除的方法的步骤流程图。所述语音干扰滤除的方法应用于所述电子装置2中,通过处理器30执行存储器20中存储的程序代码实现。
步骤S302,通过所述音频采集单元40获取外部环境中的第一音频信号,所述第一音频信号中包括用户语音信号。
步骤S304,获取所述音频输出单元50输出的第二音频信号。
步骤S306,过滤所述第一音频信号中的语音音区以得到第一背景音频信号,过滤所述第二音频信号中的语音音区以得到第二背景音频信号。
步骤S308,通过对比所述第一背景音频信号和所述第二背景音频信号,得到所述第一音频信号和所述第二音频信号之间的时间差T和扩音参数X。
步骤S310,依据所述时间差T及所述扩音参数X,对所述第二音频信号进行时间补偿、放大和反相操作以得到第三音频信号。
步骤S312,合成所述第一音频信号与所述第三音频信号,得到与所述用户语音信号接近的第四音频信号。
以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (6)

1.一种语音干扰滤除的方法,用于电子装置中,所述电子装置包含至少一个音频采集单元和至少一个音频输出单元,其特征在于,所述方法包括步骤:
通过所述音频采集单元获取外部环境中的第一音频信号,所述第一音频信号中包括用户语音信号;
获取所述音频输出单元输出的第二音频信号;
过滤所述第一音频信号中的语音音区以得到第一背景音频信号,过滤所述第二音频信号中的语音音区以得到第二背景音频信号;
设定一固定区间作为计算能量值的时间区间,区间长度为t;
在所述第一背景音频信号与所述第二背景音频信号的相同时间点以所述区间长度t设置连续n个所述固定区间;
计算所述第一背景音频信号中设置的n个区间的能量值,得到第一区间能量序列,记为E1[n];
计算所述第二背景音频信号中设置的n个区间内的能量,得到第二区间能量序列,记为E2[n];
针对所述第一背景音频信号和所述第二背景音频信号,将每一固定区间内的能量与后一固定区间内的能量进行比较,得到多个特征值,从而得到第一特征值序列C1[m]和第二特征值序列C2[m];
根据所述第一特征值序列C1[m]和所述第二特征值序列C2[m],计算得到所述第一背景音频信号和所述第二背景音频信号之间的时间差T;
根据所述时间差T,补偿所述第二背景音频信号并将补偿后的第二背景音频信号和所述第一背景音频信号进行对比,以得到扩音参数X;
依据所述时间差T及所述扩音参数X,对所述第二音频信号进行时间补偿、放大和反相操作以得到第三音频信号;及
合成所述第一音频信号与所述第三音频信号,得到与所述用户语音信号接近的第四音频信号;
其中,所述第一特征值序列C1[m]中第m个第一特征值C1m和所述第二特征值序列C2[m]的中第m个第二特征值C2m的计算公式如下:
Figure FDA0002903767820000021
Figure FDA0002903767820000022
其中,E1m为所述第一背景音频信号中第m个所述固定区间的能量值,E2m为所述第二背景音频信号中第m个所述固定区间的能量值。
2.如权利要求1所述的语音干扰滤除的方法,其特征在于,所述根据所述第一特征值序列和所述第二特征值序列,计算得到所述第一背景音频信号和所述第二背景音频信号之间的时间差T的步骤,包括:
对比所述第一特征值序列C1[m]与所述第二特征值序列C2[m],得到一数值k,使得C1m+k=C2m
所述时间差T等于所述区间长度t与所述数值k的乘积。
3.如权利要求2所述的语音干扰滤除的方法,其特征在于,计算所述扩音参数X的公式为:
Figure FDA0002903767820000031
其中,E1n为所述第一背景音频信号中第n个所述固定区间的能量值,E2n为所述第二背景音频信号中第n个所述固定区间内的能量值。
4.如权利要求1所述的语音干扰滤除的方法,其特征在于,所述第三音频信号的计算公式为:
S3(t)=-XS2(t-T)
其中,S3(t)为所述第三音频信号,S2(t)为所述第二音频信号。
5.一种电子装置,其特征在于,所述装置包括:至少一个音频采集单元和至少一个音频输出单元,存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至4中任一项所述的语音干扰滤除方法的步骤。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4中任一项所述的语音干扰滤除的方法的步骤。
CN201710396430.3A 2017-05-31 2017-05-31 语音干扰滤除的方法、电子装置及计算机可读存储介质 Active CN108986831B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201710396430.3A CN108986831B (zh) 2017-05-31 2017-05-31 语音干扰滤除的方法、电子装置及计算机可读存储介质
US15/665,965 US10643635B2 (en) 2017-05-31 2017-08-01 Electronic device and method for filtering anti-voice interference
TW107111700A TWI663595B (zh) 2017-05-31 2018-04-02 語音干擾濾除方法、語音干擾濾除裝置及電腦可讀存儲介質

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710396430.3A CN108986831B (zh) 2017-05-31 2017-05-31 语音干扰滤除的方法、电子装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN108986831A CN108986831A (zh) 2018-12-11
CN108986831B true CN108986831B (zh) 2021-04-20

Family

ID=64460723

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710396430.3A Active CN108986831B (zh) 2017-05-31 2017-05-31 语音干扰滤除的方法、电子装置及计算机可读存储介质

Country Status (3)

Country Link
US (1) US10643635B2 (zh)
CN (1) CN108986831B (zh)
TW (1) TWI663595B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109658930B (zh) * 2018-12-19 2021-05-18 Oppo广东移动通信有限公司 语音信号处理方法、电子装置及计算机可读存储介质
CN111210833A (zh) * 2019-12-30 2020-05-29 联想(北京)有限公司 音频处理方法、电子设备和介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5761638A (en) * 1995-03-17 1998-06-02 Us West Inc Telephone network apparatus and method using echo delay and attenuation
WO2002052546A1 (en) * 2000-12-27 2002-07-04 Intel Corporation Voice barge-in in telephony speech recognition
US20110069830A1 (en) * 2009-09-23 2011-03-24 Polycom, Inc. Detection and Suppression of Returned Audio at Near-End
CN102026080A (zh) * 2009-04-02 2011-04-20 奥迪康有限公司 基于插入和/或固有的信号特性及匹配恢复的自适应反馈抵消
CN102044253A (zh) * 2010-10-29 2011-05-04 深圳创维-Rgb电子有限公司 一种回声信号处理方法、系统及电视机
CN102314868A (zh) * 2010-06-30 2012-01-11 中兴通讯股份有限公司 一种风扇噪音的抑制方法和装置
CN102543060A (zh) * 2011-12-27 2012-07-04 瑞声声学科技(深圳)有限公司 有源噪声控制系统及其设计方法
WO2013007070A1 (zh) * 2011-07-08 2013-01-17 歌尔声学股份有限公司 一种抑制残留回声的方法和装置
CN105681513A (zh) * 2016-02-29 2016-06-15 上海游密信息科技有限公司 通话语音信号发送方法、系统及通话终端
CN106303119A (zh) * 2016-09-26 2017-01-04 维沃移动通信有限公司 一种通话过程中的回声消除方法和移动终端

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6515976B1 (en) * 1998-04-06 2003-02-04 Ericsson Inc. Demodulation method and apparatus in high-speed time division multiplexed packet data transmission
KR20020058116A (ko) 2000-12-29 2002-07-12 조미화 음성 제어 텔레비젼 수상기 및 음성 제어 방법
US6934345B2 (en) * 2001-01-17 2005-08-23 Adtran, Inc. Apparatus, method and system for correlated noise reduction in a trellis coded environment
KR100480789B1 (ko) * 2003-01-17 2005-04-06 삼성전자주식회사 피드백 구조를 이용한 적응적 빔 형성방법 및 장치
JP4940588B2 (ja) * 2005-07-27 2012-05-30 ソニー株式会社 ビート抽出装置および方法、音楽同期画像表示装置および方法、テンポ値検出装置および方法、リズムトラッキング装置および方法、音楽同期表示装置および方法
EP2015604A1 (en) * 2007-07-10 2009-01-14 Oticon A/S Generation of probe noise in a feedback cancellation system
WO2010112073A1 (en) * 2009-04-02 2010-10-07 Oticon A/S Adaptive feedback cancellation based on inserted and/or intrinsic characteristics and matched retrieval
US9589580B2 (en) * 2011-03-14 2017-03-07 Cochlear Limited Sound processing based on a confidence measure
CN102385862A (zh) * 2011-09-07 2012-03-21 武汉大学 一种面向空气信道传播的音频数字水印方法
EP2962299B1 (en) * 2013-02-28 2018-10-31 Nokia Technologies OY Audio signal analysis
US9185199B2 (en) * 2013-03-12 2015-11-10 Google Technology Holdings LLC Method and apparatus for acoustically characterizing an environment in which an electronic device resides
CN104050969A (zh) * 2013-03-14 2014-09-17 杜比实验室特许公司 空间舒适噪声
EP2922058A1 (en) * 2014-03-20 2015-09-23 Nederlandse Organisatie voor toegepast- natuurwetenschappelijk onderzoek TNO Method of and apparatus for evaluating quality of a degraded speech signal
TWI569263B (zh) * 2015-04-30 2017-02-01 智原科技股份有限公司 聲頻訊號的訊號擷取方法與裝置
CN105654962B (zh) * 2015-05-18 2020-01-10 宇龙计算机通信科技(深圳)有限公司 信号处理方法、装置及电子设备
CN105989846B (zh) * 2015-06-12 2020-01-17 乐融致新电子科技(天津)有限公司 一种多通道语音信号同步方法及装置
JP6404780B2 (ja) * 2015-07-14 2018-10-17 日本電信電話株式会社 ウィナーフィルタ設計装置、音強調装置、音響特徴量選択装置、これらの方法及びプログラム
US9455847B1 (en) * 2015-07-27 2016-09-27 Sanguoon Chung Wireless communication apparatus with phase noise mitigation
TWI671737B (zh) * 2015-08-07 2019-09-11 圓剛科技股份有限公司 回音消除裝置以及回音消除方法
CN106653046B (zh) * 2016-09-27 2020-07-14 北京云知声信息技术有限公司 一种语音采集中回路消噪的装置及方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5761638A (en) * 1995-03-17 1998-06-02 Us West Inc Telephone network apparatus and method using echo delay and attenuation
WO2002052546A1 (en) * 2000-12-27 2002-07-04 Intel Corporation Voice barge-in in telephony speech recognition
CN102026080A (zh) * 2009-04-02 2011-04-20 奥迪康有限公司 基于插入和/或固有的信号特性及匹配恢复的自适应反馈抵消
US20110069830A1 (en) * 2009-09-23 2011-03-24 Polycom, Inc. Detection and Suppression of Returned Audio at Near-End
CN102314868A (zh) * 2010-06-30 2012-01-11 中兴通讯股份有限公司 一种风扇噪音的抑制方法和装置
CN102044253A (zh) * 2010-10-29 2011-05-04 深圳创维-Rgb电子有限公司 一种回声信号处理方法、系统及电视机
WO2013007070A1 (zh) * 2011-07-08 2013-01-17 歌尔声学股份有限公司 一种抑制残留回声的方法和装置
CN102543060A (zh) * 2011-12-27 2012-07-04 瑞声声学科技(深圳)有限公司 有源噪声控制系统及其设计方法
CN105681513A (zh) * 2016-02-29 2016-06-15 上海游密信息科技有限公司 通话语音信号发送方法、系统及通话终端
CN106303119A (zh) * 2016-09-26 2017-01-04 维沃移动通信有限公司 一种通话过程中的回声消除方法和移动终端

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Parameters estimation of LFM echoes based on relationship of time delay and Doppler shift;Tao Sun et al;《2012 5th International Congress on Image and Signal Processing (CISP 2012)》;20121231;全文 *
滤波器组自适应语音增强方法;陈紫强等;《计算机工程与应用》;20081231;全文 *

Also Published As

Publication number Publication date
US10643635B2 (en) 2020-05-05
US20180350386A1 (en) 2018-12-06
CN108986831A (zh) 2018-12-11
TW201903756A (zh) 2019-01-16
TWI663595B (zh) 2019-06-21

Similar Documents

Publication Publication Date Title
US11138992B2 (en) Voice activity detection based on entropy-energy feature
JP6621536B2 (ja) 電子装置、身元認証方法、システム及びコンピュータ読み取り可能な記憶媒体
Trigeorgis et al. Adieu features? end-to-end speech emotion recognition using a deep convolutional recurrent network
JP6436633B2 (ja) ハプティック効果の自動適合
US20170125037A1 (en) Electronic device and method for recognizing speech
CN109308908B (zh) 一种语音交互方法及装置
US20200227039A1 (en) Electronic device and voice command identification method thereof
CN111028845A (zh) 多音频识别方法、装置、设备及可读存储介质
CN104123938A (zh) 语音控制系统、电子装置及语音控制方法
US10546574B2 (en) Voice recognition apparatus and method
JP6587742B2 (ja) サウンド混合処理方法および装置、装置、並びに記憶媒体
US11138987B2 (en) System and method to distinguish sources in a multiple audio source environment
US20230253003A1 (en) Speech processing method and speech processing apparatus
US20180033427A1 (en) Speech recognition transformation system
CN110837758B (zh) 一种关键词输入方法、装置及电子设备
CN108986831B (zh) 语音干扰滤除的方法、电子装置及计算机可读存储介质
US20160216944A1 (en) Interactive display system and method
CN110772700A (zh) 自动推送助眠乐曲方法、装置、计算机设备及存储介质
US10224029B2 (en) Method for using voiceprint identification to operate voice recognition and electronic device thereof
KR102220964B1 (ko) 오디오 인식을 위한 방법 및 디바이스
CN112489675A (zh) 一种多通道盲源分离方法、装置、机器可读介质及设备
WO2016197430A1 (zh) 信息输出的方法、终端和计算机存储介质
CN113724694B (zh) 语音转换模型训练方法、装置、电子设备及存储介质
CN113421554B (zh) 语音关键词检测模型处理方法、装置及计算机设备
CN116982111A (zh) 音频特征补偿方法、音频识别方法及相关产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant