TWI663595B - 語音干擾濾除方法、語音干擾濾除裝置及電腦可讀存儲介質 - Google Patents

語音干擾濾除方法、語音干擾濾除裝置及電腦可讀存儲介質 Download PDF

Info

Publication number
TWI663595B
TWI663595B TW107111700A TW107111700A TWI663595B TW I663595 B TWI663595 B TW I663595B TW 107111700 A TW107111700 A TW 107111700A TW 107111700 A TW107111700 A TW 107111700A TW I663595 B TWI663595 B TW I663595B
Authority
TW
Taiwan
Prior art keywords
audio signal
voice
background audio
background
sequence
Prior art date
Application number
TW107111700A
Other languages
English (en)
Other versions
TW201903756A (zh
Inventor
林燕星
Original Assignee
新加坡商雲網科技新加坡有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 新加坡商雲網科技新加坡有限公司 filed Critical 新加坡商雲網科技新加坡有限公司
Publication of TW201903756A publication Critical patent/TW201903756A/zh
Application granted granted Critical
Publication of TWI663595B publication Critical patent/TWI663595B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0224Processing in the time domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Noise Elimination (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

一種語音干擾濾除方法,其中,該方法包括步驟:通過音訊採集單元獲取外部環境中的第一音訊信號,該第一音訊信號中包括使用者語音信號;獲取音訊輸出單元輸出的第二音訊信號;過濾該第一音訊信號中的語音音區以得到第一背景音訊信號,過濾該第二音訊信號中的語音音區以得到第二背景音訊信號;通過對比第一背景音訊信號和第二背景音訊信號,得到時間差T和擴音參數X;對該第二音訊信號進行時間補償、放大和反相操作以得到第三音訊信號;合成該第一音訊信號與該第三音訊信號,得到與使用者語音信號接近的第四音訊信號。本發明還提供一種電子裝置、電腦可讀存儲介質。本發明可以避免使用者的控制語音受到音訊輸出單元聲源干擾的情況。

Description

語音干擾濾除方法、語音干擾濾除裝置及電腦可讀存儲介質
本發明涉及語音處理技術領域,尤其是涉及一種語音干擾濾除的方法、電子裝置及電腦可讀存儲介質。
隨著科技的發展,具有播放功能的電子裝置(如智慧電視、電腦、手機等)因具備豐富的功能與複雜的選項,傳統的控制方法(如遙控器控制、觸摸控制、鍵鼠控制)已不足以帶來便捷的控制與直覺式使用者體驗,因此多數產品開始導入語音控制。
然而,使用者在利用該電子裝置播放電影或音樂時,若想要通過語音控制該電子裝置,則必須關閉正在播放的電影或音樂,否則使用者所發出的控制語音容易受到該電子裝置所產生的音源干擾,其控制語音無法被該電子裝置精確識別,降低了使用者語音控制的控制效率和準確率。
鑒於以上內容,有必要提供一種語音干擾濾除的方法、電子裝置及電腦可讀存儲介質,可以讓使用者所發出的控制語音不會受到該電子裝置輸出的音源干擾,使得控制語音被該電子裝置精確識別,提高了使用者語音控制的控制效率。
本發明實施方式提供一種語音干擾濾除的方法,包括步驟:通過該音訊採集單元獲取外部環境中的第一音訊信號,該第一音訊信號中包括使用者語音信號;獲取該音訊輸出單元輸出的第二音訊信號;過濾該第一音訊信號中的語音音區以得到第一背景音訊信號,過濾該第二音訊信號中的語音音區以得到第二背景音訊信號;通過對比該第一背景音訊信號和該第二背景音訊信號,得到該第一音訊信號和該第二音訊信號之間的時間差T和擴音參數X;依據該時間差T及該擴音參數X,對該第二音訊信號進行時間補償、放大和反相操作以得到第三音訊信號;合成該第一音訊信號與該第三音訊信號,得到與該使用者語音信號接近的第四音訊信號。
本發明實施方式還提供一種電子裝置,該電子裝置包括記憶體、處理器、音訊採集單元、音訊輸出單元及存儲在該記憶體上並可在該處理器上運行的電腦程式,該電腦程式被該處理器執行時實現如該語音干擾濾除的方法的步驟。
進一步地,本發明實施方式還提供一種電腦可讀存儲介質,該電腦可讀存儲介質上存儲有電腦程式,該電腦程式被處理器執行時實現如該語音干擾濾除的方法的步驟。
相較於現有技術,所述之語音干擾濾除的方法、電子裝置及電腦可讀存儲介質,能夠使得使用者的控制語音被該電子裝置精確識別,提高了使用者語音控制的控制效率。
參閱圖1所示,是本發明實施例之電子裝置2的架構圖。在本實施例中,該電子裝置2中包括語音干擾濾除系統10、記憶體20、處理器30、音訊採集單元40及音訊輸出單元50。該電子裝置2可以是智慧家電、智慧手機、電腦等。
其中,該記憶體20至少包括一種類型的可讀存儲介質,該可讀存儲介質包括快閃記憶體、硬碟、多媒體卡、卡型記憶體(例如,SD或DX記憶體等)、隨機訪問記憶體(RAM)、靜態隨機訪問記憶體(SRAM)、唯讀記憶體(ROM)、電可擦除可程式設計唯讀記憶體(EEPROM)、可程式設計唯讀記憶體(PROM)、磁性記憶體、磁片、光碟等。該處理器30可以是中央處理器(Central Processing Unit,CPU)、控制器、微控制器、微處理器、或其他資料處理晶片等。
參閱圖2所示,是該語音干擾濾除系統10的程式模組圖。
該語音干擾濾除系統10包括獲取模組100、過濾模組200、對比模組300、修改模組400以及合成模組500。該模組被配置成由一個或多個處理器(本實施例為處理器30)執行,以完成本發明。本發明所稱的模組是完成特定功能的電腦程式段。該記憶體20用於存儲該語音干擾濾除系統10的程式碼等資料。該處理器30用於執行該記憶體20中存儲的程式碼。
該獲取模組100用於通過該音訊採集單元40獲取外部環境中的第一音訊信號,該第一音訊信號中包括使用者語音信號。
該獲取模組100還用於獲取該音訊輸出單元50輸出的第二音訊信號。在本實施例中,該第二音訊信號是從該電子裝置2內部獲取,而不是在該音訊輸出單元50輸出時從外部採集。
該過濾模組200用於過濾該第一音訊信號中的語音音區以得到第一背景音訊信號,過濾該第二音訊信號中的語音音區以得到第二背景音訊信號。在本實施例中,該語音音區是指人類正常聲音頻率對應的音區,例如80~1000HZ音區。
該對比模組300用於對比該第一背景音訊信號和該第二背景音訊信號,得到該第一音訊信號和該第二音訊信號之間的時間差T和擴音參數X。
在本實施例中,該對比模組300取樣該第一背景音訊信號以提取該第一背景音訊信號中多個取樣點的第一特徵值序列,及取樣該第二背景音訊信號以提取該第二背景音訊信號中多個取樣點的第二特徵值序列。
其中,計算該第一特徵值序列與該第二特徵值序列的方法包括:
設定一固定區間作為計算能量值的時間區間,區間長度為t。
在該第一背景音訊信號與該第二背景音訊信號的相同時間點,以該區間長度t設置連續n個該固定區間。在本實施例中,以n=10為例。
計算該第一背景音訊信號中設置的10個固定區間的能量值,得到第一區間能量序列,記為。依據各固定區間內音訊信號的振幅大小為該固定區間計算一對應的能量值,其中,為第一個固定區間的能量值、為第二個固定區間的能量值,以此類推。
同樣地,計算該第二背景音訊信號中設置的10個固定區間的能量值,得到第二區間能量序列,。其中,為第一個固定區間的能量值、為第二個固定區間的能量值,以此類推。
針對該第一背景音訊信號和該第二背景音訊信號,依序將每一固定區間的能量值與後一固定區間的能量值進行比較,得到多個特徵值。特徵值的計算公式如下:
其中,為第個該固定區間的能量值。
根據該第一區間能量序列計算得到多個特徵值,以取得第一特徵值序列
根據該第二區間能量序列計算得到多個特徵值,以取得第二特徵值序列
該對比模組300還用於對比該第一特徵值序列與該第二特徵值序列,得到一數值k,使得
例如,若,可以看出、…、,此時該數值k為2。
該時間差T等於該區間長度t與該數值k的乘積。
該對比模組300還用於根據該數值k計算該擴音參數X。
計算該擴音參數X的公式如下:
其中,為該第一背景音訊信號中第n個該固定區間的能量值,為該第二背景音訊信號中第n個該固定區間的能量值。例如:
,當k=2時,。此時,該擴音參數X=1.1971。
該修改模組400用於依據該時間差T及該擴音參數X,對該第二音訊信號進行時間補償、放大和反相操作以得到第三音訊信號。公式如下:
其中,為該第三音訊信號,為該第二音訊信號。
該合成模組500用於合成該第一音訊信號與該第三音訊信號,得到與該使用者語音信號接近的第四音訊信號。
其中,為該第四音訊信號,為該第一音訊信號,為該第三音訊信號。在本實施例中,該第四音訊信號為已經消除背景雜訊的使用者控制語音,可以直接輸入至該電子裝置2語音辨識系統進行辨識進而控制該電子裝置2。
參閱圖3所示,是本發明實施例之語音干擾濾除的方法的步驟流程圖。該語音干擾濾除的方法應用於該電子裝置2中,通過處理器30執行記憶體20中存儲的程式碼實現。
步驟S302,通過該音訊採集單元40獲取外部環境中的第一音訊信號,該第一音訊信號中包括使用者語音信號。
步驟S304,獲取該音訊輸出單元50輸出的第二音訊信號。
步驟S306,過濾該第一音訊信號中的語音音區以得到第一背景音訊信號,過濾該第二音訊信號中的語音音區以得到第二背景音訊信號。
步驟S308,通過對比該第一背景音訊信號和該第二背景音訊信號,得到該第一音訊信號和該第二音訊信號之間的時間差T和擴音參數X。
步驟S310,依據該時間差T及該擴音參數X,對該第二音訊信號進行時間補償、放大和反相操作以得到第三音訊信號。
步驟S312,合成該第一音訊信號與該第三音訊信號,得到與該使用者語音信號接近的第四音訊信號。
以上實施例僅用以說明本發明的技術方案而非限制,儘管參照較佳實施例對本發明進行了詳細說明,本領域的普通技術人員應當理解,可以對本發明的技術方案進行修改或等同替換,而不脫離本發明技術方案的精神和範圍。
2‧‧‧電子裝置
10‧‧‧語音干擾濾除系統
20‧‧‧記憶體
30‧‧‧處理器
40‧‧‧音訊採集單元
50‧‧‧音訊輸出單元
100‧‧‧獲取模組
200‧‧‧過濾模組
300‧‧‧對比模組
400‧‧‧修改模組
500‧‧‧合成模組
S302~S312‧‧‧語音干擾濾除方法的步驟流程
圖1是本發明實施例之電子裝置的架構圖。
圖2是本發明實施例之語音干擾濾除系統的程式模組圖。
圖3是本發明實施例之語音干擾濾除方法的步驟流程圖。

Claims (9)

  1. 一種語音干擾濾除方法,用於電子裝置中,該電子裝置包含至少一個音訊採集單元和至少一個音訊輸出單元,其中,該方法包括步驟: 通過該音訊採集單元獲取外部環境中的第一音訊信號,該第一音訊信號中包括使用者語音信號; 獲取該音訊輸出單元輸出的第二音訊信號; 過濾該第一音訊信號中的語音音區以得到第一背景音訊信號,過濾該第二音訊信號中的語音音區以得到第二背景音訊信號; 通過對比該第一背景音訊信號和該第二背景音訊信號,得到該第一音訊信號和該第二音訊信號之間的時間差T和擴音參數X; 依據該時間差T及該擴音參數X,對該第二音訊信號進行時間補償、放大和反相操作以得到第三音訊信號;及 合成該第一音訊信號與該第三音訊信號,得到與該使用者語音信號接近的第四音訊信號。
  2. 如請求項1所述之語音干擾濾除方法,其中,該得到該第一音訊信號和該第二音訊信號之間的時間差T和擴音參數X的步驟還包括: 取樣該第一背景音訊信號以提取該第一背景音訊信號中多個取樣點的第一特徵值序列,及取樣該第二背景音訊信號以提取該第二背景音訊信號中多個取樣點的第二特徵值序列; 根據該第一特徵值序列和該第二特徵值序列,計算得到該第一背景音訊信號和該第二背景音訊信號之間的時間差T; 根據該時間差T,補償該第二背景音訊信號並將補償後的第二背景音訊信號和該第一背景音訊信號進行對比,以得到該擴音參數X。
  3. 如請求項2所述之語音干擾濾除方法,其中,該取樣該第一背景音訊信號以提取該第一背景音訊信號中多個取樣點的第一特徵值序列,及取樣該第二背景音訊信號以提取該第二背景音訊信號中多個取樣點的第二特徵值序列的步驟還包括: 設定一固定區間作為計算能量值的時間區間,區間長度為t; 在該第一背景音訊信號與該第二背景音訊信號的相同時間點以該區間長度t設置連續n個該固定區間; 計算該第一背景音訊信號中設置的n個區間的能量值,得到第一區間能量序列,記為
    Figure TWI663595B_C0001
    ; 計算該第二背景音訊信號中設置的n個區間內的能量,得到第二區間能量序列,記為
    Figure TWI663595B_C0002
    ; 針對該第一背景音訊信號和該第二背景音訊信號,將每一固定區間內的能量與後一固定區間內的能量進行比較,得到多個特徵值,從而得到第一特徵值序列
    Figure TWI663595B_C0003
    和第二特徵值序列
    Figure TWI663595B_C0004
  4. 如請求項3所述語音干擾濾除方法,其中,特徵值
    Figure TWI663595B_C0005
    的計算公式如下:
    Figure TWI663595B_C0006
    其中,
    Figure TWI663595B_C0007
    為第
    Figure TWI663595B_C0008
    個該固定區間的能量值。
  5. 如請求項3所述之語音干擾濾除方法,其中,該根據該第一特徵值序列和該第二特徵值序列,計算得到該第一背景音訊信號和該第二背景音訊信號之間的時間差T的步驟還包括: 對比該第一特徵值序列
    Figure TWI663595B_C0003
    與該第二特徵值序列
    Figure TWI663595B_C0004
    ,得到一數值k,使得
    Figure TWI663595B_C0009
    ; 該時間差T等於該區間長度t與該數值k的乘積。
  6. 如請求項5所述之語音干擾濾除方法,其中,計算該擴音參數X的公式為:
    Figure TWI663595B_C0010
    其中,
    Figure TWI663595B_C0011
    為該第一背景音訊信號中第n個該固定區間的能量值,
    Figure TWI663595B_C0012
    為該第二背景音訊信號中第n個該固定區間內的能量值。
  7. 如請求項1所述之語音干擾濾除方法,其中,該第三音訊信號的計算公式為:
    Figure TWI663595B_C0013
    其中,
    Figure TWI663595B_C0014
    為該第三音訊信號,
    Figure TWI663595B_C0015
    為該第二音訊信號。
  8. 一種電腦可讀存儲介質,其用於存儲多條程式指令,該些程式指令當由語音干擾濾除裝置執行時,使得該語音干擾濾除裝置實現如請求項1至7中任一項所述之語音干擾濾除方法的步驟。
  9. 一種語音干擾濾除裝置,包括:至少一個音訊採集單元和至少一個音訊輸出單元、記憶體、處理器及存儲在該記憶體上並可在該處理器上運行的電腦程式,該電腦程式被該處理器執行時實現如請求項1至7中任一項所述之語音干擾濾除方法的步驟。
TW107111700A 2017-05-31 2018-04-02 語音干擾濾除方法、語音干擾濾除裝置及電腦可讀存儲介質 TWI663595B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
??201710396430.3 2017-05-31
CN201710396430.3A CN108986831B (zh) 2017-05-31 2017-05-31 语音干扰滤除的方法、电子装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
TW201903756A TW201903756A (zh) 2019-01-16
TWI663595B true TWI663595B (zh) 2019-06-21

Family

ID=64460723

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107111700A TWI663595B (zh) 2017-05-31 2018-04-02 語音干擾濾除方法、語音干擾濾除裝置及電腦可讀存儲介質

Country Status (3)

Country Link
US (1) US10643635B2 (zh)
CN (1) CN108986831B (zh)
TW (1) TWI663595B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109658930B (zh) * 2018-12-19 2021-05-18 Oppo广东移动通信有限公司 语音信号处理方法、电子装置及计算机可读存储介质
CN111210833A (zh) * 2019-12-30 2020-05-29 联想(北京)有限公司 音频处理方法、电子设备和介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160027421A1 (en) * 2013-02-28 2016-01-28 Nokia Technologies Oy Audio signal analysis
US20160027447A1 (en) * 2013-03-14 2016-01-28 Dolby International Ab Spatial comfort noise
CN105580076A (zh) * 2013-03-12 2016-05-11 谷歌技术控股有限责任公司 用于听觉上表征电子设备所处的环境的方法和装置
CN105654962A (zh) * 2015-05-18 2016-06-08 宇龙计算机通信科技(深圳)有限公司 信号处理方法、装置及电子设备
TW201638932A (zh) * 2015-04-30 2016-11-01 智原科技股份有限公司 聲頻訊號的訊號擷取方法與裝置
JP2017021267A (ja) * 2015-07-14 2017-01-26 日本電信電話株式会社 ウィナーフィルタ設計装置、音強調装置、音響特徴量選択装置、これらの方法及びプログラム
TW201706984A (zh) * 2015-08-07 2017-02-16 圓剛科技股份有限公司 回音消除裝置以及回音消除方法
CN106653046A (zh) * 2016-09-27 2017-05-10 北京云知声信息技术有限公司 一种语音采集中回路消噪的装置及方法
US20170148470A1 (en) * 2011-03-14 2017-05-25 Adam A. Hersbach Sound processing based on a confidence measure

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5761638A (en) * 1995-03-17 1998-06-02 Us West Inc Telephone network apparatus and method using echo delay and attenuation
US6515976B1 (en) * 1998-04-06 2003-02-04 Ericsson Inc. Demodulation method and apparatus in high-speed time division multiplexed packet data transmission
US7437286B2 (en) * 2000-12-27 2008-10-14 Intel Corporation Voice barge-in in telephony speech recognition
KR20020058116A (ko) 2000-12-29 2002-07-12 조미화 음성 제어 텔레비젼 수상기 및 음성 제어 방법
US6934345B2 (en) * 2001-01-17 2005-08-23 Adtran, Inc. Apparatus, method and system for correlated noise reduction in a trellis coded environment
KR100480789B1 (ko) * 2003-01-17 2005-04-06 삼성전자주식회사 피드백 구조를 이용한 적응적 빔 형성방법 및 장치
JP4940588B2 (ja) * 2005-07-27 2012-05-30 ソニー株式会社 ビート抽出装置および方法、音楽同期画像表示装置および方法、テンポ値検出装置および方法、リズムトラッキング装置および方法、音楽同期表示装置および方法
EP2015604A1 (en) * 2007-07-10 2009-01-14 Oticon A/S Generation of probe noise in a feedback cancellation system
US8442251B2 (en) * 2009-04-02 2013-05-14 Oticon A/S Adaptive feedback cancellation based on inserted and/or intrinsic characteristics and matched retrieval
DK2237573T3 (da) * 2009-04-02 2021-05-03 Oticon As Adaptiv feedbackundertrykkelsesfremgangsmåde og anordning dertil
US8625776B2 (en) 2009-09-23 2014-01-07 Polycom, Inc. Detection and suppression of returned audio at near-end
CN102314868A (zh) * 2010-06-30 2012-01-11 中兴通讯股份有限公司 一种风扇噪音的抑制方法和装置
CN102044253B (zh) * 2010-10-29 2012-05-30 深圳创维-Rgb电子有限公司 一种回声信号处理方法、系统及电视机
DK2568695T3 (en) * 2011-07-08 2016-11-21 Goertek Inc Method and device for suppressing residual echo
CN102385862A (zh) * 2011-09-07 2012-03-21 武汉大学 一种面向空气信道传播的音频数字水印方法
CN102543060B (zh) * 2011-12-27 2014-03-12 瑞声声学科技(深圳)有限公司 有源噪声控制系统及其设计方法
EP2922058A1 (en) * 2014-03-20 2015-09-23 Nederlandse Organisatie voor toegepast- natuurwetenschappelijk onderzoek TNO Method of and apparatus for evaluating quality of a degraded speech signal
CN105989846B (zh) * 2015-06-12 2020-01-17 乐融致新电子科技(天津)有限公司 一种多通道语音信号同步方法及装置
US9455847B1 (en) * 2015-07-27 2016-09-27 Sanguoon Chung Wireless communication apparatus with phase noise mitigation
CN105681513A (zh) * 2016-02-29 2016-06-15 上海游密信息科技有限公司 通话语音信号发送方法、系统及通话终端
CN106303119A (zh) * 2016-09-26 2017-01-04 维沃移动通信有限公司 一种通话过程中的回声消除方法和移动终端

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170148470A1 (en) * 2011-03-14 2017-05-25 Adam A. Hersbach Sound processing based on a confidence measure
US20160027421A1 (en) * 2013-02-28 2016-01-28 Nokia Technologies Oy Audio signal analysis
CN105580076A (zh) * 2013-03-12 2016-05-11 谷歌技术控股有限责任公司 用于听觉上表征电子设备所处的环境的方法和装置
US20160027447A1 (en) * 2013-03-14 2016-01-28 Dolby International Ab Spatial comfort noise
TW201638932A (zh) * 2015-04-30 2016-11-01 智原科技股份有限公司 聲頻訊號的訊號擷取方法與裝置
CN105654962A (zh) * 2015-05-18 2016-06-08 宇龙计算机通信科技(深圳)有限公司 信号处理方法、装置及电子设备
JP2017021267A (ja) * 2015-07-14 2017-01-26 日本電信電話株式会社 ウィナーフィルタ設計装置、音強調装置、音響特徴量選択装置、これらの方法及びプログラム
TW201706984A (zh) * 2015-08-07 2017-02-16 圓剛科技股份有限公司 回音消除裝置以及回音消除方法
CN106653046A (zh) * 2016-09-27 2017-05-10 北京云知声信息技术有限公司 一种语音采集中回路消噪的装置及方法

Also Published As

Publication number Publication date
CN108986831A (zh) 2018-12-11
TW201903756A (zh) 2019-01-16
US20180350386A1 (en) 2018-12-06
US10643635B2 (en) 2020-05-05
CN108986831B (zh) 2021-04-20

Similar Documents

Publication Publication Date Title
CN108352159B (zh) 用于识别语音的电子设备和方法
WO2019101123A1 (zh) 语音活性检测方法、相关装置和设备
JP2019003700A (ja) ハプティック効果の自動適合
CN109308908B (zh) 一种语音交互方法及装置
US9812104B2 (en) Sound providing method and electronic device for performing the same
US10831440B2 (en) Coordinating input on multiple local devices
TWI663595B (zh) 語音干擾濾除方法、語音干擾濾除裝置及電腦可讀存儲介質
US11703320B2 (en) Determining relative positions of user devices
WO2017107654A1 (zh) 一种页面入口图标的显示方法及装置
US20150310878A1 (en) Method and apparatus for determining emotion information from user voice
KR102519902B1 (ko) 오디오 데이터를 처리하는 방법 및 이를 제공하는 전자 장치
US20150018993A1 (en) System and method for audio processing using arbitrary triggers
US11601774B2 (en) System and method for real time loudspeaker equalization
TW202109508A (zh) 聲音分離方法、電子設備和電腦可讀儲存媒體
JP5395399B2 (ja) 携帯端末、拍位置推定方法および拍位置推定プログラム
CN112489675A (zh) 一种多通道盲源分离方法、装置、机器可读介质及设备
CN110534110B (zh) 一种机器人及提高其语音交互识别率的方法、装置和电路
EP3170176B1 (en) Separating, modifying and visualizing audio objects
WO2016110156A1 (zh) 语音搜索方法、装置、终端和计算机存储介质
CN116982111A (zh) 音频特征补偿方法、音频识别方法及相关产品
WO2018129854A1 (zh) 一种语音处理方法及装置
CN110210317B (zh) 检测基频的方法、装置及计算机可读存储介质
CN105741830B (zh) 一种音频合成方法及装置
KR102670793B1 (ko) 적응적 라우드스피커 이퀄라이제이션
CN109690956A (zh) 邻接存储器地址处的数据存储