TWI451405B - 增進語音即時輸出之方法及助聽器 - Google Patents

增進語音即時輸出之方法及助聽器 Download PDF

Info

Publication number
TWI451405B
TWI451405B TW100138125A TW100138125A TWI451405B TW I451405 B TWI451405 B TW I451405B TW 100138125 A TW100138125 A TW 100138125A TW 100138125 A TW100138125 A TW 100138125A TW I451405 B TWI451405 B TW I451405B
Authority
TW
Taiwan
Prior art keywords
sound
segment
frequency
sound segment
silent
Prior art date
Application number
TW100138125A
Other languages
English (en)
Other versions
TW201317983A (zh
Inventor
Kuan Li Chao
Neo Bob Chih Yung Yang
jing wei Li
Kuo Ping Yang
Original Assignee
Kuo Ping Yang
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kuo Ping Yang filed Critical Kuo Ping Yang
Priority to TW100138125A priority Critical patent/TWI451405B/zh
Priority to CN201210301908.7A priority patent/CN103067840B/zh
Publication of TW201317983A publication Critical patent/TW201317983A/zh
Application granted granted Critical
Publication of TWI451405B publication Critical patent/TWI451405B/zh

Links

Description

增進語音即時輸出之方法及助聽器
本發明係關於一種用於聽障者之助聽器。
助聽器之發展由來已久,主要概念為將聲音放大,以幫助聽障者聽見原本聽不到的聲音,將聲音放大的處理幾乎不會產生延遲。另外助聽器若針對頻率進行處理,通常是將聲音頻率降低,譬如先前技術美國專利第6,577,739號”Apparatus and methods for proportional audio compression and frequency shifting”將聲音訊號以某比例壓縮後,提供給對某特定範圍有聽力損失的聽障者,然此技術是對全體聲音做壓縮,雖然可即時輸出,但會使得聲音失真嚴重。
若只針對部分高頻聲音進行降頻,則失真就會降低,然而這牽涉大量運算,因此會造成延遲的問題,常常不適用於即時語音之處理,力如申請人於專利申請第099141772號(美國專利申請第13/064,645號)雖可減少失真,但會有輸出延遲的問題產生。
因此如何減少聲音輸出的失真之狀況下,也能減少聲音輸出延遲的問題是有需要被解決的。
語音在處理變頻的過程中,有時會產生延遲的現象,造成輸出的語音不能同步輸出,本發明之主要目的係在增進語音即時輸出之方法。
為達成上述之目的,本發明包括下列步驟:將該輸入聲音切割為複數聲音段。
由複數聲音段中尋找至少二種不同屬性之聲音段:靜音聲音段,靜音聲音段之聲音能量小於一聲音能量門檻值;非靜音聲音段,非靜音聲音段之聲音能量大於一聲音能量門檻值,在實施例中,非靜音聲音段被區分為高頻及低頻兩種屬性。
輸出部分之複數聲音段,其中:針對全部或部分非靜音聲音段進行變頻處理後全部輸出。在實施例中,當非靜音聲音段之屬性為高頻時,則要進行變頻處理;當非靜音聲音段之屬性為低頻時,則不進行變頻處理。
以及針對全部或部分該靜音聲音段消除而不輸出。
藉由上述之步驟,全部或部分非靜音聲音段進行變頻處理而產生時間延遲,可透過消除全部或部分該靜音聲音段,以降低或消除播放非靜音聲音段之延遲。
為讓本發明之上述和其他目的、特徵和優點能更明顯易懂,下文特舉出本發明之具體實施例,並配合所附圖式,作詳細說明如下。
以下請先參考圖1係本發明之助聽器之整體架構圖。
本發明之助聽器10包括收音器11、聲音處理模組12及聲音輸出模組13。收音器11用於接收聲源80發出之輸入聲音20,交由聲音處理模組12處理後,由聲音輸出模組13輸出。收音器11可為麥克風等任何可收音之器材,聲音輸出模組13可包括揚聲器,耳機等任何可播音之器材,但本發明不以上述列舉之裝置為限。聲音處理模組12一般為音效處理晶片搭配控制電路、放大電路所組成;亦可為處理器、記憶體搭配控制電路、放大電路所組成之解決技術。聲音處理模組12之重點為聲音訊號之放大處理、濾除噪音、改變聲音頻率組成以及為了達成本發明目的而需要之處理,由於聲音處理模組12可用習知之硬體搭配新的韌體或軟體,因此聲音處理模組12之硬體架構不再贅述。本發明之助聽器10基本上可以為將硬體特製化之專用機,亦可為小型電腦如PDA、PDA手機,或智慧型手機以及個人電腦。譬如以手機而言,處理器執行記憶體內的軟體程式後,配合聲音晶片、麥克風及喇叭(外接式或耳機)即形成如圖1聲音處理模組12的主要架構,現在手機處理器執行速度加快,手機配合適當軟體即可成為助聽器。
接著請參考圖2,係關於本發明聲音處理模組之步驟流程圖。另請一併參考圖3及圖4,係關於本發明之相關實施例之示意圖,圖3及圖4以每一階段接著每一階段(step by step)之方式(階段0~階段11)呈現示意圖,以方便瞭解本發明之重點。
步驟201:
接收一輸入聲音20。
此步驟由收音器11完成,接收自聲源80發出之輸入聲音20。
步驟202:
將輸入聲音20切割為複數聲音段。
請參考圖3的『階段0』,為方便說明起見被切割之輸入聲音20依照時間順序被標註為S1,S2,S3....聲音段,而每一聲音段(S1~S11)的屬性被標註為”L”,“H”,或“Q”。譬如聲音段S1被標註為”L”之意義代表聲音段S1的聲音偏向低頻聲音;如聲音段S3被標註為”H”之意義代表聲音段S3的聲音偏向高頻聲音;而如聲音段S8被標註為”Q”之意義代表聲音段S8的聲音為靜音(譬如分貝數低於15以下)。
每一聲音段之時間長度建議為0.0001~0.1秒之間,以I-Phone4做為助聽器的實驗中(根據本發明所製作之軟體於I-Phone4中執行),聲音段之時間長度約在0.0001~00.1秒之間效果不錯。
步驟203:
由複數聲音段中尋找至少二種不同屬性之聲音段:靜音聲音段,該靜音聲音段之聲音能量小於一聲音能量門檻值;非靜音聲音段,該非靜音聲音段之聲音能量大於一聲音能量門檻值。
聲音處理模組12除了將輸入聲音20切割為複數聲音段之外,並且要判斷每一聲音段的屬性”L”,“H”,或“Q”。聲音段是否為靜音(”Q”)非常容易判斷,基本上只要給一聲音能量門檻值(如15分貝),只要低於設定之門檻值則被判斷為靜音。聲音能量只要高於門檻值都是非靜音聲音段,在本實施例中,非靜音聲音段分為至少兩種屬性,被標註為”L”(低頻聲音)或“H”(高頻聲音)。
至於聲音段的聲音是偏向高頻聲音或低頻聲音,主要判斷的方式是根據聽障者之狀況而定。一般而言,人類語言溝通的頻率為20赫茲~16000赫茲,而一般聽障者難以聽到3000赫茲或4000赫茲以上的頻率,聽障程度越重度,則所能聽到的高頻範圍越少。因此每一聲音段的屬性為”L”或“H”即以聽障者做為判斷。關於如何判斷哪一聲音段是屬於”L”或“H”之判斷方式很多,譬如分析每一聲音段有無出現高於某一赫茲(如3000赫茲)的聲音,然而此種簡單方式判斷上較不精準。申請人於專利申請第099141772號(美國專利申請第13/064,645號)亦揭露以高頻或低頻能量來判斷,譬如以下是幾種可行之判斷方式:
若1000赫茲(Hz)以下頻率之聲音能量係最多佔30%,且2500赫茲(Hz)以上頻率之聲音能量至少佔70%則為高頻”H”屬性,反之屬於低頻”L”屬性。
若1000赫茲(Hz)以下頻率之聲音能量係至少佔30%則為低頻”L”屬性,反之屬於高頻”H”屬性。
若1000赫茲(Hz)以下頻率之聲音能量最多佔30%則為高頻”H”屬性,反之屬於低頻”L”屬性。
若2500赫茲(Hz)以上頻率之聲音能量至少佔70%則為高頻”H”屬性,反之屬於低頻”L”屬性。
聲音處理模組12基本上可以一切割出聲音段,馬上判斷其屬性,亦可每切割出如5個聲音段,再一次判斷各聲音段之屬性的批次方式進行。
步驟204:
輸出部分之複數聲音段,其中:針對全部或部分非靜音聲音段進行變頻處理後全部輸出;以及針對全部或部分該靜音聲音段消除而不輸出。
於本實施例中,僅針對非靜音聲音段但屬性為“H”(高頻聲音)進行變頻處理,對於非靜音聲音段但屬性為“L”(低頻聲音)不進行變頻處理。這是因為聽障者難以聽到高頻聲音,因此屬性為“H”的聲音段為『需處理聲音段』,而屬性為“L”的聲音段為『不需處理聲音段』。為了聽障者聽到高頻聲音,因此變頻處理基本上為降低聲音頻率之處理,譬如以壓頻或移頻方式處理。關於壓頻或移頻之技術為已知技術,在此不再贅述。需注意的是,為了使聽障者聽到高頻聲音,傳統技術是將整段聲音進行降低聲音頻率之處理,因此處理過的聲音失真很嚴重。專利申請第099141772號(美國專利申請第13/064,645號)即是改善此問題,然而採用先判斷是否為高頻或低頻,再決定僅針對高頻聲音段進行處理則會有延遲的問題,因此採用專利申請第099141772號(美國專利申請第13/064,645號)之技術對於即時性聲音輸出會有較明顯延遲之問題產生,因此本發明即針對此問題進行改善。
以下請參考圖3及圖4關於實施例之敘述。
階段0:一開始之狀態,關於標註請見步驟202之說明。
階段1:第一個聲音段S1屬性為低頻”L”,因此不進行變頻處理然後輸出。需注意的是,為使聽障者聽到聲音,輸出之聲音段一般要經過放大處理(增加聲音能量)。
階段2:第二個聲音段S2屬性為低頻”L”,因此不進行變頻處理然後輸出。
階段3:第三個聲音段S3屬性為高頻”H”,因此需要進行變頻處理,由於進行變頻處理需要一時間,此時開始產生延遲輸出,聲音段S3此時無法即時輸出。為方便解說起見,在階段3以聲音段SX做為一個虛擬輸出,聲音段SX事實上無聲音也代表延遲之時段。
階段4:第四個聲音段S4屬性為高頻”H”,因此需要進行變頻處理,在本實施例假設處理變頻所需時間等於兩個聲音段時間,因此聲音段S3仍無法輸出,當然S4也還在處理變頻因此也無法輸出,同樣的另一個聲音段SX加入階段4。
階段5:由於聲音段S3已經處理好了,因此輸出聲音段S3。由圖可知,若完全無延遲,在階段5時,聲音段S5應該要輸出,但因為有兩個延遲SX,因此在階段5時聲音段S3才輸出。
階段6:由於聲音段S4已經處理好了,因此輸出聲音段S4。
階段7:第五個聲音段S5屬性為低頻”L”,因此不進行變頻處理然後輸出。
階段8:第六個聲音段S6屬性為低頻”L”,因此不進行變頻處理然後輸出。
階段9:第七個聲音段S7屬性為低頻”L”,因此不進行變頻處理然後輸出。由圖可知,階段3之延遲為一個聲音段時間(一個SX),而從階段4~階段9之延遲為兩個聲音段時間(兩個SX)。
階段10:接下來聲音段S8,聲音段S9及聲音段S10都是靜音。本發明針對全部或部分靜音聲音段消除而不輸出。以此實施例而言,因為延遲了兩個聲音段時間,因此聲音段S8及聲音段S9都不輸出,只輸出聲音段S10。
因此之前有延遲時,本發明即以不輸出全部或部分靜音聲音,以達成減少或消除延遲。假設目前累積有6個聲音段的延遲,而若後面有4個靜音聲音段,則4個靜音聲音段都不輸出;當後面有8個靜音聲音段,則有6個靜音聲音段不輸出,但會輸出2個靜音聲音段。
一般而言,語音溝通高頻聲音段佔得最少(常常10%以下),而低頻聲音段佔得最多,靜音聲音段比高頻聲音段多了許多。因此當聲音處理模組12夠快時,去除一些靜音聲音段可以彌補高頻聲音段進行變頻所延遲的時間。
階段11:第十一個聲音段S11屬性為低頻”L”,因此不進行變頻處理然後輸出。在階段11輸出聲音段S11顯示沒有延遲發生了。
需注意的是,一般助聽器中聲音處理模組12基本上會包括放大聲音以及雜訊消除處理,上述由於放大聲音以及雜訊消除之處理並非本發明之重點,因此不再此贅述。
綜上所陳,本發明無論就目的、手段及功效,在在均顯示其迥異於習知技術之特徵,懇請 貴審查委員明察,早日賜准專利,俾嘉惠社會,實感德便。惟應注意的是,上述諸多實施例僅係為了便於說明而舉例而已,本發明所主張之權利範圍
10...助聽器
11...收音器
12...聲音處理模組
13...聲音輸出模組
20...輸入聲音
21...改造輸入聲音
80...聲源
81...聽障者
圖1係本發明之助聽器之整體架構圖。
圖2係本發明之聲音處理模組之步驟流程圖。
圖3係解釋本發明處理聲音之示意圖。
圖4係解釋本發明處理聲音之示意圖。
步驟 201
步驟 202
步驟 203
步驟 204

Claims (14)

  1. 一種增進語音即時輸出之方法,係用於一助聽器,該方法包括:接收一輸入聲音;將該輸入聲音切割為複數聲音段;由複數聲音段中尋找至少二種不同屬性之聲音段:靜音聲音段,該靜音聲音段之聲音能量小於一聲音能量門檻值;非靜音聲音段,該非靜音聲音段之聲音能量大於一聲音能量門檻值;輸出部分之複數聲音段,其中:針對全部或部分非靜音聲音段進行變頻處理後全部輸出;以及針對全部或部分該靜音聲音段消除而不輸出;藉由上述之步驟,全部或部分非靜音聲音段進行變頻處理而產生時間延遲,可透過消除全部或部分該靜音聲音段,以降低或消除播放非靜音聲音段之延遲。
  2. 如申請專利範圍第1項所述之增進語音即時輸出之方法,其中非靜音聲音段包括不需處理聲音段及需處理聲音段兩種,其中於輸出部分之複數聲音段時:當聲音段為需處理聲音段時,將需處理聲音段進行變頻處理後輸出;以及當聲音段為不需處理聲音段時,將不需處理聲音段以不進行變頻處理輸出。
  3. 如申請專利範圍第2項所述之增進語音即時輸出之方法,其中變頻處理係為降低聲音頻率之處理。
  4. 如申請專利範圍第3項所述之增進語音即時輸出之方法,其中降低聲音頻率之處理係以壓頻或移頻方式處理。
  5. 如申請專利範圍第3項所述之增進語音即時輸出之方法,其中不需處理聲音段係合乎下列條件:1000赫茲(Hz)以下頻率之聲音能量係至少佔30%。
  6. 如申請專利範圍第3項所述之增進語音即時輸出之方法,其中需處理聲音段係合乎下列其中至少一條件:1000赫茲(Hz)以下頻率之聲音能量最多佔30%且2500赫茲(Hz)以上頻率之聲音能量至少佔70%;2500赫茲(Hz)以上頻率之聲音能量至少佔70%;1000赫茲(Hz)以下頻率之聲音能量最多佔30%;或2500赫茲(Hz)以上頻率之聲音能量至少佔70%。
  7. 如申請專利範圍第1~6項任一項所述之增進語音即時輸出之方法,其中,每一聲音段之時間長度為0.0001~0.1秒之間。
  8. 一種助聽器,包括:一收音器,用以接收一輸入聲音;一聲音處理模組,與該收音器電性連接,用以:將該輸入聲音切割為複數聲音段;由複數聲音段中尋找至少二種不同屬性之聲音段:靜音聲音段,該靜音聲音段之聲音能量小於一聲音能量門檻值;非靜音聲音段,該非靜音聲音段之聲音能量大於一聲音能量門檻值;針對全部或部分非靜音聲音段進行變頻處理;針對全部或部分該靜音聲音段消除;以及一聲音輸出模組,與該聲音處理模組電性連接,用以輸出該聲音處理模組處理後之全部或部分之複數聲音段;藉由上述之構造,全部或部分非靜音聲音段進行變頻處理而產生時間延遲,可透過消除全部或部分該靜音聲音段,以降低或消除播放非靜音聲音段之延遲。
  9. 如申請專利範圍第8項所述之助聽器,其中非靜音聲音段包括不需處理聲音段及需處理聲音段兩種,其中於輸出部分之複數聲音段時:當聲音段為需處理聲音段時,將需處理聲音段進行變頻處理後輸出;以及當聲音段為不需處理聲音段時,將不需處理聲音段以不進行變頻處理輸出。
  10. 如申請專利範圍第9項所述之助聽器,其中變頻處理係為降低聲音頻率之處理。
  11. 如申請專利範圍第10項所述之助聽器,其中降低聲音頻率之處理係以壓頻或移頻方式處理。
  12. 如申請專利範圍第10項所述之助聽器,其中不需處理聲音段係合乎下列條件:1000赫茲(Hz)以下頻率之聲音能量係至少佔30%。
  13. 如申請專利範圍第10項所述之助聽器,其中需處理聲音段係合乎下列其中至少一條件:1000赫茲(Hz)以下頻率之聲音能量最多佔30%且2500赫茲(Hz)以上頻率之聲音能量至少佔70%;2500赫茲(Hz)以上頻率之聲音能量至少佔70%;1000赫茲(Hz)以下頻率之聲音能量最多佔30%;或2500赫茲(Hz)以上頻率之聲音能量至少佔70%。
  14. 如申請專利範圍第8~13項任一項所述之助聽器,其中,每一聲音段之時間長度為0.0001~0.1秒之間。
TW100138125A 2011-10-20 2011-10-20 增進語音即時輸出之方法及助聽器 TWI451405B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW100138125A TWI451405B (zh) 2011-10-20 2011-10-20 增進語音即時輸出之方法及助聽器
CN201210301908.7A CN103067840B (zh) 2011-10-20 2012-08-22 增进语音即时输出的方法及助听器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW100138125A TWI451405B (zh) 2011-10-20 2011-10-20 增進語音即時輸出之方法及助聽器

Publications (2)

Publication Number Publication Date
TW201317983A TW201317983A (zh) 2013-05-01
TWI451405B true TWI451405B (zh) 2014-09-01

Family

ID=48110270

Family Applications (1)

Application Number Title Priority Date Filing Date
TW100138125A TWI451405B (zh) 2011-10-20 2011-10-20 增進語音即時輸出之方法及助聽器

Country Status (2)

Country Link
CN (1) CN103067840B (zh)
TW (1) TWI451405B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104427433A (zh) * 2013-08-20 2015-03-18 杨国屏 声音处理的方法及开放式播音装置
DK2988529T3 (da) * 2014-08-20 2020-02-24 Sivantos Pte Ltd Adaptiv opdelingsfrekvens i hørehjælpeapparater
CN106157966B (zh) * 2015-04-15 2019-08-13 宏碁股份有限公司 语音信号处理装置及语音信号处理方法
TWI603627B (zh) * 2015-07-03 2017-10-21 元鼎音訊股份有限公司 處理聲音段之方法及其電腦程式產品及助聽器
CN106101969A (zh) * 2016-08-18 2016-11-09 孟玲 增进语音即时输出的助听器

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002015395A1 (en) * 2000-07-27 2002-02-21 Clear Audio Ltd. Voice enhancement system
WO2011116309A1 (en) * 2010-03-19 2011-09-22 Digimarc Corporation Intuitive computing methods and systems

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101227759B (zh) * 2007-01-15 2013-01-23 昆山杰得微电子有限公司 具有自动音量控制功能的耳机装置
CN101060724A (zh) * 2007-04-25 2007-10-24 比特联创电子(北京)有限公司 避免音频设备损害听力的方法及用该方法制成的电声装置
US8861742B2 (en) * 2010-01-26 2014-10-14 Yamaha Corporation Masker sound generation apparatus and program

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002015395A1 (en) * 2000-07-27 2002-02-21 Clear Audio Ltd. Voice enhancement system
WO2011116309A1 (en) * 2010-03-19 2011-09-22 Digimarc Corporation Intuitive computing methods and systems

Also Published As

Publication number Publication date
CN103067840B (zh) 2015-10-21
CN103067840A (zh) 2013-04-24
TW201317983A (zh) 2013-05-01

Similar Documents

Publication Publication Date Title
TWI576824B (zh) 處理聲音段之方法及其電腦程式產品及助聽器
US10043515B2 (en) Voice activation system
TWI451770B (zh) 增加聽障者聽到聲音正確性之方法及助聽器
JP4986182B2 (ja) 電子機器用音響処理システム、方法及び携帯電話端末
TWI451405B (zh) 增進語音即時輸出之方法及助聽器
US20100329473A1 (en) Apparatus, method and computer program
US9672843B2 (en) Apparatus and method for improving an audio signal in the spectral domain
CN102104815A (zh) 自动调音耳机及耳机调音方法
US10020003B2 (en) Voice signal processing apparatus and voice signal processing method
TWI504282B (zh) 增加聽障者聽到聲音正確性之方法及助聽器
TWI543634B (zh) 處理聲音段之方法及其電腦程式產品及助聽器
US9787824B2 (en) Method of processing telephone signals and electronic device thereof
CN111063363B (zh) 一种语音获取方法、音频设备和具有存储功能的装置
US10109293B2 (en) Voice signal processing apparatus and voice signal processing method
CN113259801A (zh) 一种智能耳机的喇叭降噪方法和相关装置
JP2008148179A (ja) 音声信号処理装置および自動利得制御装置における雑音抑圧処理方法
TWI603627B (zh) 處理聲音段之方法及其電腦程式產品及助聽器
CN106161780A (zh) 具有扬声器降噪功能的通信装置及其降噪方法
US9313582B2 (en) Hearing aid and method of enhancing speech output in real time
US9514765B2 (en) Method for reducing noise and computer program thereof and electronic device
US10374566B2 (en) Perceptual power reduction system and method
CN205693744U (zh) 具有扬声器降噪功能的通信装置
CN117425122A (zh) 一种用于助听器的音频信号处理方法和助听器
CN117424665A (zh) 一种自动增益控制的数字语音广播系统及其控制方法
TWI221078B (en) Environmental noise filtering circuit