TWI451405B

TWI451405B - 增進語音即時輸出之方法及助聽器

Info

Publication number: TWI451405B
Application number: TW100138125A
Authority: TW
Inventors: Kuan Li Chao; Neo Bob Chih Yung Yang; jing wei Li; Kuo Ping Yang
Original assignee: Kuo Ping Yang
Priority date: 2011-10-20
Filing date: 2011-10-20
Publication date: 2014-09-01
Also published as: CN103067840B; CN103067840A; TW201317983A

Description

增進語音即時輸出之方法及助聽器

本發明係關於一種用於聽障者之助聽器。

助聽器之發展由來已久，主要概念為將聲音放大，以幫助聽障者聽見原本聽不到的聲音，將聲音放大的處理幾乎不會產生延遲。另外助聽器若針對頻率進行處理，通常是將聲音頻率降低，譬如先前技術美國專利第6,577,739號”Apparatus and methods for proportional audio compression and frequency shifting”將聲音訊號以某比例壓縮後，提供給對某特定範圍有聽力損失的聽障者，然此技術是對全體聲音做壓縮，雖然可即時輸出，但會使得聲音失真嚴重。

若只針對部分高頻聲音進行降頻，則失真就會降低，然而這牽涉大量運算，因此會造成延遲的問題，常常不適用於即時語音之處理，力如申請人於專利申請第099141772號(美國專利申請第13/064,645號)雖可減少失真，但會有輸出延遲的問題產生。

因此如何減少聲音輸出的失真之狀況下，也能減少聲音輸出延遲的問題是有需要被解決的。

語音在處理變頻的過程中，有時會產生延遲的現象，造成輸出的語音不能同步輸出，本發明之主要目的係在增進語音即時輸出之方法。

為達成上述之目的，本發明包括下列步驟：將該輸入聲音切割為複數聲音段。

由複數聲音段中尋找至少二種不同屬性之聲音段：靜音聲音段，靜音聲音段之聲音能量小於一聲音能量門檻值；非靜音聲音段，非靜音聲音段之聲音能量大於一聲音能量門檻值，在實施例中，非靜音聲音段被區分為高頻及低頻兩種屬性。

輸出部分之複數聲音段，其中：針對全部或部分非靜音聲音段進行變頻處理後全部輸出。在實施例中，當非靜音聲音段之屬性為高頻時，則要進行變頻處理；當非靜音聲音段之屬性為低頻時，則不進行變頻處理。

以及針對全部或部分該靜音聲音段消除而不輸出。

藉由上述之步驟，全部或部分非靜音聲音段進行變頻處理而產生時間延遲，可透過消除全部或部分該靜音聲音段，以降低或消除播放非靜音聲音段之延遲。

為讓本發明之上述和其他目的、特徵和優點能更明顯易懂，下文特舉出本發明之具體實施例，並配合所附圖式，作詳細說明如下。

以下請先參考圖1係本發明之助聽器之整體架構圖。

本發明之助聽器10包括收音器11、聲音處理模組12及聲音輸出模組13。收音器11用於接收聲源80發出之輸入聲音20，交由聲音處理模組12處理後，由聲音輸出模組13輸出。收音器11可為麥克風等任何可收音之器材，聲音輸出模組13可包括揚聲器，耳機等任何可播音之器材，但本發明不以上述列舉之裝置為限。聲音處理模組12一般為音效處理晶片搭配控制電路、放大電路所組成；亦可為處理器、記憶體搭配控制電路、放大電路所組成之解決技術。聲音處理模組12之重點為聲音訊號之放大處理、濾除噪音、改變聲音頻率組成以及為了達成本發明目的而需要之處理，由於聲音處理模組12可用習知之硬體搭配新的韌體或軟體，因此聲音處理模組12之硬體架構不再贅述。本發明之助聽器10基本上可以為將硬體特製化之專用機，亦可為小型電腦如PDA、PDA手機，或智慧型手機以及個人電腦。譬如以手機而言，處理器執行記憶體內的軟體程式後，配合聲音晶片、麥克風及喇叭(外接式或耳機)即形成如圖1聲音處理模組12的主要架構，現在手機處理器執行速度加快，手機配合適當軟體即可成為助聽器。

接著請參考圖2，係關於本發明聲音處理模組之步驟流程圖。另請一併參考圖3及圖4，係關於本發明之相關實施例之示意圖，圖3及圖4以每一階段接著每一階段(step by step)之方式(階段0～階段11)呈現示意圖，以方便瞭解本發明之重點。

步驟201：

接收一輸入聲音20。

此步驟由收音器11完成，接收自聲源80發出之輸入聲音20。

步驟202：

將輸入聲音20切割為複數聲音段。

請參考圖3的『階段0』，為方便說明起見被切割之輸入聲音20依照時間順序被標註為S1,S2,S3....聲音段，而每一聲音段(S1~S11)的屬性被標註為”L”,“H”,或“Q”。譬如聲音段S1被標註為”L”之意義代表聲音段S1的聲音偏向低頻聲音；如聲音段S3被標註為”H”之意義代表聲音段S3的聲音偏向高頻聲音；而如聲音段S8被標註為”Q”之意義代表聲音段S8的聲音為靜音(譬如分貝數低於15以下)。

每一聲音段之時間長度建議為0.0001~0.1秒之間，以I-Phone4做為助聽器的實驗中(根據本發明所製作之軟體於I-Phone4中執行)，聲音段之時間長度約在0.0001~00.1秒之間效果不錯。

步驟203：

由複數聲音段中尋找至少二種不同屬性之聲音段：靜音聲音段，該靜音聲音段之聲音能量小於一聲音能量門檻值；非靜音聲音段，該非靜音聲音段之聲音能量大於一聲音能量門檻值。

聲音處理模組12除了將輸入聲音20切割為複數聲音段之外，並且要判斷每一聲音段的屬性”L”,“H”,或“Q”。聲音段是否為靜音(”Q”)非常容易判斷，基本上只要給一聲音能量門檻值(如15分貝)，只要低於設定之門檻值則被判斷為靜音。聲音能量只要高於門檻值都是非靜音聲音段，在本實施例中，非靜音聲音段分為至少兩種屬性，被標註為”L”(低頻聲音)或“H”(高頻聲音)。

至於聲音段的聲音是偏向高頻聲音或低頻聲音，主要判斷的方式是根據聽障者之狀況而定。一般而言，人類語言溝通的頻率為20赫茲~16000赫茲，而一般聽障者難以聽到3000赫茲或4000赫茲以上的頻率，聽障程度越重度，則所能聽到的高頻範圍越少。因此每一聲音段的屬性為”L”或“H”即以聽障者做為判斷。關於如何判斷哪一聲音段是屬於”L”或“H”之判斷方式很多，譬如分析每一聲音段有無出現高於某一赫茲(如3000赫茲)的聲音，然而此種簡單方式判斷上較不精準。申請人於專利申請第099141772號(美國專利申請第13/064,645號)亦揭露以高頻或低頻能量來判斷，譬如以下是幾種可行之判斷方式：

若1000赫茲(Hz)以下頻率之聲音能量係最多佔30%，且2500赫茲(Hz)以上頻率之聲音能量至少佔70%則為高頻”H”屬性，反之屬於低頻”L”屬性。

若1000赫茲(Hz)以下頻率之聲音能量係至少佔30%則為低頻”L”屬性，反之屬於高頻”H”屬性。

若1000赫茲(Hz)以下頻率之聲音能量最多佔30%則為高頻”H”屬性，反之屬於低頻”L”屬性。

若2500赫茲(Hz)以上頻率之聲音能量至少佔70%則為高頻”H”屬性，反之屬於低頻”L”屬性。

聲音處理模組12基本上可以一切割出聲音段，馬上判斷其屬性，亦可每切割出如5個聲音段，再一次判斷各聲音段之屬性的批次方式進行。

步驟204：

輸出部分之複數聲音段，其中：針對全部或部分非靜音聲音段進行變頻處理後全部輸出；以及針對全部或部分該靜音聲音段消除而不輸出。

於本實施例中，僅針對非靜音聲音段但屬性為“H”(高頻聲音)進行變頻處理，對於非靜音聲音段但屬性為“L”(低頻聲音)不進行變頻處理。這是因為聽障者難以聽到高頻聲音，因此屬性為“H”的聲音段為『需處理聲音段』，而屬性為“L”的聲音段為『不需處理聲音段』。為了聽障者聽到高頻聲音，因此變頻處理基本上為降低聲音頻率之處理，譬如以壓頻或移頻方式處理。關於壓頻或移頻之技術為已知技術，在此不再贅述。需注意的是，為了使聽障者聽到高頻聲音，傳統技術是將整段聲音進行降低聲音頻率之處理，因此處理過的聲音失真很嚴重。專利申請第099141772號(美國專利申請第13/064,645號)即是改善此問題，然而採用先判斷是否為高頻或低頻，再決定僅針對高頻聲音段進行處理則會有延遲的問題，因此採用專利申請第099141772號(美國專利申請第13/064,645號)之技術對於即時性聲音輸出會有較明顯延遲之問題產生，因此本發明即針對此問題進行改善。

以下請參考圖3及圖4關於實施例之敘述。

階段0：一開始之狀態，關於標註請見步驟202之說明。

階段1：第一個聲音段S1屬性為低頻”L”，因此不進行變頻處理然後輸出。需注意的是，為使聽障者聽到聲音，輸出之聲音段一般要經過放大處理(增加聲音能量)。

階段2：第二個聲音段S2屬性為低頻”L”，因此不進行變頻處理然後輸出。

階段3：第三個聲音段S3屬性為高頻”H”，因此需要進行變頻處理，由於進行變頻處理需要一時間，此時開始產生延遲輸出，聲音段S3此時無法即時輸出。為方便解說起見，在階段3以聲音段SX做為一個虛擬輸出，聲音段SX事實上無聲音也代表延遲之時段。

階段4：第四個聲音段S4屬性為高頻”H”，因此需要進行變頻處理，在本實施例假設處理變頻所需時間等於兩個聲音段時間，因此聲音段S3仍無法輸出，當然S4也還在處理變頻因此也無法輸出，同樣的另一個聲音段SX加入階段4。

階段5：由於聲音段S3已經處理好了，因此輸出聲音段S3。由圖可知，若完全無延遲，在階段5時，聲音段S5應該要輸出，但因為有兩個延遲SX，因此在階段5時聲音段S3才輸出。

階段6：由於聲音段S4已經處理好了，因此輸出聲音段S4。

階段7：第五個聲音段S5屬性為低頻”L”，因此不進行變頻處理然後輸出。

階段8：第六個聲音段S6屬性為低頻”L”，因此不進行變頻處理然後輸出。

階段9：第七個聲音段S7屬性為低頻”L”，因此不進行變頻處理然後輸出。由圖可知，階段3之延遲為一個聲音段時間(一個SX)，而從階段4～階段9之延遲為兩個聲音段時間(兩個SX)。

階段10：接下來聲音段S8，聲音段S9及聲音段S10都是靜音。本發明針對全部或部分靜音聲音段消除而不輸出。以此實施例而言，因為延遲了兩個聲音段時間，因此聲音段S8及聲音段S9都不輸出，只輸出聲音段S10。

因此之前有延遲時，本發明即以不輸出全部或部分靜音聲音，以達成減少或消除延遲。假設目前累積有6個聲音段的延遲，而若後面有4個靜音聲音段，則4個靜音聲音段都不輸出；當後面有8個靜音聲音段，則有6個靜音聲音段不輸出，但會輸出2個靜音聲音段。

一般而言，語音溝通高頻聲音段佔得最少(常常10%以下)，而低頻聲音段佔得最多，靜音聲音段比高頻聲音段多了許多。因此當聲音處理模組12夠快時，去除一些靜音聲音段可以彌補高頻聲音段進行變頻所延遲的時間。

階段11：第十一個聲音段S11屬性為低頻”L”，因此不進行變頻處理然後輸出。在階段11輸出聲音段S11顯示沒有延遲發生了。

需注意的是，一般助聽器中聲音處理模組12基本上會包括放大聲音以及雜訊消除處理，上述由於放大聲音以及雜訊消除之處理並非本發明之重點，因此不再此贅述。

綜上所陳，本發明無論就目的、手段及功效，在在均顯示其迥異於習知技術之特徵，懇請　貴審查委員明察，早日賜准專利，俾嘉惠社會，實感德便。惟應注意的是，上述諸多實施例僅係為了便於說明而舉例而已，本發明所主張之權利範圍

10．．．助聽器

11．．．收音器

12．．．聲音處理模組

13．．．聲音輸出模組

20．．．輸入聲音

21．．．改造輸入聲音

80．．．聲源

81．．．聽障者

圖1係本發明之助聽器之整體架構圖。

圖2係本發明之聲音處理模組之步驟流程圖。

圖3係解釋本發明處理聲音之示意圖。

圖4係解釋本發明處理聲音之示意圖。

步驟　201

步驟　202

步驟　203

步驟　204

Claims

一種增進語音即時輸出之方法，係用於一助聽器，該方法包括：接收一輸入聲音；將該輸入聲音切割為複數聲音段；由複數聲音段中尋找至少二種不同屬性之聲音段：靜音聲音段，該靜音聲音段之聲音能量小於一聲音能量門檻值；非靜音聲音段，該非靜音聲音段之聲音能量大於一聲音能量門檻值；輸出部分之複數聲音段，其中：針對全部或部分非靜音聲音段進行變頻處理後全部輸出；以及針對全部或部分該靜音聲音段消除而不輸出；藉由上述之步驟，全部或部分非靜音聲音段進行變頻處理而產生時間延遲，可透過消除全部或部分該靜音聲音段，以降低或消除播放非靜音聲音段之延遲。
如申請專利範圍第1項所述之增進語音即時輸出之方法，其中非靜音聲音段包括不需處理聲音段及需處理聲音段兩種，其中於輸出部分之複數聲音段時：當聲音段為需處理聲音段時，將需處理聲音段進行變頻處理後輸出；以及當聲音段為不需處理聲音段時，將不需處理聲音段以不進行變頻處理輸出。
如申請專利範圍第2項所述之增進語音即時輸出之方法，其中變頻處理係為降低聲音頻率之處理。
如申請專利範圍第3項所述之增進語音即時輸出之方法，其中降低聲音頻率之處理係以壓頻或移頻方式處理。
如申請專利範圍第3項所述之增進語音即時輸出之方法，其中不需處理聲音段係合乎下列條件：1000赫茲(Hz)以下頻率之聲音能量係至少佔30%。
如申請專利範圍第3項所述之增進語音即時輸出之方法，其中需處理聲音段係合乎下列其中至少一條件：1000赫茲(Hz)以下頻率之聲音能量最多佔30%且2500赫茲(Hz)以上頻率之聲音能量至少佔70%；2500赫茲(Hz)以上頻率之聲音能量至少佔70%；1000赫茲(Hz)以下頻率之聲音能量最多佔30%；或2500赫茲(Hz)以上頻率之聲音能量至少佔70%。
如申請專利範圍第1~6項任一項所述之增進語音即時輸出之方法，其中，每一聲音段之時間長度為0.0001~0.1秒之間。
一種助聽器，包括：一收音器，用以接收一輸入聲音；一聲音處理模組，與該收音器電性連接，用以：將該輸入聲音切割為複數聲音段；由複數聲音段中尋找至少二種不同屬性之聲音段：靜音聲音段，該靜音聲音段之聲音能量小於一聲音能量門檻值；非靜音聲音段，該非靜音聲音段之聲音能量大於一聲音能量門檻值；針對全部或部分非靜音聲音段進行變頻處理；針對全部或部分該靜音聲音段消除；以及一聲音輸出模組，與該聲音處理模組電性連接，用以輸出該聲音處理模組處理後之全部或部分之複數聲音段；藉由上述之構造，全部或部分非靜音聲音段進行變頻處理而產生時間延遲，可透過消除全部或部分該靜音聲音段，以降低或消除播放非靜音聲音段之延遲。
如申請專利範圍第8項所述之助聽器，其中非靜音聲音段包括不需處理聲音段及需處理聲音段兩種，其中於輸出部分之複數聲音段時：當聲音段為需處理聲音段時，將需處理聲音段進行變頻處理後輸出；以及當聲音段為不需處理聲音段時，將不需處理聲音段以不進行變頻處理輸出。
如申請專利範圍第9項所述之助聽器，其中變頻處理係為降低聲音頻率之處理。
如申請專利範圍第10項所述之助聽器，其中降低聲音頻率之處理係以壓頻或移頻方式處理。
如申請專利範圍第10項所述之助聽器，其中不需處理聲音段係合乎下列條件：1000赫茲(Hz)以下頻率之聲音能量係至少佔30%。
如申請專利範圍第10項所述之助聽器，其中需處理聲音段係合乎下列其中至少一條件：1000赫茲(Hz)以下頻率之聲音能量最多佔30%且2500赫茲(Hz)以上頻率之聲音能量至少佔70%；2500赫茲(Hz)以上頻率之聲音能量至少佔70%；1000赫茲(Hz)以下頻率之聲音能量最多佔30%；或2500赫茲(Hz)以上頻率之聲音能量至少佔70%。
如申請專利範圍第8~13項任一項所述之助聽器，其中，每一聲音段之時間長度為0.0001~0.1秒之間。