TWI527024B - 傳送語音數據之方法及非暫態電腦可讀取媒體 - Google Patents
傳送語音數據之方法及非暫態電腦可讀取媒體 Download PDFInfo
- Publication number
- TWI527024B TWI527024B TW102141819A TW102141819A TWI527024B TW I527024 B TWI527024 B TW I527024B TW 102141819 A TW102141819 A TW 102141819A TW 102141819 A TW102141819 A TW 102141819A TW I527024 B TWI527024 B TW I527024B
- Authority
- TW
- Taiwan
- Prior art keywords
- user
- communication device
- sound
- voice data
- audio
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 39
- 238000004891 communication Methods 0.000 claims description 213
- 239000000463 material Substances 0.000 claims description 21
- 238000001228 spectrum Methods 0.000 claims description 19
- 230000005540 biological transmission Effects 0.000 claims description 16
- 239000011159 matrix material Substances 0.000 claims description 13
- 230000000694 effects Effects 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 7
- 230000001629 suppression Effects 0.000 claims description 6
- 210000005069 ears Anatomy 0.000 claims description 4
- 230000002708 enhancing effect Effects 0.000 claims 1
- 238000010408 sweeping Methods 0.000 claims 1
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000001755 vocal effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000003825 pressing Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- XXQCMVYBAALAJK-UHFFFAOYSA-N ethyl n-[4-[benzyl(2-phenylethyl)amino]-2-(2-phenylethyl)-1h-imidazo[4,5-c]pyridin-6-yl]carbamate Chemical compound N=1C=2C(N(CCC=3C=CC=CC=3)CC=3C=CC=CC=3)=NC(NC(=O)OCC)=CC=2NC=1CCC1=CC=CC=C1 XXQCMVYBAALAJK-UHFFFAOYSA-N 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001256 tonic effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/247—Telephone sets including user guidance or feature selection means facilitating their use
- H04M1/2474—Telephone terminals specially adapted for disabled people
- H04M1/2475—Telephone terminals specially adapted for disabled people for a hearing impaired user
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Otolaryngology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Description
本發明係關於通訊系統,例如使用行動電話、行動電腦裝置、平板電腦、膝上型電腦、或其他終端裝置之通訊系統。更具體而言,本發明係關於一種配置以編輯被接收音訊資料以改善語音數據(voice data)之聲音品質之系統、方法和裝置,該語音數據係被接收供記錄或傳送。
電信端點(telecommunication endpoints)經常配備有雜訊抑制裝置(noise reduction device)。當資料被輸出或傳送作為輸出音訊資料時,此類裝置通常配置以過濾由裝置所接收之音訊資料以遞送較佳之聲音內容。
然而,使用於此類雜訊抑制機構之濾波器通常係設計用一般方式處理音頻之通用型濾波器。因此,雜訊抑制可能無法在聲音品質上或被輸出音訊資料其他屬性上提供很大的改善。
我們已經確定需要一種新的方法和設備來改善音頻輸出之音頻特性,該音頻輸出係根據被接收音訊
資料而輸出。在本發明之方法和設備之某些實施例中,被輸出之音頻可配置以使用聽覺和講說的參數,該聽覺和講說的參數係根據使用者進行講說和進行聆聽之講說和聽力形態(特徵)(profile)而決定。
本發明係提供一種傳送語音數據之方法。該方法之一實施例可包括以下步驟:一通訊裝置提示一使用者說話以獲取該使用者之一聲音之一樣本以識別該使用者之該聲音之時域、頻域、主音(vocal dominants)及一音域(vocal range)中之至少一項;該通訊裝置根據該使用者之該聲音之該樣本,為該使用者之該聲音決定數個聲音矩陣(voice matrix);該通訊裝置儲存該使用者之該聲音之該等聲音矩陣;該通訊裝置接收來自該使用者之語音數據;該通訊裝置根據該使用者之該聲音之該等聲音矩陣、該時域、該頻域、該主音及該音域中之至少一項而修飾該已接收語音數據;以及該通訊裝置傳送該已修飾語音數據至另一裝置為使該己修飾語音數據係能輸出給至少一接受者。
該方法之某些實施例可包括額外的步驟或變化態樣。例如,該方法也可包括以下步驟:該通訊裝置產生數個音調供發射至一使用者,為使該使用者聽到該等音調;該通訊裝置接收識別數個音量設定之輸入,該等音調在該等音量設定係可被該使用者所聽到;以及該通訊裝置根據識別該等音量設定之該已接收輸入,而決定該使用者之一聽力形態(特徵),其中該等音調在該等
音量設定係可被該使用者所聽到。此外,該方法之實施例可包括以下步驟:該通訊裝置調整由該通訊裝置所接收之音訊資料之一音量,根據該使用者之該聽力形態(特徵)以一較高音量輸出該音訊資料。
於一實施例中,該方法可包括以下步驟:該通訊裝置傳送該使用者之該聽力形態(特徵)至另一通訊裝置,以及該另一通訊裝置根據該使用者之該聽力形態(特徵)在傳送音訊資料至該通訊裝置之前修飾該音訊資料。於一實施例中,該另一通訊裝置可在傳送音訊資料至該使用者之前,藉由將該音訊資料之一部分自該音訊資料中刪除而修飾該音訊資料,為使被傳送之音訊資料不含位於該使用者無法聴到的音頻頻譜(audio spectrum)之內,其中該音訊資料係位於由該使用者之該聽力形態(特徵)指示為無法被該使用者所聽到之一音頻頻譜之內。於其他實施例中,該音訊資料可藉由增加該音訊資料之音量而被該另一通訊裝置所修飾,為使在被傳送音訊資料中之所有被傳送語音數據係位於該使用者之可聽到音頻頻譜之內。
對於特定實施例,該使用者之該聲音之該等聲音矩陣係由數個參數所組成,該等參數係根據該聲音之該時域、該聲音之該頻域、該聲音之該主音和該使用者之該聲音之一音域所決定。該通訊裝置可根據該等聲音矩陣、該時域、該頻域及該主音中至少一者而修飾該語音數據。該使用者之該聲音之該音域能夠包括該通訊裝置移除位於一頻率範圍內之該已接收語音數據之一部
分,該頻率範圍係位於該使用者之該聲音之該頻域之外。該通訊裝置根據該使用者之該聲音之該等聲音矩陣、該時域、該頻域、該主音及該音域中至少一者而修飾該語音數據之步驟也可包括該通訊裝置應用一參數至該已接收語音數據之雜訊消除程序,該參數係根據該使用者聲音之該使用者之該聲音之該等聲音矩陣、該時域、該頻域、該主音及該音域中之至少一項而決定。
通訊裝置可以是不同型態裝置中之一種。例如,通訊裝置可以是伺服器、工作站、桌上型電腦、平板電腦、行動電話、互聯網設備(internet appliance)、膝上型電腦、智慧型手機、個人數位助理、行動電腦裝置或通訊終端(communication terminal)。在某些實施例中,通訊裝置也可被配置來決定已接收語音數據係來自該使用者。
本發明也提供通訊系統。通訊系統之某些實施例可包括被配置以使用於上文討論之方法實施例之一種通訊系統,其將於下文進一步討論。
本發明也提供一種非暫態電腦可讀取媒體(non-transitory computer readable medium)。該非暫態電腦可讀取媒體具有儲存在其上之一應用程式(application),該應用程式當被該通訊裝置所執行時係定義被該通訊裝置施行之一方法。該方法可包括上文提及之任何一種方法實施例,其將在下文進一步討論。例如,該方法之一實施例可包括以下步驟:該通訊裝置提示一使用者說話以獲取該使用者之該聲音之一樣本,以識別
該使用者之該聲音之時域、頻域、主音及一音域中至少一者;該通訊裝置根據該使用者之該聲音之該樣本,為該使用者之該聲音決定數個聲音矩陣;該通訊裝置儲存該使用者之該聲音之該等聲音矩陣且將該等已儲存聲音矩陣與該使用者相關聯;該通訊裝置接收來自該使用者之語音數據;該通訊裝置根據該使用者之該聲音之該時域、該頻域、該主音及該音域中至少一者而修飾該已接收語音數據;以及該通訊裝置傳送該已修飾語音數據至另一裝置。
由該電腦可讀取媒體之該應用程式所定義之該方法之某些實施例也可包括以下步驟:該通訊裝置產生數個音調供發射至一使用者,為使該使用者聽到該等音調;該通訊裝置接收識別數個音量設定之輸入,該等音調在該等音量設定係可被該使用者所聽到;以及該通訊裝置根據識別該等音量設定之該已接收輸入而決定該使用者之一聽力形態(特徵),其中該等音調在該等音量設定係可被該使用者所聽到。該通訊裝置也可調整由該通訊裝置所接收之音訊資料之一音量,根據該使用者之該聽力形態(特徵)以一較高音量輸出該音訊資料。該通訊裝置可傳送該使用者之該聽力形態(特徵)給另一通訊裝置,且該另一通訊裝置可根據該使用者之該聽力形態(特徵)在根據該使用者之該聽力形態(特徵)傳送音訊資料至該通訊裝置之前,修飾該音訊資料。於一實施例中,該另一通訊裝置可在傳送音訊資料至該使用者之前,藉由將該音訊資料之一部分自該音訊資料中刪除而修飾該
音訊資料,為使已傳送之音訊資料不含位於該使用者無法聴到的音頻頻譜之內,其中該音訊資料之一部分係位於由該使用者之該聽力形態(特徵)指示為無法被該使用者所聽到之一音頻頻譜之內。於其他實施例中,該音訊資料可藉由增加音訊資料音量而被該另一通訊裝置所修飾,為使在已傳送音訊資料內之所有已傳送語音數據係位於該使用者之一可聽到音頻頻譜之內。
在被該應用程式所定義之方法之特定實施例中,該通訊裝置根據該使用者之該聲音之該時域、該頻域、該主音及該音域中至少一者而修飾該語音數據之步驟可包括若干步驟。例如,此類修飾可包括該通訊裝置移除位於一頻率範圍內之該已接收語音數據之一部分,該頻率範圍係位於該使用者之該聲音之該頻域之外;以及該通訊裝置應用一參數至該已接收語音數據之雜訊消除程序,該參數係根據該使用者聲音之該使用者之該聲音之該時域、該頻域、該主音及該音域中之至少一項而決定。
本發明之其他細節、目的和優點將隨著其特定目前較佳實施例之以下敍述和實踐本發明之特定目前較佳方法之進行而變得明顯易懂。
1‧‧‧處理器單元
2‧‧‧顯示單元
3‧‧‧收發單元
3a‧‧‧接收器單元
3b‧‧‧傳送器單元
4‧‧‧揚聲器
5‧‧‧記憶體
6‧‧‧麥克風
7‧‧‧應用程式
8‧‧‧相機感應器
12‧‧‧聲音資料庫
13‧‧‧聽覺資料庫
21‧‧‧第一通訊終端
22‧‧‧第二通訊終端
24‧‧‧網路
25‧‧‧電腦裝置
在多重通迅裝置間提供通訊之目前較佳裝置、系統和設備係顯示於附圖中且實踐本發明之特定目前較佳方法也圖示在其中。應當理解使用在圖式中之相同元件符號可識別相同元件。
第1圖係一通訊裝置之一範例性實施例之方塊圖,該通訊裝置可以例如是伺服器、電腦裝置、工作站、平板電腦、膝上型電腦、電話裝置(telephony device)、互聯網設備、個人數位助理、智慧型手機、行動電話、電話或其他類型的通訊終端。超過一支的麥克風和揚聲器可包含在通訊裝置(例如通訊裝置之某些實施例可包括一單耳揚聲器(one ear speaker)和一外放揚聲器(loud speaker)且可包括兩支麥克風,一支供環繞音效偵測,另一支供周圍雜訊消除)之實施例中。
第2圖係用於傳送語音數據或音訊資料之範例性方法之流程圖;第3圖係用於輸出語音數據或音訊資料之範例性方法之流程圖;及第4圖係一通訊系統之一範例性實施例之方塊圖。
參考第1圖至第4圖,通訊裝置可以例如是伺服器或工作器之電腦裝置,或者例如是桌上型電腦、平板電腦、行動電話、互聯網設備、膝上型電腦、智慧型手機、個人數位助理、行動電腦裝置或通訊終端之終端裝置(terminal device)。於系統之一實施例中,網路24可包括第一和第二通訊終端21、22,二者係透過由電腦裝置25所建立和維護之通訊路徑而通訊連接(communicatively connected)。網路24可以是廣域網路(wide area network)或區域網路(local area network),例
如在系統某些實施例中之企業網路。
顯示於第4圖之系統的第一和第二通訊終端21、22,其個別可以是顯示於第1圖中之通訊裝置實施例。或者,顯示於第4圖的電腦裝置25之功能可作為電話式通訊裝置或媒體通訊裝置,例如交換機裝置(switch device)、媒體伺服器(media server)或電話會議伺服器(teleconference server),其可以是顯示於第1圖中之通訊裝置之一實施例。
通訊裝置可包括通訊地連接至收發單元3之處理器單元1、顯示單元2、至少一例如麥克風6和相機感應器8之輸入裝置、記憶體5及揚聲器4。其中,收發單元3包括接收器單元3a和傳送器單元3b。收發單元3可包括接收器單元3a和傳送器單元3b用以透過移動網路(cellular network)、無線網路連接,或其他的網路連接來傳送及接收資料,或者可配置透過近距離無線通訊(near field communication)、符合藍牙規範之通訊(Bluetooth compliant communication)或其他形式的無線通訊機制而形成無線連接,或者允許有線連接,例如透過USB連接建立之有線連接。在某些實施例中,通訊裝置也可包括額外的收發單元。
處理器單元1可以是中央處理單元,例如微處理器、互聯微處理器(interconnected microprocessors)或其他硬體處理器元件。記憶體5可以是非暫態電腦可讀取媒體(non-transitory computer readable medium),其具有儲存在其上之至少一應用程式7,該應用程式7係
定義被該通訊裝置施行之一種方法,例如顯示於第2圖或第3圖之方法。記憶體5可包括硬碟(hard drive)、隨身碟(flash drive)、光碟片(optical disk)或硬碟片(hard disk)或其他類型之能夠儲存資料一非暫態時間之電腦可讀取媒體。例如聲音資料庫12和聽覺資料庫13之資料集和當執行應用程式7時可被通訊裝置使用之其他資料也可以儲存於記憶體5中。
揚聲器4可包括發射音效之多重揚聲器且麥克風6可以是記錄由使用者發出之音效之輸入裝置,用以接收音訊資料。舉例而言,麥克風6可包括偵測周圍雜訊之第一麥克風和作為消除周圍雜訊之第二麥克風且揚聲器4可包括發射雜訊到人耳之第一揚聲器和作為外放揚聲器之第二揚聲器。顯示單元2可以是液晶顯示器或其他顯示裝置。顯示單元2可配置成輸入裝置和輸出裝置,例如觸控顯示幕,其功能可輸出可見的資料,同時允許使用者藉由碰觸顯示器上不同部位而提供輸入。
其他型態之輸入裝置,例如按鈕(button)、鍵盤(keyboard)、藍牙頭載式(Bluetooth headset)或藍牙耳掛式(Bluetooth ear-set)耳機組或滑鼠,也能連接到處理器單元1,為使使用者可利用該輸入裝置提供輸入給該裝置。
通訊裝置可透過處理器單元1運行(run)應用程式7。應用程式7當其運行時可定義被通訊裝置執行之一種方法。此類方法之範例可以從第2圖和第3圖加以理解。例如,通訊裝置可運行該應用程式以建立一聽
力形態(特徵)而儲存在一聽覺資料庫以供傳送或輸出已接收音效使用,或者產生一聲音設定檔供一語音資料庫使用,該語音資料庫在傳送該語音數據之前可被用來強化透過麥克風6接收的語音數據,以修飾已接收語音數據而改善清晰度,降低在已接收語音數據內之雜訊,或者強化語音數據,為使已傳送語音數據具有增強之品質。
例如,通訊裝置可運行應用程式且提示使用者經由麥克風6而輸入聲音,為使使用者聲音之語音數據能被收集以定義一使用者聲音設定檔供儲存於聲音資料庫12。使用者說話聲意可被記錄下來為使定義該使用者之一特定濾波器之聲音設定檔能被預備且被儲存成為在聲音資料庫12內之使用者聲音設定檔。或者,當使用者被偵測為是說話者時,聲音資料庫12可儲存參數供送達至一濾波器,為使任何來自該使用者的已記錄語音數據係根據定義在聲音資料庫12中該使用者聲音參數之濾波器而被過濾。
通訊裝置可經由顯示單元2將輸出送給使用者以提示使用者以不同音量或不同速度提供特定語音數據來獲取使用者聲音的樣本。使用者聲音的取樣可使用使用者聲音之不同元音(vocals)和頻率之一種取樣。例如,給使用者之提示輸出可要求使用者以不同八度音(octaves)(例如,以低音或高音)或不同速度(例如,慢或快)說出特定片語以記錄當使用者所說滿足上述條件時之片語。使用者也可經由音效以使用者偏好的語言重複一特定句子,該語言係對語音分析具有重要音位
(phoneme)。已記錄之語音數據接著被評估來決定說話者聲音可能不含那些頻率和使用者聲音之強度頻率(例如,當使用者說話時,使用者聲音最常出現的頻率範圍)。
使用者聲音被評估之後,通訊裝置可決定出使用者聲音不含有特定的頻率。不出現在使用者聲音內之頻率範圍因此可被濾波器移除,使得當記錄使用者聲音送達另一裝置時,該頻率範圍內沒有聲音被輸出或傳送到另一裝置,例如當通訊裝置經由相機感應器8和麥克風6記錄影像時,或當使用者使用通訊裝置打電話時可以做的。移除不包含使用者聲音之此頻率範圍能夠消除可能出現在記錄使用者聲音過程中的雜訊且可能減少執行抑制雜訊或其他語音數據掃除(cleanup)所需的處理程序,其中在儲存或傳送該語音數據之前,抑制雜訊或其他語音數據掃除可在已記錄語音數據上執行。
此外,對使用者聲音而言係一強度範圍(例如,使用者聲音幾乎總是出現之範圍)之頻率範圍可以從使用者聲音之取樣加以決定。落在被判定是使用者聲音強度之頻率範圍內之使用者聲音之過濾係可以被識別,為使此類的頻譜可以使用較細的粒度(finer granularity)加以過濾。
在一實施例中,使用者之聲音設定檔可以由一已記錄聲音樣本之評估加以定義和界定(ranged),該已記錄聲音樣本係當使用者被顯示單元2所提示說出話語及片語時所記錄。接著,使用者聲音之時域、頻域和主音可藉由通訊裝置分析已記錄聲音樣本而加以評估。之
後,使用者聲音之評估參數被儲存在聲音資料庫12中供定義使用者聲音之過濾,目的為要強化接收任一來自使用者之語音數據,該語音數據係為了儲存而與經由語音通道(voice channel)、媒體傳送(media transmission)、電話或其他語音數據傳送之一影像記錄或傳送相關聯。應該理解的是將被傳送之語音數據的強化可與雜訊消除同時進行,其中雜訊消除可被通訊裝置執行。雜訊消除和聲音強化可在經由雜訊消除和聲音強化所修飾之語音數據被打包(packetizing)之前進行。然後,被已打包修飾之語音數據可被傳送到另一裝置。
通訊裝置也可提示使用者提供輸入給該通訊裝置以回應經由至少一揚聲器4所輸出之發出音效,為使該使用者之一聽力形態(特徵)可被決定並儲存至聽覺資料庫13中。之後,聽覺資料庫13可使用於處理已接收音訊資料且也可以使用在處理語音數據以被輸出或傳送至另一裝置。例如,一特別使用者可具有該使用者較不易察覺之頻譜或該使用者無法聽到任何音效,當音效落入該頻譜內時。此類頻譜可在該使用者之聽力形態(特徵)中被加以識別且隨後被用來修飾將被輸出至該特別使用者之語音數據或修飾將被傳送到與該特別使用者相關聯之裝置之語音數據,例如電話或行動電話。
例如,通訊裝置可提示該使用者回應經由揚聲器4以不同響度水平(levels of loudness)發射的一系列音調。該使用者所提供之輸入可指出在何種音量或響度上該使用者能聽到不同的發射音調且可以提示該使用者
偵測相同系列的音調,該音調對於經由單耳揚聲器之每個個別耳朵係以不同的響度發射而且該音調對於經由外放揚聲器之兩耳也可以不同的響度發射。該使用者所提供之輸入接著可被通訊裝置用來決定該使用者每個耳朵和兩個耳朵之聽閾值(hearing threshold)。然後,該使用者之聽力形態(特徵)可連結(link)於該使用者且被用在許多方面。此外,所形成的聽力形態(特徵)也可送到其他裝置,該其他裝置可將音訊資料送至通訊裝置或其他與該使用者相關聯的其他裝置,為使該使用者之聽力形態(特徵)可被用來修飾將被送至該使用者之語音數據以強化送至該使用者之資料清晰度。
例如,聽力形態(特徵)可儲存在通訊裝置之記憶體5內之聽覺資料庫13中。通訊裝置接著可調整已接收語音數據的響度,為使不落在使用者可聽到之頻率內的語音數據或其他音訊資料被修飾以便使用者可聽得到該被輸出之語音數據。例如,聽力形態(特徵)可透過音頻通道(audio path)應用在即時傳送協定(Real-time Transport Protocol,RTP)解碼器或其他音頻等化器(audio equalizer)以提供此類的調整。在使用者自己的通訊裝置內的聽力形態(特徵)因此可調整已接收資料被發出時之音量設定,為要改善送至該使用者之資料清晰度。
作為另一範例,聽力形態(特徵)可送至另一通訊裝置,為使傳送至使用者通訊裝置之音訊資料可被傳送資料至使用者的裝置所修飾,以經由使用者之聽力形態(特徵)描述使用者的特定聽覺能力(specific hearing
capabilities)。例如,接收使用者聽力形態(特徵)之傳送通訊裝置係可以強化其對於將被傳送到通訊裝置的語音數據之抑制雜訊,其中該通訊裝置係根據使用者聽力形態(特徵)而與該使用者產生相關聯。將被傳送之語音數據可被修飾,為使該語音數據落在使用者聽力形態(特徵)之頻譜內以改善傳送至使用者之資料清晰度。傳送裝置也可以,或可選擇地,修飾將傳送到使用者通訊裝置之音訊資料以避免、刪除或者廢除落在頻譜內之音效,其中在該頻譜內使用者絲毫無法察覺或在該頻譜內使用者幾近耳聾,使得與該音訊資料之該部分的傳送和接收相關之頻寬和處理能量可被節省下來。
使用者之通訊裝置可將使用者聽力形態(特徵)或通訊裝置之聽覺資料庫13送至一傳送裝置,使得其能夠被其他裝置儲存供未來呼叫使用或供音訊資料之其他傳送使用。其他裝置可將使用者聽力形態(特徵)與使用者通訊裝置之位址產生關聯,例如電話號碼或該裝置之網路協定位址,使得使用該位址之任何通訊可使用該使用者聽力形態(特徵)來修飾將被傳送至使用者通訊裝置之語音數據或其他音訊資料。傳送裝置可儲存該設定檔供未來通訊會話(communication session)使用,其也是根據一裝置位址之關聯,例如與使用者相關聯之電話號碼以及被具有該位址之裝置所建立之呼叫。使用者聽力形態(特徵)也可與和使用者相關聯之其他裝置相關聯,例如語音信箱或電郵地址,為使傳送至這些其他裝置或位址之音訊資料被修飾以改善送至該使用者之音訊
資料清晰度,其中該使用者係被該資訊所定址。
在通訊裝置之某些實施例中,使用者可在一呼叫或其他通訊會話過程中鍵入輸入以啟動(actuate)一信息(message)送至參與該通訊會話之另一裝置。該被鍵入之輸入可示意一電話夥伴(call partner),其為該使用者不想在一特定會話中或在任何未來呼叫或未來通訊會話過程中應用與該使用者相關聯之聽力形態(特徵)。此類輸入在一正在進行的呼叫中或其他的通訊會話過程中可啟動一訊息以使被另一裝置所使用將被送至此裝置之聽力形態(特徵)無效(deactivate),或者此類輸入可被傳送。在一特別的通訊會話之後或之前,此類信息可以選擇性地被送出。此類信息例如可在當使用者建立一新的聽力形態(特徵)或聲音設定檔時被送出。此類信息也可和一替換聽力形態(特徵)或聲音設定檔一起送出,該替換聽力形態(特徵)或聲音設定檔係供其他裝置儲存而使用於後續之通訊會話。
應該了解的是語音數據或其他音訊資料之修飾以改善送到一特定使用者之資料清晰度,當該資料輸出至該使用者時,係可能造成音訊資料之偏移(skew)而將該資料放置在對該使用者較易察覺的頻譜之一部分中。此類偏移可能造成說話者聲音特性被改變。但,這也可能改善對使用者通訊之清晰度,以便在一通訊會話中更多資料被使用者確實地聽到且被使用者所了解,例如在電話呼叫或電話會議中。
應該理解的是第一通訊終端21和第二通訊
終端22可個別具有一聲音資料庫和聽覺資料庫供在二裝置間之電話呼叫過程中使用。每一通訊終端可修飾使用者對著該終端之麥克風6說話之語音數據,為使已傳送之語音數據被修飾以改善送至接收終端之使用者之語音數據清晰度。在一考慮的其他實施例中,在通訊會話過程中位於兩終端之傳送路徑內之諸如電腦裝置25之切換裝置(switch device)可以具有聽覺資料庫和聲音資料庫且可以根據使用者聽力形態(特徵)修飾將被傳送至一特別使用者之音訊資料以接收該音訊資料之輸出和該說話者之聲音設定檔,其中該聲音設定檔係正傳送該音訊資料至接收方。
在通訊裝置之某些實施例中,超過一位使用者可使用該裝置。不同的使用者可建立不同的聽力形態(特徵)和不同的聲音設定檔。例如,每次使用可利用該通訊裝置而具有如上敍所建立、儲存和傳送之一個聽力形態(特徵)和聲音設定檔。所形成之使用者諸設定檔可被儲存在相同裝置的記憶體中且與一使用者身份識別(user identification)相連結以區分不同的使用者。然後,每位使用者可以任一種方式之來識別自己。例如,每次使用可鍵入獨一的登錄識別(log-on identification)或密碼(code),該登錄識別或密碼係可確認使用者為目前正在使用此裝置之人員。該登錄識別可包括鍵入個人識別號碼(personal identification number)或以一預先定義之按壓順序來按壓通訊裝置之觸控顯示幕之特定部分以鍵入使用者之參考碼(reference number)或識別密碼
(identification code)。一旦偵測到此類鍵入之使用者識別,通訊裝置接著可使用在聲音和聽力形態(特徵)內之該已識別使用者之設定檔。作為另一選項,一使用者可藉由經一輸入裝置鍵入輸入而選擇一特定設定檔給該使用者,以選擇該使用者特定設定檔。在某些實施例中,通訊裝置可預設地將一使用者聽覺和聲音設定檔與經由已鍵入識別(entered identification)所識別之使用者相關聯。一使用者接著可提供輸入以取消此類的設定或更改該設定。
當通訊裝置、通訊系統和製造使用該通訊裝置和系統之方法之特定目前較佳實施例已被呈現且敍述於上文時,應清楚理解的是本發明係不受限於上述實施例,但可在以下專利請求項之範圍內以其他各種不同方式加以實現和實踐。
1‧‧‧處理器單元
2‧‧‧顯示單元
3‧‧‧收發單元
3a‧‧‧接收器單元
3b‧‧‧傳送器單元
4‧‧‧揚聲器
5‧‧‧記憶體
6‧‧‧麥克風
7‧‧‧應用程式
8‧‧‧相機感應器
12‧‧‧聲音資料庫
13‧‧‧聽覺資料庫
Claims (15)
- 一種傳送語音數據之方法,包含:一通訊裝置(21)提示一使用者說話以獲取該使用者之一聲音之一樣本以識別該使用者之該聲音之時域、頻域、主音、不同八度音、不同速度、不同音量及一音域中至少一者;該通訊裝置(21)根據該使用者之該聲音之該樣本,為該使用者之該聲音決定數個聲音矩陣;該通訊裝置(21)儲存該使用者之該聲音之該等聲音矩陣;該通訊裝置(21)接收來自該使用者之語音數據;該通訊裝置(21)根據該使用者之該聲音之該等聲音矩陣、該時域、該頻域、該主音、該不同八度音、該不同速度、該不同音量及該音域中至少一者而修飾該該已接收語音數據;該通訊裝置(21)傳送該已修飾語音數據至另一裝置為使該已修飾語音數據能輸出給至少一接受者,該通訊裝置(21)產生可供發射至一使用者,使該使用者聽得到的音調;該通訊裝置(21)接收可識別使用者可聽到該等音調時的音量設定的輸入;及該通訊裝置(21)根據可識別該等音量設定之該接收到的輸入而決定該使用者之一聽力形態,其中該等音調在該等音量設定係可被該使用者所聽到,以及該通訊裝置(21)將該使用者之該聽力形態傳送至 另一通訊裝置(22),該使用者之該聽力形態能夠被該另一通訊裝置(22)儲存,以供未來通訊會話用或音訊資料的其他傳輸用;該另一通訊裝置(22)在傳送該音訊資料至該通訊裝置(21)前,根據該使用者之該聽力形態修飾該音訊資料,使得傳送到該通訊裝置的該音訊資料藉由傳送該音訊資料給該使用者的該另一通訊裝置(22)來加以修飾,以將該使用者聽力形態修飾成適合於使用者的特定聽覺能力。
- 如請求項1之方法,進一步包含:使用者在一呼叫或其他通訊會話之前、過程中或之後鍵入輸入以啟動一信息送至參與該通訊會話之該另一通訊裝置(22),其中被鍵入的該輸入啟動該信息以藉由該另一通訊裝置(22)使一聽力形態的使用無效。
- 如請求項1之方法,進一步包含:該另一通訊裝置(22)藉由增加該音訊資料的音量修飾該音訊資料,以使在傳送的音訊資料中的所有傳送的語音數據係在使用者的可聽到音訊頻譜之內。
- 如請求項1之方法,進一步包含:該通訊裝置(21)提示該使用者對每個個別耳朵透過一個耳機及對兩個耳朵同時透過揚聲器,偵測發射在不同響度水平的相同系列的音調,其中該使用者提供的該輸入接著可被該通訊裝置(21)用來決定對該使用者的每個耳朵及該使用者的兩個耳朵之聽閾值。
- 如請求項1之方法,其中該使用者之該聲音之該等聲音矩陣係由數個參數所組成,該等參數係根據該聲音 之該時域、該聲音之該頻域、該聲音之該主音、該不同八度音、該不同速度、該不同音量和該使用者之該聲音之一音域所決定;及其中該另一通訊裝置(22)根據該使用者之該聽力形態在傳送該音訊資料至該通訊裝置(21)之前係修飾該音訊資料之步驟,係包含刪除該音訊資料之一部分,該部分係位於被識別為經由該使用者之該聽力形態而無法被一使用者所聽到之一音頻頻譜之內,以致該已傳送音訊資料不包括該音訊資料之該部分,以節省與該音訊資料的該部分的傳送及接收相關的頻寬及處理能量。
- 如請求項1之方法,其中該通訊裝置(21)根據該使用者之該聲音之該等聲音矩陣、該時域、該頻域、該主音、該不同八度音、該不同速度、該不同音量及該音域中之該至少一者而修飾該語音數據之步驟,係包括該通訊裝置(21)移除位於一頻率範圍內之該已接收語音數據之一部分,該頻率範圍係位於該使用者之該聲音之該頻域之外,其中該頻率範圍的移除係消除在記錄該使用者聲音過程中出現的雜訊且減少執行抑制雜訊或其他語音數據掃除所需的處理程序,該抑制雜訊或該其他語音數據掃除係在儲存該語音數據或傳送該語音數據之前,在已記錄的語音數據上執行。
- 如請求項1之方法,其中該使用者的該聽力形態係與該使用者連結,且該聽力形態係送到至少該其他裝置(22),該其他裝置可將音訊資料送至通訊裝置(21)或與 該使用者相關,因此該使用者之該聽力形態係被用來修飾將被送至該使用者之語音數據已強化送至該使用者之資料清晰度。
- 如請求項1至7中任一項之方法,其中該通訊裝置(21)係一伺服器、一工作站、一桌上型電腦、一平板電腦、一行動電話、一互聯網設備、一膝上型電腦、一智慧型手機、一個人數位助理、一行動電腦裝置或一通訊終端之一,且該方法進一步包含:該通訊裝置(21)決定該已接收語音數據係來自該使用者。
- 如請求項1至7中任一項之方法,其中藉由其他通訊裝置(22)將使用者的聽力形態與使用者的通訊裝置(21)的位置聯繫,使得使用該位址之任何通訊使用該使用者聽力形態來修勢將被傳送至使用者通訊裝置之語音數據或其他音訊資料,藉由其他通訊裝置(22)儲存該使用者的該聽力形態以供未來通訊會話使用,其係根據一裝置位置之關聯,或者該使用者的該聽力形態至少與該其他通訊裝置(22)相關聯,以使傳送至該其他通訊裝置(22)或位址之音訊資料被修飾以改善送至該使用者之音訊資料清晰度,該使用者被該資訊所定址,該使用者通訊裝置(21)的該位置係電話號碼或該通訊裝置(21)的網路協定位置,該裝置位置係與使用者相關聯之電話號碼以及被 具有該位址之裝置所建立之呼叫,該對該使用者有關的其他通訊裝置(22)係一語音信箱或電郵地址。
- 一種非暫態電腦可讀取媒體,其具有儲存在其上之一應用程式(7),該應用程式(7)當被一通訊裝置(21)所執行時係定義被該通訊裝置(21)施行之一方法,該方法包含:該通訊裝置(21)提示一使用者說話以獲取該使用者之一聲音之一樣本以識別該使用者之該聲音之時域、頻域、主音、不同八度音、不同速度、不同音量及一音域中至少一者;該通訊裝置(21)根據該使用者之該聲音之該樣本,為該使用者之該聲音決定數個聲音矩陣;該通訊裝置(21)儲存該使用者之該聲音之該等聲音矩陣且將該等已儲存聲音矩陣與該使用者相關聯;該通訊裝置(21)接收來自該使用者之語音數據;該通訊裝置(21)根據該使用者之該聲音之該時域、該頻域、該主音、該不同八度音、該不同速度、該不同音量及該音域中至少一者而修飾該被接收語音數據;該通訊裝置傳送該已修飾語音數據至另一裝置,該通訊裝置(21)產生數個音調供發射至一使用者,為使該使用者聽到該等音調;該通訊裝置(21)接收識別數個音量設定之輸入,該等音調在該等音量設定係可被該使用者所聽到;及 該通訊裝置(21)根據識別該等音量設定之該已接收輸入而決定該使用者之一聽力形態,其中該等音調在該等音量設定係可被該使用者所聽到,以及該通訊裝置(21)將該使用者之該聽力形態傳送至第二通訊裝置(22),使得該使用者之該聽力形態能夠被該第二通訊裝置(22)儲存,以供未來通訊會話用或音訊資料的其他傳輸用;以及該第二通訊裝置(22)在傳送該音訊資料至該通訊裝置(21)前,根據該使用者之該聽力形態修飾該音訊資料,使得傳送到該通訊裝置的該音訊資料藉由將傳送該音訊資料給該使用者的該第二通訊裝置(22)來加以修飾,以將該使用者聽力形態修飾成適合該使用者的特定聽覺能力。
- 如請求項10之電腦可讀取媒體,其中該方法進一步包含:該通訊裝置(21)運行該應用程式(7)以建立一聽力形態而儲存在一聽覺資料庫(13)以供傳送或輸出已接收的音效使用,或者產生一聲音設定檔供一語音資料庫(12)使用,該語音資料庫在傳送該語音數據之前可被用來強化透過麥克風(6)接收的語音數據,已修飾已接收語音數據而改善清晰度,降低在已接收語音數據內之雜訊,或者強化語音數據,其中當執行應用程式(7)時,該聲音資料庫(12)和該聽覺資料庫(13)以及其他資料可被通訊裝置(21)使用。
- 如請求項10或11之電腦可讀取媒體,其中該通訊裝 置係一第一通訊裝置且該方法進一步包含:該第二通訊裝置(22)根據該使用者之該聽力形態在傳送該音訊至該第一通訊裝置(21)之前修飾該音訊,使得被傳送至該第一通訊裝置(21)之該已修飾音訊係刪除位於一第一音頻頻譜內之該音訊之任一部分,該第一音頻頻譜係被該使用者之該聽力形態識別為無法被該使用者所聽到之一音頻頻譜,以節省與該音訊資料的該部分的傳送及接收相關的頻寬及處理能量。
- 如請求項10或11之電腦可讀取媒體,其中該通訊裝置(21)根據該使用者之該聲音之該時域、該頻域、該主音、該不同八度音、該不同速度、該不同音量及該音域中至少一者而修飾該語音數據之步驟,係包括該通訊裝置(21)移除位於一頻率範圍內之該已接收語音數據之一部分,該頻率範圍係位於該使用者之該聲音之該頻域之外。
- 如請求項10或11之電腦可讀取媒體,其中該通訊裝置(21)及該第二通訊裝置(22)個別具有該聲音資料庫(12)及聽覺資料庫(13)供在該兩個通訊裝置間的電話呼叫過程中使用,其中該每個通訊裝置(21、22)修飾該使用者對著該通訊裝置(21、22)的麥克風說話之語音數據,以修飾已傳送之該語音數據以增進送至接收的該通訊裝置(21、22)的該使用者之語音數據清晰度。
- 如請求項10或11之電腦可讀取媒體,其中在通訊會話過程中位於該通訊裝置(21)及該第二通訊裝置(22)的傳送路徑內之切換裝置,其具有聽覺資料庫(12)及 聲音資料庫(13)且根據該使用者的該聽力形態修飾將被傳送至一特別使用者之該音訊資料,以接收該音訊資料之輸出和該說話者之聲音設定檔,該聲音設定檔系傳送該音訊資料至接收的使用者;該切換裝置係電腦裝置(25)。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2012/065995 WO2014081408A1 (en) | 2012-11-20 | 2012-11-20 | Method, device, and system for audio data processing |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201430834A TW201430834A (zh) | 2014-08-01 |
TWI527024B true TWI527024B (zh) | 2016-03-21 |
Family
ID=47326378
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW102141819A TWI527024B (zh) | 2012-11-20 | 2013-11-18 | 傳送語音數據之方法及非暫態電腦可讀取媒體 |
Country Status (6)
Country | Link |
---|---|
US (4) | US20140379343A1 (zh) |
EP (1) | EP2786376A1 (zh) |
KR (1) | KR101626438B1 (zh) |
CN (1) | CN104160443B (zh) |
TW (1) | TWI527024B (zh) |
WO (1) | WO2014081408A1 (zh) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6314837B2 (ja) * | 2013-01-15 | 2018-04-25 | ソニー株式会社 | 記憶制御装置、再生制御装置および記録媒体 |
US9344793B2 (en) * | 2013-02-11 | 2016-05-17 | Symphonic Audio Technologies Corp. | Audio apparatus and methods |
US9319019B2 (en) | 2013-02-11 | 2016-04-19 | Symphonic Audio Technologies Corp. | Method for augmenting a listening experience |
US9344815B2 (en) | 2013-02-11 | 2016-05-17 | Symphonic Audio Technologies Corp. | Method for augmenting hearing |
TWI624183B (zh) * | 2013-07-05 | 2018-05-11 | 元鼎音訊股份有限公司 | 電話語音處理之方法及其電腦程式 |
US10051120B2 (en) | 2013-12-20 | 2018-08-14 | Ultratec, Inc. | Communication device and methods for use by hearing impaired |
US10324593B2 (en) * | 2014-01-28 | 2019-06-18 | International Business Machines Corporation | Impairment-adaptive electronic data interaction system |
US20160239253A1 (en) * | 2014-01-31 | 2016-08-18 | Matteo Staffaroni | Method for audio correction in electronic devices |
JP6454514B2 (ja) * | 2014-10-30 | 2019-01-16 | 株式会社ディーアンドエムホールディングス | オーディオ装置およびコンピュータで読み取り可能なプログラム |
US10121488B1 (en) * | 2015-02-23 | 2018-11-06 | Sprint Communications Company L.P. | Optimizing call quality using vocal frequency fingerprints to filter voice calls |
CN104954555B (zh) * | 2015-05-18 | 2018-10-16 | 百度在线网络技术(北京)有限公司 | 一种音量调节方法及系统 |
US9407989B1 (en) | 2015-06-30 | 2016-08-02 | Arthur Woodrow | Closed audio circuit |
JP6374854B2 (ja) * | 2015-11-10 | 2018-08-15 | 株式会社オプティム | 画面共有システム及び画面共有方法 |
CN105788612B (zh) * | 2016-03-31 | 2019-11-05 | 广州酷狗计算机科技有限公司 | 一种检测音质的方法和装置 |
CN108231089B (zh) * | 2016-12-09 | 2020-11-03 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音处理方法及装置 |
US9973627B1 (en) | 2017-01-25 | 2018-05-15 | Sorenson Ip Holdings, Llc | Selecting audio profiles |
US20180271710A1 (en) * | 2017-03-22 | 2018-09-27 | Bragi GmbH | Wireless earpiece for tinnitus therapy |
CN108877822A (zh) * | 2017-05-09 | 2018-11-23 | 塞舌尔商元鼎音讯股份有限公司 | 智能语音系统、语音输出调整的方法及计算机可读取记忆媒体 |
US10521512B2 (en) * | 2017-05-26 | 2019-12-31 | Bose Corporation | Dynamic text-to-speech response from a smart speaker |
US10564928B2 (en) | 2017-06-02 | 2020-02-18 | Rovi Guides, Inc. | Systems and methods for generating a volume- based response for multiple voice-operated user devices |
CN107945815B (zh) * | 2017-11-27 | 2021-09-07 | 歌尔科技有限公司 | 语音信号降噪方法及设备 |
US10991379B2 (en) * | 2018-06-22 | 2021-04-27 | Babblelabs Llc | Data driven audio enhancement |
CN108986830B (zh) * | 2018-08-28 | 2021-02-09 | 安徽淘云科技有限公司 | 一种音频语料筛选方法及装置 |
US11393478B2 (en) * | 2018-12-12 | 2022-07-19 | Sonos, Inc. | User specific context switching |
TW202027062A (zh) * | 2018-12-28 | 2020-07-16 | 塞席爾商元鼎音訊股份有限公司 | 聲音播放系統及其調整輸出聲音之方法 |
US10971168B2 (en) * | 2019-02-21 | 2021-04-06 | International Business Machines Corporation | Dynamic communication session filtering |
TW202102010A (zh) | 2019-05-24 | 2021-01-01 | 瑞典商赫爾桑茲股份有限公司 | 用於無損資料壓縮和解壓縮的方法、裝置、和電腦程式產品 |
US11818426B2 (en) * | 2019-11-14 | 2023-11-14 | Dish Network L.L.C. | Method and system for adaptive audio modification |
US11257480B2 (en) * | 2020-03-03 | 2022-02-22 | Tencent America LLC | Unsupervised singing voice conversion with pitch adversarial network |
KR20220081090A (ko) * | 2020-12-08 | 2022-06-15 | 라인 가부시키가이샤 | 감정 기반 멀티미디어 컨텐츠 생성 방법 및 시스템 |
DE102021103310B4 (de) | 2021-02-12 | 2024-01-04 | Dr. Ing. H.C. F. Porsche Aktiengesellschaft | Verfahren und vorrichtung zur verbesserung der sprachverständlichkeit in einem raum |
TWI801085B (zh) * | 2022-01-07 | 2023-05-01 | 矽響先創科技股份有限公司 | 智能網路通訊之雜訊消減方法 |
Family Cites Families (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CH633903A5 (de) * | 1978-09-26 | 1982-12-31 | Feller Ag | Sprachschalter fuer ein an eine telefonleitung anzuschliessendes geraet. |
US4538295A (en) * | 1982-08-16 | 1985-08-27 | Nissan Motor Company, Limited | Speech recognition system for an automotive vehicle |
US5706352A (en) | 1993-04-07 | 1998-01-06 | K/S Himpp | Adaptive gain and filtering circuit for a sound reproduction system |
DE69816610T2 (de) | 1997-04-16 | 2004-06-09 | Dspfactory Ltd., Waterloo | Verfahren und vorrichtung zur rauschverminderung, insbesondere bei hörhilfegeräten |
US5844983A (en) * | 1997-07-10 | 1998-12-01 | Ericsson Inc. | Method and apparatus for controlling a telephone ring signal |
CA2362357A1 (en) * | 1998-11-09 | 2000-05-18 | Xinde Li | System and method for processing low signal-to-noise ratio signals |
US6463128B1 (en) * | 1999-09-29 | 2002-10-08 | Denso Corporation | Adjustable coding detection in a portable telephone |
DE19948308C2 (de) * | 1999-10-06 | 2002-05-08 | Cortologic Ag | Verfahren und Vorrichtung zur Geräuschunterdrückung bei der Sprachübertragung |
DE19956747C1 (de) * | 1999-11-25 | 2001-01-11 | Siemens Ag | Verfahren und Vorrichtung zur Spracherkennung sowie ein Telekommunikationssystem |
GB0116071D0 (en) * | 2001-06-30 | 2001-08-22 | Hewlett Packard Co | Improvements in audio reproduction |
US6944474B2 (en) * | 2001-09-20 | 2005-09-13 | Sound Id | Sound enhancement for mobile phones and other products producing personalized audio for users |
DK1437031T3 (da) * | 2001-10-05 | 2005-10-10 | Oticon As | Fremgangsmåde til programmering af en kommunikationsanordning og programmerbar kommunikationsanordning |
US20050119894A1 (en) * | 2003-10-20 | 2005-06-02 | Cutler Ann R. | System and process for feedback speech instruction |
CA2454296A1 (en) | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
CN100440899C (zh) * | 2004-11-15 | 2008-12-03 | 北京中星微电子有限公司 | 一种手机音量自动调节的方法及装置 |
CN1855704B (zh) * | 2005-04-26 | 2011-07-20 | 佛山市顺德区顺达电脑厂有限公司 | 自动调整电子装置音量的方法 |
US20060282264A1 (en) * | 2005-06-09 | 2006-12-14 | Bellsouth Intellectual Property Corporation | Methods and systems for providing noise filtering using speech recognition |
AU2006255482A1 (en) * | 2005-06-10 | 2006-12-14 | Neuromonics Pty Ltd | Digital playback device and method and apparatus for spectrally modifying a digital audio signal |
US7720681B2 (en) * | 2006-03-23 | 2010-05-18 | Microsoft Corporation | Digital voice profiles |
DE102006015497B4 (de) * | 2006-04-03 | 2008-01-10 | Nebel, Wolfgang, Dr. | Audiosystem und Verfahren sowie Computerprogramm und Datenträger der das Computerprogramm enthält zur Anpassung der Übertragungsfunktion eines Audiosystems mittels Sprachsteuerung |
US7616936B2 (en) * | 2006-12-14 | 2009-11-10 | Cisco Technology, Inc. | Push-to-talk system with enhanced noise reduction |
US8010366B1 (en) * | 2007-03-20 | 2011-08-30 | Neurotone, Inc. | Personal hearing suite |
US8270593B2 (en) * | 2007-10-01 | 2012-09-18 | Cisco Technology, Inc. | Call routing using voice signature and hearing characteristics |
US8259954B2 (en) * | 2007-10-11 | 2012-09-04 | Cisco Technology, Inc. | Enhancing comprehension of phone conversation while in a noisy environment |
US8027743B1 (en) | 2007-10-23 | 2011-09-27 | Adobe Systems Incorporated | Adaptive noise reduction |
EP2081405B1 (en) * | 2008-01-21 | 2012-05-16 | Bernafon AG | A hearing aid adapted to a specific type of voice in an acoustical environment, a method and use |
US20090287489A1 (en) * | 2008-05-15 | 2009-11-19 | Palm, Inc. | Speech processing for plurality of users |
WO2009143898A1 (en) | 2008-05-30 | 2009-12-03 | Phonak Ag | Method for adapting sound in a hearing aid device by frequency modification and such a device |
US20110178799A1 (en) * | 2008-07-25 | 2011-07-21 | The Board Of Trustees Of The University Of Illinois | Methods and systems for identifying speech sounds using multi-dimensional analysis |
US8244535B2 (en) * | 2008-10-15 | 2012-08-14 | Verizon Patent And Licensing Inc. | Audio frequency remapping |
DE102008052176B4 (de) | 2008-10-17 | 2013-11-14 | Siemens Medical Instruments Pte. Ltd. | Verfahren und Hörgerät zur Parameteradaption durch Ermittlung einer Sprachverständlichkeitsschwelle |
US8582790B2 (en) | 2010-02-12 | 2013-11-12 | Audiotoniq, Inc. | Hearing aid and computing device for providing audio labels |
US8369549B2 (en) * | 2010-03-23 | 2013-02-05 | Audiotoniq, Inc. | Hearing aid system adapted to selectively amplify audio signals |
DK2375781T3 (da) | 2010-04-07 | 2013-06-03 | Oticon As | Fremgangsmåde til styring af et binauralt høreapparatsystem og binauralt høreapparatsystem |
US8386252B2 (en) * | 2010-05-17 | 2013-02-26 | Avaya Inc. | Estimating a listener's ability to understand a speaker, based on comparisons of their styles of speech |
US8639516B2 (en) * | 2010-06-04 | 2014-01-28 | Apple Inc. | User-specific noise suppression for voice quality improvements |
US8781836B2 (en) * | 2011-02-22 | 2014-07-15 | Apple Inc. | Hearing assistance system for providing consistent human speech |
US8918197B2 (en) * | 2012-06-13 | 2014-12-23 | Avraham Suhami | Audio communication networks |
US8700396B1 (en) * | 2012-09-11 | 2014-04-15 | Google Inc. | Generating speech data collection prompts |
WO2014062859A1 (en) * | 2012-10-16 | 2014-04-24 | Audiologicall, Ltd. | Audio signal manipulation for speech enhancement before sound reproduction |
KR20150104626A (ko) * | 2013-01-09 | 2015-09-15 | 에이스 커뮤니케이션스 리미티드 | 자율 관리 음향 개선을 위한 방법 및 시스템 |
-
2012
- 2012-11-20 KR KR1020147023147A patent/KR101626438B1/ko active IP Right Grant
- 2012-11-20 US US14/372,233 patent/US20140379343A1/en not_active Abandoned
- 2012-11-20 CN CN201280071289.5A patent/CN104160443B/zh active Active
- 2012-11-20 EP EP12798982.0A patent/EP2786376A1/en not_active Ceased
- 2012-11-20 WO PCT/US2012/065995 patent/WO2014081408A1/en active Application Filing
-
2013
- 2013-11-18 TW TW102141819A patent/TWI527024B/zh not_active IP Right Cessation
-
2017
- 2017-08-01 US US15/665,537 patent/US10325612B2/en active Active
-
2019
- 2019-05-01 US US16/400,237 patent/US10803880B2/en active Active
-
2020
- 2020-09-11 US US17/018,647 patent/US20200411025A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
TW201430834A (zh) | 2014-08-01 |
US10325612B2 (en) | 2019-06-18 |
KR101626438B1 (ko) | 2016-06-01 |
CN104160443A (zh) | 2014-11-19 |
US20170330578A1 (en) | 2017-11-16 |
WO2014081408A1 (en) | 2014-05-30 |
US20190259406A1 (en) | 2019-08-22 |
US10803880B2 (en) | 2020-10-13 |
US20140379343A1 (en) | 2014-12-25 |
US20200411025A1 (en) | 2020-12-31 |
KR20140121447A (ko) | 2014-10-15 |
EP2786376A1 (en) | 2014-10-08 |
CN104160443B (zh) | 2016-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI527024B (zh) | 傳送語音數據之方法及非暫態電腦可讀取媒體 | |
US10553235B2 (en) | Transparent near-end user control over far-end speech enhancement processing | |
JP6849797B2 (ja) | 音響信号の聴取試験および変調 | |
US8972251B2 (en) | Generating a masking signal on an electronic device | |
JP6419222B2 (ja) | 音質改善のための方法及びヘッドセット | |
CN105493177B (zh) | 用于音频处理的系统和计算机可读存储介质 | |
US20190066710A1 (en) | Transparent near-end user control over far-end speech enhancement processing | |
US20130339025A1 (en) | Social network with enhanced audio communications for the Hearing impaired | |
US20160239253A1 (en) | Method for audio correction in electronic devices | |
US20220122605A1 (en) | Method and device for voice operated control | |
WO2019228329A1 (zh) | 个人听力装置、外部声音处理装置及相关计算机程序产品 | |
TWI624183B (zh) | 電話語音處理之方法及其電腦程式 | |
US9031836B2 (en) | Method and apparatus for automatic communications system intelligibility testing and optimization | |
US11094328B2 (en) | Conferencing audio manipulation for inclusion and accessibility | |
US20150201057A1 (en) | Method of processing telephone voice output and earphone | |
TWI519123B (zh) | 電話語音輸出之方法,用於電話語音之電腦程式產品及可撥打電話之電子裝置 | |
US11615801B1 (en) | System and method of enhancing intelligibility of audio playback | |
US20230290356A1 (en) | Hearing aid for cognitive help using speaker recognition | |
JP2019515520A (ja) | 電気通信装置、電気通信システム、電気通信装置を操作する方法、およびコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |