TWI578753B - 電話語音處理方法及可撥打電話之電子裝置 - Google Patents
電話語音處理方法及可撥打電話之電子裝置 Download PDFInfo
- Publication number
- TWI578753B TWI578753B TW104121778A TW104121778A TWI578753B TW I578753 B TWI578753 B TW I578753B TW 104121778 A TW104121778 A TW 104121778A TW 104121778 A TW104121778 A TW 104121778A TW I578753 B TWI578753 B TW I578753B
- Authority
- TW
- Taiwan
- Prior art keywords
- segment
- high frequency
- sound
- telephone
- frequency
- Prior art date
Links
Landscapes
- Telephone Function (AREA)
Description
本發明係關於一種語音處理方法及電子裝置,尤其是一種電話語音處理方法及電話。
能夠藉由助聽器聽到聲音的聽障者通常是無法或難以聽到高頻聲音,較為輕度的聽障者無法聽到6000Hz以上的聲音,較為重度的無法聽到2000Hz以上的聲音,譬如4000Hz以上的聲音即便將聲音放大幾倍仍是無法被聽到,由於子音有許多是4000Hz以上的頻率,因此助聽器基本的作法是將聲音進行壓頻及放大聲音。聽障者可以根據每個人的狀況來設定一些變音參數,變音參數通常跟頻率、放大聲音有關,以便助聽器內部的變音處理程式(軟體或韌體)根據變音參數處理聲音。
當聽障者與其他人面對面聊天時,助聽器是沒有什麼大問題的,因為高頻的聲音經過壓頻或移頻,聽障者可以聽到原本
屬於高頻的聲音。但是當聽障者若以電話與朋友聊天時,則會有問題產生,原因是電話會將高頻聲音先行去除才傳送。譬如傳統的室內電話(市話)會先將4000Hz以上的頻率去除才傳送,因此聽障者在透過電話傳送的聲音是沒有4000Hz以上的聲音。所以聽障者若以電話與朋友聊天時,只要有一方是使用傳統的室內電話(包括2G及3G電話),聽障者就不容易辨別正確的聲音,尤其是具有高頻率的子音及短音(如sit)以及如中文全部是單音(只有一母音)之狀況。此外,對於一般人來說,4000Hz以上頻率被去除的聲音也會失真。
如圖1所示,由通話者發出但還未經電話傳送的一傳送語音80被切割成複數語音段的語音段20,其中的一段語音段20可參考圖2,其分為高頻區21以及低頻區22,若此語音段20經過傳統電話傳輸過程中的處理而移除4000Hz以上的聲音,聽者就僅能接收到如圖3之終端傳送語音段30,原高頻區21若含有其他聲音內容,聽者將無法聽到。
若是雙方都是透過網路電話溝通,有些網路電話也會將4000Hz以上的頻率去除,因此也有此問題,故在這方面的技術是需要改良的。
本發明之主要目的係在提供一種電話語音處理之方法。
本發明之另一主要目的係在提供一種達成上述方法之可撥打電話之電子裝置。
為達成上述之目的,本發明之電話語音處理之方法,用於一使用者於使用一電話時,該電話所進行之語音處理,該方法包括:接收一傳送語音段;若該傳送語音段為一高頻子音聲音段,則進行:找出該高頻子音聲音段於A赫茲以上之一高頻主要分佈能量段,其中2500≦A≦3500;以及將該高頻主要分佈能量段移頻以B赫茲為起始以產生一低頻化高頻子音聲音段,其中2500≦B≦3500。
根據本發明之一實施例,其中該高頻主要分佈能量段之分佈頻寬為C赫茲,其中300≦C≦1500,使得該高頻主要分佈能量段分佈於B赫茲至B+C赫茲之間。
根據本發明之一實施例,其中該高頻主要分佈能量28段為一連續的頻寬。
根據本發明之一實施例,其中該高頻主要分佈能量段28係為該高頻子音聲音段於A赫茲以上中能量最高之C赫茲分佈頻寬。
根據本發明之一實施例,其中-300≦A-B≦300。
根據本發明之一實施例,其中該高頻子音聲音段係符合A赫茲以上的能量超過30%。
1a‧‧‧可撥打電話之電子裝置
1b‧‧‧可撥打電話之電子裝置
11‧‧‧處理器
12‧‧‧記憶體
121‧‧‧聲音處理程式
13‧‧‧麥克風模組
14‧‧‧播音模組
15‧‧‧聲音訊號通訊模組
20‧‧‧傳送語音段
21‧‧‧高頻區
22‧‧‧低頻區
25‧‧‧高頻子音聲音段
25a‧‧‧低頻化高頻子音聲音段
28‧‧‧高頻主要分佈能量段
30‧‧‧終端傳送語音段
50‧‧‧變音處理模組
步驟701‧‧‧接收一傳送語音
步驟702‧‧‧判斷一傳送語音段是否為一高頻子音聲音段
步驟703‧‧‧找出該高頻子音聲音段於A Hz以上之一高頻主要分佈能量段28,其中2500≦A≦3500
步驟704‧‧‧將該高頻主要分佈能量段移頻以B Hz為起始以產生一低頻化高頻子音聲音段,其中2500≦B≦3500
步驟705‧‧‧輸出一低頻化高頻子音聲音段
步驟706‧‧‧輸出該傳送語音
80‧‧‧傳送語音
90‧‧‧網路
圖1係為一語音示意圖,其顯示被切割為複數語音段的語音。
圖2係先前技術的示意圖,其顯示電話接收到的一傳送語音段。
圖3係先前技術的示意圖,其顯示經過電話處理的一終端傳送語音段。
圖4係使用本發明電話語音處理方法之硬體架構圖及使用環境示意圖。
圖5係本發明電話語音處理方法之步驟流程圖。
圖6係本發明電話語音處理方法之示意圖,其顯示切割後的其中一傳送語音段。
圖7係本發明電話語音處理方法之示意圖,其顯示經過移頻處理的一傳送語音段。
圖8係本發明電話語音處理方法之示意圖,其顯示一實施例經過電話處理的一傳送語音段。
為能讓 貴審查委員能更瞭解本發明之技術內容,特舉較佳具體實施例說明如下。
如圖4所示為關於本發明使用環境之示意圖。撥話者透
過可撥打電話之電子裝置1a打電話給受話者,受話者則使用可撥打電話之電子裝置1b,而網路90可包括網際網路、電信網路,無線網路(如3G,4G,Wi-Fi)等等。可撥打電話之電子裝置1a、1b可為手機、智慧型手機、電腦(網路電話)、無線對講機、電話等。而使用可撥打電話之電子裝置1a也可為家用電話(但有需要可加裝變音處理模組)。除了聽障者或有聽力困難的老人可利用本發明改善通話品質外,一般使用者也能因此得到更完整的通話聲音。
可撥打電話之電子裝置1a包括一處理器11,一記憶體12,一麥克風模組13,一播音模組14以及一聲音訊號通訊模組15(傳送及接收語音訊號)。而記憶體12儲存有一聲音處理程式121及使用者之相關變音參數。記憶體12、麥克風模組13、播音模組14以及一聲音訊號通訊模組15皆與處理器11電性連接。
需注意的是,在本實施例中可撥打電話之電子裝置1a,1b是以電腦架構製成之電子裝置,譬如是手機、智慧型手機、電腦、平板電腦。處理器11及記憶體12這兩部分事實上構成一變音處理模組50,變音處理模組50可以以硬體、韌體之架構設計,不一定採取處理器11加記憶體12之設計。另外電子裝置1b之架構與電子裝置1a相同,因此不再於圖1重複標示。
以下請一併參考圖5以及圖6至圖8,根據本實施例,可撥打電話之電子裝置1a為發話端,可撥打電話之電子裝置1b為受話端。
步驟701:接收一傳送語音80。
根據本實施例,傳送語音80為由通話者發出但還未經電話傳送的語音,具本發明功能之電話會先將傳送語音80切割為複數段傳送語音段20(如圖1所示),並逐段處理。
步驟702:判斷一傳送語音段是否為一高頻子音聲音段。
可撥打電話之電子裝置1a透過變音處理模組50來作高頻語音之判斷,若傳送語音段20被判斷為非高頻子音聲音段,那麼就不會經過本發明之電話裝置的語音處理,而是透過步驟706由電話直接輸出傳送語音80送至受話者端;若傳送語音段20被判斷為高頻子音聲音段,便會藉由變音處理模組50來針對判定為高頻的傳送語音段20進行步驟703。其中判斷高頻子音聲音段可以A Hz以上的能量是否超過30%來作判斷,但方法不在此限,判斷方法還可參考同發明人之判斷高頻子音相關案件US 8,582,792。然而判斷高頻子音的方法非本案重點,故不再贅述。
步驟703:找出該高頻子音聲音段於A Hz以上之一高頻主要分佈能量段28,其中2500≦A≦3500。
如圖6所示之傳送語音段20被判定為高頻之高頻子音聲音段25,根據本實施例,低頻區22以及高頻區21分界的起始頻率A為2900Hz,處理語音的第一步驟會先以2900Hz為起點,向上找出能量最高的地方(找出高頻區21的能量集中處),由於針對高低頻的分界標準非一定,故起始頻率A不在此限,本發明建
議以2500-3500Hz任一頻率作為低頻區22以及高頻區21的分界,皆能得到理想的處理結果。
所述之能量集中處在此將描述為高頻主要分佈能量段28,高頻主要分佈能量段28的取樣頻寬C在本實施例為連續的300Hz,但其不在此限,依照能量集中處的分布情況,可讓取樣的頻寬C介於300-1500Hz。也就是說,取樣後的高頻主要分佈能量段28之頻寬可介於300-1500Hz之間。
步驟704:將該高頻主要分佈能量段28移頻以B Hz為起始以產生一低頻化高頻子音聲音段25a,其中2500≦B≦3500。
如圖7所示,原圖6位於高頻區21的高頻主要分佈能量段28被向下移頻至一起始頻率B以將高頻子音聲音段25處理為一低頻化高頻子音聲音段25a,藉此讓傳送語音段20在被電話移除4000Hz以上的高頻部分前,先行保留具有高頻的聲音。根據本實施例,移頻之起始頻率B為2900Hz,但其不在此限,移頻之起始頻率B可介於2500-3500Hz,相較於作為低頻以及高頻分界的起始頻率A,分界的起始頻率A與移頻的起始頻率B的差值建議介於300內(-300≦A-B≦300),譬如分界的起始頻率A為3400,移頻的起始頻率B可為3150。
另外需要注意的是,由於最終目的是將高頻區21的高頻聲音向下移動且同時不被移除4000Hz以上的聲音,故移頻之起始頻率B以及高頻主要分佈能量段28的取樣頻寬C需相互調
整,譬如當移頻之起始頻率B為3500Hz時,取樣頻寬C不應超過500Hz;又譬如當移頻之起始頻率B為2500Hz時,取樣頻寬C可為建議範圍的最大值1500Hz。
步驟705:輸出低頻化高頻子音聲音段25a。將處理過後的低頻化高頻子音聲音段25a傳送至可撥打電話之電子裝置1b之受話端。
步驟706:終端傳送語音段30。在電話傳輸的過程中,低頻化高頻子音聲音段25a會被電話移除超過4000Hz的高頻,故受話端接受的終端傳送語音段30就如同圖8所示。
藉由上述之方法步驟,原本聲音段在電話傳輸過程中會被移除的高頻部分可予以保留,使得使用者可順利地在電話溝通時聽到完整的聲音。需注意的是,上述僅為實施例,而非限制於實施例。譬如此不脫離本發明基本架構者,皆應為本專利所主張之權利範圍,而應以專利申請範圍為準。
步驟701~步驟706
Claims (10)
- 一種電話語音處理之方法,用於一使用者於使用一電話時,該電話所進行之語音處理,該方法包括:接收一傳送語音段;若該傳送語音段為一高頻子音聲音段,則進行:找出該高頻子音聲音段於A赫茲以上之一高頻主要分佈能量段,其中2500≦A≦3500;以及將該高頻主要分佈能量段移頻以B赫茲為起始以產生一低頻化高頻子音聲音段,其中2500≦B≦3500,其中該高頻主要分佈能量段之分佈頻寬為C赫茲,其中300≦C≦1500,使得該高頻主要分佈能量段分佈於B赫茲至B+C赫茲之間。
- 如申請專利範圍第1項所述之電話語音處理之方法,其中該高頻主要分佈能量段為一連續的頻寬。
- 如申請專利範圍第2項所述之電話語音處理之方法,其中該高頻主要分佈能量段係為該高頻子音聲音段於A赫茲以上中能量最高之C赫茲分佈頻寬。
- 如申請專利範圍第3項所述之電話語音處理之方法,其中-300≦A-B≦300。
- 如申請專利範圍第4項所述之電話語音處理之方法,其中該高頻子音聲音段係符合A赫茲以上的能量超過30%。
- 一種可撥打電話之電子裝置,其用於執行如申請專利範圍第1項所述之電話語音處理之方法。
- 如申請專利範圍第6項所述之可撥打電話之電子裝置,其中該高頻主要分佈能量段為一連續的頻寬。
- 如申請專利範圍第7項所述之可撥打電話之電子裝置,其中該高頻主要分佈能量段係為該高頻子音聲音段於A赫茲以上中能量最高之C赫茲分佈頻寬。
- 如申請專利範圍第8項所述之可撥打電話之電子裝置,其中-300≦A-B≦300。
- 如申請專利範圍第9項所述之可撥打電話之電子裝置,其中該高頻子音聲音段係符合A赫茲以上的能量超過30%。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW104121778A TWI578753B (zh) | 2015-07-03 | 2015-07-03 | 電話語音處理方法及可撥打電話之電子裝置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW104121778A TWI578753B (zh) | 2015-07-03 | 2015-07-03 | 電話語音處理方法及可撥打電話之電子裝置 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201703491A TW201703491A (zh) | 2017-01-16 |
TWI578753B true TWI578753B (zh) | 2017-04-11 |
Family
ID=58401003
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW104121778A TWI578753B (zh) | 2015-07-03 | 2015-07-03 | 電話語音處理方法及可撥打電話之電子裝置 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWI578753B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012076044A1 (en) * | 2010-12-08 | 2012-06-14 | Widex A/S | Hearing aid and a method of improved audio reproduction |
TW201503707A (zh) * | 2013-07-05 | 2015-01-16 | Kuo-Ping Yang | 電話語音處理之方法及其電腦程式 |
-
2015
- 2015-07-03 TW TW104121778A patent/TWI578753B/zh active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012076044A1 (en) * | 2010-12-08 | 2012-06-14 | Widex A/S | Hearing aid and a method of improved audio reproduction |
CN103250209A (zh) * | 2010-12-08 | 2013-08-14 | 唯听助听器公司 | 改善音频重现的助听器和方法 |
TW201503707A (zh) * | 2013-07-05 | 2015-01-16 | Kuo-Ping Yang | 電話語音處理之方法及其電腦程式 |
Also Published As
Publication number | Publication date |
---|---|
TW201703491A (zh) | 2017-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10542136B2 (en) | Transcribing audio communication sessions | |
CN104717594B (zh) | 助听系统、助听手机及其助听方法 | |
US20080254753A1 (en) | Dynamic volume adjusting and band-shifting to compensate for hearing loss | |
JP2006345025A (ja) | 電話装置およびその音声処理方法 | |
US20040162722A1 (en) | Speech quality indication | |
US9787824B2 (en) | Method of processing telephone signals and electronic device thereof | |
EP4165882A1 (en) | Audio enhancement for hearing impaired in a shared listening environment | |
CN103581934A (zh) | 一种终端语音质量评估方法和终端 | |
US10483933B2 (en) | Amplification adjustment in communication devices | |
TWI578753B (zh) | 電話語音處理方法及可撥打電話之電子裝置 | |
CN116367066A (zh) | 具有音频质量检测的音频设备及相关方法 | |
US20150201057A1 (en) | Method of processing telephone voice output and earphone | |
CN104104780B (zh) | 电话语音输出的方法、应用其的电脑程序产品及电子装置 | |
US9301060B2 (en) | Method of processing voice signal output and earphone | |
TWI519123B (zh) | 電話語音輸出之方法,用於電話語音之電腦程式產品及可撥打電話之電子裝置 | |
US10748548B2 (en) | Voice processing method, voice communication device and computer program product thereof | |
JP2007325201A (ja) | 音源分離法 | |
KR100575764B1 (ko) | 휴대폰의 통화연결음 서비스 방법 | |
CN108156307B (zh) | 语音处理的方法以及语音通讯装置 | |
US20150327035A1 (en) | Far-end context dependent pre-processing | |
TW201642675A (zh) | 通訊裝置及其音量調整方法 | |
KR20050029314A (ko) | 휴대폰의 벨소리 출력 방법 | |
TW201528707A (zh) | 聲音傳輸系統及方法 | |
JPH06350691A (ja) | 電話機 |