TWI626647B

TWI626647B - 嗓音即時監測系統

Info

Publication number: TWI626647B
Application number: TW106134812A
Authority: TW
Inventors: 王棨德
Original assignee: 醫療財團法人徐元智先生醫藥基金會亞東紀念醫院
Priority date: 2017-10-11
Filing date: 2017-10-11
Publication date: 2018-06-11
Also published as: TW201916008A

Abstract

本發明嗓音即時監測系統，用於檢測並分析使用者的嗓音使用狀況，如語速或音量等，包含：收音裝置，持續性接收使用者周圍的聲音，聲音包含嗓音音訊及環境音訊；消音模組，電性連接收音裝置，用以接收聲音，並消除環境音訊，餘留嗓音音訊；音訊轉換模組，電性連接消音模組，用以接收嗓音音訊，並轉換嗓音音訊為線性圖案；語音偵測模組，電性連接音訊轉換模組，用以接收線性圖案，並預設有門檻值，並將線性圖案比對上述門檻值，形成一輸出波型，再由輸出波型定義出語音區段以及非語音區段；檢測處理模組，電性連接語音偵測模組，擷取一時間區間內的語音區段及非語音區段來形成嗓音使用指標。

Description

嗓音即時監測系統

本發明有關於一種檢測嗓音使用狀況的系統，尤指一種能夠即時檢測嗓音狀況是否符合預定正常範圍數值，並能夠供使用者隨時查看知悉的系統。

嗓音，特別係指由人類呼吸系統與喉部協調，震動聲帶所產生的聲音，用以傳達信息。

嗓音疲勞是指使用喉嚨發聲頻繁或不當，導致聲帶和聲帶的周邊肌肉出現疲勞的狀態，而在發聲的過程中，聲帶表皮的細胞或組織，一旦出現疲勞、水腫或受傷的狀態，若不暫時休息仍繼續使用喉嚨發聲，或是持續飲用酒精、咖啡或抽菸，則可能導致聲帶長繭、聲帶息肉等不容易復原或難以恢復之傷害。

而一般人能夠透過自我初步檢視是否發生下列情況，判斷是否須避免繼續使用嗓音並休息緩解疲勞：發聲或講話開始吃力、覺得喉嚨周圍肌肉緊張、發聲時不自覺地提高音量或音高、原先能夠發出小聲或假音突然變得不行、出現聲音沙啞或粗糙的情形、痰突然變得很多等。

由於嗓音出現異樣的狀況，多係起因於長期過量或不當之持續用聲，因此，自主有意識地調整發聲習慣、放慢說話速度與減輕用聲量等，自然成為治療上的根本。

然而，由臨床治療的長期觀察發現，有不少比率之患者，提出不易當下立即地意識到，應該適時調整發聲過快或音量過大的時機點，進而做出立即修正或休息的反應，往往都是要待嗓音出現異常狀況或喉嚨不適後，才自覺過當之使用可能已經造成聲帶之傷害。

本發明之主要目的在於提供一種能夠即時監測並分析、記錄當下嗓音使用狀況的系統。

本發明之另一目的在於，該系統尚能夠配合遠端醫療輔助系統、穿戴式裝置或者是智慧醫療機構來顯示或記錄受測者的嗓音使用狀況，供受測者當下即時或事後查看嗓音使用狀況，隨時隨地檢測並調整嗓音使用的習慣。

本發明之再一目的在於，提供一種主動地即時警示與提醒使用者其嗓音使用方式的手段，透過即時監測嗓音品質，並由系統主動地將監測結果即時回饋於受測者，供受測者立即地根據顯示的監測結果，適當地調整聲帶發音的時間、速度或音量、又或者轉而噤聲休息。

為達上述目的，本發明嗓音即時監測系統，用於檢測並分析一使用者的嗓音使用狀況，包含：一收音裝置，持續性接收使用者周圍的聲音，上述聲音包含一由上述使用者所發出的嗓音音訊以及一非使用者所產生的環境音訊；一消音模組，電性連接上述收音裝置，用以接收上述聲音，並消除上述環境音訊，餘留上述嗓音音訊；一音訊轉換模組，電性連接上述消音模組，用以接收上述嗓音音訊，並將上述嗓音音訊轉換為一同時以能量大小及時間軸表示的線性圖案；一語音偵測模組，電性連接上述音訊轉換模組，用以接收上述線性圖案，預設一門檻值，並將上述線性圖案比對上述門檻值，形成一輸出波型，再由上述輸出波型定義出至少一語音區段以及至少一非語音區段；以及一檢測處理模組，電性連接上述語音偵測模組，擷取一預定時間區間內的上述語音區段以及至少一非語音區段形成一嗓音使用指標。

而上述消音模組預設一閾值，能量大小低於上述閾值的聲音設為上述環境音訊，而能量大小等於或高於上述閾值的音訊設為上述嗓音資訊。

其中，上述線性圖案是由複數條胞絡線連續連接所構成。

又，上述語音區段由至少一具有大幅度能量變化表示的方形波構成。

上述嗓音使用指標設為一上述語音區段或者是非語音區段佔上述時間區間的比例、或是一將上述語音區段的全部時間長度加總、或是一每一上述語音區段的振幅寬度或能量大小，而輸出不同的上述嗓音使用指標。

於一較佳可行實施例中，上述嗓音即時監測系統進一步包含一供使用者觀看的螢幕，上述螢幕用於顯示上述嗓音使用指標的線性圖形或數值。

於另一較佳可行實施例中，上述嗓音即時監測系統進一步包含一警示機構，上述警示機構電性連接上述檢測處理模組，並依據上述嗓音使用指標，保持一原先的非警示狀態或改變為一警示狀態。

上述警示狀態包含：震動、文字、溫度、電磁信號、圖片、燈號的顏色改變或閃爍變化等。

由前述說明可知，本發明的特點在於：設計即時接收並分析嗓音狀況的系統，且系統能夠結合穿戴式裝置供受測者隨身攜帶，供受測者隨時監測並查看紀錄，了解自我的實際發音使用情形，有助於長期監控與改善受測者使用嗓音的習慣；又或者是本發明與遠端醫療輔助系統、智慧醫療機構結合連線，受測者能夠於家中遠端與醫院或系統連線或上網連結，隨時透過電子產品使用線上系統監測當時嗓音使用狀況。

此外，本發明尚能夠結合即時提醒或警示的機構，受測者若於發聲的當下，啟動並應用本發明嗓音即時監測系統，則當出現預定時間內使用嗓音過久、音量過大、發音沙啞、音頻改變等監測結果時，系統將於螢幕上顯示對應提醒結果、或者是透過燈光閃爍發聲警示聲音等方式，即時地提醒受測者意識到當下聲帶使用情形，並可做為喝水濕潤喉部、噤聲休息以及改變長期發聲習慣之參考。

1‧‧‧嗓音即時監測系統

2‧‧‧收音裝置

20‧‧‧嗓音音訊

21‧‧‧環境音訊

22‧‧‧音源檔

3‧‧‧消音模組

30‧‧‧閾值

4‧‧‧音訊轉換模組

40‧‧‧線性圖案

41‧‧‧胞絡線

5‧‧‧語音偵測模組

50‧‧‧輸出波型

51‧‧‧語音區段

510‧‧‧方形波

52‧‧‧非語音區段

6‧‧‧檢測處理模組

60‧‧‧嗓音使用指標

7‧‧‧螢幕

8‧‧‧警示機構

80‧‧‧警示狀態

81‧‧‧非警示狀態

圖1為嗓音即時監測系統之電性連接及嗓音使用指標產生流程之示意圖；圖2A至2B為圖1嗓音使用指標的產生原理之示意圖；圖3為語音偵測模組的門檻值計算方程式之較佳實施例示意圖；圖4為螢幕顯示嗓音使用指標的使用狀態之第一較佳實施例示意圖；圖5為螢幕顯示嗓音使用指標的使用狀態之第二較佳實施例示意圖。

茲為便於更進一步對本發明之構造、使用及其特徵有更深一層明確、詳實的認識與瞭解，爰舉出較佳實施例，配合圖式詳細說明如下：請參照圖1、圖2A及圖2B所示，本發明嗓音即時監測系統1，能夠應用於遠端或隨身監測並記錄受測者的長期的發音習慣、即時的嗓音使用狀況，藉以供受測者依據其自身發音習慣或當下聲帶狀況，可長期循序漸進地改善或即時調整使用喉部的發音情形，其主要包含有一收音裝置2、一消音模組3、一音訊轉換模組4、一語音偵測模組5以一檢測處理模組6等五部分，並依序地彼此電性連接。

當本發明嗓音即時監測系統1受到使用者啟動開關後，上述收音裝置2會持續性地自動接收使用者周圍的聲音，又或者使用者欲開始監測時，使用者按下錄音或輸入按鍵後，上述收音裝置2才會開始持續地接收使用者周圍的聲音，直至使用者按下停止按鍵，上述聲音包含一由上述使用者所發出的嗓音音訊20以及一非使用者所產生的環境音訊21。

其中，上述嗓音音訊20以及環境音訊21透過上述收音裝置2接收後轉為一音源檔22的電子資料形式，上述音源檔22的音訊格式可設為Waveform(*.wav)、MPEG-1 or MPEG-2 Audio Layer III(*.mp3)、Free Lossless Audio Codec(*.flac)、Perfect authentic cadence(*.pac)、Monkey's Audio(*.ape)等數位格式。

上述音源檔22經過上述收音裝置2傳輸至上述消音模組3，上述消音模組3預設一閾值30，上述音源檔22的能量大小低於上述閾值30的聲音設為上述環境音訊21，而能量大小等於或高於上述閾值30的聲音設為上述嗓音音訊20。

因上述收音裝置2每段時間所收錄的聲音大小、收音清晰程度不同，上述閾值30設為一浮動的數值，並對應所收錄聲音的強弱而改變其數值。

此外，上述嗓音音訊20經過上述消音模組3傳輸至上述音訊轉換模組4，上述嗓音音訊20轉換為一同時以能量大小及時間軸表示的線性圖案40，其中，上述線性圖案40是由複數條胞絡線41依據上述嗓音音訊20於每單位時間所偵測到的能量峰值相互連接構成，其中，上述胞絡線41代表著於不同頻率下之聲音。

上述線性圖案40經過上述音訊轉換模組4傳輸至上述語音偵測模組5，上述語音偵測模組5預設一門檻值，並將上述線性圖案40比對上述門檻值，形成一輸出波型50，再由上述輸出波型50定義出至少一語音區段51以及至少一非語音區段52，而於本發明一較佳可行實施例中，上述語音區段51由至少一具有大幅度能量變化表示的方形波510表示。

請參照圖3所示，須加以詳細說明的是，上述門檻值的設計為當下時間與往前推回兩時間點的能量峰值數據彼此之間的線性關係，其計算方式是一預設的方程式：aX ₁+b ² X ₂+c ³ X ₃，取上述輸出波型50中的語音區段51之當下時間點的峰值數據為X ₃，取當下時間點之前的兩筆峰值數據為X ₁及X ₂，另，a,b,c三者為透過一最佳演算法而得知三個最佳參數值，其中，而本文所指最佳演算法如：基因演算法、梯度下降法、牛頓法、共軛梯度法、線性搜索、置信域方法、模擬退火、類免疫演算法等，上述a,b,c的參數值以及X _1、 X _2、 X ₃峰值數據是依據不同使用者個人當下的發音特性、環境噪音的特性、語言的特性或者是上述方形波510與其他方形波510彼此之間的前後連續表現特性等因素而變動。

於一較佳可行實施例中，門檻值的方程式：aX ₁+b ² X ₂+c ³ X ₃，求得最佳a,b,c三個最佳參數值分別為a=-0.2639，b=-0.2835，c=0.9286，而透過此方程式計算出來的數值，比對預測出受測者具有嗓音問題的準確率為95.4511%(如圖3)。

請接續參照圖1、圖2A及圖2B所示，上述輸出波型50經過上述語音偵測模組5傳輸至上述檢測處理模組6，上述檢測處理模組6擷取一預定時間區間內的輸出波型50構成該單位時間內的嗓音使用指標60，上述嗓音使用指標60能夠設為一上述語音區段51或者是非語音區52段佔上述時間區間的比例，作為判斷該單位時間內使用者是否說話的過多、使用聲帶的休息時間是否充足之依據；還能夠設為一全部上述語音區段51的時間長度加總同樣能夠作為該單位時間內使用者是否說話的過多、使用聲帶的休息時間是否充足之依據；亦能夠透過比對上述語音區段51與非語音區段52彼此之間的時間長度，作為該單位時間內使用者是否語速過快之依據；尚能夠透過比對上述語音區段51與非語音區段52彼此之間的能量大小，作為該單位時間內使用者是否嗓音過於大聲，而過於用力使用聲帶，而前述不同的判斷結果將輸出不同的嗓音使用指標60。

另外，請參照圖4及圖5所示，於圖示兩較佳可行實施例中，本發明嗓音即時監測系統1能夠配合一具有顯示螢幕7的穿戴式裝置、遠端醫療輔助系統、智慧醫療機構使用，上述螢幕7能夠將上述不同的嗓音使用指標60、線性圖案40、計算數值或者是應該注意放慢說話速度、減低說話音量、或須噤聲休息等類似的提醒文字顯示其上。

據此，供使用者隨時查看過往或是當下監測出來的結果，以及比對過去使用嗓音的習慣，藉以自我檢視是否有順利調整或改善原先不良的聲帶使用狀況，而能夠大幅度地提升根本治療個人的嗓音疲勞或嗓音疾病的主因。

請接續參照圖4及圖5所示，本發明嗓音即時監測系統1能夠配合一警示機構8使用，上述嗓音使用指標60經過上述檢測處理模組6傳輸至上述警示機構8，依據不同的上述嗓音使用指標60，上述警示機構8能夠保持一原先的非警示狀態81或改變為一警示狀態80，於較佳的可行實施例中，上述警示狀態80包含：震動、文字、溫度、電磁信號、圖片、燈號的顏色改變或閃爍變化等，使得使用者能夠在無需主動查看上述螢幕7所顯示的嗓音使用指標60資訊，透過警示狀態80所傳達出的訊號主動地顯示予使用者知悉，即可即時地於監測自我嗓音的當下，便能夠立即地意識到須放慢說話語速、降低說話聲量、或者是聲帶已出現嗓音疲勞現象，乃至必須噤聲休息或者是喝水滋潤喉部。

如此一來，理想狀態下，使用者在主動查看上述螢幕7或是受到上述警示機構8的警示提醒後，使用者能夠暫時停止原先使用聲帶的行為，噤聲休息或進行放鬆聲帶及聲帶周圍肌肉的運動。

上述所舉實施例，僅用為方便說明本發明並非加以限制，在不離本發明精神範疇，熟悉此一行業技藝人士依本發明申請專利範圍及創作說明所作之各種簡易變形與修飾，均仍應含括於以下申請專利範圍中。

Claims

一種嗓音即時監測系統，用於檢測並分析一使用者的嗓音使用狀況，包含：一收音裝置，接收使用者周圍的聲音，上述聲音包含一由上述使用者所發出的嗓音音訊以及一非使用者所產生的環境音訊；一消音模組，電性連接上述收音裝置，用以接收上述聲音，並將上述環境音訊消除，餘留上述嗓音音訊；一音訊轉換模組，電性連接上述消音模組，用以接收上述嗓音音訊，並將上述嗓音音訊轉換為一同時以能量大小即時間軸表示的線性圖案；一語音偵測模組，電性連接上述音訊轉換模組，用以接收上述線性圖案，預設一門檻值，並將上述線性圖案比對上述門檻值，形成一輸出波型，再由上述輸出波型定義出至少一語音區段以及至少一非語音區段；以及一檢測處理模組，電性連接上述語音偵測模組，擷取一預定時間區間內的上述語音區段以及至少一非語音區段形成一嗓音使用指標。
如申請專利範圍第1項所述之嗓音即時監測系統，其中，上述消音模組預設一閾值，能量大小低於上述閾值的聲音設為上述環境音訊，而能量大小等於或高於上述閾值的聲音設為上述嗓音音訊。
如申請專利範圍第1項所述之嗓音即時監測系統，其中，上述線性圖案是由複數條胞絡線連續連接所構成。
如申請專利範圍第1項所述之嗓音即時監測系統，其中，上述語音區段由至少一具有大幅度能量變化表示的方形波構成。
如申請專利範圍第1項所述之嗓音即時監測系統，其中，上述嗓音使用指標設為一上述語音區段或者是非語音區段佔上述時間區間的比例、或是一將上述語音區段的全部時間長度加總、或是一每一上述語音區段的振幅寬度或能量大小，而輸出不同的上述嗓音使用指標。
如申請專利範圍第1項所述之嗓音即時監測系統，其中，上述嗓音即時監測系統進一步包含一供使用者觀看的螢幕，上述螢幕用於顯示上述嗓音使用指標的線性圖形或數值。
如申請專利範圍第1項所述之嗓音即時監測系統，其中，上述嗓音即時監測系統進一步包含一警示機構，上述警示機構電性連接上述檢測處理模組，並依據上述嗓音使用指標，保持一原先的非警示狀態或改變為一警示狀態。
如申請專利範圍第7項所述之嗓音即時監測系統，其中，上述警示狀態包含：震動、文字、溫度、電磁信號、圖片、燈號的顏色改變或閃爍變化等。