TW202307830A - 音質評價方法及使用其之音質評價系統 - Google Patents
音質評價方法及使用其之音質評價系統 Download PDFInfo
- Publication number
- TW202307830A TW202307830A TW110129852A TW110129852A TW202307830A TW 202307830 A TW202307830 A TW 202307830A TW 110129852 A TW110129852 A TW 110129852A TW 110129852 A TW110129852 A TW 110129852A TW 202307830 A TW202307830 A TW 202307830A
- Authority
- TW
- Taiwan
- Prior art keywords
- group
- sound quality
- audio data
- scores
- evaluation
- Prior art date
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 51
- 238000012360 testing method Methods 0.000 claims abstract description 11
- 238000013441 quality evaluation Methods 0.000 claims description 45
- 238000000034 method Methods 0.000 claims description 31
- 238000004422 calculation algorithm Methods 0.000 claims description 28
- 238000012545 processing Methods 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000004891 communication Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 description 6
- 238000010183 spectrum analysis Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 238000009825 accumulation Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 210000005069 ears Anatomy 0.000 description 2
- 238000011478 gradient descent method Methods 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 229920000742 Cotton Polymers 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009413 insulation Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Electrophonic Musical Instruments (AREA)
Abstract
本案揭示一種音質評價方法及使用其之音質評價系統。音質評價系統錄製複數個播放裝置所播放之一測試音檔以產生複數個音訊資料,並將音訊資料切分為複數個頻段。音質評價系統計算頻段以得到播放裝置之複數個評價分數。音質評價系統會自一參考來源擷取對應播放裝置之一音質排行資訊,並根據音質排行資訊以調整評價分數,進而得到一參考模型。音質評價系統會依據參考模型對應調整複數個待測播放裝置之評價分數,以得到待測播放裝置之音質排行資訊。
Description
本案是有關於一種播放裝置之音質的評價方法及評價系統。
消費者在購買播放裝置時,通常會親自聆聽播放裝置所播放音檔來決定自己所偏好的產品。網路上大部分的產品分析也都是以分析者們的主觀感受,來對播放裝置進行評價。也就是說,目前市面上並沒有一套客觀且精準的評價方法來對播放裝置進行性能表現分析。此外,受到主觀感受的影響,每個人對於同一項產品的評價也大不相同。如此的現況使得消費者難以從主觀的播放裝置排行榜中,選擇適合自己的產品。
本案揭示一種音質評價方法,用以提供複數個播放裝置的音質排行資訊,包含:將這些播放裝置定義為一第一群組以及一第二群組;分別錄製第一群組以及第二群組所播放至少一測試音檔,以產生複數個第一音訊資料以及複數個第二音訊資料;分別切分各第一音訊資料以及各第二音訊資料,以產生複數個第一群組頻段以及複數個第二群組頻段;分別計算處理第一群組頻段以及第二群組頻段,以得到第一群組之複數個第一評價分數以及第二群組之複數個第二評價分數;自一參考來源擷取對應第一群組之一第一音質排行資訊;參考第一音質排行資訊以對應調整第一評價分數,進而得到一第一參考模型;以及依據第一參考模型對應調整第二評價分數,進而得到第二群組之一第二音質排行資訊。
本案亦揭示一種音質評價系統,包含一音訊錄製模組、一計算模組、一通訊模組以及一處理模組。音訊錄製模組係用以將複數個播放裝置定義為一第一群組以及一第二群組,分別錄製第一群組以及第二群組所播放至少一測試音檔,以產生複數個第一音訊資料以及複數個第二音訊資料。計算模組係用以切分各第一音訊資料以及各第二音訊資料,以產生複數個第一群組頻段以及複數個第二群組頻段,並分別計算處理第一群組頻段以及第二群組頻段,以得到第一群組之複數個第一評價分數以及第二群組之複數個第二評價分數。通訊模組係用以自一參考來源擷取對應第一群組之一第一音質排行資訊。處理模組係用以參考第一音質排行資訊以對應調整第一評價分數,進而得到一第一參考模型,依據第一參考模型對應調整第二評價分數,進而得到第二群組之一第二音質排行資訊。
本案的音質評價方法和音質評價系統透過參照一或多個網路公開資料庫所發布的音訊裝置的音質排行資訊,來訓練出可以客觀評價音訊裝置的音質評價演算法模型,且訓練過程中完全無須聲學專家的介入。隨著訓練資料的累積,本案的音質評價模型所計算出的評價分數高低不僅能夠趨近於聲學專家的判斷,也可以完全避免聲學專家偶因評價當下的生理與心理條件變化所導致的評價結果偏差,因而能比聲學專家更加客觀且更加具有一致性地評價各種播放裝置的音質好壞,因此可以提供客觀且精準的評價方法,方便地提供使用者得知播放裝置的性能表現。
以下將以圖式揭露本案之一些實施例,為明確說明起見,許多實務上的細節將在以下敘述中一併說明,但這並不限制本案的申請專利範圍。
如圖1所示,在一些實施例中,音質評價方法的實施環境係一聆聽室10,其中聆聽室10係根據歐洲通訊標準機構(ETSI)及國際電子技術協會(IEC)所定義用於鑑賞電聲產品、喇叭之一空間。聆聽室10包含有一待測播放裝置110、一人工頭裝置120及一電腦主機130。電腦主機130係設置在人工頭裝置120旁邊,且電腦主機130電性連接人工頭裝置120。
參照圖2與圖3,圖2為本發明之一實施例中音質評價系統210進行音質評價方法的示意圖,圖3為本發明之音質評價方法的例示流程圖。音質評價系統210可用來執行音質評價方法,並包含音訊錄製模組211、計算模組212、通訊模組213及處理模組214,其中音訊錄製模組211電性連接計算模組212,計算模組212電性連接處理模組214,處理模組214電性連接通訊模組213。
如圖3所示,將複數個播放裝置200定義為第一群組201以及第二群組202後(步驟S10),音質評價系統210之音訊錄製模組211會分別錄製第一群組201之播放裝置以及第二群組202之播放裝置所播放至少一測試音檔,以產生複數個第一音訊資料以及複數個第二音訊資料(步驟S20)。
一實施例中,音質評價系統210可以是一手機、一平板電腦或一個人電腦。
一實施例中,音訊錄製模組211係一人工頭裝置120,其中人工頭裝置120是模擬人耳構造之一麥克風,其功用為模擬人耳接收音訊資料以分析人體各部位構造對人耳聽覺所造成的影響。
一實施例中,播放裝置200可以是任意型號之喇叭、音響、手機、平板或個人電腦。
一實施例中,測試音檔可以是任意音訊檔案格式的音訊檔案,例如MP3檔、WAV檔、AAC檔或FLAC檔等。音訊錄製模組211會將測試音檔錄製成固定音訊格式之音訊資料。
音質評價系統210之計算模組212會分別切分各第一音訊資料以及各第二音訊資料,以產生複數個第一群組頻段以及複數個第二群組頻段(步驟S30),其中這些頻段之頻率係在100 Hz至22K Hz之範圍間,100 Hz至22K Hz之範圍係一般人所能聽到聲音的一頻率範圍。切分各音訊資料為複數個頻段係用以擷取人耳可聽到的聲音頻率,並過濾掉那些人耳聽不到的聲音頻率。
一實施例中,計算模組212可以是一中央處理器(CPU)、一圖形處理器(GPU)或具有計算功能之一計算單元。
一實施例中,計算模組212切分各第一音訊資料以及各第二音訊資料為多個頻段,例如但不限於是26個頻段。
計算模組212切分完各第一音訊資料以及各第二音訊資料為複數個第一群組頻段以及複數個第二群組頻段後,會繼續分別計算處理這些第一群組頻段以及這些第二群組頻段,以得到第一群組201之複數個第一評價分數以及第二群組202之複數個第二評價分數(步驟S40)。
計算模組212會透過一機器學習演算法與一音質評價演算法模型來計算這些第一群組頻段以及這些第二群組頻段,以得到這些第一評價分數以及這些第二評價分數,其中這些第一評價分數係第一群組201之播放裝置的音質表現,這些第二評價分數係第二群組202之播放裝置的音質表現,評價分數愈高,表示播放裝置的音質表現愈好。
一實施例中,機器學習演算法係一梯度下降法,其中梯度下降法的公式為
。
f(x)為一音質評價函數(即音質評價演算法模型),
係該第一音訊資料之各該頻段的能量,
係一學習率,
係一目標分數,
係更新次數,其中音質評價演算法模型之初始模型係採用隨機的一初始參考模型,本發明所屬技術領域中具有通常知識者皆熟知初始參考模型,故不贅述。
學習率係指每次進行更新時的更新幅度,在更新的過程中需逐步調整學習率之值。本實施例中,學習率之值係在0.001到0.002之範圍間,學習率之值的調整幅度係在0.00001至0.0001之範圍間。
音質評價系統210之通訊模組213會自一參考來源220擷取對應第一群組201之播放裝置之第一音質排行資訊221(步驟S50),其中通訊模組213可以透過有線網路或無線網路以連接參考來源220。
一實施例中,參考來源220係一網路公開資料庫,其中網路公開資料庫包含複數個型號之複數個播放裝置200之音質排行資訊。舉例來說,音質評價系統210之通訊模組213可以自一手機評測網站上擷取複數個型號之複數個播放裝置200之音質排行資訊。
擷取完第一音質排行資訊221後,音質評價系統210之處理模組214會參考第一音質排行資訊221以對應調整第一評價分數,進而得到一第一參考模型(步驟S60)。
處理模組214會將初始參考模型中的一參數調整為一第一參數以得到第一參考模型,使得這些第一評價分數之高低順序經由機器學習演算法與第一參考模型計算後會匹配該第一音質排行資訊221,也就是使這些第一評價分數之高低順序與第一音質排行資訊221中第一群組201之播放裝置排名之高低順序相同。
一實施例中,處理模組214可以是一中央處理器(CPU)、一圖形處理器(GPU)或具有計算功能之一計算單元。
音質評價系統210之處理模組214會依據第一參考模型對應調整這些第二評價分數,進而得到第二群組202之一第二音質排行資訊(步驟S70),此時音質評價演算法模型
f(x)已經完成訓練,並且可客觀地評價一或多個播放裝置200之音質表現。因此,將第二音訊資料經由機器學習演算法與第一參考模型計算後,即可得到客觀的第二音質排行資訊以及第二群組202之播放裝置的音質表現。
一實施例中,音質評價系統210之計算模組212會進一步透過一空間性演算法計算這些第二音訊資料,以得到第二群組202之複數個空間性分數,其中空間性分數愈高,代表第二群組202之播放裝置在播放音訊時的空間性表現愈好。空間性演算法包含一頭部相關轉換函數以及一最小變異無失真響應演算法,本發明所屬技術領域中具有通常知識者皆熟知頭部相關轉換函數以及最小變異無失真響應演算法,故不贅述。
一實施例中,音質評價系統210之計算模組212會進一步透過一動態性演算法計算這些第二音訊資料,以得到第二群組202之複數個動態性分數,其中動態性分數愈高,代表第二群組202之播放裝置在播放音訊時的動態性表現愈好。動態性演算法包含一頻譜分析方法、一線性回歸方法以及一基尼係數方法,本發明所屬技術領域中具有通常知識者皆熟知頻譜分析方法、線性回歸方法以及基尼係數方法,故不贅述。
一實施例中,音質評價系統210之計算模組212會進一步透過透過一音量演算法計算這些第二音訊資料,以得到第二群組202之複數個音量分數,其中音量分數愈高,代表第二群組202之播放裝置在播放音訊時的音量表現愈好。音量演算法係一動態範圍抑制方法,本發明所屬技術領域中具有通常知識者皆熟知動態範圍抑制方法,故不贅述。
一實施例中,音質評價系統210之計算模組212會進一步透過一失真演算法計算這些第二音訊資料,以得到第二群組202之複數個失真分數,其中失真分數愈高,代表第二群組202之播放裝置在播放音訊時的失真表現愈差。失真演算法包含一動態互調失真方法以及一尖銳度頻譜分析方法 (亦稱為噝音頻譜分析方法,sibilance),本發明所屬技術領域中具有通常知識者皆熟知動態互調失真方法以及嘶嘶聲頻譜分析方法,故不贅述。
本案的音質評價方法和音質評價系統透過參照一或多個網路公開資料庫所發布的音訊裝置的音質排行資訊,來訓練出可以客觀評價音訊裝置的音質評價演算法模型,且訓練過程中完全無須聲學專家的介入。隨著訓練資料的累積,本案的音質評價模型所計算出的評價分數高低不僅能夠趨近於聲學專家的判斷,也可以完全避免聲學專家偶因評價當下的生理與心理條件變化所導致的評價結果偏差,因而能比聲學專家更加客觀且更加具有一致性地評價各種播放裝置的音質好壞,因此可以提供客觀且精準的評價方法,方便地提供使用者得知播放裝置的性能表現。
雖然本發明已以實施例揭露如上,然其並非用以限定本發明,任何所屬技術領域中具有通常知識者,在不脫離本揭露內容之精神和範圍內,當可作些許之修改與變化,惟該些許之修改與變化仍然在本發明之申請專利範圍內。
10:聆聽室
101:隔音棉
110:待測播放裝置
120:人工頭裝置
130:電腦主機
200:播放裝置
201:第一群組
202:第二群組
210:音質評價系統
211:音訊錄製模組
212:計算模組
213:通訊模組
214:處理模組
220:參考來源
221:第一音質排行資訊
S10~S70:步驟
[圖1]是本發明之一實施例中音質評價方法的實施環境的示意圖。
[圖2]是本發明之一實施例中音質評價系統進行音質評價方法的示意圖。
[圖3]是本發明之音質評價方法的一例示流程圖。
S10~S70:步驟
Claims (8)
- 一種音質評價方法,用以提供複數個播放裝置的音質排行資訊,包含: 將該些播放裝置定義為一第一群組以及一第二群組; 分別錄製該第一群組以及該第二群組所播放至少一測試音檔,以產生複數個第一音訊資料以及複數個第二音訊資料; 分別切分各該第一音訊資料以及各該第二音訊資料,以產生複數個第一群組頻段以及複數個第二群組頻段; 分別計算處理該些第一群組頻段以及該些第二群組頻段,以得到該第一群組之複數個第一評價分數以及該第二群組之複數個第二評價分數; 自一參考來源擷取對應該第一群組之一第一音質排行資訊; 參考該第一音質排行資訊以對應調整該些第一評價分數,進而得到一第一參考模型;以及 依據該第一參考模型對應調整該些第二評價分數,進而得到該第二群組之一第二音質排行資訊。
- 如請求項1所述之音質評價方法,更包含: 透過一空間性演算法計算該些第二音訊資料,以得到該第二群組之複數個空間性分數; 透過一動態性演算法計算該些第二音訊資料,以得到該第二群組之複數個動態性分數; 透過一音量演算法計算該些第二音訊資料,以得到該第二群組之複數個音量分數;以及 透過一失真演算法計算該些第二音訊資料,以得到該第二群組之複數個失真分數。
- 如請求項1所述之音質評價方法,係透過一人工頭裝置錄製該第一群組以及該第二群組所播放之該至少一測試音檔,以產生該些第一音訊資料以及該些第二音訊資料。
- 如請求項1所述之音質評價方法,其中,該參考來源係一網路公開資料庫。
- 一種音質評價系統,包含: 一音訊錄製模組,用以將複數個播放裝置定義為一第一群組以及一第二群組,分別錄製該第一群組以及該第二群組所播放至少一測試音檔,以產生複數個第一音訊資料以及複數個第二音訊資料; 一計算模組,用以分別切分各該第一音訊資料以及各該第二音訊資料,以產生複數個第一群組頻段以及複數個第二群組頻段,分別計算處理該些第一群組頻段以及該些第二群組頻段,以得到該第一群組之複數個第一評價分數以及該第二群組之複數個第二評價分數; 一通訊模組,用以自一參考來源擷取對應該第一群組之一第一音質排行資訊;以及 一處理模組,用以參考該第一音質排行資訊以對應調整該些第一評價分數,進而得到一第一參考模型,依據該第一參考模型對應調整該些第二評價分數,進而得到該第二群組之一第二音質排行資訊。
- 如請求項5所述之音質評價系統,其中,該計算模組更用以透過一空間性演算法計算該些第二音訊資料以得到該第二群組之複數個空間性分數,透過一動態性演算法計算該些第二音訊資料以得到該第二群組之複數個動態性分數,透過一音量演算法計算該些第二音訊資料以得到該第二群組之複數個音量分數,以及透過一失真演算法計算該些第二音訊資料以得到該第二群組之複數個失真分數。
- 如請求項5所述之音質評價系統,其中,該音訊錄製模組係一人工頭裝置。
- 如請求項5所述之音質評價系統,其中,該參考來源係一網路公開資料庫。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW110129852A TWI811762B (zh) | 2021-08-12 | 2021-08-12 | 音質評價方法及使用其之音質評價系統 |
US17/829,810 US11756569B2 (en) | 2021-08-12 | 2022-06-01 | Sound quality evaluation method and sound quality evaluation system using same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW110129852A TWI811762B (zh) | 2021-08-12 | 2021-08-12 | 音質評價方法及使用其之音質評價系統 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202307830A true TW202307830A (zh) | 2023-02-16 |
TWI811762B TWI811762B (zh) | 2023-08-11 |
Family
ID=85177007
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW110129852A TWI811762B (zh) | 2021-08-12 | 2021-08-12 | 音質評價方法及使用其之音質評價系統 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11756569B2 (zh) |
TW (1) | TWI811762B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117612566B (zh) * | 2023-11-16 | 2024-05-28 | 书行科技(北京)有限公司 | 音频质量评估方法及相关产品 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1321390C (zh) * | 2005-01-18 | 2007-06-13 | 中国电子科技集团公司第三十研究所 | 客观音质评价归一化主客观统计相关模型的建立方法 |
CN101645268B (zh) * | 2009-08-19 | 2012-03-14 | 李宋 | 一种演唱和演奏的计算机实时分析系统 |
US20210306780A1 (en) * | 2020-03-25 | 2021-09-30 | Liquidity Services, Inc. | System and method for audio output device testing |
CN111540382B (zh) * | 2020-07-10 | 2020-10-16 | 北京海天瑞声科技股份有限公司 | 基于线性预测残差负熵的语音音质度量评价方法及装置 |
CN111985788A (zh) * | 2020-07-29 | 2020-11-24 | 中国第一汽车股份有限公司 | 汽车电器件声品质测试评价方法 |
US20220036878A1 (en) * | 2020-07-31 | 2022-02-03 | Starkey Laboratories, Inc. | Speech assessment using data from ear-wearable devices |
CN112215469A (zh) | 2020-09-15 | 2021-01-12 | 中国第一汽车股份有限公司 | 一种汽车按键类开关声音设计方法 |
US20210306782A1 (en) * | 2021-06-14 | 2021-09-30 | Intel Corporation | Method and system of audio device performance testing |
-
2021
- 2021-08-12 TW TW110129852A patent/TWI811762B/zh active
-
2022
- 2022-06-01 US US17/829,810 patent/US11756569B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20230053206A1 (en) | 2023-02-16 |
TWI811762B (zh) | 2023-08-11 |
US11756569B2 (en) | 2023-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9055382B2 (en) | Calibration of headphones to improve accuracy of recorded audio content | |
Pralong et al. | The role of individualized headphone calibration for the generation of high fidelity virtual auditory space | |
JP2018528735A5 (zh) | ||
CN105530565A (zh) | 自动声音均衡装置 | |
JP6791001B2 (ja) | 頭外定位フィルタ決定システム、頭外定位フィルタ決定装置、頭外定位決定方法、及びプログラム | |
US11405723B2 (en) | Method and apparatus for processing an audio signal based on equalization filter | |
CN112017687A (zh) | 一种骨传导设备的语音处理方法、装置及介质 | |
WO2015017914A1 (en) | Media production and distribution system for custom spatialized audio | |
CN109716793A (zh) | 滤波器生成装置、滤波器生成方法以及程序 | |
CN112584277B (zh) | 一种室内音频均衡的方法 | |
CN108076400A (zh) | 一种用于3d音效耳机重放的校准与优化方法 | |
TWI811762B (zh) | 音質評價方法及使用其之音質評價系統 | |
CN114584908A (zh) | 助听器的声学测试方法、装置以及设备 | |
WO2024067782A1 (zh) | 声场扩展方法、音频设备及计算机可读存储介质 | |
CN114205724B (zh) | 助听耳机的调试方法、装置以及设备 | |
CN115705850A (zh) | 音质评价方法及使用其的音质评价系统 | |
OZAWA et al. | Contents which yield high auditory-presence in sound reproduction | |
JP2022020259A (ja) | 頭外定位フィルタ生成システム、処理装置、頭外定位フィルタ生成方法、及びプログラム | |
Li et al. | Evaluation of headphone phase equalization on sound reproduction | |
JP6805879B2 (ja) | フィルタ生成装置、フィルタ生成方法、及びプログラム | |
CN117437367B (zh) | 一种基于耳廓关联函数预警耳机滑动及动态修正方法 | |
US20240064487A1 (en) | Customized selective attenuation of game audio | |
Pecolt et al. | Measuring station for testing on-ear headphones, made by 3D printing used in Industry 4.0 | |
CN112511941B (zh) | 一种音频输出方法及系统及耳机 | |
CN108446024A (zh) | 音乐播放方法及相关产品 |