TWI811762B - 音質評價方法及使用其之音質評價系統 - Google Patents

音質評價方法及使用其之音質評價系統 Download PDF

Info

Publication number
TWI811762B
TWI811762B TW110129852A TW110129852A TWI811762B TW I811762 B TWI811762 B TW I811762B TW 110129852 A TW110129852 A TW 110129852A TW 110129852 A TW110129852 A TW 110129852A TW I811762 B TWI811762 B TW I811762B
Authority
TW
Taiwan
Prior art keywords
group
sound quality
scores
evaluation
audio data
Prior art date
Application number
TW110129852A
Other languages
English (en)
Other versions
TW202307830A (zh
Inventor
王俊棋
黃國原
官韋辰
蘇紫茵
游宗嚴
Original Assignee
華碩電腦股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 華碩電腦股份有限公司 filed Critical 華碩電腦股份有限公司
Priority to TW110129852A priority Critical patent/TWI811762B/zh
Priority to US17/829,810 priority patent/US11756569B2/en
Publication of TW202307830A publication Critical patent/TW202307830A/zh
Application granted granted Critical
Publication of TWI811762B publication Critical patent/TWI811762B/zh

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

本案揭示一種音質評價方法及使用其之音質評價系統。音質評價系統錄製複數個播放裝置所播放之一測試音檔以產生複數個音訊資料,並將音訊資料切分為複數個頻段。音質評價系統計算頻段以得到播放裝置之複數個評價分數。音質評價系統會自一參考來源擷取對應播放裝置之一音質排行資訊,並根據音質排行資訊以調整評價分數,進而得到一參考模型。音質評價系統會依據參考模型對應調整複數個待測播放裝置之評價分數,以得到待測播放裝置之音質排行資訊。

Description

音質評價方法及使用其之音質評價系統
本案是有關於一種播放裝置之音質的評價方法及評價系統。
消費者在購買播放裝置時,通常會親自聆聽播放裝置所播放音檔來決定自己所偏好的產品。網路上大部分的產品分析也都是以分析者們的主觀感受,來對播放裝置進行評價。也就是說,目前市面上並沒有一套客觀且精準的評價方法來對播放裝置進行性能表現分析。此外,受到主觀感受的影響,每個人對於同一項產品的評價也大不相同。如此的現況使得消費者難以從主觀的播放裝置排行榜中,選擇適合自己的產品。
本案揭示一種音質評價方法,用以提供複數個播放裝置的音質排行資訊,包含:將這些播放裝置定義為一第一群組以及一第二群組;分別錄製第一群組以及第二群組所播放至少一測試音檔,以產生複數個第一音訊資料以及複數個第二音訊資料;分別切分各第一音訊資料以及各第二音訊資料,以產生複數個第一群組頻段以及複數個第二群組頻段;分別計算處理第一群組頻段以及第二群組頻段,以得到第一群組之複數個第一評價分數以及第二群組之複數個第二評價分數;自一參考來源擷取對應第一群組之一第一音質排行資訊;參考第一音質排行資訊以對應調整第一評價分數,進而得到一第一參考模型;以及依據第一參考模型對應調整第二評價分數,進而得到第二群組之一第二音質排行資訊。
本案亦揭示一種音質評價系統,包含一音訊錄製模組、一計算模組、一通訊模組以及一處理模組。音訊錄製模組係用以將複數個播放裝置定義為一第一群組以及一第二群組,分別錄製第一群組以及第二群組所播放至少一測試音檔,以產生複數個第一音訊資料以及複數個第二音訊資料。計算模組係用以切分各第一音訊資料以及各第二音訊資料,以產生複數個第一群組頻段以及複數個第二群組頻段,並分別計算處理第一群組頻段以及第二群組頻段,以得到第一群組之複數個第一評價分數以及第二群組之複數個第二評價分數。通訊模組係用以自一參考來源擷取對應第一群組之一第一音質排行資訊。處理模組係用以參考第一音質排行資訊以對應調整第一評價分數,進而得到一第一參考模型,依據第一參考模型對應調整第二評價分數,進而得到第二群組之一第二音質排行資訊。
本案的音質評價方法和音質評價系統透過參照一或多個網路公開資料庫所發布的音訊裝置的音質排行資訊,來訓練出可以客觀評價音訊裝置的音質評價演算法模型,且訓練過程中完全無須聲學專家的介入。隨著訓練資料的累積,本案的音質評價模型所計算出的評價分數高低不僅能夠趨近於聲學專家的判斷,也可以完全避免聲學專家偶因評價當下的生理與心理條件變化所導致的評價結果偏差,因而能比聲學專家更加客觀且更加具有一致性地評價各種播放裝置的音質好壞,因此可以提供客觀且精準的評價方法,方便地提供使用者得知播放裝置的性能表現。
以下將以圖式揭露本案之一些實施例,為明確說明起見,許多實務上的細節將在以下敘述中一併說明,但這並不限制本案的申請專利範圍。
如圖1所示,在一些實施例中,音質評價方法的實施環境係一聆聽室10,其中聆聽室10係根據歐洲通訊標準機構(ETSI)及國際電子技術協會(IEC)所定義用於鑑賞電聲產品、喇叭之一空間。聆聽室10包含有一待測播放裝置110、一人工頭裝置120及一電腦主機130。電腦主機130係設置在人工頭裝置120旁邊,且電腦主機130電性連接人工頭裝置120。
參照圖2與圖3,圖2為本發明之一實施例中音質評價系統210進行音質評價方法的示意圖,圖3為本發明之音質評價方法的例示流程圖。音質評價系統210可用來執行音質評價方法,並包含音訊錄製模組211、計算模組212、通訊模組213及處理模組214,其中音訊錄製模組211電性連接計算模組212,計算模組212電性連接處理模組214,處理模組214電性連接通訊模組213。
如圖3所示,將複數個播放裝置200定義為第一群組201以及第二群組202後(步驟S10),音質評價系統210之音訊錄製模組211會分別錄製第一群組201之播放裝置以及第二群組202之播放裝置所播放至少一測試音檔,以產生複數個第一音訊資料以及複數個第二音訊資料(步驟S20)。
一實施例中,音質評價系統210可以是一手機、一平板電腦或一個人電腦。
一實施例中,音訊錄製模組211係一人工頭裝置120,其中人工頭裝置120是模擬人耳構造之一麥克風,其功用為模擬人耳接收音訊資料以分析人體各部位構造對人耳聽覺所造成的影響。
一實施例中,播放裝置200可以是任意型號之喇叭、音響、手機、平板或個人電腦。
一實施例中,測試音檔可以是任意音訊檔案格式的音訊檔案,例如MP3檔、WAV檔、AAC檔或FLAC檔等。音訊錄製模組211會將測試音檔錄製成固定音訊格式之音訊資料。
音質評價系統210之計算模組212會分別切分各第一音訊資料以及各第二音訊資料,以產生複數個第一群組頻段以及複數個第二群組頻段(步驟S30),其中這些頻段之頻率係在100 Hz至22K Hz之範圍間,100 Hz至22K Hz之範圍係一般人所能聽到聲音的一頻率範圍。切分各音訊資料為複數個頻段係用以擷取人耳可聽到的聲音頻率,並過濾掉那些人耳聽不到的聲音頻率。
一實施例中,計算模組212可以是一中央處理器(CPU)、一圖形處理器(GPU)或具有計算功能之一計算單元。
一實施例中,計算模組212切分各第一音訊資料以及各第二音訊資料為多個頻段,例如但不限於是26個頻段。
計算模組212切分完各第一音訊資料以及各第二音訊資料為複數個第一群組頻段以及複數個第二群組頻段後,會繼續分別計算處理這些第一群組頻段以及這些第二群組頻段,以得到第一群組201之複數個第一評價分數以及第二群組202之複數個第二評價分數(步驟S40)。
計算模組212會透過一機器學習演算法與一音質評價演算法模型來計算這些第一群組頻段以及這些第二群組頻段,以得到這些第一評價分數以及這些第二評價分數,其中這些第一評價分數係第一群組201之播放裝置的音質表現,這些第二評價分數係第二群組202之播放裝置的音質表現,評價分數愈高,表示播放裝置的音質表現愈好。
一實施例中,機器學習演算法係一梯度下降法,其中梯度下降法的公式為 f(x)為一音質評價函數(即音質評價演算法模型), 係該第一音訊資料之各該頻段的能量, 係一學習率, 係一目標分數, 係更新次數,其中音質評價演算法模型之初始模型係採用隨機的一初始參考模型,本發明所屬技術領域中具有通常知識者皆熟知初始參考模型,故不贅述。
學習率係指每次進行更新時的更新幅度,在更新的過程中需逐步調整學習率之值。本實施例中,學習率之值係在0.001到0.002之範圍間,學習率之值的調整幅度係在0.00001至0.0001之範圍間。
音質評價系統210之通訊模組213會自一參考來源220擷取對應第一群組201之播放裝置之第一音質排行資訊221(步驟S50),其中通訊模組213可以透過有線網路或無線網路以連接參考來源220。
一實施例中,參考來源220係一網路公開資料庫,其中網路公開資料庫包含複數個型號之複數個播放裝置200之音質排行資訊。舉例來說,音質評價系統210之通訊模組213可以自一手機評測網站上擷取複數個型號之複數個播放裝置200之音質排行資訊。
擷取完第一音質排行資訊221後,音質評價系統210之處理模組214會參考第一音質排行資訊221以對應調整第一評價分數,進而得到一第一參考模型(步驟S60)。
處理模組214會將初始參考模型中的一參數調整為一第一參數以得到第一參考模型,使得這些第一評價分數之高低順序經由機器學習演算法與第一參考模型計算後會匹配該第一音質排行資訊221,也就是使這些第一評價分數之高低順序與第一音質排行資訊221中第一群組201之播放裝置排名之高低順序相同。
一實施例中,處理模組214可以是一中央處理器(CPU)、一圖形處理器(GPU)或具有計算功能之一計算單元。
音質評價系統210之處理模組214會依據第一參考模型對應調整這些第二評價分數,進而得到第二群組202之一第二音質排行資訊(步驟S70),此時音質評價演算法模型 f(x)已經完成訓練,並且可客觀地評價一或多個播放裝置200之音質表現。因此,將第二音訊資料經由機器學習演算法與第一參考模型計算後,即可得到客觀的第二音質排行資訊以及第二群組202之播放裝置的音質表現。
一實施例中,音質評價系統210之計算模組212會進一步透過一空間性演算法計算這些第二音訊資料,以得到第二群組202之複數個空間性分數,其中空間性分數愈高,代表第二群組202之播放裝置在播放音訊時的空間性表現愈好。空間性演算法包含一頭部相關轉換函數以及一最小變異無失真響應演算法,本發明所屬技術領域中具有通常知識者皆熟知頭部相關轉換函數以及最小變異無失真響應演算法,故不贅述。
一實施例中,音質評價系統210之計算模組212會進一步透過一動態性演算法計算這些第二音訊資料,以得到第二群組202之複數個動態性分數,其中動態性分數愈高,代表第二群組202之播放裝置在播放音訊時的動態性表現愈好。動態性演算法包含一頻譜分析方法、一線性回歸方法以及一基尼係數方法,本發明所屬技術領域中具有通常知識者皆熟知頻譜分析方法、線性回歸方法以及基尼係數方法,故不贅述。
一實施例中,音質評價系統210之計算模組212會進一步透過透過一音量演算法計算這些第二音訊資料,以得到第二群組202之複數個音量分數,其中音量分數愈高,代表第二群組202之播放裝置在播放音訊時的音量表現愈好。音量演算法係一動態範圍抑制方法,本發明所屬技術領域中具有通常知識者皆熟知動態範圍抑制方法,故不贅述。
一實施例中,音質評價系統210之計算模組212會進一步透過一失真演算法計算這些第二音訊資料,以得到第二群組202之複數個失真分數,其中失真分數愈高,代表第二群組202之播放裝置在播放音訊時的失真表現愈差。失真演算法包含一動態互調失真方法以及一尖銳度頻譜分析方法 (亦稱為噝音頻譜分析方法,sibilance),本發明所屬技術領域中具有通常知識者皆熟知動態互調失真方法以及嘶嘶聲頻譜分析方法,故不贅述。
本案的音質評價方法和音質評價系統透過參照一或多個網路公開資料庫所發布的音訊裝置的音質排行資訊,來訓練出可以客觀評價音訊裝置的音質評價演算法模型,且訓練過程中完全無須聲學專家的介入。隨著訓練資料的累積,本案的音質評價模型所計算出的評價分數高低不僅能夠趨近於聲學專家的判斷,也可以完全避免聲學專家偶因評價當下的生理與心理條件變化所導致的評價結果偏差,因而能比聲學專家更加客觀且更加具有一致性地評價各種播放裝置的音質好壞,因此可以提供客觀且精準的評價方法,方便地提供使用者得知播放裝置的性能表現。
雖然本發明已以實施例揭露如上,然其並非用以限定本發明,任何所屬技術領域中具有通常知識者,在不脫離本揭露內容之精神和範圍內,當可作些許之修改與變化,惟該些許之修改與變化仍然在本發明之申請專利範圍內。
10:聆聽室 101:隔音棉 110:待測播放裝置 120:人工頭裝置 130:電腦主機 200:播放裝置 201:第一群組 202:第二群組 210:音質評價系統 211:音訊錄製模組 212:計算模組 213:通訊模組 214:處理模組 220:參考來源 221:第一音質排行資訊 S10~S70:步驟
[圖1]是本發明之一實施例中音質評價方法的實施環境的示意圖。 [圖2]是本發明之一實施例中音質評價系統進行音質評價方法的示意圖。 [圖3]是本發明之音質評價方法的一例示流程圖。
S10~S70:步驟

Claims (8)

  1. 一種音質評價方法,用以提供複數個播放裝置的音質排行資訊,包含:將該些播放裝置定義為一第一群組以及一第二群組;分別錄製該第一群組以及該第二群組所播放至少一測試音檔,以產生複數個第一音訊資料以及複數個第二音訊資料;分別切分各該第一音訊資料以及各該第二音訊資料,以產生複數個第一群組頻段以及複數個第二群組頻段;以一機器學習演算法與具有一初始參考模型之一音質評價演算法模型分別計算處理該些第一群組頻段以及該些第二群組頻段,以得到該第一群組之複數個第一評價分數以及該第二群組之複數個第二評價分數;透過有線網路或無線網路連接至一參考來源以自該參考來源擷取對應該第一群組之一第一音質排行資訊;參考該第一音質排行資訊以對應調整該音質評價演算法模型之該初始參考模型之參數而得到一第一參考模型,使經由該機器學習演算法與具有該第一參考模型之該音質評價演算法所計算出之複數個調整後第一評價分數之高低順序與該第一音質排行資訊中該些第一群組之播放裝置排名之高低順序相同;以及以該機器學習演算法與具有該第一參考模型之該音質評價演算法計算處理該些第二群組頻段,以得到該第二群組之複數個調整後第二評價分數。
  2. 如請求項1所述之音質評價方法,其中,該音質評價方法更包含如下其中之一或其組合:透過一空間性演算法計算該些第二音訊資料,以得到該第二群組之複數個空間性分數,並通過該些空間性分數得到該第二評價分數;透過一動態性演算法計算該些第二音訊資料,以得到該第二群組之複數個動態性分數,並通過該些動態性分數得到該第二評價分數;透過一音量演算法計算該些第二音訊資料,以得到該第二群組之複數個音量分數,並通過該些音量分數得到該第二評價分數;以及透過一失真演算法計算該些第二音訊資料,以得到該第二群組之複數個失真分數,並通過該些失真分數得到該第二評價分數。
  3. 如請求項1所述之音質評價方法,係透過一人工頭裝置錄製該第一群組以及該第二群組所播放之該至少一測試音檔,以產生該些第一音訊資料以及該些第二音訊資料。
  4. 如請求項1所述之音質評價方法,其中,該參考來源係一網路公開資料庫。
  5. 一種音質評價系統,包含:一音訊錄製模組,用以將複數個播放裝置定義為一第一群組以及一第二群組,分別錄製該第一群組以及該第二群組所播放至少一測試音檔,以產生複數個第一音訊資料以及複數個第二音訊資料;一計算模組,用以分別切分各該第一音訊資料以及各該第二音訊資料,以產生複數個第一群組頻段以及複數個第二群組頻段,以及以一機器學習演算法與具有一初始參考模型之一音質評價演算法模型分別計算處 理該些第一群組頻段以及該些第二群組頻段,以得到該第一群組之複數個第一評價分數以及該第二群組之複數個第二評價分數;一通訊模組,用以透過有線網路或無線網路連接至一參考來源以自該參考來源擷取對應該第一群組之一第一音質排行資訊;以及一處理模組,用以參考該第一音質排行資訊以對應調整該音質評價演算法模型之該初始參考模型之參數而得到一第一參考模型,使經由該機器學習演算法與具有該第一參考模型之該音質評價演算法所計算出複數個調整後第一評價分數之高低順序與該第一音質排行資訊中該些第一群組之播放裝置排名之高低順序相同,以該機器學習演算法與具有該第一參考模型之該音質評價演算法計算處理該些第二群組頻段,以得到該第二群組之複數個調整後第二評價分數。
  6. 如請求項5所述之音質評價系統,其中,該計算模組更用以透過一空間性演算法計算該些第二音訊資料以得到該第二群組之複數個空間性分數,並通過該些空間性分數得到該第二評價分數;透過一動態性演算法計算該些第二音訊資料以得到該第二群組之複數個動態性分數,並通過該些動態性分數得到該第二評價分數;透過一音量演算法計算該些第二音訊資料以得到該第二群組之複數個音量分數,並通過該些音量分數得到該第二評價分數;以及透過一失真演算法計算該些第二音訊資料以得到該第二群組之複數個失真分數,並通過該些失真分數得到該第二評價分數。
  7. 如請求項5所述之音質評價系統,其中,該音訊錄製模組係一人工頭裝置。
  8. 如請求項5所述之音質評價系統,其中,該參考來源係一網路公開資料庫。
TW110129852A 2021-08-12 2021-08-12 音質評價方法及使用其之音質評價系統 TWI811762B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW110129852A TWI811762B (zh) 2021-08-12 2021-08-12 音質評價方法及使用其之音質評價系統
US17/829,810 US11756569B2 (en) 2021-08-12 2022-06-01 Sound quality evaluation method and sound quality evaluation system using same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW110129852A TWI811762B (zh) 2021-08-12 2021-08-12 音質評價方法及使用其之音質評價系統

Publications (2)

Publication Number Publication Date
TW202307830A TW202307830A (zh) 2023-02-16
TWI811762B true TWI811762B (zh) 2023-08-11

Family

ID=85177007

Family Applications (1)

Application Number Title Priority Date Filing Date
TW110129852A TWI811762B (zh) 2021-08-12 2021-08-12 音質評價方法及使用其之音質評價系統

Country Status (2)

Country Link
US (1) US11756569B2 (zh)
TW (1) TWI811762B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117612566B (zh) * 2023-11-16 2024-05-28 书行科技(北京)有限公司 音频质量评估方法及相关产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1321390C (zh) * 2005-01-18 2007-06-13 中国电子科技集团公司第三十研究所 客观音质评价归一化主客观统计相关模型的建立方法
CN101645268A (zh) * 2009-08-19 2010-02-10 李宋 一种演唱和演奏的计算机实时分析系统
CN111540382B (zh) * 2020-07-10 2020-10-16 北京海天瑞声科技股份有限公司 基于线性预测残差负熵的语音音质度量评价方法及装置
CN111985788A (zh) * 2020-07-29 2020-11-24 中国第一汽车股份有限公司 汽车电器件声品质测试评价方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210306780A1 (en) * 2020-03-25 2021-09-30 Liquidity Services, Inc. System and method for audio output device testing
US20220036878A1 (en) * 2020-07-31 2022-02-03 Starkey Laboratories, Inc. Speech assessment using data from ear-wearable devices
CN112215469A (zh) 2020-09-15 2021-01-12 中国第一汽车股份有限公司 一种汽车按键类开关声音设计方法
US20210306782A1 (en) * 2021-06-14 2021-09-30 Intel Corporation Method and system of audio device performance testing

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1321390C (zh) * 2005-01-18 2007-06-13 中国电子科技集团公司第三十研究所 客观音质评价归一化主客观统计相关模型的建立方法
CN101645268A (zh) * 2009-08-19 2010-02-10 李宋 一种演唱和演奏的计算机实时分析系统
CN111540382B (zh) * 2020-07-10 2020-10-16 北京海天瑞声科技股份有限公司 基于线性预测残差负熵的语音音质度量评价方法及装置
CN111985788A (zh) * 2020-07-29 2020-11-24 中国第一汽车股份有限公司 汽车电器件声品质测试评价方法

Also Published As

Publication number Publication date
US11756569B2 (en) 2023-09-12
TW202307830A (zh) 2023-02-16
US20230053206A1 (en) 2023-02-16

Similar Documents

Publication Publication Date Title
JP5729905B2 (ja) 音声システムの較正方法および装置
US9055382B2 (en) Calibration of headphones to improve accuracy of recorded audio content
CN103098492B (zh) 用于自我管理的声音增强的方法和系统
JP2018528735A5 (zh)
CN105530565A (zh) 自动声音均衡装置
CN109668626A (zh) 一种基于人机交互界面的噪声声品质评价方法
JP2013187912A (ja) ヘッドホーン補正のためのシステム
CN105930480B (zh) 耳鸣康复音乐的生成方法以及耳鸣康复系统
US20210250686A1 (en) Method and apparatus for processing an audio signal based on equalization filter
CN109716793A (zh) 滤波器生成装置、滤波器生成方法以及程序
WO2015017914A1 (en) Media production and distribution system for custom spatialized audio
TWI811762B (zh) 音質評價方法及使用其之音質評價系統
CN212013054U (zh) 降噪耳机测试设备
Kendrick et al. Perceived audio quality of sounds degraded by non-linear distortions and single-ended assessment using HASQI
Rämö et al. Validating a perceptual distraction model using a personal two-zone sound system
CN114205724B (zh) 助听耳机的调试方法、装置以及设备
JP2007534990A (ja) バイノーラル音信号の主観的特性の判定法
CN115705850A (zh) 音质评价方法及使用其的音质评价系统
CN113613121A (zh) 一种获取耳机声压级的方法、装置及耳机
Li et al. Evaluation of headphone phase equalization on sound reproduction
CN117437367B (zh) 一种基于耳廓关联函数预警耳机滑动及动态修正方法
CN112511941B (zh) 一种音频输出方法及系统及耳机
US20240064487A1 (en) Customized selective attenuation of game audio
Pecolt et al. Measuring station for testing on-ear headphones, made by 3D printing used in Industry 4.0
CN108446024A (zh) 音乐播放方法及相关产品