TWI662546B

TWI662546B - 聲音調整方法和系統

Info

Publication number: TWI662546B
Application number: TW107114504A
Authority: TW
Inventors: 楊國屏; 廖和信; 治勇楊; 趙冠力; 張智龍
Original assignee: 塞席爾商元鼎音訊股份有限公司
Priority date: 2018-04-27
Filing date: 2018-04-27
Publication date: 2019-06-11
Also published as: US10615765B2; TW201946051A; US20190334495A1

Abstract

一種聲音調整方法應用於一聲音調整系統，聲音調整系統包括一聲音接收模組、一聲音辨識模組，一聲音變頻模組及一聲音等化器模組。聲音調整方法包括：藉由聲音接收模組接收一聲音訊號；藉由聲音辨識模組辨識聲音訊號，以判斷聲音訊號的種類；若判斷聲音訊號是一語音訊號，則聲音變頻模組對語音訊號進行變頻處理而成為一變頻語音訊號；若判斷聲音訊號是一非語音訊號，則聲音等化器模組對聲音訊號進行調整而成為一等化器調整聲音訊號。

Description

聲音調整方法和系統

本發明係關於一種聲音調整方法，特別是一種根據聲音的種類而自動調整聲音，以對聽眾提供更優質的聆聽體驗的聲音調整方法和系統。

一般人在家裡時，常會收看電視(例如收看電影、影集、音樂節目或談話性節目)，或收聽廣播(例如收聽音樂節目或談話性節目)，以使自己放鬆。然而，對於高齡人士而言，在收看或收聽談話性節目時，由於高齡人士的耳朵聽力可能退化，因此難以聽清楚談話內容。

另外，一般人在使用電腦收聽音樂節目時，也喜歡使用電腦內的音樂播放程式的等化器(Equalizer)，來調整音樂的收聽情境；例如，使用者可以將等化器設置為重低音情境，重低音情境可以強化音樂的重低音效果，如此一來可以讓音樂聽起來更有震撼力。然而，若是使用者聽完音樂，想改成收聽談話性節目時，使用者必須手動得取消等化器的收聽情境，而造成使用者操作不便。

因此，如何提供一種根據聲音的種類而自動調整聲音的聲音調整方法，以便一併解決上述的問題，遂成為一值得探討的課題。

本發明之主要目的係在提供一種根據聲音的種類而自動調整聲音，以對聽眾提供更優質的聆聽體驗的聲音調整方法。

為達成上述之目的，本發明之一種聲音調整方法應用於一聲音調整系統，聲音調整系統包括一聲音接收模組、一聲音辨識模組，一聲音變頻模組及一聲音等化器模組。聲音調整方法包括：藉由聲音接收模組接收一聲音訊號；藉由聲音辨識模組辨識聲音訊號，以判斷聲音訊號的種類；若判斷聲音訊號是一語音訊號，則聲音變頻模組對語音訊號進行變頻處理而成為一變頻語音訊號；若判斷聲音訊號是一非語音訊號，則聲音等化器模組對聲音訊號進行調整而成為一等化器調整聲音訊號。

根據本發明之一實施例，其中聲音辨識模組是辨識聲音訊號是否能轉換為文字以判斷聲音訊號是否為語音訊號。

根據本發明之一實施例，其中聲音調整系統更包括一聲音輸出模組，聲音輸出模組電性連接聲音變頻模組和聲音等化器模組，聲音輸出模組用以輸出變頻語音訊號或等化器調整聲音訊號。

本發明之另一目的係在提供一種根據聲音的種類而自動調整聲音，以對聽眾提供更優質的聆聽體驗的聲音調整系統。

為達成上述之目的，本發明之一種聲音調整系統包括一聲音接收模組、一聲音辨識模組、一聲音變頻模組和一聲音等化器模組。聲音接收模組用以接收一聲音訊號。聲音辨識模組電性連接聲音接收模組。聲音辨識模組用以辨識聲音訊號，以判斷聲音訊號的種類。聲音變頻模組電性連接聲音辨識模組。聲音變頻模組電性連接聲音辨識模組。若聲音辨識模組判斷聲音訊號是一語音訊號，則聲音變頻模組對語音訊號進行變頻處理而成為一變頻語音訊號；若聲音辨識模組判斷聲音訊號是一非語音訊號，則聲音等化器模組對聲音訊號進行調整而成為一等化器調整聲音訊號。

為能讓貴審查委員能更瞭解本發明之技術內容，特舉較佳具體實施例說明如下。

以下請一併參考圖1至圖2關於本發明之聲音調整系統和方法。圖1係本發明之一實施例之聲音調整系統之系統架構圖。圖2係本發明之一實施例之聲音調整方法之步驟流程圖。

如圖1和圖2所示，在本發明之一實施例之中，本發明之聲音調整方法是被編程為一電腦程式，並應用於電子裝置500之聲音調整系統1。聲音調整方法用以根據聲音的種類而自動調整聲音，以對聽眾提供更優質的聆聽體驗。電子裝置500例如為一電視、電腦或手機，或是其他具有播放影音節目功能的裝置。電子裝置500包括一聲音調整系統1。聲音調整系統1用以接收外部傳來的聲音訊號，並判斷聲音訊號的種類以對聲音訊號做對應得調整，再將調整後的聲音訊號播出。聲音調整系統1包括一聲音接收模組10、一聲音辨識模組20、一聲音輸出模組30、一聲音變頻模組40和一聲音等化器模組50。

在本發明之一實施例之中，聲音接收模組10用以接收來自於外部的聲音訊號，並將該聲音訊號傳送至聲音辨識模組20；外部的聲音訊號例如為使用者用電子裝置500收看影音節目時所收到的該節目之聲音，或者也可以是手機之電子裝置500之麥克風所接收到的周圍聲音。聲音辨識模組20電性連接聲音接收模組10，聲音處辨識組20用以辨識聲音訊號，以判斷聲音訊號的種類。聲音變頻模組40電性連接聲音辨識模組20，聲音變頻模組40用以對語音訊號進行變頻處理而成為一變頻語音訊號。聲音等化器模組50電性連接聲音辨識模組20，聲音等化器模組50用以對聲音訊號進行調整而成為一等化器調整聲音訊號。聲音輸出模組30例如為一喇叭，其電性連接聲音變頻模組40和聲音等化器模組50，聲音輸出模組30用以輸出變頻語音訊號或等化器調整聲音訊號至外部。

在本發明之一實施例之中，當使用者開啟電子裝置500並開始觀賞一影音節目時，聲音調整系統1會啟動聲音調整方法之電腦程式並進行步驟101：藉由聲音接收模組接收一聲音訊號。

當使用者開啟電子裝置500並開始觀賞一影音節目時，該影音節目的聲音訊號會從外部傳輸給電子裝置500，其中聲音訊號會被聲音調整系統1之聲音接收模組10接收。

接著，聲音調整系統1會進行步驟102：藉由聲音辨識模組辨識聲音訊號，以判斷聲音訊號的種類，其中聲音辨識模組是辨識聲音訊號是否能轉換為文字以判斷聲音訊號是否為語音訊號。

在本發明之一實施例之中，聲音接收模組10會將接收到的聲音訊號傳送給聲音辨識模組20，聲音辨識模組20會辨識聲音訊號的種類是語音訊號或非語音訊號(例如唱歌或樂器演奏的訊號)。聲音辨識模組20是藉由語音辨識(voice recognition)之技術而辨識聲音訊號之內容是否能轉換為文字；若聲音訊號之內容可以轉換為文字，則可以判斷聲音訊號是語音訊號；反之，若聲音訊號之內容不能轉換為文字，則可以判斷聲音訊號是非語音訊號。關於語音辨識之技術細節，可參考以下研究及實踐語音辨識之論文：1999年出版的” A comparison of features for speech, music discrimination”、1996年出版的” Real-time discrimination of broadcast speech/music”、1999年出版的”Speech/music discrimination based on posterior probability features”、2005年出版的” A speech/music discriminator based on RMS and zero-crossings”、2003年出版的” Robust speech music discrimination using spectrum's first order statistics and neural networks”、2003年出版的” A fast and robust speech/music discrimination approach”、2010年出版的” A wavelet-based parameterization for speech/music discrimination”、2014年出版的” Music tonality features for speech/music discrimination”、2014年出版的” Speech-music discrimination: A deep learning perspective”、2005年出版的” Speech/Music Discrimination Using a Single Warped LPC-Based Feature”以及2006年出版的” Novel Features for Effective Speech and Music Discrimination”。須注意的是，執行語音辨識之細節並非本案重點且其細節已被上述公開的論文揭露，故不對其多做贅述。

在本發明之一實施例之中，若聲音辨識模組20藉由語音辨識之技術而辨識聲音訊號之內容可以轉換為文字，則聲音辨識模組20會判斷聲音訊號是語音訊號，此時，聲音調整系統1會進行步驟103：若判斷聲音訊號是一語音訊號，則聲音變頻模組對語音訊號進行變頻處理而成為一變頻語音訊號。

聲音辨識模組20判斷聲音訊號為語音訊號之後，會將判斷結果傳輸給聲音變頻模組40，聲音變頻模組40會對語音訊號進行變頻處理，而使語音訊號成為一變頻語音訊號。在本發明之一實施例中，聲音變頻模組40執行的變頻處理是將語音訊號裡的特定頻率區間之聲音訊號進行增益，使得該特定頻率區間的聲音變得更為明顯；例如，聲音變頻模組40可以設計成對低頻率(例如500赫茲以下)的聲音訊號進行增益，使得低頻率的聲音變得更為明顯，如此一來，可以方便高頻聽力衰退的老人更清楚得聽到增益後的聲音。然而，特定頻率區間之範圍並不以低頻率的聲音為限，其可依照使用者的聽力需求而改變，例如低頻聽障人士難以聽到低頻的聲音，則特定頻率區間之範圍可以設計成對高頻率(例如800赫茲以上)的聲音訊號進行增益，以便低頻聽障人士更清楚得聽到增益後的聲音。

最後，聲音調整系統1會進行步驟105：藉由聲音輸出模組輸出變頻語音訊號或等化器調整聲音訊號。

聲音變頻模組40會將變頻語音訊號傳送給聲音輸出模組30，聲音輸出模組30之喇叭即可播放出變頻語音訊號，以便使用者聽到特定頻率區間的頻率增益後的更為明顯的聲音。

請再回到步驟102；在進行步驟102時，若是聲音辨識模組20不能將聲音訊號之內容轉換為文字，則聲音辨識模組20判斷聲音訊號為非語音訊號，此時，聲音調整系統1會進行步驟104：若判斷聲音訊號是一非語音訊號，則聲音等化器模組對聲音訊號進行調整而成為一等化器調整聲音訊號。

聲音辨識模組20判斷聲音訊號為非語音訊號之後，會將判斷結果傳輸給聲音等化器模組50，聲音等化器模組50會調整非語音訊號，而使非語音訊號成為一等化器調整聲音訊號。在本發明之一實施例中，聲音等化器模組50執行的調整是將預設的音樂情境套用在非語音訊號，使得非語音訊號聽起來更加貼近該種音樂情境。例如聲音等化器模組50可以設計為提供一古典樂情境，該古典樂情境會模仿古典樂樂器的聲音頻率，將非語音訊號之30至250赫茲之間的振幅增強，將250至2000赫茲之間的振幅微幅降低，將2000至16000赫茲之間的振幅增強，將50赫茲以下的頻率以及16000赫茲以上的振幅切除；如此一來，套用了該古典樂情境的非語音訊號的頻率會被調整成類似古典樂樂器的聲音頻率組成，而更加貼近真實的古典樂演奏聲。然而，聲音等化器模組50所提供的音樂情境並不以上述的古典樂為限，其亦可設計為搖滾、電音、重低音等音樂情境。

當聲音等化器模組50調整非語音訊號，而使非語音訊號成為等化器調整聲音訊號之後，聲音調整系統1會進行步驟105，讓等化器調整聲音訊號傳送給聲音輸出模組30；如此一來，聲音輸出模組30之喇叭即可播放出等化器調整聲音訊號，以便使用者聽到更加貼近真實的音樂情境的等化器調整聲音訊號。

藉由本發明之聲音調整系統1和聲音調整方法，可以自動辨識聲音的種類為語音訊號或非語音(如音樂)訊號，並根據辨識結果而自動調整語音訊號的頻率或是對非語音訊號套用特定的音樂情境，以便使用者能聽到變頻後的清楚的語音聲，或是聽到更加貼近真實的音樂情境的音樂聲，而獲得更優質的聆聽體驗。

需注意的是，上述僅為實施例，而非限制於實施例。譬如此不脫離本發明基本架構者，皆應為本專利所主張之權利範圍，而應以專利申請範圍為準。

1‧‧‧聲音調整系統

10‧‧‧聲音接收模組

20‧‧‧聲音辨識模組

30‧‧‧聲音輸出模組

40‧‧‧聲音變頻模組

50‧‧‧聲音等化器模組

500‧‧‧電子裝置

圖1係本發明之一實施例之聲音調整系統之系統架構圖。圖2係本發明之一實施例之聲音調整方法之步驟流程圖。

Claims

一種聲音調整方法，應用於一聲音調整系統，該聲音調整系統包括一聲音接收模組、一聲音辨識模組，一聲音變頻模組及一聲音等化器模組，該聲音調整方法包括：藉由該聲音接收模組接收一聲音訊號；藉由該聲音辨識模組辨識該聲音訊號，以判斷該聲音訊號的種類；若判斷該聲音訊號是一語音訊號，則該聲音變頻模組對該語音訊號進行變頻處理而成為一變頻語音訊號；以及若判斷該聲音訊號是一非語音訊號，則該聲音等化器模組對該聲音訊號進行調整而成為一等化器調整聲音訊號。
如申請專利範圍第1項所述之聲音調整方法，其中該聲音辨識模組是辨識該聲音訊號是否能轉換為文字以判斷該聲音訊號是否為語音訊號。
如申請專利範圍第2項所述之聲音調整方法，其中該聲音調整系統更包括一聲音輸出模組，該聲音輸出模組電性連接該聲音變頻模組和該聲音等化器模組，該聲音輸出模組用以輸出該變頻語音訊號或該等化器調整聲音訊號。
一種聲音調整系統，包括：一聲音接收模組，用以接收一聲音訊號；一聲音辨識模組，電性連接該聲音接收模組，該聲音辨識模組用以辨識該聲音訊號，以判斷該聲音訊號的種類；一聲音變頻模組，電性連接該聲音辨識模組；以及一聲音等化器模組，電性連接該聲音辨識模組；其中若該聲音辨識模組判斷該聲音訊號是一語音訊號，則該聲音變頻模組對該語音訊號進行變頻處理而成為一變頻語音訊號；若該聲音辨識模組判斷該聲音訊號是一非語音訊號，則該聲音等化器模組對該聲音訊號進行調整而成為一等化器調整聲音訊號。
如申請專利範圍第4項所述之聲音調整系統，其中該聲音辨識模組是辨識該聲音訊號是否能轉換為文字以判斷該聲音訊號是否為語音訊號。
如申請專利範圍第5項所述之聲音調整系統，更包括一聲音輸出模組，該聲音輸出模組電性連接該聲音變頻模組和該聲音等化器模組，該聲音輸出模組用以輸出該變頻語音訊號或該等化器調整聲音訊號。