TWI385651B - 可生成歌詞的裝置及生成歌詞的方法 - Google Patents

可生成歌詞的裝置及生成歌詞的方法 Download PDF

Info

Publication number
TWI385651B
TWI385651B TW99103130A TW99103130A TWI385651B TW I385651 B TWI385651 B TW I385651B TW 99103130 A TW99103130 A TW 99103130A TW 99103130 A TW99103130 A TW 99103130A TW I385651 B TWI385651 B TW I385651B
Authority
TW
Taiwan
Prior art keywords
spectrum
syllable
voice
speech
frequency
Prior art date
Application number
TW99103130A
Other languages
English (en)
Other versions
TW201128636A (en
Inventor
xian-wei Ma
Original Assignee
Hon Hai Prec Ind Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hon Hai Prec Ind Co Ltd filed Critical Hon Hai Prec Ind Co Ltd
Priority to TW99103130A priority Critical patent/TWI385651B/zh
Publication of TW201128636A publication Critical patent/TW201128636A/zh
Application granted granted Critical
Publication of TWI385651B publication Critical patent/TWI385651B/zh

Links

Landscapes

  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Telephone Function (AREA)

Description

可生成歌詞的裝置及生成歌詞的方法
本發明涉及一種電子裝置,特別涉及一種可生成歌詞的電子裝置和歌詞生成方法。
目前,具有音樂播放功能的電子裝置越來越普遍,通常為了讓用戶更好的欣賞歌曲的內容,一般都需要同步顯示歌詞。現有的手機、MP3、MP4等音頻播放裝置雖然可以實現歌詞的顯示功能,但是這些歌詞需要事先存儲在音頻播放裝置的存儲單元中,在播放時顯示歌詞,但是這樣需要存儲大量的歌詞,浪費存儲空間。
為了解決這個技術問題,公開號為CN101237473A的大陸專利申請公開了一種動態實現歌詞播放的方法及實現該方法的移動終端和設備。該設備不需要事先存儲歌詞,而動態實現歌曲與歌詞同步播放的方法,該方法提供了一歌詞服務設備,該歌詞服務設備可從互聯網路獲取資源即時更新歌詞庫,用戶可通過將音頻播放裝置連接於該歌詞服務設備,從而獲得播放檔的歌詞檔。但是該方法需要增加一個額外的歌詞服務設備,此外,在互聯網上並不一定有所有歌曲的歌詞,因此,即使有該歌詞服務設備,也不一定能獲取所有歌曲對應的歌詞。
有鑒於此,有必要提供一種歌詞生成的裝置和方法,其能解決上述問題。
一種可生成歌詞的裝置,包括一聲音採集單元,用於用戶輸入語音,該裝置還包括:存儲單元,用於存儲聲母的頻譜、音節的頻譜以及聲母的標準頻率,其中,音節包括聲母和韻母,每一個音節的開頭為聲母,每個音節頻譜對應一個字;處理單元,包括:語音分析模組,用於分析該語音,得出該語音對應的語音頻譜;聲母比較模組,用於將語音分析模組得出的語音頻譜與存儲單元中存儲的聲母的頻譜進行比較,當一段語音頻譜與所存儲的聲母頻譜一致時,用該對應的聲母標示該段語音頻譜,該多個聲母將該用戶輸入語音分成了多個音節;頻率調整模組,用於將標示後的語音中每一聲母部分的頻譜的頻率與所存儲的對應聲母的標準頻率進行比較得出一比值,然後根據該比值調整該聲母對應音節的頻率,從而調整整個語音的頻率;音節比較模組,用於將經過頻率調整模組調整後的每一個音節的頻譜與存儲單元中存儲的音節的頻譜進行比較,當調整後的音節頻譜與所存儲的音節頻譜一致時,確定該調整後的音節頻譜對應的字為所存儲的音節頻譜對應的字。
一種用於裝置的生成歌詞的方法,該裝置包括聲音採集單元、存儲單元以及處理單元,該處理單元包括語音分析模組、聲母比較模組、頻率調整模組以及音節比較模組,該存儲單元存儲有聲母的頻譜、音節的頻譜以及聲母頻譜的標準頻率,其中,音節包括聲母和韻母,每一個音節的開頭為聲母,每個音節頻譜對應一個字;該方法包括步驟:通過該聲音採集單元採集用戶輸入的語音;通過該語音分析模組分析用戶語音得到語音頻譜;通過聲母比較模組將語音分析模組得出的語音頻譜與所存儲的聲母的頻譜進行比較,當一段語音頻譜與所存儲的聲母頻譜一致時,用該對應的聲母標示該段語音頻譜,該多個聲母將該用戶輸入語音分成了多個音節;通過該頻率調整模組將標示後的語音中每一聲母部分的頻譜的頻率與所存儲的對應聲母的標準頻率進行比較得出一比值,然後根據該比值調整該聲母對應音節的頻率,從而調整整個語音的頻率;通過該音節比較模組將經過頻率調整模組調整後的每一個音節的頻譜與存儲單元中存儲的音節的頻譜進行比較,當調整後的音節頻譜與所存儲的音節頻譜一致時,確定該調整後的音節頻譜對應的字為所存儲的音節頻譜對應的字。
本發明通過聲音採集單元輸入語音,語音分析模組將語音分析為對應的語音頻譜,比較語音的頻譜與存儲單元中的聲母的頻譜後,標示整個語音頻譜的聲母,然後依次調整整個語音的頻率,最後比較語音的頻譜與音節的頻譜,獲得對應的字。從而不需要存儲大量的資料,也不需要增加第三方軟體。
請參考圖1,為本發明歌詞同步生成的裝置於一實施方式的硬體結構方框圖。該裝置30包括一聲音採集單元31、一存儲單元32、一處理單元33及一顯示單元34。該聲音採集單元31用於採集用戶輸入的語音信號,在本實施方式中,用戶輸入的語音信號可為用戶發出的聲音,也可為用戶開啟MP3、MP4等音樂播放器所播放的聲音。一般來說,用戶輸入的語音每一個字都對應一個音節,音節包括聲母和韻母,聲母為輔音,韻母為母音開頭,每一個音節的開頭為聲母。
該存儲單元32存儲所有聲母的頻譜以及常用字對應的音節頻譜等,在其他實施方式中,該存儲的音節頻譜對應的字可為目前所有的漢字。該處理單元33包括語音分析模組35、聲母比較模組36、頻率調整模組37、音節比較模組38以及顯示控制模組39。
該語音分析模組35用於分析用戶輸入的語音後得出該語音的頻譜。
該聲母比較模組36用於將該語音分析模組35得出的語音頻譜與所存儲的聲母頻譜進行比較。當聲母頻譜與語音頻譜中某一段相同時,則用對應的聲母標示該段語音頻譜,標示該段語音頻譜為一個音節中的聲母部分。從而,當比較完整個語音頻譜後,該語音頻譜標示有多個聲母,其中,從每一個聲母標示到下一個聲母標示之前的頻譜為一個音節頻譜,通過該多個聲母,將整個語音頻譜分成了多個音節頻譜。例如,如果用戶輸入的語音為一段歌曲“在那桃花盛開的地方”,將該段語音頻譜與存儲單元32中存儲的所有聲母頻譜進行一一比對,例如,將b、p、m、f、d、t、n、l、g、k、h、j、q、x、zh、ch、sh、z、c、s、y、w、r所對應的聲母頻譜與該段歌曲的語音頻譜進行一個一個的比對,如對於音節“在”,通過比對確定Z與該音節對應的語音頻譜相同,則將該段語音頻譜標示Z,對於音節“桃”,通過比對確定T與該音節對應的語音頻譜相同,則將該段語音頻譜標示T,依此方法依次將整個頻譜分成了多個音節,每個音節的聲母標示分別為Z、N、T、H、S、K、D、D、以及F。
在本實施方式中,該存儲單元32還存儲有每一聲母的標準頻率,該頻率調整模組37用於調整經過聲母比較模組36比較標示後的語音頻譜中每一個音節的頻率,具體為:獲取存儲單元32中存儲的聲母的標準頻率,比較標示後的語音頻譜中第一個聲母的頻率與存儲單元32中對應聲母的標準頻率,獲得該第一個聲母的頻率與存儲單元32中的聲母的標準頻率的比值,並根據該比值調整該第一個聲母對應的音節的頻率。例如,比較第一個聲母Z的頻率與存儲單元32中存儲的Z的標準頻率,獲得一比值X,然後根據該比值X並調整語音中聲母Z對應音節的頻率。依此方法依次調整整個標示後的語音頻譜中每個音節頻率。
該音節比較模組38用於將該頻率調整模組37調整後的每一個音節頻譜與所存儲的音節頻譜進行比較得出語音頻譜中每個音節頻譜所對應的字。其中,當音節比較模組38判斷一音節頻譜與所存儲的音節頻譜相一致時,則確定該語音頻譜對應的字為該所存儲的音節頻譜對應的字。以上一個例子進行說明,“在那桃花盛開的地方”中的“在”,通過比較聲母Z與所存儲的聲母頻譜得出比值X後,根據比值X調整聲母Z開頭的音節,然後將調整後的音節與所存儲的音節頻譜進行比較後,當該調整後的音節頻譜與所存儲的“在”的音節頻譜相同,則音節比較模組38判斷出該調整後的音節頻譜對應的字為“在”。
該顯示控制模組39將音節比較模組38所確定的字顯示在顯示單元34中。
該處理單元33還包括存儲控制模組40,該存儲控制模組40用於將整個語音頻譜所對應的字以一個文檔的形式存儲於該存儲單元32中,並與該語音頻譜綁定,作為該語音頻譜的歌詞。從而當後續播放該歌曲時,獲取該綁定的文檔,從而生成該歌曲的歌詞。
在本發明的另一實施方式中,該處理單元33還包括濾波模組41,該濾波模組41用於將聲音採集單元31獲得的音頻進行濾波,去除雜音。
請參考圖2,為本發明歌詞同步生成的方法流程圖。在步驟S501中,該聲音採集單元31採集用戶發出的聲音或者音樂播放器播放的音樂。在步驟S502中,語音分析模組35分析該用戶輸入的語音,得出該語音的頻譜。在步驟S503中,聲母比較模組36將存儲單元32中存儲的聲母的頻譜與語音分析模組35得出的語音頻譜進行比較,當聲母頻譜與語音頻譜中某一段相同時,則用對應的聲母標示該段語音頻譜,標示該段語音頻譜為一個音節中的聲母部分,標示一個音節的開頭。在步驟S504中,頻率調整模組37對整個經過聲母比較模組36比較標示後語音頻率進行調整。在步驟S505中,音節比較模組38比較經過頻率調整模組37調整後的音節的頻譜與所存儲的音節頻譜,當所調整後的音節頻譜與所存儲的某一音節頻譜一致時,則確定該調整後的音節頻譜所對應的字為該存儲的音節頻譜對應的字。在步驟S506中,該顯示控制模組39將音節比較模組38所確定的字顯示在顯示單元34中。在步驟S507中,存儲控制模組40將整個語音頻譜所對應的字以一個文檔的形式存儲於該存儲單元32中,並與該語音頻譜綁定,作為該語音頻譜的歌詞。
請參考圖3,為本發明頻率調整模組37對整個語音頻率進行調整的流程圖。在步驟S601中,該頻率調整模組37從存儲單元32中獲取存儲的聲母的標準頻率。在步驟S602中,比較標示後的語音頻譜中第一個聲母的頻率與存儲單元32中的對應聲母的標準頻率。在步驟S603中,獲得該第一個聲母的頻率與存儲單元32中的對應聲母的標準頻率的比值。在步驟S604中,根據該比值調整第一個聲母對應音節的頻率。在步驟S605中,依此方法依次調整整個標示後的語音頻譜中每個音節頻率。
30‧‧‧裝置
31‧‧‧聲音採集單元
32‧‧‧存儲單元
33‧‧‧處理單元
34‧‧‧顯示單元
35‧‧‧語音分析模組
36‧‧‧聲母比較模組
37‧‧‧頻率調整模組
38‧‧‧音節比較模組
39‧‧‧顯示控制模組
S501‧‧‧輸入語音
S502‧‧‧獲得語音頻譜
S503‧‧‧比較聲母的頻譜與語音的頻譜
S504‧‧‧調整音節的頻率
S505‧‧‧比較調整後的音節的頻譜與存儲的音節頻譜
S506‧‧‧顯示歌詞
S507‧‧‧存儲歌詞
S601‧‧‧獲得存儲的聲母的頻譜
S602‧‧‧比較語音中聲母的頻率與存儲單元中聲母的頻率
S603‧‧‧獲得比值
S604‧‧‧根據比值調整對應音節的頻率
S605‧‧‧依次調整整個語音頻譜的音節頻率
圖1係可生成歌詞的裝置於一實施方式中的硬體結構方框圖。
圖2係生成歌詞的方法於一實施方式中的流程圖。
圖3係頻率調整模組的流程圖。
S501‧‧‧輸入語音
S502‧‧‧獲得語音頻譜
S503‧‧‧比較聲母的頻譜與語音的頻譜
S504‧‧‧調整音節的頻率
S505‧‧‧比較調整後的音節的頻譜與存儲的音節頻譜
S506‧‧‧顯示歌詞
S507‧‧‧存儲歌詞

Claims (8)

  1. 一種可生成歌詞的裝置,包括一聲音採集單元,用於用戶輸入語音,其改良在於,該裝置還包括:
    存儲單元,用於存儲聲母的頻譜、音節的頻譜以及聲母的標準頻率,其中,音節包括聲母和韻母,每一個音節的開頭為聲母,每個音節頻譜對應一個字;
    處理單元,包括:
    語音分析模組,用於分析該語音,得出該語音對應的語音頻譜;
    聲母比較模組,用於將語音分析模組得出的語音頻譜與存儲單元中存儲的聲母的頻譜進行比較,當一段語音頻譜與所存儲的聲母頻譜一致時,用該對應的聲母標示該段語音頻譜,該多個聲母將該用戶輸入語音分成了多個音節;
    頻率調整模組,用於將標示後的語音中每一聲母部分的頻譜的頻率與所存儲的對應聲母的標準頻率進行比較得出一比值,然後根據該比值調整該聲母對應音節的頻率,從而調整整個語音的頻率;
    音節比較模組,用於將經過頻率調整模組調整後的每一個音節的頻譜與存儲單元中存儲的音節的頻譜進行比較,當調整後的音節頻譜與所存儲的音節頻譜一致時,確定該調整後的音節頻譜對應的字為所存儲的音節頻譜對應的字。
  2. 如申請專利範圍第1項所述之裝置,其中,該裝置還包括顯示單元,用於顯示音節比較模組所確定的字,該處理單元還包括顯示控制模組,用於控制將音節比較模組所確定的字顯示在顯示單元。
  3. 如申請專利範圍第1項所述之裝置,其中,該處理單元還包括存儲控制模組,該存儲控制模組用於將整個語音頻譜所對應的字以文檔的形式存儲至該存儲單元中,並與該語音頻譜綁定,作為該語音頻譜的歌詞。
  4. 如申請專利範圍第1項所述之裝置,其中,該處理單元還包括濾波模組,該濾波模組用於將聲音採集單元獲得的語音進行濾波,去除雜音。
  5. 一種用於裝置的生成歌詞的方法,該裝置包括聲音採集單元、存儲單元以及處理單元,該處理單元包括語音分析模組、聲母比較模組、頻率調整模組以及音節比較模組,該存儲單元存儲有聲母的頻譜、音節的頻譜以及聲母頻譜的標準頻率,其中,音節包括聲母和韻母,每一個音節的開頭為聲母,每個音節頻譜對應一個字;其改良在於,該方法包括步驟:
    通過該聲音採集單元採集用戶輸入的語音;
    通過該語音分析模組分析用戶語音得到語音頻譜;
    通過聲母比較模組將語音分析模組得出的語音頻譜與所存儲的聲母的頻譜進行比較,當一段語音頻譜與所存儲的聲母頻譜一致時,用該對應的聲母標示該段語音頻譜,該多個聲母將該用戶輸入語音分成了多個音節;通過該頻率調整模組將標示後的語音中每一聲母部分的頻譜的頻率與所存儲的對應聲母的標準頻率進行比較得出一比值,然後根據該比值調整該聲母對應音節的頻率,從而調整整個語音的頻率;
    通過該音節比較模組將經過頻率調整模組調整後的每一個音節的頻譜與存儲單元中存儲的音節的頻譜進行比較,當調整後的音節頻譜與所存儲的音節頻譜一致時,確定該調整後的音節頻譜對應的字為所存儲的音節頻譜對應的字。
  6. 如申請專利範圍第5項所述之方法,該裝置還包括一顯示單元,該處理單元還包括一顯示控制模組,其中,該方法還包括步驟:
    通過顯示控制模組將音節比較模組所確定的字顯示在顯示單元。
  7. 如申請專利範圍第5項所述之方法,該處理單元還包括一存儲控制模組,其中,該方法還包括步驟:通過該存儲控制模組將整個語音頻譜所對應的字以文檔的形式存儲至該存儲單元中,並與該語音頻譜綁定,作為該語音頻譜的歌詞。
  8. 如申請專利範圍第5項所述之方法,該處理單元還包括一濾波模組,其中,該方法還包括步驟:通過該濾波模組將聲音採集單元獲得的語音進行濾波,去除雜音。
TW99103130A 2010-02-03 2010-02-03 可生成歌詞的裝置及生成歌詞的方法 TWI385651B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW99103130A TWI385651B (zh) 2010-02-03 2010-02-03 可生成歌詞的裝置及生成歌詞的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW99103130A TWI385651B (zh) 2010-02-03 2010-02-03 可生成歌詞的裝置及生成歌詞的方法

Publications (2)

Publication Number Publication Date
TW201128636A TW201128636A (en) 2011-08-16
TWI385651B true TWI385651B (zh) 2013-02-11

Family

ID=45025321

Family Applications (1)

Application Number Title Priority Date Filing Date
TW99103130A TWI385651B (zh) 2010-02-03 2010-02-03 可生成歌詞的裝置及生成歌詞的方法

Country Status (1)

Country Link
TW (1) TWI385651B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200823699A (en) * 2006-11-17 2008-06-01 Via Tech Inc Playing systems and methods with integrated music, lyrics and song information
CN101237473A (zh) * 2008-02-27 2008-08-06 中兴通讯股份有限公司 动态实现歌词播放的方法及实现该方法的移动终端和设备
TW200834542A (en) * 2007-02-02 2008-08-16 Wen-Hua Sun PC-based Karaoke system having secondary lyrics display apparatus
CN101567184A (zh) * 2009-03-24 2009-10-28 广州酷狗计算机科技有限公司 一种卡拉ok动感歌词的制作方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200823699A (en) * 2006-11-17 2008-06-01 Via Tech Inc Playing systems and methods with integrated music, lyrics and song information
TW200834542A (en) * 2007-02-02 2008-08-16 Wen-Hua Sun PC-based Karaoke system having secondary lyrics display apparatus
CN101237473A (zh) * 2008-02-27 2008-08-06 中兴通讯股份有限公司 动态实现歌词播放的方法及实现该方法的移动终端和设备
CN101567184A (zh) * 2009-03-24 2009-10-28 广州酷狗计算机科技有限公司 一种卡拉ok动感歌词的制作方法

Also Published As

Publication number Publication date
TW201128636A (en) 2011-08-16

Similar Documents

Publication Publication Date Title
US8352268B2 (en) Systems and methods for selective rate of speech and speech preferences for text to speech synthesis
US8355919B2 (en) Systems and methods for text normalization for text to speech synthesis
US8396714B2 (en) Systems and methods for concatenation of words in text to speech synthesis
CN110675886B (zh) 音频信号处理方法、装置、电子设备及存储介质
US20100082346A1 (en) Systems and methods for text to speech synthesis
US20100082327A1 (en) Systems and methods for mapping phonemes for text to speech synthesis
US9135909B2 (en) Speech synthesis information editing apparatus
US9747876B1 (en) Adaptive layout of sheet music in coordination with detected audio
CN103366730B (zh) 声音合成设备
CN105957515A (zh) 声音合成方法、声音合成装置和存储声音合成程序的介质
JP2017111372A (ja) 音声合成方法、音声合成制御方法、音声合成装置および音声合成制御装置
Dinther et al. Perception of acoustic scale and size in musical instrument sounds
US11842720B2 (en) Audio processing method and audio processing system
US9135927B2 (en) Methods and apparatus for audio processing
TWI385651B (zh) 可生成歌詞的裝置及生成歌詞的方法
KR20150118974A (ko) 음성 처리 장치
JP2014013340A (ja) 作曲支援装置、作曲支援方法、作曲支援プログラム、作曲支援プログラムを格納した記録媒体およびメロディ検索装置
US20220208174A1 (en) Text-to-speech and speech recognition for noisy environments
EP3920049A1 (en) Techniques for audio track analysis to support audio personalization
US9640172B2 (en) Sound synthesizing apparatus and method, sound processing apparatus, by arranging plural waveforms on two successive processing periods
CN101819773B (zh) 可生成歌词的装置及生成歌词的方法
CN106373594B (zh) 一种音调检测方法及装置
Howard Singing synthesis and the vocal tract organ
JP2004302285A (ja) 情報出力装置、情報出力プログラム
US20170330544A1 (en) Method and system for creating an audio composition

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees