CN1669065A - 声音-语调校准方法 - Google Patents

声音-语调校准方法 Download PDF

Info

Publication number
CN1669065A
CN1669065A CNA038165511A CN03816551A CN1669065A CN 1669065 A CN1669065 A CN 1669065A CN A038165511 A CNA038165511 A CN A038165511A CN 03816551 A CN03816551 A CN 03816551A CN 1669065 A CN1669065 A CN 1669065A
Authority
CN
China
Prior art keywords
audio signal
experimental subjects
imitation
calibration steps
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA038165511A
Other languages
English (en)
Other versions
CN100504961C (zh
Inventor
胡伯特·莱莫尼
杰克·芒格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SpeedLingua SA
Original Assignee
SpeedLingua SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SpeedLingua SA filed Critical SpeedLingua SA
Publication of CN1669065A publication Critical patent/CN1669065A/zh
Application granted granted Critical
Publication of CN100504961C publication Critical patent/CN100504961C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • G09B19/06Foreign languages
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

一声音-语调校准方法——其中,实验对象(S)发送的声频信号经实时处理后,复原在实验对象(S)的听觉器官中,它包括以下步骤:获取模仿声音范例(E10),分析所述声频信号范例的频谱(E11),获取实验对象(S)的模仿声频信号(E13),对模仿声频信号进行频谱分析(E15),比较声音范例和模仿声频信号的频谱(E16),根据所述比较的结果,校正模仿声频信号(E18),在实验对象的听觉器官复原校正声频信号(E22)。所述处理尤其应用在外语学习或练歌领域中。

Description

声音-语调校准方法
技术领域
本发明涉及一声音-语调校准方法。
它尤其涉及一种供实验对象使用的语言学习口语练习方法、练歌方法。
本发明通常涉及一种可通过改变人说话时的声音信息,以校正说话人传送的声频信号的方法。
背景技术
所述方法基于一已知原理,根据所述原理,实验对象的发音,即其发送的声音,根据所述同一实验对象的听觉器官,即其所接收的声音信息,被极大改变了。
尤其在口语教学和实践的特殊领域内,已知可使用一些仪器,其中,实验对象发出的声频信号经过实时处理后,复原在实验对象的听觉器官中。
所述方法尤其在文件WO92/14229中被描述过。
所述文件描述了一种装置,在所述装置中,实验对象发送的声频信号,根据需学习的外语的特征及所述语言的谐波内容,通过处理后被校正。所述校正声频信号由一震动信号、通常为一声频信号,实时发送给实验对象,以校正实验对象发出的声频信号。
但在所述文件中,实验对象发出的声频信号,根据需学习的语言的通频带,尤其根据所述频带的包络线,已预先处理过。
事实上,信号处理电路包括一多频均衡器,所述均衡器根据所需学习的语言、尤其根据所述语言的通频带及所述通频带的轮廓,即所述通频带的包络线,以预定方式被调节。实际上,均衡器由在不同频率上调节的多个连续滤波器构成。
因此,可根据需学习语言的特征,预先设置所述均衡器的频率参数。
同样,所述文件描述了对实验对象发出的声频信号的二次处理,其中,调节参数根据所接收发音的声音震动的泛音内容及需学习语言的相关参数,进行设置。
此时,根据来自实验对象的有效发音的处理信号和所述语言的预设特征之差,设置多频均衡器的参数。
因此,所述文件描述了产生代表实验对象发音的第一信号、第二信号及第三信号,所述第二信号相对于第一信号已根据需学习语言的通频带、尤其根据所述语言的包络线以预定方式被校正,所述第三信号根据发音的有效谐波内容及所述语言特征被校准,因而不同于第一信号。
然后,有选择地把所述信号复原给实验对象。
以前技术的所述系统存在的不足在于使用的是一预设置参数,未考虑实验对象的发音声频信号类型。
发明内容
本发明的目的在于改进目前的声音-语调校准方法,以简化使用,并扩大其应用领域。
为此,本发明提出了一种声音-语调校准方法,其中,实验对象发送的声频信号经实时处理后,复原在实验对象的听觉器官中,其特征在于它包括以下步骤:
——获取需模仿的声音范例;
——分析所述声频信号范例的频谱;
——获取实验对象的模仿声频信号;
——对模仿的声频信号进行频谱分析;
——比较声频信号范例的频谱和模仿的声频信号的频谱;
——根据所述比较的结果,校正所述模仿的声频信号;
——向实验对象的听觉器官复原纠正后的声频信号。
本发明的目的在于根据分析模仿声频信号和实验对象的模仿声频信号的频率内容,通过实时改变其发音的谐波内容及根据频率分析复原所述校正信号,可校正语调。
因此,所述校准方法通过与预录声频信号范例的比较,可实时增加或删减模仿声频信号内的不同频率强度。
所述校准方法可使实验对象根据待模仿声频信号,相当准确地模仿各类声音。因此,它不仅可应用在对外语学习的口语练习中——其中,可模仿由母语国家的人读的系列词句,还可应用在练歌如卡拉OK内——其中,练习唱歌时,可模仿再现歌手唱的音调。
根据本发明的最佳特征,所述声音-语调校准方法还包括以下步骤:
——测量实验对象模仿的声频信号的力度;
——测量纠正后的声频信号的力度;
——比较模仿的声频信号和纠正后的声频信号的力度;及
——在将已纠正的声频信号向实验对象的听觉器官复原前,根据所述比较结果校正已纠正的声频信号的力度。
因此,可根据模仿声频信号,调节校正信号的总包络线,以避免复原给实验对象的信号力度与实验对象的发音声频信号差距太大。
根据本发明的最佳特征,所述校准方法还包括存储模仿声频信号范例的频谱分析的步骤。
因此,当模仿声频信号被实验对象以不同方式重复时,可使用声频信号范例的频谱分析,以实施声音-语调校准方法。
尤其事实上,特别在练习口语时,获取实验对象的模仿声频信号步骤前,声音-语调校准方法包括把模仿声频信号发送到实验对象听觉器官的步骤。
实验对象模仿前听到模仿信号,还有利于对口语练习的学习,并在读词句时,校正其语调。
根据所述声音-语调校准方法的第一实施方式,本发明涉及一种口语练习获取方法,其中,实验对象发送的声频信号,经实时处理后,还原到实验对象的听觉器官中。所述获取方法实施了根据本发明的声音-语调校准方法。
另外,本发明在第二类应用中,还涉及练歌者练习唱歌的方法,其中,练歌者发送的声频信号经实时处理后,还原在实验对象的听觉器官内。所述练唱方法也实施了根据本发明的声音-语调校准方法。
最后,本发明还涉及一固定或可移动式信息存储装置,所述装置包括软件编码部分,所述编码部分可实施根据本发明的声音-语调校准方法、口语练习获取方法或练歌方法。
本发明的其它特征及优点将在后文中、参照附图所作描述中体现出来。
附图说明
附图以非限制性方式示出了几例实施方式。附图中:
——图1所示算法图示出了根据本发明第一实施方式的一声音-语调校准方法;
——图2a、2b和2c简略示出了图1或图5所示声音-语调校准方法的各步骤;
——图3所示算法示出了根据本发明一实施方式的口语练习学习方法;
——图4所示算法示出了图3至图6中所实施的一校准步骤;
——图5所示算法示出了根据本发明第二实施方式的声音-语调校准方法;
——图6所示算法示出了根据本发明一实施方式的歌曲执行方法;
——图7所示的信息方框简图,示出了可实施本发明的一台计算机。
具体实施方式
首先参照图1,描述根据本发明第一实施方式的声音-语调校准方法。
在所述实施例中,所述声音-语调校准方法可用在口语练习采集方法中。
它基于这一事实:各语言使用具有特有强度的一个或多个频谱带。因此,所有人的耳朵都习惯于接收其母语特有的频谱场。而声音只是重复耳朵听到的,这样,若耳朵不习惯一门需学习的新语言的特殊频谱场时,则人也很难正确发音。
因此,根据本发明的声音-语调校准方法,以听说方式训练耳朵,使其熟悉需学习语言的特殊频谱场。
首先,所述方法包括需模仿的声频信号范例获取步骤E10。
若为外语时,所述声频信号为母语国家的人说的单个词或一组词。
所述范例获取最好从一计算机文件中执行,所述文件内保存有不同的声频信号范例。
所述声音文件F可保存在计算机硬盘或任何其它计算机媒介如CD-ROM、存储卡中,……也可通过通信网络如因特网远程下载。
然后在频谱分析步骤E11,分析所述需模仿声频信号。
在所述分析步骤E11中,测量各被分析频带的强度。
图2a所示实施例中示出了所述频谱分析的结果。因此,所述分析步骤E11可用来分析30至10 000赫兹的可听频率范围内的一系列频带。
所述一系列频带对应频率范围的划分。
事实上,频率范围可划分为至少50个频带,最好至少划分为160个频带,以能对声频信号进行足够精确分析。
图2a示出的是在频率范围50至1 500赫兹的划分。
因此,对各频带来说,可了解需模仿声频信号中的所述频带的强度,单位分贝。
在所述第一实施方式中,所述频谱分析的结果,即在所述实施例中,如图2a所示的分析在存储步骤E12保存在一文件中。
声音-语调校准方法,还包括实验对象S的模仿声频信号获取步骤E13。在所述获取步骤E13中,模仿声频信号例如通过麦克风,从实验对象S发送的声频信号中采集而得。
在所述实施方式中,首先分析模仿声频信号,以在测量步骤E14测量其力度。
因此,从所述测量步骤E14中可了解模仿声频信号的总包络线。
然后根据本发明,对模仿声频信号实施频谱分析步骤E15。
所述频谱分析步骤E15与前面对需模仿声频信号所实施的分析步骤类似,可在系列频带上分析实验对象S接收到的声频信号的强度。
因此,如图2b所示,可获得在频带范围30至10 000赫兹之间的各频带上的信号强度。
图2b示出了所述频谱在频率范围50至1 500赫兹之间的一实施例。
频带划分与需模仿声频信号的频谱分析步骤E11中所使用的相似。
然后实施比较步骤E16,以比较声频信号范例与模仿声频信号的频谱。
如图2c所示,所述比较的结果可用于在计算步骤E17计算模仿声频信号的频谱变化。
如图2c所示,把模仿声频信号的各频带,一个个地和需模仿声频信号的各频带进行比较、校正,以使模仿声频信号的强度值和需模仿范例的一样。
事实上,从中可推算出对各频带的增加或删减校正。
因此,所述计算步骤可确定相对于声频信号范例,需对各频带的增加或删减校正。
在模仿声频信号校正步骤E18,使用所述计算的结果。事实上,可设置力度多频带均衡器的参数,使模仿声频信号的频域等于获取的声频信号范例的频域。
通过各频带的增益自动调节控制,可设置参数。
在所述最佳实施方式中,校正步骤E18后,再测量校正声频信号的力度,以在比较步骤E19中,比较模仿声频信号和校正声频信号的力度。
计算步骤E20可确定信号的力度变化。所述计算的结果可应用在校正声频信号的力度校正步骤E21中。
事实上,利用计算步骤E20时获得的计算结果,可设置可变增益放大器的参数,所述放大器可校正信号的力度。
通过总增益自动调节控制,可设置参数。
校准方法还包括发送步骤E22,所述步骤可在实验对象S的听觉器官中还原所述校正声频信号。
所述发送通常由放大器实施,所述放大器的输出端连接一耳机。
所述放大器可有选择地使实验对象S听到经上述处理后的模仿声频信号,或听到获取步骤E10时获取的声频信号范例。
因此,发送需模仿声频信号到实验对象S听觉器官的步骤,最好在获取实验对象S的模仿声频信号步骤E13之前实施。
最好,修改步骤E23可根据需学习语言的表示参数,修改需模仿声频信号范例。
事实上,需模仿声频信号通过预定多频带图像均衡器,即根据所选语言设置参数,以强调所述语言的特殊频带。
这样,实验对象S能更好接收其耳朵通常不敏感的频率范围。
另外,为方便学习,尤其方便实验对象S重复需模仿声频信号,当所述声频信号为一个文本时,所述方法最好包括文本显示步骤E24,例如通过连接计算机的一显示屏。
现参照图3,描述口语练习的获取方法,所述方法实施了图1所示的声音-语调校准方法。
因此,所述口语练习获取方法可纠正实验对象S对所学语言的发音。
首先,如图3所示的所述获取方法包括校正步骤E30。
所述校正步骤如图4所示。
根据其总原理,所述校正步骤可在开始使用前,通过比较实验对象S发音级和预录的例子,自动调节计算机声卡的输入电平。
所述校正可使学生自己根据口语练习获取方法学习,避免声音的输入音量太小或太大,这可能干扰所述方法的良好运行。
为此,所述校正步骤包括测试步骤E41,在所述步骤中,实验对象可决定是否实施所述校正。尤其当计算机和其相连的声卡由同一实验对象使用时,可无需所述校正步骤。
若需校正,示例步骤E42可发出一参考声频信号。
显示步骤E43可显示对应于示例步骤E42产生的声频信号的文本内容。
实验对象再重复例子的声频信号,其发音在录制步骤E44时被录存下来。
实施比较步骤E45,所述步骤中,比较例子的声频信号和实验对象发出的声频信号的总强度,以在计算步骤E46中计算两个声频信号之间的强度级之差。
调节步骤E47还可调节计算机声卡的输入增益。
如图3所示,实施所述校正步骤后,加载步骤E31可加载软件,所述软件包括口语练习获取方法的编码。
在所述实施方式中,同一软件可用于不同语言。
当然,不同外语也可用不同软件。
在所述实施方式中,在选择步骤E32时,可选择所需学习的语言。
所述选择步骤E32可把和所述语言相关的所有参数加载在计算机中。
所述参数尤其包括需学习的语言特有的一个或多个频谱。
在第二选择步骤E33中,还可选择一门特殊课程。
事实上,可为每门语言设置几课,所述每一课包括预录好的一定数量的词句。
所述各课可根据语言的难度、或按各语言特有的不同语言现象分类。
事实上,可以传统方式,把参数及课程加载到计算机的随机存取存储器(“Random Access Memory”RAM)。
获取方法还包括发送需重复的词、句的步骤E34。
所述词句发送步骤对应于图1所示的获取步骤E10及频谱修改步骤E23。
在所述发送步骤E34中,放大器的有源输入对应于声音文件F中保存的声音。
因此,所述发送步骤E34可使实验对象听到需模仿的声频信号,所述声频信号对应于需学习语言的母语国家人朗读的文本的词句。
同时实施图1所示的分析步骤E11和频谱分析存储步骤E12。
为便于保存实验对象需重复的词句,对应于图1所示显示步骤E24的显示步骤E35,与语句发送步骤E34同时实施。
之后,获取方法还包括记时步骤E36,其中,实施图1所示的步骤E13至E22。
因此,在所述记时过程中,实验对象重复需模仿声频信号,所述信号如前所述已校正过,并实时在实验对象耳内还原,这样,所述实验对象会不自觉地、自发纠正其发音。
所述记时步骤E36的时间长度约为需模仿声频信号的时间加上数秒以允许实验对象模仿词句。
所述记时时间长度极可能例如已被实验对象调整过,所述实验对象希望更长或更短时间重复不同词句。
课的学习进度,即需重复的词及已重复的词可自动或手动调节。
在所述实施方式中,测试步骤E37可询问实验对象是否需再次学习同一句或词。
若需重复学习,则对同一声频信号再次实施发送步骤E34、显示步骤E35和记时步骤E36。
若无需重复,则第二测试步骤E38询问实验对象是否希望继续学习下一词句。
若选是,则对当前课中预录的下一词句实施发送步骤E34、显示步骤E35和记时步骤E36。
反之,则结束课程的学习。
因此,可反复重复多组词句,根据需要学习每课中的某些部分。
经过一定数量的练习,实验对象的耳朵已习惯接收其听到的语言、识别新的频率范围,变成熟悉的了。因此,还可不断改变实验对象的发音。
现描述图5、6所示的一种类似的练歌方法。
在所述实施方式中,声音-语调校准方法可改变练歌者的音调,使其唱歌方式最贴近预录的歌手演唱方式。
因此,它可使练歌者以歌手的方式演唱,例如可应用在卡拉OK系统中。
首先参照图5,描述根据本发明的声音-语调校准方法,所述方法和图1所示的口语练习获取方法类似。
在所述实施方式中,声音文件F中可保存一首或多首歌。事实上,每首歌有3个声音文件,一文件只保存歌手声音,另一文件保存配乐,第三个文件保存歌词。
和前面一样,所述声音文件可保存在计算机硬盘或其它任何计算机媒介(cd-ROM,存储卡……)上,也可通过通信网络如因特网下载。
和图1所示的声音-语调校准方法(其中,一方面,范例获取步骤E10及所述范例频谱分析步骤E11,另一方面,录音步骤E13和模仿声频信号的频谱分析步骤E13,轮流实施,因此,必段有需模仿声频信号的频谱分析的存储步骤E12,以在后面进程中实施比较)的不同的是,此处,对应歌手的歌声的需模仿声频信号获取步骤E50,和练歌者S的模仿声频信号录音步骤E53同时实施。
和前面一样,对需模仿声频信号和已模仿声频信号分别实施频谱分析步骤E51、E55,其结果提供给比较器的输入端,以实施频谱比较步骤E56。
所述比较步骤E56后,为计算步骤E57,所述计算步骤可根据保存的范例,计算需对模仿声频信号的修改。
所述比较、计算步骤与图2a、2b、2c中所示的类似。
为进一步分析频谱,频率范围最好划分为至少160个频带。
因此,所计算的修改由各频带的增益自动调节控制实施,以在校正步骤E58修改模仿的声频信号。
和前面一样,所述校正可由一力度调节图形均衡器实施,所述均衡器可一个频带一个频带地调节模仿声频信号,使其最大程度接近获取的范例。
在校正信号复原给练歌者前,和前面一样,需实施包络线修改步骤E61。
事实上,对录音步骤E53中录下的声频信号的力度分析步骤E54,可了解信号的总强度。比较步骤E59比较所述录音声频信号的力度和校正步骤E58时的校正声频信号的力度。
计算步骤E60可计算对校正声频信号实施的修改。所述修改由各频带的总增益自动调节控制实施,以在校正步骤E61时,修改校正的声频信号。所述包络线修改由一可变增益放大器实施。
因此,所述校正信号在发送给练歌者的步骤E62中通过放大器复原给练歌者。
因此,在所述声音-语调校准方法中,放大器既在输入端接收校正声频信号,同时从声音文件F中接收获取步骤E63中采集的配乐信号。
因此,练歌者既听到乐曲,又听到他的通过所述处理校正过的声音。
为方便练歌,显示步骤E64可同时以滚动方式显示歌词。
事实上,如图6所示,所述声音-语调校准方法,可应用在一更复杂的卡拉OK型练歌系统中,由练歌者实施。
在所述练歌方法中,校正步骤E61可在练歌前预先实施。
所述校正步骤对应图4所示的校正步骤,可调节计算机声卡的输入增益。
加载步骤E62可载入包括练歌方法编码的一软件。
事实上,选择步骤E63可使练歌者从保存在声音文件F中的歌曲中选择一首歌。
然后以前面如图5所示方式实施练歌步骤E64。
读取歌曲时,只有保存乐曲的文件经由放大器通过耳机传送到练歌者S耳内。
同时,在显示步骤E64,歌词显示在计算机屏幕上。同时读取含有声音的范例文件,完全与保存乐曲的文件同步。练歌者还可同时随乐曲演唱,这样,以便可同时分析两个声频信号的频谱,以实时对练歌者的模仿声频信号进行适当修改。
为便于同时唱歌,还有提供帮助,即节拍信号、可能还有光标,出现在歌词上,指出该唱哪段歌词。
实时修改发音,可使练歌者也实时、自发地纠正其发音。
因此,可使练歌者以录制的歌手演唱方式唱歌。
练歌结束时,测试步骤E65会要求练歌者选择是否重复练习同一首歌。
若选是,则练歌步骤E64重复声音文件上的相同内容。
反之,第二测试步骤E66要求实验对象选择是否练唱另一首歌。
若是,则重复选择步骤E63,从保存在声音文件上的歌曲中选择一首。
因而对所述新歌实施练唱步骤E64。
测试步骤E66结束后,若不再选择任何其它歌曲,则练歌结束。
练歌或口语练习获取使用的声音-语调校准方法,可应用在如图7所示的计算机10中。
所述方法应用的所有装置集成在微处理器(CPU)11中,只读存储器(“Read Only Memory”即ROM)12可存储声音-语调校准程序及练歌程序或口语练习获取程序。
随机存取存储器(Random Access Memory即RAM)13可在寄存器中存放所述程序运行时的修改值。
事实上,它包括寄存器,所述寄存器可保存声音文件F及频谱分析结果。
微处理器11集成在计算机中,所述计算机极可能通过一通信接口,和通信网络相连。
计算机还包括文件存放装置,如硬盘14,其中,它可通过盘(软盘、压缩盘或信息卡)读取器,与可移动文件保存装置如磁盘5协作。
因此,所述固定或可移动存储装置,可包括声音-语调校准方法的编码,及口语练习获取方法的编码或练歌方法编码。
所述方法的编码极可能例如保存在计算机硬盘10中,不同应用中使用的声音文件可分别保存在与盘读取器15协作的盘5上。
作为变型,可实施本发明的程序可存储在只读存储器12中。
计算机10还有一屏幕16,所述屏幕可用作和实验对象S的接口,尤其可向实验对象显示需重复或演唱的文本内容。
还装配有声卡17,所述声卡可与麦克风6和耳机7协作,以发送声频信号或接收实验对象发送的声频信号。
因此,中央处理器11执行与实施本发明相关的指令。当通电时,保存在存储器如只读存储器12中的、与本发明相关的程序及方法,传输到随机存储器13内,所述随机存储器因而包括本发明的可执行编码,及实施本发明必需的变量。
通信总线18可保持计算机的、或与计算机相关的不同组件之间的通信。
所述通信总线18的实施并非限制性的,微处理器11尤其可把指令直接或通过另一组件,传送给任何组件。
由于本发明,因此,声音-语调校准方法可应用在个人计算机中,供实验对象S使用,且无需外界参与。
事实上,口语练习获取时,实验对象S可通过预录声音文件,使用、学习其语调,无需老师在场。
当然,可对上述实施例实施多种改变,这并未超出本发明的范围。

Claims (15)

1、一种声音-语调校准方法,其中,实验对象(S)发送的声频信号经实时处理后,复原在实验对象(S)的听觉器官中,其特征在于它包括以下步骤:
——获取需模仿的声频信号范例(E10;E50);
——分析所述声频信号范例的频谱(E11;E51);
——获取实验对象(S)的模仿声频信号(E13;E53);
——对模仿的声频信号进行频谱分析(E15;E55);
——比较声频信号范例的频谱和模仿的声频信号的频谱(E16;E56);
——根据所述比较的结果,校正所述模仿的声频信号(E18;E58);
——向实验对象的听觉器官复原纠正后的声频信号(E22;E62)。
2、按照权利要求1所述的声音-语调校准方法,其特征在于,它还包括以下各步骤:
——测量实验对象(S)模仿的声频信号的力度(E14;E54);
——测量纠正后的声频信号的力度(E18;E58);
——比较模仿的声频信号和纠正后的声频信号的力度(E19;E59);及
——在将已纠正的声频信号向实验对象(S)的听觉器官复原前,根据所述比较结果校正已纠正的声频信号的力度(E21;E61)。
3、按照权利要求1或2所述的声音-语调校准方法,其特征在于,比较步骤(E16,E56)和校正步骤(E18,E58)在可听频率范围内的一系列频带上实施。
4、按照权利要求3所述的声音-语调校准方法,其特征在于,所述一系列频带对应于可听频率范围的划分。
5、按照权利要求3或4所述的声音-语调校准方法,其特征在于,可听频率范围划分为至少50个频带。
6、按照权利要求1至5中任一项所述的声音-语调校准方法,其特征在于,被模仿的声频信号范例为文本,所述方法还包括显示所述文本的步骤。
7、按照权利要求1至6中任一项所述的声音-语调校准方法,其特征在于,它还包括存储所述要模仿的声频信号范例的频谱分析的步骤(E12)。
8、按照权利要求1至7中任一项所述的声音-语调校准方法,其特征在于,在获取实验对象(S)模仿的声频信号的步骤(E13)前,还包括把要模仿的声频信号发送到实验对象(S)听觉器官的步骤(E22)。
9、按照权利要求8所述的声音-语调校准方法,其特征在于,在发音步骤(E22)前,还包括根据需学习的语言的表示参数,修改要模仿的声频信号范例的步骤(E23)。
10、按照权利要求1至6中任一项所述的声音-语调校准方法,其特征在于,要模仿的声频信号范例为一首歌,其特征还在于,在把校正后的声频信号还原到对象(S)的听觉器官中的步骤(E62)的同时,还包括把所述歌曲的配乐信号发送到对象(S)的听觉器官的步骤(E62)。
11、一种语言口语练习获取方法,其中,实验对象(S)发出的声频信号经实时处理后被还原到实验对象(S)的听觉器官中,其特征还在于,它使用按照权利要求1至9中任一项所述的声音-语调校准方法。
12、一种实验对象(S)练唱歌的方法,其中,实验对象(S)发出的声频信号经实时处理后还原到实验对象(S)的听觉器官中,其特征还在于,它使用按照权利要求1至6或10中任一项所述的声音-语调校准方法。
13、一种固定或可移动式信息存储装置,其特征在于,它包括软件编码部分,所述编码部分可实施按照权利要求1至10中任一项所述的声音-语调校准方法的步骤。
14、一种固定或可移动式信息存储装置,其特征在于,它包括软件编码部分,所述编码部分可实施按照权利要求11所述的语言口语练习获取方法的各步骤。
15、一种固定或可移动式信息存储装置,其特征在于,它包括软件编码部分,所述编码部分可实施按照权利要求12所述的练唱歌方法的各步骤。
CNB038165511A 2002-08-07 2003-08-06 声音-语调校准方法 Expired - Fee Related CN100504961C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0210051A FR2843479B1 (fr) 2002-08-07 2002-08-07 Procede de calibrage d'audio-intonation
FR02/10051 2002-08-07

Publications (2)

Publication Number Publication Date
CN1669065A true CN1669065A (zh) 2005-09-14
CN100504961C CN100504961C (zh) 2009-06-24

Family

ID=30129715

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB038165511A Expired - Fee Related CN100504961C (zh) 2002-08-07 2003-08-06 声音-语调校准方法

Country Status (13)

Country Link
US (1) US7634410B2 (zh)
EP (1) EP1388832B8 (zh)
JP (2) JP2004133409A (zh)
CN (1) CN100504961C (zh)
AU (1) AU2003264116B2 (zh)
BR (1) BR0313054A (zh)
CA (1) CA2494697A1 (zh)
FR (1) FR2843479B1 (zh)
MX (1) MXPA05001479A (zh)
PL (1) PL373755A1 (zh)
RU (1) RU2318246C2 (zh)
WO (1) WO2004015652A1 (zh)
ZA (1) ZA200504477B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101630448B (zh) * 2008-07-15 2011-07-27 上海启态网络科技有限公司 语言学习客户端及系统
CN104081453A (zh) * 2011-07-25 2014-10-01 索拉公司 用于声学变换的系统和方法
CN106340288A (zh) * 2016-10-12 2017-01-18 刘冬来 多功能迷你便携k歌设备

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7865365B2 (en) * 2004-08-05 2011-01-04 Nuance Communications, Inc. Personalized voice playback for screen reader
JP4779365B2 (ja) * 2005-01-12 2011-09-28 ヤマハ株式会社 発音矯正支援装置
EP1849154B1 (en) * 2005-01-27 2010-12-15 Synchro Arts Limited Methods and apparatus for use in sound modification
WO2006099467A2 (en) * 2005-03-14 2006-09-21 Voxonic, Inc. An automatic donor ranking and selection system and method for voice conversion
US8224647B2 (en) * 2005-10-03 2012-07-17 Nuance Communications, Inc. Text-to-speech user's voice cooperative server for instant messaging clients
JP2007140200A (ja) * 2005-11-18 2007-06-07 Yamaha Corp 語学学習装置およびプログラム
KR100735261B1 (ko) * 2005-12-26 2007-07-03 삼성전자주식회사 휴대 단말기 및 그 단말기의 음성 데이터 출력 방법
FI122089B (fi) 2006-03-28 2011-08-15 Genelec Oy Kalibrointimenetelmä ja -laitteisto äänentoistojärjestelmässä
CN101425231A (zh) * 2007-10-29 2009-05-06 索菲亚·米德克夫 婴幼儿语言学习卡
JP5268731B2 (ja) * 2009-03-25 2013-08-21 Kddi株式会社 音声合成装置、方法およびプログラム
RU2502119C1 (ru) * 2011-04-06 2013-12-20 Касио Компьютер Ко., Лтд. Музыкальный звукогенерирующий инструмент и машиночитаемый носитель
KR20150026305A (ko) * 2013-09-02 2015-03-11 최승철 언어 학습프로그램 및 이를 기록한 컴퓨터로 읽을 수 있는 기록매체
CN111201565A (zh) 2017-05-24 2020-05-26 调节股份有限公司 用于声对声转换的系统和方法
KR101925217B1 (ko) * 2017-06-20 2018-12-04 한국과학기술원 가창 표현 이식 시스템
WO2021030759A1 (en) 2019-08-14 2021-02-18 Modulate, Inc. Generation and detection of watermark for real-time voice conversion

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR1195239A (fr) 1957-11-23 1959-11-16 Procédé et appareil pour la rééducation de la voix
FR2260153A1 (en) 1974-01-31 1975-08-29 Tomatis Alfred Teaching device for e.g. stammerers - has microphone with switched output to bone and audio headphones
FR2303434A1 (fr) 1975-03-04 1976-10-01 Tomatis Alfred Installation d'ecoute electronique pour le conditionnement de l'oreille interne
FR2431743A1 (fr) 1978-07-19 1980-02-15 Audio Psycho Phonologie Sa Cie Appareil integrateur audio-vocal
FR2495361B1 (fr) 1980-12-03 1987-04-24 Auriol Bernard Appareil modificateur d'ecoute a effet proportionnel et progressif permettant de modifier de maniere progressive et reglable le spectre sonore du signal de sortie en fonction de l'amplitude du signal d'entree (ou l'amplitude en fonction du spectre du signal d'entree)
FR2546323B1 (fr) 1983-05-20 1985-08-30 Tomatis Alfred Appareil d'entrainement a la pratique d'une langue maternelle ou etrangere, en vue de son assimilation integrale
JPS616732A (ja) * 1984-06-21 1986-01-13 Fujitsu Ltd 発声訓練装置
FR2674660A1 (fr) 1989-06-26 1992-10-02 Bozadjian Edouard Systeme d'evaluation comparative pour l'amelioration de la prononciation.
FR2667185A1 (fr) 1990-09-20 1992-03-27 Tomatis Marc Andre Dispositif de presentation d'informations notamment destine a l'enseignement de langues.
FR2672412B1 (fr) * 1991-01-31 1994-06-17 Tomatis Int Procede et appareil pour l'enseignement des langues.
FR2686442B1 (fr) 1992-01-21 1994-04-29 Beller Isi Appareil convertisseur audiofrequence perfectionne, installation pour le traitement de sujets comprenant un tel appareil et procede mettant en óoeuvre une telle installation.
WO1993018505A1 (en) * 1992-03-02 1993-09-16 The Walt Disney Company Voice transformation system
KR960042590A (ko) * 1995-05-23 1996-12-21 김광호 테이프 재생용 음량기기에서의 발음비교방법
FR2752321B1 (fr) 1996-08-09 1998-10-30 Tomatis Int Procede et dispositif pour l'enseigement des langues
US5966687A (en) * 1996-12-30 1999-10-12 C-Cube Microsystems, Inc. Vocal pitch corrector
ATE277405T1 (de) * 1997-01-27 2004-10-15 Microsoft Corp Stimmumwandlung
US6336092B1 (en) * 1997-04-28 2002-01-01 Ivl Technologies Ltd Targeted vocal transformation
JP3232321B2 (ja) 1997-09-25 2001-11-26 株式会社 傳田聴覚システム研究所 聴覚訓練方法および聴覚訓練用音処理方法および聴覚訓練用音処理装置ならびに聴覚訓練用記録媒体
TW430778B (en) * 1998-06-15 2001-04-21 Yamaha Corp Voice converter with extraction and modification of attribute data
JP2000003187A (ja) * 1998-06-16 2000-01-07 Yamaha Corp 音声特徴情報記憶方法および音声特徴情報記憶装置
JP4048651B2 (ja) * 1999-06-08 2008-02-20 ヤマハ株式会社 発音採点装置
US7149690B2 (en) 1999-09-09 2006-12-12 Lucent Technologies Inc. Method and apparatus for interactive language instruction
EP1139318A4 (en) * 1999-09-27 2002-11-20 Kojima Co Ltd PRONUNCIATION EVALUATION SYSTEM
JP4323029B2 (ja) 1999-10-21 2009-09-02 ヤマハ株式会社 音声処理装置およびカラオケ装置
US6836761B1 (en) 1999-10-21 2004-12-28 Yamaha Corporation Voice converter for assimilation by frame synthesis with temporal alignment
JP3701850B2 (ja) * 2000-09-19 2005-10-05 日本放送協会 音声言語の韻律表示装置および記録媒体
JP4301021B2 (ja) 2004-02-04 2009-07-22 日産自動車株式会社 エンジンの制御装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101630448B (zh) * 2008-07-15 2011-07-27 上海启态网络科技有限公司 语言学习客户端及系统
CN104081453A (zh) * 2011-07-25 2014-10-01 索拉公司 用于声学变换的系统和方法
CN106340288A (zh) * 2016-10-12 2017-01-18 刘冬来 多功能迷你便携k歌设备

Also Published As

Publication number Publication date
EP1388832A1 (fr) 2004-02-11
AU2003264116B2 (en) 2008-05-29
ZA200504477B (en) 2006-02-22
AU2003264116A1 (en) 2004-02-25
PL373755A1 (en) 2005-09-05
EP1388832B1 (fr) 2015-04-08
WO2004015652A1 (fr) 2004-02-19
EP1388832B8 (fr) 2015-05-27
RU2318246C2 (ru) 2008-02-27
RU2005106281A (ru) 2005-08-20
JP2004133409A (ja) 2004-04-30
JP2008146094A (ja) 2008-06-26
FR2843479B1 (fr) 2004-10-22
MXPA05001479A (es) 2005-09-30
US20050074132A1 (en) 2005-04-07
BR0313054A (pt) 2005-06-28
FR2843479A1 (fr) 2004-02-13
CA2494697A1 (fr) 2004-02-19
US7634410B2 (en) 2009-12-15
CN100504961C (zh) 2009-06-24

Similar Documents

Publication Publication Date Title
CN1669065A (zh) 声音-语调校准方法
CN1158642C (zh) 检测和产生听觉信号中的瞬态条件的方法和系统
CN1238833C (zh) 语音识别装置以及语音识别方法
CN1264138C (zh) 复制语音信号、解码语音、合成语音的方法和装置
CN1205843C (zh) 低频的音频增强系统及方法
CN1801135A (zh) 音乐内容再现装置、其方法和记录装置
CN1679371A (zh) 传声器和通信接口系统
CN1325525A (zh) 修改复合波形的泛音含量的方法
CN1194336C (zh) 波形产生方法
CN1224956C (zh) 基音波形信号发生设备、基音波形信号发生方法及程序
CN1622195A (zh) 语音合成方法和语音合成系统
CN1795490A (zh) 用于计算和调节音频信号的感觉响度的方法、设备和计算机程序
CN1409527A (zh) 终端器、服务器及语音辨识方法
CN1141698C (zh) 对输入语音进行语音识别的音程标准化装置
JP2014071138A (ja) カラオケ装置
CN1838229A (zh) 重放装置和重放方法
CN1159703C (zh) 声音识别系统
CN1619640A (zh) 自动乐曲分类设备与方法
CN1694580A (zh) 测量装置及方法,以及记录介质
CN1679082A (zh) 控制包含语音和其它类型音频素材的信号中的语音响度
CN1461463A (zh) 语音合成设备
CN1692402A (zh) 声音合成方法以及声音合成装置
CN1702675A (zh) 定时决定装置和定时决定方法
EP3505146A1 (en) Auditory training device, auditory training method, and program
US20090310799A1 (en) Information processing apparatus and method, and program

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090624

Termination date: 20160806