CN106548787B - 优化生词的评测方法及评测系统 - Google Patents

优化生词的评测方法及评测系统 Download PDF

Info

Publication number
CN106548787B
CN106548787B CN201610940236.2A CN201610940236A CN106548787B CN 106548787 B CN106548787 B CN 106548787B CN 201610940236 A CN201610940236 A CN 201610940236A CN 106548787 B CN106548787 B CN 106548787B
Authority
CN
China
Prior art keywords
text information
external
information
pronunciation
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610940236.2A
Other languages
English (en)
Other versions
CN106548787A (zh
Inventor
马洪锟
李重
许东星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisound Shanghai Intelligent Technology Co Ltd
Original Assignee
Unisound Shanghai Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Unisound Shanghai Intelligent Technology Co Ltd filed Critical Unisound Shanghai Intelligent Technology Co Ltd
Priority to CN201610940236.2A priority Critical patent/CN106548787B/zh
Publication of CN106548787A publication Critical patent/CN106548787A/zh
Application granted granted Critical
Publication of CN106548787B publication Critical patent/CN106548787B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明涉及一种优化生词的评测方法及系统,该评测方法包括如下步骤:在遇到生僻词时,基于字母排序获取排在生僻词前、后的两个标准文本信息与对应标准文本信息的标准读音信息,通过比对算法比对标准读音信息和外部读音信以输出比对结果。本发明采用对生僻词根据相邻的标准文本信息作为评测标准进行评测,得到接近生僻词的评分结果,相比对于生僻词一律给与优的评分方法,能够保证评分结果的准确性和真实性,很好的反映学习者的真实水平,对语言学习的指导起到了重要的作用。本发明的评测方法对于遇见的生僻词能够及时给出适当的评测结果,解决了现有评测系统无法对生僻词的发音进行评分的问题。

Description

优化生词的评测方法及评测系统
技术领域
本发明涉及语音评测领域,特指一种优化生词的评测方法及评测系统。
背景技术
在语言学习软件中,通常带有评测系统,用于对学习者的语言学习进行评测,给出对应的评测分数,以检测学习效果。评测系统在实际使用中,常常出现以下问题:在学习者发出生僻词的发音时,由于评测系统的词库中未设置有对应的词和评测标准,使得评测系统不能给出该生僻词的发音评分,给用户的体验造成了不良的影响,严重的会导致用户不在使用该语言学习软件。针对上述生僻词无法评测的问题,现有的学习软件系统中给出了一种对无法评测的生词一律给与优的评测结果,这样就降低了评测真实性和准确性,不能反映学习者的真实水平。
发明内容
本发明的目的在于克服现有技术的缺陷,提供一种优化生词的评测方法及评测系统,解决现有的评测系统无法对生僻词的发音进行评分给用户体验造成不良影响的问题,及采用对生词一律给与优的评分方法存在的降低评测真实性和准确性的问题。
实现上述目的的技术方案是:
本发明提供了一种优化生词的评测方法,包括如下步骤:
提供一设有单词数据库的智能设备,在所述单词数据库中预存标准文本信息与对应所述标准文本信息的标准读音信息,且所述标准文本信息基于字母排序;
向所述智能设备输入外部文本信息与对应所述外部文本信息的外部读音信息;
在所述单词数据库中搜索与所述外部文本信息相同的标准文本信息,通过一比对算法比对其对应的外部读音信息与标准读音信息;
输出比对结果;
其中,当在所述单词数据库中未搜索到与所述外部文本信息相同的标准文本信息时:
基于字母排序,获取排在所述外部文本信息前、后的两个标准文本信息与对应所述标准文本信息的标准读音信息;
通过所述比对算法,分别将所述外部文本信息的外部读音信息与所述前、后的两个标准文本信息的标准读音信息进行比对,获得两个比对结果;
输出读音信息较为近似的比对结果。
本发明对未包含在单词数据库中的外部文本信息,采用与该外部文本信息相邻的前后两个标准文本信息对应的标准读音信息,进行评测,得到的比对结果,相比现有技术中对生僻词一律给与优的评分方法,能够保证评分结果的准确性和真实性,很好的反映学习者的真实水平,对语言学习的指导起到了重要的作用。本发明的评测方法提供了一种自动纠错机制,对于遇见的生僻词能够及时给出适当的评测结果,较好的保证了用户的体验,解决了现有评测系统无法对生僻词的发音进行评分的问题。
本发明优化生词的评测方法的进一步改进在于,所述向所述智能设备输入外部文本信息与对应所述外部文本信息的外部读音信息的步骤进一步包括:
通过键盘向所述智能设备输入外部文本信息,利用所述智能设备的麦克风采集与所述外部文本信息对应的外部读音信息;或者
于所述智能设备内预存外部文本信息,通过所述智能设备显示预存的外部文本信息,并利用所述智能设备的麦克风采集与所述外部文本信息对应的外部读音信息。
本发明优化生词的评测方法的进一步改进在于,输出读音信息较为近似的比对结果,包括:
比较所获得的两个比对结果,选取比对结果中较大的值作为较为近似的比对结果进行输出。
本发明优化生词的评测方法的进一步改进在于,当在所述单词数据库中未搜索到与所述外部文本信息相同的标准文本信息时,记录所述外部文本信息和对应所述外部文本信息的标准读音信息,并形成汇总表进行存储。
本发明还提供了一种优化生词的评测系统,设于智能设备的单词数据库,所述单词数据库中预存有标准文本信息与对应所述标准文本信息的标准读音信息,且所述标准文本信息基于字母排序;
设于所述智能设备的外部信息获取模块,用于获取向所述智能设备输入的外部文本信息与对应所述外部文本信息的外部读音信息;
比对搜索模块,与所述外部信息获取模块和所述单词数据库连接,用于在所述单词数据库中搜索与所述外部文本信息相同的标准文本信息,并获取对应的标准读音信息;以及
比对评测模块,与所述外部信息获取模块和所述比对搜索模块连接,用于接收所述比对搜索模块获取的标准读音信息,并通过比对算法比对标准读音信息和对应的外部读音信息,以得到比对结果并输出;
其中,所述比对搜索模块还用于在所述单词数据库中未搜索到所述外部文本信息相同的标准文本信息时,基于字母排序,获取排在所述外部文本信息前、后的两个标准文本信息与对应所述标准文本信息的标准读音信息;
所述比对评测模块还用于通过所述比对算法,分别将所述外部文本信息的外部读音信息与所述前、后的两个标准文本信息的标准读音信息进行比对,获得两个比对结果并输出读音信息较为近似的比对结果。
本发明优化生词的评测系统的进一步改进在于,所述智能设备上装设有麦克风和键盘,通过所述键盘向所述智能设备输入外部文本信息,通过所述麦克风采集与所述外部文本信息对应的外部读音信息;或者所述智能设备上装设有麦克风和存储卡,所述存储卡内预存有外部文本信息,通过所述智能设备显示预存的外部文本信息,通过所述麦克风采集与所述外部文本信息对应的外部读音信息。
本发明优化生词的评测系统的进一步改进在于,所述比对评测模块获得两个比对结果后,比较所获得的两个比较结果,选取比对结果中较大的值作为较为近似的比对结果进行输出。
本发明优化生词的评测系统的进一步改进在于,还包括记录反馈模块,所述记录反馈模块与所述外部信息获取模块和所述比对搜索模块连接;所述比对搜索模块在所述单词数据库中未搜索到所述外部文本信息相同的标准文本信息时,形成记录指令发送给所述记录反馈模块;
所述记录反馈模块用于根据所述记录指令记录所述比对搜索模块在所述单词数据库中未搜索到的所述外部文本信息和与所述外部文本信息对应的外部读音信息。
附图说明
图1为本发明优化生词的评测系统的系统图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明。
本发明提供了一种优化生词的评测方法及评测系统,用于解决在语音评测过程中遇到生僻词而无法评测的问题,目的在于对生僻词给出较为准确恰当的评测结果,以反映学习者的真实水平,保证了学习者的良好体验。本发明优化生词的评测方法及评测系统,在遇到生僻词时,即单词数据库中没有存储对应的标准文本信息时,于单词数据库中找出与该生僻词最相似的标准文本信息,利用近似的标准文本信息的标准读音信息作为评测标准以对生僻词进行评分,得到评测结果,该评测结果趋近于生僻词的实际评测结果,相比于现有中将生僻词一律给与优的评测方法,本发明的评测方法及评测系统,能够保证评测的准确度和真实性,提高评测结果的真实度。且对于遇到的生僻词进行记录,在系统维护时人工对生僻词进行添加,以扩充和完善单词数据库。下面结合附图对本发明优化生词的评测方法及评测系统进行说明。
如图1所示,本发明提供的一种优化生词的评测系统为处理单元21,与单词数据库10、第一输入单元11、和第二输入单元12连接,单词数据库10中存储有标准文本信息与对应标准文本信息的标准读音信息。通过第一输入单元11输入外部文本信息,通过第二输入单元12输入与外部文本信息对应的外部读音信息,本发明的处理单元21利用外部文本信息搜索单词数据库10,在单词数据库10中搜索与外部文本信息相同的标准文本信息,并获取到标准读音信息,这样比对标准读音信息和外部读音信息,得到比对结果并输出,该比对结果为外部读音信息中的发音的评测分值,实现了对发音的评测功能。
本发明的评测系统能够为安装在智能设备上的语言学习系统提供发音评测功能,比如手机、平板电脑等智能设备,语言学习系统比如安装在手机和平板电脑上的英语学习软件、德语学习软件等语言类的学习系统。语言学习系统中设置有用于对学习者进行测试的测试文本信息,该测试文本信息可以通过智能设备展示给学习者,以供学习者根据该测试文本信息进行朗读,这样测试文本信息作为外部文本信息通过语言学习系统输入给本发明的评测系统,而在学习者进行朗读时,智能设备上的麦克风作为第二输入单元对学习者的朗读进行录音,形成与外部文本信息对应的外部读音信息,且该外部读音信息被发送给处理单元21进行评测处理。本发明的优化生词的评测系统用于为语言学习系统提供发音评测的功能。作为本发明的一较佳实施方式,外部文本信息和外部读音信息通过如下方式输入到智能设备内,在智能设备上装设有麦克风和键盘,通过键盘向智能设备输入外部文本信息,这样输入的外部文本信息之间通过智能设备予以显示,在通过麦克风采集与通过键盘输入的外部文本信息对应的外部读音信息。作为本发明的另一较佳实施方式,在智能设备上装设有麦克风和存储卡,该存储卡内预存有外部文本信息,预存的外部文本信息可以直接通过外接设备导入到智能设备内,智能设备显示预存的外部文本信息,而后通过麦克风采集与外部文本信息对应的外部读音信息。
单词数据库10中预存有标准文本信息与对应标准文本信息的标准读音信息,且标准文本信息基于字母排序,以26个英文字母的顺序进行排序存储在单词数据库10中,其中的标准读音信息为对应标准文本信息的音标。
处理单元21包括有外部信息获取模块、比对搜索模块以及比对评测模块,外部信息获取模块与第一输入单元11和第二输入单元12连接,比对搜索模块与外部信息获取模块和单词数据库10连接,比对评测模块与外部信息获取模块和比对搜索模块连接。
外部信息获取模块用于获取向智能设备输入的外部文本信息与对应外部文本信息的外部读音信息。
比对搜索模块用于在单词数据库10中搜索与外部文本信息相同的标准文本信息,并获取对应的标准读音信息。在搜索时,比对搜索模块基于外部文本信息的拼写字母逐一地比对单词数据库10中存储的标准文本信息的拼写字母,找到与外部文本信息的拼写字母完全相同的标准文本信息,并对应的获取到标准读音信息。
比对评测模块用于接收比对搜索模块获取的标准读音信息,并通过比对算法比对标准读音信息和对应的外部读音信息,以得到比对结果并输出,该输出的比对结果即为发音的评测分值。比对评测模块的比对过程即为对外部读音信息进行发音评测的过程。在比对评测模块进行比对时,利用标准读音信息作为评测标准,对外部读音信息进行打分,即对外部读音信息的发音准确度、语调和韵律作为评分参数进行评分,再根据各个评分参数的权重计算得出比对结果。比对评测模块所采用的比对算法包括有基于隐马尔可夫模型的GOP算法和基于深度神经网络后验概率算法等。该基于隐马尔可夫模型的GOP算法和基于深度神经网络后验概率算法属于现有语音评测中的常用算法,对此不再详细赘述。
在进行外部读音信息的发音评测过程中,若出现了单词数据库10中没有与外部文本信息相同的标准文本信息时,就无法对该外部文本信息进行评测了。为描述方便,现将出现的单词数据库中没有与外部文本信息相同的标准文本信息时的外部文本信息叫做生僻词,比对搜索模块在单词数据库中未搜索到与该生僻词相同的标准文本信息时,基于字母排序,获取排在外部文本信息前、后的两个标准文本信息与应标准文本信息的标准读音信息,利用该两个标准读音信息作为标准来对生僻词进行评测。具体地,比对评测模块用于通过比对算法,分别将外部文本信息的外部读音信息与前、后两个标准文本信息的标准读音信息进行比对,获得两个比对结果并输出读音信息较为近似的比对结果。
本发明的评测系统由于选用了与生僻词排序相邻的标准文本信息的标准读音信息作为评测标准,能够很好的解决评测过程中遇到生僻词而无法评测的问题,且还使得所得出的评测结果能够接近该生僻词的真实评测结果,从而保证了评测结果的准确度和真实性,能够如实反映学习者的水平,针对学习者的学习计划给与真实的反馈和指导。
比对搜索模块在进行字母排序获取排在外部文本信息前、后的两个标准文本信息时,根据外部文本信息的拼写字母,遍历查找单词数据库中的标准文本信息,可以将外部文本信息与单词数据库中的所有标准文本信息依据26个英文字母的顺序进行排序,然后以外部文本信息为中心,找到与该外部文本信息相邻的且排序在其前后的两个标准文本信息。例如,在单词数据库以列表的形成存储有标准文本信息和标准读音信息,见表1。
表1单词数据库中存储的标准文本信息和标准读音信息
若外部文本信息为acanthade时,在表1所示的单词数据库中未有相同的标准文本信息,比对搜索模块基于字母排序对外部文本信息和单词数据库进行排序,以形成表2所示的排序表。
表2单词数据库和外部文本信息基于字母排序的排序表
这样根据表2的排序表,可以获取到与外部文本信息acanthade相邻的且排序在前的acanthad和排序在后的acanthi两个标准文本信息及对应的标准读音信息。
比对评测模块获得两个比对结果并输出读音信息较为近似的比对结果,该比对评测模块对所获得的两个比对结果,进行比较大小,比较所获得的两个比较结果,以选取比对结果中较大的值作为较为近似的比对进行输出。因与外部文本信息和相邻的标准文本信息之间发音有相同之处,但在前的标准文本信息和在后的标准文本信息中,可能有一个较为接近外部文本信息的发音,也可能两个都接近外部文本信息的发音,本发明选取两个标准读音信息作为评测标准,在得到的两个比对结果中选择最大值作为结果进行输出,更能接近外部文本信息的真实评测结果。
作为本发明的一较佳实施方式,本发明的评测系统还包括与记录反馈模块,该记录反馈模块与外部信息获取模块和比对搜索模块连接,比对搜索模块在单词数据库中未搜索到外部文本信息相同的标准文本信息时,形成记录指令发送给记录反馈模块;该记录反馈模块根据记录指令记录比对搜索模块在单词数据库中未搜索到的外部文本信息和与外部文本信息对应的外部读音信息。记录反馈模块将记录的外部文本信息与对应的外部读音信息一一对应的写入到汇总表中,以汇总表的形式进行存储,在该汇总表内不断的累积单词数据库中未包括的外部文本信息,在进行系统维护时,可直接将汇总表导出,然后人工核对外部文本信息,将外部文本信息的拼写和音标一并更新至单词数据库10中,补充词库量以完善单词数据库。
作为本发明的一较佳实施方式,本发明的评测系统还包括有存储模块,该存储模块为单词数据库提供存储功能,单词数据库中预存的标准文本信息和对应的标准文本信息的标准读音信息以逐条对应的方式存储在存储模块中。该单词数据库可以采用外接设备直接导入到存储模块中。存储模块中还用于存储记录反馈模块所形成的汇总表,该汇总表可以文本文档的形式进行存储,在导出时可以直接将汇总表导出到外接设备。在存储模块中还设有预存区域,在预存区域内存储外部信息获取模块获取的外部文本信息与对应外部文本信息的外部读音信息,以方便在整个的发音评测过程中能够容易的查找到对应的外部文本信息和外部读音信息,在发音评测完成输出了比对结果后,该预存区域内存储的外部文本信息和外部读音信息被释放,以进行下一次的评测。
本发明优化生词的评测系统的有益效果为:
该评测系统为语言学习软件提供了一种带有自动纠错机制的评测方法,为语言学习过程中提供了发音评测功能,在发音评测中遇到生僻词时,可根据生僻词在单词数据库中找到相邻的标准文本信息,并利用相邻的标准读音信息对生僻词进行评测,得到接近生僻词真实评测结果的评分值,能够有效保证评测结果的准确度和真实性。
该评测系统还记录了生僻词,在后续系统维护时,可进行人工标注,补充词库量并完善单词数据库。
本发明还提供了一种优化生词的评测方法。下面对本发明的优化生词的评测方法进行说明。
本发明优化生词的评测方法包括如下步骤:
提供一设有单词数据库的智能设备,在单词数据库中预存标准文本信息与对应标准文本信息的标准读音信息,且标准文本信息基于字母排序;
向智能设备输入外部文本信息与对应外部文本信息的外部读音信息;
在单词数据库中搜索与外部文本信息相同的标准文本信息,通过一比对算法比对其对应的外部读音信息与标准读音信息;
输出比对结果;
其中,当在单词数据库中未搜索到与外部文本信息相同的标准文本信息时:
基于字母排序,获取排在外部文本信息前、后的两个标准文本信息与对应标准文本信息的标准读音信息;
通过比对算法,分别将外部文本信息的外部读音信息与前、后的两个标准文本信息的标准读音信息进行比对,获得两个比对结果;
输出读音信息较为近似的比对结果。输出的比对结果为发音的评测分值,利用比对算法对外部读音信息和标准读音信息进行比对的过程为发音评测过程。
遇到生僻词,即在单词数据库中没有与外部文本信息相同的标准文本信息时,就无法知晓该生僻词的音标,进而无法对生僻词进行评测,就导致了整个评测无法继续进行了。本发明的评测方法,利用单词数据库中与生僻词相邻的标准文本信息的标准读音信息作为评测标准,由于与生僻词相邻的标准文本信息和生僻词的发音有一定的相似度,这样得出的评测结果较为接近生僻词的真实评测结果,从而起到了提高评测结果的准确性和真实性的作用。
本发明的优化生词的评测方法能够解决生僻词的评测问题,给出生僻词的评测结果,且该评测结果趋近于生僻词的真实评测结果。较好的保证了用户的体验,解决了现有评测系统无法对生僻词的发音进行评分的问题。
本发明的评测方法能够为安装在智能设备上的语言学习系统提供发音评测功能,比如手机、平板电脑等智能设备,语言学习系统比如安装在手机和平板电脑上的英语学习软件、德语学习软件等语言类的学习系统。语言学习系统中设置有用于对学习者进行测试的测试文本信息,该测试文本信息可以通过智能设备展示给学习者,以供学习者根据该测试文本信息进行朗读,这样测试文本信息作为外部文本信息通过语言学习系统输入至智能设备,而在学习者进行朗读时,智能设备上的麦克风作为第二输入单元对学习者的朗读进行录音采集,形成与外部文本信息对应的外部读音信息,这样就实现了向智能设备输入外部文本信息和对应外部文本信息的外部读音信息。作为本发明的一较佳实施方式,向所述智能设备输入外部文本信息与对应所述外部文本信息的外部读音信息的步骤进一步包括:通过键盘向智能设备输入外部文本信息,利用智能设备的麦克风采集与外部文本信息对应的外部读音信息;或者在智能设备内预存外部文本信息,通过智能设备显示预存的外部文本信息,并利用智能设备的麦克风采集与所述外部文本信息对应的外部读音信息。
作为本发明的一较佳实施方式,输出读音信息较为近似的比对结果,包括:比较所获得的两个比对结果,选取比对结果中较大的值作为较为近似的比对结果进行输出。因与外部文本信息和相邻的标准文本信息之间发音有相同之处,但在前的标准文本信息和在后的标准文本信息中,可能有一个较为接近外部文本信息的发音,也可能两个都接近外部文本信息的发音,本发明选取两个标准读音信息作为评测标准,在得到的两个比对结果中选择最大值作为结果进行输出,更能接近外部文本信息的真实评测结果。
通过一比对算法比对其对应的外部读音信息与标准读音信息,输出比对结果。该输出的比对结果为发音的评测分值,利用比对算法进行比对的过程即为对外部读音信息进行发音评测的过程。其中的比对算法是利用标准读音信息作为评测标准,对外部读音信息进行打分,即对外部读音信息的发音准确度、语调和韵律作为评分参数进行评分,再根据各个评分参数的权重计算得出比对结果。比对评测模块所采用的比对算法包括有基于隐马尔可夫模型的GOP算法和基于深度神经网络后验概率算法等。
作为本发明的一较佳实施方式,当在单词数据库中未搜索到与外部文本信息相同的标准文本信息时,记录外部文本信息和对应外部文本信息的标准读音信息,并形成汇总表进行存储。该汇总表不断的累积外部文本信息,在进行系统维护时,可直接将汇总表导出,然后人工核对外部文本信息,将外部文本信息的拼写和音标一并存入到单词数据库中,补充词库量以完善单词数据库。
作为本发明的一较佳实施方式,在评测过程中,建立存储模块,将外部文本信息和外部读音信息存储到存储模块中,以方便在评测过程中对外部文本信息和外部读音信息的读取,在评测完成后,即输出了比对结果,就将存储模块中存储的外部文本信息和外部读音信息进行释放,以进行下一次的评测。还可以利用存储模块对单词数据库进行存储,可采用外接设备将单词数据库导入到存储模块中。还可以利用存储模块存储汇总表,可采用外接设备直接将汇总表导出,以进行单词数据库的完善。
本发明优化生词的评测方法的有益效果为:
该评测方法提供了一种带有自动纠错功能的评测方法,在遇到生僻词时,可根据生僻词在单词数据库中找到与生僻词相邻的标准文本信息,并利用相邻的标准文本信息的标准读音信息对生僻词进行评测,得到接近生僻词真实评测结果的评分值,能够有效保证评测结果的准确度和真实性。
该评测方法还记录了生僻词,在后续系统维护时,可进行人工标注,补充词库量并完善单词数据库。
以上结合附图实施例对本发明进行了详细说明,本领域中普通技术人员可根据上述说明对本发明做出种种变化例。因而,实施例中的某些细节不应构成对本发明的限定,本发明将以所附权利要求书界定的范围作为本发明的保护范围。

Claims (8)

1.一种优化生词的评测方法,其特征在于,包括如下步骤:
提供一设有单词数据库的智能设备,在所述单词数据库中预存标准文本信息与对应所述标准文本信息的标准读音信息,且所述标准文本信息基于字母排序;
向所述智能设备输入外部文本信息与对应所述外部文本信息的外部读音信息;
在所述单词数据库中搜索与所述外部文本信息相同的标准文本信息,通过一比对算法比对其对应的外部读音信息与标准读音信息;
输出比对结果;
其中,当在所述单词数据库中未搜索到与所述外部文本信息相同的标准文本信息时:
基于字母排序,获取排在所述外部文本信息前、后的两个标准文本信息与对应所述标准文本信息的标准读音信息;
通过所述比对算法,分别将所述外部文本信息的外部读音信息与所述前、后的两个标准文本信息的标准读音信息进行比对,获得两个比对结果;
输出读音信息较为近似的比对结果。
2.如权利要求1所述的方法,其特征在于,所述向所述智能设备输入外部文本信息与对应所述外部文本信息的外部读音信息的步骤进一步包括:
通过键盘向所述智能设备输入外部文本信息,利用所述智能设备的麦克风采集与所述外部文本信息对应的外部读音信息;或者
于所述智能设备内预存外部文本信息,通过所述智能设备显示预存的外部文本信息,并利用所述智能设备的麦克风采集与所述外部文本信息对应的外部读音信息。
3.如权利要求1所述的方法,其特征在于,输出读音信息较为近似的比对结果,包括:
比较所获得的两个比对结果,选取比对结果中较大的值作为较为近似的比对结果进行输出。
4.如权利要求1所述的优化生词的评测方法,其特征在于,当在所述单词数据库中未搜索到与所述外部文本信息相同的标准文本信息时,记录所述外部文本信息和对应所述外部文本信息的标准读音信息,并形成汇总表进行存储。
5.一种优化生词的评测系统,其特征在于,包括:
设于智能设备的单词数据库,所述单词数据库中预存有标准文本信息与对应所述标准文本信息的标准读音信息,且所述标准文本信息基于字母排序;
设于所述智能设备的外部信息获取模块,用于获取向所述智能设备输入的外部文本信息与对应所述外部文本信息的外部读音信息;
比对搜索模块,与所述外部信息获取模块和所述单词数据库连接,用于在所述单词数据库中搜索与所述外部文本信息相同的标准文本信息,并获取对应的标准读音信息;以及
比对评测模块,与所述外部信息获取模块和所述比对搜索模块连接,用于接收所述比对搜索模块获取的标准读音信息,并通过比对算法比对标准读音信息和对应的外部读音信息,以得到比对结果并输出;
其中,所述比对搜索模块还用于在所述单词数据库中未搜索到所述外部文本信息相同的标准文本信息时,基于字母排序,获取排在所述外部文本信息前、后的两个标准文本信息与对应所述标准文本信息的标准读音信息;
所述比对评测模块还用于通过所述比对算法,分别将所述外部文本信息的外部读音信息与所述前、后的两个标准文本信息的标准读音信息进行比对,获得两个比对结果并输出读音信息较为近似的比对结果。
6.如权利要求5所述的优化生词的评测系统,其特征在于,所述智能设备上装设有麦克风和键盘,通过所述键盘向所述智能设备输入外部文本信息,通过所述麦克风采集与所述外部文本信息对应的外部读音信息;或者所述智能设备上装设有麦克风和存储卡,所述存储卡内预存有外部文本信息,通过所述智能设备显示预存的外部文本信息,通过所述麦克风采集与所述外部文本信息对应的外部读音信息。
7.如权利要求5所述的优化生词的评测系统,其特征在于,所述比对评测模块获得两个比对结果后,比较所获得的两个比较结果,选取比对结果中较大的值作为较为近似的比对结果进行输出。
8.如权利要求5所述的优化生词的评测系统,其特征在于,还包括记录反馈模块,所述记录反馈模块与所述外部信息获取模块和所述比对搜索模块连接;所述比对搜索模块在所述单词数据库中未搜索到所述外部文本信息相同的标准文本信息时,形成记录指令发送给所述记录反馈模块;
所述记录反馈模块用于根据所述记录指令记录所述比对搜索模块在所述单词数据库中未搜索到的所述外部文本信息和与所述外部文本信息对应的外部读音信息。
CN201610940236.2A 2016-11-01 2016-11-01 优化生词的评测方法及评测系统 Active CN106548787B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610940236.2A CN106548787B (zh) 2016-11-01 2016-11-01 优化生词的评测方法及评测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610940236.2A CN106548787B (zh) 2016-11-01 2016-11-01 优化生词的评测方法及评测系统

Publications (2)

Publication Number Publication Date
CN106548787A CN106548787A (zh) 2017-03-29
CN106548787B true CN106548787B (zh) 2019-07-09

Family

ID=58393146

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610940236.2A Active CN106548787B (zh) 2016-11-01 2016-11-01 优化生词的评测方法及评测系统

Country Status (1)

Country Link
CN (1) CN106548787B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109451386A (zh) * 2018-10-20 2019-03-08 东北大学秦皇岛分校 返声功能部件、隔音反馈耳机及其应用和隔音反馈方法
CN111027794B (zh) * 2019-03-29 2023-09-26 广东小天才科技有限公司 一种听写作业的批改方法及学习设备
CN111078898B (zh) * 2019-12-27 2023-08-08 出门问问创新科技有限公司 一种多音字标注方法、装置以及计算机可读存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0094502A1 (en) * 1982-05-13 1983-11-23 Texas Instruments Incorporated Electronic learning aid for assistance in speech pronunciation
WO1994010666A1 (en) * 1992-11-04 1994-05-11 The Secretary Of State For Defence In Her Britannic Majesty's Government Of The United Kingdom Of Great Britain And Northern Ireland Children's speech training aid
CN1153567A (zh) * 1995-05-03 1997-07-02 菲利浦电子有限公司 基于新字建模的语音识别方法和装置
EP1134727A2 (en) * 2000-03-14 2001-09-19 Sony Corporation Sound models for unknown words in speech recognition
EP1205898A2 (en) * 2000-11-10 2002-05-15 Readingvillage. Com, Inc. Technique for mentoring pre-readers and early readers
CN101203895A (zh) * 2005-04-05 2008-06-18 Ai有限公司 语义知识评估、教学和习得系统及其方法
CN101630448A (zh) * 2008-07-15 2010-01-20 上海启态网络科技有限公司 语言学习客户端及系统
CN105374356A (zh) * 2014-08-29 2016-03-02 株式会社理光 语音识别方法、语音评分方法、语音识别系统及语音评分系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0094502A1 (en) * 1982-05-13 1983-11-23 Texas Instruments Incorporated Electronic learning aid for assistance in speech pronunciation
WO1994010666A1 (en) * 1992-11-04 1994-05-11 The Secretary Of State For Defence In Her Britannic Majesty's Government Of The United Kingdom Of Great Britain And Northern Ireland Children's speech training aid
CN1153567A (zh) * 1995-05-03 1997-07-02 菲利浦电子有限公司 基于新字建模的语音识别方法和装置
EP1134727A2 (en) * 2000-03-14 2001-09-19 Sony Corporation Sound models for unknown words in speech recognition
EP1205898A2 (en) * 2000-11-10 2002-05-15 Readingvillage. Com, Inc. Technique for mentoring pre-readers and early readers
CN101203895A (zh) * 2005-04-05 2008-06-18 Ai有限公司 语义知识评估、教学和习得系统及其方法
CN101630448A (zh) * 2008-07-15 2010-01-20 上海启态网络科技有限公司 语言学习客户端及系统
CN105374356A (zh) * 2014-08-29 2016-03-02 株式会社理光 语音识别方法、语音评分方法、语音识别系统及语音评分系统

Also Published As

Publication number Publication date
CN106548787A (zh) 2017-03-29

Similar Documents

Publication Publication Date Title
CN110782921B (zh) 语音测评方法和装置、存储介质及电子装置
CN101740024B (zh) 基于广义流利的口语流利度自动评估方法
US8583438B2 (en) Unnatural prosody detection in speech synthesis
CN101739869B (zh) 一种基于先验知识的发音评估与诊断系统
CN103761975B (zh) 一种口语评测方法及装置
CN101751919B (zh) 一种汉语口语重音自动检测方法
CN103594087B (zh) 提高口语评测性能的方法及系统
CN101650886B (zh) 一种自动检测语言学习者朗读错误的方法
CN106202153A (zh) 一种es搜索引擎的拼写纠错方法及系统
CN106782603B (zh) 智能语音评测方法及系统
CN108154735A (zh) 英语口语测评方法及装置
CN106570180A (zh) 基于人工智能的语音搜索方法及装置
CN102034475A (zh) 一种运用计算机对开放式短对话进行交互式评分的方法
CN105488142A (zh) 成绩信息录入方法及系统
CN110415725B (zh) 使用第一语言数据评估第二语言发音质量的方法及系统
CN101452701B (zh) 基于反模型的置信度估计方法及装置
CN106548787B (zh) 优化生词的评测方法及评测系统
CN102439660A (zh) 基于置信度得分的语音标签方法和装置
CN107093422A (zh) 一种语音识别方法和语音识别系统
CN109460558B (zh) 一种语音翻译系统的效果评判方法
CN113343671B (zh) 一种语音识别后的语句纠错方法、装置、设备及存储介质
KR20160059265A (ko) 신뢰도 측점 점수를 고려한 음향 모델 학습 방법 및 장치
CN107943940A (zh) 数据处理方法、介质、系统和电子设备
CN107610720A (zh) 发音偏误检测方法、装置、存储介质及设备
Kyriakopoulos et al. Automatic characterisation of the pronunciation of non-native English speakers using phone distance features

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20170929

Address after: 200233 Shanghai City, Xuhui District Guangxi 65 No. 1 Jinglu room 702 unit 03

Applicant after: YUNZHISHENG (SHANGHAI) INTELLIGENT TECHNOLOGY CO.,LTD.

Address before: 200233 Shanghai, Qinzhou, North Road, No. 82, building 2, layer 1198,

Applicant before: SHANGHAI YUZHIYI INFORMATION TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Optimizing the evaluation method and system of new words

Effective date of registration: 20201201

Granted publication date: 20190709

Pledgee: Bank of Hangzhou Limited by Share Ltd. Shanghai branch

Pledgor: YUNZHISHENG (SHANGHAI) INTELLIGENT TECHNOLOGY Co.,Ltd.

Registration number: Y2020310000047

PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20220307

Granted publication date: 20190709

Pledgee: Bank of Hangzhou Limited by Share Ltd. Shanghai branch

Pledgor: YUNZHISHENG (SHANGHAI) INTELLIGENT TECHNOLOGY CO.,LTD.

Registration number: Y2020310000047

PC01 Cancellation of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Optimize the evaluation method and evaluation system of new words

Effective date of registration: 20230210

Granted publication date: 20190709

Pledgee: Bank of Hangzhou Limited by Share Ltd. Shanghai branch

Pledgor: YUNZHISHENG (SHANGHAI) INTELLIGENT TECHNOLOGY CO.,LTD.

Registration number: Y2023310000028

PE01 Entry into force of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Granted publication date: 20190709

Pledgee: Bank of Hangzhou Limited by Share Ltd. Shanghai branch

Pledgor: YUNZHISHENG (SHANGHAI) INTELLIGENT TECHNOLOGY CO.,LTD.

Registration number: Y2023310000028

PC01 Cancellation of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Optimizing evaluation methods and evaluation systems for new words

Granted publication date: 20190709

Pledgee: Bank of Hangzhou Limited by Share Ltd. Shanghai branch

Pledgor: YUNZHISHENG (SHANGHAI) INTELLIGENT TECHNOLOGY CO.,LTD.

Registration number: Y2024310000165

PE01 Entry into force of the registration of the contract for pledge of patent right