CN103605492A - 一种自适应语言训练方法和平台 - Google Patents
一种自适应语言训练方法和平台 Download PDFInfo
- Publication number
- CN103605492A CN103605492A CN201310627536.1A CN201310627536A CN103605492A CN 103605492 A CN103605492 A CN 103605492A CN 201310627536 A CN201310627536 A CN 201310627536A CN 103605492 A CN103605492 A CN 103605492A
- Authority
- CN
- China
- Prior art keywords
- recognition result
- evaluation
- scene
- module
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
本发明公开了一种自适应语言训练方法和平台,以实现对用户在所选择的场景下输入的任意语音信息进行评价。该方法包括:调度模块调用语音识别模块对用户在所选择的场景下输入的任意语音信息进行语音识别;语音识别模块对任意语音信息进行识别,向评价模块输入识别结果;评价模块进行语义规范度、内容完整度和内容准确度的评价,对语义规范度、内容完整度和内容准确度的评价结果进行加权得到综合评价结果;调度模块将识别结果和综合评价结果反馈给用户。本发明使得系统在对用户表述进行评价时只需获得参考回答文本和期望关键词文本即可,能够客观、准确地反映用户的语言运用能力,利于提高用户的语言表述能力。
Description
技术领域
本发明涉及语音识别领域,具体涉及一种自适应语言训练方法和平台。
背景技术
随着社会发展,人与人之间的语言交流在社会生活的各个方面扮演着越来越重要的角色,语言交流过程中的诸多问题也日益受到重视。以言语障碍儿童为例,相关机构近年在北京等多地对几万名学生进行测查,发现言语和语音障碍儿童的出现率为普通小学6.42%,盲校9.24%,弱智学校30.10%,语言障碍的发生率较高,这些儿童均需要进行专业的言语康复训练;又如,香港等地警局警署为规范警员用语,均已开展警员出警用语规范性训练等语言交流训练。但是,这些语言交流训练均面临专业语言训练机构和训练师数量较少的难题
目前,计算机辅助训练已经广泛地应用于各行各业,语言交流训练也成为其中的一种。对于语言训练及评价,国内外已经进行了大量的研究。目前比较典型的语言训练系统可以从音素级别和句子级别评估训练用户的发音质量。现有的一种语言训练方法是朗读性语言表述训练及评价,也即文本相关语言表述训练及评价。具体地,首先给出期望的语言表述朗读文本,用户按照指定文本进行语言表述,系统通过强制对齐技术,将语音信号与隐马尔可夫模型(HiddenMarkov Model,HMM)识别系统的解码路径对齐。基于强制对齐的结果,提取反映发音质量的评价特征。在评价时,系统将不同的评价特征进行组合,其中包括线性回归、非线性回归(人工神经网络、回归树模型)等,得到最终的综合评价结果。在上述现有的语言训练方法中,系统使用有限个特定训练场景对用户进行训练,所有训练场景预包含在系统中,用户根据需要选择系统中合适的训练场景进行训练。
然而,上述现有的朗读性语言表述训练及评价存在的缺点也是显而易见的,其中主要包括:
1)对用户表述进行评价时必须预先知道用户表述文本,否则无法评价。用户必须按照系统预定义的的文本进行语言表述,若用户在表述时出现修改或重复等与预定义文本不一致的情况,系统对用户表述的评价准确度将会急剧下降;
2)难以达到对用户理解、表达与运用语言能力进行全面训练的目的。语言训练不仅仅局限于发音准确度与表述流利度,还应对理解、表达与运用语言的能力进行训练。但上述现有的朗读性语言训练限定了用户表述内容,因此无法对用户的理解、表达与运用语言能力进行有针对性的训练;
3)没有语法规范度方面的评价。上述现有的朗读性语言表述训练只停留在音素和声学层面,用户不能进行自发性表述,因此无法对用户表述进行语法规范度方面的评价。
发明内容
本发明实施例提供一种自适应语言训练方法和平台,以实现对用户在所选择的场景下输入的任意语音信息进行语义规范度、内容完整度和内容准确度的评价。
本发明实施例提供一种自适应语言训练方法,所述方法包括:
调度模块调用语音识别模块对用户在所选择的场景下输入的任意语音信息进行语音识别;
所述语音识别模块对所述任意语音信息进行识别,向评价模块输入识别结果;
所述评价模块根据所述识别结果对所述任意语音信息进行语义规范度的评价,以及根据所述识别结果和与所述场景对应的场景数据对所述任意语音信息进行内容完整度和内容准确度的评价,对所述语义规范度、内容完整度和内容准确度的评价结果进行加权得到综合评价结果;
所述调度模块将所述识别结果和综合评价结果反馈给所述用户。
本发明另一实施例提供一种自适应语言训练平台,所述平台包括调度模块、语音识别模块和评价模块;
所述调度模块,用于调用所述语音识别模块对用户在所选择的场景下输入的任意语音信息进行语音识别;
所述语音识别模块,用于对所述任意语音信息进行识别,向所述评价模块输入识别结果;
所述评价模块,用于根据所述识别结果对所述任意语音信息进行语义规范度的评价,以及根据所述识别结果和与所述场景对应的场景数据对所述任意语音信息进行内容完整度和内容准确度的评价,对所述语义规范度、内容完整度和内容准确度的评价结果进行加权得到综合评价结果;
所述调度模块还用于将所述识别结果和综合评价结果反馈给所述用户。
从上述本发明实施例可知,一方面,由于调度模块可以调用语音识别模块对用户在所选择的场景下输入的任意语音信息进行语音识别,因此,用户无需按照系统预定义的文本进行语言表述即可进行自发性语言表述,系统在对用户表述进行评价时只需获得参考回答文本和期望关键词文本即可,也因为无需限定用户表述的内容,因此能全面地对用户的理解、表达与运用语言能力进行有针对性的训练,另一方面,由于评价模块可以根据识别结果对任意语音信息进行语义规范度的评价,以及根据识别结果和与场景对应的场景数据对所述任意语音信息进行内容完整度和内容准确度的评价,因此,相比音素和声学层面的朗读性语言表述训练,能够更加客观、准确地反映用户的语言运用能力,更有利于提高用户的语言表述能力。
附图说明
图1是本发明实施例提供的自适应语言训练方法的基本流程示意图;
图2是本发明实施例提供的调度模块工作流程示意图;
图3是本发明实施例提供的场景控制模块的场景控制流程示意图;
图4是本发明实施例提供的场景控制模块的训练流程示意图;
图5是本发明实施例提供的场景拓展接口模块实现场景拓展的过程示意图;
图6是本发明实施例提供的自适应语言训练平台逻辑结构示意图;
图7是本发明另一实施例提供的自适应语言训练平台逻辑结构示意图;
图8是本发明另一实施例提供的自适应语言训练平台逻辑结构示意图;
图9是本发明另一实施例提供的自适应语言训练平台逻辑结构示意图;
图10-a是本发明另一实施例提供的自适应语言训练平台逻辑结构示意图;
图10-b是本发明另一实施例提供的自适应语言训练平台逻辑结构示意图;
图10-c是本发明另一实施例提供的自适应语言训练平台逻辑结构示意图;
图10-d是本发明另一实施例提供的自适应语言训练平台逻辑结构示意图;
图11是本发明实施例提供的与自适应语言训练平台相应的系统软件架构示意图。
具体实施方式
本发明实施例提供一种自适应语言训练方法,包括:调度模块调用语音识别模块对用户在所选择的场景下输入的任意语音信息进行语音识别;所述语音识别模块对所述任意语音信息进行识别,向评价模块输入识别结果;所述评价模块根据所述识别结果对所述任意语音信息进行语义规范度的评价,以及根据所述识别结果和与所述场景对应的场景数据对所述任意语音信息进行内容完整度和内容准确度的评价,对所述语义规范度、内容完整度和内容准确度的评价结果进行加权得到综合评价结果;所述调度模块将所述识别结果和综合评价结果反馈给所述用户。本发明实施例还提供相应的自适应语言训练平台。以下分别进行详细说明。
本发明实施例的自适应语言训练方法的基本流程可参考图1,主要包括如下步骤S101至步骤S104:
S101,调度模块调用语音识别模块对用户在所选择的场景下输入的任意语音信息进行语音识别。
首先对本发明实施例中的系统数据库和场景数据库进行说明。首先说明,系统数据库和场景数据库属于系统的软件架构中核心处理层的范畴,其中,系统数据库主要负责记录系统的多种数据信息,可供系统在需要时进行增、删、查、改等操作。系统数据库使用单机离线版轻量级数据库实现,主要记录的信息包括注册用户信息、登录信息、场景数据信息、识别任务记录、识别结果、评价结果等信息。系统数据库响应逻辑控制层的操作指令,对核心处理层中其他子模块透明。系统数据库在分析系统场景数据存储与管理需求以及系统用户注册与管理需求的基础上,依照典型的关系型数据库进行设计,满足第三范式设计要求,在满足高效操作的同时,最大程度地消除了数据冗余。系统数据库采用SQLite Library实现,这是因为轻量级关系型数据库SQLite能够和WPF框架紧密结合,并且与Mysql、PostgreSQL等数据库相比,占用资源非常低,处理速度更快。
场景数据库主要负责保存系统中预包含的多套场景数据文件,同时可以保存用户拓展的新场景数据文件。场景数据库受场景控制模块和场景拓展接口模块的控制和管理,场景控制模块可根据需要加载场景数据库中的场景数据文件,可删除场景数据库中保存的场景,而场景拓展接口模块可向场景数据库中添加一套或多套新场景。场景数据库中预包含了针对言语障碍儿童康复训练场景,包括相关音视频文件和数据文件。
在本发明实施例中,调度模块属于逻辑控制层的主要功能模块之一,其主要负责对语音识别模块的初始化、加载、调用、释放以及对评价模块的调用和控制。同时,调度模块还与位于逻辑控制层之上的用户界面层进行双向通信,一方面从用户界面层接收用户在所选择的场景下输入的任意语音信息,一方面将识别结果和评价结果反馈至用户界面层。识别调度模块的主要调度对象为语音识别模块、评价模块以及系统数据库中与识别结果和评价结果相关的数据表。例如,调度模块调用语音识别模块对用户在所选择的场景下输入的任意语音信息进行语音识别。本发明实施例提供的调度模块工作流程如附图2所示,具体包括:在系统初始化阶段,调度模块初始化语音识别模块并加载语音识别模块入系统内存中(步骤S201)。加载完成后,调度模块等待用户界面层是否产生新的识别任务(步骤S202)。若用户进行一次训练并完成录音后,用户界面层将产生一次新的识别任务,并将任务相关信息写入系统数据库中,任务相关信息包含了此次识别任务中需要与逻辑控制层进行通信的完整信息。此时,调度模块将连接系统数据库并获取新的任务相关信息(步骤S203),调用语音识别模块对用户输入的语音信息进行识别是否成功(步骤S204)。若识别成功,则将识别结果回写至系统数据库的识别结果表中(步骤S206),若识别失败,则向用户界面层反馈失败信息(步骤S205)。接着,调度模块调用评价模块对得到的识别结果进行评价是否成功(步骤S207),若评价成功,则将评价结果回写至系统数据库的评价结果表中(步骤S208),若评价失败,则向用户界面层反馈失败信息(步骤S205)。最后,调度模块通知用户界面层完成识别任务的识别和评价(步骤S209),并恢复等待状态,直至新的识别任务产生。
需要说明的是,在本发明实施例中,“用户”包括两类,一类是被训练用户,一类是系统管理员用户。被训练用户为主要用户,例如,步骤S101中提到的用户,系统的主要功能即语言训练为面向被训练用户设计,系统管理员用户主要对系统的场景进行管理,可新增场景和删除系统中现有的场景。系统将两类用户区别设计的目的在于区分用户权限以提高系统的可靠性和数据安全性。被训练用户登录系统后,根据系统给出的训练场景列表,结合训练需求,选择一个场景进行语言训练。被训练用户通过收听和收看系统的提示,并按照系统要求完成语音录制,与系统进行语音交互。在完成一条语音录制后,系统会实时地给出识别结果和评价结果,用户可通过查看结果来修正语言表述上存在的问题。系统管理员用户登录系统后,可对系统的场景数据库进行管理,包括通过拓展场景接口向场景数据库中添加新的场景,或对目前场景数据库中包含的场景进行删除和修改。系统管理员用户还可对系统的注册用户进行管理,可向系统用户注册表中添加新的被训练用户的账户,或者对系统当前的账户进行删除和修改等等。
S102,语音识别模块对任意语音信息进行识别,向评价模块输入识别结果。
在本发明实施例中,语音识别模块即语音识别引擎,由一系列稳健的语音识别算法实现,主要负责对用户输入的待识别语音信息进行语音识别,并得到文本形式的识别结果。具体地,语音识别模块采用基于大规模连续语音识别的解码系统,其中,声学模型采用基于隐马尔科夫模型的声学模型,语言模型采用的是基于N元文法的语言模型。对于用户输入的任意语音信息即文本无关的口语表述,由于未知表述内容,因此,对任意语音信息采用直接解码、基于最大线性似然回归的非监督性自适应、二次解码等处理,其中,解码时采用多遍解码技术以提高识别率。
需要说明的是,在本发明实施例中,语音识别模块受调度模块控制,与调度模块进行双向数据通信,接收调度模块发送的待识别的任意语音信息,并将识别结果反馈至调度模块。
S103,评价模块根据识别结果对任意语音信息进行语义规范度的评价,以及根据所述识别结果和与场景对应的场景数据对所述任意语音信息进行内容完整度和内容准确度的评价,对所述语义规范度、内容完整度和内容准确度的评价结果进行加权得到综合评价结果。
在本发明实施例中,评价模块主要负责从内容完整度、内容准确度和语义规范度等多方面对识别模块得到的识别结果进行评价,并根据识别结果评价算法得出评价结论。评价模块受调度模块控制,从识别模块接收对用户在所选择的场景下输入的任意语音信息的识别结果作为输入,并将评价结果反馈至调度模块。
在本发明一个实施例中,评价模块根据所述识别结果对所述任意语音信息进行语义规范度的评价包括Sa1至Sa3:
Sa1,基于决策树的词性标注,获取语法规则。
具体地,使用基于决策树的词性标注,对大量日常语料进行标注,提取高频格式,获得日常语法规则。
Sa2,对识别结果进行词性标注以检测是否符合语法规则。
Sa3,若符合语法规则,则对所述识别结果进行加权以获得语义规范度的评价结果。
以言语康复训练这一场景的语义规范度评价为例。首先对识别结果进行词性标注,然后根据所获取的语法规则,进行词性标注以检测是否符合所述语法规则,最后使用一个通用的语言模型,计算语法无误的测试句子的困惑度(perplexity),取其倒数作分值,可分别表示为pex1、pex2、…、pexn,则语义规范度可通过计算各句的加权平均值得出,即,使用η1表示语义规范度,则pex1为:
在本发明另一实施例中,场景数据包括来自场景数据库的参考回答文本,相应地,评价模块根据识别结果和与场景对应的场景数据对任意语音信息进行内容完整度的评价包括Sb1至Sb3:
Sb1,依次计算识别结果中词语与参考回答文本中词语之间的相似度得分、所述识别结果中词语与所述参考回答文本中参考要点Ti句子之间的相似度得分以及所述识别结果中句子与所述参考回答文本中参考要点Ti句子之间的相似度得分。
Sb2,取识别结果中句子与参考回答文本中参考要点Ti句子之间的相似度得分中的最高得分作为识别结果中句子与所述参考要点Ti的相似度得分scorei。
在本发明实施例中,相似度得分scorei作为计算完整度评价结果的主要元素,并且认定参考要点的相似度得分scorei大于某个阈值时,该参考要点作为识别出的要点。统计出所有识别出的要点,对没有识别出的要点进行反馈,可以让用户再次表述。
以言语康复训练这一场景的内容完整度评价为例,在得到语音识别结果后,首先接着计算识别结果中的每一个单词与参考回答文本中词语之间的相似度得分,接着计算识别结果中的每一个单词(设为ω)与参考要点中的文本(设为T)的相似度得分,该相似度得分使用scorew(w,T)表示。然后将识别结果句子A的文本中所有单词与参考要点中的文本T之间语义相似度得分的总和作为两个文本的相似度得分,该相似度得分使用scoresumT(A,T)表示。计算出识别结果每一句的文本与各个参考要点的文本之间的相似度得分,取最大相似度的句子得分作为对应参考要点的相似度得分,并且认定此时的参考要点文本为识别出的要点。假设参考要点文本与其本身的相似度可表示为Mi(i为对应的参考要点),该参考要点与识别结果中对应句子文本的相似度以scorei表示,则内容完整度评价结果可通过各参考要点和识别结果中其对应的句子的相似度与各参考要点和其自身的相似度的商的总和得到,即内容完整度的评价结果使用η2表示,则η2为:
在本发明另一实施例中,场景数据包括来自场景数据库的关键词文本,相应地,评价模块根据识别结果和与场景对应的场景数据对任意语音信息进行内容准确度的评价包括Sc1至Sc3:
Sc1,计算识别结果中关键词与关键词文本中参考要点关键词之间的相似度得分。
Sc2,取识别结果中关键词与关键词文本中参考要点Pi关键词之间的相似度得分中的最高得分作为所述识别结果中关键词与所述参考要点Pi的相似度得分。
Sc3,对识别结果中所有关键词与关键词文本中所有参考要点关键词之间的相似度得分进行加权平均,将所述加权平均的值作为内容准确度的评价结果。
以言语康复训练场景的准确度评价为例。在得到对用户在所选择的场景下输入的任意语音信息进行语音识别的识别结果后,对识别结果进行关键词提取,然后计算识别结果的所有关键词与参考要点关键词的相似度。内容准确度可通过识别得到的所有关键词与各个参考要点关键词相似度与参考要点关键词自身相似度的商的总和得出。假设计算出各个参考要点关键词的相似度分别为Ui(i为识别结果的关键词的数目),参考要点关键词自身的相似度为βi,则内容准确度的评价结果以η3表示时,η3为:
在获得了语义规范度、内容完整度和内容准确度的评价结果后,可以对语义规范度、内容完整度和内容准确度的评价结果进行加权得到综合评价结果。具体地,准备一组数量足够、其分布能反映总体状况的数据,并对它们进行专业的人工评价,接着使用多元线性回归算法计算语义规范度、内容完整度和内容准确度三部分的权重,然后使用这些权重,将语义规范度、内容完整度和内容准确度的评价结果加权求和得到的综合评价结果作为表述质量反馈给用户。
以言语康复训练这一场景的综合评价为例。在得到语义规范度、内容完整度和内容准确度的评价结果(这三个评价结果分别以η1、η2和η3表示)的基础上,结合使用多元线性回归算法得到的语义规范度、内容完整度和内容准确度三部分的权重(这三个权重分别以λ1、λ2和λ3表示),对语义规范度、内容完整度和内容准确度三部分进行加权求和,得到的综合评价结果以η表示,则η为η=λ1η1+λ2η2+λ3η3。
S104,调度模块将识别结果和综合评价结果反馈给用户。
如前所述,调度模块可以与用户界面层通信,而用户界面层负责系统与用户的交互。当调度模块将识别结果和综合评价结果反馈至用户界面层时,用户界面层向用户呈现这些结果。
从上述本发明实施例提供的自适应语言训练方法可知,一方面,由于调度模块可以调用语音识别模块对用户在所选择的场景下输入的任意语音信息进行语音识别,因此,用户无需按照系统预定义的文本进行语言表述即可进行自发性语言表述,系统在对用户表述进行评价时只需获得参考回答文本和期望关键词文本即可,也因为无需限定用户表述的内容,因此能全面地对用户的理解、表达与运用语言能力进行有针对性的训练,另一方面,由于评价模块可以根据识别结果对任意语音信息进行语义规范度的评价,以及根据识别结果和与场景对应的场景数据对所述任意语音信息进行内容完整度和内容准确度的评价,因此,相比音素和声学层面的朗读性语言表述训练,能够更加客观、准确地反映用户的语言运用能力,更有利于提高用户的语言表述能力。
本发明实施例提供的自适应语言训练还包括:对场景进行管理和控制,以及对外提供向系统数据库和场景数据库增加新场景时的接口,其中,对场景进行管理和控制由场景控制模块来实现,对外提供向系统数据库和场景数据库增加新场景时的接口由场景拓展接口模块来实现。
首先说明场景控制模块的实现过程。在系统初始化时,场景控制模块进行自身初始化(步骤S301),并读取数据库中场景相关的数据表内容,对场景数据库进行场景文件完整性检查等初始化。初始化完成后,场景控制模块将系统中可用的训练场景列表反馈给用户界面层(步骤S302),供用户选择。判断用户是否选定一个训练场景(步骤S303),在用户判断用户选定一个训练场景后,场景控制模块读取场景数据库中此场景对应的数据并加载场景数据库中的场景文件(步骤S304)。加载完成后,即进入训练过程(步骤S305),上述场景控制流程如附图3所示。在训练过程中,场景控制模块需要对场景内部的提示进行控制和切换。首先,在开始训练前,对当前场景环境进行必要的说明(步骤S401)。然后,进入提示循环,进行下一条提示(步骤S402)。在完成一条提示后,场景控制模块等待是否有来自用户界面层的任意语音信息输入(步骤S403)。若有,则创建新的识别任务(步骤S404),否则,超时反馈,进行下一条提示(步骤S402)。新的识别任务驱动语音识别模块对任意语音信息进行识别和驱动评价模块对识别结果进行评价。场景控制模块等待识别和评价是否完成(步骤S405)。若识别和评价完成,则将结果反馈给用户界面层(步骤S406),用户界面层最终将结果反馈给用户,否则,超时反馈,进行下一条提示(步骤S402)。场景控制模块对综合评价结果是否达到预设标准进行判断(步骤S407),若评价模块给出的综合评价结果达到预设标准,则场景控制模块将对提示进行切换,即进入提示循环,进行下一条提示(步骤S402);若综合评价结果未达到预设标准,则场景控制模块将再次进行提示,并增加关键词和短语的提示数量(步骤S408),直到提示出参考答案,上述训练流程如附图4所示。
以下对场景拓展接口模块的实现进行说明。当系统管理员用户通过场景拓展接口添加新的场景时,场景拓展接口模块首先检查系统管理员用户提供的文件夹路径是否合法(步骤S501),若不合法,则向用户界面层反馈失败信息(步骤S502)。接着,场景拓展接口模块对文件夹内的场景文件数量和格式进行检查(步骤S503),场景文件包括文本和音(视)频文件。对系统管理员用户提供的所有文本文件,场景拓展接口模块逐一进行解析(步骤S504),以检查文本内容是否符合标准(步骤S505)。若有文本内容不合法,则场景拓展接口模块将尝试进行修正(步骤S506)。若修正失败,则向用户界面层反馈失败信息(步骤S502),若修正成功,场景拓展接口模块将在场景数据库中的场景记录表中创建一条新的场景记录(步骤S507),同时,将之前解析的文本内容添加入场景数据库的场景数据表中(步骤S508)。最后,场景拓展接口模块将场景文件统一命名后,添加入场景数据库中保存(步骤S509)。上述场景拓展接口模块实现场景拓展的过程如附图5所示。
下面对用于执行上述自适应语言训练方法的本发明实施例的自适应语言训练平台进行说明,其基本逻辑结构参考附图6。为了便于说明,附图6示例的自适应语言训练平台仅仅示出了与本发明实施例相关的部分,主要包括调度模块601、语音识别模块602和评价模块603,各模块详细说明如下:
调度模块601,用于调用语音识别模块602对用户在所选择的场景下输入的任意语音信息进行语音识别;
语音识别模块602,用于对所述任意语音信息进行识别,向评价模块603输入识别结果;
评价模块603,用于根据识别结果对任意语音信息进行语义规范度的评价,以及根据识别结果和与场景对应的场景数据对任意语音信息进行内容完整度和内容准确度的评价,对所述语义规范度、内容完整度和内容准确度的评价结果进行加权得到综合评价结果;
调度模块601还用于将识别结果和综合评价结果反馈给用户。
需要说明的是,以上附图6示例的自适应语言训练平台的实施方式中,各功能模块的划分仅是举例说明,实际应用中可以根据需要,例如相应硬件的配置要求或者软件的实现的便利考虑,而将上述功能分配由不同的功能模块完成,即将所述自适应语言训练平台的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。而且,实际应用中,本实施例中的相应的功能模块可以是由相应的硬件实现,也可以由相应的硬件执行相应的软件完成,例如,前述的调度模块,可以是具有执行前述调用语音识别模块对用户在所选择的场景下输入的任意语音信息进行语音识别的硬件,例如调度器,也可以是能够执行相应计算机程序从而完成前述功能的一般处理器或者其他硬件设备;再如前述的语音识别模块,可以是具有执行前述对任意语音信息进行识别,向评价模块(或评价器)输入识别结果功能的硬件,例如语音识别器,也可以是能够执行相应计算机程序从而完成前述功能的一般处理器或者其他硬件设备(本说明书提供的各个实施例都可应用上述描述原则)。
附图6示例的自适应语言训练平台中,评价模块603可以包括获取单元701、检测单元702和加权单元703,如附图7所示本发明另一实施例提供的自适应语言训练平台,其中:
获取单元701,用于基于决策树的词性标注,获取语法规则;
检测单元702,用于对识别结果进行词性标注以检测是否符合所述语法规则;
加权单元703,用于若检测单元702的检测结果为符合所述语法规则,则对所述识别结果进行加权以获得所述语义规范度的评价结果。
附图6示例的自适应语言训练平台中,场景数据包括来自场景数据库的包括参考回答文本,评价模块603可以包括第一计算单元801、第一确定单元802和第二计算单元803,如附图8所示本发明另一实施例提供的自适应语言训练平台,其中:
第一计算单元801,用于依次计算识别结果中词语与所述参考回答文本中词语之间的相似度得分、所述识别结果中词语与所述参考回答文本中参考要点Ti句子之间的相似度得分以及所述识别结果中句子与所述参考回答文本中参考要点Ti句子之间的相似度得分;
第一确定单元802,用于取所述识别结果中句子与所述参考回答文本中参考要点Ti句子之间的相似度得分中的最高得分作为所述识别结果中句子与所述参考要点Ti的相似度得分scorei;
附图6示例的自适应语言训练平台中,场景数据包括来自场景数据库的关键词文本,评价模块603可以包括第三计算单元901、第二确定单元902和平均值求取单元903,如附图9所示本发明另一实施例提供的自适应语言训练平台,其中:
第三计算单元901,用于计算识别结果中关键词与关键词文本中参考要点关键词之间的相似度得分;
第二确定单元902,用于取识别结果中关键词与关键词文本中参考要点Pi关键词之间的相似度得分中的最高得分作为所述识别结果中关键词与所述参考要点Pi的相似度得分;
平均值求取单元903,用于对识别结果中所有关键词与关键词文本中所有参考要点关键词之间的相似度得分进行加权平均,将所述加权平均的值作为所述内容准确度的评价结果。
附图6至附图9任一示例的自适应语言训练平台还可以包括场景控制模块1001和场景拓展接口模块1002,如附图10-a至附图10-d所示本发明另一实施例提供的自适应语言训练平台,其中:
场景控制模块1001,用于对场景进行管理和控制;
场景拓展接口模块1002,用于对外提供向系统数据库和场景数据库增加新场景时的接口。
附图11是对应于附图6示例的自适应语言训练平台时,本发明实施例提供的系统软件架构示意图,其为三层设计,其中,用户界面层为最上层,逻辑控制层包括调度模块601、场景控制模块1001和场景拓展接口模块1002,核心处理层包括语音识别模块602、评价模块603、系统数据库1101和场景数据库1102,各层、模块或数据库均已在前述实施例中进行过说明,此处不再赘述。
需要说明的是,上述平台各模块/单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,其带来的技术效果与本发明方法实施例相同,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁盘或光盘等。
以上对本发明实施例所提供的自适应语言训练方法和平台进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种自适应语言训练方法,其特征在于,所述方法包括:
调度模块调用语音识别模块对用户在所选择的场景下输入的任意语音信息进行语音识别;
所述语音识别模块对所述任意语音信息进行识别,向评价模块输入识别结果;
所述评价模块根据所述识别结果对所述任意语音信息进行语义规范度的评价,以及根据所述识别结果和与所述场景对应的场景数据对所述任意语音信息进行内容完整度和内容准确度的评价,对所述语义规范度、内容完整度和内容准确度的评价结果进行加权得到综合评价结果;
所述调度模块将所述识别结果和综合评价结果反馈给所述用户。
2.根据权利要求1所述的方法,其特征在于,所述评价模块根据所述识别结果对所述任意语音信息进行语义规范度的评价,包括:
基于决策树的词性标注,获取语法规则;
对所述识别结果进行词性标注以检测是否符合所述语法规则;
若符合所述语法规则,则对所述识别结果进行加权以获得所述语义规范度的评价结果。
3.根据权利要求1所述的方法,其特征在于,所述场景数据包括参考回答文本,所述评价模块根据所述识别结果和与所述场景对应的场景数据对所述任意语音信息进行内容完整度的评价,包括:
依次计算所述识别结果中词语与所述参考回答文本中词语之间的相似度得分、所述识别结果中词语与所述参考回答文本中参考要点Ti句子之间的相似度得分以及所述识别结果中句子与所述参考回答文本中参考要点Ti句子之间的相似度得分;
取所述识别结果中句子与所述参考回答文本中参考要点Ti句子之间的相似度得分中的最高得分作为所述识别结果中句子与所述参考要点Ti的相似度得分scorei;
4.根据权利要求1所述的方法,其特征在于,所述场景数据包括关键词文本,所述评价模块根据所述识别结果和与所述场景对应的场景数据对所述任意语音信息进行内容准确度的评价,包括:
计算所述识别结果中关键词与所述关键词文本中参考要点关键词之间的相似度得分;
取所述识别结果中关键词与所述关键词文本中参考要点Pi关键词之间的相似度得分中的最高得分作为所述识别结果中关键词与所述参考要点Pi的相似度得分;
对所述识别结果中所有关键词与所述关键词文本中所有参考要点关键词之间的相似度得分进行加权平均,将所述加权平均的值作为所述内容准确度的评价结果。
5.根据权利要求1至4任意一项所述的方法,其特征在于,所述方法还包括:
对场景进行管理和控制;以及
对外提供向系统数据库和场景数据库增加新场景时的接口。
6.一种自适应语言训练平台,其特征在于,所述平台包括调度模块、语音识别模块和评价模块;
所述调度模块,用于调用所述语音识别模块对用户在所选择的场景下输入的任意语音信息进行语音识别;
所述语音识别模块,用于对所述任意语音信息进行识别,向所述评价模块输入识别结果;
所述评价模块,用于根据所述识别结果对所述任意语音信息进行语义规范度的评价,以及根据所述识别结果和与所述场景对应的场景数据对所述任意语音信息进行内容完整度和内容准确度的评价,对所述语义规范度、内容完整度和内容准确度的评价结果进行加权得到综合评价结果;
所述调度模块还用于将所述识别结果和综合评价结果反馈给所述用户。
7.根据权利要求6所述的平台,其特征在于,所述评价模块包括:
获取单元,用于基于决策树的词性标注,获取语法规则;
检测单元,用于对所述识别结果进行词性标注以检测是否符合所述语法规则;
加权单元,用于若所述检测单元的检测结果为符合所述语法规则,则对所述识别结果进行加权以获得所述语义规范度的评价结果。
8.根据权利要求6所述的平台,其特征在于,所述场景数据包括参考回答文本,所述评价模块包括:
第一计算单元,用于依次计算所述识别结果中词语与所述参考回答文本中词语之间的相似度得分、所述识别结果中词语与所述参考回答文本中参考要点Ti句子之间的相似度得分以及所述识别结果中句子与所述参考回答文本中参考要点Ti句子之间的相似度得分;
第一确定单元,用于取所述识别结果中句子与所述参考回答文本中参考要点Ti句子之间的相似度得分中的最高得分作为所述识别结果中句子与所述参考要点Ti的相似度得分scorei;
9.根据权利要求6所述的平台,其特征在于,所述场景数据包括关键词文本,所述评价模块包括:
第三计算单元,用于计算所述识别结果中关键词与所述关键词文本中参考要点关键词之间的相似度得分;
第二确定单元,用于取所述识别结果中关键词与所述关键词文本中参考要点Pi关键词之间的相似度得分中的最高得分作为所述识别结果中关键词与所述参考要点Pi的相似度得分;
平均值求取单元,用于对所述识别结果中所有关键词与所述关键词文本中所有参考要点关键词之间的相似度得分进行加权平均,将所述加权平均的值作为所述内容准确度的评价结果。
10.根据权利要求6至9任意一项所述的平台,其特征在于,所述平台还包括:
场景控制模块,用于对场景进行管理和控制;以及
场景拓展接口模块,用于对外提供向系统数据库和场景数据库增加新场景时的接口。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310627536.1A CN103605492B (zh) | 2013-11-28 | 2013-11-28 | 一种自适应语言训练方法和平台 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310627536.1A CN103605492B (zh) | 2013-11-28 | 2013-11-28 | 一种自适应语言训练方法和平台 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103605492A true CN103605492A (zh) | 2014-02-26 |
CN103605492B CN103605492B (zh) | 2016-08-17 |
Family
ID=50123723
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310627536.1A Active CN103605492B (zh) | 2013-11-28 | 2013-11-28 | 一种自适应语言训练方法和平台 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103605492B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105975631A (zh) * | 2016-06-03 | 2016-09-28 | 华东理工大学 | 一种用于数据集的数据使用质量的评估方法 |
CN106295792A (zh) * | 2016-08-05 | 2017-01-04 | 北京光年无限科技有限公司 | 基于多模型输出的对话数据交互处理方法及装置 |
CN106710337A (zh) * | 2016-12-20 | 2017-05-24 | 成都远策数码科技有限公司 | 一种用于教育平台的学习进度记录推送系统与方法 |
CN107818797A (zh) * | 2017-12-07 | 2018-03-20 | 苏州科达科技股份有限公司 | 语音质量评价方法、装置及其系统 |
CN108629975A (zh) * | 2018-05-24 | 2018-10-09 | 北京交通大学 | 高速公路交通流数据的质量评价方法 |
CN109615220A (zh) * | 2018-12-07 | 2019-04-12 | 浪潮通用软件有限公司 | 一种生成会计凭证转换规则评价的方法及装置 |
CN110309279A (zh) * | 2019-05-23 | 2019-10-08 | 平安国际智慧城市科技股份有限公司 | 基于语言模型的话语训练方法、装置及计算机设备 |
CN110413961A (zh) * | 2019-06-21 | 2019-11-05 | 平安国际智慧城市科技股份有限公司 | 基于分类模型进行文本评分的方法、装置和计算机设备 |
CN111984766A (zh) * | 2019-05-21 | 2020-11-24 | 华为技术有限公司 | 缺失语义补全方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070015121A1 (en) * | 2005-06-02 | 2007-01-18 | University Of Southern California | Interactive Foreign Language Teaching |
CN102376182A (zh) * | 2010-08-26 | 2012-03-14 | 财团法人工业技术研究院 | 语言学习系统、语言学习方法及其程序产品 |
CN102509483A (zh) * | 2011-10-31 | 2012-06-20 | 苏州思必驰信息科技有限公司 | 一种口语考试的分布式自动评分系统及其方法 |
CN102663925A (zh) * | 2012-05-09 | 2012-09-12 | 长春大学 | 面向听障儿童语训的舌部训练方法及其系统 |
CN103198828A (zh) * | 2013-04-03 | 2013-07-10 | 中金数据系统有限公司 | 语音语料库的构建方法和系统 |
-
2013
- 2013-11-28 CN CN201310627536.1A patent/CN103605492B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070015121A1 (en) * | 2005-06-02 | 2007-01-18 | University Of Southern California | Interactive Foreign Language Teaching |
CN102376182A (zh) * | 2010-08-26 | 2012-03-14 | 财团法人工业技术研究院 | 语言学习系统、语言学习方法及其程序产品 |
CN102509483A (zh) * | 2011-10-31 | 2012-06-20 | 苏州思必驰信息科技有限公司 | 一种口语考试的分布式自动评分系统及其方法 |
CN102663925A (zh) * | 2012-05-09 | 2012-09-12 | 长春大学 | 面向听障儿童语训的舌部训练方法及其系统 |
CN103198828A (zh) * | 2013-04-03 | 2013-07-10 | 中金数据系统有限公司 | 语音语料库的构建方法和系统 |
Non-Patent Citations (1)
Title |
---|
刘晓千: "《一种应用虚拟发音头像的普通话聋儿言语康复系统》", 《集成技术》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105975631A (zh) * | 2016-06-03 | 2016-09-28 | 华东理工大学 | 一种用于数据集的数据使用质量的评估方法 |
CN106295792A (zh) * | 2016-08-05 | 2017-01-04 | 北京光年无限科技有限公司 | 基于多模型输出的对话数据交互处理方法及装置 |
CN106295792B (zh) * | 2016-08-05 | 2019-08-20 | 北京光年无限科技有限公司 | 基于多模型输出的对话数据交互处理方法及装置 |
CN106710337A (zh) * | 2016-12-20 | 2017-05-24 | 成都远策数码科技有限公司 | 一种用于教育平台的学习进度记录推送系统与方法 |
CN107818797A (zh) * | 2017-12-07 | 2018-03-20 | 苏州科达科技股份有限公司 | 语音质量评价方法、装置及其系统 |
CN108629975A (zh) * | 2018-05-24 | 2018-10-09 | 北京交通大学 | 高速公路交通流数据的质量评价方法 |
CN108629975B (zh) * | 2018-05-24 | 2020-09-15 | 北京交通大学 | 高速公路交通流数据的质量评价方法 |
CN109615220A (zh) * | 2018-12-07 | 2019-04-12 | 浪潮通用软件有限公司 | 一种生成会计凭证转换规则评价的方法及装置 |
CN111984766A (zh) * | 2019-05-21 | 2020-11-24 | 华为技术有限公司 | 缺失语义补全方法及装置 |
CN110309279A (zh) * | 2019-05-23 | 2019-10-08 | 平安国际智慧城市科技股份有限公司 | 基于语言模型的话语训练方法、装置及计算机设备 |
CN110413961A (zh) * | 2019-06-21 | 2019-11-05 | 平安国际智慧城市科技股份有限公司 | 基于分类模型进行文本评分的方法、装置和计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
CN103605492B (zh) | 2016-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103605492A (zh) | 一种自适应语言训练方法和平台 | |
US11113475B2 (en) | Chatbot generator platform | |
US10417581B2 (en) | Question answering system-based generation of distractors using machine learning | |
US11010700B2 (en) | Identifying task and personality traits | |
US11586815B2 (en) | Method, system and computer program product for generating artificial documents | |
Bogers et al. | A study of usage and usability of intelligent personal assistants in Denmark | |
Karakus et al. | Call center performance evaluation using big data analytics | |
CN113627194B (zh) | 信息抽取方法及装置、通信消息分类方法及装置 | |
McTear et al. | Evaluating the conversational interface | |
Elvir et al. | Remembering a conversation–a conversational memory architecture for embodied conversational agents | |
CN111933118B (zh) | 进行语音识别优化的方法、装置及应用其的智能语音对话系统 | |
US10970490B2 (en) | Automatic evaluation of artificial intelligence-based processes | |
CN110047473A (zh) | 一种人机协作交互方法及系统 | |
CN109979458A (zh) | 基于人工智能的新闻采访稿自动生成方法及相关设备 | |
US20220405487A1 (en) | Causal Knowledge Identification and Extraction | |
KR20220042103A (ko) | 하이브리드 지능형 고객 상담장치 및 방법 | |
Salamin et al. | Admission chatbot | |
Khullar et al. | Early Results from Automating Voice-based Question-Answering Services Among Low-income Populations in India | |
JP6599534B1 (ja) | 情報処理装置、情報処理方法及びプログラム | |
Shmueli | A tale of two macro-F1’s | |
US20230419045A1 (en) | Generating goal-oriented dialogues from documents | |
Griol et al. | A comparison between dialog corpora acquired with real and simulated users | |
RU2744063C1 (ru) | Способ и система определения говорящего пользователя управляемого голосом устройства | |
US20230359765A1 (en) | Protecting sensitive personal information in spoken commands | |
Harshani | Sinhala chatbot for train information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |