CN109376360B - 一种辅助学习语言的方法和装置 - Google Patents

一种辅助学习语言的方法和装置 Download PDF

Info

Publication number
CN109376360B
CN109376360B CN201811270842.3A CN201811270842A CN109376360B CN 109376360 B CN109376360 B CN 109376360B CN 201811270842 A CN201811270842 A CN 201811270842A CN 109376360 B CN109376360 B CN 109376360B
Authority
CN
China
Prior art keywords
sentence
user
word
language
conforming
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811270842.3A
Other languages
English (en)
Other versions
CN109376360A (zh
Inventor
魏誉荧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Genius Technology Co Ltd
Original Assignee
Guangdong Genius Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Genius Technology Co Ltd filed Critical Guangdong Genius Technology Co Ltd
Priority to CN201811270842.3A priority Critical patent/CN109376360B/zh
Publication of CN109376360A publication Critical patent/CN109376360A/zh
Application granted granted Critical
Publication of CN109376360B publication Critical patent/CN109376360B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供一种辅助学习语言的方法和装置,其包括:获取用户的第一语句进行词性标注,将所述第一语句的第一词语转换为符合相应词性类别的组合正则式的第二词语;提取所述第二词语的词性,对所述第一语句进行重新组合,生成符合语言规范的第二语句,将所述第一语句与所述第二语句关联,生成关联关系特征;根据所述关联关系特征进行模型训练,得到所述用户的语句对应关系模型库;使用所述用户的语句对应关系模型库,对所述用户的真实语料进行关联转化,生成第三语句进行语义理解;纠正所述真实语料的错误用词和句式,反馈给用户。本发明能够有针对性地识别小学生真实语料的用语错误,训练其改变错误用语习惯,有利于其更好地掌握一门语言。

Description

一种辅助学习语言的方法和装置
技术领域
本发明涉及学习机领域,尤指一种辅助学习语言的方法和装置。
背景技术
随着科学技术的发展,通过计算机进行语言学习成为人类学习语言的重要途径。在真人师资有限及地域限制的情况下,学习者可以通过计算机,不受时间地域限制地进行语言学习,降低学习障碍。通过计算机进行语言学习需要人类和计算机进行语言交流,这也就是要求计算机能够“理解”人类语言的真实语义。
一方面,传统的学习机通过请专业人士针对特定语言教材录制语音文件。然后,当语言学习者在语言学习系统中依据预先安排的教材来发出语音时,语言学习系统会比对专业人士所录制的语音文件及语言学习者的语音以分析出之间的差异来进行评分。另外有些语言学习系统则是侦测学习者发音的某些物理特性,再根据语言学习理论给予反馈。这些发音评量上通常只提供权重式的整体评量与单一分数或是简单的比对结果,学习者并无法从此获得足够的错误相关信息以及相对应的纠正方式。另一方面,未经过正规语言训练的人在说话时,可能会出现语法、语序、用词等错误。这类错误在小学生群体中表现的更频繁,小学生处在初学语言阶段中,说话的语句经常会不符合正常的语言顺序和逻辑,导致传统学习机对其真实语义的识别产生错乱,影响最终的结果输出。
因此,发明一种辅助学习语言的方法和装置,解决传统学习机对小学生学习语言时存在的识别不准确、反馈不清晰的问题,成为学习机技术发展的需要。
发明内容
本发明提供一种辅助学习语言的方法和装置,能够针对小学生群体的语音发音习惯和特点,准确识别小学生语句的真实语义,建立用户的真实语料对应语义模型库,对小学生原始语料进行分析纠错,并引导其完成正确语句训练学习。
本发明提供的技术方案如下:
本发明提供一种辅助学习语言的方法,包括步骤:
获取用户的第一语句进行词性标注,将所述第一语句的第一词语转换为符合相应词性类别的组合正则式的第二词语;
提取所述第二词语的词性,对所述第一语句进行重新组合,生成符合语言规范的第二语句,将所述第一语句与所述第二语句关联,生成关联关系特征;
根据所述第一语句和所述第二语句关联关系特征进行模型训练,得到所述用户的语句对应关系模型库;
使用所述用户的语句对应关系模型库,对所述用户的真实语料进行关联转化,生成第三语句进行语义理解;
纠正所述真实语料的错误用词和句式,反馈给用户。
具体地,在对小学生语句进行理解时,首先将其语句进行分词,拆分成若干个第一词语,然后对第一词语进行正则式转化,调整成相应词性类别的第二词语;然后根据调整后的第二词语词性,以及符合语言规范的语法,对语句进行重新组合,生成第二语句。此时将小学生的第一语句和转化后的第二语句进行关联,即可获得小学生的一组语句关联关系特征。统计收集所有获得的语句关联关系特征,对这些特征进行模型训练,即可获得特定小学生的语句对应关系模型库。如此,便完成了学习机对小学生用户的原始语句的理解,当小学生的再向学习机输入真实语料时,其语句的真实含义通过对应关系模型库被学习机理解。学习机理解真实语料的语义之后,生成符合标准语法规范的第三语句,将第三语句和真实语料对比,提示小学生语句的错误点,并对其进行规范的第三语句训练。如此,实现学习机对特定小学生的用语习惯学习、模型库建立、真实语义识别、智能纠错等功能。
进一步地,本发明提供一种辅助学习语言的方法,所述获取用户的第一语句包括步骤:
获取所述用户的第一语句的文本信息;
获取所述用户的第一语句的第一句式。
具体地,在获取小学生用户的第一语句的第一词语时,获取所述用户的第一语句的文本信息以及第一句式。文本信息可以是小学生用户通过手写等方式输入学习机的。第一句式指小学生用户输入学习机的第一文本信息中使用的语法句式。本发明适用于小学生用户手写输入时,获取第一语句的第一词语和第一句式等信息。
进一步地,本发明提供一种辅助学习语言的方法,所述获取所述用户的第一语句的文本信息包括步骤:
获取所述用户的第一语音,识别所述第一语音并转化为文本信息。
具体地,在获取小学生用户的第一语句的第一词语时,获取所述用户的第一语句的文本信息。当小学生用户通过语音输入第一语句时,其输入的语音为第一语音。学习机通过对第一语音的识别转化,将第一语音转化为文本信息,进而从文本信息中的提取第一句式。本发明适用于小学生使用语音输入时,获取第一语句的文本信息、第一词语和第一句式等信息。
进一步地,本发明提供一种辅助学习语言的方法,所述生成符合语言规范的第二语句包括步骤:
提取所述第一语句中第一词语的词性,调整成符合语言规范的第二词组;
提取所述第一语句的第一句式,调整成符合语言规范的第二句式;
提取所述第二词语、所述第二词组、所述第二句式,调整成符合语言规范的第二语句。
具体地,在学习机进行小学生第一语句的理解、建模时,需要使用符合语言规范的第二语句作为关联关系语句,用以发掘两者的对应特征关系。本发明中,当小学生使用错误的词组输入第一语句时,调整所述词组为符合语言规范的第二词组,进而结合调整后的第二词语、第二词组、第二句式,生成第二语句。本发明使用于当小学生输入的第一语句中包含词组使用错误时,理解第一语句的真实语义,生成第二语句。
优选地,本发明中,使用汉语成语库、歇后语库作为对所述第一词组进行转化的参照语库,对小学生使用汉语成语、歇后语、常用词组等用词顺序的错误进行识别和纠正,实现帮助小学生正确使用汉语成语、歇后语、常用词组。
进一步地,本发明提供一种辅助学习语言的方法,所述纠正所述真实语料的错误用词和句式,反馈给用户包括步骤:
通过语音、文本、图片形式输出所述纠正真实语料的错误用词和句式;和/或
引导所述当前用户进行所述符合语言规范的第三语句训练。
具体地,当学习机成功建立特定小学生的语句对应关系模型库后,对小学生输入的真实语料可以进行快速理解,通过理解后生成第三语句。将真实语料和第三语句的用词、句式区别反馈给小学生,告知其正确的语句,并向小学生发起第三语句训练提示,引导其进行第三语句的强化训练,以更正其错误的用语习惯。本发明可以实现对小学生的真实语料进行理解后,进一步引导其进行正确用语的训练,达到及时识别小学生用语错误,及时进行纠错训练的目的。
进一步地,本发明还提供一种辅助学习语言的装置,所述装置包括:
获取模块,获取用户的第一语句进行词性标注,将所述第一语句的第一词语转换为符合相应词性类别的组合正则式的第二词语;
关联模块,提取所述获取模块获取的第二词语的词性,对所述第一语句进行重新组合,生成符合语言规范的第二语句,将所述第一语句与所述第二语句关联,生成关联关系特征;
训练模块,根据所述关联模块生成的所述第一语句和所述第二语句关联关系特征进行模型训练,得到所述用户的语句对应关系模型库;
转化模块,获取用户真实语料,使用所述训练模块得到的对应关系模型库,对所述用户的真实语料进行关联转化,生成第三语句进行语义理解;
反馈模块,根据所述转化模块生成的语义理解纠正所述真实语料的错误用词和句式,反馈给用户。
进一步优选地,本发明还提供一种辅助学习语言的装置:
所述获取模块还用于获取所述用户的第一语句的文本信息;获取所述用户的第一语句的第一词语;获取所述用户的第一语句的第一句式;获取所述用户的真实语料。
进一步优选地,本发明还提供一种辅助学习语言的装置:
所述获取模块还用于获取用户第一语音;
所述获取模块包括一识别子模块,识别所述第一语音并转化为文本信息。
进一步优选地,本发明还提供一种辅助学习语言的装置,所述关联模块包括:
调整子模块,提取所述第一词语的词性,调整成符合语言规范的第二词组;提取所述第一句式,调整成符合语言规范的第二句式;提取所述第二词语、所述第二词组、所述第二句式,调整成符合语言规范的第二语句。
进一步优选地,本发明还提供一种辅助学习语言的装置,所述反馈模块包括:
纠错子模块,根据得到纠正后的第三语句,纠正所述用户真实语料的错误用词和句式;
输出子模块,通过语音、文本、图片形式输出所述第三语句;
引导子模块,引导所述当前用户进行所述符合语言规范的第三语句训练。
通过本发明提供的一种辅助学习语言的方法和装置,能够带来以下至少一种有益效果:
1、通过对小学生用户第一语句的学习和理解,建立特定小学生的语句关系对应模型,可以十分快速并且有针对性地识别小学生真实语料的用语错误。
2、通过对小学生进行规范的第三语句的提示以及提供规范的第三语句训练,可以及时纠正小学生真实预料的用词、句式、词组错误,进而通过及时的训练改变其错误的用语习惯,有利于小学生更好地掌握一门语言。
3、通过对小学生语音的采集和转化,可以非常方便的获取小学生的第一语句以及真实语料信息,方便小学生随时随地通过语音进行语言学习。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对一种辅助学习语言的方法和装置的上述特征、技术特征、优点及其实现方式予以进一步的说明。
图1是本发明一种辅助学习语言的方法的一个实施例的流程图;
图2是本发明一种辅助学习语言的方法的另一个实施例的流程图;
图3是本发明一种辅助学习语言的方法的又一个实施例的流程图;
图4是本发明一种辅助学习语言的方法的另一个实施例的流程图;
图5是本发明一种辅助学习语言的方法的又一个实施例的流程图;
图6是本发明一种辅助学习语言的方法的另一个实施例的流程图;
图7是本发明一种辅助学习语言的装置的一个实施例的结构示意图;
图8是本发明一种辅助学习语言的装置的另一个实施例的结构示意图;
图9是本发明一种辅助学习语言的装置的又一个实施例的结构示意图。
附图标号说明:
10 获取模块
11 识别子模块
20 关联模块
21 调整子模块
30 训练模块
40 转化模块
50 反馈模块
51 纠错子模块
52 输出子模块
52 引导子模块
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
传统的学习机通过请专业人士针对特定语言教材录制语音文件。然后,当语言学习者在语言学习系统中依据预先安排的教材来发出语音时,语言学习系统会比对专业人士所录制的语音文件及语言学习者的语音以分析出之间的差异来进行评分。另外有些语言学习系统则是侦测学习者发音的某些物理特性,再根据语言学习理论给予反馈。这些发音评量上通常只提供权重式的整体评量与单一分数或是简单的比对结果,学习者并无法从此获得足够的错误相关信息以及相对应的矫正方式。另一方面,未经过正规语言训练的人在说话时,可能会出现语法、语序、用词等错误。这类错误在小学生群体中表现的更频繁,小学生处在初学语言阶段中,说话的语句经常会不符合正常的语言顺序和逻辑,导致传统学习机对其真实语义的识别产生错乱,影响最终的结果输出。
为了解决传统学习机对小学生学习语言时存在的识别不准确、反馈不清晰的问题,本发明提供一种辅助学习语言的方法和装置。
本发明第一实施例如图1所示,提供一种辅助学习语言的方法,包括步骤:
S100获取用户的第一语句进行词性标注,将所述第一语句的第一词语转换为符合相应词性类别的组合正则式的第二词语;
S200提取所述第二词语的词性,对所述第一语句进行重新组合,生成符合语言规范的第二语句,将所述第一语句与所述第二语句关联,生成关联关系特征;
S300根据所述第一语句和所述第二语句关联关系特征进行模型训练,得到所述用户的语句对应关系模型库;
S400使用所述用户的语句对应关系模型库,对所述用户的真实语料进行关联转化,生成第三语句进行语义理解;
S500纠正所述真实语料的错误用词和句式,反馈给用户。
在第一实施例的应用场景中,例如小学生输入第一语句为“饭我吃要。”
通过S100获取“饭吃”、“我”“要”等第一词语,将其对应转化为“吃饭”、“我”、“要”等第二词语。
通过S200提取“吃饭”、“我”、“要”等第二词语的对应词性为动词、名词、能愿动词,符合语言规范的第二语句的语式为名词主语、能愿动词谓语、动词谓语,即是说,生成的第二语句为“我要吃饭。”下一步,生成第一语句“饭我吃要”与第二语句“我要吃饭”的关联关系特征。
通过S300,将多个上述第一语句和第二语句关联关系特征进行模型训练,得到所述用户的语句对应关系模型库;
在小学生用户再次输入真实语料“饭我吃要”时,立即通过S400提取改小学生用户的语句对应关系模型库,查找生成其对应第三语句为“我要吃饭”。
完成S400后,通过S500向小学生用户输出第三语句“我要吃饭”。
具体地,在对小学生语句进行理解时,首先将其语句进行分词,拆分成若干个第一词语,然后对第一词语进行正则式转化,调整成相应词性类别的第二词语;然后根据调整后的第二词语词性,以及符合语言规范的语法,对语句进行重新组合,生成第二语句。此时将小学生的第一语句和转化后的第二语句进行关联,即可获得小学生的一组语句关联关系特征。统计收集所有获得的语句关联关系特征,对这些特征进行模型训练,即可获得特定小学生的语句对应关系模型库。如此,便完成了学习机对小学生用户的原始语句的理解,当小学生的再向学习机输入真实语料时,其语句的真实含义通过对应关系模型库被学习机理解。学习机理解真实语料的语义之后,生成符合标准语法规范的第三语句,将第三语句和真实语料对比,提示小学生语句的错误点,并对其进行规范的第三语句训练。如此,实现学习机对特定小学生的用语习惯学习、模型库建立、真实语义识别、智能纠错等功能。
本发明第二实施例如图2所示,提供一种辅助学习语言的方法,包括步骤:
S010获取所述用户的第一语句的文本信息;
S020获取所述用户的第一语句的第一句式;
S100获取用户的第一语句进行词性标注,将所述第一语句的第一词语转换为符合相应词性类别的组合正则式的第二词语;
S200提取所述第二词语的词性,对所述第一语句进行重新组合,生成符合语言规范的第二语句,将所述第一语句与所述第二语句关联,生成关联关系特征;
S300根据所述第一语句和所述第二语句关联关系特征进行模型训练,得到所述用户的语句对应关系模型库;
S400使用所述用户的语句对应关系模型库,对所述用户的真实语料进行关联转化,生成第三语句进行语义理解;
S500纠正所述真实语料的错误用词和句式,反馈给用户。
在第二实施例的应用场景中,例如小学生通过学习机的输入界面输入第一语句为“饭我吃要”。
通过S010获取输入界面输入的文本信息“饭我吃要”。
通过S020获取第一语句的第一句式为“宾语”-“主语”-“谓语”-“谓语”。
通过S100获取“饭吃”、“我”“要”等第一词语,将其对应转化为“吃饭”、“我”、“要”等第二词语。
通过S200提取“吃饭”、“我”、“要”等第二词语的对应词性为动词、名词、能愿动词,符合语言规范的第二语句的语式为名词主语、能愿动词谓语、动词谓语,即是说,生成的第二语句为“我要吃饭。”下一步,生成第一语句“饭我吃要”与第二语句“我要吃饭”的关联关系特征。
通过S300,将多个上述第一语句和第二语句关联关系特征进行模型训练,得到所述用户的语句对应关系模型库;
在小学生用户再次输入真实语料“饭我吃要”时,立即通过S400提取改小学生用户的语句对应关系模型库,查找生成其对应第三语句为“我要吃饭”。
完成S400后,通过S500向小学生用户输出第三语句“我要吃饭”。
具体地,在获取小学生用户的第一语句的第一词语时,获取所述用户的第一语句的文本信息以及第一句式。文本信息可以是小学生用户通过手写等方式输入学习机的。第一句式指小学生用户输入学习机的第一文本信息中使用的语法句式。本发明适用于小学生用户手写输入时,获取第一语句的第一词语和第一句式等信息。
本发明第三实施例如图3所示,提供一种辅助学习语言的方法,包括步骤:
S001获取所述用户的第一语音;
S002识别所述第一语音并转化为文本信息;
S020获取所述用户的第一语句的第一句式;
S100获取用户的第一语句进行词性标注,将所述第一语句的第一词语转换为符合相应词性类别的组合正则式的第二词语;
S200提取所述第二词语的词性,对所述第一语句进行重新组合,生成符合语言规范的第二语句,将所述第一语句与所述第二语句关联,生成关联关系特征;
S300根据所述第一语句和所述第二语句关联关系特征进行模型训练,得到所述用户的语句对应关系模型库;
S400使用所述用户的语句对应关系模型库,对所述用户的真实语料进行关联转化,生成第三语句进行语义理解;
S500纠正所述真实语料的错误用词和句式,反馈给用户。
在第三实施例的应用场景中,例如小学生通过学习机的录音设备输入第一语句为“饭我吃要”。
通过S001获取第一语音“饭我吃要”。
通过S002识别第一语音,识别第一语句对应的文本信息为“饭我吃要”。
通过S020获取第一语句的第一句式为“宾语”-“主语”-“谓语”-“谓语”。
通过S100获取“饭吃”、“我”“要”等第一词语,将其对应转化为“吃饭”、“我”、“要”等第二词语。
通过S200提取“吃饭”、“我”、“要”等第二词语的对应词性为动词、名词、能愿动词,符合语言规范的第二语句的语式为名词主语、能愿动词谓语、动词谓语,即是说,生成的第二语句为“我要吃饭。”下一步,生成第一语句“饭我吃要”与第二语句“我要吃饭”的关联关系特征。
通过S300,将多个上述第一语句和第二语句关联关系特征进行模型训练,得到所述用户的语句对应关系模型库;
在小学生用户再次输入真实语料“饭我吃要”时,立即通过S400提取改小学生用户的语句对应关系模型库,查找生成其对应第三语句为“我要吃饭”。
完成S400后,通过S500向小学生用户输出第三语句“我要吃饭”。
具体地,在获取小学生用户的第一语句的第一词语时,获取所述用户的第一语句的文本信息。当小学生用户通过语音输入第一语句时,其输入的语音为第一语音。学习机通过对第一语音的识别转化,将第一语音转化为文本信息,进而从文本信息中的提取第一句式。本发明适用于小学生使用语音输入时,获取第一语句的文本信息、第一词语和第一句式等信息。
本发明第四实施例如图4所示,提供一种辅助学习语言的方法,包括步骤:
S001获取所述用户的第一语音;
S002识别所述第一语音并转化为文本信息;
S020获取所述用户的第一语句的第一句式;
S100获取用户的第一语句进行词性标注,将所述第一语句的第一词语转换为符合相应词性类别的组合正则式的第二词语;
S210提取所述第一语句中第一词语的词性,调整成符合语言规范的第二词组;
S212提取所述第一语句的第一句式,调整成符合语言规范的第二句式;
S213提取所述第二词语、所述第二词组、所述第二句式,调整成符合语言规范的第二语句;
S220将所述第一语句与所述第二语句关联,生成关联关系特征;
S300根据所述第一语句和所述第二语句关联关系特征进行模型训练,得到所述用户的语句对应关系模型库;
S400使用所述用户的语句对应关系模型库,对所述用户的真实语料进行关联转化,生成第三语句进行语义理解;
S500纠正所述真实语料的错误用词和句式,反馈给用户。
在第四实施例的应用场景中,例如小学生通过学习机的录音设备输入第一语句为“饭我吃要虎狼吞咽”。
通过S001获取第一语音“饭我吃要虎狼吞咽地”。
通过S002识别第一语音,识别第一语句对应的文本信息为“饭我吃要虎狼吞咽地”。
通过S020获取第一语句的第一句式为“宾语”-“主语”-“谓语”-“谓语”-“状语”。
通过S100获取“饭吃”、“我”“要”等第一词语,将其对应转化为“吃饭”、“我”、“要”等第二词语。
通过S210提取所述第一语句中第一词语“虎狼吞咽地”的词性,调整成符合语言规范的第二词组“狼吞虎咽地”。
通过S212提取所述第一语句的第一句式“宾语”-“主语”-“谓语”-“谓语”-“状语”,调整成符合语言规范的第二句式“主语”-“谓语”-“状语”-“谓语”-“宾语”。
通过S213提取所述第二词语、所述第二词组、所述第二句式,调整成符合语言规范的第二语句“我要狼吞虎咽地吃饭”。
通过S220生成第一语句“饭我吃要虎狼吞咽地”与第二语句“我要狼吞虎咽地吃饭”的关联关系特征。
通过S300,将多个上述第一语句和第二语句关联关系特征进行模型训练,得到所述用户的语句对应关系模型库;
在小学生用户再次输入真实语料“饭我吃要虎狼吞咽地”时,立即通过S400提取改小学生用户的语句对应关系模型库,查找生成其对应第三语句为“我要狼吞虎咽地吃饭”。
完成S400后,通过S500向小学生用户输出第三语句“我要狼吞虎咽地吃饭”。
具体地,在学习机进行小学生第一语句的理解、建模时,需要使用符合语言规范的第二语句作为关联关系语句,用以发掘两者的对应特征关系。本发明中,当小学生使用错误的词组输入第一语句时,调整所述词组为符合语言规范的第二词组,进而结合调整后的第二词语、第二词组、第二句式,生成第二语句。本发明使用于当小学生输入的第一语句中包含词组使用错误时,理解第一语句的真实语义,生成第二语句。
优选地,本发明中,使用汉语成语库、歇后语库作为对所述第一词组进行转化的参照语库,对小学生使用汉语成语、歇后语、常用词组等用词顺序的错误进行识别和纠正,实现帮助小学生正确使用汉语成语、歇后语、常用词组。
本发明第五实施例如图5所示,提供一种辅助学习语言的方法,包括步骤:
S100获取用户的第一语句进行词性标注,将所述第一语句的第一词语转换为符合相应词性类别的组合正则式的第二词语;
S200提取所述第二词语的词性,对所述第一语句进行重新组合,生成符合语言规范的第二语句,将所述第一语句与所述第二语句关联,生成关联关系特征;
S300根据所述第一语句和所述第二语句关联关系特征进行模型训练,得到所述用户的语句对应关系模型库;
S400使用所述用户的语句对应关系模型库,对所述用户的真实语料进行关联转化,生成第三语句进行语义理解;
S500纠正所述真实语料的错误用词和句式,反馈给用户。
S510通过语音、文本、图片形式输出所述纠正真实语料的错误用词和句式;和/或
S520引导所述当前用户进行所述符合语言规范的第三语句训练。
在第五实施例的应用场景中,例如小学生输入第一语句为“饭我吃要。”
通过S100获取“饭吃”、“我”“要”等第一词语,将其对应转化为“吃饭”、“我”、“要”等第二词语。
通过S200提取“吃饭”、“我”、“要”等第二词语的对应词性为动词、名词、能愿动词,符合语言规范的第二语句的语式为名词主语、能愿动词谓语、动词谓语,即是说,生成的第二语句为“我要吃饭。”下一步,生成第一语句“饭我吃要”与第二语句“我要吃饭”的关联关系特征。
通过S300,将多个上述第一语句和第二语句关联关系特征进行模型训练,得到所述用户的语句对应关系模型库;
在小学生用户再次输入真实语料“饭我吃要”时,立即通过S400提取改小学生用户的语句对应关系模型库,查找生成其对应第三语句为“我要吃饭”。
完成S400后,通过S500向小学生用户输出第三语句“我要吃饭”。
通过S510,以语音、文本、图片形式输出第三语句“我要吃饭”。
通过S520引导所述当前小学生用户进行所述符合语言规范的第三语句“我要吃饭”训练。
具体地,当学习机成功建立特定小学生的语句对应关系模型库后,对小学生输入的真实语料可以进行快速理解,通过理解后生成第三语句。将真实语料和第三语句的用词、句式区别反馈给小学生,告知其正确的语句,并向小学生发起第三语句训练提示,引导其进行第三语句的强化训练,以更正其错误的用语习惯。本发明可以实现对小学生的真实语料进行理解后,进一步引导其进行正确用语的训练,达到及时识别小学生用语错误,及时进行纠错训练的目的。
本发明第六实施例如图6所示,提供一种辅助学习语言的方法,包括步骤:
S001获取所述用户的第一语音;
S002识别所述第一语音并转化为文本信息;
S020获取所述用户的第一语句的第一句式;
S100获取用户的第一语句进行词性标注,将所述第一语句的第一词语转换为符合相应词性类别的组合正则式的第二词语;
S210提取所述第一语句中第一词语的词性,调整成符合语言规范的第二词组;
S212提取所述第一语句的第一句式,调整成符合语言规范的第二句式;
S213提取所述第二词语、所述第二词组、所述第二句式,调整成符合语言规范的第二语句;
S220将所述第一语句与所述第二语句关联,生成关联关系特征;
S300根据所述第一语句和所述第二语句关联关系特征进行模型训练,得到所述用户的语句对应关系模型库;
S400使用所述用户的语句对应关系模型库,对所述用户的真实语料进行关联转化,生成第三语句进行语义理解;
S500纠正所述真实语料的错误用词和句式,反馈给用户。
S510通过语音、文本、图片形式输出所述纠正真实语料的错误用词和句式;和/或
S520引导所述当前用户进行所述符合语言规范的第三语句训练。
在第六实施例的应用场景中,例如小学生通过学习机的录音设备输入第一语句为“饭我吃要虎狼吞咽”。
通过S001获取第一语音“饭我吃要虎狼吞咽地”。
通过S002识别第一语音,识别第一语句对应的文本信息为“饭我吃要虎狼吞咽地”。
通过S020获取第一语句的第一句式为“宾语”-“主语”-“谓语”-“谓语”-“状语”。
通过S100获取“饭吃”、“我”“要”等第一词语,将其对应转化为“吃饭”、“我”、“要”等第二词语。
通过S210提取所述第一语句中第一词语“虎狼吞咽地”的词性,调整成符合语言规范的第二词组“狼吞虎咽地”。
通过S212提取所述第一语句的第一句式“宾语”-“主语”-“谓语”-“谓语”-“状语”,调整成符合语言规范的第二句式“主语”-“谓语”-“状语”-“谓语”-“宾语”。
通过S213提取所述第二词语、所述第二词组、所述第二句式,调整成符合语言规范的第二语句“我要狼吞虎咽地吃饭”。
通过S220生成第一语句“饭我吃要虎狼吞咽地”与第二语句“我要狼吞虎咽地吃饭”的关联关系特征。
通过S300,将多个上述第一语句和第二语句关联关系特征进行模型训练,得到所述用户的语句对应关系模型库;
在小学生用户再次输入真实语料“饭我吃要虎狼吞咽地”时,立即通过S400提取改小学生用户的语句对应关系模型库,查找生成其对应第三语句为“我要狼吞虎咽地吃饭”。
完成S400后,通过S500向小学生用户输出第三语句“我要狼吞虎咽地吃饭”。
通过S510,以语音、文本、图片形式输出第三语句“我要吃饭”。
通过S520引导所述当前小学生用户进行所述符合语言规范的第三语句“我要吃饭”训练。
具体地,在对小学生语句进行理解时,首先将其语句进行分词,拆分成若干个第一词语,然后对第一词语进行正则式转化,调整成相应词性类别的第二词语;然后根据调整后的第二词语词性,以及符合语言规范的语法,对语句进行重新组合,生成第二语句。此时将小学生的第一语句和转化后的第二语句进行关联,即可获得小学生的一组语句关联关系特征。统计收集所有获得的语句关联关系特征,对这些特征进行模型训练,即可获得特定小学生的语句对应关系模型库。如此,便完成了学习机对小学生用户的原始语句的理解,当小学生的再向学习机输入真实语料时,其语句的真实含义通过对应关系模型库被学习机理解。学习机理解真实语料的语义之后,生成符合标准语法规范的第三语句,将第三语句和真实语料对比,提示小学生语句的错误点,并对其进行规范的第三语句训练。如此,实现学习机对特定小学生的用语习惯学习、模型库建立、真实语义识别、智能纠错等功能。
优选地,第六实施例中,在获取小学生用户的第一语句的第一词语时,获取所述用户的第一语句的文本信息以及第一句式。文本信息可以是小学生用户通过手写等方式输入学习机的。第一句式指小学生用户输入学习机的第一文本信息中使用的语法句式。本发明适用于小学生用户手写输入时,获取第一语句的第一词语和第一句式等信息。
优选地,第六实施例中,在获取小学生用户的第一语句的第一词语时,获取所述用户的第一语句的文本信息。当小学生用户通过语音输入第一语句时,其输入的语音为第一语音。学习机通过对第一语音的识别转化,将第一语音转化为文本信息,进而从文本信息中的提取第一句式。本发明适用于小学生使用语音输入时,获取第一语句的文本信息、第一词语和第一句式等信息。
优选地,第六实施例中,在学习机进行小学生第一语句的理解、建模时,需要使用符合语言规范的第二语句作为关联关系语句,用以发掘两者的对应特征关系。本发明中,当小学生使用错误的词组输入第一语句时,调整所述词组为符合语言规范的第二词组,进而结合调整后的第二词语、第二词组、第二句式,生成第二语句。本发明使用于当小学生输入的第一语句中包含词组使用错误时,理解第一语句的真实语义,生成第二语句。
进一步优选地,第六实施例中,使用汉语成语库、歇后语库作为对所述第一词组进行转化的参照语库,对小学生使用汉语成语、歇后语、常用词组等用词顺序的错误进行识别和纠正,实现帮助小学生正确使用汉语成语、歇后语、常用词组。
优选地,第六实施例中,当学习机成功建立特定小学生的语句对应关系模型库后,对小学生输入的真实语料可以进行快速理解,通过理解后生成第三语句。将真实语料和第三语句的用词、句式区别反馈给小学生,告知其正确的语句,并向小学生发起第三语句训练提示,引导其进行第三语句的强化训练,以更正其错误的用语习惯。本发明可以实现对小学生的真实语料进行理解后,进一步引导其进行正确用语的训练,达到及时识别小学生用语错误,及时进行纠错训练的目的。
本发明第七实施例如图7所示,提供一种辅助学习语言的装置,包括:
获取模块10,获取用户的第一语句进行词性标注,将所述第一语句的第一词语转换为符合相应词性类别的组合正则式的第二词语;
关联模块20,提取所述获取模块10获取的第二词语的词性,对所述第一语句进行重新组合,生成符合语言规范的第二语句,将所述第一语句与所述第二语句关联,生成关联关系特征;
训练模块30,根据所述关联模块20生成的所述第一语句和所述第二语句关联关系特征进行模型训练,得到所述用户的语句对应关系模型库;
转化模块40,获取用户真实语料,使用所述训练模块30得到的对应关系模型库,对所述用户的真实语料进行关联转化,生成第三语句进行语义理解;
反馈模块50,根据所述转化模块40生成的语义理解纠正所述真实语料的错误用词和句式,反馈给用户。
具体地,本实施例为上述第一方法实施例的装置实施例,其技术特征、采取的技术方案、达到的技术效果与上述第一实施例相同,在此不再赘述。
本发明第八实施例如图8所示,提供一种辅助学习语言的装置,包括:
获取模块10,获取用户的第一语句进行词性标注,将所述第一语句的第一词语转换为符合相应词性类别的组合正则式的第二词语;
关联模块20,提取所述获取模块10获取的第二词语的词性,对所述第一语句进行重新组合,生成符合语言规范的第二语句,将所述第一语句与所述第二语句关联,生成关联关系特征;
训练模块30,根据所述关联模块20生成的所述第一语句和所述第二语句关联关系特征进行模型训练,得到所述用户的语句对应关系模型库;
转化模块40,获取用户真实语料,使用所述训练模块30得到的对应关系模型库,对所述用户的真实语料进行关联转化,生成第三语句进行语义理解;
反馈模块50,根据所述转化模块40生成的语义理解纠正所述真实语料的错误用词和句式,反馈给用户;
纠错子模块51,根据所述转化模块40生成的第三语句,纠正所述用户真实语料的错误用词和句式;
输出子模块52,通过语音、文本、图片形式输出所述转化模块40生成的第三语句;
引导子模块53,引导所述当前用户进行所述转化模块40生成的第三语句的训练。
具体地,本实施例为上述第五方法实施例的装置实施例,其技术特征、采取的技术方案、达到的技术效果与上述第五实施例相同,在此不再赘述。
本发明第九实施例如图9所示,提供一种辅助学习语言的装置,包括:
获取模块10,获取用户的第一语句进行词性标注,将所述第一语句的第一词语转换为符合相应词性类别的组合正则式的第二词语;
识别子模块11,识别所述第一语音并转化为文本信息;
关联模块20,提取所述获取模块10获取的第二词语的词性,对所述第一语句进行重新组合,生成符合语言规范的第二语句,将所述第一语句与所述第二语句关联,生成关联关系特征;
调整子模块21,提取所述第一词语的词性,调整成符合语言规范的第二词组;提取所述第一句式,调整成符合语言规范的第二句式;提取所述第二词语、所述第二词组、所述第二句式,调整成符合语言规范的第二语句;
训练模块30,根据所述关联模块20生成的所述第一语句和所述第二语句关联关系特征进行模型训练,得到所述用户的语句对应关系模型库;
转化模块40,获取用户真实语料,使用所述训练模块30得到的对应关系模型库,对所述用户的真实语料进行关联转化,生成第三语句进行语义理解;
反馈模块50,根据所述转化模块40生成的语义理解纠正所述真实语料的错误用词和句式,反馈给用户;
纠错子模块51,根据所述转化模块40生成的第三语句,纠正所述用户真实语料的错误用词和句式;
输出子模块52,通过语音、文本、图片形式输出所述转化模块40生成的第三语句;
引导子模块53,引导所述当前用户进行所述转化模块40生成的第三语句的训练。
具体地,本实施例为上述第六方法实施例的装置实施例,其技术特征、采取的技术方案、达到的技术效果与上述第六实施例相同,在此不再赘述。
应当说明的是,上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (6)

1.一种辅助学习语言的方法,其特征在于,所述方法包括步骤:
获取用户的第一语句进行词性标注,将所述第一语句的第一词语转换为符合相应词性类别的组合正则式的第二词语;
提取所述第二词语的词性,对所述第一语句进行重新组合,生成符合语言规范的第二语句,将所述第一语句与所述第二语句关联,生成关联关系特征;
根据所述第一语句和所述第二语句关联关系特征进行模型训练,得到所述用户的语句对应关系模型库;
使用所述用户的语句对应关系模型库,对所述用户的真实语料进行关联转化,生成第三语句对真实语料进行语义理解;
纠正所述真实语料的错误用词和句式,反馈给用户;
所述获取用户的第一语句包括步骤:
获取所述用户的第一语句的文本信息;
获取所述用户的第一语句的第一句式;
所述生成符合语言规范的第二语句包括步骤:
提取所述第一语句中第一词语的词性,调整成符合语言规范的第二词组;
提取所述第一语句的第一句式,调整成符合语言规范的第二句式;
提取所述第二词语、所述第二词组、所述第二句式,调整成符合语言规范的第二语句。
2.根据权利要求1所述一种辅助学习语言的方法,其特征在于,所述获取所述用户的第一语句的文本信息包括步骤:
获取所述用户的第一语音,识别所述第一语音并转化为文本信息。
3.根据权利要求1所述一种辅助学习语言的方法,其特征在于,所述纠正所述真实语料的错误用词和句式,反馈给用户包括步骤:
通过语音、文本、图片形式输出所述纠正真实语料的错误用词和句式;和/或
引导当前用户进行所述符合语言规范的第三语句训练。
4.一种辅助学习语言的装置,其特征在于,所述装置包括:
获取模块,获取用户的第一语句进行词性标注,将所述第一语句的第一词语转换为符合相应词性类别的组合正则式的第二词语;
关联模块,提取所述获取模块获取的第二词语的词性,对所述第一语句进行重新组合,生成符合语言规范的第二语句,将所述第一语句与所述第二语句关联,生成关联关系特征;
训练模块,根据所述关联模块生成的所述第一语句和所述第二语句关联关系特征进行模型训练,得到所述用户的语句对应关系模型库;
转化模块,获取用户真实语料,使用所述训练模块得到的对应关系模型库,对所述用户的真实语料进行关联转化,生成第三语句对真实语料进行语义理解;
反馈模块,根据所述转化模块生成的语义理解纠正所述真实语料的错误用词和句式,反馈给用户;
所述获取模块还用于获取所述用户的第一语句的文本信息;获取所述用户的第一语句的第一词语;获取所述用户的第一语句的第一句式;获取所述用户的真实语料;
所述关联模块包括:
调整子模块,提取所述第一词语的词性,调整成符合语言规范的第二词组;提取所述第一句式,调整成符合语言规范的第二句式;提取所述第二词语、所述第二词组、所述第二句式,调整成符合语言规范的第二语句。
5.根据权利要求4所述一种辅助学习语言的装置,其特征在于:
所述获取模块还用于获取用户第一语音;
所述获取模块包括一识别子模块,识别所述第一语音并转化为文本信息。
6.根据权利要求4所述一种辅助学习语言的装置,其特征在于,所述反馈模块包括:
纠错子模块,根据得到纠正后的第三语句,纠正所述用户真实语料的错误用词和句式;
输出子模块,通过语音、文本、图片形式输出所述第三语句;引导子模块,引导当前用户进行所述符合语言规范的第三语句训练。
CN201811270842.3A 2018-10-29 2018-10-29 一种辅助学习语言的方法和装置 Active CN109376360B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811270842.3A CN109376360B (zh) 2018-10-29 2018-10-29 一种辅助学习语言的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811270842.3A CN109376360B (zh) 2018-10-29 2018-10-29 一种辅助学习语言的方法和装置

Publications (2)

Publication Number Publication Date
CN109376360A CN109376360A (zh) 2019-02-22
CN109376360B true CN109376360B (zh) 2023-10-20

Family

ID=65390593

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811270842.3A Active CN109376360B (zh) 2018-10-29 2018-10-29 一种辅助学习语言的方法和装置

Country Status (1)

Country Link
CN (1) CN109376360B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109918677B (zh) * 2019-03-21 2023-06-27 广东小天才科技有限公司 一种英文单词语义解析的方法及系统
CN110276073A (zh) * 2019-06-14 2019-09-24 南京机电职业技术学院 一种交互式英语口语校正方法
CN110929875A (zh) * 2019-10-12 2020-03-27 平安国际智慧城市科技股份有限公司 基于机器学习的智能语言学习方法、系统、装置及介质
CN110969012B (zh) * 2019-11-29 2023-04-07 北京字节跳动网络技术有限公司 文本纠错方法、装置、存储介质及电子设备
CN112784577B (zh) * 2021-01-26 2022-11-18 鲁巧巧 一种英语教学用语句关联学习系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009015395A (ja) * 2007-06-29 2009-01-22 Toshiba Corp 辞書構築支援装置および辞書構築支援プログラム
CN105740218A (zh) * 2015-12-31 2016-07-06 成都数联铭品科技有限公司 一种机器翻译后编辑处理方法
CN106610930A (zh) * 2015-10-22 2017-05-03 科大讯飞股份有限公司 外语写作自动纠错方法及系统
CN107122346A (zh) * 2016-12-28 2017-09-01 平安科技(深圳)有限公司 一种输入语句的纠错方法及装置
CN108595431A (zh) * 2018-04-28 2018-09-28 海信集团有限公司 语音交互文本纠错方法、装置、终端及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009015395A (ja) * 2007-06-29 2009-01-22 Toshiba Corp 辞書構築支援装置および辞書構築支援プログラム
CN106610930A (zh) * 2015-10-22 2017-05-03 科大讯飞股份有限公司 外语写作自动纠错方法及系统
CN105740218A (zh) * 2015-12-31 2016-07-06 成都数联铭品科技有限公司 一种机器翻译后编辑处理方法
CN107122346A (zh) * 2016-12-28 2017-09-01 平安科技(深圳)有限公司 一种输入语句的纠错方法及装置
CN108595431A (zh) * 2018-04-28 2018-09-28 海信集团有限公司 语音交互文本纠错方法、装置、终端及存储介质

Also Published As

Publication number Publication date
CN109376360A (zh) 2019-02-22

Similar Documents

Publication Publication Date Title
CN109376360B (zh) 一种辅助学习语言的方法和装置
US7860705B2 (en) Methods and apparatus for context adaptation of speech-to-speech translation systems
EP0917129B1 (en) Speech recognition method and apparatus
KR102191425B1 (ko) 인터랙티브 캐릭터 기반 외국어 학습 장치 및 방법
CN101551947A (zh) 辅助口语语言学习的计算机系统
CN110797010A (zh) 基于人工智能的问答评分方法、装置、设备及存储介质
US20140205974A1 (en) Statistical machine translation framework for modeling phonological errors in computer assisted pronunciation training system
Saunders et al. Towards using prosody to scaffold lexical meaning in robots
CN111508522A (zh) 一种语句分析处理方法及系统
Dai [Retracted] An Automatic Pronunciation Error Detection and Correction Mechanism in English Teaching Based on an Improved Random Forest Model
CN111326030A (zh) 一种集读听写识字学习系统、装置及方法
Oumaima et al. Text-to-speech technology for Arabic language learners
CN114254649A (zh) 一种语言模型的训练方法、装置、存储介质及设备
CN111899581A (zh) 一种英语教学用单词拼读练习装置及方法
Liu et al. Speech disorders classification in phonetic exams with MFCC and DTW
Wanderley et al. Identifying negative language transfer in learner errors using POS information
KR101949880B1 (ko) 작문 오류 식별 및 평가 시스템
Lun et al. Using Technologised Computational Corpus-Driven Linguistics Study on the Vocabulary Uses Among Advanced Malaysian Upper Primary School English as a Second Language Learners (ESL) in Northern Region
US11900048B2 (en) Acquisition method and system for clinical experimental data, electronic device, and storage medium
US20240194203A1 (en) Method of detecting a transcription error in speech recognition corpus and device for the same
Khan et al. The Tarteel dataset: crowd-sourced and labeled Quranic recitation
CN117275319B (zh) 训练语言重点能力的装置
TWI759003B (zh) 語音辨識模型的訓練方法
Quan et al. KU Leuven at HOO-2012: a hybrid approach to detection and correction of determiner and preposition errors in non-native English text
Jiang et al. Automatic Speaker-level Pronunciation Assessment of L2 Speech Using Posterior Probabilities from Multiple Utterances

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant