CN109918677B - 一种英文单词语义解析的方法及系统 - Google Patents
一种英文单词语义解析的方法及系统 Download PDFInfo
- Publication number
- CN109918677B CN109918677B CN201910214806.3A CN201910214806A CN109918677B CN 109918677 B CN109918677 B CN 109918677B CN 201910214806 A CN201910214806 A CN 201910214806A CN 109918677 B CN109918677 B CN 109918677B
- Authority
- CN
- China
- Prior art keywords
- corpus
- english
- basic
- word
- analyzing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Machine Translation (AREA)
Abstract
本发明提供了一种英文单词语义解析的方法及系统,其方法包括:收集英文单词以及所述单词的多个基本释义;获取每个基本释义对应书本中出现的所有英文句子;分别分析每个基本释义对应的所述英文句子,得到统一特征作为英文单词每个基本释义对应英文句子的句式特征;根据所述英文单词、所述基本释义以及所述句式特征训练生成语义模型;获取英文语料;分析所述英文语料得到对应的语料特征;根据所述语义模型解析所述语料特征得到所述英文语料对应的语音语义。本发明通过每个基本释义对应英文句子的句式特征生成语义模型,从而分辨具有多个基本释义的英文单词,解析英文语料得到对应的语音语义。
Description
技术领域
本发明涉及语音语义解析技术领域,尤指一种英文单词语义解析的方法及系统。
背景技术
在学习英语时,目前大多英语老师还在让学生死记硬背多义词的各个释义,效果并不理想,学生背完很快就会忘记,只能靠反复记忆来解决遗忘的问题;有些老师则会让学生在语境中(句子或语篇)背诵多义词的各个释义,学生的记忆效果会好一些,但也会耗费较多时间,尤其是通过一个较长的语篇来学习和巩固一个单词,非常不经济,相对来说效率并不高。现有的很多学习英语单词的发方法包括拼读法、谐音法、前缀法、词根法和分类法等,其中分类法是把对待记忆的单词进行归类:(1)被归为同一类的单词其语法功能相似,结构相近,便于从整体上记忆和掌握,有助于对单词形成完整的类别概念。(2)便于展开比较,有利于掌握各个单词的异同点。(3)便于集中词汇,从而可灵活地进行替换和运用。(4)能使已掌握的杂乱无章的单词条理化、系统化、门类化。用分类法记忆单词犹如把种类繁多的铅字按汉字结构的偏旁部首井井有序地排列和存储在打字机下面的字盘里,需要时随用随取。
但是,随着互联网的快速发展,人们的生活变得越来越智能化。很多翻译软件以及翻译设备都能够提供英语翻译服务,但是,英文中很多单词存在多个基本释义,在不同情境下的语义、时态等不同,翻译软件可能无法进行精准地翻译。下面以英语名词bank为例,进行说明:1)Welcome to Bank of America.2)This walk follows the Thames west fromB arnes bridge,keeping to the north bank of the Thames。很显然,在一句话中,bank应指“银行”,而第二句话则为“河岸”。
因此,目前需要一种英文单词语义解析的方法及系统解决上述英文单词多释义以及多时态的问题。
发明内容
本发明的目的是提供一种英文单词语义解析的方法及系统,实现通过每个基本释义对应英文句子的句式特征生成语义模型,从而分辨具有多个基本释义的英文单词,解析英文语料得到对应的语音语义。
本发明提供的技术方案如下:
本发明提供一种英文单词语义解析的方法,包括:
收集英文单词以及所述单词的多个基本释义;
获取每个基本释义对应书本中出现的所有英文句子;
分别分析每个基本释义对应的所述英文句子,得到统一特征作为英文单词每个基本释义对应英文句子的句式特征;
根据所述英文单词、所述基本释义以及所述句式特征训练生成语义模型;
获取英文语料;
分析所述英文语料得到对应的语料特征;
根据所述语义模型解析所述语料特征得到所述英文语料对应的语音语义。
进一步的,分别分析每个基本释义对应的所述英文句子,得到统一特征作为英文单词每个基本释义对应英文句子的句式特征具体包括:
分析同一个基本释义下,每一个英文句子中所述英文单词的单词时态;
对所述英文句子进行分词得到句式分词,并且分析所述句式分词之间的配合关系;
根据所述单词时态、所述句式分词以及所述配合关系得到每个基本释义对应英文句子的所述句式特征。
进一步的,分析所述英文语料得到对应的语料特征具体包括:
分析所述英文语料,获取其中具有多个基本释义的语料单词及对应的语料时态;
对所述英文语料进行分词得到语料分词;
分析所述分词单元得到的所述语料分词之间的语料配合关系;
根据所述语料单词、所述语料分词以及所述语料配合关系得到所述语料特征。
进一步的,根据所述语义模型解析所述语料特征得到所述英文语料对应的语音语义具体包括:
根据所述语义模型解析所述语料特征,得到所述语料单词对应的语料释义;
根据所述语料释义解析得到所述英文语料对应的所述语音语义;
根据所述语义模型分析所述语料单词对应的所述语料时态是否正确,若错误,发出提示信息。
进一步的,根据所述语义模型解析所述语料特征得到所述英文语料对应的语音语义还包括:
根据所述语义模型解析和所述语料特征分析所述英文语料中包含的所有的英文单词的单词顺序是否正确;
若正确,则解析所述英文语料得到对应的语音语义;
若错误,则根据所述语义模型解析对所述单词顺序进行调整,然后解析所述英文语料得到对应的语音语义。
本发明还提供一种英文单词语义解析的系统,包括:
收集模块,收集英文单词以及所述单词的多个基本释义;
获取模块,获取所述收集模块收集的每个基本释义对应书本中出现的所有英文句子;
句式特征分析模块,分别分析所述获取模块获取的每个基本释义对应的所述英文句子,得到统一特征作为英文单词每个基本释义对应英文句子的句式特征;
模型生成模块,根据所述收集模块收集的所述英文单词、所述基本释义以及所述句式特征分析模块得到的所述句式特征训练生成语义模型;
语料获取模块,获取英文语料;
语料特征获取模块,分析所述语料获取模块获取的所述英文语料得到对应的语料特征;
解析模块,根据所述模型生成模块生成的所述语义模型解析所述语料特征获取模块获取的所述语料特征得到所述英文语料对应的语音语义。
进一步的,所述句式特征分析模块具体包括:
单词时态分析单元,分析同一个基本释义下,每一个英文句子中所述英文单词的单词时态;
分词关系分析单元,对所述英文句子进行分词得到句式分词,并且分析所述句式分词之间的配合关系;
句式特征分析单元,根据所述单词时态分析单元得到的所述单词时态、所述分词关系分析单元得到的所述句式分词以及所述配合关系得到每个基本释义对应英文句子的所述句式特征。
进一步的,所述语料特征获取模块具体包括:
语料时态分析单元,分析所述英文语料,获取其中具有多个基本释义的语料单词及对应的语料时态;
分词单元,对所述英文语料进行分词得到语料分词;
语料关系分析单元,分析所述分词单元得到的所述语料分词之间的语料配合关系;
语料特征获取单元,根据所述语料时态分析单元得到的所述语料单词、所述分词单元得到的所述语料分词以及所述语料关系分析单元得到的所述语料配合关系得到所述语料特征。
进一步的,所述解析模块具体包括:
释义解析单元,根据所述语义模型解析所述语料特征,得到所述语料单词对应的语料释义;
语义解析单元,根据所述释义解析单元得到的所述语料释义解析得到所述英文语料对应的所述语音语义;
时态处理单元,根据所述语义模型分析所述语料时态分析单元得到的所述语料单词对应的所述语料时态是否正确,若错误,发出提示信息。
进一步的,所述解析模块还包括:
顺序分析单元,根据所述语义模型解析和所述语料特征分析所述英文语料中包含的所有的英文单词的单词顺序是否正确;
语义处理单元,若所述顺序分析单元分析所述单词顺序正确,则解析所述英文语料得到对应的语音语义;
所述语义处理单元,若所述顺序分析单元分析所述单词顺序错误,则根据所述语义模型解析对所述单词顺序进行调整,然后解析所述英文语料得到对应的语音语义。
通过本发明提供的一种英文单词语义解析的方法及系统,能够带来以下至少一种有益效果:
1、本发明中,通过手机英文单词每个基本释义对应的英文句子,然后分析其中的句式特征训练生成语义模型来解析新获取的英文语料,从而准确分辨其中的语料单词的基本释义,避免翻译或解析时出现较大的误差。
2、本发明中,通过详细分析同一个基本释义下,每一个英文句子中英文单词的单词时态,以及对英文句子进行分词得到句式分词以及相互之间的配合关系,统计得出句式特征,从而对英文单词每个基本释义在应用到英文句子中时,全面统计其特征。
3、本发明中,通过语义模型不仅可以识别判断出英文语料中具有多个基本释义的语料单词在英文语料的情境下对应的基本释义,还可以进一步判断该语料单词的单词时态是否正确,并进行相应的更改及讲解。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对一种英文单词语义解析的方法及系统的上述特性、技术特征、优点及其实现方式予以进一步说明。
图1是本发明一种英文单词语义解析的方法的一个实施例的流程图;
图2是本发明一种英文单词语义解析的方法的另一个实施例的流程图;
图3是本发明一种英文单词语义解析的方法的另一个实施例的流程图;
图4是本发明一种英文单词语义解析的方法的另一个实施例的流程图;
图5是本发明一种英文单词语义解析的方法的另一个实施例的流程图;
图6是本发明一种英文单词语义解析的系统的一个实施例的结构示意图;
图7是本发明一种英文单词语义解析的系统的另一个实施例的结构示意图。
具体实施方式
为了能够更加清楚地说明本发明实施例或现有技术中的技术方案,下面将对照说明书附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并且获得其他的实施方式。
为了使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
本发明的一个实施例,如图1所示,一种英文单词语义解析的方法,包括:
S100收集英文单词以及所述单词的多个基本释义;
S200获取每个基本释义对应书本中出现的所有英文句子;
S300分别分析每个基本释义对应的所述英文句子,得到统一特征作为英文单词每个基本释义对应英文句子的句式特征;
S400根据所述英文单词、所述基本释义以及所述句式特征训练生成语义模型;
S500获取英文语料;
S600分析所述英文语料得到对应的语料特征;
S700根据所述语义模型解析所述语料特征得到所述英文语料对应的语音语义。
具体的,本实施例中,收集课本中所有的英文单词以及对应的所有的基本释义,可以按照年级进行分类,那么后续当需要对用户的语料进行语义解析时,可以先获取用户的年级,然后再在相应的年级分类的资料中进行解析,从而快速准确地解析出用户的语义。
然后获取每个英文单词中是同一个基本释义的所有英文句子,例如英语单词bank,基本释义可以是银行,也可以是河岸,那么分别获取当英语单词bank基本释义是银行时所涉及到的所有的英文句子,以及当英语单词bank基本释义是河岸时所涉及到的所有的英文句子。
分别分析每个基本释义对应的英文句子,得到统一特征作为英文单词每个基本释义对应英文句子的句式特征,例如分析当英语单词bank基本释义是银行时所涉及到的所有的英文句子,统计分析其中所有的英文句子的统一特征,然后将其作为英文单词bank基本释义是银行时所涉及到的英文句子的句式特征。其中在分析统一特征时,可能出现并没有某一特征是所有的英文句子都存在的,那么可以统计各个特征出现的概率,选取概率排列靠前的一个或多个特征作为统一特征,或者对所有的特征进行加权得到统一特征。
根据英文单词、基本释义以及句式特征训练生成语义模型,在语义模型中建立英文单词、基本释义以及句式特征三者之间的对应关系,以便于后续对新获取的英文语料进行解析,准确分辨其中的语料单词的基本释义,避免翻译或解析时出现较大的误差。
当用户需要智能终端对英文语料进行解析时,获取英文语料,用户可以通过智能终端的人机交互界面手动输入英文语料,也可以是通过智能终端的语音设备获取英文语料。分析获取到的英文语料中所包含的语料特征,通过语义模型解析得到的语料特征,分析得到其中具有多个基本释义的语料单词在英文语料的情境下对应的基本释义,从而解析得到整个英文语料对应的语音语义,并通过人机交互界面展示给用户,或者通过语音设备播放。另外在解析出英文语料对应的语音语义之后,识别出用户的意图,也可以执行相应的操作或者进行相关的推荐。
本申请通过手机英文单词每个基本释义对应的英文句子,然后分析其中的句式特征训练生成语义模型来解析新获取的英文语料,从而准确分辨其中的语料单词的基本释义,避免翻译或解析时出现较大的误差。
本发明的另一个实施例,是上述的实施例的优化实施例,如图2所示,包括:
S100收集英文单词以及所述单词的多个基本释义;
S200获取每个基本释义对应书本中出现的所有英文句子;
S300分别分析每个基本释义对应的所述英文句子,得到统一特征作为英文单词每个基本释义对应英文句子的句式特征;
S310分析同一个基本释义下,每一个英文句子中所述英文单词的单词时态;
S320对所述英文句子进行分词得到句式分词,并且分析所述句式分词之间的配合关系;
S330根据所述单词时态、所述句式分词以及所述配合关系得到每个基本释义对应英文句子的所述句式特征。
S400根据所述英文单词、所述基本释义以及所述句式特征训练生成语义模型;
S500获取英文语料;
S600分析所述英文语料得到对应的语料特征;
S700根据所述语义模型解析所述语料特征得到所述英文语料对应的语音语义。
具体的,本实施例中,收集课本中所有的英文单词以及对应的所有的基本释义,然后获取每个英文单词中是同一个基本释义的所有英文句子,例如英语单词bank,基本释义可以是银行,也可以是河岸,那么分别获取当英语单词bank基本释义是银行时所涉及到的所有的英文句子,以及当英语单词bank基本释义是河岸时所涉及到的所有的英文句子。
分析同一个基本释义下,每一个英文句子中英文单词的单词时态,对于英文单词来说,特别是动词,即便是同一基本释义,不同的时态可能会出现不同的语义解析的结果,由于用户表达能力优先,英文语料可能出现语法或者用词方面地错误,因此后续解析英文语料时,同样需要对语料单词的单词时态进行检查。然后对英文句子进行分词得到句式分词,并且分析句式分词之间的搭配从而确定相互之间的配合关系,最后统计单词时态、句式分词以及配合关系得到每个基本释义对应英文句子的句式特征。根据英文单词、基本释义以及句式特征训练生成语义模型,在语义模型中建立英文单词、基本释义以及句式特征三者之间的对应关系。
当用户需要智能终端对英文语料进行解析时,获取英文语料,分析获取到的英文语料中所包含的语料特征,通过语义模型解析得到的语料特征,分析得到其中具有多个基本释义的语料单词在英文语料的情境下对应的基本释义,从而解析得到整个英文语料对应的语音语义。
本发明通过详细分析同一个基本释义下,每一个英文句子中英文单词的单词时态,以及对英文句子进行分词得到句式分词以及相互之间的配合关系,统计得出句式特征,从而对英文单词每个基本释义在应用到英文句子中时,全面统计其特征。
本发明的另一个实施例,是上述的实施例的优化实施例,如图3所示,包括:
S100收集英文单词以及所述单词的多个基本释义;
S200获取每个基本释义对应书本中出现的所有英文句子;
S300分别分析每个基本释义对应的所述英文句子,得到统一特征作为英文单词每个基本释义对应英文句子的句式特征;
S400根据所述英文单词、所述基本释义以及所述句式特征训练生成语义模型;
S500获取英文语料;
S600分析所述英文语料得到对应的语料特征;
S610分析所述英文语料,获取其中具有多个基本释义的语料单词及对应的语料时态;
S620对所述英文语料进行分词得到语料分词;
S630分析所述分词单元得到的所述语料分词之间的语料配合关系;
S640根据所述语料单词、所述语料分词以及所述语料配合关系得到所述语料特征。
S700根据所述语义模型解析所述语料特征得到所述英文语料对应的语音语义。
具体的,本实施例中,收集课本中所有的英文单词以及对应的所有的基本释义,然后获取每个英文单词中是同一个基本释义的所有英文句子,例如英语单词bank,基本释义可以是银行,也可以是河岸,那么分别获取当英语单词bank基本释义是银行时所涉及到的所有的英文句子,以及当英语单词bank基本释义是河岸时所涉及到的所有的英文句子。
分别分析每个基本释义对应的英文句子,得到统一特征作为英文单词每个基本释义对应英文句子的句式特征,根据英文单词、基本释义以及句式特征训练生成语义模型,在语义模型中建立英文单词、基本释义以及句式特征三者之间的对应关系。
当用户需要智能终端对英文语料进行解析时,获取英文语料,首先判断该英文语料中具有多个基本释义的语料单词,随后针对该语料单词进行分析。获取该语料单词对应的语料时态,然后对英文语料进行分词得到语料分词,同样地,分析语料分词的时态语态,从而分析得到语料分词之间的语料配合关系。根据语料单词、语料分词以及语料配合关系得到英文语料的语料特征。通过语义模型解析得到的语料特征,分析得到其中具有多个基本释义的语料单词在英文语料的情境下对应的基本释义,从而解析得到整个英文语料对应的语音语义。
本发明中通过分词技术对获取的英文语料进行分词得到语料分词,进而分析得到语料特征,将语料特征与语义模型进行比对,从而判断语料单词的基本释义。
本发明的另一个实施例,是上述的实施例的优化实施例,如图4所示,包括:
S100收集英文单词以及所述单词的多个基本释义;
S200获取每个基本释义对应书本中出现的所有英文句子;
S300分别分析每个基本释义对应的所述英文句子,得到统一特征作为英文单词每个基本释义对应英文句子的句式特征;
S400根据所述英文单词、所述基本释义以及所述句式特征训练生成语义模型;
S500获取英文语料;
S600分析所述英文语料得到对应的语料特征;
S610分析所述英文语料,获取其中具有多个基本释义的语料单词及对应的语料时态;
S620对所述英文语料进行分词得到语料分词;
S630分析所述分词单元得到的所述语料分词之间的语料配合关系;
S640根据所述语料单词、所述语料分词以及所述语料配合关系得到所述语料特征。
S700根据所述语义模型解析所述语料特征得到所述英文语料对应的语音语义。
S710根据所述语义模型解析所述语料特征,得到所述语料单词对应的语料释义;
S720根据所述语料释义解析得到所述英文语料对应的所述语音语义;
S730根据所述语义模型分析所述语料单词对应的所述语料时态是否正确,若错误,发出提示信息。
具体的,本实施例中,收集课本中所有的英文单词以及对应的所有的基本释义,然后获取每个英文单词中是同一个基本释义的所有英文句子,例如英语单词bank,基本释义可以是银行,也可以是河岸,那么分别获取当英语单词bank基本释义是银行时所涉及到的所有的英文句子,以及当英语单词bank基本释义是河岸时所涉及到的所有的英文句子。
分别分析每个基本释义对应的英文句子,得到统一特征作为英文单词每个基本释义对应英文句子的句式特征,根据英文单词、基本释义以及句式特征训练生成语义模型,在语义模型中建立英文单词、基本释义以及句式特征三者之间的对应关系。
当用户需要智能终端对英文语料进行解析时,获取英文语料,分析获取到的英文语料中所包含的语料特征,通过语义模型解析得到的语料特征,分析得到其中具有多个基本释义的语料单词在英文语料的情境下对应的基本释义,从而解析得到整个英文语料对应的语音语义。
进一步地,判断在该英文语料的情境下,该基本释义的语料单词的单词时态是否正确,如果错误,则通过人机交互界面提示用户,对于时态错误的语料单词进行标注,并且展示此处正确的单词时态,另外还可以针对此种情景下的该语料单词的应用进行详细解析,例如此处该语料单词的单词时态、搭配短语以及句子时态等。
本申请通过语义模型不仅可以识别判断出英文语料中具有多个基本释义的语料单词在英文语料的情境下对应的基本释义,还可以进一步判断该语料单词的单词时态是否正确,并进行相应的更改及讲解。
本发明的另一个实施例,是上述的实施例的优化实施例,如图5所示,包括:
S100收集英文单词以及所述单词的多个基本释义;
S200获取每个基本释义对应书本中出现的所有英文句子;
S300分别分析每个基本释义对应的所述英文句子,得到统一特征作为英文单词每个基本释义对应英文句子的句式特征;
S400根据所述英文单词、所述基本释义以及所述句式特征训练生成语义模型;
S500获取英文语料;
S600分析所述英文语料得到对应的语料特征;
S610分析所述英文语料,获取其中具有多个基本释义的语料单词及对应的语料时态;
S620对所述英文语料进行分词得到语料分词;
S630分析所述分词单元得到的所述语料分词之间的语料配合关系;
S640根据所述语料单词、所述语料分词以及所述语料配合关系得到所述语料特征。
S700根据所述语义模型解析所述语料特征得到所述英文语料对应的语音语义。
S750根据所述语义模型解析和所述语料特征分析所述英文语料中包含的所有的英文单词的单词顺序是否正确;
S760若正确,则解析所述英文语料得到对应的语音语义;
S770若错误,则根据所述语义模型解析对所述单词顺序进行调整,然后解析所述英文语料得到对应的语音语义。
具体的,本实施例中,收集课本中所有的英文单词以及对应的所有的基本释义,然后获取每个英文单词中是同一个基本释义的所有英文句子,例如英语单词bank,基本释义可以是银行,也可以是河岸,那么分别获取当英语单词bank基本释义是银行时所涉及到的所有的英文句子,以及当英语单词bank基本释义是河岸时所涉及到的所有的英文句子。
分别分析每个基本释义对应的英文句子,得到统一特征作为英文单词每个基本释义对应英文句子的句式特征,根据英文单词、基本释义以及句式特征训练生成语义模型,在语义模型中建立英文单词、基本释义以及句式特征三者之间的对应关系。
当用户需要智能终端对英文语料进行解析时,获取英文语料,分析获取到的英文语料中所包含的语料特征,通过语义模型解析得到的语料特征,分析得到其中具有多个基本释义的语料单词在英文语料的情境下对应的基本释义,同样地,还可以进一步根据语义模型以及语料上下文判断英文语料中包含的所有的英文单词的单词顺序相互之间是否正确,即判断是否符合英文语法规则,如果单词顺序正确,则解析英文语料得到对应的语音语义,如果单词顺序错误,则通过人机交互界面提示用户,对于单词顺序错误的地方进行标注,然后调整之后展示正确单词顺序的语料,再解析英文语料得到对应的语音语义。
本发明通过语义模型识别判断英文语料中包含的所有的英文单词的单词顺序相互之间是否正确,然后进一步地对单词顺序错误的英文语料进行调整并进行讲解。
本发明的一个实施例,如图6所示,一种英文单词语义解析的系统,包括:
收集模块,收集英文单词以及所述英文单词的多个基本释义;
获取模块,获取所述收集模块收集的每个基本释义对应书本中出现的所有英文句子;
句式特征分析模块,分别分析所述获取模块获取的每个基本释义对应的所述英文句子,得到统一特征作为英文单词每个基本释义对应英文句子的句式特征;
模型生成模块,根据所述收集模块收集的所述英文单词、所述基本释义以及所述句式特征分析模块得到的所述句式特征训练生成语义模型;
语料获取模块,获取英文语料;
语料特征获取模块,分析所述语料获取模块获取的所述英文语料得到对应的语料特征;
解析模块,根据所述模型生成模块生成的所述语义模型解析所述语料特征获取模块获取的所述语料特征得到所述英文语料对应的语音语义。
具体的,本实施例中,收集课本中所有的英文单词以及对应的所有的基本释义,可以按照年级进行分类,那么后续当需要对用户的语料进行语义解析时,可以先获取用户的年级,然后再在相应的年级分类的资料中进行解析,从而快速准确地解析出用户的语义。
然后获取每个英文单词中是同一个基本释义的所有英文句子,例如英语单词bank,基本释义可以是银行,也可以是河岸,那么分别获取当英语单词bank基本释义是银行时所涉及到的所有的英文句子,以及当英语单词bank基本释义是河岸时所涉及到的所有的英文句子。
分别分析每个基本释义对应的英文句子,得到统一特征作为英文单词每个基本释义对应英文句子的句式特征,例如分析当英语单词bank基本释义是银行时所涉及到的所有的英文句子,统计分析其中所有的英文句子的统一特征,然后将其作为英文单词bank基本释义是银行时所涉及到的英文句子的句式特征。其中在分析统一特征时,可能出现并没有某一特征是所有的英文句子都存在的,那么可以统计各个特征出现的概率,选取概率排列靠前的一个或多个特征作为统一特征,或者对所有的特征进行加权得到统一特征。
根据英文单词、基本释义以及句式特征训练生成语义模型,在语义模型中建立英文单词、基本释义以及句式特征三者之间的对应关系,以便于后续对新获取的英文语料进行解析,准确分辨其中的语料单词的基本释义,避免翻译或解析时出现较大的误差。
当用户需要智能终端对英文语料进行解析时,获取英文语料,用户可以通过智能终端的人机交互界面手动输入英文语料,也可以是通过智能终端的语音设备获取英文语料。分析获取到的英文语料中所包含的语料特征,通过语义模型解析得到的语料特征,分析得到其中具有多个基本释义的语料单词在英文语料的情境下对应的基本释义,从而解析得到整个英文语料对应的语音语义,并通过人机交互界面展示给用户,或者通过语音设备播放。另外在解析出英文语料对应的语音语义之后,识别出用户的意图,也可以执行相应的操作或者进行相关的推荐。
本申请通过手机英文单词每个基本释义对应的英文句子,然后分析其中的句式特征训练生成语义模型来解析新获取的英文语料,从而准确分辨其中的语料单词的基本释义,避免翻译或解析时出现较大的误差。
本发明的另一个实施例,是上述的实施例的优化实施例,如图7所示,包括:
收集模块,收集英文单词以及所述英文单词的多个基本释义;
获取模块,获取所述收集模块收集的每个基本释义对应书本中出现的所有英文句子;
句式特征分析模块,分别分析所述获取模块获取的每个基本释义对应的所述英文句子,得到统一特征作为英文单词每个基本释义对应英文句子的句式特征;
所述句式特征分析模块具体包括:
单词时态分析单元,分析同一个基本释义下,每一个英文句子中所述英文单词的单词时态;
分词关系分析单元,对所述英文句子进行分词得到句式分词,并且分析所述句式分词之间的配合关系;
句式特征分析单元,根据所述单词时态分析单元得到的所述单词时态、所述分词关系分析单元得到的所述句式分词以及所述配合关系得到每个基本释义对应英文句子的所述句式特征。
模型生成模块,根据所述收集模块收集的所述英文单词、所述基本释义以及所述句式特征分析模块得到的所述句式特征训练生成语义模型;
语料获取模块,获取英文语料;
语料特征获取模块,分析所述语料获取模块获取的所述英文语料得到对应的语料特征;
所述语料特征获取模块具体包括:
语料时态分析单元,分析所述英文语料,获取其中具有多个基本释义的语料单词及对应的语料时态;
分词单元,对所述英文语料进行分词得到语料分词;
语料关系分析单元,分析所述分词单元得到的所述语料分词之间的语料配合关系;
语料特征获取单元,根据所述语料时态分析单元得到的所述语料单词、所述分词单元得到的所述语料分词以及所述语料关系分析单元得到的所述语料配合关系得到所述语料特征。
解析模块,根据所述模型生成模块生成的所述语义模型解析所述语料特征获取模块获取的所述语料特征得到所述英文语料对应的语音语义。
所述解析模块具体包括:
释义解析单元,根据所述语义模型解析所述语料特征,得到所述语料单词对应的语料释义;
语义解析单元,根据所述释义解析单元得到的所述语料释义解析得到所述英文语料对应的所述语音语义;
时态处理单元,根据所述语义模型分析所述语料时态分析单元得到的所述语料单词对应的所述语料时态是否正确,若错误,发出提示信息。
所述解析模块还包括:
顺序分析单元,根据所述语义模型解析和所述语料特征分析所述英文语料中包含的所有的英文单词的单词顺序是否正确;
语义处理单元,若所述顺序分析单元分析所述单词顺序正确,则解析所述英文语料得到对应的语音语义;
所述语义处理单元,若所述顺序分析单元分析所述单词顺序错误,则根据所述语义模型解析对所述单词顺序进行调整,然后解析所述英文语料得到对应的语音语义。
具体的,本实施例中,收集课本中所有的英文单词以及对应的所有的基本释义,然后获取每个英文单词中是同一个基本释义的所有英文句子,例如英语单词bank,基本释义可以是银行,也可以是河岸,那么分别获取当英语单词bank基本释义是银行时所涉及到的所有的英文句子,以及当英语单词bank基本释义是河岸时所涉及到的所有的英文句子。
分析同一个基本释义下,每一个英文句子中英文单词的单词时态,对于英文单词来说,特别是动词,即便是同一基本释义,不同的时态可能会出现不同的语义解析的结果,由于用户表达能力优先,英文语料可能出现语法或者用词方面地错误,因此后续解析英文语料时,同样需要对语料单词的单词时态进行检查。然后对英文句子进行分词得到句式分词,并且分析句式分词之间的搭配从而确定相互之间的配合关系,最后统计单词时态、句式分词以及配合关系得到每个基本释义对应英文句子的句式特征。根据英文单词、基本释义以及句式特征训练生成语义模型,在语义模型中建立英文单词、基本释义以及句式特征三者之间的对应关系。
当用户需要智能终端对英文语料进行解析时,获取英文语料,首先判断该英文语料中具有多个基本释义的语料单词,随后针对该语料单词进行分析。获取该语料单词对应的语料时态,然后对英文语料进行分词得到语料分词,同样地,分析语料分词的时态语态,从而分析得到语料分词之间的语料配合关系。根据语料单词、语料分词以及语料配合关系得到英文语料的语料特征。通过语义模型解析得到的语料特征,分析得到其中具有多个基本释义的语料单词在英文语料的情境下对应的基本释义,同样地,还可以进一步根据语义模型以及语料上下文判断英文语料中包含的所有的英文单词的单词顺序相互之间是否正确,即判断是否符合英文语法规则,如果单词顺序正确,则解析英文语料得到对应的语音语义,如果单词顺序错误,则通过人机交互界面提示用户,对于单词顺序错误的地方进行标注,然后调整之后展示正确单词顺序的语料,再解析英文语料得到对应的语音语义。
进一步地,判断在该英文语料的情境下,该基本释义的语料单词的单词时态是否正确,如果错误,则通过人机交互界面提示用户,对于时态错误的语料单词进行标注,并且展示此处正确的单词时态,另外还可以针对此种情景下的该语料单词的应用进行详细解析,例如此处该语料单词的单词时态、搭配短语以及句子时态等。
本发明通过详细分析同一个基本释义下,每一个英文句子中英文单词的单词时态,以及对英文句子进行分词得到句式分词以及相互之间的配合关系,统计得出句式特征,从而对英文单词每个基本释义在应用到英文句子中时,全面统计其特征。通过分词技术对获取的英文语料进行分词得到语料分词,进而分析得到语料特征,将语料特征与语义模型进行比对,从而判断语料单词的基本释义。通过语义模型不仅可以识别判断出英文语料中具有多个基本释义的语料单词在英文语料的情境下对应的基本释义,还可以进一步判断该语料单词的单词时态是否正确,以及判断英文语料中包含的所有的英文单词的单词顺序相互之间是否正确,并进行相应的更改及讲解。
应当说明的是,上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种英文单词语义解析的方法,其特征在于,包括:
收集英文单词以及所述英文单词的多个基本释义;
获取每个基本释义对应书本中出现的所有英文句子;
分别分析每个基本释义对应的所述英文句子,得到统一特征作为英文单词每个基本释义对应英文句子的句式特征;
根据所述英文单词、所述基本释义以及所述句式特征训练生成语义模型;在语义模型中建立英文单词、基本释义以及句式特征三者之间的对应关系;
获取英文语料;
分析所述英文语料得到对应的语料特征;
根据所述语义模型解析所述语料特征得到所述英文语料对应的语义。
2.根据权利要求1所述的英文单词语义解析的方法,其特征在于,分别分析每个基本释义对应的所述英文句子,得到统一特征作为英文单词每个基本释义对应英文句子的句式特征具体包括:
分析同一个基本释义下,每一个英文句子中所述英文单词的单词时态;
对所述英文句子进行分词得到句式分词,并且分析所述句式分词之间的配合关系;
根据所述单词时态、所述句式分词以及所述配合关系得到每个基本释义对应英文句子的所述句式特征。
3.根据权利要求1所述的英文单词语义解析的方法,其特征在于,分析所述英文语料得到对应的语料特征具体包括:
分析所述英文语料,获取其中具有多个基本释义的语料单词及对应的语料时态;
对所述英文语料进行分词得到语料分词;
分析分词单元得到的所述语料分词之间的语料配合关系;
根据所述语料单词、所述语料分词以及所述语料配合关系得到所述语料特征。
4.根据权利要求3所述的英文单词语义解析的方法,其特征在于,根据所述语义模型解析所述语料特征得到所述英文语料对应的语义具体包括:
根据所述语义模型解析所述语料特征,得到所述语料单词对应的语料释义;
根据所述语料释义解析得到所述英文语料对应的所述语义;
根据所述语义模型分析所述语料单词对应的所述语料时态是否正确,若错误,发出提示信息。
5.根据权利要求3所述的英文单词语义解析的方法,其特征在于,根据所述语义模型解析所述语料特征得到所述英文语料对应的语义还包括:
根据所述语义模型解析和所述语料特征分析所述英文语料中包含的所有的英文单词的单词顺序是否正确;
若正确,则解析所述英文语料得到对应的语义;
若错误,则根据所述语义模型解析对所述单词顺序进行调整,然后解析所述英文语料得到对应的语义。
6.一种英文单词语义解析的系统,其特征在于,包括:
收集模块,收集英文单词以及所述英文单词的多个基本释义;
获取模块,获取所述收集模块收集的每个基本释义对应书本中出现的所有英文句子;
句式特征分析模块,分别分析所述获取模块获取的每个基本释义对应的所述英文句子,得到统一特征作为英文单词每个基本释义对应英文句子的句式特征;
模型生成模块,根据所述收集模块收集的所述英文单词、所述基本释义以及所述句式特征分析模块得到的所述句式特征训练生成语义模型;在语义模型中建立英文单词、基本释义以及句式特征三者之间的对应关系;
语料获取模块,获取英文语料;
语料特征获取模块,分析所述语料获取模块获取的所述英文语料得到对应的语料特征;
解析模块,根据所述模型生成模块生成的所述语义模型解析所述语料特征获取模块获取的所述语料特征得到所述英文语料对应的语义。
7.根据权利要求6所述的英文单词语义解析的系统,其特征在于,所述句式特征分析模块具体包括:
单词时态分析单元,分析同一个基本释义下,每一个英文句子中所述英文单词的单词时态;
分词关系分析单元,对所述英文句子进行分词得到句式分词,并且分析所述句式分词之间的配合关系;
句式特征分析单元,根据所述单词时态分析单元得到的所述单词时态、所述分词关系分析单元得到的所述句式分词以及所述配合关系得到每个基本释义对应英文句子的所述句式特征。
8.根据权利要求6所述的英文单词语义解析的系统,其特征在于,所述语料特征获取模块具体包括:
语料时态分析单元,分析所述英文语料,获取其中具有多个基本释义的语料单词及对应的语料时态;
分词单元,对所述英文语料进行分词得到语料分词;
语料关系分析单元,分析所述分词单元得到的所述语料分词之间的语料配合关系;
语料特征获取单元,根据所述语料时态分析单元得到的所述语料单词、所述分词单元得到的所述语料分词以及所述语料关系分析单元得到的所述语料配合关系得到所述语料特征。
9.根据权利要求8所述的英文单词语义解析的系统,其特征在于,所述解析模块具体包括:
释义解析单元,根据所述语义模型解析所述语料特征,得到所述语料单词对应的语料释义;
语义解析单元,根据所述释义解析单元得到的所述语料释义解析得到所述英文语料对应的所述语义;
时态处理单元,根据所述语义模型分析所述语料时态分析单元得到的所述语料单词对应的所述语料时态是否正确,若错误,发出提示信息。
10.根据权利要求8所述的英文单词语义解析的系统,其特征在于,所述解析模块还包括:
顺序分析单元,根据所述语义模型解析和所述语料特征分析所述英文语料中包含的所有的英文单词的单词顺序是否正确;
语义处理单元,若所述顺序分析单元分析所述单词顺序正确,则解析所述英文语料得到对应的语义;
所述语义处理单元,若所述顺序分析单元分析所述单词顺序错误,则根据所述语义模型解析对所述单词顺序进行调整,然后解析所述英文语料得到对应的语义。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910214806.3A CN109918677B (zh) | 2019-03-21 | 2019-03-21 | 一种英文单词语义解析的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910214806.3A CN109918677B (zh) | 2019-03-21 | 2019-03-21 | 一种英文单词语义解析的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109918677A CN109918677A (zh) | 2019-06-21 |
CN109918677B true CN109918677B (zh) | 2023-06-27 |
Family
ID=66965988
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910214806.3A Active CN109918677B (zh) | 2019-03-21 | 2019-03-21 | 一种英文单词语义解析的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109918677B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110610630B (zh) * | 2019-08-02 | 2021-05-14 | 广州千课教育科技有限公司 | 一种基于错误离散度检查的智能英语教学系统 |
CN111581970B (zh) * | 2020-05-12 | 2023-01-24 | 厦门市美亚柏科信息股份有限公司 | 一种网络语境的文本识别方法、装置及存储介质 |
CN112417900A (zh) * | 2020-11-25 | 2021-02-26 | 北京乐我无限科技有限责任公司 | 一种翻译方法、装置、电子设备及计算机可读存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106855854A (zh) * | 2016-12-29 | 2017-06-16 | 北京奇虎科技有限公司 | 一种英文信息的识别方法和装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012141679A (ja) * | 2010-12-28 | 2012-07-26 | Nippon Telegr & Teleph Corp <Ntt> | 訓練データ獲得装置、訓練データ獲得方法、及びそのプログラム |
US9251141B1 (en) * | 2014-05-12 | 2016-02-02 | Google Inc. | Entity identification model training |
CN104484411B (zh) * | 2014-12-16 | 2017-12-22 | 中国科学院自动化研究所 | 一种基于词典的语义知识库的构建方法 |
CN106919689B (zh) * | 2017-03-03 | 2018-05-11 | 中国科学技术信息研究所 | 基于术语释义知识单元的专业领域知识图谱动态构建方法 |
CN107195295B (zh) * | 2017-05-04 | 2020-06-23 | 百度在线网络技术(北京)有限公司 | 基于中英文混合词典的语音识别方法及装置 |
US11113599B2 (en) * | 2017-06-22 | 2021-09-07 | Adobe Inc. | Image captioning utilizing semantic text modeling and adversarial learning |
CN107797995A (zh) * | 2017-11-20 | 2018-03-13 | 语联网(武汉)信息技术有限公司 | 一种中英文片段语料生成方法 |
CN109376360B (zh) * | 2018-10-29 | 2023-10-20 | 广东小天才科技有限公司 | 一种辅助学习语言的方法和装置 |
-
2019
- 2019-03-21 CN CN201910214806.3A patent/CN109918677B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106855854A (zh) * | 2016-12-29 | 2017-06-16 | 北京奇虎科技有限公司 | 一种英文信息的识别方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109918677A (zh) | 2019-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8170868B2 (en) | Extracting lexical features for classifying native and non-native language usage style | |
CN111369996A (zh) | 一种特定领域的语音识别文本纠错方法 | |
CN109918677B (zh) | 一种英文单词语义解析的方法及系统 | |
CN111292751B (zh) | 语义解析方法及装置、语音交互方法及装置、电子设备 | |
CN1742273A (zh) | 多模态语音-语音语言翻译和显示 | |
KR20110038474A (ko) | 문장경계 인식 장치 및 방법 | |
CN114580382A (zh) | 文本纠错方法以及装置 | |
Dickinson et al. | Language and computers | |
US20230069935A1 (en) | Dialog system answering method based on sentence paraphrase recognition | |
CN114416942A (zh) | 一种基于深度学习的自动化问答方法 | |
CN110705262A (zh) | 一种改进的应用于医技检查报告的智能纠错方法 | |
CN111881297A (zh) | 语音识别文本的校正方法及装置 | |
CN115512696A (zh) | 模拟训练方法及车辆 | |
CN113822052A (zh) | 一种文本错误检测方法、装置、电子设备及存储介质 | |
CN116561275A (zh) | 对象理解方法、装置、设备及存储介质 | |
Sen et al. | Bangla natural language processing: A comprehensive review of classical machine learning and deep learning based methods | |
CN112071304B (zh) | 一种语意分析方法及装置 | |
Hladek et al. | Unsupervised spelling correction for Slovak | |
Tang et al. | Modelling L1 and the artificial language during artificial language learning | |
Mekki et al. | COTA 2.0: An automatic corrector of tunisian Arabic social media texts | |
KR102072708B1 (ko) | 텍스트 콘텐츠의 장르를 추론하는 방법 및 컴퓨터 프로그램 | |
Goonawardena et al. | Automated spelling checker and grammatical error detection and correction model for sinhala language | |
KR101638953B1 (ko) | 온라인상 텍스트 자동분석·수정시스템 | |
Navoda et al. | Automated spelling and grammar checker tool for sinhala | |
CN117454906B (zh) | 一种基于自然语言处理和机器学习的文字校对方法与系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |