CN109614624A - 一种英文语句的识别方法及电子设备 - Google Patents

一种英文语句的识别方法及电子设备 Download PDF

Info

Publication number
CN109614624A
CN109614624A CN201811521905.8A CN201811521905A CN109614624A CN 109614624 A CN109614624 A CN 109614624A CN 201811521905 A CN201811521905 A CN 201811521905A CN 109614624 A CN109614624 A CN 109614624A
Authority
CN
China
Prior art keywords
target
preposition
english
verb
noun
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811521905.8A
Other languages
English (en)
Other versions
CN109614624B (zh
Inventor
崔颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Genius Technology Co Ltd
Original Assignee
Guangdong Genius Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Genius Technology Co Ltd filed Critical Guangdong Genius Technology Co Ltd
Priority to CN201811521905.8A priority Critical patent/CN109614624B/zh
Publication of CN109614624A publication Critical patent/CN109614624A/zh
Application granted granted Critical
Publication of CN109614624B publication Critical patent/CN109614624B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及电子设备技术领域,公开一种英文语句的识别方法及电子设备,包括:获取待批改英文作文中的目标英文语句,目标英文语句中包含目标介词、目标名词以及目标动词;计算目标介词和目标名词的第一共现程度,以及计算目标介词和目标动词的第二共现程度;根据第一共现程度和第二共现程度计算得到对数似然比;根据对数似然比确定目标介词修饰的目标词性,目标词性为名词或动词。实施本发明实施例,能够根据英文语句中的介词和名词的共现程度以及介词和动词的共现程度计算得到对数似然比,进而根据该对数似然比确定介词修饰的词性,以使电子设备根据计算得到的结果对英文语句进行识别,提高了识别英文语句的含义的准确性。

Description

一种英文语句的识别方法及电子设备
技术领域
本发明涉及电子设备技术领域,具体涉及一种英文语句的识别方法及电子设备。
背景技术
目前,市面上的家教机、学习机等电子设备可以对学生写的英文作文进行自动化批改,电子设备对英文作文进行批改的方式通常为:获取英文作文中包含的英文语句,当检测出每条英文语句不存在语法错误以及拼写错误时,识别每条英文语句的含义,并根据每条英文语句的含义确定该英文作文的写作水平。然而,在实践中发现,当英文语句中的介词既可以修饰名词又可以修饰动词时,电子设备可能无法准确的判断介词修饰的词性,从而导致电子设备无法准确的识别英文语句的含义,进而影响电子设备批改英文作文的准确性。
发明内容
本发明实施例公开一种英文语句的识别方法及电子设备,能够通过确定英文语句中介词修饰的词性,从而提高识别英文语句的含义的准确性。
本发明实施例第一方面公开一种英文语句的识别方法,所述方法包括:
获取待批改英文作文中的目标英文语句,所述目标英文语句中包含目标介词、目标名词以及目标动词;
计算所述目标介词和所述目标名词的第一共现程度,以及计算所述目标介词和所述目标动词的第二共现程度;
根据所述第一共现程度和所述第二共现程度计算得到对数似然比;
根据所述对数似然比确定所述目标介词修饰的目标词性,所述目标词性为名词或动词。
作为一种可选的实施方式,在本发明实施例第一方面中,所述获取待批改英文作文中的目标英文语句,包括:
获取待批改英文作文;
识别所述待批改英文作文中的英文语句;
检测所述英文语句中包含的词性,所述词性至少包括名词、动词、介词、形容词以及副词;
从所述英文语句中获取包含名词、动词以及介词的目标英文语句。
作为一种可选的实施方式,在本发明实施例第一方面中,所述计算所述目标介词和所述目标名词的第一共现程度,以及计算所述目标介词和所述目标动词的第二共现程度,包括:
生成所述目标介词修饰所述目标名词的第一语法树,以及生成所述目标介词修饰所述目标动词的第二语法树;
根据所述第一语法树计算得到所述目标介词修饰所述目标名词的第一概率,并将所述第一概率确定为所述目标介词和所述目标名词的第一共现程度;
根据所述第二语法树计算得到所述目标介词修饰所述目标动词的第二概率,并将所述第二概率确定为所述目标介词和所述目标动词的第二共现程度。
作为一种可选的实施方式,在本发明实施例第一方面中,所述根据所述对数似然比确定所述目标介词修饰的目标词性之后,所述方法还包括:
以所述目标介词修饰的所述目标词性为依据,识别所述目标英文语句的含义;
根据所述目标英文语句的含义分析得到所述目标英文作文的含义。
作为一种可选的实施方式,在本发明实施例第一方面中,所述根据所述对数似然比确定所述目标介词修饰的目标词性,包括:
判断所述对数自然比是否大于预设阈值;
如果是,确定所述目标介词修饰的目标词性为目标名词;
如果否,确定所述目标介词修饰的目标词性为目标动词。
本发明实施例第二方面公开一种电子设备,包括:
获取单元,用于获取待批改英文作文中的目标英文语句,所述目标英文语句中包含目标介词、目标名词以及目标动词;
第一计算单元,用于计算所述目标介词和所述目标名词的第一共现程度,以及计算所述目标介词和所述目标动词的第二共现程度;
第二计算单元,用于根据所述第一共现程度和所述第二共现程度计算得到对数似然比;
确定单元,用于根据所述对数似然比确定所述目标介词修饰的目标词性,所述目标词性为名词或动词。
作为一种可选的实施方式,在本发明实施例第二方面中,所述获取单元包括:
第一获取子单元,用于获取待批改英文作文;
识别子单元,用于识别所述待批改英文作文中的英文语句;
检测子单元,用于检测所述英文语句中包含的词性,所述词性至少包括名词、动词、介词、形容词以及副词;
第二获取子单元,用于从所述英文语句中获取包含名词、动词以及介词的目标英文语句。
作为一种可选的实施方式,在本发明实施例第二方面中,所述第一计算单元包括:
生成子单元,用于生成所述目标介词修饰所述目标名词的第一语法树,以及生成所述目标介词修饰所述目标动词的第二语法树;
计算子单元,用于根据所述第一语法树计算得到所述目标介词修饰所述目标名词的第一概率,并将所述第一概率确定为所述目标介词和所述目标名词的第一共现程度;
所述计算子单元,还用于根据所述第二语法树计算得到所述目标介词修饰所述目标动词的第二概率,并将所述第二概率确定为所述目标介词和所述目标动词的第二共现程度。
作为一种可选的实施方式,在本发明实施例第二方面中,所述电子设备还包括:
识别单元,用于在所述确定单元根据所述对数似然比确定所述目标介词修饰的目标词性之后,以所述目标介词修饰的所述目标词性为依据,识别所述目标英文语句的含义;
分析单元,用于根据所述目标英文语句的含义分析得到所述目标英文作文的含义。
作为一种可选的实施方式,在本发明实施例第二方面中,所述确定单元包括:
判断子单元,用于判断所述对数自然比是否大于预设阈值;
第一确定子单元,用于在所述第一判断子单元的判断结果为是时,确定所述目标介词修饰的目标词性为目标名词;
第二确定子单元,用于在所述第一判断子单元的判断结果为否时,确定所述目标介词修饰的目标词性为目标动词。
本发明实施例第三方面公开另一种电子设备,包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行第一方面的任意一种方法的部分或全部步骤。
本发明实施例第四方面公开一种计算机可读存储介质,所述计算机可读存储介质存储了程序代码,其中,所述程序代码包括用于执行第一方面的任意一种方法的部分或全部步骤的指令。
本发明实施例第五方面公开一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面的任意一种方法的部分或全部步骤。
本发明实施例第六方面公开一种应用发布平台,所述应用发布平台用于发布计算机程序产品,其中,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面的任意一种方法的部分或全部步骤。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,获取待批改英文作文中的目标英文语句,目标英文语句中包含目标介词、目标名词以及目标动词;计算目标介词和目标名词的第一共现程度,以及计算目标介词和目标动词的第二共现程度;根据第一共现程度和第二共现程度计算得到对数似然比;根据对数似然比确定目标介词修饰的目标词性,目标词性为名词或动词。可见,实施本发明实施例,能够根据英文语句中的介词和名词的共现程度以及介词和动词的共现程度计算得到对数似然比,进而根据该对数似然比确定介词修饰的词性,以使电子设备根据计算得到的结果对英文语句进行识别,提高了识别英文语句的含义的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种英文语句的识别方法的流程示意图;
图2是本发明实施例公开的另一种英文语句的识别方法的流程示意图;
图3是本发明实施例公开的另一种英文语句的识别方法的流程示意图;
图4是本发明实施例公开的一种电子设备的结构示意图;
图5是本发明实施例公开的另一种电子设备的结构示意图;
图6是本发明实施例公开的另一种电子设备的结构示意图;
图7是本发明实施例公开的另一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例及附图中的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例公开一种英文语句的识别方法及电子设备,能够根据英文语句中的介词和名词的共现程度以及介词和动词的共现程度对英文语句进行识别,提高了识别英文语句的含义的准确性。以下分别进行详细说明。
实施例一
请参阅图1,图1是本发明实施例公开的一种英文语句的识别方法的流程示意图。如图1所示,该英文语句的识别方法可以包括以下步骤:
101、电子设备获取待批改英文作文中的目标英文语句,该目标英文语句中包含目标介词、目标名词以及目标动词。
本发明实施例中,待批改英文作文可以为用户在电子设备上输入的英文作文,也可以为用户在纸面上书写的英文作文,通过电子设备的摄像头拍摄得到包含该英文作文的图片,从该图片中识别得到的英文作文,对此,本发明实施例不做限定。
本发明实施例中,获取的目标英文语句中需要包含介词、名词以及动词,由于介词既可以修饰名词也可以修饰动词,因此当一条英文语句中同时包含介词、名词以及动词时,既可以将介词理解为修饰名词,也可以将介词理解为修饰动词,从而导致歧义的产生,所以电子设备需要确定介词修饰的词性,以使电子设备准确的识别英文语句的含义。
作为一种可选的实施方式,电子设备执行步骤101之前,还可以执行以下步骤:
当检测到用户输入的批改指令时,电子设备获取该批改指令对应的待批改内容;
电子设备识别该待批改内容中是否包含待批改英文作文;
如果是,电子设备获取该待批改作文。
其中,实施这种实施方式,可以通过用户输入的批改指令获取需要批改的内容,并从需要批改的内容中确定待待批改英文作文,从而保证了获取到的待批改英文作文的准确性。
102、电子设备计算目标介词和目标名词的第一共现程度,以及计算目标介词和目标动词的第二共现程度。
本发明实施例中,共现程度可以理解为两种词性组合的可能性,因此第一共现程度可以理解为表示目标介词与目标名词组合的可能性,目标介词和目标名词组合可以得到修饰名词的介词短语;此外,第二共现程度可以理解为表示目标介词与目标动词组合的可能性,目标介词和目标动词组合可以得到修饰动词的介词短语。
作为一种可选的实施方式,电子设备执行步骤101之后,以及执行步骤102之前,还可以执行以下步骤:
电子设备检测该目标英文语句中是否存在拼写错误的单词;
如果不存在拼写错误的单词,电子设备检测该目标英文语句中是否存在语法错误;
如果不存在语法错误,电子设备确定该目标英文语句中的目标介词、目标名词以及目标动词。
其中,实施这种实施方式,可以在确定目标英文语句中不存在拼写错误的单词以及语法错误之后,获取目标介词、目标名词以及目标动词,从而避免电子设备对于存在基础错误的英文语句进行识别,提高了电子设备识别英文语句的效率。
103、电子设备根据第一共现程度和第二共现程度计算得到对数似然比。
本发明实施例中,对数似然比的值可以表示当前英文语句中的目标介词修饰的词性,电子设备根据第一共现程度和第二共现程度计算得到对数似然比的计算公式可以为:
其中,F(v,n,p)可以为对数似然比,p(p|n)可以表示目标介词修饰目标名词的第一共现程度,p(p|v)可以表示目标介词修饰目标动词的第二共现程度。
104、电子设备根据对数似然比确定目标介词修饰的目标词性,目标词性为名词或动词。
本发明实施例中,目标词性可以为上述步骤中的目标名词或目标动词,电子设备根据计算得到的对数似然比的值可以确定介词修饰的词性。
在图1所描述的方法中,能够根据英文语句中的介词和名词的共现程度以及介词和动词的共现程度对英文语句进行识别,提高了识别英文语句的含义的准确性。此外,实施图1所描述的方法,保证了获取到的待批改英文作文的准确性。此外,实施图1所描述的方法,提高了电子设备识别英文语句的效率。
实施例二
请参阅图2,图2是本发明实施例公开的另一种英文语句的识别方法的流程示意图。如图2所示,该英文语句的识别方法可以包括以下步骤:
201、电子设备获取待批改英文作文。
本发明实施例中,电子设备可以对整篇待批改英文作文进行批改,由于一篇英文作文中可能存在不止一条同时包含介词、名词以及动词的英文语句,因此如果不确定每条英文语句中的介词修饰的词性,则可能导致电子设备对于整篇待批改英文作文的含义识别错误,所以电子设备需要对待批改英文作文中存在的同时包含介词、名词以及动词的英文语句的介词进行分析,从而使得电子设备准确的识别待批改英文作文的含义。
202、电子设备识别待批改英文作文中的英文语句,该目标英文语句中包含目标介词、目标名词以及目标动词。
203、电子设备检测英文语句中包含的词性,词性至少包括名词、动词、介词、形容词以及副词。
204、电子设备从英文语句中获取包含名词、动词以及介词的目标英文语句。
本发明实施例中,实施上述的步骤201~步骤204,可以识别待批改英文作文中的每一句英文语句,并识别出每一句英文语句中包含的单词的词性,并从所有的英文语句中将同时包含名词、动词以及介词的英文语句确定为电子设备需要确定介词修饰词性的目标英文语句,从而保证每个同时包含名词、动词以及介词的英文语句都可以在确定介词修饰的词性之后再被识别含义,从而保证了英文语句含义识别的准确性。
205、电子设备生成目标介词修饰目标名词的第一语法树,以及生成目标介词修饰目标动词的第二语法树。
本发明实施例中,第一语法树的生成过程可以为:电子设备可以确定目标介词修饰的是目标名词,并以目标介词修饰目标名词为基础,确定目标英文语句的语法结构,并根据该语法结构生成该目标英文语句对应的第一语法树;第二语法树的生成过程可以为:电子设备可以确定目标介词修饰的是目标动词,并以目标介词修饰目标动词为基础,确定目标英文语句的语法结构,并根据该语法结构生成该目标英文语句对应的第二语法树。
206、电子设备根据第一语法树计算得到目标介词修饰目标名词的第一概率,并将第一概率确定为目标介词和目标名词的第一共现程度。
207、电子设备根据第二语法树计算得到目标介词修饰目标动词的第二概率,并将第二概率确定为目标介词和目标动词的第二共现程度。
本发明实施例中,实施上述的步骤205~步骤207,可以根据介词修饰名词的可能性生成第一语法树,并根据介词修饰动词的可能性生成第二语法树,并根据第一语法树和第二语法树得到介词和名词的第一共现程度以及介词和动词的共现程度,以提高计算共现程度的准确性。
208、电子设备根据第一共现程度和第二共现程度计算得到对数似然比。
209、电子设备根据对数似然比确定目标介词修饰的目标词性,目标词性为名词或动词。
在图2所描述的方法中,能够根据英文语句中的介词和名词的共现程度以及介词和动词的共现程度对英文语句进行识别,提高了识别英文语句的含义的准确性。此外,实施图2所描述的方法,保证了英文语句含义识别的准确性。此外,实施图2所描述的方法,可以提高计算共现程度的准确性。
实施例三
请参阅图3,图3是本发明实施例公开的另一种英文语句的识别方法的流程示意图。如图3所示,该英文语句的识别方法可以包括以下步骤:
301、电子设备获取待批改英文作文中的目标英文语句,该目标英文语句中包含目标介词、目标名词以及目标动词。
302、电子设备计算目标介词和目标名词的第一共现程度,以及计算目标介词和目标动词的第二共现程度。
303、电子设备根据第一共现程度和第二共现程度计算得到对数似然比。
304、电子设备判断对数自然比是否大于预设阈值,如果是,执行步骤305;如果否,执行步骤306~步骤308。
本发明实施例中,可以根据实施例一中的对数似然比的计算公式计算得到对数似然比,预设阈值可以设置为0,如果对数似然比大于0,可以认为目标介词修饰目标名词的第一共现程度大于目标介词修饰目标动词的第二共现程度,因此确定目标介词修饰目标名词;如果对数似然比小于0,可以认为目标介词修饰目标名词的第一共现程度小于目标介词修饰目标动词的第二共现程度,因此确定目标介词修饰目标动词。
305、电子设备确定目标介词修饰的目标词性为目标名词,并执行步骤307~步骤308。
306、电子设备确定目标介词修饰的目标词性为目标动词。
本发明实施例中,实施上述的步骤304~步骤306,可以根据电子设备计算得到的对数自然比的值确定介词修饰的词性,从而保证确定介词修饰词性的方式更加具有依据。
307、电子设备以目标介词修饰的目标词性为依据,识别目标英文语句的含义。
308、电子设备根据目标英文语句的含义分析得到目标英文作文的含义。
本发明实施例中,实施上述的步骤307~步骤308,可以根据确定的介词修饰的词性对当前英文语句的含义进行分析,进而根据每条确定介词修饰的词性的英文语句分析整篇英文文章的含义,以使分析得到的英文文章的含义更加准确。
作为一种可选的实施方式,电子设备执行步骤308之后,还可以执行以下步骤:
电子设备获取该待批改英文作文的标准含义;
电子设备分析该目标英文作文的含义与该标准含义的相似度;
在检测到该目标英文作文的含义与该标准含义的相似度高于预设相似度时,电子设备确定该目标英文作文符合写作要求。
其中,实施这种实施方式,可以获取到目标英文作文的标准写作要求,并分析目标英文作文是否符合标准的写作要求,从而对该目标英文作文进行准确的批改。
在图3所描述的方法中,能够根据英文语句中的介词和名词的共现程度以及介词和动词的共现程度对英文语句进行识别,提高了识别英文语句的含义的准确性。此外,实施图3所描述的方法,可以保证确定介词修饰词性的方式更加具有依据。此外,实施图3所描述的方法,可以使分析得到的英文文章的含义更加准确。此外,实施图3所描述的方法,可以对目标英文作文进行准确的批改。
实施例四
请参阅图4,图4是本发明实施例公开的一种电子设备的结构示意图。如图4所示,该电子设备可以包括:
获取单元401,用于获取待批改英文作文中的目标英文语句,该目标英文语句中包含目标介词、目标名词以及目标动词。
作为一种可选的实施方式,获取单元401还可以用于:
当检测到用户输入的批改指令时,获取该批改指令对应的待批改内容;
识别该待批改内容中是否包含待批改英文作文;
如果是,获取该待批改作文。
其中,实施这种实施方式,可以通过用户输入的批改指令获取需要批改的内容,并从需要批改的内容中确定待待批改英文作文,从而保证了获取到的待批改英文作文的准确性。
第一计算单元402,用于计算获取单元401获取的目标介词和目标名词的第一共现程度,以及计算获取单元401获取的目标介词和目标动词的第二共现程度。
作为一种可选的实施方式,第一计算单元402还可以用于:
检测该目标英文语句中是否存在拼写错误的单词;
如果不存在拼写错误的单词,检测该目标英文语句中是否存在语法错误;
如果不存在语法错误,确定该目标英文语句中的目标介词、目标名词以及目标动词。
其中,实施这种实施方式,可以在确定目标英文语句中不存在拼写错误的单词以及语法错误之后,获取目标介词、目标名词以及目标动词,从而避免电子设备对于存在基础错误的英文语句进行识别,提高了电子设备识别英文语句的效率。
第二计算单元403,用于根据第一计算单元402得到的第一共现程度和第二共现程度计算得到对数似然比。
确定单元404,用于根据第二计算单元403得到的对数似然比确定获取单元401获取的目标介词修饰的目标词性,目标词性为名词或动词。
可见,实施图4所描述的电子设备,能够根据英文语句中的介词和名词的共现程度以及介词和动词的共现程度对英文语句进行识别,提高了识别英文语句的含义的准确性。此外,实施图4所描述的电子设备,保证了获取到的待批改英文作文的准确性。此外,实施图4所描述的电子设备,提高了电子设备识别英文语句的效率。
实施例五
请参阅图5,图5是本发明实施例公开的另一种电子设备的结构示意图。其中,图5所示的电子设备是由图4所示的电子设备进行优化得到的。与图4所示的电子设备相比,图5所示的电子设备的获取单元401可以包括:
第一获取子单元4011,用于获取待批改英文作文。
识别子单元4012,用于识别第一获取子单元4011获取的待批改英文作文中的英文语句。
检测子单元4013,用于检测识别子单元4012识别的英文语句中包含的词性,该词性至少包括名词、动词、介词、形容词以及副词。
第二获取子单元4014,用于从识别子单元4012识别的英文语句中获取包含检测子单元4013得到的名词、动词以及介词的目标英文语句。
本发明实施例中,可以识别待批改英文作文中的每一句英文语句,并识别出每一句英文语句中包含的单词的词性,并从所有的英文语句中将同时包含名词、动词以及介词的英文语句确定为电子设备需要确定介词修饰词性的目标英文语句,从而保证每个同时包含名词、动词以及介词的英文语句都可以在确定介词修饰的词性之后再被识别含义,从而保证了英文语句含义识别的准确性。
作为一种可选的实施方式,图5所示的电子设备的第一计算单元402可以包括:
生成子单元4021,用于生成目标介词修饰目标名词的第一语法树,以及生成目标介词修饰目标动词的第二语法树;
计算子单元4022,用于根据生成子单元4021生成的第一语法树计算得到目标介词修饰目标名词的第一概率,并将第一概率确定为目标介词和目标名词的第一共现程度;
计算子单元4022,还用于根据生成子单元4021生成的第二语法树计算得到目标介词修饰目标动词的第二概率,并将第二概率确定为目标介词和目标动词的第二共现程度。
其中,实施这种实施方式,可以根据介词修饰名词的可能性生成第一语法树,并根据介词修饰动词的可能性生成第二语法树,并根据第一语法树和第二语法树得到介词和名词的第一共现程度以及介词和动词的共现程度,以提高计算共现程度的准确性。
可见,实施图5所描述的电子设备,能够根据英文语句中的介词和名词的共现程度以及介词和动词的共现程度对英文语句进行识别,提高了识别英文语句的含义的准确性。此外,实施图5所描述的电子设备,保证了英文语句含义识别的准确性。此外,实施图5所描述的电子设备,可以提高计算共现程度的准确性。
实施例六
请参阅图6,图6是本发明实施例公开的另一种电子设备的结构示意图。其中,图6所示的电子设备是由图5所示的电子设备进行优化得到的。与图5所示的电子设备相比,图6所示的电子设备还可以包括:
识别单元405,用于在确定单元404根据对数似然比确定目标介词修饰的目标词性之后,以目标介词修饰的目标词性为依据,识别目标英文语句的含义;
分析单元406,用于根据识别单元405识别的目标英文语句的含义分析得到目标英文作文的含义。
本发明实施例中,可以根据确定的介词修饰的词性对当前英文语句的含义进行分析,进而根据每条确定介词修饰的词性的英文语句分析整篇英文文章的含义,以使分析得到的英文文章的含义更加准确。
作为一种可选的实施方式,分析单元406还可以用于:
获取该待批改英文作文的标准含义;
分析该目标英文作文的含义与该标准含义的相似度;
在检测到该目标英文作文的含义与该标准含义的相似度高于预设相似度时,确定该目标英文作文符合写作要求。
其中,实施这种实施方式,可以获取到目标英文作文的标准写作要求,并分析目标英文作文是否符合标准的写作要求,从而对该目标英文作文进行准确的批改。
作为一种可选的实施方式,图5所示的电子设备的确定单元404可以包括:
判断子单元4041,用于判断第二计算单元403得到的对数自然比是否大于预设阈值;
第一确定子单元4042,用于在第一判断子单元4041的判断结果为是时,确定获取单元401获取的目标介词修饰的目标词性为目标名词;
第二确定子单元4043,用于在第一判断子单元4041的判断结果为否时,确定获取单元401获取的目标介词修饰的目标词性为目标动词。
其中,实施这种实施方式,可以根据电子设备计算得到的对数自然比的值确定介词修饰的词性,从而保证确定介词修饰词性的方式更加具有依据。
可见,实施图6所描述的电子设备,能够根据英文语句中的介词和名词的共现程度以及介词和动词的共现程度对英文语句进行识别,提高了识别英文语句的含义的准确性。此外,实施图6所描述的电子设备,可以使分析得到的英文文章的含义更加准确。此外,实施图6所描述的电子设备,可以对目标英文作文进行准确的批改。此外,实施图6所描述的电子设备,可以保证确定介词修饰词性的方式更加具有依据。
实施例七
请参阅图7,图7是本发明实施例公开的另一种电子设备的结构示意图。如图7所示,该电子设备可以包括:
存储有可执行程序代码的存储器701;
与存储器701耦合的处理器702;
其中,处理器702调用存储器701中存储的可执行程序代码,执行以上各方法实施例中的方法的部分或全部步骤。
本发明实施例还公开一种计算机可读存储介质,其中,计算机可读存储介质存储了程序代码,其中,程序代码包括用于执行以上各方法实施例中的方法的部分或全部步骤的指令。
本发明实施例还公开一种计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行如以上各方法实施例中的方法的部分或全部步骤。
本发明实施例还公开一种应用发布平台,其中,应用发布平台用于发布计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行如以上各方法实施例中的方法的部分或全部步骤。
应理解,说明书通篇中提到的“本发明实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“在本发明实施例中”未必一定指相同的实施例。此外,这些特定特征、结构或特性可以以任意适合的方式结合在一个或多个实施例中。本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在本发明的各种实施例中,应理解,上述各过程的序号的大小并不意味着执行顺序的必然先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
另外,本文中术语“系统”和“网络”在本文中常可互换使用。应理解,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
在本发明所提供的实施例中,应理解,“与A对应的B”表示B与A相关联,根据A可以确定B。但还应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可位于一个地方,或者也可以分布到多个网络单元上。可根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可获取的存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分,可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本发明的各个实施例上述方法的部分或全部步骤。
以上对本发明实施例公开的一种英文语句的识别方法及电子设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种英文语句的识别方法,其特征在于,所述方法包括:
获取待批改英文作文中的目标英文语句,所述目标英文语句中包含目标介词、目标名词以及目标动词;
计算所述目标介词和所述目标名词的第一共现程度,以及计算所述目标介词和所述目标动词的第二共现程度;
根据所述第一共现程度和所述第二共现程度计算得到对数似然比;
根据所述对数似然比确定所述目标介词修饰的目标词性,所述目标词性为名词或动词。
2.根据权利要求1所述的方法,其特征在于,所述获取待批改英文作文中的目标英文语句,包括:
获取待批改英文作文;
识别所述待批改英文作文中的英文语句;
检测所述英文语句中包含的词性,所述词性至少包括名词、动词、介词、形容词以及副词;
从所述英文语句中获取包含名词、动词以及介词的目标英文语句。
3.根据权利要求1或2所述的方法,其特征在于,所述计算所述目标介词和所述目标名词的第一共现程度,以及计算所述目标介词和所述目标动词的第二共现程度,包括:
生成所述目标介词修饰所述目标名词的第一语法树,以及生成所述目标介词修饰所述目标动词的第二语法树;
根据所述第一语法树计算得到所述目标介词修饰所述目标名词的第一概率,并将所述第一概率确定为所述目标介词和所述目标名词的第一共现程度;
根据所述第二语法树计算得到所述目标介词修饰所述目标动词的第二概率,并将所述第二概率确定为所述目标介词和所述目标动词的第二共现程度。
4.根据权利要求1~3任一项所述的方法,其特征在于,所述根据所述对数似然比确定所述目标介词修饰的目标词性之后,所述方法还包括:
以所述目标介词修饰的所述目标词性为依据,识别所述目标英文语句的含义;
根据所述目标英文语句的含义分析得到所述目标英文作文的含义。
5.根据权利要求1~4任一项所述的方法,其特征在于,所述根据所述对数似然比确定所述目标介词修饰的目标词性,包括:
判断所述对数自然比是否大于预设阈值;
如果是,确定所述目标介词修饰的目标词性为目标名词;
如果否,确定所述目标介词修饰的目标词性为目标动词。
6.一种电子设备,其特征在于,包括:
获取单元,用于获取待批改英文作文中的目标英文语句,所述目标英文语句中包含目标介词、目标名词以及目标动词;
第一计算单元,用于计算所述目标介词和所述目标名词的第一共现程度,以及计算所述目标介词和所述目标动词的第二共现程度;
第二计算单元,用于根据所述第一共现程度和所述第二共现程度计算得到对数似然比;
确定单元,用于根据所述对数似然比确定所述目标介词修饰的目标词性,所述目标词性为名词或动词。
7.根据权利要求6所述的电子设备,其特征在于,所述获取单元包括:
第一获取子单元,用于获取待批改英文作文;
识别子单元,用于识别所述待批改英文作文中的英文语句;
检测子单元,用于检测所述英文语句中包含的词性,所述词性至少包括名词、动词、介词、形容词以及副词;
第二获取子单元,用于从所述英文语句中获取包含名词、动词以及介词的目标英文语句。
8.根据权利要求6或7所述的电子设备,其特征在于,所述第一计算单元包括:
生成子单元,用于生成所述目标介词修饰所述目标名词的第一语法树,以及生成所述目标介词修饰所述目标动词的第二语法树;
计算子单元,用于根据所述第一语法树计算得到所述目标介词修饰所述目标名词的第一概率,并将所述第一概率确定为所述目标介词和所述目标名词的第一共现程度;
所述计算子单元,还用于根据所述第二语法树计算得到所述目标介词修饰所述目标动词的第二概率,并将所述第二概率确定为所述目标介词和所述目标动词的第二共现程度。
9.根据权利要求6~8任一项所述的电子设备,其特征在于,所述电子设备还包括:
识别单元,用于在所述确定单元根据所述对数似然比确定所述目标介词修饰的目标词性之后,以所述目标介词修饰的所述目标词性为依据,识别所述目标英文语句的含义;
分析单元,用于根据所述目标英文语句的含义分析得到所述目标英文作文的含义。
10.根据权利要求6~9任一项所述的电子设备,其特征在于,所述确定单元包括:
判断子单元,用于判断所述对数自然比是否大于预设阈值;
第一确定子单元,用于在所述第一判断子单元的判断结果为是时,确定所述目标介词修饰的目标词性为目标名词;
第二确定子单元,用于在所述第一判断子单元的判断结果为否时,确定所述目标介词修饰的目标词性为目标动词。
CN201811521905.8A 2018-12-12 2018-12-12 一种英文语句的识别方法及电子设备 Active CN109614624B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811521905.8A CN109614624B (zh) 2018-12-12 2018-12-12 一种英文语句的识别方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811521905.8A CN109614624B (zh) 2018-12-12 2018-12-12 一种英文语句的识别方法及电子设备

Publications (2)

Publication Number Publication Date
CN109614624A true CN109614624A (zh) 2019-04-12
CN109614624B CN109614624B (zh) 2023-07-25

Family

ID=66008411

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811521905.8A Active CN109614624B (zh) 2018-12-12 2018-12-12 一种英文语句的识别方法及电子设备

Country Status (1)

Country Link
CN (1) CN109614624B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110750989A (zh) * 2019-10-28 2020-02-04 北京金山数字娱乐科技有限公司 一种语句分析的方法及装置
CN112232057A (zh) * 2020-09-21 2021-01-15 清华大学 基于文本扩展的对抗样本生成方法、装置、介质和设备

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0554063A (ja) * 1991-08-26 1993-03-05 Matsushita Electric Ind Co Ltd 対話型英日機械翻訳システム
JPH11259474A (ja) * 1998-03-10 1999-09-24 Matsushita Electric Ind Co Ltd 機械翻訳装置及び機械翻訳方法
JPH11259473A (ja) * 1998-03-10 1999-09-24 Matsushita Electric Ind Co Ltd 機械翻訳装置及び機械翻訳方法
CN101201820A (zh) * 2007-11-28 2008-06-18 北京金山软件有限公司 一种双语语料库过滤方法及系统
TW201113722A (en) * 2009-10-13 2011-04-16 Inventec Corp Translation system for establishing classes by lexical syntax attribute of language units and method thereof
CN102043770A (zh) * 2009-10-19 2011-05-04 英业达股份有限公司 依据语言单元的词性建立类别的翻译系统及其方法
CN103164390A (zh) * 2011-12-15 2013-06-19 富士通株式会社 文档处理方法和文档处理装置
CN103443787A (zh) * 2011-02-01 2013-12-11 埃森哲环球服务有限公司 用于标识文本关系的系统
CN106202036A (zh) * 2016-06-29 2016-12-07 齐鲁工业大学 一种基于依存约束和知识的动词词义消歧方法和装置
CN107291694A (zh) * 2017-06-27 2017-10-24 北京粉笔未来科技有限公司 一种自动评阅作文的方法和装置、存储介质及终端
CN107608959A (zh) * 2017-09-08 2018-01-19 电子科技大学 一种英文社交媒体短文本地名识别方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0554063A (ja) * 1991-08-26 1993-03-05 Matsushita Electric Ind Co Ltd 対話型英日機械翻訳システム
JPH11259474A (ja) * 1998-03-10 1999-09-24 Matsushita Electric Ind Co Ltd 機械翻訳装置及び機械翻訳方法
JPH11259473A (ja) * 1998-03-10 1999-09-24 Matsushita Electric Ind Co Ltd 機械翻訳装置及び機械翻訳方法
CN101201820A (zh) * 2007-11-28 2008-06-18 北京金山软件有限公司 一种双语语料库过滤方法及系统
TW201113722A (en) * 2009-10-13 2011-04-16 Inventec Corp Translation system for establishing classes by lexical syntax attribute of language units and method thereof
CN102043770A (zh) * 2009-10-19 2011-05-04 英业达股份有限公司 依据语言单元的词性建立类别的翻译系统及其方法
CN103443787A (zh) * 2011-02-01 2013-12-11 埃森哲环球服务有限公司 用于标识文本关系的系统
CN103164390A (zh) * 2011-12-15 2013-06-19 富士通株式会社 文档处理方法和文档处理装置
CN106202036A (zh) * 2016-06-29 2016-12-07 齐鲁工业大学 一种基于依存约束和知识的动词词义消歧方法和装置
CN107291694A (zh) * 2017-06-27 2017-10-24 北京粉笔未来科技有限公司 一种自动评阅作文的方法和装置、存储介质及终端
CN107608959A (zh) * 2017-09-08 2018-01-19 电子科技大学 一种英文社交媒体短文本地名识别方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110750989A (zh) * 2019-10-28 2020-02-04 北京金山数字娱乐科技有限公司 一种语句分析的方法及装置
CN110750989B (zh) * 2019-10-28 2023-09-19 北京金山数字娱乐科技有限公司 一种语句分析的方法及装置
CN112232057A (zh) * 2020-09-21 2021-01-15 清华大学 基于文本扩展的对抗样本生成方法、装置、介质和设备
CN112232057B (zh) * 2020-09-21 2024-03-01 清华大学 基于文本扩展的对抗样本生成方法、装置、介质和设备

Also Published As

Publication number Publication date
CN109614624B (zh) 2023-07-25

Similar Documents

Publication Publication Date Title
US10467114B2 (en) Hierarchical data processor tester
KR101629415B1 (ko) 문법 오류 검출 방법 및 이를 위한 오류검출장치
US9342499B2 (en) Round-trip translation for automated grammatical error correction
CN103493041B (zh) 使用浅层句法分析器自动评估句子的自动句子评估装置及其错误检测设备和方法
Rozovskaya et al. The Illinois-Columbia system in the CoNLL-2014 shared task
CN110276023B (zh) Poi变迁事件发现方法、装置、计算设备和介质
US9646512B2 (en) System and method for automated teaching of languages based on frequency of syntactic models
CN111144100B (zh) 一种问题文本识别方法、装置、电子设备及存储介质
Rozovskaya et al. The UI system in the HOO 2012 shared task on error correction
Rozovskaya et al. Correcting grammatical verb errors
Glass et al. A naive salience-based method for speaker identification in fiction books
CN106610990A (zh) 情感倾向性分析的方法及装置
Crocker Rational models of comprehension: Addressing the performance paradox
CN112668311A (zh) 文本错误的检测方法及装置
CN109614623A (zh) 一种基于句法分析的作文处理方法及系统
CN109614624A (zh) 一种英文语句的识别方法及电子设备
CN110232117B (zh) 句子流畅度检测方法、装置以及终端
CN110287286A (zh) 短文本相似度的确定方法、装置及存储介质
Kaur et al. Spell Checking and Error Correcting System for text paragraphs written in Punjabi Language using Hybrid approach
Islam et al. Correcting different types of errors in texts
CN111079489A (zh) 一种内容识别方法及电子设备
Hladek et al. Unsupervised spelling correction for Slovak
CN106815191B (zh) 修正词的确定方法和装置
Rahman et al. An investigative design based statistical approach for determining Bangla sentence validity
Faisal et al. A rule-based bengali grammar checker

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant