CN103493041A - 使用浅层句法分析器自动评估句子的自动句子评估装置及其错误检测设备和方法 - Google Patents

使用浅层句法分析器自动评估句子的自动句子评估装置及其错误检测设备和方法 Download PDF

Info

Publication number
CN103493041A
CN103493041A CN201280019540.3A CN201280019540A CN103493041A CN 103493041 A CN103493041 A CN 103493041A CN 201280019540 A CN201280019540 A CN 201280019540A CN 103493041 A CN103493041 A CN 103493041A
Authority
CN
China
Prior art keywords
speech
sentence
rule
error
cohesion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201280019540.3A
Other languages
English (en)
Other versions
CN103493041B (zh
Inventor
金承焕
金东南
李银淑
金星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SK Telecom Co Ltd
Original Assignee
SK Telecom Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SK Telecom Co Ltd filed Critical SK Telecom Co Ltd
Publication of CN103493041A publication Critical patent/CN103493041A/zh
Application granted granted Critical
Publication of CN103493041B publication Critical patent/CN103493041B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及用于自动评估句子的错误检测,并提供了一种利用浅层句法分析器来自动评估句子的自动句子评估装置及其错误检测设备和方法,由此通过针对撰写的输入句子利用n-gram生成词性串并基于根据相邻词性之间的连接关系定义的规则(浅层句法分析)对所生成的词性串进行句法分析来检测简单语法错误和句子结构分析错误,并且针对所检测出的错误提示校正草案,从而增加句子评估的准确度。

Description

使用浅层句法分析器自动评估句子的自动句子评估装置及其错误检测设备和方法
技术领域
本公开涉及用于自动评估句子撰写的错误检测,更具体地讲,涉及一种用于自动评估句子的设备和方法以及针对此目的的错误检测设备,其将撰写的输入句子分割成词素,将词性(parts of speech)标注到所分割出的词素,检测各个词性串的简单语法英语撰写错误,并且基于由彼此相邻的词性的连接关系限定的规则来对它们进行句法分析,以提高撰写评估的准确度。
背景技术
近来,韩国SAT和企业分级评估已改变为根据说和写的实际英语表现评估。
即,教育部已开发出NEAT(国家英语能力测试,它是听、阅读理解、说和写的基于互联网的评估)并通过示范来进行实施,并且计划取代公务员考试和SAT的英语测试。在这些英语表现评估中,引入自动撰写评估系统来评估写作能力。
自动撰写评估系统从语法上分析撰写的句子并通过错误检测来评估它是否按照语法撰写。在这种情况下,在分析撰写的句子的处理中,必然需要将句子分割成词素,将词性标注到各个词素,并执行句法分析的处理。然而,传统句法分析未复杂地考虑词汇、词性、含义和上下文相关性,而是仅依赖于词性串信息,由此存在准确度显著降低的问题。
具体地讲,由于自然语言中存在上下文具有相互依赖关系的各种现象,所以通常定义的语法在句法分析方面存在局限。例如,在通过句法分析(syntax analysis)将词句法分析(parse)为“动词”的情况下,由于相邻词的词性,可将其句法分析为“名词”,而非“动词”。在这种情况下,存在通过句法分析提取两个或更多个句法树并且其句法分析变得有歧义的问题。
因此,需要一种通过对标注的输入句子的相邻词性之间的连接关系执行正确的句法分析来增强自动评估系统的解决方案。
发明内容
技术问题
根据一些实施方式,提供了一种使用浅层句法分析器(shallow parser)的自动句子评估装置、错误检测设备及相关方法,由此通过针对撰写的输入句子利用n-gram生成词性串并基于根据相邻词性之间的连接关系定义的规则(浅层句法分析)对所生成的词性串进行句法分析来检测简单语法错误和句子结构错误,针对所检测出的错误提示校正草案,从而增加句子评估的准确度。
技术方案
根据一些实施方式,一种用于自动评估句子的设备包括输入句子分割器、词性标注部、句法分析器、句子评估部和错误检测器。所述输入句子分割器被构造为将撰写的输入句子分割成词素,所述词素是句子的最小单元。所述词性标注部被构造为将词性标注到所分割出的词素。所述句法分析器被构造为基于词性分析句子的句法结构并输出句法树作为分析结果。所述句子评估部被构造为利用由所述句法分析器输出的句法树来评估所述句子语法上是否正确。所述错误检测器被构造为针对由所述词性标注部标注的各个词性利用n-gram生成词性串,基于根据彼此相邻的词性之间的连接关系定义的正则语法规则和上下文无关语法规则分析所生成的词性串以检测句法分析的错误,并针对所检测出的错误提供校正。
根据一些实施方式,一种利用浅层句法分析器来自动评估句子的撰写的错误检测设备包括词性串生成器、浅层句法分析器、错误检测器和错误校正部。所述词性串生成器被构造为针对标注到输入句子的各个词性,利用n-gram按照特定窗口单位生成词性串。所述浅层句法分析器被构造为基于上下文无关语法规则和正则语法规则来对所述词性串进行句法分析,并且计算所述词性串的亲密度。所述错误检测器被构造为根据由所述浅层句法分析器计算出的亲密度来检测错误。所述错误校正部被构造为针对由所述错误检测器检测出的错误提供校正。
根据一些实施方式,一种利用浅层句法分析器来自动评估句子的撰写的错误检测方法包括以下步骤:针对标注到输入句子的各个词性,利用n-gram按照特定窗口单位生成词性串;基于上下文无关语法规则和正则语法规则来对所述词性串进行句法分析,从而计算所述词性串的亲密度;根据所计算出的亲密度来检测错误;以及针对所检测出的错误提供校正。
有益效果
根据本文公开的实施方式,通过考虑语言的典型规则以及相邻词性之间的依赖关系分析撰写的输入句子,具有这样的效果:检测语法错误的准确度增加,以增强自动句子评估的能力。
另外,通过根据预定模式生成词性串并以所生成的词性串为单位执行分析,具有这样的效果:与传统的全句法分析相比,句法分析的歧义减少,并且能够详细检测错误的类型。
附图说明
图1示出根据至少一个实施方式的用于自动撰写评估的错误检测设备的构造。
图2示出根据至少一个实施方式的错误检测设备的详细构造。
图3是示出正则语法的示例的表。
图4是针对根据至少一个实施方式的使用错误检测设备的错误检测方法的方法的流程图。
图5是示出检测错误的具体处理的流程图。
图6是示出通过图4的错误检测方法生成词性串的处理的示例性表。
具体实施方式
以下描述详细参照附图。然而,本领域普通技术人员将理解,以下描述不限于以下具体公开的实施方式,可以按照各种形式实现,并且以下描述的范围不限于以下实施方式。公知的技术、元件、结构和处理将省略,以避免使本公开的主题模糊。
图1示出根据至少一个实施方式的用于自动撰写评估的错误检测设备的构造。
如图1所示,提供有:自动句子评估装置100,其分析撰写的输入句子并评估撰写是否正确;以及错误检测设备200,其检测自动评估句子时的句法分析错误,并针对所检测到的错误提示校正草案。
在图1中,为了更好的理解,示出了错误检测构造(即,错误检测设备200)独立于自动句子评估装置100来构造的示例。然而,另选地,错误检测设备200可形成为包含在自动句子评估装置100中的单个设备。
自动句子评估装置100接收撰写的输入句子作为数据,并且包括输入句子分割器110、词性标注部129、句法分析器130、句子评估部140等作为用于评估输入句子的构造。
输入句子分割器110将撰写的输入句子(以下,称作“输入句子”)分割成句子和词素。
这里,句子的分割表示利用标点符号(例如,句号、问号、感叹号等)将撰写的输入句子分割成多个句子。
分割成词素表示将通过句子的分割所分成的各个句子分割成词素,词素是句子的最小单元。在英语撰写的情况下,由于语言的特性,单词后不会附有后置助词,因此作为最小单元的词素可为单词本身。
词性标注部120将对应的词性标注到在输入句子分割器110中分割出的各个词素。可参照已经存储的词性字典来进行词性的标注。例如,词性的类型包括名词、动词、介词、形容词、副词、冠词、感叹词等。
句法分析器130基于在词性标注部120中标注的词性来分析各个句子的句法结构,并输出句法树作为分析结果。通常,“句法分析”是指分析句子的句法,“句法分析器”是指使得句法树输出以便获知是否可通过语法生成字符串的程序。
在句法分析时,句法分析器130发送标注了词性的句子以使句法分析的错误最小化,并从错误检测设备200接收所检测到的错误的信息以将其应用于句法树。
句子评估部140参照在句法分析器130中提取的句法树,并评估撰写是否正确。撰写的最终结果可在转换为分数之后输出,或者可通过T/F(真/假)标记来输出。
错误检测设备针对从句法分析器130发送来的句子利用n-gram生成词性串,并基于简单语法规则以及根据相邻词性之间的连接关系定义的语法规则来分析所生成的词性串,由此检测到英语撰写中的简单错误以及根据相邻词性之间的连接关系的错误。
另外,错误检测设备200显示所检测到的错误,并向句法分析器130提示校正草案。
图2示出根据至少一个实施方式的错误检测设备的详细构造。
错误检测设备200包括词性串生成器210、浅层句法分析器220、错误检测器230、错误校正部240、形式语法知识DB250、上下文无关语法知识DB260等,如图所示。
词性串生成器210利用n-gram生成针对各个词性的词性串,词性串按照任何窗口大小将在词性标注部120中标注的各个词性联系在一起。
例如,通过词素分割和词性标注将输入句子“I went to go to school.”提取为“I/名词”、“went/动词”、“to/介词”、“go/动词”、“to/介词”、“school/名词”,并且在词性串生成器210中,可通过应用Tri-gram来生成“I went to”、“went to go”、“go to school”、“to school(null)”、“school(null)(null)”等作为各个词性的词性串。
词性串生成器210预先设置窗口大小,并在错误检测中通过生成与所设置的窗口大小对应的词性来使用该窗口大小。为了详细检测,可通过改变窗口大小(例如,bi-gram和tri-gram)来生成并分析各个词性。
浅层句法分析器220针对由词性串生成器210生成的词性串,基于正则语法规则和上下文无关语法(CFG)规则来通过考虑彼此相邻的词性之间的连接关系对句法结构进行句法分析。
上下文无关语法规则称为一般英语语法,包括对与拼字法、冠词或时态有关的规则进行规范化的规则。
例如,上下文无关语法规则包括诸如这样的规则:时态为一般现在时,主语为单数形式的动词后附加“s”,“an”用于以元音开始的名词,“a”用于以辅音开始的名词。
此上下文无关语法规则存储在上下文无关语法知识DB260中,并在浅层句法分析器220进行句法分析的情况下提供此上下文无关语法规则。
正则语法规则定义无法由一般语法(即,上下文无关语法)定义,而是可根据彼此相邻的词性之间的亲密度或连接关系来进一步定义的例外规则。具体地讲,如图4所示,可参照拼字法、词之间的空格、冠词形式、冠词重叠、主语-动词不一致、词性混用、动词形式错误、不正确的搭配、不正确的词序、介词缺失、人称、多余限定词、多余介词等来定义规则。
例如,冠词“a”通常附在辅音前面,而冠词“an”附在第一音节不发音的名词前面,这是上下文无关语法。然而,冠词“an”附在名词“hoest”前面,这是正则语法。即,增加作为上下文无关语法规则的例外而应用的名词作为单独的规则是正则语法。
另外,作为正则语法规则的另一示例,在诸如“beggining”的打字错误的情况下,分析出不正确地使用了“beginning”,可检测校正草案“beginning”。
这种正则语法规则被存储在正则语法知识DB250中,并可以被提供用于浅层句法分析器220的句法分析,以作为参考。
因此,浅层句法分析器200利用所存储的上下文无关语法规则来直接分析简单语法错误,并利用正则语法规则根据彼此相邻的词性之间的连接关系来计算词性串的亲密度。如果词性的亲密度高,则浅层句法分析器220生成具有诸如名词短语、合成词、宾语短语和从属子句的诱生树(inducement tree)的对应词性串,如果亲密度低,则浅层句法分析器220利用独立的词代替短语,来生成具有形成各个词性串的词的诱生树。
确定亲密度是高还是低可通过设置用于确定的参考值并将亲密度与参考值进行比较来进行。或者,可通过计算可从词性串诱生出的多个诱生树的亲密度并确定亲密度的相对大小来进行。在这种情况下,可通过选择亲密度相对最高的诱生树来检测错误。
另外,浅层句法分析器220执行自下而上图表(chart)句法分析,其从标注的词性的右侧移位至左侧。由于自下而上图表句法分析不是用于一般句法分析的句法分析,所以对整个对象造句(S)不是目标。即,如果没有新形成节点,则句法分析停止。
错误检测器230基于通过浅层句法分析器220生成的分析结果从由句法分析器(图1的130)分析出的句法树检测错误。此时,错误检测器230利用n-gram进行检测,其将输入句子分割成具有特定部分的串,而非搜索整个输入句子,由此与针对整个句子的分析方法相比,可更快速且准确地进行错误检测。
错误校正部150基于上下文无关语法规则和正则语法规则来对由错误检测器140检测到的错误提示校正草案。
图4是针对根据至少一个实施方式的使用错误检测设备的错误检测方法的方法的流程图。
首先,为了评估句子,如果输入了撰写的输入句子,则自动句子评估装置将输入句子分割成句子和词素(S100)。
接下来,自动句子评估装置基于词性字典将词性标注到各个词素(S200)。
接下来,自动句子评估装置对分割出的句子执行句法分析,并提取句法树作为分析结果(S300)。
另外,自动句子评估装置利用浅层句法分析器对各个词性生成词性串以便确定所提取的句法树中是否存在错误,并以所生成的词性串为单位检测错误。
此后,自动句子评估装置校正所检测到的错误,并通过校正的句法树来评估句子(S500、S600)。可利用通过错误检测处理(S400)获得的校正草案来执行所述校正。
图5是示出错误检测处理(S400)的详细方法的流程图。
错误检测处理(S400)可由包括在自动句子评估装置中的错误检测设备来实现,或者由独立于自动句子评估装置而包括的错误检测设备来实现。
即,对于在词性标注处理(S200)中标注的各个词性,错误检测设备按照特定窗口单位生成词性串(S410)。
所述特定窗口表示将彼此相邻的2个、3个或更多个(n个)词性形成一组。bi-gram是将彼此相邻的2个词性形成一组,而tri-gram是将彼此相邻的3个词性形成一组。
错误检测设备利用n-gram(bi-gram、tri-gram等)按照设置的单位生成词性。
接下来,错误检测设备以词性串为单位执行浅层句法分析(S420)。
浅层句法分析基于存储的上下文无关语法规则和存储的正则语法规则考虑相邻词性之间的亲密度来分析句法结构。
具体地讲,利用所存储的上下文无关语法规则的知识,直接分析简单语法错误,同时,利用所存储的正则语法规则的知识,根据彼此相邻的词性之间的连接关系来计算词性的亲密度。如果词性的亲密度高,则可生成具有诸如名词短语、合成词、宾语短语和从属子句的诱生树的对应词性串,如果亲密度低,则可利用独立的词(而非短语)来生成具有形成各个词性串的词的诱生树。
接下来,错误检测设备基于分析结果检测从句法分析提取出的句法树的错误,并针对所检测出的错误提示校正草案(S430、S440)。
图6是示出通过图4的错误检测方法生成词性串的处理的示例性表。
尽管已具体示出并描述了各种实施方式,但是本领域技术人员将理解,在不脱离本公开的主题和范围的情况下,可对其进行各种形式和细节上的改变。本公开和附图中使用的特定术语用于示意性目的,而不应被认为是对本公开的限制。本发明的范围应该由下述的权利要求请求保护的范围来解释,并且应该解释为,在与其等同的范围内的所有技术也应该被包含在本发明的范围内。
产业上的可利用性
如此前充分讨论的,在句法分析的情况下,传统句法分析不复杂地考虑词汇、词性、含义和上下文相关性,而是仅依赖于词性串信息,由此存在其准确度显著降低的问题。通过针对撰写的输入句子利用n-gram生成词性串并基于根据相邻词性之间的连接关系定义的规则来分析所生成的词性串,本文公开的实施方式可通过检测简单语法错误以及句子结构错误来增加针对句子的句子评估的准确度。就这一点,所公开的实施方式可能不应用于简单评估算法,而是通过应用于由企业进行的或者大学入学考试中的英语能力测试、作文评估等来实现自动评估。

Claims (9)

1.一种用于自动评估句子的设备,该设备包括:
输入句子分割器,其被构造为将撰写的输入句子分割成词素,所述词素是句子的最小单元;
词性标注部,其被构造为将词性标注到所分割出的词素;
句法分析器,其被构造为基于词性来分析句子的句法结构并输出句法树作为分析结果;
句子评估部,其被构造为利用由所述句法分析器输出的所述句法树来评估所述句子语法上是否正确;以及
错误检测器,其被构造为针对由所述词性标注部标注的各个词性来利用n-gram生成词性串,基于根据彼此相邻的词性之间的连接关系定义的正则语法规则和上下文无关语法规则来分析所生成的词性串,以检测句法分析的错误,并针对所检测出的错误,向所述句法分析器提供校正草案。
2.一种利用浅层句法分析器来自动评估句子的撰写的错误检测设备,该错误检测设备包括:
词性串生成器,其被构造为针对标注到输入句子的各个词性,利用n-gram来按照预定窗口单位生成词性串;
浅层句法分析器,其被构造为基于上下文无关语法规则和正则语法规则来对所述词性串进行句法分析,并计算所述词性串的亲密度;
错误检测器,其被构造为根据由所述浅层句法分析器计算出的所述亲密度来检测错误;以及
错误校正部,其被构造为针对由所述错误检测器检测出的错误提供校正草案。
3.根据权利要求2所述的设备,其中,所述上下文无关语法规则包括对包括拼字法、冠词或时态的正规语法进行规范化的规则。
4.根据权利要求2所述的设备,其中,所述正则语法规则包括无法由上下文无关语法定义的例外规则以及能够根据彼此相邻的词性之间的亲密度或连接关系定义的规则。
5.根据权利要求2所述的设备,其中,所述浅层句法分析器还被构造为,如果针对词性计算出的所述亲密度大于参考值,则生成包括名词短语、合成词、宾语短语和从属子句的对应句法树,如果针对词性计算出的所述亲密度小于所述参考值,则利用独立的词代替短语来生成具有形成各个词性串的词的诱生树。
6.一种利用浅层句法分析器来自动评估句子的撰写的错误检测方法,该错误检测方法包括以下步骤:
针对标注到输入句子的各个词性,利用n-gram来按照预定窗口单位生成词性串;
基于上下文无关语法规则和正则语法规则来对所述词性串进行句法分析,从而计算所述词性串的亲密度;
根据所计算出的亲密度来检测错误;以及
针对所检测出的错误提供校正草案,以便对撰写的句子的句法分析的错误进行校正。
7.根据权利要求6所述的方法,其中,所述上下文无关语法规则包括对包括拼字法、冠词或时态的正规语法进行规范化的规则。
8.根据权利要求6所述的方法,其中,所述正则语法规则包括无法由上下文无关语法定义的例外规则以及能够根据彼此相邻的词性之间的亲密度或连接关系定义的规则。
9.根据权利要求6所述的方法,其中,计算所述亲密度的步骤包括以下步骤:如果针对词性计算出的所述亲密度大于参考值,则生成包括名词短语、合成词、宾语短语和从属子句的对应句法树,如果针对词性计算出的所述亲密度小于所述参考值,则利用独立的词代替短语来生成具有形成各个词性串的词的诱生树。
CN201280019540.3A 2011-11-29 2012-10-24 使用浅层句法分析器自动评估句子的自动句子评估装置及其错误检测设备和方法 Expired - Fee Related CN103493041B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2011-0125967 2011-11-29
KR1020110125967A KR101475284B1 (ko) 2011-11-29 2011-11-29 작문 자동 평가를 위해 샬로우 파서를 이용한 오류 검출 장치 및 방법
PCT/KR2012/008751 WO2013081301A1 (ko) 2011-11-29 2012-10-24 작문 자동 평가를 위해 샬로우 파서를 이용한 문장 자동 평가 장치, 이를 위한 오류 검출 장치 및 이를 위한 방법

Publications (2)

Publication Number Publication Date
CN103493041A true CN103493041A (zh) 2014-01-01
CN103493041B CN103493041B (zh) 2016-01-27

Family

ID=48535713

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280019540.3A Expired - Fee Related CN103493041B (zh) 2011-11-29 2012-10-24 使用浅层句法分析器自动评估句子的自动句子评估装置及其错误检测设备和方法

Country Status (4)

Country Link
US (1) US9336199B2 (zh)
KR (1) KR101475284B1 (zh)
CN (1) CN103493041B (zh)
WO (1) WO2013081301A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110147546A (zh) * 2019-04-03 2019-08-20 苏州驰声信息科技有限公司 一种英语口语的语法校正方法及装置
CN110164422A (zh) * 2019-04-03 2019-08-23 苏州驰声信息科技有限公司 一种口语考试的多维度评估方法及装置
CN110245348A (zh) * 2019-05-17 2019-09-17 北京百度网讯科技有限公司 一种意图识别方法及系统
CN110750989A (zh) * 2019-10-28 2020-02-04 北京金山数字娱乐科技有限公司 一种语句分析的方法及装置

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140067394A1 (en) * 2012-08-28 2014-03-06 King Abdulaziz City For Science And Technology System and method for decoding speech
JP6235373B2 (ja) * 2013-03-02 2017-11-22 株式会社EduLab 言語解析方法及びシステム
US10452779B2 (en) * 2013-05-07 2019-10-22 Paul V. Haley System for knowledge acquisition
KR101482430B1 (ko) * 2013-08-13 2015-01-15 포항공과대학교 산학협력단 전치사 교정 방법 및 이를 수행하는 장치
US9747280B1 (en) * 2013-08-21 2017-08-29 Intelligent Language, LLC Date and time processing
KR102026967B1 (ko) * 2014-02-06 2019-09-30 한국전자통신연구원 n-gram 데이터 및 언어 분석에 기반한 문법 오류 교정장치 및 방법
KR101687116B1 (ko) * 2015-09-21 2017-01-12 주식회사 스토리유 자기소개서 케어 시스템
WO2017223211A1 (en) * 2016-06-21 2017-12-28 Pearson Education, Inc. System and method for automated evaluation system routing
US10242670B2 (en) 2016-09-21 2019-03-26 Intel Corporation Syntactic re-ranking of potential transcriptions during automatic speech recognition
KR20190004525A (ko) * 2017-07-04 2019-01-14 주식회사 마인즈랩 문장 학습 시스템 및 문장 학습 방법
KR102008145B1 (ko) * 2017-09-20 2019-08-07 장창영 문장 습관 분석 장치 및 방법
US10740555B2 (en) * 2017-12-07 2020-08-11 International Business Machines Corporation Deep learning approach to grammatical correction for incomplete parses
US11520992B2 (en) 2018-03-23 2022-12-06 Servicenow, Inc. Hybrid learning system for natural language understanding
US10713441B2 (en) * 2018-03-23 2020-07-14 Servicenow, Inc. Hybrid learning system for natural language intent extraction from a dialog utterance
CN109086272B (zh) * 2018-08-01 2023-02-17 浙江蓝鸽科技有限公司 句型识别方法及其系统
US11487945B2 (en) 2019-07-02 2022-11-01 Servicenow, Inc. Predictive similarity scoring subsystem in a natural language understanding (NLU) framework
US11455357B2 (en) 2019-11-06 2022-09-27 Servicenow, Inc. Data processing systems and methods
US11468238B2 (en) 2019-11-06 2022-10-11 ServiceNow Inc. Data processing systems and methods
US11481417B2 (en) 2019-11-06 2022-10-25 Servicenow, Inc. Generation and utilization of vector indexes for data processing systems and methods
CN111104789B (zh) * 2019-11-22 2023-12-29 华中师范大学 文本评分方法、装置和系统
US11393475B1 (en) * 2021-01-13 2022-07-19 Artificial Solutions Iberia S.L Conversational system for recognizing, understanding, and acting on multiple intents and hypotheses

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002297585A (ja) * 2001-03-30 2002-10-11 Ricoh Co Ltd 英文名詞句の区分方法,英文構文情報生成方法および装置
CN101013421A (zh) * 2007-02-02 2007-08-08 清华大学 基于规则的汉语基本块自动分析方法
KR100892004B1 (ko) * 2008-05-21 2009-04-07 주식회사 청담러닝 영어 작문 학습 시스템에서, 동사 중심의 자동 문법오류검출 및 교정정보 제공 장치 및 그 방법
CN102214166A (zh) * 2010-04-06 2011-10-12 三星电子(中国)研发中心 基于句法分析和层次模型的机器翻译系统和方法

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61217871A (ja) * 1985-03-25 1986-09-27 Toshiba Corp 翻訳処理装置
JPH02159674A (ja) * 1988-12-13 1990-06-19 Matsushita Electric Ind Co Ltd 意味解析装置と構文解析装置
US6161083A (en) * 1996-05-02 2000-12-12 Sony Corporation Example-based translation method and system which calculates word similarity degrees, a priori probability, and transformation probability to determine the best example for translation
KR100413784B1 (ko) * 1997-04-29 2004-02-14 삼성전자주식회사 절단위 분할기를 갖춘 영한 번역 장치 및 그영어 해석 방법
US6816830B1 (en) * 1997-07-04 2004-11-09 Xerox Corporation Finite state data structures with paths representing paired strings of tags and tag combinations
US6243669B1 (en) * 1999-01-29 2001-06-05 Sony Corporation Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation
US6782505B1 (en) * 1999-04-19 2004-08-24 Daniel P. Miranker Method and system for generating structured data from semi-structured data sources
US6901360B1 (en) * 1999-12-16 2005-05-31 Xerox Corporation System and method for transferring packed linguistic structures
US20010047346A1 (en) * 2000-04-10 2001-11-29 Dejian Liu Artificial intelligence and computer interface
AU2001255599A1 (en) * 2000-04-24 2001-11-07 Microsoft Corporation Computer-aided reading system and method with cross-language reading wizard
CN1465018A (zh) * 2000-05-11 2003-12-31 南加利福尼亚大学 机器翻译技术
US7003444B2 (en) * 2001-07-12 2006-02-21 Microsoft Corporation Method and apparatus for improved grammar checking using a stochastic parser
US7080004B2 (en) * 2001-12-05 2006-07-18 Microsoft Corporation Grammar authoring system
US7289948B1 (en) * 2002-01-07 2007-10-30 At&T Corp. Systems and methods for regularly approximating context-free grammars through transformation
US8849648B1 (en) * 2002-12-24 2014-09-30 At&T Intellectual Property Ii, L.P. System and method of extracting clauses for spoken language understanding
JP3998668B2 (ja) * 2004-07-14 2007-10-31 沖電気工業株式会社 形態素解析装置、方法及びプログラム
KR20080028655A (ko) * 2006-09-27 2008-04-01 한국전자통신연구원 품사 태깅 장치 및 태깅 방법
US7908552B2 (en) * 2007-04-13 2011-03-15 A-Life Medical Inc. Mere-parsing with boundary and semantic driven scoping
JP2010048953A (ja) * 2008-08-20 2010-03-04 Toshiba Corp 対話文生成装置
KR101092356B1 (ko) * 2008-12-22 2011-12-09 한국전자통신연구원 상호 정보를 이용한 형태소 품사 태깅 장치 및 방법
KR101594057B1 (ko) * 2009-08-19 2016-02-15 삼성전자주식회사 텍스트 데이터의 처리 방법 및 장치
US8781810B2 (en) * 2011-07-25 2014-07-15 Xerox Corporation System and method for productive generation of compound words in statistical machine translation
US8713031B1 (en) * 2011-09-06 2014-04-29 Bryant Christopher Lee Method and system for checking citations
US20140082003A1 (en) * 2012-09-17 2014-03-20 Digital Trowel (Israel) Ltd. Document mining with relation extraction

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002297585A (ja) * 2001-03-30 2002-10-11 Ricoh Co Ltd 英文名詞句の区分方法,英文構文情報生成方法および装置
CN101013421A (zh) * 2007-02-02 2007-08-08 清华大学 基于规则的汉语基本块自动分析方法
KR100892004B1 (ko) * 2008-05-21 2009-04-07 주식회사 청담러닝 영어 작문 학습 시스템에서, 동사 중심의 자동 문법오류검출 및 교정정보 제공 장치 및 그 방법
CN102214166A (zh) * 2010-04-06 2011-10-12 三星电子(中国)研发中心 基于句法分析和层次模型的机器翻译系统和方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李伟: "现代汉语句型自动识别的研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
李伟: "现代汉语句型自动识别的研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, 15 July 2008 (2008-07-15) *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110147546A (zh) * 2019-04-03 2019-08-20 苏州驰声信息科技有限公司 一种英语口语的语法校正方法及装置
CN110164422A (zh) * 2019-04-03 2019-08-23 苏州驰声信息科技有限公司 一种口语考试的多维度评估方法及装置
CN110147546B (zh) * 2019-04-03 2023-05-26 苏州驰声信息科技有限公司 一种英语口语的语法校正方法及装置
CN110245348A (zh) * 2019-05-17 2019-09-17 北京百度网讯科技有限公司 一种意图识别方法及系统
CN110245348B (zh) * 2019-05-17 2023-11-24 北京百度网讯科技有限公司 一种意图识别方法及系统
CN110750989A (zh) * 2019-10-28 2020-02-04 北京金山数字娱乐科技有限公司 一种语句分析的方法及装置
CN110750989B (zh) * 2019-10-28 2023-09-19 北京金山数字娱乐科技有限公司 一种语句分析的方法及装置

Also Published As

Publication number Publication date
WO2013081301A1 (ko) 2013-06-06
US9336199B2 (en) 2016-05-10
CN103493041B (zh) 2016-01-27
US20140067379A1 (en) 2014-03-06
KR101475284B1 (ko) 2014-12-23
KR20130059795A (ko) 2013-06-07

Similar Documents

Publication Publication Date Title
CN103493041B (zh) 使用浅层句法分析器自动评估句子的自动句子评估装置及其错误检测设备和方法
US9342499B2 (en) Round-trip translation for automated grammatical error correction
KR101678787B1 (ko) 자동질의응답 방법 및 그 장치
KR101629415B1 (ko) 문법 오류 검출 방법 및 이를 위한 오류검출장치
EP2653982A1 (en) Method and system for statistical misspelling correction
US9594742B2 (en) Method and apparatus for matching misspellings caused by phonetic variations
US20120166942A1 (en) Using parts-of-speech tagging and named entity recognition for spelling correction
JPH07325824A (ja) 文法チェックシステム
CN103688254B (zh) 用于自动评估写作的基于示例的错误检测系统、方法及错误检测设备
Hancke et al. Exploring CEFR classification for German based on rich linguistic modeling
JP6778655B2 (ja) 単語連接識別モデル学習装置、単語連接検出装置、方法、及びプログラム
US9390078B2 (en) Computer-implemented systems and methods for detecting punctuation errors
Mansouri et al. State-of-the-art english to persian statistical machine translation system
Duran et al. Some issues on the normalization of a corpus of products reviews in Portuguese
Georgi et al. Improving dependency parsing with interlinear glossed text and syntactic projection
Kutuzov et al. Semi-automated typical error annotation for learner English essays: Integrating frameworks
Khin et al. Analyzing tagging accuracy of part-of-speech taggers
Rosen Building and Using Corpora of Non-Native Czech.
Gamallo Otero et al. Automatic generation of bilingual dictionaries using intermediary languages and comparable corpora
US11288451B2 (en) Machine based expansion of contractions in text in digital media
Ravishankar et al. Finite-state morphological analysis for Marathi
Ravishankar Finite-state back-transliteration for Marathi
Wolk et al. Unsupervised tool for quantification of progress in L2 English phraseological
Wu et al. Correcting serial grammatical errors based on n-grams and syntax
KR20160050652A (ko) 신규 언어의 트리뱅크를 구축하는 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160127

Termination date: 20201024

CF01 Termination of patent right due to non-payment of annual fee