CN110032726B - 用于改进句子图表构造和分析的系统和方法 - Google Patents
用于改进句子图表构造和分析的系统和方法 Download PDFInfo
- Publication number
- CN110032726B CN110032726B CN201910020619.1A CN201910020619A CN110032726B CN 110032726 B CN110032726 B CN 110032726B CN 201910020619 A CN201910020619 A CN 201910020619A CN 110032726 B CN110032726 B CN 110032726B
- Authority
- CN
- China
- Prior art keywords
- sentence
- constructed
- sentence structure
- computer
- natural language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010276 construction Methods 0.000 title claims abstract description 43
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000013500 data storage Methods 0.000 claims description 7
- 238000004040 coloring Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 abstract description 4
- 150000001875 compounds Chemical class 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 239000002131 composite material Substances 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000004397 blinking Effects 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 239000004744 fabric Substances 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 239000003607 modifier Substances 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000003924 mental process Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000000059 patterning Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
提供了用于改进句子图表构造和分析的系统和方法。用于改进对一个或更多个经填充的句子结构图表的计算机化分析和评级的计算机实施的系统包括句子图解接口,该接口包括:接收待被图解的自然语言句子的自然语言输入部;包括在生成经构造的句子结构时使用的多个句子构造成分的句子构造工具箱;以及接收并允许操纵所选句子构造成分以生成经构造的句子结构、并且接收并允许操纵自然语言句子中的每个词语以使得每个词语被分配给经构造的句子结构中的位置以生成经构造并填充的句子结构的句子构造工作空间。该系统还包括在服务器计算机上实施的、将经构造并填充的句子结构与分析句子结构相比较以将评级分值分配给经构造并填充的句子结构的句子分析逻辑。
Description
对相关申请的交叉引用
本申请要求了提交于2018年1月9日的美国临时专利申请号62/615,175的权益,其全部内容通过引用合并于此。
技术领域
本申请涉及用于帮助图表构造和分析的系统和方法的领域。更具体地,本申请涉及用于生成经构造并随后填充的句子结构以与分析句子结构相比较的系统和方法。
背景技术
句子图表是句子的语法结构的图形表示。图形表示说明了图解句子内的词语与其目的之间的关系。由Alonzo Reed和Brainerd Kellogg于1877年介绍的最广为人知的图解规范Reed-Kellogg图表已经被用于使得学者能够可视化句子,示出了不同句子部分之间的关系。下面描述使用Reed-Kellogg系统的句子图解图示的示例。
简单句子的典型图表包括被称为基部的水平线。句子主语位于基部的最左侧。句子谓语位于句子主语的右侧并且由第一线间隔开,第一线是延伸通过基部的竖直条。谓语包含动词,动词需要其他句子元素来完成谓语、允许其他句子元素这样做或者阻止其他句子元素这样做。动词及其宾语——如果存在——由在基线处结束的第二线间隔开。如果宾语是直接宾语,则第二线是竖直的。如果宾语是谓语名词或形容词,则第二线类似于朝向主语倾斜的反斜杠\。
主语、谓语或宾语的修饰语位于在基线下方延伸但附接至基线的角度线上。修饰语例如形容词(包括冠词)和副词被放置在角度线上以在他们修饰的词语下方。介词短语也位于他们修饰的词语下方;介词位于斜线上,并且斜线的远离基线的端部包括水平线,介词的宾语位于该水平线上。这些基本的图表规范已经针对其他类型的句子结构例如针对并列子句和从句进行了扩充。
然而,许多语言学家基于各种原因已经远离这些传统的图表。例如,传统的图表不能表示每个结构,因为传统的图表系统是不完整的,传统的图表不保留句子的词语顺序,并且即使句子不是非常复杂,句子图表也可能变得非常复杂。此外,传统软件不易适于表示引起Reed-Kellogg图表发展的人类思维过程。
除了对传统图表进行的改变之外,通过使用软件工具来改变句子图表以帮助句子图解。这些工具使得用户能够使用诸如要由用户填充的预组装结构的工具,该预组装结构然后可以由用户操纵。其他工具使得用户能够更改文本的颜色、放大和缩小、执行其他说明性功能等。已经针对个人计算设备、教室显示器例如智能板等提供了这些工具。
附加软件工具将教育方面与句子图解功能结合。例如,这些工具使得用户能够选择句子以进行图解并且向用户提供指令,向用户提供预先图解的句子以将词语拖动到指定的点中,并且自动图解所提供的句子。
然而,由于这些软件工具的使用难度、缺乏期望的特征以及难以适于非传统的句子图解,这些软件工具未被广泛使用。例如,使用传统软件,教育者可能被迫花费8至12分钟来对单个句子图表进行评级。如果测试有五个图表并且教师有45个学生,则教师可能需要花费45个小时来对该单个测试进行评级。现有的软件工具尚未进行调整以便于该评级。
所需要的是用于在计算机实施的软件中进行有效的句子图表构建和分析的系统和方法。此外,需要的是被配置成用于与分析句子结构相比较来生成对经构造并填充的句子结构的分析的这样的系统和方法。
发明内容
本发明提供了一种用于改进对一个或更多个经填充的句子结构图表的计算机化分析和评级的计算机实施的系统。该系统包括句子图解接口,句子图解接口又包括:自然语言输入部,自然语言输入部用于接收待被图解的自然语言句子;句子构造工作箱,句子构造工作箱包括在生成经构造的句子结构时使用的多个句子构造成分;以及句子构造工作空间,句子构造工作空间被配置成接收并允许操纵至少一个所选句子构造成分以生成经构造的句子结构,并且接收并允许操纵自然语言句子中的每个词语以使得每个词语被分配给经构造的句子结构中的位置以生成经构造并填充的句子结构。该系统还包括在服务器计算机上实施的句子分析逻辑,句子分析逻辑用于将经构造并填充的句子结构与分析句子结构相比较以将评级分值分配给经构造并填充的句子结构。
在一个更详细的方面,经构造的句子结构包括多个句子结构成分。句子构造工具箱中的句子结构成分可以基于自然语言输入部中的自然语言句子来定制。在另一详细方面,句子图解接口被显示在在通过网络连接至服务器计算机的用户计算机上实施的网页浏览器中。
在另一详细方面,句子分析逻辑被配置成通过与分析句子结构相比较来分析经构造并填充的句子结构。分析句子结构可以由句子分析逻辑基于输入到自然语言输入部中的数据来动态地生成,或者分析句子结构被存储在服务器计算机的数据存储装置中。可替选地,句子分析逻辑基于至少所使用的句子结构成分、句子结构成分的相对位置、句子结构成分的着色以及来自自然语言输入部的词语在句子结构成分内的位置的评级分来分析经构造并填充的句子结构。
在本发明的另一实施方式中,示出了一种用于改进对一个或更多个经填充的句子结构图表的计算机化分析和评级的计算机实施的方法。该方法包括以下步骤:使用由远程计算机执行的网页浏览器、通过计算机网络从服务器计算机实施句子图解接口;通过句子图解接口中的自然语言输入部来接收待被图解的自然语言句子;在句子图解接口中显示句子构造工具箱,句子构造工具箱包括在生成经构造的句子结构时使用的多个句子构造成分;在句子图解接口中实施句子构造工作空间,句子构造工作空间被配置成接收并允许操纵至少一个所选句子构造成分以生成经构造的句子结构、并且接收并允许操纵自然语言句子中的每个词语以使得每个词语被分配给经构造的句子结构中的位置以生成经构造并填充的句子结构;以及在服务器计算机上实施句子分析逻辑,句子分析逻辑用于将经构造并填充的句子结构与分析句子结构相比较以将评级分值分配给经构造并填充的句子结构。
根据以下对示例性实施方式的描述,除了以上讨论的那些之外,本发明的其他方面对于本领域普通技术人员来说将是明显的。在说明书中,参照附图,附图形成说明书的一部分并且示出了本发明的示例。
附图说明
图1是根据示例性实施方式的计算网络,其包括用于提供句子图解用户接口以帮助自然语言句子的句子图表的构造的支持网页的系统的部件;
图2是根据示例性实施方式的实施远程句子图解用户接口并且用于生成对图解句子的分析的服务器计算设备;以及
图3A至图3D是根据示例性实施方式的使用第一示例性句子的句子图解用户接口的屏幕截图;
图4A至图4F是根据示例性实施方式的使用第一示例性句子的句子图表用户接口的屏幕截图;以及
图5A至图5F是根据示例性实施方式的分析句子结构及其句子子结构的图表。
具体实施方式
本公开内容提供了以下方法和系统:所述方法和系统用于实施用于将自然语言句子可视地构造成便于表示句子结构和分析句子结构的评级的句子结构的句子图解系统,从而改进实施所述方法和系统的计算设备的功能,并且使得能够准确且有效地表示句子。本申请描述了包括句子图解用户接口的用户接口,句子图解用户接口提供被配置成便于对句子元素进行描述和分析的句子结构成分。这通过以传统上在句子图解中不使用的方式基于定位和着色提供在视觉上区分句子元素的句子结构成分来实施。此后,使用减少错误和处理步骤以改进系统功能的方法,对使用在视觉上区分的句子元素的经构造并填充的句子结构与分析句子结构相比较。
首先参照图1,根据示例性实施方式示出了说明性计算网络100,计算网络100描绘了用于提供句子图解用户接口以便于使用多个句子结构成分构造自然语言句子的句子图表的支持网页的系统的部件。计算机网络100可以包括广域网(WAN)例如因特网、局域网(LAN)、移动通信网络、公共服务电话网络(PSTN)、个人区域网络(PAN)、大都市区域网络(MAN)、虚拟专用网络(VPN)和/或其他网络。计算机网络100通常可以被配置成电子地连接一个或更多个计算设备和/或其部件。说明性计算设备可以包括但不限于至少一个用户计算设备110和至少一个服务器计算设备200。
用户计算设备110通常可以用作用户与连接至计算机网络100的其他部件之间的接口。因此,如在本文中更详细描述的,用户计算设备110可以用于执行一个或更多个面向用户的功能,例如从用户接收一个或更多个输入或者向用户提供信息。在一些实施方式中,用户计算设备110可以包括用于访问远程实施的软件程序以使用如本文描述的句子图解用户接口的一个或更多个软件程序等。虽然计算机网络100被示为包括两个用户计算设备110,但是应该理解,可以使用任何数目的这样的计算机系统来通过计算机网络100与服务器计算设备200交互。
服务器计算设备200可以从一个或更多个源接收数据(例如,键盘输入的数据、写入的数据等)、处理数据(例如,将自然语言句子转换成令牌)、存储数据和/或向一个或更多个接收者例如用户计算设备110提供数据。
应当理解,虽然用户计算设备110被描绘为个人计算机,并且服务器计算设备200被描绘为服务器,但是这些是非限制性示例。更具体地,在一些实施方式中,任何类型的计算设备(例如,移动计算设备、个人计算机、服务器等)可以用于这些部件中的任何部件。另外,虽然这些计算设备中的每一个在图1中被示为单件硬件,但是这也仅是示例。更具体地,用户计算设备110和服务器计算设备200中的每一个可以表示多个计算机、服务器、数据库、部件等。
另外,应当理解,虽然本文中描绘的实施方式涉及计算设备的网络,但是本公开内容不仅限于这样的网络。例如,在一些实施方式中,本文描述的各种处理可以由不使用网络来完成本文描述的各种处理的单个计算设备例如非联网计算设备或联网计算设备来完成。
现在参照图2,根据示例性实施方式示出了来自图1的服务器计算设备200,还示出了用于从一个或更多个源接收数据、处理数据、存储数据和/或向一个或更多个接收者提供数据的系统。特别地,根据本文示出和描述的实施方式,服务器计算设备200可以包括非暂态计算机可读介质,以用于提供句子图解用户接口以便于使用多个句子结构成分来构造自然语言句子的句子图表,并且用于与经构造并填充的句子结构相比较来生成对分析句子结构的分析。虽然在一些实施方式中,服务器计算设备200可以被配置为具有必需的硬件、软件和/或固件的通用计算机,但是在一些实施方式中,服务器计算设备200也可以被配置为专门被设计成用于执行本文描述的功能的专用计算机。
服务器计算设备200可以包括处理设备230、输入/输出硬件240、网络接口硬件250、数据存储部件220(其可以存储语法数据222和分析句子数据226)以及非暂态存储器部件210。存储器部件210可以被配置为易失性和/或非易失性计算机可读介质,并且因此可以包括随机存取存储器(包括SRAM、DRAM和/或其他类型的随机存取存储器)、闪存、寄存器、致密盘(CD)、数字通用光盘(DVD)和/或其他类型的存储部件。另外,存储器部件210可以被配置成存储操作逻辑212和构造接口逻辑214(作为示例,操作逻辑212和构造接口逻辑214中的每一个可以实施为计算机程序、固件或硬件)。本地接口200也包括在图2中,并且可以被实施为总线或其他接口以帮助服务器计算设备200的部件之间的通信。
处理设备230可以包括被配置成接收和执行指令的任何处理部件(诸如来自数据存储部件220和/或存储器部件210)。输入/输出硬件240可以包括监测器、键盘、鼠标、打印机、相机、麦克风、扬声器、触摸屏和/或用于接收、发送和/或呈现数据的其他设备。网络接口硬件250可以包括任何有线或无线网络硬件,诸如调制解调器、LAN端口、无线保真(Wi-Fi)卡、WiMax卡、移动通信硬件和/或用于与其他网络和/或设备通信的其他硬件。
应当理解,数据存储部件220可以驻留在服务器计算设备200本地和/或远离服务器计算设备200,并且可以被配置成存储一条或更多条数据并提供对一条或更多条数据的访问。如图2所示,数据存储部件220可以存储语法数据222和根据语法数据222构造的经构造的句子数据224,如本文更详细描述的。
存储器部件210中包括操作逻辑212、接口逻辑214和分析逻辑216。操作逻辑212可以包括操作系统和/或用于管理服务器计算设备200的部件的其他软件。接口逻辑214可以被配置用于提供便于使用多个句子结构成分构造自然语言句子的句子图表的句子图解用户接口,如下面详细描述的。句子构造逻辑可以被配置用于在需要时构造分析句子结构并且用于与经构造并填充的句子结构相比生成分析句子结构的分析,如下面更详细地描述的。
应该理解的是,图2中示出的部件仅仅是说明性的,并不意在限制本公开内容的范围。更具体地,虽然图2中的部件被示为驻留在服务器计算设备200内,但这是非限制性示例。在一些实施方式中,一个或更多个部件可以驻留在服务器计算设备200的外部。类似地,虽然图2涉及服务器计算设备200,但是诸如用户计算设备110(图1)的其他部件可以包括类似的硬件、软件和/或固件。
还应该理解,图1和图2两者中所示的部件可以用于执行一个或更多个过程,例如下文描述的步骤。
现在参照图3A至图3D,示出了根据示例性实施方式的便于使用多个句子结构成分构造自然语言句子的句子图表的句子图解用户接口300。可以通过用户计算设备100上的网页浏览应用程序显示接口300。用户计算设备100的用户将网页浏览地址指向与服务器200相关联的网页地址,以允许服务器200在用户计算设备100的显示器上显示接口200。
接口300包括自然语言输入部(input)310、句子结构成分工具箱320和句子构造工作空间350。接口300的这些成分可以使用已知的图形用户接口软件来实施,并且可以被配置成显示从服务器200接收的信息。根据可替选实施方式,用于实施用户接口300的软件可以在用户计算机系统110上本地存储和实施。
自然语言输入部310是输入空间,当被选择时,输入空间接收通过计算机系统110的输入设备输入的自然语言句子。例如,自然语言句子可以通过键盘输入、通过麦克风说出、使用光学输入扫描等。
在输入自然语言句子之后,用户可以选择句子输入图标311以发起自然语言句子处理。自然语言句子处理包括解析输入的句子,使得每个词语用于创建一个或更多个令牌。单个词语可以用于创建多个令牌,其中词语是收缩。
自然语言输入部310还包括文件输入按钮312。在选择按钮312之后,接口逻辑214可以被配置成显示句子图解学习单元的列表并接收来自用户的选择。现在参照图3A,示出了接口300,其描绘了学习单元的列表,其中用户已经选择了“基本句子”学习单元。
现在参照图3B,基于来自学习单元列表的选择,句子“笑容事情”被自动填充在自然语言输入部310中。句子结构成分工具箱320是可以由接口300的用户选择的句子结构成分的图形列表。工具箱320包括主语/谓语句子基部成分321、宾语成分322、动词/谓语名词成分323、形容词斜线成分324、副词斜线成分325、分词成分326、同位语成分327、复合右成分328、复合形容词成分329、虚词成分330、动名词成分331、分词成分332、不定式短语成分333、复合句子成分334、复合句子连词成分335、副词从句成分336、名词从句连词成分337、分裂句成分338、间接宾语成分339和省略成分340。
尽管工具箱320被示出为包括一组示例性句子结构成分,但是本领域普通技术人员将理解可以提供另外的结构成分。根据示例性实施方式,取决于所选择的学习单元,可以实施工具箱320,使得仅相关的句子结构成分被显示、选择等。另外,如图3B所示,工具箱320成分可以实施为下拉菜单。例如,宾语成分322设置有下拉选择图标342,其中图标342的选择将允许用户在不同类型的宾语成分诸如直接宾语成分、直接宾语被动成分和间接宾语成分之间进行选择。
句子构造工作空间350是接口300中的初始空白空间,其被配置成允许用户放置和操纵从工具箱320中选择的一个或更多个句子结构成分以生成经构造的句子结构。现在具体参照图3C,在自然语言输入部中输入自然语言句子之后,用户选择句子结构成分,通常是如图3C所示的主语/谓词基部成分321。在选择之后,用户可以根据需要将句子成分拖动到工作空间350内的任何位置。
现在参照图3D,并且在选择一个或更多个句子成分之后,用户可以开始填充经构造的句子结构,在所示的示例中是主语/谓词成分321。为了填充经构造的句子结构,创建经构造并填充的句子结构,用户选择在自然语言输入部310中显示的自然语言句子中的词语。在选择时,在所示示例中的所选词语“笑容”出现在工作空间350中。接口300允许用户将所选词语拖动到经构造的句子结构上的词语位置。接口300可以被配置成修改句子成分以使大小与所选择的词语相关。在所示的特定示例中,主语/谓语成分321的主语侧上的基线的大小与所选词语“笑容”的大小相关。对于每个词语重复图3D中所示的步骤,直到自然语言句子中的所有词语被放置在经构造并填充的句子结构上的位置。
在示例性实施方式中,接口逻辑214可以被配置成允许用户选择定位引导选项。可以关闭引导学习,自动设置引导学习、基于对成分选择或词语定位中的错误的检测来设置引导学习等。也可以以不同级别设置引导学习。例如,使用定位引导选项,接口214可以仅允许词语被定位在可能的位置。例如,参考主语/谓语成分321,诸如词语“笑容”的名词只能被定位在主语位置。本领域普通技术人员将认识到,在更复杂的句子中,所选名词可以被定位在多个位置,例如,主语、直接宾语和间接宾语。因此,词语仍可以被定位在不是正确位置的可能位置处。另外的引导可以包括但不限于当光标定位在词语上时识别句子中词语的词性,当光标定位在词语上方时提供视觉反馈,例如突出显示、闪烁等,通过在文本框中重新定位词语、闪烁词语等来拒绝定位不正确的词语。有利地,允许减少潜在位置的数目的定位为特定选择的学习单元及其一个或多个句子结构提供引导式学习。
现在参照图4A至图4F,在选择按钮312之后示出了句子图解用户接口300,以显示句子图解学习单元的列表并接收来自用户的选择。现在参照图4A,示出了接口300,接口300描绘了用户已经选择“复合左”学习单元的学习单元的列表。
现在参照图4B,基于从学习单元列表的选择,自然语言句子“你的儿子和我的女儿是同学。”被自动填充在自然语言输入部310中。此外,基于学习单元的选择来修改工具箱320。具体地,基于选择来修改句子成分,使得已经选择了复合句子成分334下拉菜单,允许用户在复合左成分438、复合右成分439和复合中间成分440之间进行选择。
现在具体参照图4C,在自然语言输入部中输入自然语言句子之后,用户选择句子结构成分,在这种情况下是复合左成分438。在选择之后,用户可以根据需要将句子成分拖动到工作空间350内的任何位置。然而,由于在自然语言输入部中显示的句子比上面参照图3A至图3D提供的示例更复杂,因此需要另外的句子结构成分。
因此,如图4D所示,主语/谓词基部成分321被添加到工作空间350中的复合左成分438。接口逻辑214可以被配置成在工作空间350内实施“对齐”功能,使得成分321在适当的连词处被定位在与成分421相邻的位置。当语法特定成分(无论是水平线、竖直线还是斜线)或预组装组被拖动到句子基线附近的“可能或正确的目标区域”附近时,接口逻辑214自动将拖动的成分拉动并连接至句子基线。例如,如图4E所示,通过添加两个形容词斜线成分324,进一步开发了经构造的句子结构。
现在参照图4F,在使用句子成分来构造经构造的句子结构之后,用户可以开始填充经构造的句子结构,类似于上面参照图3D所描述的。为了填充经构造的句子结构,用户选择在自然语言输入部310中显示的自然语言句子中的词语。在选择时,所选词语出现在工作空间350中。接口300允许用户将所选词语拖动到经构造的句子结构上的词语位置处。
在示例性实施方式中,接口300可以被配置成允许用户旋转定位在工作空间350中的词语。可替选地,接口逻辑214可以被配置成基于语法数据222中指示的词语的类型自动旋转定位的词语。根据又一可替选方案,接口逻辑214可以被配置成基于在其上拖动所定位的词语的经构造的句子结构的位置自动重新定向所定位的词语。例如,当在主语斜线成分324上拖动时,所定位的词语可以自动倾斜,当在主语/谓词基部成分321的任一位置上拖动时,所定位的词语水平定向,而当在复合左成分438的虚线位置上拖动时,所定位的词语竖直定向。
现在参照图5A至图5F,根据本文示出和描述的实施方式,分析句子结构500和分析句子子结构510至550的示例性实施方式,用于生成与经构造并填充的句子结构相比较的分析句子结构的分析。除了与接口300相关联的用于生成并填充经构造的句子结构的功能之外,服务器200还被配置成执行经构造并填充的句子结构分析,将经构造并填充的句子结构与一个或更多个分析句子结构相比较以确定用于例如学习和评级目的的句子结构构造准确度。
分析句子结构500可以与上面图3A和图4A中所示的每个学习单元相关联。这些结构500可以由教育者或出版商提供并存储在数据存储装置220中在分析句子数据226中。可替选地,在将自然文本输入到自然语言输入部310中的情况下,分析逻辑216可以被配置成利用数据存储装置220中的语法数据222来为输入的自然语言句子生成分析句子结构500。
分析句子结构500描绘了句子“疯狂到足以让他们认为自己可以改变世界的人就是这样做的人。”的句子图表。分析逻辑216被配置成解析自然语言句子以确定待与结构500相关联的评级分量。尽管在句子中只有18个词语,但是结构500可以具有可以相关联的大量变化的评级分。待与结构500相关联的评级分可以取决于教育者关注的特定方面。
为了计算待与结构500相关联的评级分,分析逻辑216首先确定句子中的句子子结构的数目。如图5所示,结构500包括五个句子子结构510至550。在每个句子子结构内计算评级分,并经由检查句子子结构之间的关系来计算评级分。
现在参照图5B,对于短语“人是那个”,句子子结构510包括主句句子基线(1分)、填充句子子结构的五个词语的位置(5分)、补语斜线(1分)、两个冠词的两条斜线(2分)以及两条形容词线的颜色(2分),总共与句子结构相关联的11分。分析逻辑216可以被配置成将权重分配给特定类型的句子成分、特定词语、句子成分的特定着色等。例如,子结构510中的补语斜线可以基于句子结构内的由教育者或出版商确定的该线的重要性被分配双权重。因此,通过加权,子结构510在该示例中可以提供12个评级分。
现在参照图5C,对于短语“足够疯狂的(人)”,句子子结构520包括句子基线(1分)、填充句子子结构的四个词语的位置(4分)、补语斜线(1分)、副词“足够”的斜线(1分)、副词斜线的颜色(1分)、虚线(1分)、形容词从句的颜色(1分)以及虚线两端的位置(2分)。对于与该示例的句子子结构相关联的总共12分,可以为子结构520中的补语斜线和形容词从句的颜色分配双权重。因此,通过加权,句子子结构520可以在该示例中提供14个评级分。
现在参照图5D,对于短语“(足够)思考”,句子子结构530包括不定式基线(1分)、填充句子子结构的两个词语的位置(2分)、宾语斜线(1分)、连接“足够”的副词的赭石线和介词短语线(2分)以及状语介词短语的颜色(1分),总共与句子子结构相关联的7分。对于该示例,子结构530中的宾语斜线可以被分配双权重。因此,通过加权,句子子结构530可以在该示例中提供8个评级分。
现在参照图5E,对于短语“他们可以改变世界”,句子子结构540包括名词从句基线(1分)、填充句子子结构的五个词语的位置(5分)、宾语竖直线(1分)、冠词的斜线(1分)、形容词斜线的颜色(1分)、虚线(1分)、形容词从句的颜色(1分)以及整个组的位置(1分)为10分。对于该示例,子结构540中的名词从句基线、宾语竖直线和整个组的位置可以被分配双权重。因此,通过加权,句子子结构540可以在该示例中提供13个评级分。
现在参照图5F,对于短语“做的(人)”,句子子结构550包括句子基线(1分)、填充句子子结构的两个词语的位置(2分)、虚线(1分)、形容词从句信号(1分)和虚线两端的位置(2分)和整个组的位置(1分)为7分。对于该示例,形容词从句信号和子结构540中的虚线的两端的位置可以被分配双权重。因此,通过加权,句子子结构540可以在该示例中提供10个评级分。
因此,成功分析句子的总得分为57分。对于经验更丰富的人来说,对此图表进行评级包括累计所有单个分通常需要大约8到12分钟。由于共同的家庭作业任务或测试包括至少五个句子,因此可能需要更多的经验来花费一个小时来创建仅一个家庭作业任务或测试。
在操作中,分析逻辑216被配置成识别从输入到输入空间310中的句子生成的令牌的位置。可以将所识别的令牌位置与工作空间350中的所选择的句子结构成分内的分配令牌位置相比较。在一个实施方式中,分析逻辑216将所选择的句子结构成分内的所分配的令牌位置与所选择的句子结构成分内的答案键分配的令牌位置相比较。如果工作空间350组合与答案键组合匹配,则可以奖励分。
答案键可以由教师使用工作空间350以与上面参照图3和图4描述的相同的方式手动生成。可替选地,答案键可以由分析逻辑216使用语法数据222自动生成。
这是对示例性实施方式的描述,但是对于本领域普通技术人员明显的是,在不脱离本发明的范围和精神的情况下,可以对这些特定实施方式的细节进行变化,并且这些变化意在由所附权利要求所涵盖。
Claims (15)
1.一种用于改进对一个或更多个经填充的句子结构图表的计算机化分析和评级的计算机实施的系统,包括:
句子图解接口,所述句子图解接口包括:
自然语言输入部,所述自然语言输入部用于接收待被图解的自然语言句子,
句子构造工具箱,所述句子构造工具箱包括在生成经构造的句子结构时使用的多个句子构造成分,以及
句子构造工作空间,所述句子构造工作空间被配置成:
接收并允许操纵至少一个所选句子构造成分以生成所述经构造的句子结构,以及
接收并允许操纵所述自然语言句子中的每个词语以使得每个词语被分配给所述经构造的句子结构中的位置以生成经构造并填充的句子结构;以及
在服务器计算机上实施的句子分析逻辑,所述句子分析逻辑用于将所述经构造并填充的句子结构与分析句子结构相比较以将评级分值分配给所述经构造并填充的句子结构。
2.根据权利要求1所述的计算机实施的系统,其中,所述经构造的句子结构包括多个句子结构成分。
3.根据权利要求1所述的计算机实施的系统,其中,所述句子构造工具箱中的所述句子结构成分基于所述自然语言输入部中的所述自然语言句子来定制。
4.根据权利要求1所述的计算机实施的系统,其中,所述句子图解接口被显示在在通过网络连接至所述服务器计算机的用户计算机上实施的网页浏览器中。
5.根据权利要求1所述的计算机实施的系统,其中,所述句子分析逻辑被配置成通过与分析句子结构相比较来分析所述经构造并填充的句子结构。
6.根据权利要求5所述的计算机实施的系统,其中,所述分析句子结构由所述句子分析逻辑基于输入到所述自然语言输入部中的数据来动态地生成。
7.根据权利要求5所述的计算机实施的系统,其中,所述分析句子结构被存储在所述服务器计算机的数据存储装置中。
8.根据权利要求5所述的计算机实施的系统,其中,所述句子分析逻辑基于至少所使用的所述句子结构成分、所述句子结构成分的相对位置、所述句子结构成分的着色、以及来自所述自然语言输入部的词语在所述句子结构成分内的位置的评级分来分析所述经构造并填充的句子结构。
9.一种用于改进对一个或更多个经填充的句子结构图表的计算机化分析和评级的计算机实施的方法,包括:
使用由远程计算机执行的网页浏览器、通过计算机网络从服务器计算机实施句子图解接口;
通过所述句子图解接口中的自然语言输入部来接收待被图解的自然语言句子;
在所述句子图解接口中显示句子构造工具箱,所述句子构造工具箱包括在生成经构造的句子结构时使用的多个句子构造成分;
在所述句子图解接口中实施句子构造工作空间,所述句子构造工作空间被配置成接收并允许操纵至少一个所选句子构造成分以生成所述经构造的句子结构、并且接收并允许操纵所述自然语言句子中的每个词语以使得每个词语被分配给所述经构造的句子结构中的位置以生成经构造并填充的句子结构;以及
在所述服务器计算机上实施句子分析逻辑,所述句子分析逻辑用于将所述经构造并填充的句子结构与分析句子结构相比较以将评级分值分配给所述经构造并填充的句子结构。
10.根据权利要求9所述的计算机实施的方法,其中,所述经构造的句子结构包括多个句子结构成分。
11.根据权利要求9所述的计算机实施的方法,其中,所述句子构造工具箱中的所述句子结构成分基于所述自然语言输入部中的所述自然语言句子来定制。
12.根据权利要求9所述的计算机实施的方法,其中,所述句子分析逻辑被配置成通过与分析句子结构相比较来分析所述经构造并填充的句子结构。
13.根据权利要求12所述的计算机实施的方法,其中,所述分析句子结构由所述句子分析逻辑基于输入到所述自然语言输入部中的数据来动态地生成。
14.根据权利要求12所述的计算机实施的方法,其中,所述分析句子结构被存储在所述服务器计算机的数据存储装置中。
15.根据权利要求12所述的计算机实施的方法,其中,所述句子分析逻辑基于至少所使用的所述句子结构成分、所述句子结构成分的相对位置、所述句子结构成分的着色、以及来自所述自然语言输入部的词语在所述句子结构成分内的位置的评级分来分析所述经构造并填充的句子结构。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862615175P | 2018-01-09 | 2018-01-09 | |
US62/615,175 | 2018-01-09 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110032726A CN110032726A (zh) | 2019-07-19 |
CN110032726B true CN110032726B (zh) | 2023-11-03 |
Family
ID=67159763
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910020619.1A Active CN110032726B (zh) | 2018-01-09 | 2019-01-09 | 用于改进句子图表构造和分析的系统和方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11106872B2 (zh) |
CN (1) | CN110032726B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110399499B (zh) * | 2019-07-18 | 2022-02-18 | 珠海格力电器股份有限公司 | 一种语料生成方法、装置、电子设备及可读存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1265209A (zh) * | 1997-07-22 | 2000-08-30 | 微软公司 | 使用自然语言处理技术用于处理文本输入的系统 |
CN1302412A (zh) * | 1997-07-22 | 2001-07-04 | 微软公司 | 应用搜索结果的自然语言处理以改进整体精度的信息检索系统的设备和方法 |
CN1545665A (zh) * | 2001-06-29 | 2004-11-10 | 英特尔公司 | 用于多分析器架构的预测串联算法 |
KR20050118411A (ko) * | 2004-06-14 | 2005-12-19 | 남승우 | 네트워크 기반의 문장 도해 작성 시스템 및 그 운영방법 |
JP2012022599A (ja) * | 2010-07-16 | 2012-02-02 | Hitachi Ltd | 文構造解析装置、文構造解析方法および文構造解析プログラム |
CN102880599A (zh) * | 2011-07-12 | 2013-01-16 | 新诺亚舟科技(深圳)有限公司 | 用于解析句子并支持对该解析进行学习的句子探索方法 |
KR20130034453A (ko) * | 2011-09-28 | 2013-04-05 | 손인한 | 기호처리를 통해 문장구조 인식이 용이한 영어문장 직독직해 학습시스템 |
CN106708800A (zh) * | 2016-11-22 | 2017-05-24 | 彭炜明 | 一种基于句本位语法构建汉语树库的形式化方案 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7676462B2 (en) * | 2002-12-19 | 2010-03-09 | International Business Machines Corporation | Method, apparatus, and program for refining search criteria through focusing word definition |
JP5389273B1 (ja) * | 2012-06-25 | 2014-01-15 | 株式会社東芝 | 文脈解析装置および文脈解析方法 |
US10325026B2 (en) * | 2015-09-25 | 2019-06-18 | International Business Machines Corporation | Recombination techniques for natural language generation |
CN108959312B (zh) * | 2017-05-23 | 2021-01-29 | 华为技术有限公司 | 一种多文档摘要生成的方法、装置和终端 |
-
2019
- 2019-01-08 US US16/242,242 patent/US11106872B2/en active Active
- 2019-01-09 CN CN201910020619.1A patent/CN110032726B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1265209A (zh) * | 1997-07-22 | 2000-08-30 | 微软公司 | 使用自然语言处理技术用于处理文本输入的系统 |
CN1302412A (zh) * | 1997-07-22 | 2001-07-04 | 微软公司 | 应用搜索结果的自然语言处理以改进整体精度的信息检索系统的设备和方法 |
CN1545665A (zh) * | 2001-06-29 | 2004-11-10 | 英特尔公司 | 用于多分析器架构的预测串联算法 |
KR20050118411A (ko) * | 2004-06-14 | 2005-12-19 | 남승우 | 네트워크 기반의 문장 도해 작성 시스템 및 그 운영방법 |
JP2012022599A (ja) * | 2010-07-16 | 2012-02-02 | Hitachi Ltd | 文構造解析装置、文構造解析方法および文構造解析プログラム |
CN102880599A (zh) * | 2011-07-12 | 2013-01-16 | 新诺亚舟科技(深圳)有限公司 | 用于解析句子并支持对该解析进行学习的句子探索方法 |
KR20130034453A (ko) * | 2011-09-28 | 2013-04-05 | 손인한 | 기호처리를 통해 문장구조 인식이 용이한 영어문장 직독직해 학습시스템 |
CN106708800A (zh) * | 2016-11-22 | 2017-05-24 | 彭炜明 | 一种基于句本位语法构建汉语树库的形式化方案 |
Non-Patent Citations (2)
Title |
---|
Sentence Diagram Generation Using Dependency Parsing;Elijah Mayfield;Proceedings of the ACL-IJCNLP 2009 Student Research Workshop;45–53 * |
浅析句子成分;赵锁平;知识窗(教师版);第20页 * |
Also Published As
Publication number | Publication date |
---|---|
US20190213257A1 (en) | 2019-07-11 |
CN110032726A (zh) | 2019-07-19 |
US11106872B2 (en) | 2021-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Fulda et al. | TimeLineCurator: Interactive authoring of visual timelines from unstructured text | |
CN108073680A (zh) | 生成具有提炼内容的演示幻灯片 | |
JP2016218995A (ja) | 機械翻訳方法、機械翻訳装置及びプログラム | |
Ledin et al. | A discourse–design approach to multimodality: the visual communication of neoliberal management discourse | |
US9646512B2 (en) | System and method for automated teaching of languages based on frequency of syntactic models | |
US10453353B2 (en) | Reading comprehension apparatus | |
Mayfield et al. | An interactive tool for supporting error analysis for text mining | |
US10043409B1 (en) | Systems and methods for monitoring comprehension | |
Chinkina et al. | Online information retrieval for language learning | |
US7013259B1 (en) | System and method for teaching writing using microanalysis of text | |
KR101670326B1 (ko) | 언어 문장 패턴 제안을 위한 생성 시스템 | |
CN110032726B (zh) | 用于改进句子图表构造和分析的系统和方法 | |
TWI686714B (zh) | 用於分析一段文本的方法和系統 | |
RU2479867C2 (ru) | Способ работы пользовательского лингвистического интерфейса | |
Koschmider et al. | Business process modeling support by depictive and descriptive diagrams | |
Phewkum et al. | ScrambleSQL: A Novel Drag-and-drop SQL Learning Tool | |
KR101412112B1 (ko) | 오답에 대한 시각화 패턴을 이용한 학습 장치 및 학습 방법 | |
WO2016018195A1 (ru) | Способ изучения языковых единиц иностранного языка | |
Hooper et al. | Considering the design of an electronic progress-monitoring system | |
CN109917983A (zh) | 一种交互控制方法及装置 | |
JP2021026521A (ja) | 不適合事例検索システムおよび不適合事例検索方法 | |
Belikova et al. | Integrative approach to the variable user interface development | |
Kopylova | Designing an Electronic System for a Foreign Language Students' Teaching of the Training Program “Information Science and Computer Engineering” | |
Smiech | Configurable text exploration interface with NLP for decision support | |
Weusten et al. | A Bayesian approach for evaluating equivalence over multiple groups, and comparison with frequentist tost |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |