CN111191425A - 一种加的夫语法分析绘图系统 - Google Patents

一种加的夫语法分析绘图系统 Download PDF

Info

Publication number
CN111191425A
CN111191425A CN202010001779.4A CN202010001779A CN111191425A CN 111191425 A CN111191425 A CN 111191425A CN 202010001779 A CN202010001779 A CN 202010001779A CN 111191425 A CN111191425 A CN 111191425A
Authority
CN
China
Prior art keywords
node
syntax tree
file
tree diagram
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010001779.4A
Other languages
English (en)
Inventor
陈光浦
李鹏程
王深
王欢
韩岱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology Beijing USTB
Original Assignee
University of Science and Technology Beijing USTB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology Beijing USTB filed Critical University of Science and Technology Beijing USTB
Priority to CN202010001779.4A priority Critical patent/CN111191425A/zh
Publication of CN111191425A publication Critical patent/CN111191425A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供一种加的夫语法分析绘图系统,所述加的夫语法分析绘图系统包括:文件操作模块,用于句法树形图文件的新建、打开以及保存操作;句法树形图绘制模块,用于接收用户的节点编辑指令,对当前正在编辑的句法树形图文件中的节点进行编辑,并根据节点编辑结果生成句法树形图;绘图显示模块,所述绘图显示模块包括句法树形图显示单元,所述句法树形图显示单元用于显示当前正在编辑的句法树形图文件。本发明的加的夫语法分析绘图系统可以辅助人工完成对语料的分词与分类,以及句法树形图的构建;解决现有绘图系统生成的文件兼容性差,文件内容冗余,无法满足语料库分析需求的问题。

Description

一种加的夫语法分析绘图系统
技术领域
本发明涉及语法分析技术领域,特别是指一种加的夫语法分析绘图系统。
背景技术
加的夫语法(Cardiff Grammar)是韩礼德(M.A.K.Halliday)系统功能语法体系(Systemic Functional Grammar)的一个分支,是目前以计算形式(Computational Form)存在的最大的语法体系之一。建造这个机器语法的目的是,准备建立一个非专业人员能自由地与“以智能知识为基础的系统(Intelligent Knowledge Based System)”对话的系统。
加的夫语法体系的核心是系统网络(System Network),它包含一系列的实现规则(realization rules),通过这些规则,不但能使计算机生成合乎语法的句子结构,而且能帮助计算机理解与这些结构配合的语义特征。
在加的夫语法中,句法范畴包括单位(unit)、类别(class)、成分(element)和形式项(item)四个组成部分。范畴之间存在着3种关系:组成(componence)、填充(filling)和体现(exponence)。其中,组成用竖线“|”表示,填充用横线“一”表示,体现用三角“△”表示。其句法树形图示例如图1所示。
其中,主语(M)、补语(C)由名词词组(ngp)填充,名词词组(ngp)由领头词(h)组成,名词词组的领头词由Henry、Helen体现。主要动词(M)由kissed体现。结束符号(E)由句点“.”体现。
由于加的夫句法系统的生成机制是基于大量语料实现的,因此,语料库的建立与完善对于句法系统至关重要。传统的句法树形图绘制工作,主要依赖纸笔绘画,或使用Microsoft Visio软件进行绘制。其中,通过Visio软件所生成的.vsd文件,仅能作为插图在Word或PPT中进行展示,文件本身不具有树形层级结构。且文件兼容性差,文件内容冗余,包含大量不必要的修饰信息,无法满足语料库分析需求。
发明内容
本发明要解决的技术问题是提供一种加的夫语法分析绘图系统,旨在辅助人工完成对语料的分词与分类,以及句法树形图的构建;以解决现有绘图系统生成的文件兼容性差,文件内容冗余,无法满足语料库分析需求的问题。
为解决上述技术问题,本发明提供如下技术方案:
一种加的夫语法分析绘图系统,所述一种加的夫语法分析绘图系统包括:
文件操作模块,用于句法树形图文件的新建、打开以及保存操作;
句法树形图绘制模块,用于接收用户的节点编辑指令,对当前正在编辑的句法树形图文件中的节点进行编辑,并根据节点编辑结果生成句法树形图;
绘图显示模块,所述绘图显示模块包括句法树形图显示单元,所述句法树形图显示单元用于显示当前正在编辑的句法树形图文件。
其中,所述文件操作模块在新建句法树形图文件时,所建文件的格式为SVG格式。
其中,所述文件操作模块在打开句法树形图文件时,支持打开的文件类型包括SVG格式文件、VSD格式文件,以及STDI格式文件。
其中,所述文件操作模块在保存句法树形图文件时,支持将文件保存为EMF或SVG格式。
其中,所述句法树形图绘制模块对当前正在编辑的句法树形图文件中的节点的编辑包括为当前节点添加子节点、删除当前节点、为当前节点添加父节点,以及将当前节点作为父节点删除;其中,当将当前节点作为父节点删除后,所述句法树形图绘制模块将当前节点的下级节点移交至当前节点的上一级节点。
进一步地,所述句法树形图绘制模块还用于实现节点树形图的自动对齐,使节点间的间距一致。
其中,所述绘图显示模块支持多文件同时打开,当打开多个文件时,以多标签页的形式显示。
进一步地,所述绘图显示模块还包括节点信息显示单元和节点层级显示单元;其中,
所述节点信息显示单元用于显示当前节点的属性信息,并根据用户的修改指令对当前节点的属性信息进行修改;所述属性信息包括节点类型、是否按字母排序、节点文本、节点是否为填充关系以及节点行距;
所述节点层级显示单元用于显示当前正在编辑的句法树形图文件XML层级结构关系;其中,处在同一层级的节点以相同颜色显示;并根据用户的展开及合并指令展开或合并相应的节点树形图。
进一步地,所述加的夫语法分析绘图系统还包括撤销与恢复模块,用于记录用户对当前正在编辑的句法树形图文件的操作,并根据用户的撤销与恢复指令,对当前正在编辑的句法树形图文件进行相应的操作撤销或恢复。
进一步地,所述加的夫语法分析绘图系统还包括语言选择模块,用于根据用户的选择指令以用户选择的语言作为加的夫语法分析绘图系统的显示语言。
本发明的上述技术方案的有益效果如下:
本发明的加的夫语法分析绘图系统旨在辅助人工完成对语料的分词与分类,以及句法树形图的构建;相比传统的语料分词系统,本发明系统是第一个引入“树形图(TreeDiagram)”机制的可视化分析系统。在底层格式的选取上,本发明系统选择了SVG(ScalableVector Graphics,可缩放矢量图)图像文件格式,其本质是一种XML可扩展标记语言,由于其本身具有层级关系,可以标记数据、定义数据,因此可以将可视化的树形图,转化为计算机能够理解与分析的逻辑结构。同时,SVG格式还具有兼容性高、矢量无损的特点,可以方便使用者导出插入Word文档,或插入HTML中通过Web浏览器进行查看。
附图说明
图1为加的夫语法的句法树形图示意图;
图2为本发明的加的夫语法分析绘图系统的系统框图;
图3为向当前节点添加父节点的示意图;
图4为将当前节点作为父节点删除的示意图;
图5为智能排版的示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
请参阅图2至图5,本实施例提供一种加的夫语法分析绘图系统,所述加的夫语法分析绘图系统包括:
文件操作模块,用于句法树形图文件的新建、打开以及保存操作;
其中,该文件操作模块在新建句法树形图文件时,所建文件的格式为SVG格式;在打开句法树形图文件时,支持打开的文件类型包括SVG格式文件、VSD格式文件,以及STDI格式文件;在保存句法树形图文件时,支持将文件另存为EMF或SVG格式;其中,EMF为增强型图元文件,该类型文件可在低版本Microsoft Office或者Windows画图工具中打开,但无法被本实施例的加的夫语法分析绘图系统重新打开编辑。
句法树形图绘制模块,用于接收用户的节点编辑指令,对当前正在编辑的句法树形图文件中的节点进行编辑,并根据节点编辑结果生成句法树形图;
其中,该句法树形图绘制模块对当前正在编辑的句法树形图文件中的节点的编辑包括为当前节点添加子节点、删除当前节点、为当前节点添加父节点,以及将当前节点作为父节点删除;
其中,为当前节点添加子节点时,若选择的节点为Σ(Sentense句子),则添加的子节点只能为Cl(Clause从句);
删除当前节点时,若绘制区只有一个Σ时,该节点无法被删除;
为当前节点添加父节点时,如图3所示,其中,N4为当前被选中的节点,当选择为其添加父节点后,所添加的父节点为N6;当绘制区填充关系层级只要一层时,即只有Σ或
Figure BDA0002353758290000041
则无法添加父节点。
当将当前节点作为父节点删除后,当前节点的下级节点将被移交至该节点的上一级节点;如图4所示,图4的(a)图中的N6节点被作为父节点删除后,结果如图4中(b)图所示。其中,Σ作为唯一的父节点,不能被删除。
进一步地,上述句法树形图绘制模块还用于实现节点树形图的自动对齐,使节点间的间距一致,免去手动拖拽的繁琐,如图5所示,其中,(a)为智能排版前,(b)为智能排版后。
绘图显示模块,所述绘图显示模块包括句法树形图显示单元、节点信息显示单元以及节点层级显示单元;其中,
句法树形图显示单元用于显示当前正在编辑的句法树形图文件,支持多文件同时打开,当打开多个文件时,以多标签页的形式显示;
节点信息显示单元用于显示当前节点的属性信息,并根据用户的修改指令对当前节点的属性信息进行修改;所述属性信息包括节点类型、是否按字母排序、节点文本、节点是否为填充关系以及节点行距;节点文本是该节点所对应的形式项(item),除最后一级节点之外,其余节点可不填写对应节点文本;节点是否为填充关系可以选择该节点是否作为“类别节点(class)”与“成分父节点(element)”构成“填充关系(filling)”。节点行距可以调整上下两级节点之间线段的长度,本实施例中的默认值为30px。
节点层级显示单元用于显示当前正在编辑的句法树形图文件XML层级结构关系;其中,处在同一层级的节点以相同颜色显示;并可根据用户的展开及合并指令展开或合并相应节点树形图,该操作不会对树形图结构信息产生影响。
进一步地,本实施例的加的夫语法分析绘图系统还包括撤销与恢复模块,用于记录用户对当前正在编辑的句法树形图文件的操作,并根据用户的撤销与恢复指令,对当前正在编辑的句法树形图文件进行相应的操作撤销或恢复。
进一步地,本实施例的加的夫语法分析绘图系统还包括语言选择模块,用于根据用户的选择指令以用户选择的语言作为加的夫语法分析绘图系统的显示语言,具体地,本实施例支持3种界面语言,分别为简体中文、繁体中文和英文,用户可根据需求在多种语言之间进行切换。
本实施例的加的夫语法分析绘图系统旨在辅助人工完成对语料的分词与分类,以及句法树形图的构建;相比传统的语料分词系统,该系统是第一个引入“树形图(TreeDiagram)”机制的可视化分析系统。在底层格式的选取上,该系统选择了SVG(ScalableVector Graphics,可缩放矢量图)图像文件格式,其本质是一种XML可扩展标记语言,由于其本身具有层级关系,可以标记数据、定义数据,因此可以将可视化的树形图,转化为计算机能够理解与分析的逻辑结构。同时,SVG格式还具有兼容性高、矢量无损的特点,可以方便使用者导出插入Word文档,或插入HTML中通过Web浏览器进行查看。
此外,需要说明的是,本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
还需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上所述是本发明的优选实施方式,应当指出,尽管已描述了本发明的优选实施例,但对于本技术领域的普通技术人员来说,一旦得知了本发明的基本创造性概念,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

Claims (10)

1.一种加的夫语法分析绘图系统,其特征在于,包括:
文件操作模块,用于句法树形图文件的新建、打开以及保存操作;
句法树形图绘制模块,用于接收用户的节点编辑指令,对当前正在编辑的句法树形图文件中的节点进行编辑,并根据节点编辑结果生成句法树形图;
绘图显示模块,所述绘图显示模块包括句法树形图显示单元,所述句法树形图显示单元用于显示当前正在编辑的句法树形图文件。
2.如权利要求1所述的加的夫语法分析绘图系统,其特征在于,所述文件操作模块在新建句法树形图文件时,所建文件的格式为SVG格式。
3.如权利要求2所述的加的夫语法分析绘图系统,其特征在于,所述文件操作模块在打开句法树形图文件时,支持打开的文件类型包括SVG格式文件、VSD格式文件,以及STDI格式文件。
4.如权利要求3所述的加的夫语法分析绘图系统,其特征在于,所述文件操作模块在保存句法树形图文件时,支持将文件保存为EMF或SVG格式。
5.如权利要求1所述的加的夫语法分析绘图系统,其特征在于,所述句法树形图绘制模块对当前正在编辑的句法树形图文件中的节点的编辑包括为当前节点添加子节点、删除当前节点、为当前节点添加父节点,以及将当前节点作为父节点删除;其中,当将当前节点作为父节点删除后,所述句法树形图绘制模块将当前节点的下级节点移交至当前节点的上一级节点。
6.如权利要求1所述的加的夫语法分析绘图系统,其特征在于,所述句法树形图绘制模块还用于实现节点树形图的自动对齐,使节点间的间距一致。
7.如权利要求1所述的加的夫语法分析绘图系统,其特征在于,所述绘图显示模块支持多文件同时打开,当打开多个文件时,以多标签页的形式显示。
8.如权利要求1所述的加的夫语法分析绘图系统,其特征在于,所述绘图显示模块还包括节点信息显示单元和节点层级显示单元;其中,
所述节点信息显示单元用于显示当前节点的属性信息,并根据用户的修改指令对当前节点的属性信息进行修改;所述属性信息包括节点类型、是否按字母排序、节点文本、节点是否为填充关系以及节点行距;
所述节点层级显示单元用于显示当前正在编辑的句法树形图文件XML层级结构关系;其中,处在同一层级的节点以相同颜色显示;并根据用户的展开及合并指令展开或合并相应的节点树形图。
9.如权利要求1所述的加的夫语法分析绘图系统,其特征在于,所述加的夫语法分析绘图系统还包括撤销与恢复模块,用于记录用户对当前正在编辑的句法树形图文件的操作,并根据用户的撤销与恢复指令,对当前正在编辑的句法树形图文件进行相应的操作撤销或恢复。
10.如权利要求1-9任一项所述的加的夫语法分析绘图系统,其特征在于,所述加的夫语法分析绘图系统还包括语言选择模块,用于根据用户的选择指令以用户选择的语言作为所述加的夫语法分析绘图系统的显示语言。
CN202010001779.4A 2020-01-02 2020-01-02 一种加的夫语法分析绘图系统 Pending CN111191425A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010001779.4A CN111191425A (zh) 2020-01-02 2020-01-02 一种加的夫语法分析绘图系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010001779.4A CN111191425A (zh) 2020-01-02 2020-01-02 一种加的夫语法分析绘图系统

Publications (1)

Publication Number Publication Date
CN111191425A true CN111191425A (zh) 2020-05-22

Family

ID=70710621

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010001779.4A Pending CN111191425A (zh) 2020-01-02 2020-01-02 一种加的夫语法分析绘图系统

Country Status (1)

Country Link
CN (1) CN111191425A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010113650A (ja) * 2008-11-10 2010-05-20 Seiko Epson Corp 構造化文書印刷装置、構造化文書印刷方法及びプログラム
CN109408674A (zh) * 2018-09-14 2019-03-01 深圳大学 基于仙人掌树的数据可视化方法、装置、设备及存储介质
CN110362691A (zh) * 2019-07-19 2019-10-22 大连语智星科技有限公司 一种句法树库构建系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010113650A (ja) * 2008-11-10 2010-05-20 Seiko Epson Corp 構造化文書印刷装置、構造化文書印刷方法及びプログラム
CN109408674A (zh) * 2018-09-14 2019-03-01 深圳大学 基于仙人掌树的数据可视化方法、装置、设备及存储介质
CN110362691A (zh) * 2019-07-19 2019-10-22 大连语智星科技有限公司 一种句法树库构建系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
梦在深巷: "XMind怎么绘制树状家谱图?", 《HTTPS://WWW.KAFAN.CN/EDU/55848526.HTML》 *
电脑软件: "XMind可以导出哪些格式", 《HTTPS://JINGYAN.BAIDU.COM/ARTICLE/EA24BC39C55273DA62B33123.HTML》 *

Similar Documents

Publication Publication Date Title
US8434014B1 (en) System and method for editing information
KR101374994B1 (ko) 다중 표현을 이용한 문서 저장
KR920006775B1 (ko) 문서 처리 시스템 및 요소 마크 확장 방법
US20080134019A1 (en) Processing Data And Documents That Use A Markup Language
US20140006913A1 (en) Visual template extraction
RU2579888C2 (ru) Универсальное представление текста с возможностью поддержки различных форматов документов и текстовая подсистема
US20090083300A1 (en) Document processing device and document processing method
US20070283246A1 (en) Processing Documents In Multiple Markup Representations
JP4566196B2 (ja) 文書処理方法および装置
Cowan et al. Rita - an Editor and User Interface for Manipulating Structured Documents
EP1830274A1 (en) Server device and name space issuing method
Tacchetti User's Guide for ELAN Linguistic Annotator
JP4627530B2 (ja) 文書処理方法および装置
US20090287994A1 (en) Document processing device and document processing method
JPWO2005098662A1 (ja) 文書処理装置及び文書処理方法
US20080005085A1 (en) Server Device and Search Method
US20080270887A1 (en) Document Processing Device And Document Processing Method
US5689723A (en) Method for allowing single-byte character set and double-byte character set fonts in a double-byte character set code page
CN111191425A (zh) 一种加的夫语法分析绘图系统
US7310771B2 (en) Method and computer-readable medium for providing page and table formatting services
JPS61278970A (ja) 自然言語処理装置における構文解析結果の表示及び校正のための制御方法
US20090083620A1 (en) Document processing device and document processing method
EP1743256A1 (en) Processing documents in multiple markup representations
EP1743254A1 (en) Processing data and documents that use a markup language
US20230289527A1 (en) Convergence of document state and application state

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200522

RJ01 Rejection of invention patent application after publication