CN103077158A - 基于语料库的计算机辅助写作系统 - Google Patents

基于语料库的计算机辅助写作系统 Download PDF

Info

Publication number
CN103077158A
CN103077158A CN2013100536423A CN201310053642A CN103077158A CN 103077158 A CN103077158 A CN 103077158A CN 2013100536423 A CN2013100536423 A CN 2013100536423A CN 201310053642 A CN201310053642 A CN 201310053642A CN 103077158 A CN103077158 A CN 103077158A
Authority
CN
China
Prior art keywords
information
sentence
corpus
writing
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2013100536423A
Other languages
English (en)
Inventor
吴志超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN2013100536423A priority Critical patent/CN103077158A/zh
Publication of CN103077158A publication Critical patent/CN103077158A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

本发明针对日益凸显的计算机辅助写作需求,引入语料库和语料库技术以弥补人们的信息视野、信息处理和反应速度等能力的不足够,利用计算机的大容量存储、快速处理和便捷的人机交互能力,构建一种基于语料库的计算机辅助写作系统,通过人机交互形式为使用者实时推荐来源于真实语料库的句型和例句,面向造句这个写作的核心活动为人们提供帮助,填补基于语料库的计算机辅助写作系统的技术空白。本发明由控制程序存储装置、语料库装置、过程信息暂存装置、输入装置、显示装置、连接装置、处理与控制装置组成,通过它们之间相互作用与配合,实现为使用者实时推荐句型以及相关例句信息的辅助写作功能。

Description

基于语料库的计算机辅助写作系统
技术领域
本发明涉及计算机信息处理技术领域,尤其涉及一种可为使用者实时推荐句型以及相关例句信息的基于语料库的计算机辅助写作系统。
背景技术
高度概括写作过程,可以用八个字四个词来概括,即“谋篇、安章、遣词、造句”,其中谋篇、安章可以说是战略层面的事,而遣词、造句则是战术层面的事,也是写作中最劳心劳力的阶段,是捉笔人最需要得到计算机帮助的中间过程。
就技术现状来看,计算机辅助写作主要集中于两类活动,这两类活动的差别在于活动主体的差别和活动目的的差异。第一类计算机辅助写作活动的主体是人,是以人为主,而计算机只是提供文字输入、编辑、文档管理等多种辅助功能,这类活动因计算机的介入可以提高写作的效率,确实给了捉笔人不小的帮助,甚至悄然改变了人们的写作模式,但是,这类活动对写作活动的精髓——“谋篇、安章、遣词、造句”似乎帮助不大,也就是说,只是在写作活动的低层次上给予捉笔人以有益的帮助;另一类则是尝试以机器(计算机)为写作活动主体的研究开发活动,研究如何利用计算机软件实现“谋篇、安章、遣词、造句”,即在人的有限参与下主要由计算机按一定规则完成行文作诗,它们属于狭义的计算机语言信息处理研究领域。这两类活动都有大量的实用产品或科研成果,发表了很多论文和专著。
分析计算机辅助写作技术现状可以发现,上述第一类活动由于其不针对写作活动的核心需求,辅助写作的功能作用是有限的,甚至可以说不具实质性;上述第二类活动限于技术基础的限制,目前还需要人的参与才能达到一定的实用效果,否则可能会输出看起来非常低级的结果,离达到真正意义上的写作还有很长的路要走。因此,这两类活动都满足不了计算机辅助写作的现实需求。
但需求是现实存在的。人类已进入以信息和网络为显著文明特征的时代,这个时代,互联网和无线通信飞速发展,全民写作的时代已悄然来临。在这个时代,写作不应该还是少数人的绝技,千百年来限制着人们表达和交流的“谋篇、安章、遣词、造句”的原始手段亟需突破和改变。快速发展的计算机技术是可帮助人们在写作活动中实现写作模式改变的优选手段,而且,利用计算机技术我们还可以做得更多。除上述两类活动之外,充分利用计算机技术的快速、精确、大存储容量、集成化、网络化、交互方式友好便捷等技术特点,可以探索另一类以写作辅助信息的实时、准确、便捷提供为特征的计算机辅助写作活动,以达到对人的写作能力的补充,以服务于因人的局限性而困扰人们的写作核心过程,例如遣词、造句等。这种可称为第三类的计算机辅助写作活动,通过人与计算机的充分互补及协同,既因可对写作的核心过程大有助益而不同于第一类活动,也没有第二类活动的技术成熟时间的遥遥无期问题,具有现实性,应该是十分可取且前景广阔的。目前,还没有出现可用于第三类计算机辅助写作活动的产品或相关应用成果报道,只是在专利信息库里可以查到技术机理相似的申请文件(尚无授权专利)。
本人前期提交的“义类计算机检索系统”专利申请可以说是第三类计算机辅助写作活动的一个实例,该系统可以通过人机交互方式帮助捉笔人解决写作中的遣词难题。
造句,是写作过程中两大基本活动(遣词、造句)中的另一个,是写作过程中的另一个困扰捉笔人的难题,捉笔人有时会为如何准确运用词语恰当地构造语句,以正确地表达原意和情感而颇费思量或绞尽脑汁。
教科书告诉我们,要写好文章、要造好句,没有捷径,必须靠日积月累,需要长期、大量的阅读和写作练习才可能达到才思如涌、下笔如神。这千百年来的谆谆教导,在计算机技术快速发展的今天,虽仍有教导意义,但其真理的相对性就凸显出来了。科学研究发现,人脑对信息的记忆、处理、提取、辨别(评估)的能力是有限的,而且因人而异、差别很大,这解释了写作只是少数人的绝技之现象的必然性。但在计算机技术高速发展和日益普及的今天,情况正在快速改变。计算机可以及时有效地提供捉笔人所需的大量素材、词语、句法、文法等基本信息,以弥补人脑的局限性,也可以通过搜索、统计、比较等技术手段帮助人们达到遣词造句时的择优萃精。这些都可以通过日益普及的计算机通过人机交互形式来实现,使写作的普及化,或称全民写作成为可能。
语料库语言学是80年代才崭露头角的一门计算语言学的新的分支学科。它研究机器可读的自然语言文本的采集、存储、检索、统计、语法标注、句法语义分析,以及研究具有上述功能的语料库在语言研究、语言教学、自然语言处理等领域中的应用。
语料库语言学的技术基础即语料库,是一种很大规模的有序存储计算机可读的自然语言的数据库。基于语料库对语言信息进行统计和处理的技术称为语料库技术。从本质上讲,语料库语言学的研究采用的是一种基于统计的经验主义处理方法,它与语言学界传统的基于规则的理性主义处理方法是大不相同的。前者是从大量现实存在的语言材料中去统计和发现语言知识,而后者的基础则是语言学家人为制定的语言学规则。
传统语言学基本上是通过语言学家用手工方法或“内省”的方法,从有限的语料资料中归纳总结个别的语言数据来获取语言知识的。由于人的记忆能力有限,任何语言学家,哪怕是语言学界的权威泰斗,都不可能记忆和处理浩如烟海的全部语言数据,因此,使用传统的手工方法来获取语言知识,犹如以管窥豹,这种获取语言知识的方法不仅效率极低,而且带有很大的主观性。因而,基于规则的研究范式难以全面揭示动态语言复杂性系统的本质属性和功能价值。
语料库语言学使用统计的方法或机器学习的方法,自动或半自动地从浩如烟海的语料库中获取准确的语言知识。这是语言学获取语言知识方式的巨大变化,在语言学的发展历史上具有革命性的意义。来源于现实世界的真实语料信息,为语言研究、语言教学等提供了最原始、最可靠的素材或证据,由此得到的研究成果和应用成果真实可信、具有生命力。从上世纪90年代开始,语料库方法逐渐成为语言学研究的主流方法,受到语言研究者的普遍欢迎。即便是传统语言学研究者也开始利用语料库技术来开展研究活动,以弥补基于规则的方法的不足。
语料库作为一种方法或技术有着广泛的应用领域,如在语言教学、语言定量分析、词汇研究、词语搭配研究、语法研究、多语言跨文化研究、词典编纂、作品风格分析、自然语言理解和机器翻译等领域中的应用,但迄今还未在公开文献上发现将语料库应用于计算机辅助写作活动。当将语料库技术应用于前述第三类计算机辅助写作活动时,计算机向捉笔人推荐的知识是来源于语料库,亦即来源于真实语言,而不是来源于人为设定的规则,这既适应了语言学发展的大方向,也将有助于推动语言学新理论和新技术走向实用、走向社会。
在中国发明专利数据库中进行检索,发现属于上述第三类计算机辅助写作技术的并不算多,尚没有发现基于语料库技术的计算机辅助写作专利申请文件。经检索发现6个专利申请公开说明书属第三类计算机辅助写作专利申请,而目前尚无授权的相关主题中国发明专利。检索到的6个专利文件简单介绍和说明如下:
申请号为CN01121472.4的“外语写作辅助方法和辅助工具”专利申请和申请号为CN03134379.1的“写作语意辅助提示系统及方法”专利申请主要为英语写作时的遣词输入过程提供参考信息,不涉及句型辅助信息的提供。
申请号为CN200310121288.X的“电子文档的计算机辅助写作和浏览的方法及装置”专利申请对已输入的电子文档生成结构摘要,并可在辅助写作和浏览过程中呈现摘要给使用者以供参考,不涉及句型辅助信息的提供。
申请号为CN200710018035.8的专利申请“一种实时句子辅助写作方法及系统”、申请号为CN201010200796.7的专利申请“文章辅助写作系统及其方法”、申请号为CN201210107089.2的专利申请“规范文档辅助写作系统及规范文档生成方法”都采用了人机交互的形式,且以提供参考句型为主要功能,但它们都可以归类为基于规则的方法,与基于语料库的方法有效果上和本质上的不同。例如申请号为CN200710018035.8和申请号为CN201010200796.7的专利申请中,作为写作基本素材的例句均来源于系统构建时人为设定的例句数据库,具有很强的主观色彩,同时也缺乏全面性、权威性和开放性,对写作的辅助作用是有限的,更难以提升写作质量。类似问题在采用基于语料库的方法时都将不复存在。
发明内容
——要解决的技术问题
日益普及的个人通信与网络终端技术催热了对大众化写作工具的需求,而真正能对写作中遣词、造句等核心活动提供便捷帮助的产品还没有在市场上出现。
本系统针对人们在写作活动中采集、存储、处理、提取、比较及组织相关信息能力的不足够,引入语料库和基于语料库的处理方法,通过人机交互形式实时便捷地推荐来源于真实语料库的句型和例句,面向造句这个写作的核心活动为人们提供帮助,填补基于语料库的计算机辅助写作系统的技术空白。
——技术方案
本系统由控制程序存储装置、语料库装置、过程信息暂存装置、输入装置、显示装置、连接装置、处理与控制装置组成,通过它们之间相互作用与配合,实现为使用者实时推荐句型以及相关例句信息的辅助写作功能。
本系统各组成装置相互连接图如图1,各装置在系统运行中的作用和功能如下:
1)控制程序存储装置(110),用以存储本系统的控制程序,供本系统运行控制之用;
2)语料库装置(120),用以存储较大规模的已对词语和句子进行语法信息标注的语料信息,供本系统以使用者输入的关键信息为检索要素进行检索,得到候选的供推荐的参考句子及其句法信息;其中所标注的语法信息至少包括句法信息;
3)过程信息暂存装置(130),用以暂存本系统信息处理过程中产生的中间过程信息;
4)输入装置(140),用于使用者输入所期望的目标句子的关键信息或操作指令;其中输入的关键信息至少包括下述信息之一种:目标句子的关键词、目标句子关键词的语法信息、目标句子的句法信息;
5)显示装置(150),用以显示本系统的用户界面信息、操作提示信息、推荐的检索结果及其它信息;
6)连接装置(161,162),161用以在输入装置和处理与控制装置之间传输信号和信息;162用以在显示装置和处理与控制装置之间传输信号和信息;
7)处理与控制装置(170),用以执行本系统的运行程序,实现辅助写作过程的检索和处理,以得到供推荐的参考句子及参考句型信息;在运行过程中向本系统内各装置发出控制信号或采集状态信息;
上述连接成一个系统的各装置之间的相互作用与配合关系是:处理与控制装置170根据来自控制程序存储装置110的控制程序和经连接装置161传来的来自输入装置140的使用者操作指令信息,对本系统运行过程涉及的系统内各装置发出控制指令或采集状态信息;处理与控制装置170根据来自控制程序存储装置110的控制程序在显示装置150显示输入提示信息,提示使用者在输入装置140输入所期望的目标句子的关键信息,经连接装置161传送给处理与控制装置170作为检索要素,在对语料库装置120存放的熟语料信息进行以句子为输出单位的检索后,对检索结果进行进一步分析处理,这些过程中产生的中间过程集合暂存于过程信息暂存装置130中,所得到的可推荐给使用者选用的参考句子集合及参考句子对应的句型信息,经连接装置162送往显示装置150按句型推荐规则进行显示,供使用者选用。
组成本系统的各装置具有特定的功能和相互关系,在实际实现方案中,它们既可以是相互分离的装置,也可以由其中部分装置组合成一体化的装置或功能模块,或者本系统的全部装置组合成一体化的单机型产品。
当系统作为一个单机型产品存在时,前述各装置构成系统的功能硬件主体,连接输入装置140的连接装置161与连接显示装置150的连接装置162均等效为该单机型计算机计算机辅助写作装置内部的连接电路。
当系统运行于互联网平台时,系统的各个装置分布在互联网的不同位置,互联网计算机终端的输入功能部件作为本系统输入装置140,互联网计算机终端的显示功能部件作为本系统显示装置150,接入互联网的服务器的相应功能模块代为行使本系统除输入装置140、显示装置150和连接装置161、162以外的各功能装置的功能,其中语料库还可以是与前述服务器相连接的另一个服务器。这种应用形式下,本系统的连接装置161、162与互联网传输设施等效,连接输入装置140的连接装置161与连接显示装置150的连接装置162合用互联网接入链路接入互联网,并通过互联网连接到远端服务器。
——有益效果
本发明针对日益凸显的计算机辅助写作需求,引入语料库语言学和语料库技术以弥补人们的信息视野、信息处理和反应速度等能力的不足够,利用计算机的大容量存储、快速处理和便捷的人机交互能力,构建一种可为使用者实时推荐句型以及相关例句信息的基于语料库的计算机辅助写作系统,面向造句这个写作的核心活动为人们提供帮助,填补基于语料库的计算机辅助写作系统的技术空白。
附图说明
图1是本发明的系统组成示意图,各组成装置的作用和相互关联关系参见以上发明内容的技术方案。
图2是本发明实施例的系统组成示意图,是图1所示系统的一种应用实例,详见实施例说明。
图3是本发明实施例的处理流程简图,详见实施例说明。
图4a、图4b、图4c是本发明实施例的显示界面示意图,各窗口在系统运行中的交互功能参见实施例说明。图中:
40为互联网计算机终端1B的显示装置150的正视图示意图;
410为安装在40上的LED显示屏;
411为410上显示的文字编辑窗口;
412为410上显示的目标句子关键信息输入提示窗口,包括待输入的关键词的指定语法功能及其输入框,以及下拉菜单式句型选择输入框;
413为410上显示的句型检索结果推荐窗口,包括句型信息、例句框和例句对应的链接标志
414为410上链接显示例句上下文的窗口。
411窗口与412、413、414窗口同时显示在一个显示屏幕上,可以在各窗口间相互切换操作。
具体实施方式
实施例 基于语料库的计算机辅助写作在线系统实施方案
1.系统构成
基于语料库的计算机辅助写作在线系统由服务器1A和互联网计算机终端1B组成,以B/S架构运行于互联网平台,使用者通过互联网平台实现在线辅助写作活动。
系统构成如图2,系统由处于网络不同位置的服务器1A和互联网计算机终端1B以及互联网设施160组成。与图1相比较,图1中的连接装置161和连接装置162在本实施方案中等效为互联网设施160,利用互联网计算机终端1B的输入功能部件作为本实施例系统输入装置140,利用互联网计算机终端1B的显示功能部件作为本实施例系统显示装置150,利用服务器1A的相应功能模块代为行使本实施例系统如图1所示除输入装置140、显示装置150、连接装置161、162以外的各功能装置的功能。各功能模块或部件的构成和作用如下:
控制程序存储模块110,为服务器1A上一程序存储区,用以存储本系统的控制程序,供本系统运行控制之用;
语料库模块120,为服务器1A上一程序存储区,用以存储较大规模的已对词语的词性、词语的语法功能和句子的句型进行标注的语料信息,供本系统以使用者输入的关键信息为检索要素进行检索,得到候选的参考句子及其句型信息;
过程信息暂存模块130,为服务器1A上一可读写存储区,用以暂存本系统信息处理过程中产生的中间过程信息;
输入部件140,为互联网计算机终端1B上的触控屏,用于使用者输入所期望的目标句子的关键信息或操作指令;其中输入的关键信息包括目标句子的部分具有指定语法功能的关键词,或选择目标句子的一种句型;输入界面提示的多种指定语法功能的关键词不一定要求全输入,可以部分缺省,句型选择也可以缺省。当不选择句型信息时,至少输入两个及两个以上关键词;当选择句型信息时,至少输入一个关键词,对语料库进行检索后可以按使用者指定的句型推荐参考例句;
显示部件150,为互联网计算机终端1B上的触控屏(显示屏),用以显示本系统的用户界面信息、操作提示信息、推荐的检索结果及其它信息;
互联网或移动互联网传输设施160等效于如图1所示的连接装置161和162;
处理与控制模块170,为服务器1A内中心处理/控制器及其连接接口等配套单元组成,用以执行本系统的运行程序,进行计算和处理操作,实现辅助写作过程的检索和处理,以得到供推荐的参考句子及参考句型信息;模块170在运行过程中向本系统内各模块和部件发出控制信号或采集状态信息。
上述连接成一个系统的各模块或部件之间的相互作用与配合关系是:1A上的处理与控制模块170根据来自控制程序存储模块110的控制程序和经互联网传来的来自互联网终端1B上输入部件140的使用者操作指令信息,对本系统运行过程涉及的系统内各模块和部件发出控制指令或采集状态信息;1A上处理与控制模块170根据来自控制程序存储模块110的控制程序在1B上显示部件150显示输入提示信息,提示使用者在输入部件140输入所期望的目标句子的关键信息,经互联网传送给1A上处理与控制模块170作为检索要素,在对1A上语料库模块120存放的语料信息进行以句子为输出单位的检索后,对检索结果进行进一步分析处理,这些过程中产生的中间过程集合暂存于1A上过程信息暂存模块130中,所得到的可推荐给使用者选用的参考句子集合及参考句子对应的句型信息,经互联网送往1B上显示部件150按句型推荐规则进行显示,供使用者选用。
2.系统处理流程
系统的处理流程简图如图3所示。
系统软件启动后,系统自动选择句型推荐规则模式:统计语料库搜索结果中具有相同句型的句子数量统计值,按统计值由大到小排列句型优先顺序(步骤310)。由使用者通过输入界面输入启动句型推荐流程的指令(步骤320);系统先在显示界面上显示输入关键信息的语法功能要求和输入位置,以及句型选择下拉菜单框(见图4a)(步骤321);使用者按照提示输入关键信息,例如输入主语“见义勇为者”、谓词“搀扶”、宾语“伤者”,或者输入主语“见义勇为者”并在下拉菜单中选择SVO句型(步骤322);系统根据使用者输入的关键信息确定搜索策略,例如选定全要素布尔检索表达式为:(见义勇为者and搀and伤者)(步骤323);采用以上搜素策略对语料库进行检索,例如得到若干同时含有“见义勇为者”、“搀”、“伤者”的句子(步骤324);由于语料库是经标注的熟语料库,可以将关键词在句子中的实际语法功能与输入的语法功能信息对比以判定句子是否符合推荐要求(步骤325);根据检索得到的句子的句型标注信息,对不同句型的句子分类,并进行统计,得到统计值(步骤326);根据统计值大小顺序填写句型推荐优先顺序表,排定推荐顺序(步骤327);按句型推荐优先顺序表逐项显示句型格式和对应的部分句子,以及与句子对应的链接标志,显示策略有利于区别推荐顺序,例如用数字序列标示优先顺序(见图4b)(步骤328);接下来,系统不断检测输入界面有无使用者输入的信息或指令,并在有输入时判定信息或指令类型(步骤330);当使用者点击显示界面上的某一个句子对应的链接标志时,系统根据该链接所附着的地址搜索对应该句子的上下文(步骤331),并显示给使用者(见图4c)(步骤332),然后重新监测使用者的输入指令(步骤333),并在得到“返回”指令后返回步骤328;当使用者点击显示界面上的“退出”软键时,系统结束句型推荐流程(步骤340)。

Claims (10)

1.一种基于语料库的计算机辅助写作系统,其特征在于,该系统(以下或称本系统)基于以下多个装置实现辅助写作功能,即根据使用者输入的所期望的目标句子的关键信息,向使用者推荐目标句子的参考句型及例句供选用参考:
1)控制程序存储装置,用以存储本系统的控制程序,供本系统运行控制之用;
2)语料库装置,用以存储较大规模的已对词语和句子进行语法信息标注的语料信息,供本系统以使用者输入的关键信息为检索要素进行检索,得到候选的供推荐的参考句子及其句法信息;其中所标注的语法信息至少包括句法信息;
3)过程信息暂存装置,用以暂存本系统信息处理过程中产生的中间过程信息;
4)输入装置,用于使用者输入所期望的目标句子的关键信息或操作指令;其中输入的关键信息至少包括下述信息之一类:目标句子的关键词、目标句子关键词的语法信息、目标句子的句法信息;
5)显示装置,用以显示本系统的用户界面信息、操作提示信息、推荐的检索结果及其它信息;
6)连接装置,用以在输入装置和处理与控制装置之间传输信号和信息;或用以在显示装置和处理与控制装置之间传输信号和信息;
7)处理与控制装置,用以执行本系统的运行程序,实现辅助写作过程的检索和处理,以得到供推荐的参考句子及参考句型信息;在运行过程中向本系统内各装置发出控制信号或采集状态信息;
上述连接成一个系统的各装置之间的相互作用与配合关系是:处理与控制装置根据来自控制程序存储装置的控制程序和经连接装置传来的来自输入装置的使用者操作指令信息,对本系统运行过程涉及的系统内各装置发出控制指令或采集状态信息;处理与控制装置根据来自控制程序存储装置的控制程序在显示界面显示输入提示信息,提示使用者在输入装置输入所期望的目标句子的关键信息,经连接装置传送给处理与控制装置作为检索要素,在对语料库装置存放的语料信息进行以句子为输出单位的检索后,对检索结果进行进一步分析处理,这些过程中产生的中间过程集合暂存于过程信息暂存装置中,所得到的可推荐给使用者选用的参考句子集合及参考句子对应的句型信息,经连接装置送往显示装置按句型推荐规则进行显示,供使用者选用。
2.如权利要求1所述基于语料库的计算机辅助写作系统,其特征在于,上述显示装置之界面上的输入提示信息标明需输入的关键词的语法或句法功能信息(例如主语、谓词等)及其输入位置。
3.如权利要求1或权利要求2所述基于语料库的计算机辅助写作系统,其特征在于,上述处理与控制装置根据使用者按显示装置的提示通过输入装置输入不少于两个具有指定语法或句法功能的关键词,针对语料库存储的所有句子执行以全部输入的关键词为检索要素的全要素布尔检索过程,检索得到的包含全部关键词的句子作为候选参考句子供进一步处理。
4.如权利要求1所述基于语料库的计算机辅助写作系统,其特征在于,系统按照程序设定的或程序运行前由使用者通过界面选定的句型推荐优先规则,在显示界面上按句型归类显示检索得到的部分或全部参考句子集合;系统根据句型推荐优先规则规定的句型优先顺序,采用界面显示策略有区别地显示各推荐句型及对应的句子;上述界面显示策略至少包括下列策略之一:用数字或字母序列标明推荐内容优先顺序、优先推荐的内容安排在更利于吸引使用者目光的屏幕区域、对优先推荐的内容相关的显示界面的文字、图形、图像等施加强调效果。
5.如权利要求1或权利要求4所述基于语料库的计算机辅助写作系统,其特征在于,该句型推荐优先规则的优先顺序排定准则为:依据对检索得到的候选参考句子集合中各句型类别对应的句子数量的统计值由大到小排列。
6.如权利要求1所述基于语料库的计算机辅助写作系统,其特征在于,显示装置上的推荐信息显示界面上与每一推荐句子相对应设置链接标志,通过操作该链接标志可链接至该推荐句子所对应的上下文信息或所在的语篇。
7.如权利要求1所述基于语料库的计算机辅助写作系统,其特征在于,本系统在显示装置上显示的操作窗口与计算机的文字编辑窗口可同时同屏显示,便于在辅助写作、文章修改或辅助翻译过程中随时相互切换使用,起到便于使用者使用的辅助写作工具的作用;文字编辑窗口至少是如下形式的窗口之一:文本编辑窗口、网络浏览器窗口、短信编辑窗口、彩信编辑窗口、电子邮件编辑窗口、博客编辑窗口、微博编辑窗口、网络论坛窗口、网络社区窗口。
8.如权利要求1所述基于语料库的计算机辅助写作系统,其特征在于,本系统所含各装置构成单机型计算机辅助写作装置的功能硬件主体,上述连接输入装置的连接装置与连接显示装置的连接装置均等效为该单机型计算机辅助写作装置内部的连接电路。
9.如权利要求1所述基于语料库的计算机辅助写作系统,其特征在于,本系统运行于互联网平台,利用互联网计算机终端的输入功能部件作为本系统输入装置,利用互联网计算机终端的显示功能部件作为本系统显示装置,利用接入互联网的服务器的相应功能模块代为行使本系统除输入装置、显示装置和连接装置以外的各功能装置的功能;这种应用形式下,本系统的连接装置与互联网传输设施等效,连接输入装置的连接装置与连接显示装置的连接装置合用互联网接入链路接入互联网,并通过互联网连接到远端服务器。
10.如权利要求1所述基于语料库的计算机辅助写作系统,其特征在于,上述显示装置显示的用户界面文字信息至少属于下列一种语言系统:汉语、日语、韩语、英语、法语、西班牙语、德语、俄语、意大利语。
CN2013100536423A 2013-02-19 2013-02-19 基于语料库的计算机辅助写作系统 Pending CN103077158A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2013100536423A CN103077158A (zh) 2013-02-19 2013-02-19 基于语料库的计算机辅助写作系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2013100536423A CN103077158A (zh) 2013-02-19 2013-02-19 基于语料库的计算机辅助写作系统

Publications (1)

Publication Number Publication Date
CN103077158A true CN103077158A (zh) 2013-05-01

Family

ID=48153689

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2013100536423A Pending CN103077158A (zh) 2013-02-19 2013-02-19 基于语料库的计算机辅助写作系统

Country Status (1)

Country Link
CN (1) CN103077158A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294297A (zh) * 2016-07-15 2017-01-04 盐城工学院 一种文案编辑系统
CN106650943A (zh) * 2016-10-28 2017-05-10 北京百度网讯科技有限公司 基于人工智能的辅助写作方法和装置
CN107615267A (zh) * 2015-05-11 2018-01-19 林迪·莱多霍夫斯基 与上下文特定的写作框架相关的方法和系统
CN109284349A (zh) * 2018-09-27 2019-01-29 中国矿业大学(北京) 专业性外文书写辅助系统
CN109582839A (zh) * 2018-12-20 2019-04-05 广东小天才科技有限公司 一种写作辅助方法及写作辅助客户端
CN111382561A (zh) * 2020-03-13 2020-07-07 北大方正集团有限公司 文件校验方法、装置、设备及存储介质
CN112149428A (zh) * 2020-10-12 2020-12-29 珍岛信息技术(上海)股份有限公司 基于语义分析和深度学习的智能写作辅助系统
CN112580305A (zh) * 2019-09-11 2021-03-30 陈涛 为创作文字作品提供写作引导的方法和文字处理设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050125215A1 (en) * 2003-12-05 2005-06-09 Microsoft Corporation Synonymous collocation extraction using translation information
CN101101594A (zh) * 2007-06-12 2008-01-09 无敌科技(西安)有限公司 一种实时句子辅助写作方法及系统
FR2958061A1 (fr) * 2010-03-23 2011-09-30 Raymond Michael Cooke Outil pour analyse linguistique et textuelle
CN102279846A (zh) * 2010-06-10 2011-12-14 英业达股份有限公司 文章辅助写作系统及其方法
CN102609410A (zh) * 2012-04-12 2012-07-25 传神联合(北京)信息技术有限公司 规范文档辅助写作系统及规范文档生成方法
CN102890723A (zh) * 2012-10-25 2013-01-23 深圳市宜搜科技发展有限公司 一种例句检索的方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050125215A1 (en) * 2003-12-05 2005-06-09 Microsoft Corporation Synonymous collocation extraction using translation information
CN101101594A (zh) * 2007-06-12 2008-01-09 无敌科技(西安)有限公司 一种实时句子辅助写作方法及系统
FR2958061A1 (fr) * 2010-03-23 2011-09-30 Raymond Michael Cooke Outil pour analyse linguistique et textuelle
CN102279846A (zh) * 2010-06-10 2011-12-14 英业达股份有限公司 文章辅助写作系统及其方法
CN102609410A (zh) * 2012-04-12 2012-07-25 传神联合(北京)信息技术有限公司 规范文档辅助写作系统及规范文档生成方法
CN102890723A (zh) * 2012-10-25 2013-01-23 深圳市宜搜科技发展有限公司 一种例句检索的方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHIEN-LIANG LIU 等: "Computer assisted writing system", 《EXPERT SYSTEMS WITH APPLICATIONS》 *
洪培钧: "以进阶的文句推荐方式作为语料库作为英文写作之辅助", 《政大机构典藏》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107615267A (zh) * 2015-05-11 2018-01-19 林迪·莱多霍夫斯基 与上下文特定的写作框架相关的方法和系统
CN106294297A (zh) * 2016-07-15 2017-01-04 盐城工学院 一种文案编辑系统
CN106650943A (zh) * 2016-10-28 2017-05-10 北京百度网讯科技有限公司 基于人工智能的辅助写作方法和装置
CN106650943B (zh) * 2016-10-28 2020-09-25 北京百度网讯科技有限公司 基于人工智能的辅助写作方法和装置
CN109284349A (zh) * 2018-09-27 2019-01-29 中国矿业大学(北京) 专业性外文书写辅助系统
CN109582839A (zh) * 2018-12-20 2019-04-05 广东小天才科技有限公司 一种写作辅助方法及写作辅助客户端
CN112580305A (zh) * 2019-09-11 2021-03-30 陈涛 为创作文字作品提供写作引导的方法和文字处理设备
CN112580305B (zh) * 2019-09-11 2022-05-17 陈涛 为创作文字作品提供写作引导的方法和文字处理设备
CN111382561A (zh) * 2020-03-13 2020-07-07 北大方正集团有限公司 文件校验方法、装置、设备及存储介质
CN111382561B (zh) * 2020-03-13 2022-11-01 北大方正集团有限公司 文件校验方法、装置、设备及存储介质
CN112149428A (zh) * 2020-10-12 2020-12-29 珍岛信息技术(上海)股份有限公司 基于语义分析和深度学习的智能写作辅助系统

Similar Documents

Publication Publication Date Title
CN103077158A (zh) 基于语料库的计算机辅助写作系统
US11714839B2 (en) Apparatus and method for automated and assisted patent claim mapping and expense planning
CN104933027B (zh) 一种利用依存分析的开放式中文实体关系抽取方法
Kilgarriff et al. Corpus tools for lexicographers
Pal et al. An approach to automatic text summarization using WordNet
CN102708100B (zh) 挖掘相关实体词的关系关键词的方法和装置及其应用
CN110362817A (zh) 一种面向产品属性的观点倾向性分析方法及系统
CN109858010A (zh) 领域新词识别方法、装置、计算机设备和存储介质
CN102955848A (zh) 一种基于语义的三维模型检索系统和方法
Benito-Santos et al. A data-driven introduction to authors, readings, and techniques in visualization for the digital humanities
CN104978314A (zh) 媒体内容推荐方法及装置
Heid et al. Dictionary and corpus data in a common portal: state of the art and requirements for the future
Ogden et al. Improving cross-language text retrieval with human interactions
CN109145288A (zh) 基于变分自编码模型的文本深度特征提取方法
CN107330111A (zh) 基于通用形式化本体的领域本体的检索方法及装置
Lin et al. A simple but effective method for Indonesian automatic text summarisation
Vandevoorde On semantic differences: a multivariate corpus-based study of the semantic field of inchoativity in translated and non-translated Dutch
Al-Jarf Issues in translating English technical terms to Arabic by Google translate
Fišer et al. Visualizing slownet
KR101794137B1 (ko) 레퍼런스 의미 지도를 이용한 데이터 시각화 방법 및 시스템
Dimitrova et al. Implementation of the Bulgarian-Polish online dictionary
Hinneburg et al. Exploring document collections with topic frames
Klosa-Kückelhaus et al. Lexicography of Coronavirus-related neologisms: An introduction
Aqle et al. Analyze Unstructured Data Patterns for Conceptual Representation
More et al. News recommendation based on user preferences and location

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130501