CN109284349A - 专业性外文书写辅助系统 - Google Patents

专业性外文书写辅助系统 Download PDF

Info

Publication number
CN109284349A
CN109284349A CN201811130151.3A CN201811130151A CN109284349A CN 109284349 A CN109284349 A CN 109284349A CN 201811130151 A CN201811130151 A CN 201811130151A CN 109284349 A CN109284349 A CN 109284349A
Authority
CN
China
Prior art keywords
corpus
professional
foreign language
source
column
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811130151.3A
Other languages
English (en)
Inventor
吴雅琴
王亮
王凯
张翔
娄振
王闯
李雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Mining and Technology Beijing CUMTB
Original Assignee
China University of Mining and Technology Beijing CUMTB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Mining and Technology Beijing CUMTB filed Critical China University of Mining and Technology Beijing CUMTB
Priority to CN201811130151.3A priority Critical patent/CN109284349A/zh
Publication of CN109284349A publication Critical patent/CN109284349A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明提供了一种专业性外文书写辅助系统,其特征在于包括客户端模块、检索模块、专业性语料库、语料库更新模块。针对目前翻译软件存在的问题,本发明重点说明了专业性语料库的建立方法以及客户端界面的设置内容,从源头上保证系统检索到的结果的科学性与专业性以及系统的易用性,为外文基础不是很高的人员书写专业性外文时提供了很好的辅助系统。

Description

专业性外文书写辅助系统
技术领域
本发明涉及外文书写辅助系统,特别是一种外文基础不是很高的人员书写专业性外文时的辅助系统及其使用方法。
背景技术
语言和文字是人类社会发展中最基础、最重要的工具之一。然而地球上不同地区使用的语言很大程度上不相通,不经过专门的翻译过程使用不同语言的人无法相互交流。社会中的个人学习外语也是一个漫长的过程,即便花费大量时间精力也可能效果不如意。
科学用语有学术性、严肃性、朴素性的特点,也几乎不会运用口语、成语、感性渲染等成分和手法。因此,科学用语的书写有困难的一面,也有简单的一面。总之,科学用语与生活用语有很大的差异。另外,由于不同的学科门类和专业有着不同的发展历史和使用习惯,每个学科门类和专业也有一定的特定用语。这就导致这样的结果:人们在面对自己不熟悉的专业场景时即便使用母语都可能无法进行科学的描述。上述情况是所有语言(汉语、英语、日语、法语等)的共同特点。人们在学习外文的时候都是从日常生活用语慢慢开始发展,对特定的专业使用科学用语可能一直无法良好掌握。
现在机器翻译软件如谷歌翻译、百度翻译、有道翻译等可以进行单词、语句甚至全文的多语言互译功能,并且随着计算机性能和人工智能水平的提高,这些翻译软件的性能在不断提高。目前,机器翻译很多时候已经可以胜任日常生活用语方面的翻译工作。但是科学家的共识是,在短期内机器翻译不可能替代人工翻译,尤其是高水平的学术性、专业性翻译。
外文基础不是很好的科学、商务、法律等工作者需要书写、翻译专业性外文的时候,每一个单词、每一个语料的使用都必须进行核对检查,确认是否符合科学用语和专业习惯。很多时候这些确认工作异常困难,人们的大量精力耗费在文字选择方面。如果使用的背景材料不合适,选用的文字还可能是错误或者不合规的。现实情况是,很多学习外语多年的人也不得不放弃独立书写专业性外文。
现在的翻译软件在书写专业性外文帮助有限,很大程度上是因为这些软件的语料库没有把专业性用语从日常生活用语、低水平科学用语甚至错误的科学用语隔离开,也没有设置针对专业性用语书写的良好用户界面。
发明内容
为解决上述问题,本发明提供了专业性外文书写辅助系统,用于辅助有一定外语基础的科学、商务、法律等工作者书写专业性外文。规定:句子、短语按着单词都称为语料,母语为源语料,需要书写的语言为目标语料;源语料与目标语料中表达同一意思的部分互称对齐语料组。易知,对齐语料组中的源语料和目标语料并非一对一的。利用该系统可以解决专业性外文书写中的两个主要问题:1、由确定的源语料确定合适的目标语料;2、检查核对某些目标语料是否满足科学性、专业性。
专业性外文书写辅助系统,包括:客户端模块、检索模块、专业性语料库、语料库更新模块。
所述客户端模块为用户提供操作界面,并展示检索结果。客户端界面包括:语言切换栏、搜索栏、学科限定栏、专业限定栏、搜索结果数量栏、搜索结果展示栏。利用客户端界面用户可以设置源语料与目标语料,输入需搜索的文字,以及进行学科、专业的限定。搜索结果数量栏可以展示从系统中检索到的符合搜索内容的语句条数。搜索结果展示栏呈现相应的目标语料、源语料和目标语料的出处。
所述检索模块是利用分词功能、同义扩展、布尔运算等功能识别用户输入的搜索信息,从专业性语料库中检索对齐语料组。
所述专业性语料库为目标语料和源语料组成的对齐语料组,目标语料来自高水平的外文学术专著和专业教材,源语料为上述专著和教材的正式发行的高水平翻译版。专业性语料库中源语料和目标语料按不同的学科和专业进行标注分类。有些语料的标签可以多于一个;有些语料在学术文献中出现非常普遍,这些语料则无需标注。
所述语料库更新模块是根据用户和市场需求对语料库进行更新,把对齐后的源语料与目标语料输入专业性语料库中。
用户在搜索的时候也可以不限定学科和专业。
语料在有标签的情况下,用户在点击任意检索返回条目的时候,客户端界面呈现该条目的第一个标签。
附图说明
图1是本发明专业性外文书写辅助系统工作流程图
图2是本发明实施例一用户界面
图3是本发明实施例一的二次搜索后用户界面
图4是本发明实施例二用户界面
图5是本发明实施例二的用户选中一个条目的用户界面
具体实施方式
下面结合附图和具体实施例对本发明做进一步详细说明。
本说明书中实施例均以中国人英文写作即源语料为中文、目标语料为英文进行举例说明。
如图1所示,本发明专业性外文书写辅助系统包括:客户端模块1、检索模块2、专业性语料库3、语料库更新模块4。
所述客户端模块1为用户提供操作界面,并展示检索结果。客户端界面包括:语言切换栏101、搜索栏102、学科限定栏103、专业限定栏104、搜索结果数量栏105、搜索结果展示栏106。利用客户端界面用户可以设置源语料与目标语料,输入需搜索的文字,进行学科、专业的限定。搜索结果数量栏105可以展示从系统中检索到的符合搜索内容的语句条数。搜索结果展示栏106呈现相应的目标语料、源语料和目标语料的出处。
所述检索模块是利用分词功能、同义扩展、布尔运算等功能识别用户输入的搜索信息,从专业性语料库中检索对齐语料组。
所述专业性语料库中的目标语料来自高水平的外文学术专著和专业教材,源语料为上述专著和教材的正式发行的高水平翻译版。由于很多国外的专著和教材并没有中译本,为减小工作量可从国家一级出版社查找已完成的译本,根据译本寻找原版,最后从作者、译者、出版社取得授权。专业性语料库中源语料和目标语料按不同的学科和专业进行标注分类。有些语料的标签可以有多个,比如“单分子层吸附理论”的标签同时为化学、物理、材料学科等,但是这些标签有前后顺序。有些语料在学术文献中出现非常普遍,如“对精度提出了更高的要求”、“这个假设不成立”,这些语料则无需标注。
所述语料库更新模块是根据用户和市场需求对语料库进行更新,把对齐后的源语料与目标语料输入专业性语料库中。
实施例一:如图2所示,用户在撰写“工学”学科中“石油与天然气工程”专业英文文章,需要确认源语言“天然气输送管道”的目标语言是什么。其在语言切换栏101、学科限定栏103、专业限定栏104进行相应设定,在搜索栏102中输入“天然气输送管道”后确认。由搜索结果数量栏105知系统返回83个结果。由搜索结果展示栏106发现“天然气输送管道”的对齐语料组有两种语料,分别为“natural gas pipeline”和“natural-gas pipeline”。为了保持与大部分人的书写习惯保持一致,可以把这两个语料分别进行搜索,发现“naturalgas pipeline”的返回结果为72个,如图3,“natural-gas pipeline”的返回结果为11个。所以选择“natural gas pipeline”作为“天然气输送管道”英文书写用词。
实施例二:由于同为学术性文献,不同专业的写作也具有很大的共通之处,所以用户在搜索的时候也可以不限定学科和专业。如用户在论文书写中需要书写“如图所示”的目标语言,这个语料本身专业性非常弱,所以不对学科和专业进行限定,系统返回结果如图4所示。易知“如图所示”的目标语料有“as show in Fig.”、“as can be seen form Fig.”、“shown schematically in Fig.”等。用户可以从中选择需要的语料,还提高论文句式的多样性。语料在有标签的情况下,用户在点击任意检索返回条目的时候,客户端界面呈现该条目的第一个标签。如图5所示,鼠标选中图4中的条目二后,该条目的学科专业标签在学科限定栏103、专业限定栏104中体现。
上述本发明的使用方法利用了互联网,如有需要稍加改变也可以制作离线版本。
外文基础一般的人利用该系统外文书写可以节省时间,也能保证正确率。该系统极大地帮助专业性外文书写,但是该系统建立的难点是专业性语料库的完善。然而,学术界文字更多的是通用、普遍的写作用词,具有很强的封闭性。本发明人认为本发明系统在收录几本不同学科的主流专著之后就有非常大的实用性。

Claims (6)

1.专业性外文书写辅助系统,其特征在于,包括:客户端模块、检索模块、专业性语料库、语料库更新模块。
所述客户端模块为用户提供操作界面,并展示检索结果,客户端界面包括:语言切换栏、搜索栏、学科限定栏、专业限定栏、搜索结果数量栏、搜索结果展示栏;利用客户端界面用户可以设置源语料与目标语料,输入需搜索的文字,以及限定学科和专业;
所述检索模块是利用分词功能、同义扩展、布尔运算等功能识别用户输入的搜索信息,从专业性语料库中检索对齐语料组;
所述专业性语料库为目标语料和源语料组成的对齐语料组,目标语料来自高水平的外文学术专著和专业教材,源语料为上述专著和教材的正式发行的高水平翻译版。专业性语料库中源语料和目标语料按不同的学科和专业进行标注分类;
所述语料库更新模块是根据用户和市场需求对语料库进行更新,把对齐后的源语料与目标语料输入专业性语料库中。
2.如权利要求1所述专业性外文书写辅助系统,其特征在于,用户在搜索的时候也可以不限定学科和专业。
3.如权利要求1所述专业性外文书写辅助系统,其特征在于,所述搜索结果数量栏可以展示从系统中检索到的符合搜索内容的语句条数。
4.如权利要求1所述专业性外文书写辅助系统,其特征在于,所述搜索结果展示栏呈现相应的目标语料、源语料和目标语料的出处。
5.如权利要求1所述专业性外文书写辅助系统,其特征在于,有些语料的标签可以多于一个,有些语料可以没有标签。
6.如权利要求1所述专业性外文书写辅助系统,其特征在于,语料在有标签的情况下,用户在点击任意检索返回条目的时候,客户端界面呈现该条目的第一个标签。
CN201811130151.3A 2018-09-27 2018-09-27 专业性外文书写辅助系统 Pending CN109284349A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811130151.3A CN109284349A (zh) 2018-09-27 2018-09-27 专业性外文书写辅助系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811130151.3A CN109284349A (zh) 2018-09-27 2018-09-27 专业性外文书写辅助系统

Publications (1)

Publication Number Publication Date
CN109284349A true CN109284349A (zh) 2019-01-29

Family

ID=65182421

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811130151.3A Pending CN109284349A (zh) 2018-09-27 2018-09-27 专业性外文书写辅助系统

Country Status (1)

Country Link
CN (1) CN109284349A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1391180A (zh) * 2001-06-11 2003-01-15 国际商业机器公司 外语写作辅助方法和辅助工具
CN102270198A (zh) * 2011-08-16 2011-12-07 上海交通大学出版社有限公司 计算机辅助翻译系统
CN103077158A (zh) * 2013-02-19 2013-05-01 吴志超 基于语料库的计算机辅助写作系统
CN103853813A (zh) * 2012-11-30 2014-06-11 株式会社东芝 外语文章写作辅助装置、方法及程序
CN107123318A (zh) * 2017-03-30 2017-09-01 河南工学院 一种基于输入法装置的外文写作学习系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1391180A (zh) * 2001-06-11 2003-01-15 国际商业机器公司 外语写作辅助方法和辅助工具
CN102270198A (zh) * 2011-08-16 2011-12-07 上海交通大学出版社有限公司 计算机辅助翻译系统
CN103853813A (zh) * 2012-11-30 2014-06-11 株式会社东芝 外语文章写作辅助装置、方法及程序
CN103077158A (zh) * 2013-02-19 2013-05-01 吴志超 基于语料库的计算机辅助写作系统
CN107123318A (zh) * 2017-03-30 2017-09-01 河南工学院 一种基于输入法装置的外文写作学习系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王全蕊 等: "基于医学领域的汉英子句对齐语料库检索系统的设计与实现", 《河南科技学院学报(自然科学版)》 *

Similar Documents

Publication Publication Date Title
US7739102B2 (en) Relationship analysis system and method for semantic disambiguation of natural language
Subalalitha Information extraction framework for Kurunthogai
Davydov et al. Mathematical method of translation into Ukrainian sign language based on ontologies
Sitender et al. Sansunl: a Sanskrit to UNL enconverter system
Hirst Overcoming linguistic barriers to the multilingual semantic web
Matthiessen et al. Translations of representations of moving and saying from English into Spanish
Almotairi et al. Developing a Semantic Question Answering System for E-Learning Environments Using Linguistic Resources.
Revanth et al. Nl2sql: Natural language to sql query translator
CN109284349A (zh) 专业性外文书写辅助系统
CN113807102B (zh) 建立语义表示模型的方法、装置、设备和计算机存储介质
Sene-Mongaba The making of Lingala corpus: An under-resourced language and the Internet
Will Thesaurus consultancy
Enikuomehin et al. An algorithm for solving natural language query execution problems on relational databases
Fomichov SK-languages as a powerful and flexible semantic formalism for the systems of cross-lingual intelligent information access
Tarish et al. Text correction algorithms for correct grammar and lex-ical errors in the English language
Štravs et al. Named entity recognition using gazetteer of hierarchical entities
Benaida et al. The link between automated translation of the Arabic language and quality of websites
Lourdusamy et al. METHODS, APPROACHES, PRINCIPLES, GUIDELINES AND APPLICATIONS ON MULTILINGUAL ONTOLOGIES: A SURVEY.
Rehman Relation on nlp with machine and language
Bayekeyeva et al. Multilingual thesaurus of industryspecific terms as major aids for translators
bin Mohd Rosman et al. Bringing together over-and under-represented languages: Linking Wordnet to the SIL Semantic Domains
Nandanwar Graph connectivity for unsupervised word sense disambiguation for Hindi language
Madi et al. Grammar checking and relation extraction in text: approaches, techniques and open challenges
Perikos et al. A methodology for generating natural language paraphrases
Robin Reading Russian for the Disciplines

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190129

WD01 Invention patent application deemed withdrawn after publication