CN1407483A - 文本表达方法及系统以及文本翻译方法及系统 - Google Patents

文本表达方法及系统以及文本翻译方法及系统 Download PDF

Info

Publication number
CN1407483A
CN1407483A CN 01131152 CN01131152A CN1407483A CN 1407483 A CN1407483 A CN 1407483A CN 01131152 CN01131152 CN 01131152 CN 01131152 A CN01131152 A CN 01131152A CN 1407483 A CN1407483 A CN 1407483A
Authority
CN
China
Prior art keywords
sentence
text
english
integrated form
natural language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 01131152
Other languages
English (en)
Inventor
向言李
徐慧兰
李斯特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
YOUWANGTONG INTERNATIONAL INFORMATION CO Ltd
Original Assignee
YOUWANGTONG INTERNATIONAL INFORMATION CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by YOUWANGTONG INTERNATIONAL INFORMATION CO Ltd filed Critical YOUWANGTONG INTERNATIONAL INFORMATION CO Ltd
Priority to CN 01131152 priority Critical patent/CN1407483A/zh
Publication of CN1407483A publication Critical patent/CN1407483A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

一种为了翻译用途的文本表达方法及系统以及应用于自然语言的文本翻译方法及系统,用于供计算机软件将一文本从一自然语言翻译为另一自然语言,特别是在网际网络上以不同的自然语言系统表达的文本。根据该文本表达方法及系统而对一文本中的词汇的分类,以及根据该分类而在该文本中插入的符号,计算机程序能够轻易地阅读该文本,并且翻译机因为参考该文本中插入的符号及基于相关自然语言的语料库而容易实现。

Description

文本表达方法及系统以及文本翻译方法及系统
发明领域
本发明涉及计算机翻译机(computer translator)对一文本于不同的自然语言之间的翻译,尤其涉及一种为了翻译用途的文本(text)表达(representation)方法及系统以及应用于自然语言(nature language)的文本翻译方法及系统。
背景技术
从九十年代至今,世界各国相继投入巨资研究机器翻译(machinetranslation),均以失败而告终,至今仍然没有真正成功的翻译软件。即使是市埸上最好的翻译软件,翻译出来的结果大部分都是乱七八糟,不知所云的“天书”。
随着网际网络(Internet)的快速发展,对于机器翻译,特别是网页(web page)的翻译的市埸需求无限增长。但是,由于机器翻译技术不能突破,翻译软件(除了电子词典之外)的实用价值不大,因此也一直不能形成规模。
近几十年内(甚至有的专家认为一个世纪以内),机器翻译获得突破的可能性不大。所以,基于自然语言开发翻译软件是不明智的商业行为。这就迫使我们不得不考虑绕过机器翻译的观点,暂时避开对于自然语言的直接翻译,寻找另外的解决途径。
发明内容
本发明的目的之一,即在于提供一种为了翻译用途的文本表达方法及系统以及应用于自然语言的文本翻译方法及系统。
根据本发明,一种为了翻译用途的文本表达方法及系统包含设立具有许多类别的词汇分类,以及设立对应这些类别的符号。然后,根据对一文本的原始版本(version)中的词汇的分类以插入这些符号至该文本的原始版本中,因而将该文本转换为一新的表达,如此一来,该新的文本版本变成一结构化的表达,可被计算机程序阅读。
一种应用于自然语言的文本翻译方法及系统包括辨识在该新的文本表达中的符号,并根据这些符号的分类从为该自然语言准备的语料库中检索相关词汇。在各种自然语言当中,翻译规则可以因为不同的语言而有变化,然而,仅仅单一的文本表达便足以适用于所有的自然语言,而每一种翻译很容易完成,毋需复杂的演算法则(algorithm)。
在一被称为集成式英文(integrated English)的较佳实施例中,其尝试在形式上接近英文表达,为准备一新的文本表达及翻译该文本的方法包括诸步骤,根据集成式英文的文法以集成式英文改写该文本,通过一计算机阅读该集成式英文文本,根据集成式英文的文法利用这些符号断句,分析该集成式英文句子,以及将该集成式英文文本翻译为一自然语言。
为了根据本发明的目的达成这些及其它的优点,一种自动化翻译该文本的系统包括阅读集成式英文文本的功能手段,根据集成式英文文法产生集成式英文句子的功能手段,分析集成式英文句子的功能手段,翻译集成式英文句子成为另一自然语言的功能手段,以及输出该翻译后文本的功能手段。在句子分析程序的期间,提示违反集成式英文文法句子的功能手段更被使用在该系统中。
本发明提供了一种文本自动化翻译方法,包括下列步骤:建立集成式英文语料库;按照集成式英文的语法规则,将文本改写为集成式英文文本;将该集成式英文文本输入计算机;根据集成式英文的语法规则,通过集成式英文句子终结符进行断句;结合该集成式英文语料库,判断该集成式英文文本句子是否为集成式英文特殊句子,如果是,则进行特殊句子处理,将该集成式英文文本句子自动翻译为另一语言文本,如果否,则前进到下一步;结合该集成式英文语料库,判断该集成式英文文本句子是否为集成式英文特殊句型句子,如果是,则进行特殊句型处理,将该集成式英文文本句子自动翻译为另一语言文本,如果否,则前进到下一步;以及结合该集成式英文语料库,判断该集成式英文文本句子是否为集成式英文标准句型,如果是,则进行标准句型处理,将该集成式英文文本句子自动翻译为另一语言文本,如果否,则发出警告提示。
本发明还提供了一种文本自动化翻译系统,该系统包括:输入装置,用于输入将文本改写成的集成式英文文本;储存装置,用于储存集成式英文语料库;断句装置,用于根据集成式英文的语法规则通过集成式英文句子终结符对该集成式英文文本进行断句;特殊句子判断装置,用于判断该集成式英文文本句子是否为集成式英文特殊句子;特殊句子翻译装置,用于将该集成式英文文本特殊句子自动翻译为另一语言文本;特殊句型判断装置,用于判断集成式英文文本句子是否为集成式英文特殊句型句子;特殊句型翻译装置,用于将该集成式英文特殊句型句子自动翻译为另一语言文本;标准句型判断装置,用于判断集成式英文文本句子是否为集成式英文标准句型句子;标准句型翻译装置,用于将该集成式英文标准句型文本句子自动翻译为另一语言文本;告警装置,如果所输入英文文本句子不符合集成式英文语法,则发出告警提示;以及输出装置,用于将该另一语言文本输出。
本发明还提供了一种结构化的文本表达方法包括:设立具有许多类别的词汇分类系统;设立对应该许多类别的符号系统;对文本的原始版本中的词汇进行分类;以及根据词汇的分类以插入这些符号至该文本的原始版本中,因而将该文本转换为新的表达的转换版本。
本发明还提供了一种结构化的文本表达系统,所述系统包括:基础自然语言系统;一套具有许多类别的词汇分类系统,用于对以该基础自然语言撰写的文本中的词汇给予特定类别;一套对应该许多类别的符号系统,用于表示词汇的类别;以及语料库,储存该基础自然语言对应至另一自然语言的资料。
本发明还提供了一种文本翻译方法,用于将文本从第一自然语言翻译为第二自然语言,该方法包括下列步骤:准备从该第一自然语言对应至该第二自然语言的语料库;确定一套符号系统对应该第一自然语言的词汇类别的规则;辨识在该文本中的符号;根据符号判断该文本中的词汇的类别;根据词汇的类别从该语料库中检索相关资料;以及翻译为该第二自然语言。
本发明还提供了一种文本翻译系统,用于将文本从第一自然语言翻译为第二自然语言,所述系统包括:语料库,用于储存从该第一自然语言对应至该第二自然语言的资料;一套预先定义的符号系统;判断功能装置,用于根据该文本中的符号从该语料库中寻找数据;以及编译功能装置,用于将该语料库中获得的资料组合为该第二自然语言。
通过本发明所提供的自动化翻译一文本的方法及系统,将文本自动地翻译为其它的语言,例如中文,能够精确地传达原始语言的所有含意,使得不懂英文的人也能够获取英文信息内容。
本发明对于应用在网际网络上特别有用,如此一来,读者所浏览的信息内容被扩大,而网站的影响力亦因而增加。
附图说明
对于本领域的技术人员而言,从以下所作的详细叙述配合伴随的附图,本发明将能够更清楚地被了解,其上述及其它目的及优点将会变得更明显,其中:
图1是根据本发明的集成式英文文本自动化翻译方法的流程图;
图2是本发明第三实施例当中标题的翻译的流程图;
图3是本发明第三实施例当中第一句的翻译的流程图;
图4是本发明第三实施例当中第九句的翻译的流程图;以及
图5是本发明在网际网络上应用的示意图。
图号说明:
10    建立iEnglish语料库
20    改写为iEnglish文本
30    输入
40    断句
50    iEnglish特殊句子
55    特殊句子处理
60    iEnglish特殊句型
65   特殊句型处理
70   iEnglish标准句型
75   提示错误信息
80   iEnglish标准句型处理
210  特殊句子判断
220  特殊句型判断
230  标准句型判断
240  标准句型翻译
250  主动对象分析
260  名属分析
410  iEnglish特殊句子
420  iEnglish特殊句型
423  特殊句型处理
426  逗号语句处理
430  iEnglish标准句型
440  标准句型翻译
450  分析“{in<seeking>(independence)}}”
453  介词in-在……过程中
456  动作seeking,被动对象independence
460  两句翻译组合
470  分析“(they)<{do not}<sacrifice>>([[their][human]](dignity))”
473  主动对象they
476  动作sacrifice,动属do not表否定
479  被动对象dignity,名属their human
具体实施方式
既然计算机自动翻译程序的难题在于自然语言的不规则性,那么,能否创造一种规范的、计算机能“看懂”的语言,以它作为中介,来达到自动化翻译的目的?由于它是规范的,从理论上讲,把它向世界上任何一种语言进行自动化翻译是可以实现的。这种语言应用在网际网络上进行信息发布,将带来很大的便利。
举例说,某网站的内容有中文版和英文版,只有懂中文和英文的人才能看懂。数量巨大的不懂中、英文的俄国人、法国人、德国人等便对该网站望而却步了。所以,“该网站的窗口”在很大的程度上并没产生窗口的作用。
但是,如果网站的内容是利用上述的那种规范的语言来撰写,那么由于计算机“看得懂”(能够识别),世界各国的人都可以通过支持这种语言的翻译软件来将其较准确的翻译成自己的语言。这和Java的“一次编译,处处运行”有异曲同工的妙。对于政府机构、新闻、跨国公司、娱乐等网站来说,这样一种语言尤其有非常不寻常的意义。
因此,从目前的情形看来,制定这样一种“标准规则”的语言,是激活网际网络上翻译机市埸的最佳出路。
在创造这样一种语言的过程中,远远没有“标准规则”四个字那么简单。为了阐明,基于英文、并参照计算机语言的演算法则,推出了一套方案,最后创造出一种新的计算机语言。在本发明中称的为“集成式英文”,简称iEnglish。
iEnglish是一种计算机描述语言,又是一种结构化、层次化、逻辑化的英文。
与PASCAL、C、FoxPro等语言不同,iEnglish的特长不是科学计算,也不是数据统计。iEnglish的作用是为计算机描述整个自然界。英文、中文、俄文等也是描述自然界的语言,它们的服务对象是人类,而iEnglish的服务对象是计算机。
iEnglish的基本规则是一种逻辑规则,它有着科学规范的结构,有着严格的句法和词法,有丰富的数据库。它的每一个组成部分都是参照计算机的演算法则而精心设计的,能够被计算机分析出每一部分的作用。换句话说,iEnglish能被计算机“看懂”。
目前流行的计算机语言多受限于科学计算和数据统计。这些只是自然界极小的一部分,自然界还有广阔的空间没有与计算机接轨。如果说汇编语言是面向机器的语言,C语言是面向过程的语言,C++语言是面向对象的语言,那么iEnglish便是“面向自然”的语言。
iEnglish在创造过程中,充分尊重了英文的习惯。从表达形式上,与英文基本上相同。所以,不仅计算机能看懂,熟悉英文的人,不需要借助任何翻译软件,也可以轻松地看懂。
iEnglish的主要应用领域是拥有英文版本的网站。iEnglish版本可以完全取代英文版本,至少也可以与之并存。
比如,如果英文网站用iEnglish来撰写,或者在英文网站上增加iEnglish的版本,那么由于其规则性,计算机很容易翻译,世界各国的人都可以通过支持这种语言的翻译软件来将英文网站内容翻译成自己熟悉的语言。这样英文网站的被造访范围便被扩大到了全世界。
木发明这种方法比起在英文网站上增设世界各国所有语言的版本,无疑要科学得多。
在创造iEnglish的过程中,曾经企图统计所有的语义关系,建立一种严格的语言体系。但是在实践过程中发现了两个问题:
1.随着语义关系的增多,使人们面临着令人不知所措的状况。
例如,对于“my book”而言,可以很容易地判断“my”和“book”是所有格“of”关系。但是,“information technology”这两个词之间是什么关系?又如“China Town”,这两个词又是什么关系?问题的关键在于语义关系的一些细微差别如何体现,以及如何让使用者来接受这些关系。
又例如,在统计动作的属性时,有“时间”、“地点”、“方式”、“伴随”等很多很多。
2.严格的语义关系,有时候不仅对翻译没有帮助,反而有不利的影响。
由于各语言之间的语言结构、文化背景等不同,一种语言的语义关系,与另一种语言的语义关系并非严格的一一对应。所以,过细的语义关系,有时候反而会给翻译工作捣乱。
为了解决上述的两个问题,本发明人发现,英文国家的人在理解“information technology”的时候,并不需要细思两个词之间到底是什么关系,却也能够理解。而译成中文“信息科技”,也已经非常准确,并没有必要在翻译的过程中一定让计算机理解“information”和“technology”这两个词之间的逻辑关系。至于这两个词之间的关系是“about”关系,还是“of“关系,或者其它的逻辑关系,对于中文翻译没有什么意义。对于其它很多国家的语言而言也有类似的情形。即使少数语言会造成别扭,却不会产生歧义。
再看另外一句话:“reports came into London Zoo that a wild puma had beenspotted.”是一个定语从句,可是怎样让计算机理解它是修饰“reports”还是修饰“London Zoo”?这对于翻译机是很有用的,它决定了翻译结果是“一个野生美洲狮已经被发现的报导进入伦敦动物园。”还是“报导进入一个野生美洲狮已经被发现的伦敦动物园。”但是如果我们采用一个技巧,翻译成“报导进入伦敦动物园,一个野生美洲狮已经被发现。”这个翻译结果并没有说出定语从句是修饰谁,人们却能根据这句话的意思(有时候可能还需要根据上下文)来理解所传递的信息。
又如:I bought a table with three legs.
      I bought a table with three dollars.
可译为:我卖了一张桌子,三条腿。
        我卖了一张桌子,三美元。
可见如果充分利用人的理解能力,对于机器来说是模糊的信息传递,对于人来说,往往是非常准确的。
基于这种思路,本发明人在创造人工语言的过程中,把握计算机理解的程度,避免陷入自然语言复杂语义关系的浩瀚深渊。这个思路贯穿了整个iEnglish体系的设计。
基于此iEnglish的设计体现了以下技术效果:
1.充分尊重自然英文的表达能力;
2.充分尊重人的理解能力;
3.充分尊重机器翻译界现有的英文翻译技术;以及
4.尽量接近英文,以利于它的推广。
iEnglish的基本原理是把英文句子中的各种复杂结构,都通过对象化、动作化、属性化等集成方法,使之等效于一个词,从而简化句子结构。
在集成式英文系统的规则下,将会有许多标示或符号插入句子中,以表达文本中词汇的分类,以及供作翻译程序中的识别。
如:I hope(he will come).
    He wanted(to<see the old folk again>and to<visit the old school>).
下面将详细讨论iEnglish的对象、动作、属性等基本概念。
(一)对象
在iEnglish中,对象是一个重要的概念。所谓对象,是指在句子中表示一个事物的结构。它有三种形式,一是名词性对象;二是事件性对象,三是空对象。
对象化符号为“()”。
1、对象词对象
由一个核心对象词及属性构成。在不存在歧义的情形时,核心名词及属性默认为一个对象,可以不打对象化符号“()”。
如“the boy”是一个对象,是由核心名词“boy”加上它的普通属性“the”所构成的。而“the boy〔whom I talk about〕”也是一个对象。这个对象是由核心名词“boy”及普通属性“the”及特殊属性“whom I talk about”构成的。
2、事件性对象
一个事件,当它起名词作用时,也称之为一个对象。例如“I hope(he willcome).”这句话中的“he will come”。
事件性对象又可分为非子句事件性对象,子句对象及句子对象三种类型。
非子句事件性对象又分为不定式对象、动名词对象、分词对象、属性说明对象等。
例如“I want(to sleep)”中的“(to sleep)”即为不定式对象;“he found(the boy reading the Bible).中的“(the boy reading the Bible)”即为分词对象;“Ifound(him clever).”即为属性说明对象。
3、空对象
“()”为空对象,表示什么对象也没有。
空对象在倒装句、省略句及一些特殊情况有重要应用。
对象具有可合并性。两个对象用逻辑连接词“and”、“or”、“except”等或其它对象连接符号联接起来将被合并为一个对象,而不再是两个对象。如“anapple”是一个对象,“a pear”也是一个对象,但是“an apple and a pear”则被合并成一个对象,而不再是两个对象。从这里可以看出,对象的核心名词可以有多个。
(二)动作
动作分为动词动作、事件动作、复合动作及空动作四种形式。
1、动词动作
一个动词加上它的属性,是一个动词动作。
如:the plane<is flying>.
又如:I<love>reading.
动词动作有如下几种形式
1)动作
2)动作+名属
3)其它
2、事件动作
一个动作加上它所影响的对象,称为一个事件动作。
例如:I<love reading>.
又如:I<give him>a book.
再如:I<<give him>a book>.
事件动作有如下几种形式:
4)      动作+对象
5)      动作+对象+对象
6)      动作+对象+名属
7)      动作+对象+不定式
8)      动作+对象+动名词
9)      动作+对象+现在分词
10)     其它
3、复合动作
由两个及以上的动作构成的一个新动作,称为一个复合动作。
如:you must<make your pocket money do>,I can’t give you more.
又如:he must<have the clock repaired>.
4、空动作
“<>”为空动作,表示什么动作也没有。
空动作常用在倒装句、省略句及一些特殊情况。
如:we went through the tests on a Monday.Jenny had hers during the day,and I
    <>mine atter work.
最后一句话省略核心动词“had”,句法不正确,需要加空动作来补足。
动作在句子中的作用和动词相当,不仅可以用在第一层,也可以用在任何一层。如可以用在不定式中:“he managed to<have the clock repaired>.”。
(三)属性
属性分为名词的属性、动词的属性及属性词的属性三大类,分别简称名属、动属及附属。
1、对象的属性
对象的属性简称名属,分为普通属性、特殊属性及隐藏属性三类。
名属化符号为“[]”。
(1)对象的普通属性
当用一个(或几个)形容词修饰一个名词的时候,这些形容词称为对象的普通属性。
如“a red apple”,“a red”为“apple”的普通属性。
形容词作名词的普通属性时,必须放在名词的前面。
(2)对象的特殊属性
当用一个介词、疑问代词或指示代词加上一个附属部分修饰一个名词,或者由不定式、动名词等修饰名词的时候,称为名词的特殊属性。
如“(the boy〔who answered the phone〕)”,其中的“〔who answered thephone〕”为“boy”的特殊属性。
(3)空名属
“〔〕”。
(4)对象的隐藏属性
不通过属性词来体现,而根据对象本身的含义来判断的属性,称为隐藏属性。
对于名词性对象来说,隐藏属性包括类别(如“watermelon”的类别为“水果”)等。iEnglish对隐藏属性不作统计,各语种可根据翻译需要自行统计。
2、动作的属性
动作的属性简称动属,分为普通属性、特殊属性、关联对象及隐藏属性四类。
动属化符号为“{}”。
(1)动作的普通属性
由动属词对动作的修饰,称为普通属性。动属词可放在动作的前面,也可以放在动作的后面,根据英文习惯而定。
如:he will probably find the book tomorrow.
其中“probably”和“tomorrow”都是动属词,一个在前,一个在后。
(2)动作的特殊属性
由介词及其附属部分对动作的修饰,称为动作的特殊属性。
如:he com from America.
句中的“from America”即为动作的“from”属性。介词默认为动作的特殊属性引导词。当用它引导名词的属性时,需要加名属化符号“[]”。
(3)动作的关联对象
任何一个动作都有它的主动对象。核心词为及物动词的动作还有它的被动对象。这些对象都是动作的属性。
如:he<is riding(a horse)>.“(a horse)”是核心动词“ride”的被动对象属性。
(4)空动属
“{}”
(5)动作的隐藏属性
与对象一样,动作也有它的隐藏属性。
3、属性的属性
属性词的属性简称附属,分为普通属性、特殊属性及隐藏属性三类。附属化符号在实际应用中很少。
附属化符号为“{[]}”。
附属词也有空附属“{[]}”。
如:(the money〔enough{[to<buy a car>]}〕)had been stolen.
(四)对象、动作及属性之间的转换
1、对象化
当一个非名词结构需要在句子中担当对象的成分时,可以对其对象化。其符号是:()。
如:she loves(red).
“red”原本是形容词,但是句子“she loves red.”在句法上是错误的。必须对“red”进行名词化处理,否则不能满足“对象+动作+对象”的结构。
2、动作化
对于一些非动词结构需要在句子中起动词的作用时,可以对其进行动作化,其符号是:<>。
事件里面都包含动作。如:“he smiled.”其中的“smiled”就是动作,它由核心动词“smile”及其时态属性构成。由于“smile”是动词,所以无需加动作化符号。如果硬要加动作符号也不算错,可以加为:“he<smiled>.”。
对于属性说明句,在此智能型网页语言中,认为属性说明部分也是一个广义的动作。如:“he is a student.”可以写成“he<is>a student.”
对象也可以看成动作的部分。如:“he<is>a student.”也可以写成“he<is astudent>.”,句子由第四种扩展句型变成了标准句型。
动作化有一些很特殊也很有用的运算,如:“I gave him a book.”原本是第三种扩展句型(参阅“句法”):“(I)<gave>(him)(a book).”。但是它可以改写成标准句型:“I<<gave him>a book>.”。也可以改写成第一种扩展句型:“I<gave him>a book.”。也可以改写成第一种扩展句型的另一种型式:“I gave abook to him.。”也可以改写成第一种扩展句的再一种形式:“I<gave a book to>him.”
这种改写有时候在词的转换中很有用,比如句子:“the farmer gave food to thehorse.”与句子:“the farmer<fed>the horse.”是等价的,从而“<fed>”等价于“<gave food to>”。
3、名属化
对于一个非名属词结构,当需要在句子做对象的属性时,可以对其进行名属化。其符号是:[]。
情形之一是用名词修饰名词时,可以用对象化符号,如:“(informationtechnology)”。也可以用名属化符号,写成“[information]technology”。
4、动属化
对于一个非动属词结构,当需要在句子中做动词的属性时,可以对其进行动属化。其符号是:{}。
5、附属化
对于一个非附属词结构,当需要在句子中做属性的属性时,可以对其进行附属化。其符号是:{[]}。iEnglish的词法:
(一)词的分类
iEnglish的单词分为对象词、动作词、属性词(又分名属词、动属词、附属词三类)、介词、逻辑连接词及感叹词。
1、对象词
(1)      名词(如:apple,stone等)
(2)      人称代词(I,me,we,us,you,he,him,she,they,them,it)
(3)      名词性物主代词(mine,yours,hers,ours,theirs)
(4)      自身代词(myself,ourselves,yourself,yourselves,himself,herself,itself,themselves)
(5)      指示代词(this,that,these,those)
(6)      名词性疑问代词(who,whom,what,which)
(7)      不定代词(如:some,any,another等)
(8)      专用名词(iEnglish区分大小写,除第一人称单数‘I’外,凡是出现大写的单词全部为专用名词,如China,Microsoft等)
2、动作词
(1)      实义动词(如:lost,run等)
(2)      助动词,如:do,be,have,shall,will等。
3、名属词
(1)      冠词(a,an,the)
(2)      形容词(如:red,large等)
(3)      基数词(如:one,two,ten,2,100等)
(4)      序数词(如:first,21th等)
(5)      形容词性物主代词(my,your,his,her,its,our,their)
(6)      形容词性疑问代词(whose)
4、动属词
(7)      部分副词,如:fast
(8)      当动作的核心动词为实义动词的时候,助动词自动降为动属词。
5、附属词
修饰属性词的词,如:very。
6、介词
to,from等
7、逻辑连接词
and,or,except等
8、引导词
there2,that2,it2等。
9、感叹词
hi等。
10、复合词
当用连接词符号“-”把两个单词连接起来时,则构成一个复合词。如:“man-made”。
(二)词性的转换
在iEnglish中,每个单词都有唯一的默认词性。如“bicycle”的默认词性为名词。但是我们可以根据需要来强制转换词的属性,如可以用动作化符号把“bicycle”转换为动词“<bicycle>。这种转换常常在句子中很有用,如“I<bicycle>down the street.”
代词“her”、“his”的默认词性为物主代词,在句子中充当属性词的作用。当需要它们在句中充当对象时,需要用对象化符号对其进行转换,如“(her)”,“(his)”。
词性可在对象词(“()”)、动作词(“<>”)、名属词(“[]”)、动属词(“{}”)、附属词(“{{}}”)之间转换。
(三)多义词解决方案——词义的转换
1、词性相同的多义情形
(1)当一个词有多个不同的原始意义或原始意义相差过大时,系统默认一个最常用的意义。当需要使用其它的意义时,通过加标注来进行处理。
如“bank”,有两个意义,一个是“银行”,另一个是“岸”。系统默认为“银行”,当需要用其来表示“岸”时,通过加标注来表示“bank2”。
注意,词的标注从“2”开始,因为默认的为“1”,只是可以不写而已。
通过加标注(而不另造新词)来解决词的多义问题,最大程度的保留了英文原有的表达形式,体现了“尽量向英文接近”的风格。
(2)当词的原始意义相同,但由于各语种的概念差异而导致的一些问题,不需要加标注。如“hard”有多种用法,
(a)           the stone is very hard.
(b)           That was a hard question.
(c)           The girl gave him a hard blow.
(d)           We had a hard time.
(e)           其它。
对于这一类的多义,iEnglish本身不进行处理,在对各语种的翻译过程中,可以通过如下两种方法进行处理:
<1>不进行处理。由于人类思维的灵活性人们往往能理解这类的话,虽然有点别扭,却也能感受一种异域语言的风格。如上面的话可以译为:
(f)           那块石头是非常坚硬的。
(g)           那是一个坚硬的问题。
(h)           那个女孩给他坚硬的一击
(i)           我们渡过了一段坚硬的时间。
(j)           其它。
可以看到,上面的翻译基本上可以理解。
又如,对于中文来说,“take off”也是一个多义动作。对于飞机是“起飞”,对于衣服是“脱掉”。但是,如果我们统统把它翻译成“离去”,于是“飞机离去”,“我离去衣服”。这种翻译虽然很别扭,却也能勉强接受。
所以,对于这种问题,并不是翻译机的最大难题。
<2>通过建立语料库或其它自然语言理解的方法来进行处理。由于iEnglish比普通英文结构化,所以基于iEnglish建立语料库基础进行语言的理解,相对要容易很多。
对于介词的多种用法,处理的方法一样。即:iEnglish本身并不对其进行处理,由翻译软件自行解决。
2、词性不同的多义情形
用词性转换符号来解决。如“book”在名词时是“书”,在动词时是“预订”。那么要使用“预订”的意义时,只需要加上动作化符号即可:<book>。iEnglish的句法:
iEnglish的基本思想是把复杂句子的各种结构、成分都通过对象化、动作化、及属性化的手段,使这些结构成分等价于一个词。这样,无论多么复杂的句子,都可以在形式上等价于一个简单句。
iEnglish的句子分为标准句型、扩展句型、特殊句型、特殊句子四大类。除了特殊句子外,其余的三类句型都非常结构化及层次化。扩展句型是标准句型的延伸,其目的是为了减少括号,简化书写量。
注意,iEnglish句子的首字母不大写。
一、句子的层次
iEnglish是一种结构化、层次化、逻辑化的语言,主要体现在句法上。
不管多么复杂的句子,从其中的任何一层来看,都是一个简单句。
如:“I know(Marry wish(they would choose Tom as(the new member[ofthe(construction committee)]))).”这是一个较复杂的句子。句子的最上面一层称为第一层,从第一层看去,它是一个简单句“I know(……).”。从第二层看去,句子也是一个简单句“Marry wish(……)”。从第三层看去,句子仍然是一个简单句“they would choose Tom as(……)”。从第四层看去,句子已经不是一个句子了,但仍然有很简单的结构“the new member[……]”,它是一个名词性对象。第五层是名词的一个特殊属性“of the(……)”。第六层也是最底层,是一个名词修饰名词的对象“construction committee”,由于名词不能直接修饰名词,必须用对象化符号强制在一起。
再看另外一个例子:“(today is Sunday)and(I know(the party is in herhonor)).”这句话的第一层是“(……)and(……)”。由于第一层有两部分,所以第二层也有两部分,第一部分的第二层是“today is Sunday”,第二部分的第二层是“I know(……)”。第一部分没有第三层,第二部分的第三层是“the party is inher honor”。
这样,计算机在“理解”句子的时候,不管多么复杂的句子,都可以当成简单句子来理解,从而大大减轻了编译难度。
二、iEnglish的标准句型
句子的句型也即是句子的结构。iEnglish的标准句子,不管多么复杂,都可以分为两部分:
主动对象+动作“()<>.”
也即相当于“主语+谓语”。
如:
(1)(he)<smiled>.(注:当动作为一个动词时,不需要加动作化符号。这里加上的原因是说明句子结构。)
(2)(I)<give him a book>.
也有的句子省略对象,如:<let me go>。整句话就一个动作(当然,动作还有结构)。
三、iEnglish的扩展句型
标准句子的书写有时显得有些繁琐。为了简化书写,在不引起歧义的前提下,iEnglish引入了“扩展句型的概念”。
(1)主动对象+动作+被动对象“()<>().”
例:(I)<have finished>(the work).
    (he)<pushed[open]>(the door).
    (I)<found>(the boy){in the room}.(由于介词及其附属部分默认为修
    饰动作,所以动属化符号可以不打。这句话的意思是:我在房间里发现
    那个男孩。)
    (I)<found>(the boy[in the room]).(我发现房间里的那个男孩。)
    (I)<found>(the boy<in the room>).(我发现那个男孩在房间里面。)
    (he)<want>(to smoke).
(2)主动对象+动作+被动对象+名属(对被动对象的说明)“()<>()[].”
例:(he)<pushed>(the door)[open].
    (I)<found>(the boy)[clever].
    (I)<found>(the boy)[a fool].
    (I)<found>(the boy)[in the room].(我发现那个男孩在房间里面。)
(3)主动对象+动作+第一被男对象+第二被动对象“()<>()().”
例:(I)<gave>(him)(a book).
    (I)<call>(him)(Tom).
(4)对象+系动词+名属“()<>[].”
例:(the apple)<is>[red].
(5)对象+系动词+对象“()<>().”
例:(he)<is>(a student).
    (he)<is>(the boy[who loves the girl]).
(6)主动对象+动作+不定式“()<>to<>.”
例:(he<want>to sleep.(=he want(to sleep).)
(7)主动对象+系动词+名属+不定式“()<>[]to<>.”
例:(I)<felt>[obliged]to leave.
    (I)<am>[sorry]to<hear that>.
四、iEnglish的特殊句型(包括疑问句)
英文中有许多很特殊的句子结构,如“There be”句型、“it”引导词句型等,标准句并不能对它们进行概括。
为了充分尊重英文的表达习惯,尽量保留英文原文的风格,“iEnglish”引入了特殊句型。
1、There be句型
There be句型完全尊重英文习惯。但是应该请注意的是,“there”是一个多义词,默认为动属词“在哪里”。当“there”做引词时应该在后面加“2”。
There be句型有两种形式。
There be里的“there”是一个引词,无实义,应该加上标注“2”。
句型一、There2+be+对象+方位动属词或表方位的介词结构(可以省略)
如:There2 is a dog[under the desk].
    There2 is a dog nearby.
    There2 is adog.
句型二、There2+一般动词+对象+方位动属词或表方位的介词结构(可以省略)
如:There2 stands a man{near the door}.
    There2 stands a man here.
    There2 stands a man.
2、引导词it语句
与there be句型一样,引导词it语句也完全尊重英文的习惯。同样,“it”是一个多义词,默认为第三人称单数“它”。当“it”做引词用时,应该在后面加“2”。
如:it2 is very important to<give up smoking>.
3、疑问句
一般疑问句为助动词提前,结尾为问号。
特殊疑问句见环形语句或成分的移位。
4、感叹句
可制订几种感叹句型。更一般的做法是以倒装语句的形式处理。
5、环形语句
英文的倒装语句,在iEnglish中有着首尾相连的结构,形成一个环,称为环形语句。在划分环形语句的结构时,应将括号反打——这是一个非常有特色的句子。
环形句子可以解决所有的倒装结构。
例如:long live>our motherland<.
环形句子的最内为第一层。最外层为最后一层。句子的开头为第一层的第一个字母。句子的顺序为一个环形。
由于疑问句可以做成特殊句型,所以在只有一层的时候,可以不打环形句子符号。但是当疑问句有很多层时,则需要把层次标注清楚。在有需要的时候,用环形句子的方法可以把对哪个部分提问都标注清楚。如:
1、    who)are they talking about(?
2、    Who))do Marry think(they are talking about(?
3、    Who)))do you wish(Marry think(they are talking about(?
子句也有可以是环形句子,如英文句子中的“I don’t know who Marry thinkthey are talking about.”中的“who Marry think they are talking about”便是一个环形对象。环形对象的括号反打时会与主句的括号冲突,出现“I don’t know(who))Marry think(they are talking about().”的情形。
为避免这种冲突的发生,iEnglish引入了环形括号“*)(*”,“*><*”,“*)  [*”,“*]{*”,“*}){[*”。
于是上面的句子便可以标为:“I don’t know(who*)*)Marry think(*theyare talking about(*).”
环形对象可以递归,其符号为“**)(**”。
五、iEnglish的特殊句子
一些俗语、谚语及名句等,可以直接在iEnglish中使用。系统不对其进行分析,直接从语料库里面去查找。
例如:no pains no gains.
六、插入语句
插入语是一个独立的成分,由插入语符号来屏蔽,不在句子中担当任何成分。
例如:father(,of course,)provides(a regular supply[of pocket-money]).
七、逗号语句
逗号有分句的作用,可以把一个句子分成几个独立的部分,每个部分都必须是iEnglish的一种结构,如可以是句子、对象、动作、属性或一个词等。
如:apparently,he is wrong.
    He went out,shutting the door behind him.
    Oh,John,will you come into my room,please?
逗号的优先级在括号之下,当某些部分不是独立成分,却也用到逗号时,需要用括号来分清层次,从而使不影响句子结构的完整性。
如:I gave(a book,a pear,and an apple)to him.
这个句子从第一层看是:I give()to him.在句子的第一层,根本看不到逗号。
八、that语句
当“that”为纯引导词,没有实际意义时,可以有“that”语句。注意,“that”是多义词,做引导词时应该加标注“2”。
例:(reports had came into London Zoo)that2(a wild puma had been spotted).
    (I felt obliged)that2(I must leave).
由于“that”有分句的作用,两边两个子句的括号也可以不打。如上面的两个句子可以写成:
例:reports had came into London Zoo that2 a wild puma had been spotted.
    I felt obliged that2 I must leave.
九、并列语句
例如:(he is a boy)and(she is a girl).
十、省略句
iEnglish中,一个句子的各个部分都可以根据需要进行省略。但是省略的结果必须是iEnglish的一种结构,例如可以是句子、对象、动作、属性或一个词等。如果省略的结果不是一个结构,需要用空Unit符号来补足。如一个有主动对象、动作和对被动对象的句子,需要省略动作时,应该写成:
主动对象+<>+被动对象。
这样才符合语法结构。
十一、句子成分的移位
对于倒装句等句子成分的位置不规范的特殊句子,当句子比较复杂时,用环形语句的方法处理有时候比较困难。“iEnglish”引入了“移位”的概念。
在倒装句中,相对于标准句型,句子的成分语序发生变化,但一般情况下,并不发生成分的残缺,为了正确划分句子的结构成分,借助符号()*、<>*、[]*、{}*来标注发生位置变化的成分,并用空括号()*、<>*、[]*、{}*来标注在标准句中的正确位置,以这种呼应来定位发生位置变化的成分的正确位置。符号()*<>*、[]*、{}*称为移位符。
如:{Here}*<came>*(a man)<>*{}*.
又如:<Go>*I can’t<>*.
在疑问句中(下面的一些句子可以不进行移位,而看成一种疑问句型。这里进行移位的目的是说明移位的概念。)
一般疑问句:
<Are>*you<>*a student?
{Are}*you<{}*studying>now?
特殊疑问句:
where{will}*they{}*<hold>(the part)?
(what)*are(the dog)<eating>()*?
当移位符号有多个,很难一一对应的时候,需要用符号“1”、“2”等进行标注。
如:{Where}*1{did}*2 you{}*2 see(I found the book{}*1)?iEnglish的标点符号:
1、句子终结符:。?!回转符
2、续行符:~
3、逗号:,
起分句的作用,与句子终结符的作用类似,但是优先级在括号之下。
4、冒号::
5、单引号:‘’
直接引语,需要翻译。
6、双引号:“”
不需要翻译,如:he write“word”on the board.
7、对象化符号:()
8、动作化符号:<>
9、名属化符号:[]
10、    动属化符号:{}
11、    附属化符号:{[]}
12、    环形对象符号:“*)(*
13、    环形动作符号:*><*
14、    环形名属符号:*][*
15、    环形动属符号:*}{*
16、    环形附属符号:*]}{[*
17、    移位符号:()*<>*[]*{}*{[]}*
18、    连接词符号:—
19、    破折号:——
20、    插入语符号:(,,)(----)
21、    批注符号:/()/需要翻译
22、    注释符号:/**/不需要翻译
23、    还原符号:/
当原句中需要用到括号等特殊符号时,用一个“\”来表示。如“\(”的翻译结果显示为“(”。标点符号优先级:
1、还原符号;
2、引号;
3、句子终结符;
4、对象化符号、动作化符号、属性化符号、批注符号、注释符号、移位符号;
5、环形符号;
6、逗号、冒号、破折号、插入语符号;
7、连词符号与其它符号无冲突。iEnglish的语料库:
严谨、丰富、多层次的语料库是iEnglish的一大特色,也是英文能被计算机“理解”并向世界各国语言翻译的保证。
iEnglish的语料库有词库、对象库、动作库、属性库、关系库、句库等。自然语言的理解也可以建立语料库,但是首先要从复杂的自然语言中找出对象、动作等部分,便是一个目前还没有克服的世界级难题。所以,针对自然语言很难建立如此严谨的语料厍。
iEnglish的语料库分两种类型:
a)不带变量的语料库。如“apple”,“afriend in need,is a friend indeed.”等,这种语料库里的元素没有什么变化。带变量的库。如名属库中的“in one’shonor”,其中的“one’s”。
b)可以有不同的取值,即可以为“his”,又可以为“Tom’s”等。这两种类型的语料库在iEnglish中都有重要地位。
在翻译iEnglish的过程中,对所有的对象、动作、属性、句子等,都先从语料库里面查。如果语料库里面有,则调用里面的信息,如果语料库里没有,则按一般规则来处理。
例如句子:“the party2 is[in her honor].”
以中文翻译为例,当分析“[in her honor]”时,程序首先从名属库里面查,找到“in one’s honor”,对应的翻译为“为祝贺……的”,于是,整个句子被翻译成:“这个聚会是为祝贺她的。”翻译效果很好。
但是,如果在语料库里面查不到,则按一般的规则来翻译,结果为:“这个聚会是在她的荣誉中”。这个翻译就比较别扭了。
对象库、动作库的情况一样。对于一些特殊的动作,如“have the clockrepaired”、“make your pocket money do”等,用语料库的方式很好解决翻译问题。
根据上述技术方案,建立以下语料库:
(一)    词库
(二)    对象库
(三)    动作库
(四)    名属库
(五)    动属库
(六)    附属库
(七)    特殊句子库
(八)    句型库iEnglish的演算法则流程:
iEnglish的优点是把对自然语言的句子的理解转化为对简单结构的理解,从而使难度大为简化。
iEnglish的最大识别单位是句子,最小识别单位是单词及标点符号。
iEnglish中,所有的结构(句子、对象、动作、属性等)都建议以先特殊、后一般的方法处理。
下面结合附图,对本发明进行详细说明。
图1为根据本发明的文本自动化翻译方法的流程图,其包括:步骤10,按照集成式英文的语法规则,建立集成式英文语料库;步骤20,按照集成式英文的语法规则,将所述文本改写为集成式英文文本;步骤30,按照集成式英文的语法规则。将所述集成式英文文本输入计算机;步骤40,根据集成式英文的语法规则,通过集成式英文句子终结符进行断句;步骤50,结合集成式英文语料库,判断所述集成式英文文本句子是否为集成式英文特殊句子,如果是,则进行步骤55特殊句子处理,将所述集成式英文文本句子自动翻译为另一种语言文本,如果否,则前进到下一步:步骤60,结合集成式英文语料库,判断所述集成式英文文本句子是否为集成式英文特殊句型句子,如果是,则进行步骤65特殊句型处理,将所述集成式英文文本句子自动翻译为另一种语言文本,如果否,则前进到下一步;以及步骤70,结合集成式英文语料库,判断所述集成式英文文本句子是否为集成式英文标准句型,如果是,则进行步骤80标准句型处理,将所述集成式英文文本句子自动翻译为另一种语言文本,如果否,则进行步骤75发出警告提示。
〔第一实施例〕
以翻译句子“I am sure(a friend in need is a friend indeed).”为中文为例。
首先将句子“I am sure(a friend in need is a friend indeed).”输入计算机。然后根据文中的句号断句。第三步,结合集成式英文语料库,根据特殊句子判断方法进行判断,此句不是特殊句子。第四步,结合集成式英文语料库,根据特殊句型判断方法进行判断,此句不是特殊句型。第五步,结合集成式英文语料库,根据标准句型判断判断方法进行判断,此句是标准句。第六步,进入标准句处理。从上述输入的句子中分析出动作分别为主动对象‘I’,动作为“am sure”,被动对象为“a friend in need is a friend indeed”。第八步,在词库中查找所述主动对象“I”,主动对象“I”在词库中有记录,则直接从词库中调用,为“我”。在词库中查找所述动作“am sure”,动作“am sure”没有记录,按一般规则处理,“am”为助动词,所以“am sure”翻译成“确信”。在特殊句子库中查找“afriend in need is a friend indeed”,可以找到,直接调用,翻译为“患难之交才是真朋友。”第九步,综合整句,所得翻译结果为“我确信患难之交才是真朋友。”〔第二实施例〕
第二实施例是按照iEnglish语法规则改写后的一段文章。
I stopped{to<let the car cool off>and to<study the map>}.I had expected to<benear my objective>by(now),but everything still seemed alien to me.I was only fivewhen(my father had taken me abroad),and that was{eighteen years ago}.when mymother had died after a tragic accident,he did not quickly recover from(the(shock)andloneliness).(everything[around him])was[full of her presence],continually reopeningthe wound.so he decided to emigrate.{in the new country}he became absorbed in(making a new life for(the(two)[of us])),so that he gradually ceased to grieve.(he didnot marry again)and(I was brought up without a woman′s care);but I lacked fornothing,for(he was(both father and mother)to me).he always meant to<go back{oneday}>,but not to stay.(his roots and mine)had become too firmly embedded in the newland.but he wanted(to<see the old folk again>and to<visit my mother′s grave>).hebecame mortally ill{a few months[before we had planned to go]}and,when he knew(that2 he was dying),he<made me<promise to<go{on my own}>>>.
I<<hired a car{the day[after landing]}>and<bought(a comprehensive book[of maps]),[*]which*)I found(*[*most helpful on(the[cross][country]journey)],but[*}which*)I did not think(*I should need(*{*on the last stage]>>.it2 was not that2(Iactually remembered anything{at all}).but my father had described{over and overagain}(what we should see at every milestone),after leaving the nearest town,so that(Iwas positive(I should recognize it as familiar territory)).well,I had been wrong,for Iwas{now}lost.
I looked{{at the map}and{at the kilometer}}.I<had come{ten miles}{sinceleaving the town}>,and at this point,according to my father,I should be looking at((farms and cottages)[in a valley]),with(the spire[of the church[of our village]])showing in the far distance.I could see(no valley,no farms,no cottages and no churchspire--only a lake).I decided(that2 I must have taken a wrong turning somewhere).so I<<drove back to the town>and<began to retrace the route,taking frequent glances atthe map>>.I landed up at the same corner.the curious thing was(that2 the lake was notmarked on the map).I felt as if(I had stumbled into(a nightmare country)),as(yousometimes do in dreams).and,as I was wondering(what to do next),there2<appeared[on the horizon]>a man[on horseback],riding in my direction.I waited till(he camenear,then I asked him(the way[to our old village]).he said(that2 there was now novillage).I thought(he must have misunderstood me),so I repeated its name.{this time}he pointed to the lake.the village no longer existed because(it had been submerged),and all the valley too.the lake was not a natural one,but a man-made reservoir.
如上面所显示的,iEnglish文本看起来像是英文文本,只是增加许多符号插入在其中。然而,因为使用这些符号,文本变成更加结构化,这使得计算机翻译机能够很轻易地阅读及分析它。此外,这些符号帮助计算机理解及分析该文本的结构,而且使得检索语料库时很容易。这些符号可以被隐藏而不显示在屏幕上,使人们阅读该英文文本时更舒适些。〔第三实施例〕
为了描述方便,对下文中的句子进行了编号,下文中有括号的数字代表其后句子的编号,如(3)表示其后的句子为第三句。
                            Tramps Who Love Freedom
(1)It has been said that everyone lives by selling something.(2)Teachers live byselling knowledge.(3)Philosophers by selling wisdom.(4)Priests by selling spiritualcomfort.(5)Few people can go beyond this general rule.
(6)As if tramps are the only exception.(7)Beggars almost sell themselves.(8)But tramps are not beggars.(9)In seeking independence,they do not sacrifice theirhuman dignity.(10)A tramp may ask you for money,but he will never ask you forpity.(11)He has deliberately chosen this way.(12)He will never regret.(13)Hemay never know the next meal is coming from.(14)But he who has freedom is veryhappy.
首先,根据iEnglish语法规则将上文改写成如下iEnglish版本:
                   (tramps)[(who)<love>(freedom)]
it2<has been said>that2((everyone)<lives by>([selling](something))).(teachers)<live by>([selling](knowledge)).(philosophers)<◇by>([selling](wisdom)).(priests)<◇by>([selling]([spiritual](comfort)).([few](people))<{can}<go beyond>>([this][general](rule)).
{as if}(tramps)<are>([[the][only]](exception)).(beggars)<{almost}sell>(themselves).{but}(tramps)<<are>{not}>(beggars).{in(<seeking>(independence))},(they)<{do not}<sacrifice>>([[their][human]](dignity)).([a](tramp))<{may}ask>(you){{for}(money)},{but}(he)<{will never}ask>(you){{for}(pity)}.(he)<{{has}{deliberately}}<chosen>>([this](way)).(he)<{{will}{never}}<regret>>.(he)<{{may}{never}}<know>>(where([[the][next]](meal))<{is}<coming from>>).{but}((he)[(who)<has>(freedom)]<is>([very](happy)).
下面应用本发明的文本自动化翻译方法,对上文以句子为单位进行翻译。首先将上文输入计算机,计算机根据集成式英文语法对输入的文本断句,然后根据断句结果对各句进行翻译。计算机对上文各句翻译工作程序如下:
参考图2,首先处理标题,将标题“(Tramps)[Who Love Freedom]”输入。根据文章的断句结果,在步骤210,结合集成式英文语料库,根据特殊句子判断方法判断此句是否为特殊句子,得出结论:此句不是特殊句子,进行步骤220。在步骤220,结合集成式英文语料库,根据特殊句型判断方法判断出此句不是特殊句型,进行步骤230。在步骤230,结合集成式英文语料库,根据标准句型判断方法进行判断,得出结论:此句是标准句,进行步骤240。在步骤240,开始进行标准句型处理。从上述输入的句子中分析出:主动对象为“Tramps”,动作省略,名属为“Who Love Freedom”。接着,在步骤250,在词库中查找所述主动对象“Tramps”,主动对象“Tramps”在词库中有记录,则直接从其中调出,为“流浪汉”。在步骤260,在词库中查找所述名属“Who Love Freedom”,无记录,按一般规则处理,“Who”为名属中的主动对象,译成“谁”;“Love”为动作,译成“爱”;“Freedom”为被动对象,译成“自由”。将其处理成修饰成分,综合整句,所得翻译结果为“爱自由的流浪汉”。第一句:
参考图3,首先将“it2<has been said>that2((everyone)<lives by>(<selling>(something))).”输入,并根据文中的句号断句。在步骤310,结合集成式英文语料库,根据特殊句子判断方法进行判断,得出结论:此句不是特殊句子。在步骤320,结合集成式英文语料库,根据特殊句型判断方法进行判断,此句是特殊句型。进入特殊句型处理步骤322。在步骤324,从上述输入的句子中分析,本句为引导词It语句,按It语句处理。读到it2时,从词库中找到它的解释,判明它无实义,跳过。在步骤326,读到‘<’时,开始搜索与之匹配的‘>’,直到读到said后的‘<’,因读入的词不止一个,到词组库和惯用法库中搜索到其解释“据说”,记录此意思。在步骤328,读到that2时,从词库中找到它的解释,判明它无实意,跳过。下一步处理从句((everyone)<lives by>([selling](something)))。根据集成式英文标准句型判断方法,判断得出((everyone)<lives by>([selling](something)))为标准句型,对此从句按照标准句型进行处理:当读到‘(’时,开始搜索与之匹配的‘)’,直到读到something后的第三个‘>’才停止,这时判明(everyone)<lives by>(<selling>(something))为一对象,而里面还有成分的划分,继续判断。在步骤340,当读到‘(’时开始搜索与之匹配的‘)’,直到读到everyone后的‘)’,从词库中搜索到其解释“每个人”,已录此意思。在步骤350,当读到‘<’时,开始搜索与之匹配的‘>’时,直到读到by后的‘>’因读入的词不止一个,到词组库和惯用法库中搜索到其解释“借助于…生活”,记录此意思,并把一个对象填充“…”处。在步骤360,接着往下读到‘(’时,开始搜索与之匹配的‘)’,直到读到something后的第二个‘)’,这时判明<selling>(something)为一对象,而里面还有成分的划分,继续判断。读到‘[’时,开始搜索与之匹配的‘]’时,直到读到selling后的‘]’,从词库中搜索到其解释“出售”,记录此意思。读到‘(’时,开始搜索与之匹配的‘)’,直到读到something后的‘)’,从词库中搜索到其解释“某些东西”记录此意思。当something翻译完后,根据<selling>(something)为一对象将其解释连接起来填充至“借助于…生活”中。
这样第一句的翻译就完成了,完整的意思为:据说每个人借助于出售某些东西生活。第二句:
将“(teachers)<live by>([selling](knowledge))”输入。然后结合集成式英文语料库,判断该句为标准句,进入标准句处理。从上述输入的句子中分析主动对象为“teachers”,动作为“live by”,被动对象为“selling something”。在词库中查找主动对象“teachers”,词库中有记录,则直接从其中调用,为“教师”;动作“live by”解释为“借助于…生活”;被动对象“selling knowledge”解释为“出售知识”并填充至“借助于…生活”中。
整句翻译为:教师借助于出售知识生活。第三、四句:
将“(philosophers)<<>by>([selling](wisdom)).”输入。结合集成式英文语料库,判断该句为标准句,进入标准句处理。从上述输入的句子中分析主动对象为“philosophers”,动词省略,被动对象为“selling wisdom”。该句句型与第二句相近,省略动词“live”,忽略不记。从词库中调出“philosophers”为“哲学家”,“wisdom”为智能。
这样将第三句翻译为:哲学家借助于出售智能。
第四句“(priests)<<>by>([selling]([spiritual](comfort)).”句型与第三句完全相同,“priest”解释为“神父”,“spiritual comfort”解释为“精神上的安慰”。
这样第四句翻译为:神父借助于出售精神上的安慰。第五句:
将“([few](people))<{can}<go beyond>>([this][general](rule)).”输入。判断此句为标准句型,进入标准句型模块处理该句。读到‘)’时开始搜索与之匹配的‘)’,直到读到“people”后第二个‘)’为止,判明“(fewpeople)”为主动对象,其中“(people)”为核心名词,解释为“人”,“[few]”为名属,解释为“很少”。读到‘<’时开始搜索与之匹配的‘>’,直到读到“beyond”后第二个‘>’为止,判明“<{can}<go beyond>>”为一个对象,“<go beyond>”为动作,到词组库和实用法库中搜索到其解释为“脱离”,“{can}”为动属,解释为“能够”。读到‘(’时开始搜索与之匹配的‘)’,直到读到“rule”后第二个‘)’为止,判明“([this][general](rule))”为一个对象,其中“(rule)”为被动对象,解释为“规律”,“[this][general]”均为名属,分别解释为“这个”和“普遍的”。
到此,该句被完整地翻译出来:很少有人能够脱离这个普遍的规律。第六句:
输入“{as if}(tramps)<are>([[the][only]](exception)).”判断此句为标准句型,进入标准句型模块处理该句。读到‘{’时开始搜索与之匹配的‘}’,直到读到“if”后的‘}’为止,判明“{as if}”为一个对象,到词组库和惯用法库中搜索到其解释为“好象”。“(tramps)”为本句的主动对象,在词库中有记录,则直接从词库中调出,为“流浪汉”。“<are>”为本句的动作,解释为“是”。读到‘(’时开始搜索与之匹配的‘)’,直到读到“exception”后第二个‘)’为止,判明“([[the][only]](exception))”为一个对象,其中“(exception”为被动对象,解释为“例外”,“[[the][only]]”均为名属,“the”为定冠词无实义,“only”解释为“仅仅的”。
这样,该句被译为:好象流浪汉是仅仅的例外。第七句:
输入“(beggars)<{almost}sell>(themselves).”。根据本发明的标准句型判断方法,判明此句为标准句型,进入标准句型模块处理该句。“(beggars)”为主动对象,在词库中解释为“乞丐”。当读到‘<’时,开始搜索与之匹配的‘>’,直到读到“sell”后的‘>’为止,判明“<{almost}sell>”为一个对象,“sell”为动作,词库中解释为“出售”,“{almost}”为动属,解释为“几乎”。“(themselves)”为被动对象,解释为“他们自己”。
这样整句被翻译为:乞丐几乎出售他们自己。第八句:
输入“{but}(tramps)<<are>{not}>(beggars)”。根据本发明的标准句型判断方法,判明此句为标准句型,进入标准句型模块处理该句。“{but}”为逻辑连接词,词库中解释为“但是”。主动对象“(tramps)”解释为“流浪汉”。“<<are>{not}>”为一个对象,“<are>”为对象,解释为“是”;“{not}”为动属,表否定,“<<are>{not}>”解释为“不是”。“(beggars)”为被动对象,解释为“乞丐”
这样第八句可翻译为:但是流浪汉不是乞丐。第九句:
参考图4,开始,将“{in(<seeking>(independence))},(they)<{do not}<sacrifice>>([[their][human]](dignity)).”输入。在步骤410根据本发明的特殊句子判断方法,判断出此句不是特殊句子。在步骤420,根据本发明的特殊句型判断方法,判断出此句是特殊句型。在步骤423,进行特殊句型处理,进一步判明此句为逗号语句。
在步骤426,以逗号语句处理该句,将此句分为两部分{in(<seeking>(independence))}和(they)<{do not}<sacrifice>>([[their][human]](dignity))分别进行分析翻译。对两个分句分别进行的翻译方法,与对一个句子的翻译方法类似。通过本发明句型判断方法,判断出这两个分句均为标准句型。在步骤440,开始对这两个句子分别进行翻译。在步骤450,开始分析分句“{in<seeking>(independence)}}”,这是句子的附属部分,其中还包含“(<seeking>(independence))”这样一个动作做“in”的对象。在步骤453,分析出“in”是一个介词,解释为“在……的过程中”,将“in”的对象填充至“……”中。在步骤456,分析出“<seeking>”为动作,解释为“寻求”。“(independence)”为“<seeking>”的被动对象,解释为“独立”。整体翻译为“寻求独立”。根据“(<seeking>(independence))”为一个对象将其解释连接起来填充至“在……过程中”,翻译为“在寻求独立的过程中”。
在步骤470,开始分析“(they)<{do not}<sacrifice>>([[their][human]](dignity))”,已判明为一个标准句型,进入标准句型处理。在步骤473,分析出其中“(they)”为主动对象,解释为“他们”。在步骤476,当读到“<”时,寻找与之匹配的“>”,直到读到“sacrifice”后第二个“>”,判明“<{do not}<sacrifice>>”为一个对象,“<sacrifice>”为动作,解释为“牺牲”;“{do not}”为动属,表否定,解释为“不”。在小骤479,当读到“<”时,寻找与之匹配的“>”,直到读到“sacrifice”后第一个“>”,判明“<{do not}<sacrifice>>”为一个对象,“<sacrifice>”为动作,解释为“牺牲”;“{do not}”为动属,表否定,解释为“不”。在步骤479,当读到“(”时,寻找与之匹配的“)”,直到读到“dignity”后第二个“)”,判明“([[their][human]](dignity))”为一个对象,“(dignity)”为被动对象,解释为“尊严”;“[their]”和“[human]”两个名属词构成一个名属,将两个解释连接起来,解释为“他们的人类的”。这样此分句译为“他们不牺牲他们的人类的尊严”。
在步骤460,将两个分句结合起来。全句翻译为:在寻求独立的过程中,他们不牺牲他们的人类的尊严。第十句:
将“([a](tramp))<{may}ask>(you){{for}(money)},{but}(he)<{will never}ask>(you){{for}(pity)}.”输入。判明这同样是一个逗号语句,处理方法同上。首先分析“([a](tramp))<{may}ask>(you){{for}(money)}”,判明这是一个标准句型,其中“([a](tramp))”为主动对象,“为主动对象,“[a]”为冠词,解释为“一个”,连接两词翻译为“一个流浪汉”;“<{may}ask>”为动作,“{may}”为动属,整体解释为“也许会求你”;“{{for}(money)}”为动属,“{for}”表动作目的,解释为“为了”,“(money)”是被动对象,解释为“金钱”,将整体解释作为动作目的加在动作前,整句翻译为:一个流浪汉为了金钱可能会求你。
“{but}(he)<{will never}ask>(you){{for}(pity)}”同样是一个标准句型,“{but}”为逻辑连接词,解释为“但是”;“(he)”为主动对象“他”;“<{willnever}ask>”为一个对象,“ask”为动作“求”,“{will never}”均为动属,连接两个解释为“将永不”;“(you)”为被动对象“你”,“{{for}(pity)}”为动属,同“for money”,解释为“为了同情”;将整体解释作为动作目的加在动作前,整句翻译为:但是他为了同情将永不求你。
将两固部分连接起来,得出全句翻译:一个流浪汉为了金钱可能会求你,但是他为了同情将永不求你。第十一句:
输入“(he)<{{has}{deliberately}}<chosen>>([this](way)).”。判明这是一个标准句,进入标准句型模块处理。“(he)”为主动对象,解释为“他”。当读到“>”时,寻找与之匹配的“>”,直到读到“chosen”后第二个“>”,判明“>{{has}{deliberately}}<chosen>>”为一个对象,其中“chosen”为动作,解释为“选择”;“{{has}{deliberately}}”为动属,“{has}”表完成时态,解释为“已经”;“deliberately”解释为“故意地”。当读到“<”时,寻找与之匹配的“>”,直到读到“chosen”后第二个“>”,判明“<{{has}{deliberately}}<chosen>>”为一个对象,其中“chosen”为动作,解释为“选择”;“{{has}{deliberately}}”为动属,“{has}”表完成时态,解释为“已经”;“deliberately”解释为“{has}”表完成时态,解释为“已经”;“deliberately”解释为“故意地”。当读到“(”时,寻找与之匹配的“)”,直到读到“way”后第二个“)”,判明“([this](way))”为一个对象,其中“way”为被动对象,解释为“路”;“this”为名属,解释为“这”。
到此,全句可译为:他已经故意的选择了这路。第十二句:
“(he)<{{will}{never}}<regret>>.”本句较简单,分析过程省略,翻译为:他将永不后悔。第十三句:
“(he)<{{may}{never}}<know>>(where([[the][next]](meal))<{is}<coming from>>).”输入。判明这是一个标准句,进入标准句模块处理。“(he)”为主动对象,解释为“他”。当读到“<”时,寻找与之匹配的“>”,直到读到“know”后第二个“>”,判明“<{{may}{never}}<know>>”为一个对象,其中“know”为动作,解释为“知道;“{{may}{never}}”均为动属,连接两词解释为“也许永不”。当读到“(”时,寻找与之匹配的“)”,直到读到“>”后的“)”,判明“(where([[the][next]](meal))<{is}<coming from>>)”为一个对象,其中“where”为被动对象,解释为“哪里”,同时引导下面从句;“([[the][next]](meal))<{is}<coming from>>”为从句,同时是一个标准句型,“([[the][next]](meal))”为一个对象,其中“meal”为主动对象,解释为“膳食”,“[[the][next]]”为名属,“the”为定冠词,无实义,“next”解释为“下一次”;“<{is}<coming from>>”为一个对象,其中“is”为动属,表进行时态,无实义,跳过。“coming from”为动作,到词组库和惯用法库中搜索到其解释“来自”。根据从句固定结构将句子重新组合,输出翻译好的句子。
全句翻译为:他也许将永远不会知道下一次膳食来自哪里。第十四句:
输入“{but}((he)[(who)<has>(freedom)])<is>([very](happy))”。判明这是一个标准句,进入标准句模块处理。“{but}”为逻辑连接词,表转折,解释为“但是”。当读到“(”时,寻找与之匹配的“)”,直到读到“]”后的“)”,判明“((he)[(who)<has>(freedom)]”为一个对象,其中“he”为主动对象,解释为“他”;“[(who)<has>(freedom)]”为名属,同时是一个标准句型,“who”为主动对象,解释为“谁”;“has”为动作,解释为“有”;“freedom”为被动对象,解释为“自由”。“<is>”为系词,解释为“是”。当读到“(”时,寻找与之匹配的“)”,直到读到“happy”后第二个“)”,判明“([very](happy))”为一个对象,解释为“非常快乐”。根据从句固定结构将句子重新组合,输出翻译好的句子。
这样全句翻译为:但是,拥有自由的他是非常快乐的。
如上所述,全文译文如下:
                          《爱自由的流浪汉》
据说每个人借助于出售某些东西生活。教师借助于出售知识生活。哲学家借助于出售智能。神父借助于出售精神上的安慰。很少有人能够脱离这普遍的规律。
好象流浪汉是仅仅的例外。乞丐几乎出售他们自己。但是流浪汉不是乞丐。在寻求独立的过程中,他们不牺牲他们的人类的尊严。一流浪汉为了金钱也许会求你。但是他为了同情不会求你。他故意地已经选择了这路。他不会后悔。他也许不会知道下一次膳食来自哪里。但是拥有自由的他是非常快乐的。〔第四实施例〕
为进行自动化翻译程序,一种供作翻译机的系统包括:输入装置、断句装置、特殊句子判断装置、特殊句子翻译装置、特殊句型判断装置、特殊句型翻译装置、标准句型判断装置、标准句型翻译装置、告警装置、以及输出装置。这些组成翻译系统的装置部份可以软件来实现,以例程或模块化的程序完成其功能。
现在通过翻译″it2<has been said>that2((everyone)<lives by>([selling](something))).″来说明此系统的操作。
内存或储存装置用于储存集成式英文语料库。输入装置将“it2<has beensaid>that2((everyone)<lives by>(<selling>(something))).”输入系统中。断句装置根据文中的句号断句。特殊句子判断装置,结合所述集成式英文语料库,根据特殊句子判断方法进行判断,得出结论:此句不是特殊句子。特殊句型判断装置,结合集成式英文语料库,根据特殊句型判断方法进行判断,此句是特殊句型。特殊句型翻译装置,对该句进行特殊句型处理及翻译。从上述输入的句子中分析,本句为引导词It语句,按It语句处理。读到it2时,从词库中找到它的解释,判明它无实义,跳过。当读到‘<’时,开始搜索与之匹配的‘>’时,直到读到said后的‘>’,因读入的词不止一个,到词组库和惯用法库中搜索到其解释“据说”,记录此意思。读到that2时,从词库中找到它的解释,判明它无实义,跳过。标准句型判断装置,根据集成式英文标准句型判断方法,判断得出((everyone)<lives by>([selling](something)))为标准句型,对此从句由标准句型翻译装置按照标准句型进行处理。当读到‘(’时,开始搜索与之匹配的‘)’,直到读到something后的第三个‘)’才停止,这时判明(everyone)<livesby>(<selling>(something))为一对象,而里面还有成分的划分,继续判断。当读到‘(’时,开始搜索与之匹配的‘)’,直到读到everyone后的‘)’,从词库中搜索到其解释“每个人”,记录此意思。当读到‘<’时,开始搜索与之匹配的‘>’时,直到读到by后的‘>’,因读入的词不止一个。到词组库和惯用法库中搜索到其解释“借助于…生活”,记录此意思,并把一个对象填充“…”处。往下读到‘(’时,开始搜索与之匹配的‘)’,直到读到something后的第二个‘)’,这时判明<selling>(something)为一对象,而里面还有成分的划分,继续判断。读到‘[]时,开始搜索与之匹配的‘]’时,直到读到selling后的‘]’,从词库中搜索到其解释“出售”,记录此意思。读到‘(’时,开始搜索与之匹配的‘)’,直到读到something后的‘)’,从词库中搜索到其解释“某些东西”,记录此意思。当something翻译完后,该装置根据<selling>(something)为一对象将其解释连接起来填充至“借助于…生活”中。
根据此系统对这一句子的翻译就完成了,完整的意思为:据说每个人借助于出售某些东西生活。〔第五实施例〕
下面,结合图5举例说明本发明在网际网络上的应用。
在A汽车公司的服务器上,A公司网站的管理员借助iEnglish编辑方法,将英文版本改写成iEnglish版本,并与英文版同时发布在网站上。
这样,中文、俄文、日文、西班牙文、法文等其它语言的浏览者,就可以借助本发明将iEnglish版本的内容自动翻译为所需语种的文本,以便获取A公司的网站上的信息。
例如中国一用户,想买一辆A公司生产的汽车。为了解更详细的情况,在办公室里打开计算机,键入A公司的网站。没有中文版。看不懂英文,则可以利用iEnglish中文翻译方法或系统,将A汽车公司iEnglish版本的内容翻译为中文文本。同样,日文浏览者,也可通过类似的方法,利用iEnglish日文翻译方法或系统,将A汽车公司的iEnglish版本的内容翻译为的日文文本。
这样,在网站上用结构化的人工语言,并结合本发明的文本自动翻译方法和系统,就实现了一对多的信息发布。A公司通过公司本身的一个网站,即可实现对全球的信息发布。
以上对于本发明的实施例所作的叙述均为阐明的目的,而无意限定本发明,基于以上的教导或从本发明的实施例学习而作修改或变化是可能的,实施例为解说本发明的原理以及让熟习该项技术者以各种实施例利用本发明在实际应用上而选择及叙述,本发明的技术思想企图由本发明的权利要求范围及其均等来决定。

Claims (25)

1.一种文本自动化翻译方法,包括下列步骤:
建立集成式英文语料库;
按照集成式英文的语法规则,将文本改写为集成式英文文本;
将该集成式英文文本输入计算机;
根据集成式英文的语法规则,通过集成式英文句子终结符进行断句;
结合该集成式英文语料库,判断该集成式英文文本句子是否为集成式英文特殊句子,如果是,则进行特殊句子处理,将该集成式英文文本句子自动翻译为另一语言文本,如果否,则前进到下一步;
结合该集成式英文语料库,判断该集成式英文文本句子是否为集成式英文特殊句型句子,如果是,则进行特殊句型处理,将该集成式英文文本句子自动翻译为另一语言文本,如果否,则前进到下一步;以及
结合该集成式英文语料库,判断该集成式英文文本句子是否为集成式英文标准句型,如果是,则进行标准句型处理,将该集成式英文文本句子自动翻译为另一语言文本,如果否,则发出警告提示。
2.如权利要求1所述的方法,其中该另一语言文本为任何一种语言文本。
3.如权利要求2所述的方法,其中该另一语言文本为中文文本。
4.一种文本自动化翻译系统,其特征在于所述系统包括:
输入装置,用于输入将文本改写成的集成式英文文本;
储存装置,用于储存集成式英文语料库;
断句装置,用于根据集成式英文的语法规则通过集成式英文句子终结符对该集成式英文文本进行断句;
特殊句子判断装置,用于判断该集成式英文文本句子是否为集成式英文特殊句子;
特殊句子翻译装置,用于将该集成式英文文本特殊句子自动翻译为另一语言文本;
特殊句型判断装置,用于判断集成式英文文本句子是否为集成式英文特殊句型句子;
特殊句型翻译装置,用于将该集成式英文特殊句型句子自动翻译为另一语言文本;
标准句型判断装置,用于判断集成式英文文本句子是否为集成式英文标准句型句子;
标准句型翻译装置,用于将该集成式英文标准句型文本句子自动翻译为另一语言文本;
告警装置,如果所输入英文文本句子不符合集成式英文语法,则发出告警提示;以及
输出装置,用于将该另一语言文本输出。
5.如权利要求4所述的系统,其中该另一语言文本为任何一种语言文本。
6.如权利要求5所述的系统,其中该另一语言文本为中文文本。
7.一种结构化的文本表达方法包括:
设立具有许多类别的词汇分类系统;
设立对应该许多类别的符号系统;
对文本的原始版本中的词汇进行分类;以及
根据词汇的分类以插入这些符号至该文本的原始版本中,因而将该文本转换为新的表达的转换版本。
8.一种结构化的文本表达系统,其特征在于所述系统包括:
基础自然语言系统;
一套具有许多类别的词汇分类系统,用于对以该基础自然语言撰写的文本中的词汇给予特定类别;
一套对应该许多类别的符号系统,用于表示词汇的类别;以及
语料库,储存该基础自然语言对应至另一自然语言的资料。
9.如权利要求8所述的系统,其中该基础自然语言为英文。
10.一种文本翻译方法,用于将文本从第一自然语言翻译为第二自然语言,该方法包括下列步骤:
准备从该第一自然语言对应至该第二自然语言的语料库;
确定一套符号系统对应该第一自然语言的词汇类别的规则;
辨识在该文本中的符号;
根据符号判断该文本中的词汇的类别;
根据词汇的类别从该语料库中检索相关资料;以及
翻译为该第二自然语言。
11.如权利要求10所述的方法,进一步包括在该第一自然语言撰写的文本中预先插入许多符号。
12.如权利要求10所述的方法,其中该第一自然语言为英文。
13.如权利要求10所述的方法,进一步包括对该第一自然语言撰写的文本断句。
14.一种文本翻译系统,用于将文本从第一自然语言翻译为第二自然语言,其特征在于所述系统包括:
语料库,用于储存从该第一自然语言对应至该第二自然语言的资料;
一套预先定义的符号系统;
判断功能装置,用于根据该文本中的符号从该语料库中寻找数据;以及
编译功能装置,用于将该语料库中获得的资料组合为该第二自然语言。
15.如权利要求14所述的系统,其特征在于所述系统进一步包括:输入功能装置,用于输入具有该符号的第一自然语言文本。
16.如权利要求14所述的系统,其特征在于所述系统进一步包括:断句功能装置,用于对该第一自然语言文本进行断句。
17.如权利要求14所述的系统,其特征在于:该判断功能装置包括特殊句子判断功能装置,用于判断句子是否为预定的特殊句子。
18.如权利要求17所述的系统,其特征在于:该编译功能装置包括特殊句子翻译功能装置,用于将特殊句子翻译为该第二自然语言。
19.如权利要求14所述的系统,其特征在于:该判断功能装置包括句型判断功能装置,用于判断句子是否为预定的句型。
20.如权利要求19所述的系统,其特征在于:该句型判断功能装置包括特殊句型判断功能装置,用于判断句子是否为特殊句型。
21.如权利要求20所述的系统,其特征在于:该编译功能装置包括特殊句型翻译功能装置,用于将特殊句型翻译为该第二自然语言。
22.如权利要求19所述的系统,其特征在于:该句型判断功能装置包括标准句型判断功能装置,用于判断句子是否为标准句型。
23.如权利要求22所述的系统,其特征在于:该编译功能手段包括标准句型翻译功能装置,用于将标准句型翻译为该第二自然语言。
24.如权利要求14所述的系统,其特征在于:所述系统进一步包括告警功能装置,用于发出告警提示。
25.如权利要求14所述的系统,其特征在于:所述系统进一步包括输出功能装置,用于输出翻译后的第二自然语言。
CN 01131152 2001-09-04 2001-09-04 文本表达方法及系统以及文本翻译方法及系统 Pending CN1407483A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 01131152 CN1407483A (zh) 2001-09-04 2001-09-04 文本表达方法及系统以及文本翻译方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 01131152 CN1407483A (zh) 2001-09-04 2001-09-04 文本表达方法及系统以及文本翻译方法及系统

Publications (1)

Publication Number Publication Date
CN1407483A true CN1407483A (zh) 2003-04-02

Family

ID=4670403

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 01131152 Pending CN1407483A (zh) 2001-09-04 2001-09-04 文本表达方法及系统以及文本翻译方法及系统

Country Status (1)

Country Link
CN (1) CN1407483A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100418040C (zh) * 2004-06-25 2008-09-10 诺基亚公司 文本消息传递设备
WO2012079257A1 (zh) * 2010-12-17 2012-06-21 北京交通大学 机器翻译装置和方法
CN104572906A (zh) * 2014-12-26 2015-04-29 华为软件技术有限公司 一种事件特征的获取方法和设备
CN106255998A (zh) * 2014-05-09 2016-12-21 高光哲 利用英语语序地图的英语学习方法及其系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100418040C (zh) * 2004-06-25 2008-09-10 诺基亚公司 文本消息传递设备
WO2012079257A1 (zh) * 2010-12-17 2012-06-21 北京交通大学 机器翻译装置和方法
CN103314369A (zh) * 2010-12-17 2013-09-18 北京交通大学 机器翻译装置和方法
CN103314369B (zh) * 2010-12-17 2015-08-12 北京交通大学 机器翻译装置和方法
CN106255998A (zh) * 2014-05-09 2016-12-21 高光哲 利用英语语序地图的英语学习方法及其系统
CN106255998B (zh) * 2014-05-09 2019-05-17 高光哲 利用英语语序地图的英语学习方法及其系统
CN104572906A (zh) * 2014-12-26 2015-04-29 华为软件技术有限公司 一种事件特征的获取方法和设备
CN104572906B (zh) * 2014-12-26 2018-05-18 华为软件技术有限公司 一种事件特征的获取方法和设备

Similar Documents

Publication Publication Date Title
CN1155906C (zh) 数据处理方法、系统、处理程序及记录媒体
CN1204515C (zh) 自由格式数据处理的方法和设备
CN1119755C (zh) 文本处理器
CN1255213A (zh) 语言分析系统及方法
CN1297935C (zh) 进行非结构化信息管理和自动文本分析的系统和方法
CN1328321A (zh) 通过语音提供信息的装置和方法
CN1628298A (zh) 综合从搜索系统中使用的文档中抽取知识的自学习系统的方法
CN101079026A (zh) 文本相似度、词义相似度计算方法和系统及应用系统
CN1608259A (zh) 机器翻译
CN1578954A (zh) 机器翻译
CN1311423C (zh) 利用多语言字典执行语音识别的系统和方法
CN1672149A (zh) 词联想方法和装置
CN1567174A (zh) 对象表示和处理的方法及其装置
CN1581156A (zh) 信息处理系统、方法、程序和记录介质
CN1604076A (zh) 文章信息处理装置
CN1266633C (zh) 语音查询中的辨音方法
CN1407483A (zh) 文本表达方法及系统以及文本翻译方法及系统
CN1889174A (zh) 一种语音编码有声读物及其拾音器
CN1154502A (zh) 教育规范五笔字型汉字输入法及其装置
CN1321941A (zh) 中外文信息数字化运算编码处理系统
CN1119759C (zh) 中文汉语到盲文的自动转换方法
CN1178935A (zh) 世界文百语转换装置和方法
CN1529219A (zh) 语言码输入法
CN1140865C (zh) 超级数字码
CN1089919C (zh) 一种叠加式按形归类的文字拆分编码输入方法及键盘

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication