CN1224203A - 智能型汉英即时同步共显式机器互译方法 - Google Patents
智能型汉英即时同步共显式机器互译方法 Download PDFInfo
- Publication number
- CN1224203A CN1224203A CN98100049A CN98100049A CN1224203A CN 1224203 A CN1224203 A CN 1224203A CN 98100049 A CN98100049 A CN 98100049A CN 98100049 A CN98100049 A CN 98100049A CN 1224203 A CN1224203 A CN 1224203A
- Authority
- CN
- China
- Prior art keywords
- sentence
- sign indicating
- chinese
- indicating number
- english
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
一种智能化汉英互译装置。由于采用了“主体模板逻辑模拟方法”,并建立了一套完整的逻辑分析运作码、逻辑指令码、逻辑分析认知码、逻辑移动指令码、逻辑概念码,以及一套完整的语言识别码,因而能对主体模板的标准译文进行“逆向翻译”,从而具有了最优化翻译及自动纠错功能,能实现用中文入网漫游及操作英文软件,以及实现自动电话翻译和即时同声翻译。
Description
本发明涉及汉英互译的方法,特别是人工智能型汉英机器互译的方法。
目前,经计算机检索,还没发现在国内有汉英机器互译的专利技术,更不用说在国内外,还不存在人工智能型的汉英即时同步共显式的机器互译技术了。
本发明提供了一种人工智能型的汉英机器互译方法,可以实现随时输入中文句子,随时将句子译成英文,或是随时输入英文句子,随时将句子译成中文,并且能同时将中文和英文显示在计算机屏幕的方法。如果将本发明所使用的机器互译系统的输入端和输出端,分别衔接上语音识别系统和语音合成系统,它就能具有“自动电话翻译”或“即时同声翻译”的功能。如果将本发明所使用的汉英机器系统的输入端,联接上文字或文件识别系统,那么,它还可以把手写的或印刷的中文文件直接翻译成英文文件,或是把英文文件直接翻译成中文文件。不仅如此,由于本发明采用了“主体模板模拟式逻辑分析”的人工智能方法,因此能够自动模拟“联想句式信息库”中标准的、规范的汉译英或是英译汉的示范例句,并从中选择出最优的译文来。与此同时,它还具有自动纠错和自动记忆与联想的功能,从而使计算机具有使用时间越长,其处理中英文互译的能力就越强的特点。本发明所采用的人工智能方法,原则上适用于一切语种之间的相互翻译。为此,只要适当地按不同语种的语法和惯用语的特点,编排不同的语言翻译程序和语言词汇信息库,再与本发明所采用的人工智能方法相结合就行了。
特别需要说明的是,本发明所采用的中文输入方法,正是由本专利提出者所创立的一种汉字输入方法:“汉字两次输音输入方法”(简称“双读法”)。“双读法”属第三代汉字编码。它是纯音码,并实现了声母输入。因此,非常适用于汉英机器互译。这是因为,如果给具有相同词意的汉字和英文词汇都标上相同的“双读码”,那么,就可以直接实施中英文同时输出。而且,这也有利于衔接于输出端的语音合成系统的工作,有利于实现在系统输入端联接上“文字识别系统”后,能够适用于其它各种“汉字编码的使用。“汉字两次读音输入方法”的专利号为96100095.3,公开号是CN1155114A,使用者可自己去检索。
智能型汉英即时同步共显式机器互译的方法,其特征为:它独立提出了汉英机器互译的指导原则;编排了其独有的词汇码、句法码、句式码;提出了本发明独有的智能化机器自动翻译原理,并据此创立了一套独有的计算机逻辑认知码。这些逻辑认知码包括:逻辑指令码、逻辑作用模式码、逻辑分析运作指令码、词汇逻辑码和句式逻辑码。以上内容将在后面予以分节说明。
综上所述,可见,智能型汉英即时同步共显式机器互译方法,是一种极为优越的汉英机器互译的方法。它易于操作,并具有输入后不管自动纠错功能,适用于名种文化层次的操作者使用,属于智能型文字操作技术,可适用于多种不同语种的互译。因此,它有利于今后开发汉语与其他各种语种,以及各种不同语种之间的互译系列专利技术,所以具有非常广阔的应用前景与市场用途。
在说明本发明特征之前,需要先简要介绍一个“双读法”。所谓“双读法”,就是通过同时向计算机输入一个汉字和它的部首的拼音,来输出一个汉字的方法。这是一种纯拼音的汉字输入方法,也是一种利用部首来检索汉字的方法。“双拼读法”为每一个汉字(词组)分别规定了三组拼音码:“全拼码”、“双拼码”和“双字码”。“全拼码”输入的是一个汉字和它的部首的两个“全拼”,“双拼码”输入的是两个“双拼”,而“双字码”输入的,则是以这个汉字打头的一个两字词的第一个字和它的部首的声母,以及第二个字的声母的拼音,共三码。例如:“妈”字的全拼是“maNü”,双拼是“maNu”共四码,“双字码”为“mNm”。其中,全拼码是“妈”字和它的部首“女”字的全拼;双拼码是这两个字的双拼,而在“双字码”中,前两个声母mN是两字词组“妈妈”头一个“妈”字及其所属部首“女”的声母,第三个m则是第二个“妈”字的声母。详细情况可查阅有关这项专利的公报。
由上可知,“双读法”非常有利于实现汉英互译。因为它的全字母化的输入方式,与英文的全字母输入方式完全对应。所以,从原则上说,应用“双读法”很容易实现汉英互译。不过,由于,汉语言和英语在语法习惯和口语应用中还有很大差异,因此,为了实现这种汉英互译,还需要提出一些与计算机翻译相关的某些规范才行,而在此之前,首先了解一下汉语与英文都有哪些差异。
<一>汉语与英语的一般差异
这些差异大致表现在以下几个方面:
<a>英语大量运用放在被修饰名词后边的后置定语,而汉语没有这种情况。这里的一般规律是:用单词修饰的定语,放在定语之前,其余用词组修饰定语的,放在定语之后。
<b>英语用的最多的是句尾状语,中文几乎没有。汉语一般放在句首和主、谓语之间。英语只有少数几个表示频率、否定的副词放在主谓之间,如weldom等等。
<c>英语主、谓语之间要求动词以形式变化来体现人称和数的对应关系,汉语无此现象。
<d>英语常用it作形式主语、形式宾语,汉语无此现象。
<e>英语疑问句绝大多数是倒装着的,汉语无此现象。
<f>英语谓语动词有16种时态形式。汉语动词(谓语的)则没有词形变化。汉语一般只是加上了“了”、“过”等词表示时间。
<g>英语动词有虚拟语气,汉语没有。那么,如何在汉译英中表现虚拟语气呢?这就是;在汉语条件假设句中,如果假设的条件不存在,或是与结果矛盾,那么在译成英文时,就使用虚拟语气。
<h>英语名词有单、复数之分,有所属格,而汉语名词一般只用一个不变形式。
<i>英语有的名词直接用数词修饰,汉语则必须用“数量词”。这时,对应的英语却要用“数词十名词+of”来修饰,如:“ten lamps-十盏灯”。
<j>英语句子大多数名词前须用冠词a或the,汉词没有冠词。
<k>英语代词有宾格形式,汉语没有。
<l>英语基数词变成序数词时,绝大多数加th,汉语则是在前面加一个“第”字。英语分数的表示是“基数词+序数词”,汉语则是“……分之一”。
<m>英语动词有一种基本形式和四种变化式:过去式、不定式、-ing式、过去分词式。凡在谓词以外的地方用动词必须用其中一种形式。英语除谓语以外动词要用什么形式,要看当时的句子结构而定。
<n>英语连词有单纯标志从句的that,汉语没有。
<o>英语从句大多数以疑问代词、副词开端,汉语则也可以用别的词开端。
以上说明了汉语与英语的一般差异,而为了在汉英互译时克服这些差异,就需要提出一些编排计算机程序的指导性原则来。
<二>编排计算机汉英互译程序的指导性原则
<a>一致性原则(包括等效惯用语)。
这是实现汉英互译的准确性的最根本的原则。在这里,一致性包括三方面:首先是在词意方面的一致性;其次是在句法方面的一致性,再次,是句子成份位置的一致或等效性。需要指出的是,一致性也包含有等效性的情况。例如:在词汇方面有等效的惯用语,在句法方面有等效的句子成份。比如,在英语中,宾语的定语往往是后置的,而在汉语中宾语的定语则是前置的,但它们的作用仍然是等效的,都是修饰宾语的,因而是一致的。在以下例句里,就包括了上述三个方面的一致性:
例句中,汉语中的主语“这”与英语主语This对等,它们的位置也一致。与此同时,它们的词意是相同的。而这两个句子的句式和句子种类也是相同的。这就充分体现了翻译的一致性原则。
<b>差异性原则。
这就是前面提到的汉语与英语存在的一般性差异。只有了解了这些差异,才能有效地编排出克服这种差异的程序和编码,从而实现汉英互译的一致性。例如,既然已知汉语的谓语动词只有靠修饰它的时间副词或时态助词来表示时态,为了与英语动词的十六种时态变化保持一致,就要将汉语的所有的时间副词和时态助词划分为十六种表示时态的词汇类别,以与英语的十六种时态相对应。
例如,时态助词“了”属于“过去时”时态,与英语“过去时”相对应。
<c>限制性原则。
为了能更好地实现汉英互译的一致性原则,有必要对某些词汇构成句子的功能作一些限制。这种限制有时是句法所要求的,有时是符合某种语言习惯。了解了这些限制,就有力地保证了译文的准确性,从而保证了翻译的一致性原则。这种情况在英语中是很多的。例如,在英语中,大约只有四十几个动词可以带宾补。有了这限制,就大大缩小了计算机的选择范围,这就保证了译文的准确性。
<d>禁忌性原则。
所谓禁忌性原则,也可称为“反证原则”,意思是禁忌某些汉语或英语词汇(词组)具有某种语法功能。例如,在汉语中,禁忌把状语放在句尾。此外,在英语中,原形动词一般不能充当表语,必须将它改为不定式、-ing式或者是过去分词。而在汉语中,动词根本没有词形的变化,因此,也没有这种禁忌。根据这个原则,可以让计算机对一些不符合语法规范的词汇使用否定性指令。
<e>自由位置原则。
自由位置包括两种情况:其一是,无论在汉语或英语中,主语、谓语和宾语的位置在翻译时一般是不变的,除非在强调某一句子成份时有所例外。而所有修饰这些主语、谓语和宾语的定语、状语的词汇或词组的位置,在互译中则是可变的。因此,称它们的位置为自由位置,而称主语、谓语和宾语的位置为基本位置。不过,虽然它们的位置变化了,但它们在句子中的作用,即在正文与译文含意中的意义却没有变化。另一种情况就不同了。在英语或汉语中,某一个句子成份的位置变化往往会使同一个句子的意义发生很大的变化。这就体现了自由位置在汉英互译中的作用。在下边例句中,由于副词only位置发生了不同的变化,句子的含义也有了很大的改变。
有了这条原则,计算机可以根据一定的语法习惯,只改变句子中的某些成份的位置就可以得到合适的译文。不过,以上所说两种情况是有所区别的:一种是语法性的自由位置变化,不改变语意,另一种为改变语意,不属语法变化。
<f>逻辑一致性原则。
这个原则是指,在汉英互译中,一要保持译文在语法、语义方面与原文合乎一致,并且原文和译文句子本身在词汇(词组)配合上也要合乎逻辑。众所周知,汉语,特别是英语的词汇都具有一词多义性,这就给机器翻译,带来了很大的困难。例如,英语time flies这个短语(或词组),按字面的意义可以有三种解释:
①时间飞逝(光阴似箭)。其中time为名词,flies为动词。
②时间苍蝇。其中,时间是形容词,苍蝇是名词。
③给苍蝇计时。其中time又是动词,而flies则作名词而表示时间。
显而易见,第②和第③种解释是错误的。因为它们虽然符合语法,但不符合逻辑。比如,解释②中,时间与苍蝇根本不属于同类概念,在逻辑上这叫全异不相容。为了解决这个问题,本专利采用了智能逻辑的方式,来使译文合乎语法及语意逻辑。这种智能逻辑分析的特点,是以外延比较为主,而不以内涵理解为重心,这就有利于计算机的处理。因为,对于计算机来说,比较概念的外延相对来说是比较容易的。只要它的数据库存非常丰富,能容纳每个词汇或词组(短语)的所有外延就行了,而这正是计算机的特长。至于计算机如何进行这种智能化逻辑分析,下面将予以具体的说明。
同时,为了实现逻辑一致性的原则,本汉英互译系统还设立了“逻辑模拟部”,以便对于汉英机器互译进行逻辑模拟类比工作。这种模拟,既包括语法关系的模拟类比,也包括上述与智能逻辑分析有关的概念逻辑的模拟类比。在机器程序流程的各个步骤中,所输入的中文或英文句子只有通过了逻辑模拟部的分析,才能被送入到下一个流程。否则,还得重新执行一次原处理部的程序指令,再搜索一次合适的词组,而只有选择到正确的词组或句子,才能通过逻辑模拟部的分析,从而进入到下一个翻译程序中去。
与此同时,为了适应各个文化层次使用者的需要,逻辑模拟器还特设了逻辑开关,以使那些操作不规范语言的使用者,关闭开关后也能应用这种汉英互译机器,但是,这就不能保证译文的准确性了。同时,机器可在显示屏中,揭示他所输入的语句不符合语法逻辑。这样可促使他用其它的表达方式,以便最终得到比较准确的译文。不过,本专利所使用的智能型汉英互译程序,有自动纠错的功能。因此,也可不必断开逻辑开关,就能得到正确的译文。以上就是为克服汉英语言存在的一般差异而提出的七项原则。
下面将在这七项原则的指导下,建立起汉英句子的词汇码(词组码),句法码、句式码,以及为了实现智能分析而设立的句法逻辑码、词汇逻辑码和句式逻辑码,以便供计算机编程序和执行机器指令使用。
<三>词汇码。
词汇码包括拼音码、词类码、词意码和词法码四种。
<a>拼音码。
所谓拼音码,就是建立与“双读码”相对应的“汉字词库”与“汉字惯用语语词库”码。这时词(字)库的每个汉字或词组(包括惯用语)都被配上三种不同的“双读码”,即“读全拼码”、“双读双拼码”和“双读双字码”。例如,可以给“妈”字配上以上三组码:
妈
双读全拼码:maNü
双读双拼码:maNu
双读双字码:mNm
这样,当操作者输入“双读码”后,计算机就可以在“汉语输入部”直接将这些“双读码”转换为汉字了。这些“双读码”都是以一个字节为单位输入的,所以,转换而来的汉字,也都是以一个单词为节点。以后计算机对汉字进行分析时,也是以每个汉字单词分析为节点的。前面说过,本专利系统不排斥使用其他类型汉字输入方法,但必须配以相应类型的汉字词库才行,以便将其在“汉语输入部”转成汉字。
<b>词类码。
词类码,是为汉英双方词汇(词组或短语)所共同建立的、表明其词类身份特征的计算机识别码。它包括:名词码、代词码、形容词码、数词码、量词码、动词码、介词码、助词码、助动词码、连词码、副词码、叹词码,以及英语特有的冠词码。以上各类词类码,每一种又可细分为各个子类码。说明如下:
名词码可细分为:个体名词码、专有名词码、抽象名词码和集体名词码。
冠词码可细分为:定冠词码、不定冠词码,零冠词码(表示不需加冠词之意)。
动词码分为:趋向动词码、判断动词码(系动词码)、心理动词码、能愿动词码、施动动词码、受动动词码、存在与变化动词码、使令动词码和助动词码。
副词码包括:方式副词码、时间副词码、地点副词码、频率副词码、确定性副词码、程度副词码、疑问副词码、关系副词码,语气副词码。
介词码:时间和方位介词码,方式介词码,原因和目的介词码。
助词码包括:结构助词码、动态助词码,其它助词码,语气助词码。
连词码有两大基本种类:并连连词码和从属连词码。但为了计算机编排程序,将其中划分出语气连词码。这在后面讲词法码时将提到。
叹词码,只归为一种。代词包括有:人称、指示、疑问、物主、自身、不定、关系等代词码。
<c>词法码,指的是具有语法功能的词汇码。
名词:可数名词码,它包括单数名词码和复数名词码,阳性名词码、中性名词码、阴性名词码、名词所有格码。
动词:不规则动词码、规则动词码、及物动词码、不及物动词码,还有在英语中非常重要的十六种时态码,例如,四种基本时态码:一般现在时码、现在进行时码、过去进码和将来时码。其余12种时态码在一般英语教科书都有介绍,就不再细说了。动词词法码还包括:-ing码,过去式码,过去分词码。
形容词和副词还分别有比较级码和最高级码。
此外,还应为汉语的时间副词和时态助词建立十六种时态码。
例如:给“正在”与“在”建立现在进行时码,等等。
语法连词码:它包括英语从句的关系副词、关系代词、关系连词以及疑问代词、疑问副词码和if码、that码,等等。
<d>重读码。这是为区别重读词汇所用的识别码,以便确定它在句中语法身份。
<e>词意码
在前述有关逻辑一致原则时,曾讲述到,逻辑一致有两个含义;一个是指词汇概念在“类”的方面的一致,另一个是指在语法方面保持规范一致。为了确保词汇概念在类的方面的逻辑一致性,可按日本角川书店出版的“类语字典”给出的分类,将所有词汇共分为十类:即“自然”、“性状”、“行动”、“心情”、“人物”、“性向”、“社会”、“学生”、“品物”。此外,又可对大类细分为十个中分类。词意码可用数字表示。例如,“自然类”可用代码S,于是可得如下一种词意分类数字码:
SO(“自然”类)SO2(属“自然”类的“气象”)SO28(属“自然”类的“风”)SO28a(属“风”类的强弱)
以上是词意码。综合以上词汇的四种认识码(词意、词法、词类和拼音码)可知,在这里,汉语和英语的每一个词汇(词组)都被配备了四组编码,这就是它们的词汇身份码。但是,由于词汇在句子中的语法作用不同,它们还需要有表明其在句中语法身份的句法码,叙述如下:
<四>句法码
句法码主要是为了在汉英原文与译文中,给对等的语法成份,建立对应的句子成份码。例如,在汉英句子中的主语码。为了有助于编排计算机的翻译程序,以利于识别,因此,有必要按前述的一致性原则、差异性原则、限制性原则和禁忌性原则,区别出它们不同的语法身份特征。
<a>主语码<b>谓语码<c>宾语码<d>定语码<e>状语码
以上是五种句法码。此外,在英语中,还有汉语所没有的从句码。从句码在说明定语码和状语码时已经提到,另外还有主语从句码、表语从句码、宾语从句码,再加上定语从句码、状语从句码,共有五种。其中,定语从句码又应该分限制性和非限制性定语从句码,而状语从句码共包括:时间、地点、原因、目地、结果、方式、让步、条件等八种状语码。
<F>虚拟语气码
前面在说明汉语和英语一般差异时,曾提到英语的虚拟语气是汉语所没有的,故设立虚拟语气码。
<H>直接引语和间接引语码。
这是英语特有的一种语法现象,所以特别设立了这两种句法码。
<G>自由位置码和基本位置码
这两种位置码又简称“自由码”和“基本码”。它们是为了表示句子成份在句中的位置而设定的。由于在英语中,定语和状语的位置与汉语不同,在翻译时必须改换它们的位置,因此,为了便于计算机在译文时,编排移动句中成份的位置,故设立了这两种位置码。
在汉语或英语的句子里,一般来说,主语、谓语和宾语的位置是不变的,除了特别强调其中某一成份而外。同时,它们又是句中的基本要素,所以称它们在句中的位置为“基本位”。而由于定语、状语、宾补的位置是可变的,特别是在汉语与英语的句子里,它们的位置完全不同,在汉英互译时,一般都要发生变化,所以称它们为句中的自由要素,而称它们的位置为“自由位”。
自由位在句中共有四个,位置也是固定的,可供句中定语、状语自由移动使用。这四个自由位置分别用罗马数字Ⅰ、Ⅱ、Ⅲ、Ⅳ来表示:
<Ⅰ>+主语+<Ⅱ>+谓语+<Ⅲ>+宾语+<Ⅳ>。按前述有关句法码的规定,只有具有特定句法或词法身份的词汇(词组)才能进入基本位。例如,在英语中,只有原形动词和系动词才能占据“谓语”的位置(系动词大约有六十多个)。而在汉语中就不一样了,形容词也可以占据谓语的位置,但它必须位于作为主语的名词之后。
与此同时,自由要素在句中“自由位”中的位置也是固定的。例如,在汉语中,状语位于动词之前,而在英句中,状语则位于句尾“自由位”<Ⅳ>。另外,在“自由位”中,定语和状语的语序也是固定的。例如,在英语中,句尾状语的一种语序是:地点+方式+目地+原因+时间+状语从句。
<J>特殊成份码
它包括:全句修饰码、外位成份码和独立成份码。
<五>句式码。
<a>句类码
汉语与英语的句类码是相同的:陈述句码、疑问句码、祈使句码和感叹句码。由于本专利有自动纠错功能,故还设立了“病句码”。
<b>句型码
汉语与英语的句型码也是相同的:特殊句码、简单句码,并列句码、复合句码。
<C>词组码
它又分为动词性词组码和非动词性句型词组码。其中,动词性词组码包括:主谓词组码,动宾词组码,连动词组码、后补词组。而非动词性组码包括:偏正词组码,联合词组码、方位词码、定中词组码、状中词组码、“的”字词组码,“所”字词组码、同位词组码和比况词组码。
<d>句式结构码
汉语与英语的句式结构的基本要素位置相同,而自由要素的位置不同:
<Ⅰ>英语总句式码:状语+主语+状语+谓语+宾语+宾补+状语
英语基本句式码:①主语+谓语②主语+系动词+表语③主语+谓语+宾语④主语+谓语+间宾+直宾⑤主语+谓语+宾语+宾补
英语倒装句式码:①宾补+主语+谓语+宾补②宾语+主语十谓语
③谓语+主语④状语+谓语+主语⑤表语+系动词+主语⑥表语十主语+系动词⑦系动词十主语+表语⑧助动词<含情态动词>+主语+核心谓语
<Ⅱ>汉词句式结构码
汉语基本句式码:①主语+谓语+宾语②主语+是+宾语③主语+谓语+定语+宾语④主语+状语+谓语+宾语⑤定语+主语+状语+谓语+定语+宾语⑥时间修饰词+定语+宾语+宾补)。
汉语特殊句式码:①主语+<把>+宾语+谓语②<被>+主语+谓语+宾语③主语+<被>+谓语+宾语④主语+<给>+名词+谓语+宾语。
汉语选择疑问句码:①主语+谓语+宾语+吗<呢、吧>?②主语+动词+<不>+动词+宾语?③主语+<不>+动词+宾语?。
汉语否定句式码:①主语+<不>谓语+宾语。
英语的疑问句共分四种形式,所以有四种疑问句式码,即①一般疑问句式码②特殊疑问句式码③选择疑问句式码和④反意疑问句式码。
汉语的“被”字句式、“把”字句式、疑问句式、否定句式,比较句式和英语的疑问句式、否定句式与被动语态,一样都属于特殊句型,在计算机程序中,应均按特殊句式处理。
由于汉语和英语的句法有很大的不同,为了便于句中自由要素的移动,故特别设立了四种移动句子成份的指令识别码:①前置指令码②后置指令码③倒装指令码④不变指令码。
<六>智能化机器翻译原理。
本专利所采用的智能化分析方法,称为“主体模板模拟式逻辑分析方法。”这里,首先说明一下两个有关概念。①主体模板。这是指的是计算机数据信息库予先贮存的,从各种汉英词典和各类汉英教科书中所大量摘取的、规范的、标准的,包括各种句式类型的汉英互译例句。它是对所输入的中文或英文的句子和词组(短语),进行模拟逻辑分析的样板。由于它又是计算机内贮存的标准样板,所以称它为“主体模板”。
②原始模板。这是指从计算机的汉语或英语输入部输入的、有待于分析、类比,以便译成另一种文字(中文或英文)的中文或英文句子。相对于主体模板来说,它便被称为“原始模板”。所谓“主体模板模拟式逻辑分析”,就是将作为原始模板的中文或英文的词组(短语)或句子,从语法规范和逻辑规范这两个方面,来和作为主体模板的词组或句子进行模拟比较,以求找到它们在语法、句子结构和形式逻辑这几个方面的同构与异构之处,从而使计算机能够按主体模板的标准的译文样式,来对所输入的中文或英文句子进行正确的翻译。
这种方法,主要是靠对主体模板和原始模板所对应的句子概念的外延,以及句子所属“作用模式”的相容性,进行比较与类比来实现的。而这正属于计算机功能的强项。一般说来,计算机不擅长进行概念内涵的逻辑演绎而善于对概念的外延作出对比分析。同时,为了弥补只单纯依靠对概念外延进行逻辑分析的片面与不足,本专利又提出了一个有关“作用模式”的人工智能的新概念。“作用模式”是比概念更高一级的范畴。它代表的是由概念所构成的判断的内涵。对“作用模式”的模拟,实质上就是对于概念内涵的模拟。因此,这种“主体模板模拟式逻辑分析”,真正实现了汉英互译的智能化处理。因为这种方法,实际上和人类依赖于把外界经验与头脑中已有的认识模式(这是主体模板)进行模拟类比,从而获得对外界经验(这是原始模板)认识的方法是一致的。这种类比,也往往是从对概念外延与“作用模式”的比较中进行的。
所谓对概念外延的比较,主要是比较主体模板与原始模板中,各对应句子成份的概念的相容性。这种相容性共有几种:一种是全同相容,一种是部分相容,部分相容中又包含种属相容和交叉相容。再有,就是全异不相容,它包括矛盾、反对关系和并列不相容关系。这在一般形式逻辑教科书中都有说明,就不再详述了。相容关系,是我们所期望的,也很容易处理。它表示的是原始模板与主体模板的相似性。困难在于不相容情况,以及对于一个判断内部的主、谓项和联项之间的关系性质的模拟分析。因此,本专利才发展了“作用模式”的新观念。
根据D-BOX表达系统的术语:一个判断包括主体概念、作用(Role)和属性(Attribute)。所谓“作用模式”,是主体概念,一般指主项或主语的一种作用方式。这里强调的只是一种“作用方式”的基本模式。这里所说的作用,是用动词所表示的某种动作的作用。它表示了判断的内在作用特征的类型。例如,“抓住”是一种“作用”,而“抓住酒杯”表示的是抓住其一种具体实物的一类基本作用模式。它代表了诸如“抓住苍蝇”、“抓住绳子”、“抓住扶手”……这类作用模式。同一个作用“抓住”,还有另一种作用模式:“抓住机遇”、“抓住市场”、“抓住观众心理”,等等,它表示的是抓住某种抽象事物这样一类基本作用模式。这两种基本作用模式就包括了所有与“抓住”有关的作用模式的全部外延。由此可见,“作用模式”具有一种普遍性。在模拟化智能分析中,我们关注的只是这种“作用模式的相容性”。例如,无论是在汉语中,或是在英语中,在“抓住一个苍蝇(或是一个小偷)”这两个短语中,苍蝇和小偷,两个被作用项,在概念上都是不相容的。但由于它们都适用于“抓住”某种事物这个基本作用模式,因此,它们所表达的作用模式是相容的。由此可见,“作用模式相容性”扩大了概念相容性的范围。但更为重要的是,这种作用模式相容性概念,又是与汉语及英语中的谓语与宾语之间的语法关系相一致的。也就是说,在汉语或英语中,这两个短语的语法关系,并不因为“小偷”与“苍蝇”的并例不相容性而有所改变,它们都可以在句中作为相同的语法成份,例如,作为宾语。因此,“作用模式模式”的观念,更适用于对主体模板与原始模板的整个句子进行总的模拟比较,因而也使计算机获得了一种新的、更为全面的、更适用于对句子进行逻辑分析的人工智能类比方法。
对于“作用模式”的相容性,同样也应给予和概念相容性相类似的说明。“作用模式”的相容性也包括全同相容和部分相容,全异不相容和并列不相容这几种情况。举例来说,前述“抓住一个苍蝇”和“抓住一个小偷”就属于全同相容的作用模式;而“抓住一只苍蝇”和“抓住市场”则属于交叉相容的作用模式。但对于“一个苍蝇被抓住”和“抓住一只苍蝇”这两个短语来说,由于一个表示了主动式作用,另一个表示了被动式作用,所以是两个全异的矛盾的作用模式。与此对应,在汉语和英语语法中,也正好有主动语态和被动语态句或是“被”字句,这两种语法关系。
又因为在英语中,动词有不同时态的区别,所以,表示不同时态作用模式的动词应该是并列不相容的。例如“昨天抓住一只苍蝇”和“今天抓住一只苍蝇”就属于这种“作用模式时态不相容性”。而对于否定的作用模式,则属于作用模式的反对关系。在英语中,这种否定性作用模式对应动词否定式。例如“今天没抓住苍蝇”,就属“作用模式的否定性”,它对应英语的动词否定式。
至于连续性的作用,则可称为“连续作用模式”。相应的,它也具有作用模式的相容性问题,它对应句子中的连动谓语成份。
除此而外,还有“复合式作用模式”,它分别对应复合判断和复合句式。具体来说,有“并列型作用模式”、“转折型作用模式”、“连续型作用模式”,它们分别对应复合句中的并列、转折、递进、连贯复句。同时还对应联言判断。对应选言判断的是“选言型作用模式”。对应假言判断的是“假言型作用模式”,它又包括“充要条件型作用模式”和“必要条件型作用模式”。与此同时,还有“多重复合型作用模式”,它对应多重复合判断。而“必然型作用模式”和“可能型作用模式”,它们分别对应必然判断和可能判断。最后,还有“否定型作用模式”,它对应否定式判断。否定型作用模式与肯定型作用模式一样,有全称型和特称型作用模式两种,它们分别对应英语中的主语与谓语动词之间的数与人称的变化关系。
以上是对“作用模式”性质的说明。由于“作用模式”具有广泛相容性,它既包括一般性事物与特殊性事物之间的相容,也包括整体事物与个体事物的相容。因此,我们可以把具有相近意义的作用模式归为一类。这主要是指把由具有同义词性质的动词所表示的作用模式归为一类。例如,可根据同义词组:安顿——安放——安排——安置,将它们所表示的作用模式归为一类,即“安排型作用模式”类。这样做的目地,是为了在“句式联想信息库”中,把具有相似作用模式的标准示范例句,即主体模板归并在一起,使之条理化,以便有利于将具有相似性的原始模板与主体模板进行模拟比较。
以上是对于本专利所采用的智能化原理所作的说明,下面再说明一下它的应用方法。它包括对于词组(短语)和句子所作的智能化模拟分析的方法。下面分别予以说明。
对于词组的模拟分析,是将原始模板词组与“词组联想信息库”中的主体模板词组所进行的逻辑比较。这是一种初级的逻辑模拟分析。目的只是为了通过这种模拟类比,来确定词汇的词性和词组的语法结构。关于词性的确定,除了要确定词汇的语法身份码之外,还要确定词汇的概念码,例如,要确定该词汇是名词还是动词,从而给它标记上名词码或动词码。同时,还要识别它是实概念还是虚概,单义概念或是多义概念,以及是个体名词还是集体名词,等等。关于短语的结构,主要是确定它属于动词性短语还是非动词性谓语。而在非动词性谓语中,还要确定出它是主谓型短语,还是非主谓型短语。确定出动词性短语,是为了以后在对句子作模拟分析,能够确定它所属作用模式类型。对主谓型短语的认别,是为了以后在对句子分析时,可确定它是否属于主语成份或是定语、状语、宾语成份,而对于非主谓型短语的确定,是为了表明其口语语法身份。
“词组联想信息库”所贮存的词组,是以某一个词汇为中心,而形成一个联想词组网络,并进而将所有这些大大小小的词汇网络又组合在一起的。随着计算机翻译的进展,新输入的词汇又会形成新的词汇网络,从而不断丰富库存信息。在信息库中,每个词组网络中的词组都被标记上各种词法码、概念码和短语类型码,作用模式类型码(动词性词组),从而成为词组模拟的主体模板。
对词组的逻辑模拟有两个目的。第一个目的是通过对原始模板和主体模板的相容性,来确定作为原始模板的词组是否合乎语法关系和逻辑关系?其次,是在多义词组中,选择出一个意义正确的词组来。
对于第一种模拟分析,计算机主要是确定词组的搭配是否合乎语法和逻辑相容性。例如,英语表示高大的同义词共有三个:high、tall和lofty。其中high属于普通义,表示高于一般,主要表示超凡出众之意。tall一般表示人或动物的身高,而lofty则表示崇高或令人惊讶的高大之意。如果需要组织一个词组“高大建筑”,那么,显然应该是lofty strncture(建筑物)。如果此时计算机输入的原始模板例句是tall strncture,那么,计算机可以根据主体模板的规范表示,自动将这个错误的词组改为lofty strncture。这是计算机对词组的自动纠错功能。
对于多义词组,计算机可以通过给其中一种解释标记上“已确定码”,来表示这种解释是正确的。而面对其他的解释,或标记上“待确定码”,表示要在通过对全句的分析,再最后确定它的意义是否正确,或是给它标记上“不确定码”以否定这种解释。例如,在前述<F>逻辑一致原则中,曾提到词组time flies有三种解释。其中第二种解释“时间苍蝇”,应被划入“非动词性短语”类。通过对“词组联想信息库”的检索,计算机发现,以苍蝇为中心的词组网络里没有“时间苍蝇”这种词组。。与此同时,计算机又发现时间与苍蝇这两个名词是全异不相容的,不能搭配在一起。因此在给它标记上“无从确定码”之后,就否定了这组解释。而对于“给苍蝇计时”的解释,计算机通过模拟比较,发现在“计时”这种作用模式中,没有给苍蝇计时时这种作用模式。它是与计时这种作用模式不相容的。但由于该词组又是全句的一部分,所以,计算机在给它标记上“逻辑作用模式不相容码”后,又给它标记上“待确定码”,表明该词组将在以后对整个句子分析后再最后确认它的正确与否。接着,对于“时间飞逝”的解释,计算机发现在“词组联想信息库”中有和它完全一样的主体模板词组。于是,计算机在给它标记上逻辑作用模式全同码”后,又给它标记上“已确定码”,表示计算机已认定它是正确的解释。这就是计算机对多义词组的选择方法,以上就是对词组逻辑模拟方法的说明。
对句子的分析,也叫“总句分析”。这种模拟分析的目的,也是力图通过对作为原始模板的原句,与作为主体模板的例句之间的逻辑模拟类比,来确定原始模板的语法结构、所属判断的类型,以及整个句子作用模式的含义,从而为能得到正确的译文,打下良好的基础。这种模拟分析的方式也与对词组分析的方式相同,即先对句子的基本句型和所属判断的类型作出初步判断。然后计算机再据此对“句式联想信息库”中进行检索,来找到与原始模式的句子结构、判断类型相同,作用模式也相容的主体模板,而且是若干个相容的主体模板之中最优相容的。最后,再由计算机对主体模板与原始模板的各个对应的句中成份,逐类进行模拟类比。这种类比既包括词法上的,也包括逻辑概念上的,更包括作用模式相容情况方面的,以从中找出它们的相同、相容或异构之处,并分别标以不同的逻辑概念码,从而完成对整个句子的模拟比较。显而易见,这实质上是用逻辑模拟比较的方法来对句子进行解构。不过,这是种对总句所进行的逻辑模拟比较,又是和对词组所进行的模拟比较大不相同的。不同之处在于,当计算机检索到与原始模板相容的主体模板后,下一步则是使主体模板转换了角色,从被模拟者转换为模拟者,即将原始模板作为自身的模拟对象,来查找出自身与原始模板中,对应各个句子成份之间的相同或不同之处。然后再给自身(中文主体模板和主体模本的英文译文)各个句中成份标记上各种逻辑概念码。例如,经过这种“逆向模拟”后,计算机发觉主体模板(包括译文)的状语成份,比原始模板相应的状语成份多了一个修饰语。于是,这个多出的修饰语就被标记上“逻辑状语同格增加码”。由于主体模板已事先译好了标准译文,这样,当计算机需要把原始模板最后译成中文或英文时,只要将主体模板译文中,标有“逻辑状语同格增加码”的句中修饰成份删去,就得到了所需译文了。这实际上是一种“逆向翻译法”。如果这时还需要变动语法连接词,则可由“汉英连接词插入、删除部”根据需要,再插入或删去某些连接词就行了。主体模板其余的变动,也依此类推。需要指出的是,这种“逆向模拟”是在将原始模板的中文句子顺序,已按英语句子的语法顺序重新转换之后才进行的。于是这时共有三种主体模板:汉语语序中文句子,英语语序的中文句子,英文译文。以便于进行这种“逆向翻译”。因为在“句式联想信息库”中,所有的中文规范例句,都具有这种双重语序结构:一个是中文语序的,一个是英文语序的。在开始搜索与中文原始模板类似的主体模板时,计算机是以中文语序的句子为参照物或识别码的,而在第二步,对原始模板与主体模板进行模拟类比时,却是以按英语语序排列句中成份的中文句子为识别码的。这样做的目的,是为了更便于将模拟类比的结果,与已事先翻译好的主体模板的英文句子进行对照处理,从而能更准确地进行这种“逆向翻译”。以上是对智能化逻辑分析应用方法的说明。需要补充的是,每当计算机正确翻译了操作者所输入的中文或英文句子,以及正确修改了所输入的病句后,就会自动地将它们作为新的主体模板示范例句,吸收储存到“词组联想信息库”和“句式联想信息库”中。这样,随着计算机使用的期限加长,它的智能化功能也就会变得越来越强大。
还需要补充的是,对于中英文句子的逻辑智能模拟,也分两个不同类型。第一,是限制性逻辑智能分析。它主要指对于相互之间有语法和逻辑制约关系的主、谓语等句中主要成份,以及相互之间构成必然联系,如因果、条件、相容关系、目的关系的复句的各个分句之间的智能化逻辑分析。这种分析的结果,是要求主体模板与原始模板对应的主、谓语,以及复句的对应分句,也就是句中主要成份之间,必须有相容关系。如果其中有一个对应成份不相容,就必须重新选择新的与原始模板都相容的主体模板来。这就是限制性的基本句中成分的逻辑模拟。
第二,则是非限制性逻辑智能分析。这种分析主要是针对句子中非主要成份即自由成份而言的,同时,也包括非相容的选言判断和“引语”。在这里,非限制性的意思有两个:其一是说,如果主体模板与原始模板限制性相容关系成立,即句中主要成份相容,那么,即使句中的这些非限制性自由成份——它包括句中的宾语、宾补、状语、定语、非相容选言判断复句的分句,等等-不相容也没关系,它们不会影响对原始模板的逆向翻译。其二是说,如果遇到这种情况,即句中基本成份相容,而自由成份或直接与间接引语不相容,那么,计算机可以对这些自由成份或引语进行第二次或第三次的逻辑智能分析。这就是对句中对自由成份或引语句子中,所包含的定语、状语进行双重或多重独立的逻辑智能分析。
而这种对句中状语、定语等修饰语和引语所进行的第二次独立的逻辑分析,仍属限制性逻辑智能分析。它们之间也必须彼此相容。但这种相容性和对句中主要成份的相容性无关。这就是在智能化逻辑分析中的“多重分析独立叠加原理”。它使计算机具有了对更复杂的多重复句进行智能化分析的能力。
以上就是对智能化逻辑分析的全面说明,以下再表述一些与智能化逆向翻译有关的逻辑指令码。①逻辑相容更换指令。这一指令是命令计算机将主体模板与原始模板逻辑同格相容的句中成份的译文,更换为原始模板相应的句中成份的译文。②逻辑同格相增加(删除)指令。这是计算机命令将主体模板与原始模板逻辑同格的增加项删除或是对减少项进行补充(从原始模板中)的指令。③已确认指令。它是计算机确认原始模板与主体模板完全相容(包括词组和句子),并同意将它输送到下一步程序的指令。④待确认指令,是指计算机对原始模板与主体模板是否相容,以及对多义词组中某种解释有疑问,需要留待到进行总句分析时解决的指令。⑤不确定指令。表明作为原始模板的词组或句中成份不合规范应被淘汰的指令。⑥无从确认指令。它是指由于所输入的句子完全不规范,计算机无法对其进行智能化分析的指令。这时,计算机或是要求操作者重新输入,或是对其进行自动纠错处理。此时,计算工机应在屏幕显示”此句不通,请问如何处理?”的字样。
举例来说,前述英文译句“给苍蝇计时”就因被标记上“待确认指令码”,而被输送到“句式联想部”。由于整个英文句子是Time flike an arrow,如果按“给苍蝇计时”来理解,那么,整个句子就应译为“象箭一样对苍蝇计时”。但是“句式联想信息库”里根本没有这种例句。与此同时,通过计算机对比句所进行的逻辑分析,认定在“计时”这种作用模式里,是没有用“飞箭”这种方式计时的,也没有给苍蝇计时的。这就是说,它不包括在计时方式的外延和计时的对象之内。于是计算机便可确定,对句子的这种解释是错误的。在给它标记上“不确定码”之后,便否定了这个译文。又因为这只是对词组time flike的三种解释之一,而计算机又确认了其中一词解释“时间飞逝”是正确的。这样,计算机便找到了词组的正确解释,并最终将整个句子译为“光阴似箭”。这是对于一句多义而其中只有一种意义是正确的,并且又不是病句的情况的处理。但是对于只有一种意义,而句子本身又有毛病,从而使计算机不能正确辨认该句含义的情况,计算机就会对这种标记上“无从确认”和“病句码”的句子来进行自动纠错处理了。
计算机的智能化自动纠错的原理是,先将病句按类型分类,然后,再依其各类的特点,把它们贮存在“句式联想信息库”中。库中已预先贮存的许多具有这类特点的示范病句,可称之为“主体模板病句”。与此同时,在“句式联想信息库”中,还予先贮存了将每类病句改为正确句子的几种方案。例如,对于修饰不当的句子:“我听过一位司机亲眼看见的故事”的改正,就是如此。句子的毛病在于“故事”不能被看见。这时,“看见的故事”这一短语,就被标记上了“待确认”的标记和“病句码”。由于在“句式联想信息库”中,恰好有这一类“主体模板病句”,并同时有纠正此类病句的程序方案。比如,将“看见”改为“亲口叙述”或“亲身经历”。于是,计算机可以按程序自动将“看见”改为其中的一种。如果病句的类型在“句式联想信息库”中没有,则可以按“作用模式相容性”来进行模拟比较。例如,病句为“看见的传闻”。由于传闻与故事是相容的,因此也可以按上述情况进行更改,把“传闻”改为“亲口叙述”。但如果没有相容的情况,则就需要计算机在屏幕上显示“此句有误,请重新说明”的字样,而由操作者自行更改了。与此同时,计算机将会把这一更改方案贮存在信息库中,并将此病句作为“主体模板病句”,以备再迂到类似情况时使用。随着计算机对这类贮存的不断增多,它的“自动纠错”能力也就会更加强大了。病句类型共有:成份残缺、搭配不当、用词不当、语序不当、句式用错和不合事理,这五种类型。计算机确定病句的方法,就是根据以上五种病句类型来确定的。但是,对于修改病句,则要本着以操作者为准,而不是以计算机为准的原则,即主要是力图让译文符合操作者的原意,而不是使原始模板符合计算机所贮存的规范例句的标准。因此,计算机自动纠错的重点,是对于“作用方式不相容”而不是作用模式不相容的纠错,比如,将“骑”改为“乘坐”以适用于作用对象。一般在残缺主语和宾语的情况下,不自动补充新主语或宾语,因为计算机并不了解操作者心目中的主语和宾语是什么,所以不可自作主张。这是一条基本原则。因此,对于属于有歧义的病句,应该开列出其所包含的所有意义的若干个句子,以供操作者选择。这也包括语序不当的情况。计算机自动纠错的范围,除了作用方式不相容外,还包括句式用错和用词不当这两种情况,这些都属于计算机可以自己作主的范围。
最后,再说明一下,智能化逻辑模拟比应遵循的几个原则:
<a>句式结构的一致性。这主要是指原始模板与主体模板在基本的语法关系和句式结构上应完全一致。
<b>度的一致性。这主要是指原始模板与主体模板,在副词与形容词比较级方面保持一致。同时,对作为这个相容的判断来说,对应项相容的最大限度应保持在外延的上位与下位之间。
<c>判断结构的一致性。它表现为:①判断的性质一致,②判断内主谓项关系或肢判断关系一致。例如,在因果关系判断中,前肢判断与后肢判断之间的因果关系一致。③原始模板与主体模板的各对应主、谓项是相容的。④作用模式是相容的,对作用模式相容、前面已有说明,下面再作一下补充:
作用模式相容,既包括作用方式的相容,也包括作用对象范围的相容。作用方式相容前面己有叙述,并要求将相容的作用方式归并为一类。这里需要说明的是作用对象的相容性。前面已有说明:作用模式的相容性扩大了概念相容性的范围,它还包括了同类的相容性。但是这种同类的相容性,也是有限定范围的,例如,对于“骑”这种作用方式,只限定作用于“动物”和“小型交通工具”,例如“骑马”、“骑羊”、“骑鲸鱼”……,以及“骑自行车”、“骑摩托车”等等,而不包括大型交通工具。例如,不能说:“骑飞机”、“骑轮船”。因为它又属于“乘坐”这种作用方式的限定范围之内,两者不能交叉相容。因此,每种作用方式的范围是严格限定的,只有几类。这样,计算机也好加以认别。凡是超出所限定的几类范围的,就是“作用模式不相容”的。例如,“给苍蝇计时”就超出了计时这种作用方式的范围,因为计时只对事物的过程计时,而不对具体事物计时。再比如,说“看见故事”是错误的。因为它属于“听说”或是“讲述”的作用范围之内。
作用对象范围的相容,实质上是作用方式与作用对象的相容。例如,前面曾讲到的“听”故事与看见“故事”就涉及到了这个问题。“听”与故事是符合作用方式与对象相容关系的,而“看见”这种作用方式是与“故事”这个作用对象不相容的。
<d>正判断与等效负判断的一致性。有许多负判断是与正判断等效的。它包含以下几种类型:简单判断类型:并非SOP≡SOP,并非SEP≡SIP,并非SIP≡SEP
并非SOP≡SAP,并非这个S是P≡这个S不是P。负复合判断类型:并非(P并且q)≡非P或非q,并非(P或q)≡并非P并且非q
并非(如果P,那么q)≡P并且非q,并非(非P)≡P。
其中S、P为简单判断的主、谓项,P、q为复合判断的肢判断,而A、E、O、I则表示全称肯定判断、全称否定判断、特称肯定判断和特称否定判断。
以上是对逻辑一致性关系的说明。下面再介绍进行智能化逻辑分析所必备的逻辑分析认知码。
①逻辑作用模式码。它包括“逻辑作用模式相容码”和“逻辑作用模式不相容码”两种,“逻辑作用模式相容码”中又包括有:“基本句逻辑作用模式相容码”,它表示的是在原始板与主体模板的主、谓、宾关系之间的作用模式是相容的。“状语逻辑模式相容码”,它指的是,两个句子的状语短语成份的作用模式相容。“定语逻辑模式相容码”,指的是两模板的句中定语成份短语的作用模式相容。“分句Ⅰ逻辑模式相容码”和“分句Ⅱ逻辑模式相容码”乃至“分句Ⅲ逻辑模式相容码”……它们分别表示在两模板的复句或多重复句中,第一或第二,乃至第三或第四……个分句的作用模式是相容的。
②逻辑同格码。它表示的是,在原始模板和主体模板中,相对应的句中成份概念外延之间的关系。它包括四种码:“逻辑同格全同码”。它表示原始模板与主体模板对应项的概念外延是完全一致的,例如,两个句子的谓语,都是“在飞”这个词组或短语。“逻辑同格相容码”,它表明的是,两句子对应句子成份是相容的。例如,两句中主语,都表示某个人物,但它们的姓名不同。“逻辑同格不相容码。”它表示句中相应成份是不相容的。例如,句中主语一个是动物,另一个是人,但句子的类型,句子结构和作用模式都是相同的。“简缩逻辑同格码”,它指的是对应句中成份,一个是普通用语,一个是简缩语。
以上是指在句子的作用模式相容的情况下,概念之间的逻辑同格关系。如果作用模式不相容,那么,计算应首先搜索与原始模板作用模式相容的主体模板,然后再进行上述概念的逻辑同格的模拟比较。
③逻辑分析运作指令码。它包括“逻辑同格增加指令码”和逻辑同格取消指令码。”而每种码又可细分为:“逻辑定语同格增加(或取消简码)”和“逻辑状语同格增加或取消码”、“逻辑主语同格增加(或取消)码”、“逻辑宾语同格增加(或取消码)”以及“逻辑宾补同格增加(或取消码)。”
④特殊语义逻辑码。它包括前述有特殊语法作用的词汇如yet,以及某些“惯用语”。
综上所述,就是对智能化逻辑分析原理和具体的逻辑分析操作方法的说明。
需要补充说明的是,安排“汉(英)句式联想信息库”中的规范例句的排列顺序的基本规则,先是以“作用模式”的类型为分类标准:凡是有“作用模式相容”或是以近义动词作谓语的句子,都归为一类。而后,再对由同一类作用模式构成的句群,按基本句式类型分类。这样可便于计算机检索。
(七)逻辑概念码
逻辑概念码,是与词汇和句式有关的逻辑码的总称。它包括,词汇逻辑码和句式逻辑码。
<a>词汇逻辑码
这是指与概念的逻辑属性有关的认知码。它包括:实概念码、虚概念码、单义概念码、多义概念码、同位概念码、概念内涵码、概念树码、概念外延码、单独概念码、普遍概念码、肯定概念码、否定概念码、集合概念码、非集合概念码、实体概念码、属性概念码、属概念码、种概念码、概念不相容并列码、概念不相容反对码、概念相容同一码、概念相容种属码、概念相容交叉码。
概念的上位外延码、中位外延码和下位外延码:它们指的分别是某个概念所有的外延中最大、中间和最小的外延。例如学校的外延包括大学、中学、小学。
概念相容并列码:指的是同一属概念下的二个以上种概念,它们的外延部分相同。以上是词汇逻辑码。
<b>句式逻辑码
句式逻辑码是对分属不同判断所建立的识别码。它又分简单判断码、复合判断码、模态判断码三大类,其中每类又可细分为几小类。简单判断码包括:性质判断码和关系判断码,其中性质判断又分为单称肯定和否定、特称肯定与否定、全称肯定与否定码共六种。关系判断码则包括对称,非对称和反对称三种判断码,以及传递、非传递和反传递三种传递判断码。
复合判断码包括:联言、选言、假言、负判断、多重复合等五种判断码。模态判断码则包括必然与可能两种判断码。
以上建立了句式结构的逻辑码。
<d>词汇与句式逻辑码的应用
建立词汇与句式逻辑的目地,就是为了便于计算机判断识别,与“词汇联想信息库”和“句式联想信息库”中的示范词组(短语)和示范例句相近似的、所输入的中文或英文句子。
首先,对于词汇来说,“词汇联想信息库”,不但给每个单词和词组(短语)分别建立了词法码、句法码(短语句法码),而且还给它们建立了词汇逻辑码,例如:给“国家”建立了词法码。它包括名词码、专有名词码、集体名词码、复数名词码。在词组或短语中,如果“国家”充当主语,则有主语码。除此而外,还给它建立了词汇逻辑码,其中包括“国家”的内涵、外延码、普遍概念码、肯定概念码、集合概念码、实概念码、上位概念杩、中位概念码、下位概念码及属性概念码,等等。
以上第七部分、是对智能化原理的说明,并建立了相关的逻辑认别码。下面参照汉英机智能化机器翻译流程,来说明如何建立计算机具体操作的程序方法。
(八)智能型汉英互译基本流程分析(参见流程图<一>)
这种分析从流程的每一步说起,本说明以汉字输入为例。
100步:在这里,所输入的“双读码”,与预先贮存在450“汉语词汇信息库”中的汉字信息相比较后,转换成汉字。它以一个词汇或词组为一个字节,并以一个句子为一个完整的输入单位。如果用其他“汉字码”,则需相应的配套字库。如果输入文章或文件,则可按从上至下,从左至右的顺序,由文字处理装置进行扫描后,逐句输入。
200步:如果输入是汉字计算机指令,则根据220“英语计算机指令库”的信息,由计算机按程序翻译为英语计算机指令,直接从1300“英语输出部”输出,而不再进入预定的汉译英流程。如果不是计算机指令,则所输入的中文句子--以后通称为“原始模板”,还要输送到300步。凡是输入单纯计算机指令的中文句子,都要按功能换键。
300步:如果原始模板是完整的惯用语句子,那么,计算机根据300“汉英惯用语分析、转换部”的信息,将它转换为英语惯用语,也直接经1300输出。如果在句子中,只有部分句子成份是惯用语,则在被计算机标记上“未确定码”和“惯用语码”后,随整个句子一同转入到后面的各个程序中。除非它是一个完整的惯用语,否则,这些标有“未确定码”的句中成份,都要按句子的语法要求变化,并最后在1100“汉英词汇转换部”转换为英语。对于一个完整的惯用语,在标记上“已确定码”以后,就不再发生语法变化了。
特别需要指明的是,从100步至300步,每部处理完的句子,都要暂存在缓冲区里,然后被送到下一步进行处理。以后各步也是如此,就不再重复说明了。
400步:这是“词法分析、模拟部”。在这里,所输入的每个汉字词汇都被标记上各种词法码,例如,给名词标记上“个体或集体名词码”、“单数或复数码”。同时,还要标记上各种词汇逻辑码,如“实概念码”、“单义概念码”。计算机是根据450“汉语词汇信息库”和1220“逻辑模拟信息库”而给出这些认知码的。不仅如此,计算机还会以1220“逻辑模拟信息库”为根据,并联合“汉语词汇联想信息库”,共同对中文句子中的词组进行逻辑模拟分析。凡是符合语法关系与逻辑规范的,就被标记上“已确定码”;凡是不符合的,就被淘汰出局;仍难以确定的,被标记上“待遇定码”后,和已标上“已确定码”的词组,一同被送到下一步程序。在这里,对多义词组已作了初步的选择淘汰。
500步:在“句法分析部”里,各句中成份被赋与各种“句法码”,如“主语码”,等等。无论是在英文或中文句子中,都以动词为检索的首选取步骤,目地是确定谓语。在中、英语句子中,原动动词和系动词是谓语的显著标志。而在中文里,则以“的、地、得”这种语气助词为标志:凡在“地”后和“得”前的第一动词为谓语。如果没有“地”、“得”两字,则以最靠近句首的动词为谓语,但必须在靠近句首的“的”字之后。对汉语中以形容词作谓语的情况也是如此。如果是复句,计算机则以逗号和联接词为分节点,把复句分为若干分句,并按上述方法,检索每个分句的主谓语。与此同时,在这里还要确定句子的“句式码”,如“陈述句码”。如果属特殊句式,则要标记上“待确认码”,以留下一步处理。
600步:这是“动词分析部”。计算机根据650“汉语动词信息库”的信息,按句中时间副词和时态助词与十六种时态对应的情况,给动词标记上不同的时态码。如果不含时间副词和时态助词,对于政治和科技论文,则一律按“现在时”处理。
在这里,动词还被赋与“主动动词码”和“被动动词码”,并标记上动词词法码,如“能愿动词码”。标记上“被动动词码”的句子,将被作为特殊句式处理,除此而外,还要确认非谓成份中的动词句法身份,如状语从句和定语从句中的动词时态码,以及“直接引语”与“间接引语”中动词的法码。
700步:在这里,句中的状语或状语从句、定语或定语从句、中文句子的补语(也属状语),将被标记“自由成份码”。与此同时,计算机还将根据主、谓、宾的位置,确定出句中的自由位和三个基本位。如果缺少某一个基本位,则相应也要减少自由位。同时,计算机还根据贮存在950“英语构句信息库”的信息指令,赋与每个自由句子成份以自由位置移动指令,例如:“定语前置指令<Ⅰ>”。但此时自由句子成份并不真正移动,只是到后来,在900步进行句子要素位置调整时,才真正移动。
800步:这是特殊句式部。在这里,根据850“汉语特殊句式信息库”的信息指令,把属于特殊句式的中文句子鉴别出来,并标记上特殊句式码,即“被”字句式码。
900步:在“汉语句子要素转换部”里,中文句子的各个成分,需要按英语的构句顺序重新排列。这时,可执行自由句子成份的移动指令。变换后的中文句子,将与原句共同被输送到1000步,进行逻辑模拟分析。但如果操作者不想进行智能化模拟翻译,而要按计算机设计的机器程序翻译,则可按动某个功能转换键。这时,变换后的句子将被送到1100步,在“汉英词汇转换部”中,直接将中文词汇转换为英文词汇,再经1200步“删除和插入语法连接词”后,从1300“英语输出部分输出”。
1000步:从900步输入的两种语序不同的中文句子,首先,将对具有中文语序的句子进行鉴别,以确定它所属的逻辑判断类型和基本句式类型,计算机将据此,到1050“汉字联想信息库”中检索与它相似的主体模板。然后,在主体模板更换为具有英语语序的句子后,再转换角色,根据1000“句式模拟分析部”的信息指令,进行“逆向模拟”,以原始模板(也已更换为英语语序)为对象,察寻自身与原始模板之间的同构与异构之处,并标记上不同的逻辑认别码,例如“逻辑作用模式相容码”和“逻辑状语同格增加(或减少码)”,随后,标记上逻辑识别码的中文句子被输送到1100步,转换为事先贮存在“英语句式联想库”中已译好的英文句子,并按句中对应的逻辑别码,对句中的成份进行增添和删除,即进行“逆向翻译”。
1100步:进行逻辑模拟的句子,在这里,按其所带逻辑词汇码的情况,将对与主体模板对应的标准译文进行增删,从而得到与原始模板的原意相一致的译文。这就是“逆向翻译法”。
未进行智能化模拟的句子,在这里,将直接把中文词汇转换为英文词汇,从而变成英文句子。
1200步:无论是经过逻辑分析的句子,还是未经过智能分析的句子的译文,在这里,都要根据各自的情况,在句中增加或删除一些语法连接词,从而构成一个完整的译文。
1300步:译好的英文句子从这里输出来。如果这里还衔接有“语言合成系统”,那么,所译的英文句子就可以直接转化为英语口语,从而成为“即时同声翻译系统”了。
至此,整个中文句子翻译过程结束。对于英译汉的情况也是如此。下面再就一个具体的中文句子的翻译过程,作一个简单的介绍。(参照汉英互译程序流和图<二>)、
流程图的翻译步骤如下(采用逻辑模拟分析):
100步:用“双读法”输入中文句子“我从上海到北京坐了飞机”。因为要对此句进行中译英,故没有启动直通输出部的转换键,而转入下一步200步。
200步:由于不是计算机程序指令,转入300步。
300步:因不是惯用语,转入400步。
400步:在汉语词法分析部里,句子中各个成份被赋与了各种词类码和词意码,如“我”被赋与了“代词码”,又被赋与了词意码一“人物类”码。与此同时,预先贮存在460“汉语词汇联想信息库”的词组,又被句子中各句子成份作为标准模板,进行了逻辑模拟比较,确定了大多数句中成份都与联想库中的词组相同,都属于逻辑同格。只有“从上海到北京”这一词组,是与联想库中所贮存的词组不同,但又是相近的,所以被赋与了“逻辑同格相容码”。联想库中贮存的词组,也许是从北京到什么其它地方。然后,句子转达入500步。
500步:在这里,句中被赋与了各类句法码,如主语码、谓语码。还被确定为陈述句和基本句式结构④,这两种句式识别码。以后,又转入600步。
600步:句子在这里被确定为过去时态,动词“坐”又被确定为使动动词,从而被确定为主动句式,然后转入700步。
700步:被计算机根据程序确定了状语“从上海到北京”属于自由成份码。同时,还确定了三个基本位与四个自由位,并被赋与了“后置<Ⅳ>指令”。随后转达入800步。赋与“后置<Ⅳ>指令”,是根据950“英语句子顺序信息库”的程序要求而作出的。
800步:该句不属于特殊句子,被转达入900步。
900步:句子按英语语序,执行了计算机移动每指令,把状语“从上海到北京”移到了句尾自由位置<Ⅳ>的位置,然后与原句共同输送到1000步。此时,操作者要求进行智能化自动翻译。
1000步:在这里,句子被赋与了“基本句式码④”和“非传递性关系判断码”,以及“逻辑‘乘坐’作用模式码”。然后,计算机在“汉语句式联想信息库”中搜寻到与它作用模式相同的例句:“我从上海到北京坐了火车”,并将它改为英语语序的句子:“我坐了火车从上海到北京”。随后,将主体模板以原始模板为对象,进行逆向模拟,从中确定主体模板句中的“火车”与原始模板句中的“飞机”,为“逻辑宾语同格相容码”,其余的都为“逻辑同格码”。在主体模板标记上逻辑认知码后,被输送到1100步。
1100步:在这里,主体模板按预先贮存在“英语句式联想部”中对应的标准译文,进行了转换。同时,又按逻辑识别码“逻辑定语同格相容码”,把译文中的英文词汇“火车”,更换为原始模板中的词汇“飞机”。而原始模板的中文词汇“飞机”,在经过前面400步“汉语词法分析部”处理时,就已经与贮存在“英语词组联想信息库”的英文词汇“飞机”建立了对应关系。这时,就直接由480“英语词组联想信息库”调到1100“汉英词汇转换部”,更换掉主体模板中的宾语“火车”,从而完成了这种逆向翻译。
1200步:这是“汉英连接词插入,删除部”。在中文句子译为英文句子后,原来的中文名词“飞机”前,应加上一个不定冠词the,但由于主体模板英文译句的宾语“火车”前,已有不定冠词the,因此,在1200步就不再增减语法连接词了。
1300步:译好的英文句子“I took the plane from Shanghaito Beijing”从这里输出。
全句翻译完毕。
Claims (10)
1.一种“智能型汉英即时同步共显式互译方法”。其特征为,本专利所采用的中英文输入系统,主要应用以“双读码”为主并配有“双读码”字库的汉字输入方法,来进行汉译英。它也可兼用其他汉字输入法,但必须有相应的配套字库。如果与文字识别系统衔接,它可以直接输入中英文文件和手抄文字进行汉英互泽。如果和语音识别系统衔接,可以将声音转为文字输入;
2.根据权利要求1所述,本专利为了分析、判别所输入的中英文句子的语法关系和句型结构,特别设计了一套计算机语法识别码,其特征为,既有词法码,又有句法码,还有特殊语法码。它们包括:词类码、词意码、词法码;五种句法码;虚拟语气码,以及自由位置和基本位置码;此外还有句类码,其中也包括病句码;还有句型码;又有词组码,其中词组码又包括动词性词组码和非动词性词组码;再有句式结构码,等等。还有计算机关于句子成份语法移动和识别的指令码;
3.根据权利要求1所述,本专利为了实现智能化逻辑模拟分析,特别设计了一套计算机逻辑识别码和逻辑指令码,并提出了作为翻译对象的“原始模板”,作为模拟对象的“主体模板”,以及为实现这种模拟而创立的“作用模式”、“作用方式”及“作用对象”,及其各种有关作用模式的判断形式,如“并列型作用模式”,等等,这一系列独创的、与智能化分析有关的新概念。这套逻辑识别码体系的特征为,它包括有逻辑分析认知码,逻辑分析运作指令码、逻辑概念码、逻辑指令码,逻辑分析认知码、逻辑移动指令码;
4.根据权利要求1所述,本专利又建立了一套与智能化模拟分析有关的“词组(短语)联想信息库”和“句式联想信息库”,其特征为:“词组(短语)联想信息库”包括中文与英文两种信息库,它们被称为“主体模板词组”,以作为词组模拟对象和标准。它们属于一个二级词组网络系统。网络第一级,是以某一个词及其所有与它同义或近义的单词所组的词组母集;网络第二级则是以上述同义或近义词组中的每一个词汇为中心所建立的、以这个词汇打头的所有联想式词组子集。这个“词组联想信息库”还包括有病句词组集。集中每个有毛病的词组还配备有某个病句修正案例。它是为计算机自动纠正词组错误而设定的。“句式联想信息库”有两种:一种是中文的,一种是英文的。它们都是由从各个教科书及词典中大量摘取的中文或英文规范例句构成的,称为“主体模板句式”,以作为原始模板句式的模拟对象和标准。它们也属于一个二级句式网络系统。网络第一级是由具有同一类作用模式的句子构成的母集;网络第二级,是在上述母集中,再按基本句式类型标准分类后,所构成的各个子集。与此同时,每一个主体模体句式都有三种句式:在“中文句式联想信息库”中的中文例句有两个句式,一个是以中文语序构成的,另一个则是以英文语序构成的。同时还有若干种与它对应的英文译句句式。对于英文的主体模板句式也是如此。这是为了进行“逆向模拟”以及“逆向翻译”所用。不仅如此,“句式信息库”还具有病句子集。它是以五种病句类型为标准而构成的,并附有病句修改案例;
5.根据权利要求1所述,本专利还独创一套模拟分析运作方法。其特征为:从“作用模式”、语法及句式结构、判断类型,这三个方面为标准,将原始模板进行“正向模拟”和“逆向模拟”。然后根据模拟结果,给主体模板译文的句中成份标记上不同的逻辑识别码,并按不同的逻辑运作指令,对译文再进行“逆向翻译”。这种模拟分析,既包括单句的,也包括多重复句的,这就是本专利提出“多重模拟分析独立叠加原理。”本专利保留运用这套智能方法对一切不同语种互译的权利;
6.根据权利要求1所述,计算机还可以根据这一套智能分析方法,对多义词组或多义句子进行最优化的选择,从而迭出最准确的译文,并能自动进行纠错处理。其特征为:将与主体不相容的病句来和主体模板进行规范化类比,然后,根据预先贮存的修改方案对病句按类型进行修改;
7.根据权利要求1所述,本专利所设计的系统还有记忆功能,其特征为:它能将每次所正确进行的词组与句式模拟,对正确的多义词组与多义句子进行最优化的选择,以及对病句的修改,都储存起来。因此具有工作时间越长,功能也就愈强的特点。为此特设立了“汉英译文词组与句式自动记忆贮存部”和“英汉译文词组与句式自动记忆贮存部”(十六、十七部)它具有将原文与译文的规范词组与句式,按要求自动贮存在“汉、英词组联想信息库”和“汉、英句式联想信息库”的自动记忆功能;
8.根据权利要求1所述,本专利所设计的智能化模拟分析程序,其特征为:它包括有汉语与英语共用的“计算机指令转换部”、“惯用语分析转换部”、“词汇转换部”和“连接词插入、删除部”,以及“词汇分析模拟部”、“句法分析部”、“动词分析部”、“特殊句式部”、“句子自由成份分析部”、“句子要素转换部”、“句式分析模拟部”,再加上两个中英文“输入部”和两个中英文“输出部”,及其权利要求(7)中所设十六、十七两部,一共有17个部。其运作程序特征为:“汉语输入部”将所输入的“双码”转为汉字词汇,或是把文件分解为单个句子输入,或是将语音或其他汉字编码转换为文字输入,或者把手写句子转换为计算机文字符号输入。“计算机转换部”将汉语计算机指令转换为英语计算机指令,依照“快行道原则”直接从“输出部”输出,对英语软件进行操作。对于英译汉的计算机指令也是如此。对于汉语或英语独立的惯用语,如感叹句,也依“快行道原则”,从“惯用语分析转换部”直接向“汉、英输出部”输出。但对于作为句中部分的句子成份的惯用语,则给标记上“惯用语识别码”,在最后整句翻译时,再一并转换为译文。“词法分析部”给每个词汇标记上词汇码和逻辑词汇码,并与储存在“词组联想信息库”中的主体模板词组,进行初步的智能逻辑模拟分析,病句修改,以及对多义词组进行选择。在给它标记上各种逻辑指令,例如,标记上“已确定码”后,输送到“句法分析部”。在这里,句中词汇被分析出主、谓、宾语。如果是复句,则分析出分句所有的主、谓、宾语,并被标记上各种句法码。在“动词分析部”,计算机根据中文句中的汉语时间副词和时态助词所被划归的十六种时态类别,分析出动词所属时态。对于英文句子,则根据词尾变化分析出它的时态,并分析出动词是受动还是主动动词。在“句子自由成份分析部”,句中状语、定语及其从句,被标记上自由成份码,又区分出句中的三个基本位和四个自由位,并按译文的语种性质所要求的语序所应移动的自由成份,赋以不同的移动指令识别码。“句子要素调整部”,将句子按所译语种的语序进行调整。“句式分析模拟部,”对句子进行正向与逆向模拟。随后,这种逆向翻译在“汉、英词汇转换部”完成。“汉、英连接词插入、删除部”对这种逆向翻译更换所需的连接词。最后,译文从输出部输出。同时,十六、十七两部又自动将规范的中文及其英文译文,或是将规范的英文及其中文译文,分别按程序要求输送到“汉、英词组联想信息库”和“汉、英句式联想信息库”中贮存。如果该部衔接有语音合成系统,则可变为声音输出,而成为自动电话翻译或“同声翻译装置”。本专利保留一切与本专利装置相衔接的所有设置的权利要求。
9.本专利系统具有机械式翻译和智化翻译的双重功能,以供操作者选择,这也是本专利所独创的。
10.本专利还具有将中英两种文字即时同步地在计算机屏幕显示的功能。一切在中英互译中所表现出来的问题,都可同时显示在计算机屏幕上,以供操作者选择,这也是本专利独创的功能。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN98100049A CN1224203A (zh) | 1998-01-20 | 1998-01-20 | 智能型汉英即时同步共显式机器互译方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN98100049A CN1224203A (zh) | 1998-01-20 | 1998-01-20 | 智能型汉英即时同步共显式机器互译方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1224203A true CN1224203A (zh) | 1999-07-28 |
Family
ID=5215768
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN98100049A Pending CN1224203A (zh) | 1998-01-20 | 1998-01-20 | 智能型汉英即时同步共显式机器互译方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1224203A (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100346625C (zh) * | 2002-12-27 | 2007-10-31 | 联想(北京)有限公司 | 一种电话语音交互系统及其实现方法 |
WO2010020087A1 (en) * | 2008-08-18 | 2010-02-25 | Xingke Medium And Small Enterprises Service Center Of Northeastern University | Automatic word translation during text input |
CN102375809A (zh) * | 2010-08-04 | 2012-03-14 | 英业达股份有限公司 | 以输入的第一语言即时输出第二语言的系统及其方法 |
CN101340676B (zh) * | 2008-08-21 | 2012-04-18 | 华为终端有限公司 | 一种实现同声翻译的方法、装置和移动终端 |
CN103678289A (zh) * | 2013-12-12 | 2014-03-26 | 苏州市峰之火数码科技有限公司 | 电子语音翻译方法 |
CN105355100A (zh) * | 2015-10-19 | 2016-02-24 | 陈俊睿 | 文科学习资料辅助阅读测试系统 |
CN109036451A (zh) * | 2018-07-13 | 2018-12-18 | 深圳市小瑞科技股份有限公司 | 一种基于人工智能的同声翻译终端及其同声翻译系统 |
CN109271647A (zh) * | 2018-09-06 | 2019-01-25 | 练敏 | 基于TParse的中英文互译方法和装置 |
CN110533020A (zh) * | 2018-05-25 | 2019-12-03 | 腾讯科技(深圳)有限公司 | 一种文字信息的识别方法、装置及存储介质 |
CN111738019A (zh) * | 2020-06-24 | 2020-10-02 | 深圳前海微众银行股份有限公司 | 一种复述句识别的方法及装置 |
CN112395889A (zh) * | 2019-08-01 | 2021-02-23 | 林超伦 | 机器同步翻译 |
CN115062632A (zh) * | 2022-06-09 | 2022-09-16 | 中国电力科学研究院有限公司 | 变电站模型数据涵义英文描述方法、装置、设备及介质 |
CN115965017A (zh) * | 2023-01-04 | 2023-04-14 | 北京三维天地科技股份有限公司 | 一种基于开发平台的多语言录入和解析系统及方法 |
CN115062632B (zh) * | 2022-06-09 | 2024-09-27 | 中国电力科学研究院有限公司 | 变电站模型数据涵义英文描述方法、装置、设备及介质 |
-
1998
- 1998-01-20 CN CN98100049A patent/CN1224203A/zh active Pending
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100346625C (zh) * | 2002-12-27 | 2007-10-31 | 联想(北京)有限公司 | 一种电话语音交互系统及其实现方法 |
WO2010020087A1 (en) * | 2008-08-18 | 2010-02-25 | Xingke Medium And Small Enterprises Service Center Of Northeastern University | Automatic word translation during text input |
CN101340676B (zh) * | 2008-08-21 | 2012-04-18 | 华为终端有限公司 | 一种实现同声翻译的方法、装置和移动终端 |
CN102375809A (zh) * | 2010-08-04 | 2012-03-14 | 英业达股份有限公司 | 以输入的第一语言即时输出第二语言的系统及其方法 |
CN103678289A (zh) * | 2013-12-12 | 2014-03-26 | 苏州市峰之火数码科技有限公司 | 电子语音翻译方法 |
CN105355100A (zh) * | 2015-10-19 | 2016-02-24 | 陈俊睿 | 文科学习资料辅助阅读测试系统 |
CN110533020A (zh) * | 2018-05-25 | 2019-12-03 | 腾讯科技(深圳)有限公司 | 一种文字信息的识别方法、装置及存储介质 |
CN109036451A (zh) * | 2018-07-13 | 2018-12-18 | 深圳市小瑞科技股份有限公司 | 一种基于人工智能的同声翻译终端及其同声翻译系统 |
CN109271647A (zh) * | 2018-09-06 | 2019-01-25 | 练敏 | 基于TParse的中英文互译方法和装置 |
CN109271647B (zh) * | 2018-09-06 | 2023-04-18 | 练敏 | 基于TParse的中英文互译方法和装置 |
CN112395889A (zh) * | 2019-08-01 | 2021-02-23 | 林超伦 | 机器同步翻译 |
CN111738019A (zh) * | 2020-06-24 | 2020-10-02 | 深圳前海微众银行股份有限公司 | 一种复述句识别的方法及装置 |
CN115062632A (zh) * | 2022-06-09 | 2022-09-16 | 中国电力科学研究院有限公司 | 变电站模型数据涵义英文描述方法、装置、设备及介质 |
CN115062632B (zh) * | 2022-06-09 | 2024-09-27 | 中国电力科学研究院有限公司 | 变电站模型数据涵义英文描述方法、装置、设备及介质 |
CN115965017A (zh) * | 2023-01-04 | 2023-04-14 | 北京三维天地科技股份有限公司 | 一种基于开发平台的多语言录入和解析系统及方法 |
CN115965017B (zh) * | 2023-01-04 | 2023-11-10 | 北京三维天地科技股份有限公司 | 一种基于开发平台的多语言录入和解析系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1174332C (zh) | 转换表达方式的方法和装置 | |
CN1652107A (zh) | 语言变换规则产生装置、语言变换装置及程序记录媒体 | |
CN1871597A (zh) | 利用一套消歧技术处理文本的系统和方法 | |
CN1542649A (zh) | 自然语言生成系统中用于句子实现中排序的成分结构的语言信息统计模型 | |
CN1094618C (zh) | 机器翻译中的语法自纠正方法 | |
CN1503161A (zh) | 获悉词组之间的转换关系的统计方法和装置 | |
CN1648828A (zh) | 去多义性语音输入系统和方法 | |
CN1869976A (zh) | 通过执行不同语言之间的翻译来支持交流的装置和方法 | |
CN1770107A (zh) | 提取小树转换对 | |
CN1224203A (zh) | 智能型汉英即时同步共显式机器互译方法 | |
CN1297561A (zh) | 语音合成系统与语音合成方法 | |
CN1781102A (zh) | 低速存储器判定树 | |
CN86108582A (zh) | 速记翻译系统 | |
CN1514387A (zh) | 语音查询中的辨音方法 | |
CN1838159A (zh) | 一种认知逻辑机器及其处理信息的方法 | |
CN1111841C (zh) | 在语言识别中通过计算机来确定至少两个单词的序列出现概率的方法 | |
CN101692188A (zh) | 一种音形码汉字输入法 | |
CN1442787A (zh) | 作文修改写作系统 | |
JP5298834B2 (ja) | 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置 | |
CN101436179A (zh) | 文本转换方法及装置 | |
CN1117158A (zh) | 辅助汉文双拼音义码及其键盘方案 | |
CN1088011A (zh) | 多文种电子文稿的模板校对方法和装置 | |
CN1178935A (zh) | 世界文百语转换装置和方法 | |
CN1489122A (zh) | 拼音英语及学习机 | |
CN1808350A (zh) | 国际音标联想式输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |