CN1108572C - 汉语和日语的双向机械翻译机 - Google Patents

汉语和日语的双向机械翻译机 Download PDF

Info

Publication number
CN1108572C
CN1108572C CN 93104048 CN93104048A CN1108572C CN 1108572 C CN1108572 C CN 1108572C CN 93104048 CN93104048 CN 93104048 CN 93104048 A CN93104048 A CN 93104048A CN 1108572 C CN1108572 C CN 1108572C
Authority
CN
China
Prior art keywords
chinese
japanese
sentence
character
external storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 93104048
Other languages
English (en)
Other versions
CN1078565A (zh
Inventor
高桥忠雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of CN1078565A publication Critical patent/CN1078565A/zh
Application granted granted Critical
Publication of CN1108572C publication Critical patent/CN1108572C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明参照汉语知识数据库外存储器,把构成输入的汉语句子的汉语单词翻译成日语单词。并把输入的构成日语句子的日语单词翻译成汉语单词。参照日语词典外存储器,对构成日语句子的日语单词赋与词类。按照赋与日语单词的词类,变换构成日语句子的日语单词的排列,使之符合日语语法或汉语语法。在由词类排列变换装置变换排列的日语句子单词群之间插入连接词或者删除输入的日语语句单词群之间的连接词。

Description

汉语和日语的双向机械翻译机
技术领域
本发明涉及汉语译成日语或日语译成汉语的双向机械翻译机。
背景技术
已有的双向机械翻译方式,有情报处理学会出版的杂志“情报处理”(1985年VOL.26.NO.10)发表的英语和日语的双向机械翻译方式。
日本国特许出愿平1-258245(日本公开特许公报特开平3-119473)中提出了汉语译成日语的机械翻译方式,日本国特许出愿平1-242909(日本公开特许公报特开平3-102568)中提出了日语译成汉语的机械翻译方式。日本国特许出原昭62-192329等提出了可以用罗马字母及数字从键盘输入汉语的汉语输入装置(汉语文字处理机)。
上述已有的双向机械翻译是以英语和日语为基本的方式,不能直接地用于汉语和日语的双向机械翻译中。因为汉语语法和英语语法之间有差异,所以不适用于汉语和日语的双向机械翻译中。
此外,采用汉语译成日语的机械翻译和日语译成汉语的机械翻译这二种翻译方式进行汉语和日语间的双向机械翻译时,两种方式必需会分别重复,在计算机数量及设备经费方面造成浪费。用于汉语和日语之间的双向电话会话等机械翻译方式时,往电话线上连接实现该机械翻译的装置方面上还存在着作业较烦杂等问题。
发明内容
本发明的目的是提供一种汉语和日语的双向机械翻译机,它能便利地进行汉语和日语间的双向机械翻译,而且在实现汉语和日语间的双向机械翻译时,无需重复地设置日语译成汉语和汉语译成日语两套机械翻译机,节省了计算机数量和设备费用。
此外,本发明的另一目的是提供一种很容易地连接到电话线上实现机械翻译的双向机械翻译机,该翻译机在汉语和日语间的双向电话会话适用机械翻译机(会话机械翻译机)时,不必象从前那样分别地接到汉语译成日语的机械翻译机和日语译成汉语的翻译机上,因此,往电话线上连接实现该机械翻译的装置的连接作业很方便。
为实现本发明的目的,本发明的汉语和日语双向机械翻译机包括以下装置:
输入汉语句子的汉语输入装置和输入日语句子的日语输入装置;
汉语句法分析装置,对符合汉语语法的汉语句子和符合日语语法的汉语句子进行句法分析;
句型变换装置,将上述汉语句法分析装置所分析的、符合汉语语法的汉语句子变换为符合日语语法的汉语句子,并将上述汉语句法分析装置所分析的、符合日语语法的汉语句子变换为符合汉语语法的汉语句子;
汉语知识数据库外存储器,其中容纳有汉语单词文字代码、对应与汉语单词文字代码的拼音·声调文字代码及日语文字代码;
单词翻译机,它参照上述汉语知识数据库外存储器,把由上述汉语输入装置输入的汉语句子中的汉语单词翻译成日语单词,并且把由上述日语输入装置输入的日语句子中的日语单词翻译成汉语单词;
容纳有日语单词及其词类的日语词典外存储器;
参照上述日语词典外存储器,对构成日语句子的日语单词赋予词类的日语词类赋予装置;
词类排列变换装置,按照赋予的日语单词的词类,变换日语句中的单词排列顺序,使其符合日语语法或汉语语法;
连接词插入·删除装置,它在由上述词类排列变换装置变换装置变换了日语单词排列、使之符合日语语法的日语句子单词群之间插入连接词,或者删除由上述日语输入装置输入的日语句子单词群间的连接词;
还设有容纳汉语文字代码和拼音·声调文字代码和汉语文字型式的汉语文字型式外存储器、容纳日语文字代码和日语文字型式的日语文字型式外存储器和容纳罗马字母·数字·符号文字型式及其文字代码的罗马字母·数字·符号文字型式外存储器、容纳汉字文字代码和拼音·声调文字代码和用语文字代码的汉语用语外存储器及设有容纳汉字文字代码和平假名·片假名文字代码和日语文字型式的日语用语外存储器;并且
设有日语输出装置和汉语输出装置,日语输出装置利用上述日语文字型式外存储器和罗马字母·数字·符号文字型式外存储器输出从汉语译成为日语的日语文字,汉语输出装置利用上述汉语文字型式外存储器和罗马字母·数字·符号文字型式外存储器输出从日语译成汉语的汉语汉字。
附图说明
图1是表示本发明双向机械翻译机一个实施例结构的方框图。
图2是说明由图1所示双向机械翻译机将汉语译成日语的机械翻译处理的程序方框图。
图3是说明由图1所示双向机械翻译机将日语译成汉语的机械翻译处理的程序方框图。
图4是表示图1中所示的汉语知识数据库外存储器一部分内容图。
图5是表示图1中所示的汉语知识数据库外存储器一部分内容图。
图6是表示图1中所示的汉语知识数据库外存储器一部分内容图。
图7是表示图1中所示的汉语知识数据库外存储器一部分内容图。
图8是表示图1中所示的汉语文字型式外存储器一部分内容图。
图9是表示图1中所示的罗马字母·数字·符号文字型式外存储器一部分内容图。
图10是表示图1中所示的汉语用语外存储器一部分内容图。
图11是表示图1中所示的日语用语外存储器一部分内容图。
图12是表示图1中所示的日语文字型式外存储器一部分内容图。
图13是表示图1中所示的日语文字型式外存储器一部分内容图。
图14是表示图1中所示的日语文字型式外存储器一部分内容图。
图15是表示汉语语法中基本句型种类图。
图16是表示汉语语法中惯用句型图。
图17是表示在将汉语译成日语时,把拼音符号及声调符号变换为汉语文字代码进行处理图。
图18是表示由汉语输入装置作汉语文字代码检索处理的程序方框图。
图19是表示从汉语文字代码变换为汉语汉字处理过程的程序方框图。
图20是表示汉语句法分析装置备有的一部分词类·单词表图。
图21表示由汉语句法分析装置作的句法分析处理图。
图22是表示不由汉语句法分析装置作句法分析处理图。
图23是表示汉语和日语在句型方面的文法差异图。
图24是表示由单词翻译机将汉语文字代码变换为日语文字代码的转换处理图。
图25是表示汉语和日语在词类排列方面的文法差异图。
图26是说明由连接词插入·删除装置作连接词的插入处理图。
图27是表示在汉语译成日语的机械翻译中形成的日语文字代码例子图。
图28是表示在日语译成汉语的机械翻译中由日语输入装置输入的日语文字代码例子图。
图29是表示由日语输入装置将日语文字代码变换为日语汉字代码的转换处理图。
图30是由连接词插入·删除装置作连接词删除处理的说明图。
图31表示日语和汉语在词类排列方面的文法差异图。
图32是表示由单词翻译机将日语文字代码变换汉语文字代码的转换处理图。
图33是表示在日语译成汉语的机械翻译中由汉语句法分析装置作句法分析处理图。
图34是表示在日语译成汉语的机械翻译中日语和汉语在句法方面的文法差异图。
图35是表示在日语译成汉语的机械翻译中形成的汉语文字代码例子图。
图36是表示汉语声音输出装置结构的方框图。
图37是程序方框图,表示对于图36中所示的汉语声音输出装置的声音信号存储部,进行汉语声音信号和拼音、声调符号的存储处理程序。
图38是表示图36中所示的汉语声音输出装置声音信号存储部的一部分存储内容图。
具体实施方式
以下,参照附图详细说明本发明的最佳实施例,图1是表示本发明一个实施例的汉语和日语双向机械翻译机结构的方框图,本双向机械翻译机由以下装置构成:汉语输入装置1、汉语句法分析装置2、句型变换装置3、单词翻译机4、日语词类赋予装置5、词类排列变换装置6、连接词插入·删除装置7、日语输出装置8、日语输入装置9、汉语输出装置10、汉语知识数据库外存储器11、汉语文字型式外存储器12、罗马字母·数字·符号文字型式外存储器13、汉语用语外存储器14、日语用语外存储器15、日语文字型式外存储器16和日语词典外存储器17。
汉语输入装置1,例如已由日本国特许出愿昭62-192329号等中揭示的汉语文字处理机实现,该汉语输入装置1是用罗马字母将汉语的拼音符号和用数字将声调记号通过键盘(例如JIS规格的标本键盘)输入的。
日语输出装置8及日语输入装置9,由日语方字处理机实现。日语输出装置8是利用罗马字母·数字·符号文字型式外存储器13和日语文字型式外存储器16来输出日语(显示或打印)。
汉语输出装置10通过将汉语文字型式外存储器12和罗马字母·数字·符号文字型外存储器13作为附加词典使用并输出汉语汉字(汉语简体汉字)的日语文字处理机等实现。
日语词典外存储器17是参照日语的国语词典作成的。即由“索引”、“汉字”、“词意”、“词类”等构成。
图2是程序方框图,说明本实施例的双向机械翻译机将汉语译成日语的机械翻译处理过程(图2中,表示着后述的汉语译成日语的机械翻译处理具体例中处理对象句子的变换形态)。
图3是程序方框图,说明本实施例的双向机械翻译机将日语译成汉语的机械翻译处理过程(图3中,表示着后述的日语译成汉语的机械翻译处理具体例中处理对象句子的变换形态)。
图4至图7是表示汉语知识数据库外存储器11的一部分内容的图(但也包括上述以外的内容)。汉语知识数据库外存储器11由汉语单词文字代码(表示汉语单词的汉语文字代码)、拼音(相当于日语的“发音”,其汉语标记参见图4)/声调(四声)文字代码及日语意思的文字代码(表示日语意思的日语文字代码)构成。为了更便于理解图的内容,在图4至图7中,列出了汉语单词文字代码中的汉语单词“阿”、日语意思文字代码中的日语“怎样”等。
图8表示汉语文字型式外存储器12的一部分内容。汉语文字型式外存储器12由文字代码(汉语文字代码)和拼音/声调文字代码和汉语文字型式组成。
图9表示了罗马字母·数字·符号文字型式外存储器13的一部分内容。罗马字母·数字·符号文字型式外存储器13由文字代码和罗马字母/数字/符号文字型式组成。
图10表示了汉语用语外存储器14的一部分内容。汉语用语外存储器14由汉字文字代码、拼音/声调文字代码和用语例文字代码组成。
图11表示了日语用语外存储器15的一部分内容。日语用语外存储器15由汉字文字代码、平假名/片假名文字代码和日语用语文字型式组成。
图12至图14表示了日语文字型式外存储器16的一部分内容。日语文字型式外存储器16由文字代码(日语文字代码)和日语文字型式(平假名及片假名)或日语汉字文字型式组成。
下面,说明具有上述结构的本实施例汉语、日语双向机械翻译机的动作。第一,先说明汉语译成日语时的机械翻译处理动作。用图2所示的具体例句进行说明。从汉语输入装置1(汉语文字处理机)的键盘输入图2中①所示的[WO3ΔCONG2ΔSHANG4ΔHAI3ΔDAO4ΔBEI3ΔJIING1ΔZUO4ΔLEΔΔFEI1ΔJI1]。即,输入用汉语拼音符号(罗马字母)及声调符号(数字)表示的汉语句子。其中,数字“1”表示声调符号的“1声”,“2”表示“2声”,“3”表示“3声”,“4”表示“4声”。“Δ”是空白表示“轻声”。关于“轻声”也可以输入数字“5”代替“Δ”。
上述的汉语拼音符号(罗马字母)及声调符号(数字)输入后,参见图4至图7所示的汉语知识数据库外存储器11、图8所示的汉语文字型式外存储器12、图9所示的罗马字母·数字·符号文字型式外存储器13及图10所示的汉语用语外存储器14,汉语输入装置1将该输入的句子变换为如图17所示的那样的汉语文字代码。图17中括号内的单词,表示对应于汉语文字代码的汉语单词。
将用拼音符号及声调符号输入的句子变换为汉语文字代码时,采用下述方式检索汉语知识数据库外存储器11。首先,从输入句子的开头检索到第三个字,如检索不出,再从头开始检索到第二个字,如检索到了,则显示该检索到的汉语文字代码(汉字)。如检索不到,则再检索句子的头一个字,显示出检索到的汉语文字代码(汉字)。另外,如果检索头三个字时检索到了,则接着检索头四个字,如头四个字检索不到,则显示检索头三个字的结果。如果检索头四个字检索到了,则接着检索头n(n≥5)个字,如此,进行同样的反复处理。
图18的程序方框图表示对图2的①中所示的输入句子进行实际检索时的处理过程。例如,用WO3ΔCONG2ΔSHANG4检索时,检索不到一致的汉语文字代码,接着用WO3ΔCONG2进行检索,仍然未检索到一致的汉语文字代码,因此,就用WO3检索,这时检索到了一致的汉语文字代码(Cn36 Cm36)。
参照图8所示的汉语文字型式外存储器12、图9所示的罗马字母·数字·符号文字型式外存储器13,将上述那样用汉语知识数据库外存储器11检索到的汉语文字代码变换为汉语汉字后进行显示,该处理过程由图19的程序方框图表示。
汉语句法分析装置2对图2中的②表示的汉语句子进行句法分析,该汉语句子是根据汉语文字代码表示的。
作为由该汉语句法分析装置2而进行的句法分析所涉及的汉语语法中的句型(句法构造)的主要形态,有如图15所示的各种句型。这些汉语句型,大致可分为三大类,即简单句、主从复合句及结合形复合句。如图1 5所示,由汉语句法分析装置2所分析的汉语句型,可分成为一般句型(使用最多的句型)、宾语在动词前面的句型、被动句型、能动句型、疑问句型、否定句型、比较句型等。这里,作为如图15所示的句型而能进行句法分析的占全体的90%左右,对惯用句等不能作句法分析,因此,在汉语句法分析装置2中,予先存储着这样的惯用句等知识。另外,作为惯用句的例子还包括如图16所示表示自然现象内容的句子。
下面,说明汉语句法分析装置2的句法分析方法。
图15所示的一般句型有以下五种型式:
(1)主语+(是)+宾语+。
(2)主语+动词+宾语+。
(3)主语+动词+名词修饰语+宾语+。
(4)主语+地点修饰语+动词+宾语+。
(5)时间修饰语+主语+动词修饰语+动词+名词修饰语+宾语+。
汉语句法分析装置2设有图20所示的汉语单词的词类·单词表。图20中表示着汉语单词的一例,实际上还有许多图示以外的单词。
汉语句法分析装置2参照上述的词类·单词表,对图2的②所示的汉语句子“我从上海到北京坐了飞机”进行分析。图21表示分析处理的程序方框图中。“我”相当于主语,“从上海到北京”相当于地点修饰语,“坐了”相当于动词。“坐了”中的“了”是动词接尾词,表示“坐”的过去时态。“飞机”相当于宾语。从以上分析结果可以知道,图2的②中所示的“我从上海到北京坐了飞机”这句话相当于一般句型中的(4),即主语+地点修饰语+动词+宾语+。这样,对汉语句子进行句法分析。
图22模式化地表示了汉语句法分析装置2对图2的②中所示汉语句子的句法分析。通过该句法分析,可以看到该汉语句子是由主语、状语、动词及宾语诸成分构成。
然后,句型变换装置3根据上述的句法分析,将汉语句型变换为适合于日语语法的句型(适当地变换句子各成分的顺序)。
汉语和日语在句型方面的语法差异,主要是宾语和动词的位置关系不同,图2中例句的句法,有图23所示的关系。句型变换装置3按照该规则,将动词和宾语交换位置,把图2中的③所示的汉语句子变换为图2中的④所示的汉语句子。把汉语与日语的句型差异部分变换为适合于日语语法。
下面,更详细地进行说明。由汉语句法分析装置2对汉语句子“我从上海到北京坐了飞机”分析的结果,可以知道,该句相法于一般句型之(4),与对应于该一般句型(4)的日语句子(主语+地点修饰语+宾语+动词)相比较,是动词和宾语的顺序不同。在句型变换装置3内,记载着每种汉语句型与日语句型相异点规则。句型变换装置3按照该规则,把汉语句型变换为适合日语语法的句型。
上述变换后,如图24所示,单词翻译机4参照汉语知识数据库外存储器11将构成该汉语句子(图2中的④所示汉语句子)的各汉语单词翻译成日语单词(从汉语文字代码变换为日语文字代码)。
日语词类赋予装置5参照汉语知识数据库外存储器11,对上述那样形成的为日语单词赋与词类。定出各日语单词的词类。
图2中的⑥所示的日语句子中,赋予“我”的词类是名词,赋予“从”的词类是格助词,赋予“上海”的词类是名词,赋予“到”的词类是副助词,赋予“北京”的词类是名词,赋予“飞机”的词类是名词,赋予“坐了”的词类是动词。
词类排列变换装置6按照上述所赋予的词类,变换各日语单词的排列,使之适合于日语语法。汉语和日语在词类排列方面的语法差异,主要是如图25所示那样的助词与名词的排列规则,词类排列变换装置6按照该规则,变换日语单词的排列,使之成为图2中的⑦所示的日语句子。
连接词插入·删除装置7按照连接关系和修饰关系的有关资料,在上述被变换排列的日语句子中的单词群(相当于汉语句法分析装置2的句型分析所辨认的汉语句子成分的单词集合,图2例句中的“我”、“从上海到北京”、“飞机”、“坐了”各单词群)之间,插入连接词(连用修饰语)(见图26,图26中的“”表示不要连接词),这样,就形成了如图27所示的由日语文字代码组成的日语句子(图2的⑧中所示的日语句子)。即,对于由词类排列变换装置6所排列变换的日语句子单词群,从头开始边搜索边决定连用修饰语并插入。
此外,连接词插入·删除装置7,通过对日语句子的反复分析和学习,收集和积蓄日语句子中有关单词间的连接关系和修饰关系的资料,这就可以翻译成高质量的日语。在后述的由日语译成汉语的机械翻译处理过程中,如后所述,进行连接词的删除。汉语译成日语的机械翻译处理中的学习也可以用到日语译成汉语的机械翻译处理中,日语译成汉语的机械翻译处理中的学习也能利用汉语译成日语的机械翻译处理中。即,把在日语句子单词群之间插入连接词这一过程的学习,作为有关连接关系和修饰关系的资料收集、积蓄起来,在删除该连接词时,利用有关该连接关系和修饰关系的资料。同样,把删除日语句子单词群间的连接词这一过程的学习,作为有关连接关系和修改关系的资料收集、积蓄起来,在插入该连接词时,利用有关该连接关系和修饰关系的资料。
日语输出装置8按照这样形成的由日语文字代码组成的日语句子(图2中的⑧所示的日语句子),参照罗马字母·数字·符号文字型式外存储器13和图12~图14所示的日语文字型式外存储器16,输出图2中⑨所示的“我从上海到北京坐了飞机”这样的日语句子[日语文字(日语文字型式)的日语句子]。
如以上所述那样,若根据汉语拼音符号及声调符号(这里,汉语拼音符号和声调符号分别由罗马字母及数字表示)输入汉语句子,就可以进行将输入的汉语句子译成日语的机械翻译。
第二,再对日语译成汉语的机械翻译处理动作进行说明。这儿根据图3所示的具体例句说明动作。
在日语输入装置9(日语文字处理机)的键盘(一般的日语键盘)上,用平假名输入图3中的①所示的“我从上海到北京坐了飞机”这个句子,参照图9所示的罗马字母·数字·符号文字型式外存储器13和图12~图14所示的日语文字型式外存储器16,把日语输入装置9的该输入句子变换为图28所示的日语文字代码。日语输入装置9再参照图11所示的日语用语外存储器15,把图28所示的日语文字代码变换为图29所示的日语汉字文字代码。这样,就可以输出图3中的②所示的日语句子(日语汉字组成的日语句子)。
连接词插入·删除装置7,删除图3中的②所示的日语句子中的连接词(连用修饰语),形成图3的③所示的日语句子。在日语句子中必须有连用修饰语,而在汉语句子中就不一定需要,所以要删除因日语语法所需要而加上的连用修饰语。这里,是删除与日语输入装置9输入的日语句子成分相当的各单词集合的单词群(图3的例中,“我”、“从上海到北京”、“飞机”、“坐了”)间的连接词(连用修饰语)。其处理内容如图30所示。图30中的“”表示不要连接词。这样就形成了图3中的③所示的日语句子。此外,连接词插入·删除装置7也利用在上述汉语译成日语的机械翻译处理中学习的结果,执行上述连接词的删除动作。
然后,日语词类赋予装置5参照日语词典外存储器17,对构成上述那样形成的日语句子(图3中的③所示日语句子)的名日语单词赋予日语词类。即,定出各日语单词的词类。
图3中的④所示日语句子中,赋予“我”的词类是名词,赋予“上海”的词类是名词,赋予“从”的词类是格助词,赋予“北京”的词类是名词,赋于“到”的词类是副助词,赋予“飞机”的词类是名词,赋予“坐了”的词类是动词。
词类排列变换装置6根据日语句子与汉语句子词类排列的有关语法规则,按照上述赋予的词类,变换各日语单词的排列使之符合汉语语法。日语句子和汉语句子在词类排列方面的语法差异,主要如图31所示,在于名词和助词的排列规则不同。词类排列变换装置6按照该规则,变换日语单词的排列,使之成为图3中的⑤所示的日语句子。
单词翻译机4与上述被变换排列的日语句子(图3中的⑤所示的日语句子)有关,参照汉语知识数据库外存储器11,如图32所示,把构成该日语句子的各日语单词翻译成汉语单词,将日语文字代码变换为汉语文字代码。
汉语句法分析装置2对用该汉语文字代码表示的图3中⑥所示的汉语句子进行句法分析。
由汉语句法分析装置2分析的汉语语法句型(语法构造)的主要形式,有如前所述图15所示的基本句型。不能用图15的基本句型来分析的句型,有图16所示的惯用句型等。
图33模式化地表示了由汉语句法分析装置2对图3中的⑥所示的汉语句子进行的句法分析。通过该句法分析可知,该汉语句子是由主语、状语、动词及宾语诸成分组成的句型。
然后,句型变换装置3按照上述的句法分析,将汉语句子(在此阶段,还是符合日语语法的句型)变换于符合汉语语法的句子。即,适当地变换句子成分的顺序。日语和汉语在句子方面的语法差异,主要在于宾语和动词的关系,图3例句的句型,有图34所示关系。
句型变换装置3按照该关系(规则),把图3中的⑦所示的汉语句子变换为图3中的⑧所示的汉语句子(图35所示的汉语文字代码组成的汉语句子)。也就是说,将日语与汉语的句子中的不同部分变换成符合汉语语法。
汉语输出装置10基于这样形成的由汉语文字代码组成的汉语句子(图3的⑧所示的汉语句子),参照汉语文字型式外存储器12及罗马字母·数字·符号文字型式外存储器13,输出与各汉语文字代码相对应的汉语文字型式(构成图3中的⑨所示汉语句子的汉语文字)。
如以上所述,用“平假名输入”的方式输入日语句子,可进行将该输入的日语译成汉语的机械翻译处理。
将图2所示的汉语译成日语的机械翻译处理与图3所示的日语译成汉语的机械翻译处理合并起来(这种情况下,实际双方机械翻译处理的装置几乎是共同的),就可以实际汉语与日语间的双向机械翻译。
另外,至汉语输入装置1上附加识别汉语声音的功能、在日语输出装置8上附加输出日语声音的功能、在日语输入装置9上附加识别日语声音的功能、在汉语输出装置10上附加输出汉语声音的功能、在汉语输出装置10上附加输出汉语声音的功能,就能形成一个可进行汉语、日语间双向会话机械翻译的双向会话机械翻译系统。
这里,对一例输出汉语声音的装置进行说明。如图36所示,该输出汉语声音的装置上传声器等的声音输入部100、键盘等的拼音·声调输入部110、声音存储元件(LSI)构成的声音信号存储部120、声音信号读出部130、放大部140、喇叭150、拼音·声调输出部160、从翻译成的汉语中只取出拼音·声调符号的拼音·声调符号取出控制部170构成。
现在说明上述汉语声音输出装置对实施例中翻译的例句“我从上海到北京坐了飞机”用汉语发声时的动作。
首先,如力37所示,在由汉语的韵母和声母组合而成的拼音(参照北京语音表)中加声调并发声,并从声音输入部100输入,将该发音情报(声音信号情报)存储在声音信号存储部120内。然后,从拼音·声调输入部110输入与存储的发音情报相同发音的拼音符号和声调符号,并存储在声音信号存储部120内。这样,如图38所示,对应于例句“我从上海到北京坐了飞机”的拼音符号和发音情报(声音信号情报)就被存储在声音信号存储部120中。
从翻译成汉语的句子“我从上海到北京坐了飞机”的资料中,拼音·声调符号取出控制部170只取出拼音·声调符号,从拼音·声调输出部160输出到声音信号存储部120内。这样,声音信号读出部130从声音信号存储部120中读出与拼音·声调输出部160输出的拼音·声调符号一致的发音情报,由放在部140放大,通过喇叭150发音。在上述例句中,WAN2、JI4、HAO4(完成记号)是表示句子结束的符号,在声音输出时要删除,也具有使之不发音的功能。
显然,在本发明中还可以作出上述实施例以外的种种改变,在本发明精神及范围内的各种改变例,均在本发明的权利要求范围内。
如以上所述,根据本发明可以实现汉语与日语间的双向机械翻译。这样,在实际汉语和日语间的双向机械翻译时,就不必重复地设置日语译成汉语的机械翻译机和汉语译成日语的机械翻译机。能节省计算机数量和设备经费。由于不必要重复设置汉语与日语间双向机械翻译所需的设备等,当使用汉语和日语间双向电话会话机械翻译机(会话翻译机)时,就不是象以前那样分别地接到日语译汉语的机械翻译机和汉语译日语的机械翻译机上,而只要接到在电话线上的执行该机械翻译的装置上即可。操作很方便。
在汉语输入装置上附加识别汉语声音的动能、在汉语输出装置上附加输出汉语声音的功能、在日语输出装置上附加输出日语声音的功能、在日语输入装置上附加识别日语声音的功能,就可以很容易地实现汉语和日语间的双向会话机械翻译,通过把双向会话机械翻译系统与进行电话交换的电子交换机系统结合起来,日本人和中国人就可以很方便地用自己的母语进行电话会话。

Claims (6)

1、一种汉语和日语间的双向机械翻译机,其特征在于,包括以下装置:
输入汉语句子的汉语输入装置和输入日语句子的日语输入装置;
对符合汉语语法的汉语句子和符合日语语法的汉语句子进行句法分析的汉语句法分析装置;
将上述汉语句法分析装置分析的、符合汉语语法的汉语句子变换为符合日语语法的汉语句子、并且将上述汉语句法分析装置分析的、符合日语语法的汉语句子变换为符合汉语语法的汉语句子的句型变换装置;
容纳汉语单词文字代码、与汉语单词文字代码对应的拼音·声调文字代码及日语文字代码的汉语知识数据库外存储器;
单词翻译装置,它参照上述汉语知识数据库外存储器,把构成由上述汉语输入装置输入的汉语句子的汉语单词翻译成日语单词,并且,把构成由上述日语输入装置输入的日语句子的日语单词翻译成汉语单词;
容纳有日语单词及其词类的日语词典外存储器;
参照上述日语词典外存储器,对构成日语句子的日语单词赋与词类的日语词类赋与装置;
按照赋与的日语单词为词类,变换构成日语句子的日语单词的排列,使之符合日语语法或汉语语法的词类排列变换装置;
连接词插入·删除装置,它在由上述词类排列变换装置变换了日语单词排列、使之符合日语语法的日语句子单词群之间插入连接词,或者删除由上述日语输入装置输入的日语句子单词群间的连接词;
还设有容纳汉语文字代码和拼音·声调文字代码和汉语文字型式的汉语文字型式外存储器、容纳日语文字代码和日语文字型式的日语文字型式外存储器和容纳罗马字母·数字·符号文字型式及其文字代码的罗马字母·数字·符号文字型式外存储器、容纳汉字文字代码和拼音·声调文字代码和用语文字代码的汉语用语外存储器及设有容纳汉字文字代码和平假名·片假名文字代码和日语文字型式的日语用语外存储器;并且
设有日语输出装置和汉语输出装置,日语输出装置利用上述日语文字型式外存储器和罗马字母·数字·符号文字型式外存储器输出从汉语译成为日语的日语文字,汉语输出装置利用上述汉语文字型式外存储器和罗马字母·数字·符号文字型式外存储器输出从日语译成汉语的汉语汉字。
2、如权利要求1所述的汉语和日语的双向机械翻译机,其特征在于,上述汉语句法分析装置设有汉语词类和汉语单词对应的词类·单词表,按照该词类·单词表进行句法分析。
3、如权利要求1所述的汉语和日语的双向机械翻译机,其特征在于,上述的连接词插入·删去装置积蓄有关插入日语句子单词群间的连接词的情报,在对该连接词进行删除处理时利用,并积蓄有关删除的日语句子单词群间的连接词的情报,在对该连接词进行插入处理时利用。
4、如权利要求1所述的汉语和日语的双向机械翻译机,其特征在于,上述汉语输入装置用拼音·声调文字代码输入汉语句子,并将输入的该拼音·声调文字代码变换成汉语单词文字代码。
5、如权利要求1所述的汉语和日语的双向机械翻译机,其特征在于,设有由声音将汉语输出的汉语声音输出装置。
6、如权利要求5所述的汉语和日语的双向机械翻译机,其特征在于,上述汉语声音输出装置由声音输入部、拼音·声调输入部、声音信号存储部、从汉语句子中只取出拼音·声调符号的拼音·声调符号取出控制部、声音信号读出部和喇叭构成,所说的声音信号存储部存储从上述声音输入部输入的汉语声音信号和从上述拼音·声调输入部输入的汉语拼音·声调符号,所说的声音信号读出部是从上述声音信号存储部中读出与上述拼音·声调符号取出控制部取出的拼音·声调符号一致的声音信号,喇叭是将上述声音信号读出部读出的声音信号作为声音输出。
CN 93104048 1992-03-23 1993-03-23 汉语和日语的双向机械翻译机 Expired - Fee Related CN1108572C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP95927/1992 1992-03-23
JP4095927A JPH05266069A (ja) 1992-03-23 1992-03-23 中国語と日本語との間の双方向機械翻訳方式
JP95927/92 1992-03-23

Publications (2)

Publication Number Publication Date
CN1078565A CN1078565A (zh) 1993-11-17
CN1108572C true CN1108572C (zh) 2003-05-14

Family

ID=14150911

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 93104048 Expired - Fee Related CN1108572C (zh) 1992-03-23 1993-03-23 汉语和日语的双向机械翻译机

Country Status (2)

Country Link
JP (1) JPH05266069A (zh)
CN (1) CN1108572C (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100437557C (zh) * 2004-02-04 2008-11-26 北京赛迪翻译技术有限公司 基于语言知识库的机器翻译方法与装置

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06314293A (ja) * 1993-04-30 1994-11-08 Nec Corp 電子中日辞典使用検索方式
WO2006090732A1 (ja) 2005-02-24 2006-08-31 Fuji Xerox Co., Ltd. 単語翻訳装置、翻訳方法および翻訳プログラム
CN101131689B (zh) * 2006-08-22 2010-08-18 苗玉水 汉语外语句型转换双向机器翻译方法
CN101441643B (zh) * 2007-11-22 2010-09-22 英业达股份有限公司 一种数字词库的生成系统及其方法
CN102479208B (zh) * 2010-11-26 2016-05-25 青海汉拉信息科技股份有限公司 汉语语音码多样网页信息搜索转换翻译方法
JP5552101B2 (ja) * 2011-09-05 2014-07-16 日本電信電話株式会社 並べ替え規則学習装置、方法、及びプログラム、並びに翻訳装置、方法、及びプログラム
JP5462894B2 (ja) * 2012-01-20 2014-04-02 日本電信電話株式会社 翻訳モデル学習装置、方法、翻訳装置、方法、及びプログラム
JP5924677B2 (ja) * 2012-05-30 2016-05-25 国立研究開発法人情報通信研究機構 機械翻訳装置、機械翻訳方法、およびプログラム
CN103853706B (zh) * 2012-12-06 2017-04-12 富士通株式会社 用于将简体汉语句子转换为繁体汉语句子的方法和设备
JP5800206B2 (ja) * 2013-03-01 2015-10-28 日本電信電話株式会社 語順並べ替え装置、翻訳装置、翻訳モデル学習装置、方法、及びプログラム
JP6846666B2 (ja) * 2017-05-23 2021-03-24 パナソニックIpマネジメント株式会社 翻訳文生成方法、翻訳文生成装置及び翻訳文生成プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01160249A (ja) * 1987-12-17 1989-06-23 Toshiba Corp 翻訳通信方式
JP2888525B2 (ja) * 1988-10-21 1999-05-10 株式会社日立製作所 機械翻訳システムの辞書保守方法
JP2827321B2 (ja) * 1989-09-18 1998-11-25 日本電気株式会社 日本語から中国語への機械翻訳方式
JP3016797B2 (ja) * 1989-10-03 2000-03-06 日本電気株式会社 中国語から日本語への機械翻訳方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100437557C (zh) * 2004-02-04 2008-11-26 北京赛迪翻译技术有限公司 基于语言知识库的机器翻译方法与装置

Also Published As

Publication number Publication date
JPH05266069A (ja) 1993-10-15
CN1078565A (zh) 1993-11-17

Similar Documents

Publication Publication Date Title
CN1140871C (zh) 实现多源文件的音频信号重放的方法和系统
CN1108572C (zh) 汉语和日语的双向机械翻译机
CN100568225C (zh) 文本中数字和特殊符号串的文字符号化处理方法及系统
CN1384940A (zh) 以无模式输入将一种文本形式转换成另一种文本形式的语言输入体系结构
CN1652106A (zh) 基于语言知识库的机器翻译方法与装置
CN1197525A (zh) 交互式语言训练设备
CN1387650A (zh) 对拼写、打字和转换错误具有容错能力的将一种文本形式转换为另一种文本形式的语言输入体系结构
CN101079268A (zh) 进行手语合成与显示的系统和方法
US7072880B2 (en) Information retrieval and encoding via substring-number mapping
KR101794274B1 (ko) 계층적 구문 기반의 통계적 기계 번역에서의 번역규칙 필터링과 목적단어 생성을 위한 방법 및 장치
Tsarfaty Integrated morphological and syntactic disambiguation for modern hebrew
CN1102779C (zh) 中文简繁体字文件转换装置
CN1121015C (zh) 盲人用的汉语智能计算机系统
CN100337232C (zh) 盲汉对照编辑排版方法
CN1679023A (zh) 创建和使用中文语言数据和用户自纠正数据的方法和系统
CN1054219C (zh) 一种汉语拼音输入法及其键盘
CN1144141C (zh) 汉语输入变换处理装置及汉语输入变换处理方法
Joshi et al. A phonemic code based scheme for effective processing of Indian Languages
CN1056457C (zh) 汉语的方块拼音字的电脑输入方法
CN1047678C (zh) 电子汉日辞典编辑检索装置
CN86101508A (zh) 语言计算机
CN1048273A (zh) 袖珍英汉电子字典及使用方法
CN1097244C (zh) 多国语文件处理装置
CN1043490C (zh) 叠词变换方法和汉字变换装置
CN1088210C (zh) 六区五位汉语音节和汉字键盘输入方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20030514

Termination date: 20100323