CN101295298A - 翻译系统、翻译系统的控制方法以及对译数据生成方法 - Google Patents

翻译系统、翻译系统的控制方法以及对译数据生成方法 Download PDF

Info

Publication number
CN101295298A
CN101295298A CNA2008100891994A CN200810089199A CN101295298A CN 101295298 A CN101295298 A CN 101295298A CN A2008100891994 A CNA2008100891994 A CN A2008100891994A CN 200810089199 A CN200810089199 A CN 200810089199A CN 101295298 A CN101295298 A CN 101295298A
Authority
CN
China
Prior art keywords
simple sentence
language
data
translation
sentence data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2008100891994A
Other languages
English (en)
Inventor
高野陆男
白井谕
大岛一纯
小野雅敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Funai Electric Co Ltd
Funai Electric Advanced Applied Technology Research Institute Inc
Original Assignee
Funai Electric Co Ltd
Funai Electric Advanced Applied Technology Research Institute Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Funai Electric Co Ltd, Funai Electric Advanced Applied Technology Research Institute Inc filed Critical Funai Electric Co Ltd
Publication of CN101295298A publication Critical patent/CN101295298A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供一种处理负荷小且翻译精度高的翻译系统、翻译系统的控制方法以及对译数据生成方法。该翻译系统包括:对译数据存储部(32),将与多个第一语言单句数据和多个第二语言单句数据相关联并进行存储,使得对应的第一语言单句和第二语言单句能够对译;以及译文单句数据输出处理部(40),基于与所给予的原文单句对应的原文单句数据,输出与作为原文单句的对译的译文单句对应的译文单句数据。译文单句数据输出处理部(40)接收第一语言原文单句数据,基于接收的第一语言原文单句数据选择存储在对译数据存储部中的第一语言单句数据中的任一个,将与选择的第一语言单句数据相关联的第二语言单句数据作为译文单句数据输出。

Description

翻译系统、翻译系统的控制方法以及对译数据生成方法
技术领域
本发明涉及翻译系统、翻译系统的控制方法以及对译数据生成方法。
背景技术
将一种语言翻译成其他语言的翻译系统的研究正在进行中,开发了各种翻译系统。
但是,因为人们发送的信息的内容和结构多种多样,即使在使用处理能力很高的硬件(计算机等)和庞大的数据库的情况下,也难以实现精度较高的翻译。作为该领域的技术,已知日本特开平9-258776号公报、日本特开平4-54670号公报、长尾真以及其他四名作者的《语言信息处理》p.112-p.113(岩波书店,2004年12月3日)等。
发明内容
本发明的目的是提供一种处理负荷小且翻译精度高的翻译系统、翻译系统的控制方法以及对译数据生成方法。
(1)本发明的翻译系统包括:
对译数据存储部,将与由第一语言表达的多个第一语言单句对应的多个第一语言单句数据和与由第二语言表达的多个第二语言单句对应的多个第二语言单句数据相关联,并对其进行存储,使得对应的上述第一语言单句和上述第二语言单句对译;以及
译文单句数据输出处理部,其基于与所给予的原文单句对应的原文单句数据,输出与成为上述原文单句的对译的译文单句对应的译文单句数据,
上述译文单句数据输出处理部接收与由上述第一语言表达的第一语言原文单句对应的第一语言原文单句数据,基于接收的上述第一语言原文单句数据选择存储在上述对译数据存储部中的上述第一语言单句数据中的任一个,
将与被选择的上述第一语言单句数据相关联的上述第二语言单句数据作为上述译文单句数据输出。
本发明的翻译系统中,以单句单位接收原文,以单句单位输出译文。即,在本发明的翻译系统中,进行单句单位的翻译处理。其中,一般来说,“单句”是指“仅包括一组主语和谓语的关系的句子”。但是在本发明中,“单句”包括比此更广泛的概念。在本发明中,“单句”也可以被看作是“包括多个单词的语句,表示一个意义的语句(归拢在一起的语句)”。即,在本发明中,因为能够对每个表示一个意义的语句进行翻译处理,所以能够正确地传达用户的意图。
此外,在本发明的翻译系统中,基于使第一语言单句数据和第二语言单句数据相关联的译文单句数据,进行单句单位的翻译。因此,根据本发明,能够正确地以单句单位翻译原文。
此外,在本发明的翻译系统中,选择存储在对译数据存储部中的第一语言单句数据,将与选择的第一语言单句数据相关联的第二语言单句数据作为译文单句数据输出。由此,能够以较少的处理负荷输出译文单句数据。
进而,在本发明的翻译系统中,将预先准备的存储在对译数据存储部中的第二语言单句数据作为译文数据输出。因此,能够以自然的语句(没有不协调感的语句)输出作为原文的对译的译文,能够实现顺利的交流。
从而,根据本发明,能够以较少的处理负荷提供能够实现正确反映用户的意图的翻译处理的翻译系统。
(2)在该翻译系统中,
上述译文单句数据输出处理部,
检索上述对译数据存储部,判断在上述对译数据存储部中是否存储有与上述第一语言原文单句数据一致的第一语言单句数据,
在判断为在上述对译数据存储部中存储有与上述第一语言原文单句数据一致的第一语言单句数据的情况下,选择与上述第一语言原文单句数据一致的第一语言单句数据。
从而,能够从存储在对译数据存储部中的第一语言单句数据中选择表示用户输入的原文(原文单句)的第一语言单句数据,并且,在对译数据存储部中存储有与选择的第一语言单句数据相关联的第二语言单句数据,所以将其作为译文数据输出,从而能够输出与正确翻译原文的译文对应的译文数据。
从而,根据本发明,能够提供高精度的翻译系统。
(3)在该翻译系统中,
上述译文单句数据输出处理部,
检索上述对译数据存储部,判断在上述对译数据存储部中是否存储有与表示和上述第一语言原文单句相类似的意义的第一语言单句对应的第一语言单句数据,
在判断为在上述对译数据存储部中存储有与表示和上述第一语言原文单句相类似的意义的第一语言单句对应的第一语言单句数据的情况下,选择与表示和上述第一语言原文单句相类似的意义的第一语言单句对应的第一语言单句数据。
从而,能够从存储在对译数据存储部中的第一语言单句数据中选择表示与用户输入的原文(原文单句)相类似的意义的第一语言单句数据。并且,在对译数据存储部中存储有与选择的第一语言单句数据相关联的第二语言单句数据,所以能够将其作为译文数据输出,从而能够输出与具有和原文类似的意义的译文对应的译文数据。
从而,根据本发明,能够提供高精度的翻译系统。
(4)在该翻译系统中,
还可以包括存储有上述第一语言的词库数据的词库数据存储部,
上述译文单句数据输出处理部基于上述词库数据,判断在上述对译数据存储部中是否存储有与表示和上述第一语言原文单句相类似的意义的第一语言单句对应的第一语言单句数据。
(5)在该翻译系统中,
还可以包括选择候补数据抽取处理部,其将存储在上述对译数据存储部中的上述多个第一语言单句数据中满足所给予的选择候补条件的第一语言单句数据,作为选择候补数据抽出,
上述翻译系统基于上述选择候补数据,使所给予的输出装置输出与作为上述选择候补数据抽出的第一语言单句数据对应的第一语言单句。
由此,能够向用户提示选择候补数据,用户能够选择选择候补数据中的任一个。因此,能够选择与和用户的意图一致的第一语言单句对应的第一语言单句数据。
(6)在该翻译系统中,
上述译文单句数据输出处理部也可以基于用于选择作为上述选择候补数据抽出的第一语言单句数据中的任一个的选择信息,选择作为上述选择候补数据抽出的第一语言单句数据中的任一个。
其中,选择信息可以是用户输入的、用于选择选择候补数据中的任一个的信息。由此,能够选择与和用户的意图一致的第一语言单句对应的第一语言单句数据,能够提供高精度的翻译系统。
(7)在该翻译系统中,
还可以包括选择单句输出处理部,进行在所给予的输出装置中输出与在上述译文单句数据输出处理部中选择的上述第一语言单句数据对应的第一语言单句的处理。
由此,能够将翻译系统认知为原文的语句被用户所认知。因此,能够进行与用户的意图一致的翻译处理。
(8)在该翻译系统中,
可以在上述对译数据存储部中将上述第一语言单句数据分类为多个组,并进行存储,并且
将分类成上述各组的上述第一语言单句数据中的任一个指定为代表数据。
(9)在该翻译系统中,
上述译文单句数据输出处理部可以选择被指定为上述代表数据的上述第一语言单句数据中的任一个。
由此,能够输出通常利用表达方式的译文,容易传达用户的意图。
(10)在该翻译系统中,
可以在上述对译数据存储部中将上述第二语言单句数据分类为多个组并进行存储,并且
将分类成上述各组的上述第二语言单句数据中的任一个指定为代表数据。
(11)在该翻译系统中,
上述译文单句数据输出处理部可以将被指定为上述代表数据的任一个上述第二语言单句数据作为上述译文单句数据输出。
由此,能够输出通常利用表达方式的译文,容易传达用户的意图。
(12)在该翻译系统中,
上述译文单句数据输出处理部,
可以接收与由上述第二语言表达的第二语言原文单句对应的第二语言原文单句数据,基于接收的上述第二语言原文单句数据选择存储在上述对译数据存储部中的上述第二语言单句数据中的任一个,并且
将与选择的上述第二语言单句数据相关联的上述第一语言单句数据作为上述译文单句数据输出。
在本发明中,基于一个对译数据,进行将第一语言翻译为第二语言的处理,和将第二语言翻译为第一语言的处理。换言之,两个翻译系统共用一个对译数据。因此,能够以较少的数据实现双向的翻译处理。
(13)在该翻译系统中,
还可以包括译文单句输出处理部,其基于上述译文单句数据,进行在所给予的输出装置中输出上述译文单句的处理。
(14)在该翻译系统中,
还可以包括输出单位确定处理部,其基于来自外部的信号进行确定上述译文单句的输出单位的处理,
上述译文单句输出处理部基于确定的输出单位,连续输出与多个译文单句数据对应的多个译文单句。
(15)在该翻译系统中,还可以包括:
第二对译数据存储部,将上述多个第二语言单句数据和与由第三语言表达的多个第三语言单句对应的多个第三语言单句数据相关联,并对其进行存储,使得对应的上述第二语言单句和上述第三语言单句对译;以及
第二译文单句数据输出处理部,其接收从上述译文单句数据输出处理部作为上述译文单句数据输出的上述第二语言单句数据,检索上述第二对译数据存储部,进行将与接收的上述第二语言单句数据相关联的上述第三语言单句数据作为第二译文单句数据输出的处理。
根据本发明,利用使第一语言单句数据与第二语言单句数据相关联的对译数据(第一对译数据),和使第二语言单句数据与第三语言单句数据相关联的第二对译数据,将由第一语言表达的语句翻译为由第三语言表达的语句。即,根据本发明,通过第二语言单句(第二语言单句数据),将第一语言单句翻译为第三语言单句。因此,不需要另外准备使第一语言单句数据和第三语言单句数据直接关联的对译数据,能够实现第一语言和第三语言间的翻译处理。由此,根据本发明,能够提供以较少的对译数据,实现精度较高的将一个语言翻译为多个语言的多语言翻译的翻译系统。
特别的,在本发明中,包括在第一对译数据中的第二语言单句数据和包括在第二对译数据中的第二语言对译数据可以是同一数据。由此,能够使第一语言单句数据和第三语言单句数据相关联,使得对应的单句能够对译,从而,能够高精度地将由第一语言表达的原文翻译为第三语言。其中,第二语言也可以称为桥语言。
(16)在该翻译系统中,
还可以包括第二译文单句输出处理部,其基于上述第二译文单句数据,进行用于在所给予的输出装置中输出与上述第二译文单句数据对应的第二译文单句的处理。
(17)在该翻译系统中,
还可以包括原文单句输出处理部,其基于上述原文单句数据,进行用于在所给予的输出装置中输出上述原文单句的处理。
(18)在该翻译系统中,
还可以包括机械翻译处理部,其判断上述原文单句数据是否满足规定的机械翻译处理条件,在上述原文单句数据满足上述机械翻译处理条件的情况下,对所述原文单句数据进行所给予的机械翻译处理。
(19)在该翻译系统中,
还可以包括原文单句数据输出部,其基于从外部输入的、表示原文语句的原文语句数据,输出所述原文单句数据,
所述原文单句数据输出部判断上述原文语句是否是单句,
在上述原文语句是单句的情况下,
将上述原文语句数据作为上述原文单句数据输出,
在上述原文语句不是单句的情况下,
分析上述原文语句数据,生成与表示和上述原文语句相同的意义的单句对应的数据并作为上述原文单句数据输出,
上述译文单句数据输出处理部基于从上述原文单句数据输出处理部输出的上述原文单句数据,进行输出上述译文单句数据的处理。
(20)在该翻译系统中,
上述原文单句数据输出部也可以以通过网络获取上述原文语句数据的方式构成。
(21)在该翻译系统中,
上述译文单句数据输出处理部也可以以通过网络获取上述原文单句数据的方式构成。
(22)本发明的翻译系统的控制方法,包括:
准备对译数据存储部步骤,将与由第一语言表达的多个第一语言单句对应的多个第一语言单句数据和与由第二语言表达的多个第二语言单句对应的多个第二语言单句数据相关联,并对其进行存储,使得对应的上述第一语言单句和上述第二语言单句对译;以及
译文单句数据输出处理步骤,其基于与所给予的原文单句对应的原文单句数据,输出与成为上述原文单句的对译的译文单句对应的译文单句数据,
其中,在上述译文单句数据输出处理步骤中接收与由上述第一语言表达的第一语言原文单句对应的第一语言原文单句数据,基于接收的上述第一语言原文单句数据选择存储在上述对译数据存储部中的上述第一语言单句数据中的任一个,并且
将与被选择的上述第一语言单句数据相关联的上述第二语言单句数据作为上述译文单句数据输出。
在本发明的翻译系统的控制方法中,以单句单位接收原文,以单句单位输出译文。即,在本发明的翻译系统的控制方法中,以单句单位进行翻译处理。此外,在本发明的翻译系统的控制方法中,基于使第一语言单句数据和第二语言单句数据相关联的译文单句数据,进行单句单位的翻译。因此,根据本发明,能够对每个表示一个意义的语句进行高精度的翻译处理。
此外,根据本发明,选择存储在对译数据存储部中的第一语言单句数据,将与选择的第一语言单句数据相关联的第二语言单句数据作为译文单句数据输出。由此,能够以较少的负荷输出译文单句数据。
即,根据本发明,能够以较少的处理负荷,提供能够实现正确反映用户的意图的高精度的翻译处理的翻译系统的控制方法。
(23)本发明的对译数据生成方法包括:
准备包括与由第一语言表达的多个第一语言单句对应的多个第一语言单句数据,和与由第二语言表达的多个第二语言单句对应的多个第二语言单句数据,并以对应的上述第一语言单句和上述第二语言单句对译的方式相关联的第一和第二语言对译数据的步骤;以及
对包括在上述第一和第二语言对译数据中的上述第二语言单句数据进行机械翻译处理,生成与由第三语言表达的多个第三语言单句对应的多个第三语言单句数据,以对应的上述第二语言单句和上述第三语言单句对译的方式,使上述第二语言单句数据和上述第三语言单句数据相关联的步骤。
由此,能够有效地生成能够实现多语言翻译的对译数据。特别是能够以共用第二语言单句数据(桥语言单句数据)的方式生成多个对译数据,从而能够生成能够实现高精度的多语言翻译的对译数据。
附图说明
图1是用于说明翻译系统的图;
图2是用于说明翻译系统的图;
图3是用于说明对译数据的图;
图4是用于说明翻译系统的动作的流程图;
图5是用于说明对译数据的图;
图6是用于说明翻译系统的图;
图7是用于说明翻译系统的图;
图8是用于说明翻译系统的图;
图9是用于说明对译数据的生成方法的流程图;以及
图10是用于说明用户终端的一个例子的图。
符号说明
1翻译系统           2翻译系统
3服务器装置         4用户终端
10输入部            20原文单句数据生成处理部
30存储部            32对译数据存储部
34词库数据存储部    40译文单句数据输出处理部
42第一语言单句数据选择处理部
43第二语言单句数据选择处理部
44一致数据检索处理部
46类似意义数据检索处理部
48选择候补数据抽取处理部
50机械翻译处理部    60输出装置
62显示部            64声音输出部
70输出处理部        80操作部
90通信部            100处理部
110原文语句数据     120原文单句数据
140译文单句数据     142选择单句数据
148选择候补数据        150机械翻译数据
160第二译文单句数据    200处理部
232第二对译数据存储部
240第二译文单句数据输出处理部
250存储部              260通信部
具体实施方式
以下参照附图说明应用本发明的实施方式。但是,本发明并不限定于以下的实施方式。此外,本发明还包括将以下的实施方式和变形例自由组合而成的结构。
(第一实施方式)
以下说明适用本发明的第一实施方式的翻译系统1。翻译系统1构成为接收由第一语言(例如日语)表达的原文语句,输出由第二语言(第一语言以外的语言:例如英语)表达的译文语句的翻译装置。图1~图4是用于说明翻译系统1的图。
(1)翻译系统1的结构
首先参照图1~图3说明翻译系统1的结构。
如图1和图2所示,本实施方式的翻译系统1包括输入部10。输入部10是用户输入所给予的语句(原文语句)的装置。其中,原文语句是指作为翻译系统1(翻译装置)翻译对象的语句。输入部10接收用户的原文语句输入操作(动作),输出与原文语句对应的原文语句数据110。
适用于翻译系统1的输入部10无特别限定,能够应用已公知的任一种输入装置(用户接口)。输入部10也可以是用户以文字输入原文语句的装置。此时,输入部10也可以由按钮、操作杆、触摸面板等硬件实现。或者,输入部10也可以是用户以声音输入原文语句的装置。此时,输入部10也可以由已公知的某种麦克风(声音输入装置)实现。
如图1和图2所示,本实施方式的翻译系统1包括原文单句数据生成处理部20。原文单句数据生成处理部20接收原文语句数据110,输出原文单句数据120。其中,原文单句数据120是与原文单句(由单句构成的、作为翻译对象的语句)对应的数据。
此外,一般而言,“单句”被定义为“仅包括一组主语和谓语的关系的句子”。但是,在本发明中,“单句”包括比此更广泛的概念。例如,在日语中存在省略主语(主格)的情况,在本发明中,主语被省略的语句当然也包括在“单句”中。此外,即使是在语法上被分类为“复句”(主句和从句构成的句子)的结构的语句,利用为归拢在一起的惯用句的语句也可以包括在单句中。即,在本发明中,“单句”可以被看作是“包括多个单词的语句,表示一个意义的语句(归拢在一起的语句)”。
原文单句数据生成处理部20判断原文语句(与原文语句数据110对应的语句)是否为单句。换言之,原文单句数据生成处理部20判断原文语句是表示一个意义的语句,还是表示多个意义的语句(包括多个单句的语句:复句)。原文单句数据生成处理部20可以基于原文语句数据110判断原文语句是否为单句。
并且,原文单句数据生成处理部20在原文语句是单句的情况下,将原文语句数据110作为原文单句数据120输出。
例如,原文单句数据生成处理部20接收到与“(私は)風をひいた。”这个原文语句(单句)对应的原文语句数据110时,将其作为原文单句数据120输出。
相反的,原文单句数据生成处理部20在原文语句不是单句的情况下(原文语句是复句的情况,即,原文语句是包括多个意义的语句的情况),基于原文语句数据110,生成与表示和原文语句相同的意义的单句(原文单句)对应的数据,作为原文单句数据120输出。此时,原文单句数据生成处理部20基于原文语句数据110输出一个或多个原文单句数据120。在原文语句能够变换为一个单句的情况下,原文单句数据生成处理部20输出与该一个单句对应的一个原文单句数据120。此外,在原文语句能够变换(分解)为多个单句的情况下,原文单句数据生成处理部20输出与该多个单句对应的多个原文单句数据120。
例如,原文单句数据生成处理部20在接受与“風邪をひいたので、薬を下さい。”这个原文语句(复句)对应的原文语句数据时,输出与“(私は)風邪をひいた。”这个单句对应的原文单句数据120,和与“(私に)薬を下さい。”这个单句对应的原文单句数据120。在该例子中,原文单句数据生成处理部20将一个原文语句数据110分解成两个(多个)原文单句数据120并输出。即,在该例子中,原文单句数据生成处理部20以多个原文单句数据120表示的多个单句相互结合,与原文语句为相同意义的方式,分解原文语句数据110。但是,在原文语句能够变换为一个单句的情况下,原文单句数据生成处理部20可以输出一个原文单句数据120。
而且,在本实施方式的翻译系统1中,原文单句数据生成处理部20能够应用已公知的任一种方法(日本特开平4-54670号公报,长尾真以及其他四名作者的《语言信息处理》(岩波书店,2004年12月3日)等)。
如图1和图2所示,本实施方式的翻译系统1包括对译数据存储部32。对译数据存储部32使与由第一语言表达的多个第一语言单句对应的多个第一语言单句数据和与由第二语言表达的多个第二语言单句对应的多个第二语言单句数据相关联,并对其进行存储,使得相对应的第一语言单句和第二语言单句能够对译。存储在对译数据存储部32中的数据也可以称为对译数据(第一语言和第二语言对译数据)。此时,存储在对译数据存储部32中的对译数据包括与由第一语言表达的多个第一语言单句对应的多个第一语言单句数据,和与由第二语言表达的多个第二语言单句对应的多个第二语言单句数据,是以使对应的第一语言单句和第二语言单句能够对译的方式使第一语言单句数据和第二语言单句数据相关联的数据。
图3表示存储在对译数据存储部32中的单句(第一语言单句和第二语言单句)的一个例子。在本实施方式中,如图3所示,第一语言单句和第二语言单句以能够对译的方式相关联。于是,在对译数据存储部32中,使与图3所示的第一语言单句对应的第一语言单句数据和与第二语言单句对应的第二语言单句数据相关联,并对其进行存储。在本实施方式中,第一语言单句数据和第二语言单句数据也可以是以ASCII编码、JIS编码构成的文本数据。
在本实施方式中,对译数据存储部32可以构成为固定在翻译装置主体上的存储装置。或者,对译数据存储部32也可以由能够从翻译装置主体卸下的信息存储介质实现。
如图1和图2所示,本实施方式的翻译系统1也可以包括词库数据存储部34。此处,词库数据存储部34是指存储有第一语言的词库数据的存储装置。词库数据存储部34可以是固定在翻译装置主体上的存储装置,也可以由能够从翻译装置主体卸下的信息存储介质实现。
此外,第一语言的词库数据是指将各种第一语言的语句按照意义上的类似进行分类、排列的数据。第一语言的词库数据也可以是多个名词、动词、形容词、副词、助词分别按照类似意义单位进行分类的数据。
如图1和图2所示,本实施方式的翻译系统1包括译文单句数据输出处理部40。译文单句数据输出处理部40基于与所给予的原文单句对应的原文单句数据120,输出与作为原文单句的对译的译文单句对应的译文单句数据140。译文单句数据输出处理部40基于原文单句数据120选择存储在对译数据存储部32中的第一语言单句数据中的任一个,将与选择的第一语言单句数据相关联的某个第二语言单句数据作为译文单句数据输出。以下详细说明译文单句数据输出处理部40。
如图1所示,译文单句数据输出处理部40包括第一语言单句数据选择处理部42。第一语言单句数据选择处理部42基于表示由第一语言表达的原文单句的第一语言原文单句数据(原文单句数据120),选择存储在对译数据存储部32中的第一语言单句数据中的任一个。由第一语言单句数据选择处理部42选择的第一语言单句数据也可以称为选择单句数据142。
本实施方式中,如图1所示,第一语言单句数据选择处理部42也可以包括一致数据检索处理部44。一致数据检索处理部44检索对译数据存储部32,判断在对译数据存储部32中是否包括与第一语言原文单句数据一致的数据(同一数据)。并且,第一语言单句数据选择处理部42在对译数据存储部32中包括与第一语言原文单句数据一致的数据(同一数据)的情况下,选择该一致的第一语言单句数据。
此外,在本实施方式中,如图1所示,第一语言单句数据选择处理部42也可以包括类似意义数据检索处理部46。类似意义数据检索处理部46检索对译数据存储部32,判断在对译数据存储部32中是否包括与表示和第一语言原文单句相类似的意义的第一语言单句对应的第一语言单句数据(类似意义数据)。并且,第一语言单句数据选择处理部42在对译数据存储部32中包括与表示和第一语言原文单句相类似的意义的第一语言单句对应的第一语言单句数据(类似意义数据)的情况下,选择该类似意义数据。
类似意义数据检索处理部46例如在输入“ワイシヤツはありますか。”这个第一语言原文单句的情况下,可以将与存储在对译数据存储部32中的“シヤツはありますか。”这个第一语言单句对应的第一语言单句数据判断为类似意义数据。此外,类似意义数据检索处理部46在输入“これを着てもいいですか。”这个第一语言原文单句的情况下,可以将与存储在对译数据存储部32中的“これを試着してもいいですか。”这个第一语言单句对应的第一语言单句数据判断为类似意义数据。此外,类似意义数据检索处理部46在输入“このカ一ドを使えますか。”这个第一语言原文单句的情况下,可以将与存储在对译数据存储部32中的“このカ一ドは使えますか。”这个第一语言单句对应的第一语言单句数据判断为类似意义数据。
类似意义数据检索处理部46也可以基于存储在词库数据存储部34中的词库数据(第一语言的同义词数据),判断在对译数据存储部32中是否包括类似意义数据。例如,通过比较所给予的第一语言单句数据和第一语言原文单句数据,抽取两者的一致点和不同点,基于词库数据,判断是否能够进行不同点的置换,从而能够判断与存储在对译数据存储部32中的所给予的第一语言单句数据对应的第一语言单句是否与第一语言原文单句相类似。
在本实施方式中,如图1所示,译文单句数据输出处理部40(翻译系统1)也可以包括选择候补数据抽取处理部48。选择候补数据抽取处理部48进行从存储在对译数据存储部32中的第一语言单句数据中将满足所给予的选择候补条件的数据作为选择候补数据148抽出的处理。例如,选择候补数据抽取处理部48也可以计算原文单句数据120和存储在对译数据存储部32中的第一语言单句数据的类似度,将和原文单句数据120的类似度超过规定的值的第一语言单句数据作为选择候补数据148抽出。或者,选择候补数据抽取处理部48在判断在对译数据存储部32中存储有多个与表示和原文单句相类似的意义的第一语言单句对应的第一语言单句数据的情况下,也可以将与该表示类似意义的第一语言单句对应的第一语言单句数据作为选择候补数据148抽出。
而且,在翻译系统1包括选择候补数据抽取处理部48的情况下,第一语言单句数据选择处理部42也可以基于从外部输入的选择信息,选择作为选择候补数据148而抽出的第一语言单句数据中的任一个。本实施方式的翻译系统1中,选择信息也可以是用户通过后述的操作部80输入的信息。例如在显示部62中显示与选择候补数据对应的选择候补单句,用户通过操作部80进行输入,基于选择显示的选择候补单句中的任一个的信息,选择作为选择候补数据而抽出的第一语言单句数据中的任一个。
在本实施方式的翻译系统1中,译文单句数据输出处理部40基于由第一语言单句数据选择处理部42选择的第一语言单句数据(选择单句数据142),输出译文单句数据140。详细而言,译文单句数据输出处理部40将与选择单句数据142相关联的、存储在对译数据存储部32中的第二语言单句数据作为译文单句数据140输出。如前面所说明的,在对译数据存储部32中使第一语言单句数据和第二语言单句数据相关联并对其进行存储。因此,当选择一个第一语言单句数据时,能够容易地指定与其相关联的第二语言单句数据。并且,因为第一语言单句数据和第二语言单句数据以第一语言和第二语言能够对译的方式相关联,所以能够认为与选择的第一语言单句数据对应的第二语言单句数据是表示原文单句的译文的数据。
如图1和图2所示,本实施方式的翻译系统1也可以包括机械翻译处理部50。机械翻译处理部50判断原文单句数据120是否满足所给予的机械翻译条件,对满足机械翻译条件的原文单句数据120进行所给予的机械翻译处理。机械翻译处理部50可以在原文单句数据120与存储在对译数据存储部32中的任一个数据均不一致,并且与表示类似的意义的第一语言单句对应的第一语言单句数据没有存储在对译数据存储部32中的情况下,判断该原文单句数据120满足所给予的机械翻译条件,进行机械翻译处理。机械翻译处理部50也可以以对原文单句数据120进行所给予的机械翻译处理,输出机械翻译数据150的方式构成。能够应用于本实施方式的机械翻译处理部50并无特别限定,可以应用已公知的任一个机械翻译装置。
如图2所示,本实施方式的翻译系统1也可以包括输出装置60。输出装置60例如可以是显示部62、声音输出部64。此处,显示部62可以由CRT显示器、LCD、OELD、PDP、触摸面板型显示器等硬件实现。此外,声音输出部64可以由扬声器、耳机等硬件实现。
如图2所示,翻译系统1也可以包括输出处理部70。输出处理部70进行用于向输出装置60中输出所给予的语句的处理。在输出装置60为显示装置的情况下,输出处理部70向显示部62进行显示所给予的语句的处理。此外,在输出装置60为声音输出装置的情况下,输出处理部70进行从声音输出部64对所给予的语句进行发声的处理。
输出处理部70也可以基于译文单句数据140进行用于输出译文单句的处理。即,输出处理部70也可以构成为译文单句输出处理部。其中,译文单句数据140是预先准备的第二语言单句数据中的任一个。因此,通过基于译文单句数据140输出译文单句,能够输出自然的语句(没有不协调感的语句)。
本实施方式的翻译系统1也可以包括输出单位确定处理部(未图示)。输出单位确定处理部进行确定输出处理部70的输出译文单句数据140的单位的处理。输出单位确定处理部可以基于来自外部的信号(例如触发信号)确定译文单句数据140的输出单位。输出处理部70也可以以基于确定的输出单位连续输出多个译文单句数据140的方式构成。
输出处理部70可以在每次从译文单句数据输出处理部40输出一个译文单句数据140时,进行用于输出一个译文单句的处理。或者,输出处理部70也可以将多个译文单句数据140作为一个输出单位连续输出。输出处理部70例如将多个译文单句数据140存储并保持在存储部30中,在接收从外部输入的译文输出触发信号时,进行将存储在存储部30中的多个译文单句数据140作为构成一个输出单位的数据连续输出的处理。由此,能够连续输出归拢在一起的多个单句,从而能够实现顺利的交流。
或者,输出处理部70也可以基于由第一语言单句数据选择处理部42选择的第一语言单句数据(选择单句数据142),进行用于输出与选择单句数据142对应的第一语言单句(选择单句)的处理。即,输出处理部70也可以构成为选择单句输出处理部。或者,输出处理部70也可以基于原文单句数据120进行用于输出原文单句的处理。即,输出处理部70也可以构成为原文单句输出处理部。或者,输出处理部70也可以基于机械翻译数据150,进行用于输出机械翻译语句的处理。即,输出处理部70也可以构成为机械翻译语句输出处理部。或者,输出处理部70也可以基于由选择候补数据抽取处理部48抽出的第一语言单句数据(选择候补数据148),进行用于输出与选择候补数据148对应的第一语言单句(选择候补单句)的处理。
此外,输出处理部70也可以以在输出装置60(显示装置62)中配合语句显示图像的方式构成。例如输出装置60也可以检测出在原文单句数据、译文单句数据中包括表示“薬”或“medicine”的数据,并显示药的图像。输出装置60可以例如通过网络获得图像数据,基于获得的图像数据进行在显示部62中显示图像的处理。
如图1所示,本实施方式的翻译系统1也可以包括操作部80。操作部80用于将用户的操作作为数据输入,其功能可以由操作按钮、操作杆、触摸面板等实现。操作部80也可以是输入例如指定第一语言(作为原文输入的语言)、第二语言(作为译文输出的语言)的信息的装置。或者,操作部80也可以是输入译文输出开始触发信号的装置。或者,操作部80也可以是输入选择输出的多个候补单句中的任一个的选择信号的装置。
本实施方式的翻译系统1中,原文单句数据生成处理部20和译文单句数据输出处理部40可以构成为处理部100。处理部100通过进行利用存储部(存储部30)作为工作区域的各种处理,可以实现各种功能。处理部100的各功能(原文单句数据生成处理功能、译文单句数据输出处理功能等)可以通过由各种处理器(CPU、DSP等)执行各种程序而实现。但是,处理部100的各功能也可以由专用的硬件电路实现。
本实施方式的翻译系统1可以以上述方式构成。
(2)翻译系统1的动作
以下说明本实施方式的翻译系统1的动作。图4是用于说明翻译系统1的动作的流程图。
首先,译文单句数据输出处理部40接收原文单句数据120(第一语言原文单句数据)(步骤S10)。
然后,判断在对译数据存储部32中是否存储有与译文单句数据输出处理部40接收的第一语言原文单句数据一致的第一语言单句数据(步骤S20)。
在对译数据存储部32中存储有与译文单句数据输出处理部40接收的第一语言原文单句数据一致的第一语言单句数据的情况下(在步骤S20中为Yes的情况),选择与原文单句数据一致的第一语言单句数据(步骤S22)。
然后,将与选择的第一语言单句数据相关联的存储在对译数据存储部32中的第二语言单句数据作为译文单句数据输出(步骤S24)。
此外,在对译数据存储部32中没有存储与译文单句数据输出处理部40接收的第一语言原文单句数据一致的第一语言单句数据的情况下(步骤S20中为No的情况),判断在对译数据存储部32中是否存储有与表示和第一语言原文单句相类似的意义的第一语言单句对应的第一语言单句数据(步骤S30)。
然后,在对译数据存储部32中存储有与表示和第一语言原文单句相类似的意义的第一语言单句对应的第一语言单句数据的情况下(步骤S30为Yes的情况),选择与表示和第一语言原文单句相类似的意义的第一语言单句对应的第一语言单句数据(步骤S32)。
然后,将与选择的第一语言单句数据相关联的存储在对译数据存储部32中的第二语言单句数据作为译文单句数据输出(步骤S24)。
此外,在对译数据存储部32中没有存储与表示和第一语言原文单句相类似的意义的第一语言单句对应的第一语言单句数据的情况下(步骤S30为No的情况),对语言单句数据(第一语言单句数据)进行所给予的机械翻译处理(步骤S40)。
(3)翻译系统1达到的作用效果
以下总结翻译系统1达到的作用效果。
在本实施方式的翻译系统1中,以单句单位接收原文,以单句单位输出译文。即,在翻译系统1中,以单句单位进行翻译处理。此处,“单句”是指“表示一个意义的语句”,因此,在本实施方式的翻译系统1中,对每个表示一个意义的语句进行翻译处理。因此,利用翻译系统1,能够输出正确反映用户意图的译文,能够实现高精度的翻译系统。
此外,在本实施方式的翻译系统1中,选择存储在对译数据存储部32中的第一语言单句数据,将与选择的第一语言单句数据相关联的第二语言单句数据作为译文单句数据输出。由此,能够以较少的处理负荷输出译文单句数据。
而且,在本实施方式中,在对译数据存储部32中使第一语言单句数据和第二语言单句数据相关联并对其进行存储,使得对应的第一语言单句和第二语言单句能够对译(成为相同意义)。因此,只要第一语言单句数据选择处理部42能够从对译数据存储部32中选择出与原文单句为相同意义的第一语言单句数据,则能够输出与原文单句的译文对应的第二语言单句数据。
在本实施方式的翻译系统1中,第一语言单句数据选择处理部42判断在对译数据存储部32中是否存储有与原文单句数据一致的第一语言单句数据。然后,在对译数据存储部32中存储有与原文单句数据一致的数据的情况下,选择它,输出与选择的第一语言单句数据相关联的第二语言单句数据。由此,能够输出与作为原文单句的对译的第二语言单句对应的第二语言单句数据。因此,能够输出与原文为相同意义的译文(与原文相关联的译文),从而能够实现高精度的翻译。
此外,在本实施方式的翻译系统1中,第一语言单句数据选择处理部42在对译数据存储部32中没有存储与原文单句数据一致的第一语言单句数据的情况下,判断在对译数据存储部32中是否存储有与表示和原文单句类似的意义的第一语言单句对应的第一语言单句数据。然后,在对译数据存储部32中存储有与表示和原文单句类似的意义的第一语言单句对应的第一语言单句数据的情况下,选择它,输出与选择的第一语言单句数据相关联的第二语言单句数据。由此,能够输出表示第二语言单句的第二语言单句数据,该第二语言单句成为表示和原文单句类似的意义的第一语言单句的对译。因此,能够输出和原文意义类似的译文,从而能够实现高精度的翻译。
进而,在本实施方式的翻译系统1中,第一语言单句数据选择处理部42包括机械翻译处理部50。由此,即使是在对译数据存储部32中没有存储与原文单句数据一致的数据,以及与表示和原文单句类似的意义的第一语言单句对应的第一语言单句数据的情况下,也能够输出译文。特别在本实施方式中,作为机械翻译处理部50的机械翻译处理对象的数据是对应单句的数据(原文单句数据120)。因此,即使在应用已公知的机械翻译方法的情况下,也能够实现高精度的翻译处理。
(4)变形例
本发明并不限定于上述实施方式,能够有各种变形。本发明包括与实施方式中说明的结构实质上相同的结构(例如功能、方法和结果相同的结构,或者目的和效果相同的结构)。此外,本发明包括能够置换实施方式中说明的结构中非本质的部分的结构。此外,本发明包括能够达到与实施方式说明的结构相同的作用效果的结构,或能够达到相同目的的结构。此外,本发明包括将实施方式中说明的结构添加于公知技术后的结构。
以下说明具体的变形例。
(第一变形例)
图5是用于说明本实施方式的第一变形例的翻译系统的图。
第一变形例中,在对译数据存储部32中将第一语言单句数据分类为多个组并对其进行存储。在第一变形例中,也可以将与表示类似意义的第一语言单句对应的第一语言单句数据分类为一个组。并且,在第一变形例中,将分类为各组的第一语言单句数据中的任一个指定为代表数据。
此外,在第一变形例中,在对译数据存储部32中将第二语言单句数据分类为多个组并对其进行存储。在第一变形例中,也可以将与表示类似意义的第二语言单句对应的第二语言单句数据分类为一个组。并且,在第一变形例中,将分类为各组的第二语言单句数据中的任一个指定为代表数据。
图5表示在对译数据存储部32中存储的、已被分组的对译数据的一个例子。在图5中,将组1中的“風邪をひきました。”这个第一语言单句和“I caught a cold.”这个第二语言单句分别指定为代表数据。并且,将与代表数据为(大致)相同的意义的数据分类为一个组。此外,在组2中,将“風邪薬を下さい。”这个第一语言单句和“Can I have a cold medicine?”这个第二语言单句分别指定为代表数据。并且,将与代表数据为相同的意义的数据分类为一个组。
然后,在第一变形例中,第一语言单句数据选择处理部42也可以以选择指定为代表数据的第一语言单句数据中的任一个的方式构成。详细而言,第一语言单句数据选择处理部42可以进行检测接收的原文单句数据所属的组的处理,和选择检测出的组中指定为代表数据的第一语言单句数据的处理。
具体而言,第一语言单句数据选择处理部42在接收例如图5所示的对译数据中的“風邪気味です。”这个原文单句数据的情况下,检测接收的原文单句数据属于组1,选择“風邪をひきました。”这个第一语言单句数据。
然后,译文单句数据输出处理部40可以将与第一语言单句数据的代表数据相关联的第二语言单句数据作为译文单句数据输出。
由此,通过指定一般使用的单句作为代表数据,能够向第三者输出更容易理解的译文,从而能够更顺利地进行交流。
但是,如果总是使用代表数据输出译文,虽然能传达用户的意图的概要,但可能无法传达语句的细微差别。因此,第一变形例的翻译系统也可以以能够切换动作模式的方式构成。即,第一变形例的翻译系统可以采用能够切换选择代表数据的代表数据利用模式和不使用代表数据的通常模式的结构。由此,能够与使用状况相适应地输出译文。例如,可以基于用户通过操作部80输入的模式切换信号,进行切换动作模式的处理。
(第二变形例)
图6是用于说明本实施方式的第二变形例的翻译系统的图。
第二变形例中,译文单句数据输出处理部40包括第二语言单句数据选择处理部43。第二语言单句数据选择处理部43接收与由第二语言表达的第二语言原文单句对应的第二语言原文单句数据,基于接收的第二语言原文单句数据选择存储在对译数据存储部32中的第二语言单句数据中的任一个。
然后,译文单句数据输出处理部40将与由第二语言单句数据选择处理部43选择的第二语言单句数据相关联的第一语言单句数据作为译文单句数据输出。
在第二变形例中,译文单句数据输出处理部40利用存储在对译数据存储部32中的对译数据,能够进行将由第一语言表达的原文翻译成第二语言的处理,和将由第二语言表达的原文翻译成第一语言的处理。换言之,能够在两个翻译处理中共用存储在对译数据存储部32中的对译数据。因此,能够使翻译装置所需的存储容量变小。
(第二实施方式)
以下说明应用本发明的第二实施方式。图7~图9是用于说明应用本发明的第二实施方式的翻译系统2的图。
本实施方式的翻译系统2包括对译数据存储部32和译文单句数据输出处理部40。
如图7和图8所示,本实施方式的翻译系统2包括第二对译系统存储部232。第二对译数据存储部232使与由第二语言表达的多个第二语言单句对应的多个第二语言单句数据和与由第三语言表达的多个第三语言单句对应的多个第三语言单句数据相关联,并对其进行存储,使得对应的第二语言单句和第三语言单句能够对译。此外,在本实施方式中,也将存储在第二对译数据存储部232中的数据称为第二对译数据(第二和第三语言对译数据)。此时,第二对译数据包括与由第二语言表达的多个第二语言单句对应的多个第二语言单句数据,以及与由第三语言表达的多个第三语言单句对应的多个第三语言单句数据,第二语言单句数据和第三语言单句数据是以对应的第二语言单句和第三语言单句能够对译的方式相关联的数据。此外,包括在第二对译数据中的第二语言单句数据也可以是与包括在第一和第二语言对译数据中的第二语言单句数据相同的数据。
如图7和图8所示,在本实施方式的翻译系统2中包括第二译文单句数据输出处理部240。第二译文单句数据输出处理部240进行下述处理:接收从译文单句数据输出部40作为译文单句数据140输出的第二语言单句数据,检索第二对译数据存储部232,并将与接收的第二语言单句数据相关联的第三语言单句数据作为第二译文单句数据输出。
在本实施方式的翻译系统2中,从译文单句数据输出处理部40输出的译文单句数据140是存储在对译数据存储部32中的第二语言单句数据中的任一个。并且,在第二对译数据存储部232中存储有与存储在对译数据存储部32中的第二语言单句数据相同的数据。即,在第二对译数据存储部232中,存储有与从译文单句数据输出处理部40输出的译文单句数据140(第二语言单句数据)相同的数据,并且,存储有与译文单句数据140(第二语言单句数据)相关联的数据(第三语言单句数据)。因此,通过检索第二对译数据存储部232,检测与译文单句数据140相同的第二语言单句数据,指定与检测出的第二语言单句数据相关联的第三语言单句数据,能够指定与由第三语言表达的、成为原文单句的对译的第二译文单句对应的第二译文单句数据160。
于是,输出处理部70基于第二译文单句数据160,进行用于向输出装置60输出第二译文单句的处理。即,输出处理部70也可以构成为第二译文单句输出处理部。
此外,如图8所示,翻译系统2可以由服务器装置3和用户终端4构成。服务器装置3和用户终端4包括用于相互通信的通信部260和通信部90。并且,翻译系统2中,处理部200(译文单句数据输出处理部40和第二译文单句数据输出处理部240)包括在服务器装置3中,译文单句数据输出处理部40可以采用通过通信部260获取原文单句数据120的结构。换言之,译文单句数据输出处理部40也可以采用通过网络获得原文单句数据120的结构。即,译文单句数据输出处理部40接收的原文单句数据120可以是通过网络输入的数据。此外,原文单句数据生成处理部20也可以由服务器装置3和用户终端4的任一个实现。在由服务器装置3实现原文单句数据生成处理部20的情况下,原文单句数据生成处理部20接收的原文语句数据110是通过网络输入的数据。
此外,服务器装置3包括存储部250。存储部250可以是作为处理部200的工作区域的硬件。此外,在本实施方式中,对译数据存储部32和第二对译数据存储部232也可以包括在存储部250中。
本实施方式的翻译系统2可以采用以上结构。根据该翻译系统2,能够提供能够将由第一语言表达的语句(第一语言原文单句)高精度地翻译成由第三语言表达的语句(第三语言译文单句)的翻译系统。
此外,在本实施方式中,如上所述,通过第二语言(桥语言),实现第一语言和第三语言之间的翻译。由此,能够使得用于实现将由一个语言表达的语句翻译成多种语言的多语言翻译所必需的对译数据的数据量变小。以下说明其效果。
例如,当考虑在第一语言、第二语言、第三语言的各自之间进行翻译处理时,为了进行这三个语言间的翻译,需要三个对译数据。具体而言,需要使第一语言单句数据和第二语言单句数据相关联的对译数据、使第二语言单句数据和第三语言单句数据相关联的对译数据、使第三语言单句数据和第一语言单句数据相关联的对译数据。将此扩展为一般化,为了实现N个语言间的翻译,需要N×(N-1)/2个对译数据。
但是,如本发明所示,通过一个语言(第二语言)进行翻译处理的情况下,能够由两个对译数据实现三个语言间的翻译。将此扩展为一般化,在通过一个语言(桥语言,例如英语)进行翻译处理的情况下,准备N-1个对译数据就能够实现N个语言间的翻译。由此,根据本发明,能够提供需要的对译数据的数据量较少的翻译系统。
此外,在本实施方式中,第二对译数据(使第二语言单句数据和第三语言单句数据相关联的数据)可以利用已生成的对译数据(使第一语言单句数据和第二语言单句数据相关联的数据)而生成。以下说明第二对译数据的生成方法。图9是用于说明第二对译数据的生成方法的流程图。
首先,准备使第一语言单句和第二语言单句以对应的第一语言单句和第二语言单句能够对译的方式相关联的对译数据(第一和第二语言对译数据)(步骤S110)。
然后,对包括在对译数据中的第二语言单句数据进行所给予的机械翻译处理,生成与由第三语言表达的多个第三语言单句对应的多个第三语言单句数据,使第二语言单句数据和第三语言单句数据以对应的第二语言单句和第三语言单句能够对译的方式相关联(步骤S120)。
通过以上的顺序,能够生成第二对译数据。
现在,在指定的语言(特别是英语)和其他语言(日语、韩语、中文、法语、德语、俄语等)之间,机械翻译技术的开发不断进步。因此,通过对表示由英语表达的单句的英语单句数据进行规定的机械翻译处理,能够高效地生成与由英语以外的语言表达的单句对应的单句数据。
此外,根据该方法,能够以使桥语言单句数据(第二语言单句数据)为相同数据的方式生成对译数据。因此,能够高效地生成能够实现高精度的多语言翻译的对译数据,能够实现高精度的多语言翻译系统。
图10表示作为能够应用于翻译系统2的用户终端4的电子设备的一个例子的便携式电话1000。便携式电话1000包括由按钮和麦克风实现的输入部1010。便携式电话1000包括由按钮实现的操作部1080。便携式电话1000包括由显示面板实现的显示部1062、由扬声器实现的声音输出部1064。

Claims (23)

1.一种翻译系统,包括:
对译数据存储部,将与由第一语言表达的多个第一语言单句对应的多个第一语言单句数据和与由第二语言表达的多个第二语言单句对应的多个第二语言单句数据相关联,并进行存储,使得相对应的所述第一语言单句和所述第二语言单句对译;以及
译文单句数据输出处理部,基于与所给予的原文单句对应的原文单句数据,输出与成为所述原文单句的对译的译文单句对应的译文单句数据,
其中,所述译文单句数据输出处理部
接收与由所述第一语言表达的第一语言原文单句对应的第一语言原文单句数据,基于接收的所述第一语言原文单句数据选择存储在所述对译数据存储部中的所述第一语言单句数据中的任一个,
将与选择的所述第一语言单句数据相关联的所述第二语言单句数据作为所述译文单句数据输出。
2.根据权利要求1所述的翻译系统,其中,
所述译文单句数据输出处理部
检索所述对译数据存储部,判断在所述对译数据存储部中是否存储有与所述第一语言原文单句数据一致的第一语言单句数据,
在判断为在所述对译数据存储部中存储有与所述第一语言原文单句数据一致的第一语言单句数据的情况下,选择与所述第一语言原文单句数据一致的第一语言单句数据。
3.根据权利要求1所述的翻译系统,其中,
所述译文单句数据输出处理部
检索所述对译数据存储部,判断在所述对译数据存储部中是否存储有与表示和所述第一语言原文单句相类似的意义的第一语言单句对应的第一语言单句数据,
在判断为在所述对译数据存储部中存储有与表示和所述第一语言原文单句相类似的意义的第一语言单句对应的第一语言单句数据的情况下,选择与表示和所述第一语言原文单句相类似的意义的第一语言单句对应的第一语言单句数据。
4.根据权利要求3所述的翻译系统,还包括,
词库数据存储部,存储有所述第一语言的词库数据,
所述译文单句数据输出处理部基于所述词库数据,判断在所述对译数据存储部中是否存储有与表示和所述第一语言原文单句相类似的意义的第一语言单句对应的第一语言单句数据。
5.根据权利要求1所述的翻译系统,还包括,
选择候补数据抽取处理部,将存储在所述对译数据存储部中的所述多个第一语言单句数据中满足所给予的选择候补条件的第一语言单句数据,作为选择候补数据抽出,
所述翻译系统基于所述选择候补数据,使所给予的输出装置输出与作为所述选择候补数据抽出的第一语言单句数据对应的第一语言单句。
6.根据权利要求5所述的翻译系统,其中,
所述译文单句数据输出处理部基于用于选择作为所述选择候补数据抽出的第一语言单句数据中的任一个的选择信息,选择作为所述选择候补数据抽出的第一语言单句数据中的任一个。
7.根据权利要求1所述的翻译系统,还包括,
选择单句输出处理部,进行在所给予的输出装置中输出与在所述译文单句数据输出处理部中选择的所述第一语言单句数据对应的第一语言单句的处理。
8.根据权利要求1所述的翻译系统,其中,
在所述对译数据存储部中将所述第一语言单句数据分类为多个组并进行存储,并且
将分类成所述各组的所述第一语言单句数据中的任一个指定为代表数据。
9.根据权利要求8所述的翻译系统,其中,
所述译文单句数据输出处理部选择被指定为所述代表数据的所述第一语言单句数据中的任一个。
10.根据权利要求1所述的翻译系统,其中,
在所述对译数据存储部中将所述第二语言单句数据分类为多个组并进行存储,并且
将分类成所述各组的所述第二语言单句数据中的任一个指定为代表数据。
11.根据权利要求10所述的翻译系统,其中,
所述译文单句数据输出处理部将被指定为所述代表数据的任一个所述第二语言单句数据作为所述译文单句数据输出。
12.根据权利要求1所述的翻译系统,其中,
所述译文单句数据输出处理部
接收与由所述第二语言表达的第二语言原文单句对应的第二语言原文单句数据,基于接收的所述第二语言原文单句数据选择存储在所述对译数据存储部中的所述第二语言单句数据中的任一个,并且
将与选择的所述第二语言单句数据相关联的所述第一语言单句数据作为所述译文单句数据输出。
13.根据权利要求1所述的翻译系统,还包括,
译文单句输出处理部,基于所述译文单句数据,进行在所给予的输出装置中输出所述译文单句的处理。
14.根据权利要求13所述的翻译系统,还包括,
输出单位确定处理部,基于来自外部的信号进行确定所述译文单句的输出单位的处理,
所述译文单句输出处理部基于确定的输出单位,连续输出与多个译文单句数据对应的多个译文单句。
15.根据权利要求1所述的翻译系统,还包括:
第二对译数据存储部,将所述多个第二语言单句数据和与由第三语言表达的多个第三语言单句对应的多个第三语言单句数据相关联,并进行存储,使得对应的所述第二语言单句和所述第三语言单句对译;以及
第二译文单句数据输出处理部,接收从所述译文单句数据输出处理部作为所述译文单句数据输出的所述第二语言单句数据,检索所述第二对译数据存储部,进行将与接收的所述第二语言单句数据相关联的所述第三语言单句数据作为第二译文单句数据输出的处理。
16.根据权利要求15所述的翻译系统,还包括,
第二译文单句输出处理部,基于所述第二译文单句数据,进行用于在所给予的输出装置中输出与所述第二译文单句数据对应的第二译文单句的处理。
17.根据权利要求1所述的翻译系统,还包括,
原文单句输出处理部,基于所述原文单句数据,进行用于在所给予的输出装置中输出所述原文单句的处理。
18.根据权利要求1所述的翻译系统,还包括,
机械翻译处理部,判断所述原文单句数据是否满足规定的机械翻译处理条件,在所述原文单句数据满足所述机械翻译处理条件的情况下,对所述原文单句数据进行所给予的机械翻译处理。
19.根据权利要求1所述的翻译系统,还包括,
原文单句数据输出部,基于从外部输入的表示原文语句的原文语句数据,输出所述原文单句数据,
所述原文单句数据输出部判断所述原文语句是否是单句,
在所述原文语句是单句的情况下,
将所述原文语句数据作为所述原文单句数据输出,
在所述原文语句不是单句的情况下,
分析所述原文语句数据,生成与表示和所述原文语句相同的意义的单句对应的数据并作为所述原文单句数据输出,
所述译文单句数据输出处理部基于从所述原文单句数据输出处理部输出的所述原文单句数据,进行输出所述译文单句数据的处理。
20.根据权利要求19所述的翻译系统,其中,
所述原文单句数据输出部以通过网络获取所述原文语句数据的方式构成。
21.根据权利要求1所述的翻译系统,其中,
所述译文单句数据输出处理部以通过网络获取所述原文单句数据的方式构成。
22.一种翻译系统的控制方法,包括:
准备对译数据存储部步骤,将与由第一语言表达的多个第一语言单句对应的多个第一语言单句数据和与由第二语言表达的多个第二语言单句对应的多个第二语言单句数据相关联,并进行存储,使得相对应的所述第一语言单句和所述第二语言单句对译;以及
译文单句数据输出处理步骤,基于与所给予的原文单句对应的原文单句数据,输出与成为所述原文单句的对译的译文单句对应的译文单句数据,
其中,在所述译文单句数据输出处理步骤中,接收与由所述第一语言表达的第一语言原文单句对应的第一语言原文单句数据,基于接收的所述第一语言原文单句数据选择存储在所述对译数据存储部中的所述第一语言单句数据中的任一个,并且
将与被选择的所述第一语言单句数据相关联的所述第二语言单句数据作为所述译文单句数据输出。
23.一种对译数据生成方法,包括:
准备包括与由第一语言表达的多个第一语言单句对应的多个第一语言单句数据,和与由第二语言表达的多个第二语言单句对应的多个第二语言单句数据,并以对应的所述第一语言单句和所述第二语言单句对译的方式相关联的第一和第二语言对译数据的步骤;以及
对包括在所述第一和第二语言对译数据中的所述第二语言单句数据进行所给予的机械翻译处理,生成与由第三语言表达的多个第三语言单句对应的多个第三语言单句数据,以对应的所述第二语言单句和所述第三语言单句对译的方式,使所述第二语言单句数据和所述第三语言单句数据相关联的步骤。
CNA2008100891994A 2007-04-23 2008-04-22 翻译系统、翻译系统的控制方法以及对译数据生成方法 Pending CN101295298A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2007113272A JP5280642B2 (ja) 2007-04-23 2007-04-23 翻訳システム及び翻訳プログラム、並びに、対訳データ生成方法
JP2007-113272 2007-04-23

Publications (1)

Publication Number Publication Date
CN101295298A true CN101295298A (zh) 2008-10-29

Family

ID=39711060

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2008100891994A Pending CN101295298A (zh) 2007-04-23 2008-04-22 翻译系统、翻译系统的控制方法以及对译数据生成方法

Country Status (4)

Country Link
US (1) US8108203B2 (zh)
EP (1) EP1986107A3 (zh)
JP (1) JP5280642B2 (zh)
CN (1) CN101295298A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102270198A (zh) * 2011-08-16 2011-12-07 上海交通大学出版社有限公司 计算机辅助翻译系统
CN102486770A (zh) * 2010-12-02 2012-06-06 财团法人资讯工业策进会 文字转换方法与系统
US8600729B2 (en) 2010-11-03 2013-12-03 Institute For Information Industry Method and system for co-occurrence-based text conversion
CN105573990A (zh) * 2014-11-04 2016-05-11 株式会社东芝 外语句子制作支援装置以及方法
CN106445926A (zh) * 2013-10-23 2017-02-22 日耀有限公司 翻译辅助系统确认控制方法以及服务器
CN107430598A (zh) * 2015-03-18 2017-12-01 三菱电机株式会社 多语言翻译装置和多语言翻译方法
CN107861937A (zh) * 2016-09-21 2018-03-30 松下知识产权经营株式会社 对译语料库的更新方法、更新装置以及更新程序
CN109255129A (zh) * 2017-07-14 2019-01-22 松下电器(美国)知识产权公司 翻译方法、翻译装置以及翻译程序

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8155951B2 (en) * 2003-06-12 2012-04-10 Patrick William Jamieson Process for constructing a semantic knowledge base using a document corpus
JP5007977B2 (ja) * 2008-02-13 2012-08-22 独立行政法人情報通信研究機構 機械翻訳装置、機械翻訳方法、及びプログラム
JP5008144B2 (ja) * 2008-02-13 2012-08-22 独立行政法人情報通信研究機構 対訳情報生成装置、対訳情報生成方法、及びプログラム
US9672204B2 (en) * 2010-05-28 2017-06-06 Palo Alto Research Center Incorporated System and method to acquire paraphrases
US20120215520A1 (en) * 2011-02-23 2012-08-23 Davis Janel R Translation System
JP5915326B2 (ja) * 2012-03-29 2016-05-11 富士通株式会社 機械翻訳装置、機械翻訳方法及び機械翻訳プログラム
US9183198B2 (en) 2013-03-19 2015-11-10 International Business Machines Corporation Customizable and low-latency interactive computer-aided translation
JP2015060458A (ja) * 2013-09-19 2015-03-30 株式会社東芝 機械翻訳装置、方法、及びプログラム
CN104750687B (zh) * 2013-12-25 2018-03-20 株式会社东芝 改进双语语料库的方法及装置、机器翻译方法及装置
US20200210530A1 (en) * 2018-12-28 2020-07-02 Anshuman Mishra Systems, methods, and storage media for automatically translating content using a hybrid language

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2770555B2 (ja) 1990-06-22 1998-07-02 日本電信電話株式会社 自然言語解析システム
JPH04160473A (ja) * 1990-10-24 1992-06-03 Hitachi Ltd 事例再利用型翻訳方法および装置
JPH07160720A (ja) * 1993-12-01 1995-06-23 Runatetsuku:Kk 機械で読み取り可能な情報の翻訳を支援し、効率化する装置及びその方法
JPH08106474A (ja) * 1994-10-07 1996-04-23 Hitachi Ltd 類似例文検索結果表示方法及び装置
JPH09258776A (ja) 1996-03-22 1997-10-03 Sony Corp 音声認識方法および音声認識装置、並びに翻訳方法および翻訳装置
US6161083A (en) * 1996-05-02 2000-12-12 Sony Corporation Example-based translation method and system which calculates word similarity degrees, a priori probability, and transformation probability to determine the best example for translation
US6438524B1 (en) 1999-11-23 2002-08-20 Qualcomm, Incorporated Method and apparatus for a voice controlled foreign language translation device
JP2002278963A (ja) * 2001-03-15 2002-09-27 Logo Vista Corp 事例翻訳装置
US20030004702A1 (en) 2001-06-29 2003-01-02 Dan Higinbotham Partial sentence translation memory program
US20050033567A1 (en) * 2002-11-28 2005-02-10 Tatsuya Sukehiro Alignment system and aligning method for multilingual documents
US7562008B2 (en) * 2004-06-23 2009-07-14 Ning-Ping Chan Machine translation method and system that decomposes complex sentences into two or more sentences
US20070016397A1 (en) * 2005-07-18 2007-01-18 Microsoft Corporation Collocation translation using monolingual corpora
JP4961755B2 (ja) * 2006-01-23 2012-06-27 富士ゼロックス株式会社 単語アライメント装置、単語アライメント方法、単語アライメントプログラム
JP2008065395A (ja) * 2006-09-04 2008-03-21 Fuji Xerox Co Ltd 翻訳装置、翻訳方法および翻訳プログラム

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8600729B2 (en) 2010-11-03 2013-12-03 Institute For Information Industry Method and system for co-occurrence-based text conversion
CN102486770A (zh) * 2010-12-02 2012-06-06 财团法人资讯工业策进会 文字转换方法与系统
CN102486770B (zh) * 2010-12-02 2014-09-17 财团法人资讯工业策进会 文字转换方法与系统
CN102270198A (zh) * 2011-08-16 2011-12-07 上海交通大学出版社有限公司 计算机辅助翻译系统
CN106445926B (zh) * 2013-10-23 2019-05-21 日耀有限公司 翻译辅助系统确认控制方法
CN106445926A (zh) * 2013-10-23 2017-02-22 日耀有限公司 翻译辅助系统确认控制方法以及服务器
CN105573990A (zh) * 2014-11-04 2016-05-11 株式会社东芝 外语句子制作支援装置以及方法
US10394961B2 (en) 2014-11-04 2019-08-27 Kabushiki Kaisha Toshiba Foreign language sentence creation support apparatus, method, and program
CN105573990B (zh) * 2014-11-04 2019-09-27 株式会社东芝 外语句子制作支援装置以及方法
CN107430598A (zh) * 2015-03-18 2017-12-01 三菱电机株式会社 多语言翻译装置和多语言翻译方法
CN107861937A (zh) * 2016-09-21 2018-03-30 松下知识产权经营株式会社 对译语料库的更新方法、更新装置以及更新程序
CN107861937B (zh) * 2016-09-21 2023-02-03 松下知识产权经营株式会社 对译语料库的更新方法、更新装置以及记录介质
CN109255129A (zh) * 2017-07-14 2019-01-22 松下电器(美国)知识产权公司 翻译方法、翻译装置以及翻译程序
CN109255129B (zh) * 2017-07-14 2023-11-07 松下电器(美国)知识产权公司 翻译方法、翻译装置以及记录介质

Also Published As

Publication number Publication date
JP5280642B2 (ja) 2013-09-04
US20090326915A1 (en) 2009-12-31
JP2008269413A (ja) 2008-11-06
EP1986107A3 (en) 2008-12-10
US8108203B2 (en) 2012-01-31
EP1986107A2 (en) 2008-10-29

Similar Documents

Publication Publication Date Title
CN101295298A (zh) 翻译系统、翻译系统的控制方法以及对译数据生成方法
US10073843B1 (en) Method and apparatus for cross-lingual communication
US9672206B2 (en) Apparatus, system and method for application-specific and customizable semantic similarity measurement
US9754592B2 (en) Methods and systems for speech-enabling a human-to-machine interface
US8239207B2 (en) Speech-enabled language translation system and method enabling interactive user supervision of translation and speech recognition accuracy
JP6113217B2 (ja) 辞書機能提供方法、サービスサーバ、コンピュータプログラムおよびファイル配布システム
CN104573099B (zh) 题目的搜索方法及装置
CN1971554A (zh) 使用样例来翻译语音输入的设备和方法
CN110162600B (zh) 一种信息处理的方法、会话响应的方法及装置
JP2013206397A (ja) 機械翻訳装置、機械翻訳方法及び機械翻訳プログラム
KR101541170B1 (ko) 텍스트 요약 장치 및 방법
CN101901276A (zh) 智能查询系统及查询方法
Aasha et al. Machine translation from English to Malayalam using transfer approach
US9779083B2 (en) Functioning of a computing device by a natural language processing method comprising analysis of sentences by clause types
JP5300576B2 (ja) 検索装置、検索方法、および検索プログラム
KR20160140527A (ko) 다국어 전자책 시스템 및 방법
Zafar et al. Interactive English to Urdu machine translation using example-based approach
KR20080052318A (ko) 기계 번역에서의 대역어 선택 방법 및 장치
TWI385538B (zh) 單詞擷取翻譯系統及其方法
KR20010008073A (ko) 음성 인식 및 번역 전용 에이직을 이용한 휴대용 다국어번역 단말장치
JP6145011B2 (ja) 文正規化システム、文正規化方法及び文正規化プログラム
JP2006190226A (ja) 用言自動換言装置、用言換言方法及び用言換言処理プログラム
Damdoo et al. Probabilistic N-gram language model for SMS Lingo
KR20080033689A (ko) 반자동 번역 서비스 제공 시스템 및 방법
CN101093444A (zh) 输入系统及输入方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20081029