CN102193913B - 翻译装置及翻译方法 - Google Patents

翻译装置及翻译方法 Download PDF

Info

Publication number
CN102193913B
CN102193913B CN201110058868.3A CN201110058868A CN102193913B CN 102193913 B CN102193913 B CN 102193913B CN 201110058868 A CN201110058868 A CN 201110058868A CN 102193913 B CN102193913 B CN 102193913B
Authority
CN
China
Prior art keywords
unit
character string
translation
word
regulation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110058868.3A
Other languages
English (en)
Other versions
CN102193913A (zh
Inventor
佐田以知子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of CN102193913A publication Critical patent/CN102193913A/zh
Application granted granted Critical
Publication of CN102193913B publication Critical patent/CN102193913B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Abstract

本发明的翻译装置的显示单元显示以收取到的第1语言记述的字符串。翻译单位提取单元将获取的字符串分割为规定的翻译单位,对每个翻译单位提取字符串。翻译单元将分别提取出的各个翻译单位的字符串翻译成第2语言。显示控制单元使翻译单元的翻译结果从显示中的字符串的开头起依次与字符串对应关联显示在显示单元上。

Description

翻译装置及翻译方法
技术领域
本发明涉及将以第1语言记述的字符串翻译成第2语言的翻译装置及翻译方法。
背景技术
以往,将说话语音进行语音识别而文本化的语音识别技术、将第1语言的字符串翻译成不同的第2语言的字符串的自动翻译技术为人所知。此外,组合了这些技术的语音翻译系统也在实用化。但是,以目前的技术水平,在处理速度或处理精度方面存在很大的课题,还未实现达到用户期待的程度的系统。
因此,与以往的技术比较,提出了能够在短时间翻译,并且能够翻译成自然的句子而使作为全句意思通顺的装置(例如,参照特开平8-263499号公报(日本))。在特开平8-263499号公报中公开的装置中,从说话语音得到的翻译前的字符串基于预先准备的多个分割模型(pattern)被分割,对每个分割了的单位翻译成目标语言(部分翻译),另一方面,不分割地翻译成目标语言(全部翻译)。然后,在比较部分翻译的结果和全部翻译的结果,省略了冗长的表达后,作为最终的翻译结果被输出。
发明内容
在特开平8-263499号公报中公开的装置中,必须预先准备在进行部分翻译时使用的分割模型。此外,在没有网罗足够的分割模型的情况下,或在获得良好的翻译结果的程度上分割模型的质量不好的情况下,难以实现高精度的翻译处理。此外,在特开平8-263499号公报中公开的装置中,由于进行部分翻译和全部翻译,而且进行比较部分翻译的结果和全部翻译的结果而消除冗长的表达的处理,所以有阻碍实时性的问题。
本发明鉴于这样的情况而完成,其目的在于,提供通过渐进地翻译被随时输入的字符串,从而提高翻译精度,并且能够执行实时性高的翻译处理的翻译装置及翻译方法。
本发明的翻译装置,将由第1语言记述的字符串翻译成第2语言,它包括:获取单元,随时获取由第1语言记述的字符串;显示单元,随时显示获取单元获取到的字符串;提取单元,从获取单元获取到的字符串,随时提取在作为翻译对象的规定单位中包含的字符串;翻译单元,对提取单元提取出的每个字符串翻译成第2语言;以及显示控制单元,使翻译单元的翻译结果与显示单元上显示出的字符串对应关联显示在显示单元上。
根据本发明,翻译装置随时获取由第1语言记述的字符串,随时显示获取到的字符串,并且将其随时翻译成第2语言,使翻译结果与显示中的第1语言的字符串对应关联显示。因此,由于第1语言的字符串和翻译了该字符串所得的第2语言的字符串对应关联显示,所以收看者不仅能够容易地掌握被输入的第1语言的字符串,还能够容易地掌握作为其翻译结果的第2语言的字符串。此外,翻译装置从获取到的字符串中,随时提取在作为翻译处理的对象的规定单位中包含的字符串,对提取出的每个字符串进行翻译。因此,由于不等待中断或结束字符串的输入,而将随时输入的字符串依次进行翻译,所以能够渐进地进行翻译处理,在从输入字符串至显示翻译结果为止的处理中,可进行实时性高的处理。
在本发明的翻译装置中,翻译单元对提取单元提取出的字符串中包含的单词,分配第2语言的译词。
根据本发明,翻译装置进行所谓对第1语言的字符串中包含的单词分配第2语言的译词的译词标注(訳ふり)翻译的翻译处理。例如,翻译装置以第1语言的字符串中包含的单词、词组(由两个以上的单词构成的复合词、动词词组、成语、惯用语等)、短语(连结单词或词组而形成了短单位的词组)为单位生成译词。此外,翻译装置有意图地、或按照由用户预先设定了‘译词标注级别’进行不对难易度低的单词、词组、短语分配译词的处理。因此,例如,即使在输入的字符串中有错误的情况下,或在将输入的语音变换为字符串时有语音识别错误的情况下,也可以不对全句的翻译结果产生影响,而停留在局部的错误。由此,可提高翻译精度。此外,通过采用译词标注翻译方式,在通常的翻译处理中不是最合适的单位中也可以进行精度高的翻译处理,可以进一步提高翻译处理的实时性。
在本发明的翻译装置中,提取单元将从前后的规定单位的前侧的规定单位的字符串中的末尾起规定数的单词附加在后侧的规定单位的字符串的开头而提取。
根据本发明,翻译装置在前后的翻译单位(作为翻译处理的对象的规定单位)的字符串中,将从前侧的翻译单位的字符串中的末尾起规定数的单词附加在后侧的翻译单位的字符串的开头进行翻译。因此,即使词组被分断在前后的翻译单位中的情况,前侧的翻译单位中包含的一部分词组也被包含在后侧的翻译单位中而被翻译。由此,即使翻译单位并不一定在翻译处理中限于最合适的单位的情况,也可以进行精度高的翻译处理。
在本发明的翻译装置中,显示控制单元将对于从前侧的规定单位的字符串中的末尾起规定数的单词的翻译结果作为对于后侧的规定单位的字符串的翻译结果显示在显示单元上。
根据本发明,翻译装置将对于从前侧的规定单位的字符串中的末尾起规定数的单词的翻译结果作为对于后侧的规定单位的字符串的翻译结果显示。因此,即使词组被分断在了前后的翻译单位情况,也可以进行精度高的翻译处理,并且可以高效率显示翻译结果。此外,例如,临时显示前侧的翻译单位中包含的词组的一部分翻译结果,在显示包含了该一部分的后侧的翻译单位的翻译结果时,删除该一部分的翻译结果的显示而显示了后侧的翻译单位的翻译结果的情况下,产生显示的重写造成的画面的闪烁。但是,根据本发明,可以避免这样的状况。
本发明的翻译装置包括:单词数接受单元,在前侧的规定单位的字符串中,接受在后侧的规定单位的字符串中所附加的单词数,提取单元将从前侧的规定单位的字符串中的末尾起单词数接受单元接受了的单词数的单词,附加在后侧的规定单位的字符串的开头。
根据本发明,可以任意地变更在前侧的翻译单位中包含的字符串中,要附加在后侧的翻译单位的开头的单词数。
在本发明的翻译装置中,获取单元包括输入接受单元和字符串变换单元的至少一方,输入接受单元随时接受由第1语言记述的字符串的输入,字符串变换单元随时接受用第1语言说话的语音的输入,将其随时变换为字符串。
根据本发明,翻译装置接受由第1语言记述的字符串、或从以第1语言说话的语音进行了变换所得的字符串的至少一方的输入。因此,例如,不仅可以将通过电视会议系统或聊天发送接收的文字信息作为翻译的对象,而且可以将语音信息作为翻译的对象。
在本发明的翻译装置中,提取单元将从开始了字符串的输入起至中断了规定时间以上为止输入接受单元接受了的字符串、在预先设定了的时间内输入接受单元接受了的字符串、预先设定了的单词数的字符串、或预先设定了的文本(text)长度的字符串,作为规定单位。
根据本发明,翻译装置在接受由第1语言记述的字符串的输入的情况下,将从开始输入字符串起至输入中断规定时间以上为止所输入的字符串、预先设定了的时间内输入的字符串、预先设定了的单词数的字符串、或预先设定了的文本长度的字符串作为一个翻译单位进行翻译。因此,可以在如聊天系统那样以往所利用的处理系统中不修改,而构筑将这样的处理系统作为输入单元的翻译系统。
在本发明的翻译装置中,提取单元将从开始了语音的输入起至无声持续了规定时间以上为止字符串变换单元对接受了的语音进行变换所得的字符串、字符串变换单元将语音变换为字符串时的处理单位的字符串、在预先设定了的时间内所述字符串变换单元对接受了的语音进行变换所得的字符串、预先设定了的单词数的字符串、或预先设定了的文本长度的字符串,作为所述规定单位。
根据本发明,翻译装置在接受从以第1语言说话的语音变换所得的字符串的输入的情况下,将从开始了接受语音起至无声持续了规定时间以上为止对接受了语音进行变换所得的字符串、将语音变换为字符串时的处理单位的字符串、在预先设定了的时间内变换所得的字符串、预先设定了的单词数的字符串、或预先设定了的文本长度的字符串作为一个翻译单位进行翻译。因此,可以在如语音识别系统那样以往所利用的处理系统中不修改,而构筑将这样的处理系统作为输入单元的翻译系统。
本发明的翻译方法,用于将由第1语言记述的字符串通过翻译装置翻译成第2语言,该翻译方法包括:翻译装置随时获取由第1语言记述的字符串而使其显示在显示单元的步骤;翻译装置从获取到的字符串,随时提取在作为翻译对象的规定单位中包含的字符串;翻译装置对提取出的每个字符串翻译成第2语言的步骤;以及翻译装置使翻译结果与显示单元上显示出的字符串对应关联显示在显示单元上的步骤。
在本发明中,随时输入的字符串不等待中断或结束字符串的输入而被翻译,所以渐进地执行翻译处理。因此,可以执行实时性高的翻译处理,对于输入了字符串的用户或确认字符串的收看者,可以减轻对于翻译处理的等待时间的压力(stress)。此外,由于第1语言的字符串和翻译了该字符串所得的第2语言的字符串对应关联显示,所以用户和收看者不仅容易掌握输入的第1语言的字符串,也容易掌握作为其翻译结果的第2语言的字符串。
附图说明
图1是表示本实施方式的翻译装置的内部结构的方框图;
图2是表示本实施方式的翻译装置的功能结构的功能方框图;
图3A~图3D是用于说明翻译单位的说明图;
图4A~图4C是表示翻译结果的显示例子的说明图;
图5是表示翻译装置的翻译处理步骤的流程图;
图6是表示翻译单位提取处理的步骤的流程图;以及
图7是表示显示单位控制处理的步骤的流程图。
具体实施方式
以下,基于表示其实施方式的附图,详细论述本发明的翻译装置、翻译方法及计算机程序。在以下的实施方式中,对于通过将本发明的计算机程序读取到公知的个人计算机、服务器计算机等中,使个人计算机或服务器计算机的CPU(Central Processing Unit;中央处理单元)等执行该程序,从而实现本发明的翻译装置的结构进行说明。但是,也可以通过进行等效动作的硬件而实现本发明的翻译装置。
图1是表示本实施方式的翻译装置的内部结构的方框图。本实施方式的翻译装置10包括控制单元1、存储单元2、语音识别处理单元3、操作单元4、显示单元5、语音输入单元6及网络I/F单元7等,这些硬件的各个单元通过总线1a而相互地连接。
控制单元1为CPU、MPU(Micro Processing Unit;微处理单元)等,控制上述那样的硬件的各个单元,并且适当执行被存储在存储单元2中的控制程序。存储单元2为EEPROM(Electrically Erasable and Programmable ROM;电可擦可编程只读存储器)、闪存ROM、HDD(Hard Disk Drive;硬盘驱动器)等。存储单元2存储使翻译装置10动作所需要的各种各样的控制程序、控制单元1执行控制程序时产生的各种各样的数据等。存储单元2例如存储用于将第1语言翻译成第2语言的翻译处理程序2a及翻译用辞典2b等作为控制程序。
在本实施方式中,说明翻译装置10进行从英语向日本语的翻译处理的例子。因此,在翻译用辞典2b中,关于英语的单词、词组(由两个以上的单词构成的复合词、动词词组、成语、惯用语等)、短语(连结单词或词组而形成了短单位的词组)等,对应的日本语的译词被对应关联注册。
存储单元2中存储的各个信息不限于存储单元2中预先存储的结构。在翻译装置10包括可读出在外部存储器(未图示)中存储的数据的驱动器(未图示)的情况下,也可以通过驱动器读出在外部存储器中存储的各种信息而将其存储在存储单元2中。此外,也可以通过网络I/F单元7等从外部装置下载各种信息而将其存储在存储单元2中。
语音识别处理单元3进行将语音信号变换为文本信息的语音识别处理。语音识别处理单元3例如将通过后述的语音输入单元6输入的语音信号变换为文本信息(字符串)。具体地说,语音识别处理单元3对语音信号进行声响分析而提取声响参数,与预先存储的声响模式(model)进行核对,将与最相似的声响模式对应的单词作为识别结果。再有,语音识别处理单元3也可以为将控制单元1用于进行语音识别处理的语音识别处理程序、进行语音识别处理时需要的各种数据库存储在存储单元(未图示)中的结构。这种情况下,通过控制单元1执行在语音识别处理单元3的存储单元中存储的语音识别处理程序,可以执行语音识别处理。
操作单元4例如是鼠标、键盘、图形输入板(tablet)等,包括用户为了操作翻译装置10所需要的各种按钮。操作单元4将用户输入了的各种信息输出到控制单元1,控制单元1执行与从操作单元4获取到的信息对应的处理。
显示单元5是LCD(Liquid Crystal Display;液晶显示器)、CRT(CathodeRay Tube;阴极射线管)、PDP(Plasma Display Panel;等离子显示屏)等的显示装置。显示单元5根据来自控制单元1的指示显示视频信号。
语音输入单元6例如包括话筒、A/D(模拟/数字)变换器,将话筒集音所得的模拟的语音信号变换为数字的语音信号。
再有,操作单元4、显示单元5及语音输入单元6可以与翻译装置10的本体分体地构成,可以通过连接线与翻译装置10的本体分别连接,也可以全部一体地构成。此外,操作单元4及显示单元5也可以由触摸屏或图形输入板构成。
网络I/F单元7是用于连接到LAN(Local Area Network;局域网)或WAN(Wide Area Network;广域网)等的IP(Internet Protocol;因特网协议)网络的接口。网络I/F单元7通过IP网络与外部装置之间进行信息的发送接收。
以下,说明在上述结构的翻译装置10中,控制单元1通过执行在存储单元2中存储的控制程序而实现的各种功能。图2是表示本实施方式的翻译装置10的功能结构的功能方框图。在本实施方式的翻译装置10中,在通过操作单元4请求了执行翻译处理的情况下,控制单元1执行在存储单元2中存储的翻译处理程序2a。由此,控制单元1实现翻译单位提取单元11、翻译单元12、显示控制单元13等的各个功能。
翻译装置10获取通过操作单元(获取单元)4输入的文本信息(字符串)作为翻译处理的对象,或获取将通过语音输入单元6输入的语音信号利用语音识别处理单元3的语音识别处理而随时变换所得的文本信息(字符串)作为翻译处理的对象。操作单元4作为随时接受以第1语言(这里为英语)记述的字符串的输入的输入接受单元进行动作。语音输入单元6随时接受以第1语言(这里为英语)说话的语音的输入,语音识别处理单元(获取单元)3作为将语音输入单元6接受了的语音信息随时变换为字符串的字符串变换单元进行动作。
由此,在翻译装置10是可以实现例如聊天系统或电视会议系统的装置的情况下,可以将通过聊天系统或电视会议系统发送接收的字符信息或语音信息作为翻译对象。
如上所述,翻译装置10获取到的字符串作为翻译对象被输入到翻译单位提取单元11。翻译单位提取单元(提取单元)11将输入的字符串随时分割为翻译处理的单位(以下,称为翻译单位),提取各个翻译单位中包含的字符串而将其按每个翻译单位输出到翻译单元12。在本实施方式中,翻译单位提取单元11将预先设定了的单词数(例如9单词)设为规定的翻译单位,从输入的字符串中随时提取规定的单词数的字符串而将其输出到翻译单元12。
再有,翻译单位提取单元11提取字符串时的规定的翻译单位不限于预先设定了的单词数。例如,也可以将通过操作单元4从开始输入字符串起至输入被中断规定时间以上为止所输入的字符串、在预先设定了的时间内通过操作单元4输入的字符串、或者预先设定了的文本长度的字符串作为一个翻译单位。此外,也可以将通过语音输入单元6从开始输入语音信号起至无音持续规定时间以上为止所输入的语音信号进行变换所得到的字符串、语音识别处理单元3将语音信号变换为字符串时的处理单位的字符串、或者在预先设定了的时间内语音识别处理单元3变换所得的字符串作为一个翻译单位。
此外,本实施方式的翻译单位提取单元11在从输入的字符串中提取翻译单位中包含的字符串时,分别在前后的翻译单位中,进行将从前侧的翻译单位中包含的字符串中的末尾起规定数的单词附加在后侧的翻译单位的开头而提取的重叠处理。翻译单位提取单元11进行根据来自通过了操作单元4的用户的指示,进行了重叠处理的提取处理、或不进行重叠处理的提取处理的其中一个处理。再有,是否进行重叠处理的设定,不仅由用户指定,也可以预先设定。
图3A~图3D是用于说明翻译单位的说明图。在图3A、图3C中,‘aa’、‘bb’...分别表示一个英语单词。此外,这里,翻译单位提取单元11将进行分割的规定的翻译单位设为9单词,将通过重叠处理而被附加到后侧的翻译单位中的单词数设为3单词。
图3A、图3B表示通过不进行重叠处理的提取处理所提取的翻译单位。在用户通过操作单元4指示了不进行重叠处理的情况下,如图3A、图3B所示,翻译单位提取单元11将输入的字符串从开头起依次每次分割为9单词,将分别分割出的翻译单位设为第1翻译单位、第2翻译单位、...。
图3C、图3D表示通过进行了重叠处理的提取处理所提取的翻译单位。在用户通过操作单元4指示了进行重叠处理的情况下,翻译单位提取单元11首先将输入的字符串从开头起依次每次分割为9单词。然后,翻译单位提取单元11分别在前后的翻译单位中,将从前侧的翻译单位的末尾起3单词附加在后侧的翻译单位的开头,并将各自的翻译单位设为第1翻译单位、第2翻译单位、...。具体地说,如图3C所示,将从第1翻译单位(前侧的翻译单位)的末尾起3单词(‘gg’,‘hh’,‘ii’)附加到第2翻译单位(后侧的翻译单位)的开头,将从第2翻译单位(前侧的翻译单位)的末尾起3单词(‘pp’,‘qq’,‘rr’)附加到第3翻译单位(后侧的翻译单位)的开头。此外,如图3D所示,将从第1翻译单位(前侧的翻译单位)的末尾起3单词(‘are’,‘hungry’,‘around’)附加到第2翻译单位(后侧的翻译单位)的开头。
通过进行这样的重叠处理,即使是词组被分断在了前后的翻译单位的情况,也可以进行精度高的翻译处理。
再有,在前侧的翻译单位中包含的字符串中,可以预先设定被附加到后侧的规定单位中的单词数,也可以由用户通过操作单元(单词数接受单元)4受理。由此,在重叠处理中,可以任意地设定被附加到后侧的翻译单位中的单词数,可以设定进一步提高翻译精度的合适的单词数。
翻译单元12将从翻译单位提取单元11依次输入的字符串(各个翻译单位中包含的字符串)依次存储在本身具有的缓冲器(未图示)中。翻译单元12使用翻译用辞典2b,对于被依次存储在缓冲器中的各个字符串进行翻译处理。本实施方式的翻译单元12,例如进行以各个字符串中包含的单词、词组、短语为单位生成第2语言(这里为日本语)的译词的翻译处理(译词标注翻译)。此外,在翻译用辞典2b中,注册了对于各个单词、词组、短语的难易度级别的情况下,翻译单元12有意图地或按照用户预先设定了的‘译词标注级别’,进行不对难易度低的单词、词组、短语分配译词的处理。翻译单元12从翻译用辞典2b中读出与各个字符串中包含的单词、词组、短语对应的译词,将日本语的译词分别对应关联并作为翻译结果输出到显示控制单元13。
这样,通过进行译词标注翻译,例如,在通过操作单元4输入的字符串中有错误的情况下,或者在语音识别处理单元3中有语音识别错误的情况下,也可以不对全句的翻译结果产生影响,而停留在局部的错误,可以提高翻译精度。此外,通过采用译词标注翻译,即使由翻译单位提取单元11分割出的翻译单位不是通常的翻译处理中最合适的单位,也可以进行精度高的翻译处理。
在显示控制单元13中,除了来自翻译单元12的翻译结果以外,还从操作单元4或语音识别处理单元3输入字符串。显示控制单元13在从操作单元4或语音识别处理单元3输入了字符串的情况下,使输入的字符串随时显示在显示单元5上。此外,显示控制单元13在从翻译单元12输入了翻译结果的情况下,使输入的翻译结果(日本译词)与已经显示的字符串(英语单词)对应关联而显示在显示单元5上。显示控制单元13将从翻译单元12依次输入的翻译结果(各个翻译单位的翻译结果)依次存储在自身具有的缓冲器(未图示)中,使显示单元5依次显示存储的各个翻译结果。
显示控制单元13在将翻译结果与显示中的英语单词对应关联显示时,将翻译结果从英语单词的开头起依次显示。此外,翻译单位提取单元11进行了重叠处理的情况下,本实施方式的显示控制单元13可以对于通过重叠处理附加在后侧的翻译单位中的、前侧的翻译单位的单词,作为后侧的翻译单位的翻译结果来显示。
由此,显示控制单元13不仅将翻译结果从显示中的英语单词的开头起依次显示,而且可以适当地显示通过重叠处理附加在后侧的翻译单位中而恰当翻译的结果。显示控制单元13根据来自用户通过操作单元4的指示,切换将通过重叠处理附加在后侧的翻译单位中的单词的翻译结果作为前侧的翻译单位的翻译结果显示,或作为后侧的翻译单位的翻译结果显示。
图4A~图4C是表示翻译结果的显示例子的说明图。图4A表示将翻译结果从显示中的英语单词的开头起依次显示的状态。在用户通过操作单元4指示了将通过重叠处理附加在后侧的翻译单位中的单词的翻译结果作为前侧的翻译单位的翻译结果显示的情况下,如图4A所示,显示控制单元13将翻译结果从显示中的英语单词的开头起依次显示。
图4B、图4C表示将通过重叠处理附加在后侧的翻译单位中的单词的翻译结果作为后侧的翻译单位的翻译结果显示的状态。在用户通过操作单元4指示了将通过重叠处理附加在后侧的翻译单位中的单词的翻译结果作为后侧的翻译单位的翻译结果显示的情况下,如图4B、图4C所示,显示控制单元13显示翻译结果。具体地说,显示控制单元13将通过重叠处理附加在后侧的翻译单位中的单词(‘are hungry around’)的翻译结果作为后侧的翻译单位的翻译结果显示。再有,图4B在上段表示第1翻译单位,在下段表示第2翻译单位,并表示对于第1翻译单位中的‘are hungry around’的翻译结果作为第2翻译单位的翻译结果显示的事实。实际上,显示控制单元13在图4C所示的状态下,使显示单元5显示输入的英语单词和日本语译词。
这样,通过将通过重叠处理附加在后侧的翻译单位中的单词的翻译结果作为后侧的翻译单位的翻译结果显示,例如,即使词组被分断在了前后的翻译单位情况下,也可以高效率显示翻译结果。此外,例如,在临时显示前侧的翻译单位的翻译结果,显示后侧的翻译单位的翻译结果时,在通过重叠处理删除了显示附加在后侧的翻译单位中的单词的翻译结果的情况下,产生显示的重写造成的画面的闪烁。但是,如上所述,在将通过重叠处理附加在后侧的翻译单位中的单词作为后侧的翻译单位的翻译结果显示的情况下,可以避免这样的状况。
以下,基于流程图说明本实施方式的翻译装置10进行的翻译处理。图5是表示翻译装置10的翻译处理的步骤的流程图。再有,以下的处理,由翻译装置10的控制单元1执行。
翻译装置10的控制单元1判断通过操作单元4是否获取到字符串作为翻译对象,或通过语音输入单元6及语音识别处理单元3是否获取到字符串作为翻译对象(S1)。在判断为未获取字符串的情况下(S1:“否”),控制单元1等待至获取字符串为止。在判断为获取到字符串的情况下(S1:“是”),控制单元1使显示单元5显示获取到的字符串(S2)。
控制单元1对于依次获取的字符串进行翻译单位提取处理(S3),按规定的每个翻译单位进行分割,提取在各个翻译单位中包含的字符串。图6是表示翻译单位提取处理的步骤的流程图。
控制单元1基于来自用户通过操作单元4的设定,判断在提取翻译单位中包含的字符串时是否指定了进行重叠处理(S11)。在判断为指定了进行重叠处理的情况下(S11:“是”),控制单元1在重叠处理中前侧的翻译单位中包含的字符串之中,设定被附加在后侧的翻译单位中的单词数(重叠单词数)(S12)。再有,可以预先设定重叠单词数,也可以对指示了开始翻译处理的每个用户变更重叠单词数。
控制单元1将依次获取的字符串分割为规定的每个翻译单位(S13),进行重叠处理(S14)。具体地说,控制单元1将字符串分割为每9单词,对于各自分割了的翻译单位,将分别从前后的翻译单位的、前侧的翻译单位的末尾起3单词附加到后侧的翻译单位的开头,如图3C、图3D所示,成为第1翻译单位、第2翻译单位...。再有,本实施方式的翻译装置10不限于将9单词作为一个翻译单位处理的结构。
控制单元1提取在第1翻译单位、第2翻译单位...的各个翻译单位中包含的字符串(单词)(S15)。控制单元1判断获取到的字符串是否还有(S16),在判断为还有的情况下(S16:“是”),返回到步骤S13的处理,对于获取到的全部字符串,重复步骤S13~S15的处理。在判断为获取到的字符串没有的情况下(S16:“否”),控制单元1结束翻译单位提取处理,返回到图5所示的处理。
在步骤S11中判断为没有指定进行重叠处理的情况下(S11:“否”),控制单元1将依次获取的字符串分割为规定的每个翻译单位(S17),提取在各个翻译单位中包含的字符串(单词)(S18)。这里,控制单元1将字符串分割为每9单词,分别提取在分割了的翻译单位中包含的字符串。控制单元1判断获取到的字符串是否还有(S19),在判断为还有的情况下(S19:“是”),返回到步骤S17的处理,对于获取到的全部字符串,重复步骤S17、S18的处理。在判断为获取到的字符串没有的情况下(S19:“否”),控制单元1结束翻译单位提取处理,返回到图5所示的处理。
控制单元1对通过上述翻译单位提取处理而依次提取的每个翻译单位进行翻译处理(S4)。控制单元1对于各个翻译单位中的单词、词组、短语,从翻译用辞典2b中读出对应的日本语的译词,对每个翻译单位将与各自的英语单词对应的日本语译词作为翻译结果存储在规定的缓冲器中(S5)。控制单元1对于各个翻译单位的翻译结果进行显示单位控制处理(S6),控制与步骤S2中显示的英语单词对应关联而显示翻译结果时的显示单位。
图7是表示显示单位控制处理的步骤的流程图。控制单元1判断在步骤S3中将字符串分割为翻译单位时是否执行了重叠处理(S21)。在判断为执行了重叠处理的情况下(S21:“是”),控制单元1判断对于通过重叠处理附加在后侧的翻译单位中的、前侧的翻译单位的单词,是否指定了作为后侧的翻译单位的翻译结果显示(S22)。
在判断为作为后侧的翻译单位的翻译结果显示的情况下(S22:“是”),控制单元1进行规定的显示控制处理(S23)。具体地说,控制单元1将通过重叠处理附加在当前的翻译单位中的、一个前侧的翻译单位的单词的翻译结果附加在当前的翻译单位的翻译结果中,将通过重叠处理附加到后侧的翻译单位中的单词的翻译结果从当前的翻译单位的翻译结果中除去。
更正确地,从通过步骤S3的翻译单位提取处理提取出的各个翻译单位中,将对于除了通过重叠处理附加到后侧的翻译单位中的单词以外的单词(字符串)的翻译结果作为当前翻译单位的翻译结果。再有,从当前翻译单位中除去了的单词的翻译结果包含在下个翻译单位(后侧的翻译单位)的翻译结果中。控制单元1将前后的翻译单位中的各个翻译结果包含在适当的显示单位中,提取与各个显示单位对应的翻译结果(S24)。
控制单元1判断步骤S4的翻译结果是否还有(S25),在判断为还有的情况下(S25:“是”),返回到步骤S23的处理,对于全部的翻译结果,重复步骤S23、S24的处理。在判断为翻译结果没有的情况下(S25:“否”),控制单元1结束显示单位控制处理,返回到图5所示的处理。
在步骤S21中判断为没有执行重叠处理的情况下(S21:“否”),或者判断为在步骤S22中没有指定作为后侧的翻译单位的翻译结果显示的情况下(S22:“否”),控制单元1将处理移动至步骤S26。控制单元1对步骤S4中的翻译处理的每个单位(翻译单位),提取对于各个翻译单位的翻译结果(S26)。控制单元1判断步骤S4的翻译结果是否还有(S27),在判断为还有的情况下(S27:“是”),返回到步骤S26的处理,对于全部的翻译结果,重复步骤S26的处理。在判断为翻译结果没有的情况下(S27:“否”),控制单元1结束显示单位控制处理,返回到图5所示的处理。
控制单元1将通过上述显示单位控制处理依次提取的翻译结果与步骤S2中显示的英语单词对应关联显示(S7)。由此,控制单元1在将翻译结果与显示中的英语单词对应关联显示时,不仅可以从英语单词的开头起依次显示,还可以对于通过重叠处理附加到后侧的翻译单位中的、前侧的翻译单位的单词,作为后侧的翻译单位的翻译结果显示。
控制单元1判断通过操作单元4是否指示了结束翻译处理(S8),在判断为没有指示结束的情况下(S8:“否”),将处理返回到步骤S1,重复步骤S1~S7的处理。在判断为指示了结束的情况下(S8:“是”),控制单元1结束上述翻译处理。
如上所述,本实施方式的翻译装置10使显示单元5显示输入的翻译前的英语的字符串,并且随时翻译为日本语,使翻译结果与显示中的英语单词对应关联显示。因此,由于输入的英语单词和作为其翻译结果的日本语的译词被对应关联显示,所以收看者不仅能够掌握输入的英语单词,其翻译结果也可以容易掌握。此外,本实施方式的翻译装置10从随时输入的英语单词中,随时提取在规定的翻译单位中包含的英语单词,对提取出的每个单位进行翻译。因此,可以不等待中断或结束字符串的输入,而渐进地进行翻译处理,在从输入字符串至显示翻译结果为止的处理中,可进行实时性高的处理。再有,如果预先准备与要翻译的语言对应的翻译用辞典,则翻译装置10不限于将英语翻译成日本语的结构。
本实施方式的翻译装置10在从输入的英语单词中提取各个翻译单位的英语单词时进行重叠处理,所以如词组被分断在了前后的翻译单位中情况下,即使是控制单元1分割的翻译单位并非为翻译处理中最合适的单位的情况下,也可以执行精度高的翻译处理。此外,由于将通过重叠处理附加到后侧的翻译单位中的、前侧的翻译单位的单词的翻译结果作为后侧的翻译单位的翻译结果显示,所以能够更正确地显示翻译结果。
在本实施方式中,为以下结构:翻译单元12将通过翻译单位提取单元11提取出的各个翻译单位中包含的字符串依次存储在缓冲器中,显示控制单元13将翻译单元12的翻译结果按每个翻译单位依次存储在缓冲器中。除此以外,例如,也可以为将通过操作单元4或语音输入单元6及语音识别处理单元3依次输入的字符串按单词单位分别存储在缓冲器中的结构。这种情况下,在翻译单位提取单元11进行重叠处理时,可以高效率地提取在前后的翻译单位中被重复提取的各个单词。
在本实施方式中,将一个翻译单位中包含的单词数及重叠单词数设为预先设定了单词数或设为通过用户任意地变更的单词数。除此以外,例如,在前侧的翻译单位的末尾包含词组的情况下,也可以将构成该词组的所有单词包含在后侧的翻译单位中。具体地说,第1翻译单位包含第1单词、第2单词、第3单词、第4单词、第5单词,第2单词和第3单词为词组的情况下,也可以将第2单词~第5单词转到后侧的翻译单位中。这种情况下,例如,翻译单位提取单元11基于在翻译用辞典2b中注册的词组,判断输入的字符串中的各个单词是否构成词组。此外,在判断为构成词组的情况下,翻译单位提取单元11判断构成词组的各个单词通过重叠处理是否在转到后侧的翻译单位中的边界部分且是否被分断。然后,在判断为词组在边界部分被分断的情况下,翻译单位提取单元11将构成词组的所有单词转到后侧的翻译单位中即可。
在本实施方式中,说明了将通过翻译装置10中设置的操作单元4输入的字符信息进行翻译,将通过语音输入单元6输入的语音信息利用语音识别处理进行变换所得的字符信息进行翻译的结构。但是,翻译装置10也可以是仅包括操作单元4或语音识别处理单元3一方作为获取翻译对象的字符串的部件的结构。
此外,例如,翻译装置10也可以是通过网络I/F单元7连接到外部装置,将外部装置通过自身的操作单元或语音输入单元获取到的字符信息或语音信息进行翻译的结构。在形成了这样的结构的情况下,在通过网络连接多个终端装置而构成的电视会议系统中,通过在一个终端装置上搭载本申请的翻译装置的功能,可以将各个终端装置的用户写入的字符信息或说话的语音、以及它们的翻译结果通过网络通知给其他的终端装置的用户。
以上,分别具体地说明了本发明的优选实施方式,但各个结构及动作等可进行适当变更,不限于上述实施方式。

Claims (1)

1.一种翻译装置,将由第1语言记述的字符串翻译成第2语言,包括:
获取单元,随时获取由第1语言记述的字符串;
显示单元,随时显示该获取单元获取到的字符串;
提取单元,从所述获取单元获取到的字符串,随时提取为作为翻译对象的规定单位中包含的字符串;
翻译单元,对该提取单元提取出的每个字符串翻译成第2语言;以及
显示控制单元,使该翻译单元的翻译结果与所述显示单元上显示出的字符串对应关联显示在所述显示单元上,
所述翻译单元对所述提取单元提取出的字符串中包含的单词分配与所述第2语言对应的译词,
所述提取单元将从前后相邻的规定单位的位于前侧的规定单位的字符串中的末尾起规定个数的单词,附加在位于后侧的规定单位的字符串的开头而提取,
所述显示控制单元将对于从位于所述前侧的规定单位的字符串中的末尾起规定个数的单词的翻译结果,作为对于位于所述后侧的规定单位的字符串的翻译结果显示在所述显示单元上,
所述翻译装置还包括:
单词数接受单元,接受在位于所述前侧的规定单位的字符串中,附加在位于所述后侧的规定单位的字符串中的单词个数,
所述提取单元将从位于所述前侧的规定单位的字符串中的末尾起所述单词个数接受单元接受了的单词个数的单词,附加在位于所述后侧的规定单位的字符串的开头,
所述获取单元包括输入接受单元和字符串变换单元的至少一方,所述输入接受单元随时接受由第1语言记述的字符串的输入,所述字符串变换单元随时接受用第1语言说话的语音的输入,将其随时变换为字符串,
所述提取单元将以下字符串之一作为所述规定单位:从所述字符串的输入开始起至中断了规定时间为止所述输入接受单元接受了的字符串、在预先设定了的时间内所述输入接受单元接受了的字符串、预先设定了的单词个数的字符串、或预先设定了的文本长度的字符串、从所述语音的输入开始起至无声持续了规定时间为止所述字符串变换单元对接受了的语音进行变换所得的字符串、所述字符串变换单元将语音变换为字符串时的处理单位的字符串、在预先设定了的时间内所述字符串变换单元对接受了的语音进行变换所得的字符串,
在将字符串分割为所述规定单位时,将从在前后相邻的位于所述规定单位中的前侧的规定单位的字符串的末尾起规定个数的单词,附加到位于后侧的规定单位中的字符串的开头,同时判断字符串中的各个单词是否构成词组,在构成所述词组的所述单词的一部分为附加到位于所述后侧的翻译单位中的单词时,将构成所述词组的所有所述单词附加到位于所述后侧的翻译单位中,
根据来自用户的指示,将通过重叠处理被附加在位于所述后侧的翻译单位的所述单词的翻译结果切换显示,作为位于所述前侧的翻译单位的翻译结果,或作为位于所述后侧的翻译单位的翻译结果,所述重叠处理将从位于所述前侧的翻译单位中包含的字符串中的末尾起规定个数的单词,附加到位于所述后侧的规定单位的开头并提取。
CN201110058868.3A 2010-03-12 2011-03-11 翻译装置及翻译方法 Active CN102193913B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2010056366A JP5058280B2 (ja) 2010-03-12 2010-03-12 翻訳装置、翻訳方法及びコンピュータプログラム
JP056366/10 2010-03-12

Publications (2)

Publication Number Publication Date
CN102193913A CN102193913A (zh) 2011-09-21
CN102193913B true CN102193913B (zh) 2014-07-16

Family

ID=44560783

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110058868.3A Active CN102193913B (zh) 2010-03-12 2011-03-11 翻译装置及翻译方法

Country Status (3)

Country Link
US (1) US8521508B2 (zh)
JP (1) JP5058280B2 (zh)
CN (1) CN102193913B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9304712B2 (en) * 2011-10-10 2016-04-05 Alcatel Lucent Automated word substitution for contextual language learning
CN104504005A (zh) * 2012-03-31 2015-04-08 北京奇虎科技有限公司 一种对输入数据的控制方法和装置
JP6233798B2 (ja) * 2013-09-11 2017-11-22 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation データを変換する装置及び方法
JP6235280B2 (ja) 2013-09-19 2017-11-22 株式会社東芝 音声同時処理装置、方法およびプログラム
JP6234188B2 (ja) * 2013-11-27 2017-11-22 シャープ株式会社 翻訳表示装置、翻訳表示方法、および制御プログラム
JP2016057986A (ja) * 2014-09-11 2016-04-21 株式会社東芝 音声翻訳装置、方法およびプログラム
JP6556473B2 (ja) * 2015-03-12 2019-08-07 株式会社東芝 送信装置、音声認識システム、送信方法、およびプログラム
KR102174565B1 (ko) * 2016-02-08 2020-11-05 미쓰비시덴키 가부시키가이샤 표시 제어 장치, 입력 표시 시스템, 표시 제어 방법 및 프로그램
EP3582120A4 (en) * 2017-02-07 2020-01-08 Panasonic Intellectual Property Management Co., Ltd. TRANSLATION DEVICE AND TRANSLATION METHOD
JP2018128925A (ja) * 2017-02-09 2018-08-16 富士通株式会社 情報出力プログラム、情報出力方法及び情報出力装置
CN107329960B (zh) * 2017-06-29 2019-01-01 哈尔滨工业大学 一种上下文敏感的神经网络机器翻译中未登录词翻译装置和方法
CN111104016B (zh) * 2019-08-02 2021-07-20 广州三星通信技术研究有限公司 提供翻译结果的方法及设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6047252A (en) * 1996-06-28 2000-04-04 Kabushiki Kaisha Toshiba Machine translation method and source/target text display method
CN1643490A (zh) * 2002-03-27 2005-07-20 接触及转换公司 用于翻转数字化虚拟文件中的页面的设备和方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6465662A (en) * 1987-09-07 1989-03-10 Hitachi Ltd Language processor
JP3356536B2 (ja) * 1994-04-13 2002-12-16 松下電器産業株式会社 機械翻訳装置
JP3066274B2 (ja) * 1995-01-12 2000-07-17 シャープ株式会社 機械翻訳装置
JP2758851B2 (ja) 1995-03-28 1998-05-28 株式会社エイ・ティ・アール音声翻訳通信研究所 自動翻訳装置及び自動通訳装置
US6282507B1 (en) * 1999-01-29 2001-08-28 Sony Corporation Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
US7860706B2 (en) * 2001-03-16 2010-12-28 Eli Abir Knowledge system method and appparatus
JP4050950B2 (ja) * 2002-07-26 2008-02-20 富士通株式会社 対訳候補表示装置および対訳候補表示プログラム
JP4428266B2 (ja) * 2005-03-22 2010-03-10 富士ゼロックス株式会社 翻訳装置およびプログラム
JP4087400B2 (ja) * 2005-09-15 2008-05-21 株式会社東芝 音声対話翻訳装置、音声対話翻訳方法および音声対話翻訳プログラム
US8209162B2 (en) * 2006-05-01 2012-06-26 Microsoft Corporation Machine translation split between front end and back end processors

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6047252A (en) * 1996-06-28 2000-04-04 Kabushiki Kaisha Toshiba Machine translation method and source/target text display method
CN1643490A (zh) * 2002-03-27 2005-07-20 接触及转换公司 用于翻转数字化虚拟文件中的页面的设备和方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
RalfD.Brown,et al.Reducing boundary friction using translation-fragment overlap.《Carnegie Mellon University Research Showcase》.2003,1-8.
Reducing boundary friction using translation-fragment overlap;RalfD.Brown,et al;《Carnegie Mellon University Research Showcase》;20031231;1-8 *

Also Published As

Publication number Publication date
JP5058280B2 (ja) 2012-10-24
US8521508B2 (en) 2013-08-27
US20110224968A1 (en) 2011-09-15
JP2011191922A (ja) 2011-09-29
CN102193913A (zh) 2011-09-21

Similar Documents

Publication Publication Date Title
CN102193913B (zh) 翻译装置及翻译方法
US9239829B2 (en) Speech recognition device
US8407039B2 (en) Method and apparatus of translating language using voice recognition
JP2013068952A (ja) 音声認識結果の統合
CN104239289B (zh) 音节划分方法和音节划分设备
CN109256133A (zh) 一种语音交互方法、装置、设备及存储介质
US20170372695A1 (en) Information providing system
US20200043493A1 (en) Translation device
JP2015036788A (ja) 外国語の発音学習装置
US11403470B2 (en) Translation device
CN110263334A (zh) 一种辅助外语学习的方法和可读存储介质
WO2020246175A1 (ja) 翻訳装置
Narayanan et al. The Transonics Spoken Dialogue Translator: An Aid for English-Persian Doctor-Patient Interviews.
CN111710328A (zh) 语音识别模型的训练样本选取方法、装置及介质
JP2010197709A (ja) 音声認識応答方法、音声認識応答システム、及びそのプログラム
KR101777141B1 (ko) 한글 입력 키보드를 이용한 훈민정음 기반 중국어 및 외국어 입력 장치 및 방법
EP2755202A1 (en) Voice recognition device
JP7012935B1 (ja) プログラム、情報処理装置、方法
JP2002323969A (ja) コミュニケーション支援方法およびこの方法を用いたシステムならびに装置
JP6298806B2 (ja) 音声翻訳システム及びその制御方法、並びに音声翻訳プログラム
JP4797307B2 (ja) 音声認識装置及び音声認識方法
CN114327090A (zh) 日文输入方法以及相关装置、设备
CN111951826A (zh) 一种语言测试装置、方法、介质和计算设备
JP2024029885A (ja) 文字入力装置、文字入力方法、および文字入力プログラム
WO2024039267A1 (ru) Обучение пользователя тонам китайских иероглифов

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant