JP5058280B2 - 翻訳装置、翻訳方法及びコンピュータプログラム - Google Patents

翻訳装置、翻訳方法及びコンピュータプログラム Download PDF

Info

Publication number
JP5058280B2
JP5058280B2 JP2010056366A JP2010056366A JP5058280B2 JP 5058280 B2 JP5058280 B2 JP 5058280B2 JP 2010056366 A JP2010056366 A JP 2010056366A JP 2010056366 A JP2010056366 A JP 2010056366A JP 5058280 B2 JP5058280 B2 JP 5058280B2
Authority
JP
Japan
Prior art keywords
character string
unit
translation
word
predetermined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010056366A
Other languages
English (en)
Other versions
JP2011191922A (ja
Inventor
いち子 佐田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2010056366A priority Critical patent/JP5058280B2/ja
Priority to CN201110058868.3A priority patent/CN102193913B/zh
Priority to US13/046,249 priority patent/US8521508B2/en
Publication of JP2011191922A publication Critical patent/JP2011191922A/ja
Application granted granted Critical
Publication of JP5058280B2 publication Critical patent/JP5058280B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Description

本発明は、第1言語で記述された文字列を第2言語に翻訳する翻訳装置、翻訳方法、該翻訳装置をコンピュータで実現するためのコンピュータプログラムに関する。
従来、発話音声を音声認識してテキスト化する音声認識技術、第1言語の文字列を異なる第2言語の文字列に翻訳する自動翻訳技術が知られている。また、これらの技術を組み合わせた音声翻訳システムも実用化されつつある。しかしながら、現在の技術レベルでは、処理速度又は処理精度の面で大きな課題があり、利用者が期待する程度のシステムの実現には達していない。
そこで、従来の技術と比較して短時間で翻訳できると共に、文全体として意味が通じるように自然な文に翻訳できる装置が提案されている(例えば、特許文献1参照)。特許文献1に開示された装置では、発話音声から得られた翻訳前の文字列が、予め用意された複数の分割パターンに基づいて分割され、分割された単位毎に目的の言語に翻訳(部分翻訳)される一方、分割されずに目的の言語に翻訳(全翻訳)される。そして、部分翻訳の結果と全翻訳の結果とが比較され、冗長な表現の省略が行なわれた後、最終的な翻訳結果として出力される。
特開平8−263499号公報
特許文献1に開示された装置では、部分翻訳を行なう際に用いる分割パターンを予め用意しておく必要がある。また、十分な分割パターンが網羅されていない場合、又は良好な翻訳結果が得られる程度に分割パターンの品質が良好でない場合には、高精度の翻訳処理を実現することは困難である。また、特許文献1に開示された装置は、部分翻訳及び全翻訳を行ない、更に部分翻訳の結果と全翻訳の結果とを比較して冗長な表現を削除する処理を行なうので、リアルタイム性を阻害するという問題がある。
本発明はかかる事情に鑑みてなされたものであり、その目的とするところは、随時入力される文字列を漸進的に翻訳することにより、翻訳精度を向上させつつ、リアルタイム性の高い翻訳処理を実行することが可能な翻訳装置、翻訳方法及びコンピュータプログラムを提供することにある。
本発明に係る翻訳装置は、第1言語で記述された文字列を第2言語に翻訳する翻訳装置において、第1言語で記述された文字列を随時取得する取得部と、該取得部が取得した文字列を随時表示する表示部と、前記取得部が取得した文字列から、翻訳対象とする所定単位に含まれる文字列を随時分割し、前後する所定単位における前側の所定単位に含まれる文字列中の末尾から所定数の単語を、後側の所定単位に含まれる文字列の先頭に付加し、各文字列を抽出する抽出部と、該抽出部が抽出した文字列毎に第2言語に翻訳する翻訳部と、該翻訳部による翻訳結果を、前記表示部に表示された文字列に対応付けて前記表示部に表示させる表示制御部とを備え、前記抽出部は、前記取得部が取得した文字列中の各単語が連語を構成するか否かを判断し、連語を構成すると判断した場合、連語を構成する単語の一部が、後側の所定単位に含まれる文字列の先頭に付加される単語であるか否かを判断し、前記連語を構成する単語の一部が、後側の所定単位に含まれる文字列の先頭に付加される単語であると判断した場合、前記連語を構成する単語の全てを後側の所定単位に含まれる文字列の先頭に付加して各文字列を抽出するようにしてあることを特徴とする。
本発明によれば、翻訳装置は、第1言語で記述された文字列を随時取得し、取得した文字列を随時表示すると共に随時第2言語に翻訳し、翻訳結果を、表示中の第1言語の文字列に対応付けて表示させる。よって、第1言語の文字列と、この文字列を翻訳した第2言語の文字列とが対応付けて表示されるので、視聴者は、入力された第1言語の文字列だけでなく、その翻訳結果としての第2言語の文字列も容易に把握することが可能となる。また、翻訳装置は、取得した文字列から、翻訳処理の対象とする所定単位に含まれる文字列を随時抽出し、抽出した文字列毎に翻訳する。よって、文字列の入力の中断又は終了を待つことなく、随時入力される文字列を順次翻訳するので、翻訳処理を漸進的に行なうことができ、文字列の入力から翻訳結果の表示までの処理において、リアルタイム性の高い処理が可能となる。また、翻訳装置は、前後する翻訳単位(翻訳処理の対象とする所定単位)の文字列において、前側の翻訳単位の文字列中の末尾から所定数の単語を、後側の翻訳単位の文字列の先頭に付加して翻訳する。その際、翻訳装置は、文字列中の各単語が連語を構成するか否かを判断し、連語を構成する単語の一部が、後側の翻訳単位に付加される場合、連語を構成する単語の全てを後側の翻訳単位に付加して翻訳する。よって、連語を構成する全ての単語が、後側の翻訳単位の先頭に含まれて翻訳されるので、連語が、前後する翻訳単位に分断されない。これにより、翻訳単位が必ずしも翻訳処理に最適な単位であるとは限らない場合であっても、精度の高い翻訳処理が可能となる。
本発明に係る翻訳装置は、前記翻訳部は、前記抽出部が抽出した文字列に含まれる単語に、第2言語の訳語を割り当てるようにしてあることを特徴とする。
本発明によれば、翻訳装置は、第1言語の文字列に含まれる単語に第2言語の訳語を割り当てる訳ふり翻訳と呼ばれる翻訳処理を行なう。例えば、翻訳装置は、第1言語の文字列に含まれる単語、連語(2個以上の単語で構成される複合語、動詞句、熟語、イディオム等)、フレーズ(単語や連語を連結して短い単位の句にしたもの)単位で訳語を生成する。また、翻訳装置が意図的に、又はユーザによって予め設定された「訳ふりレベル」に応じて、難易度の低い単語、連語、フレーズには訳語を割り当てないといった処理を行なう。よって、例えば、入力された文字列に誤りがあった場合、又は入力された音声を文字列に変換する際に音声認識誤りがあった場合であっても、文全体の翻訳結果に影響を与えず、局所的な誤りに止めることが可能となる。これにより、翻訳精度の向上が可能となる。また、訳ふり翻訳方式を採用することにより、通常の翻訳処理においては最適ではない単位においても精度の高い翻訳処理が可能となり、翻訳処理のリアルタイム性をより向上させることが可能となる。
本発明に係る翻訳装置は、前記表示制御部は、前記前側の所定単位の文字列中の末尾の、前記後側の所定単位に含まれる文字列の先頭に付加された単語に対する翻訳結果を、前記後側の所定単位の文字列に対する翻訳結果として前記表示部に表示させるようにしてあることを特徴とする。
本発明によれば、翻訳装置は、前側の翻訳単位の文字列中の末尾の、後側の所定単位の先頭に付加された単語に対する翻訳結果を、後側の翻訳単位の文字列に対する翻訳結果として表示させる。よって、前後する翻訳単位に連語が分断された場合であっても、精度の高い翻訳処理が可能となると共に、翻訳結果を効率よく表示させることが可能となる。また、例えば、前側の翻訳単位に含まれる連語の一部の翻訳結果を一旦表示し、この一部を含めた後側の翻訳単位の翻訳結果を表示する際に、前記一部の翻訳結果の表示を削除して後側の翻訳単位の翻訳結果を表示した場合、表示の書き換えによる画面のチラツキが発生する。しかし、本発明によれば、このような状況を回避することが可能となる。
本発明に係る翻訳装置は、前記前側の所定単位の文字列のうちで、前記後側の所定単位の文字列に付加される単語数を受け付ける単語数受付部を備え、前記抽出部は、前記前側の所定単位の文字列中の末尾から、前記単語数受付部が受け付けた単語数の単語を、前記後側の所定単位の文字列の先頭に付加するようにしてあることを特徴とする。
本発明によれば、前側の翻訳単位に含まれる文字列において、後側の翻訳単位の先頭に付加すべき単語数を任意に変更することが可能となる。
本発明に係る翻訳装置は、前記取得部は、第1言語で記述された文字列の入力を随時受け付ける入力受付部と、第1言語で発話された音声の入力を随時受け付け、文字列に随時変換する文字列変換部との少なくとも一方を備えることを特徴とする。
本発明によれば、翻訳装置は、第1言語で記述された文字列、又は第1言語で発話された音声から変換された文字列の少なくとも一方の入力を受け付ける。よって、例えば、テレビ会議システム又はチャットを介して送受信される文字情報だけでなく音声情報を翻訳の対象とすることが可能となる。
本発明に係る翻訳装置は、前記抽出部は、前記文字列の入力が開始されてから所定時間以上中断されるまでに前記入力受付部が受け付けた文字列、予め設定された時間内に前記入力受付部が受け付けた文字列、予め設定された単語数の文字列、又は、予め設定されたテキスト長の文字列を、前記所定単位とするようにしてあることを特徴とする。
本発明によれば、翻訳装置は、第1言語で記述された文字列の入力を受け付ける場合、文字列の入力が開始されてから所定時間以上中断されるまでに入力された文字列、予め設定された時間内に入力された文字列、予め設定された単語数の文字列、又は、予め設定されたテキスト長の文字列を1つの翻訳単位として翻訳する。よって、チャットシステムのように、従来から利用されている処理系に手を加えることなく、このような処理系を入力部とする翻訳システムを構築することが可能となる。
本発明に係る翻訳装置は、前記抽出部は、前記音声の入力が開始されてから所定時間以上無音が継続するまでに前記文字列変換部が受け付けた音声を変換した文字列、前記文字列変換部が音声を文字列に変換する際の処理単位の文字列、予め設定された時間内に前記文字列変換部が受け付けた音声を変換した文字列、予め設定された単語数の文字列、又は、予め設定されたテキスト長の文字列を、前記所定単位とするようにしてあることを特徴とする。
本発明によれば、翻訳装置は、第1言語で発話された音声から変換された文字列の入力を受け付ける場合、音声の受付を開始してから所定時間以上無音が継続するまでに受け付けた音声を変換して得られた文字列、音声を文字列に変換する際の処理単位の文字列、予め設定された時間内に変換された文字列、予め設定された単語数の文字列、又は、予め設定されたテキスト長の文字列を1つの翻訳単位として翻訳する。よって、音声認識システムのように、従来から利用されている処理系に手を加えることなく、このような処理系を入力部とする翻訳システムを構築することが可能となる。
本発明に係る翻訳方法は、第1言語で記述された文字列を翻訳装置にて第2言語に翻訳する翻訳方法において、前記翻訳装置が、第1言語で記述された文字列を随時取得して表示部に表示させるステップと、前記翻訳装置が、取得した文字列から、翻訳対象とする所定単位に含まれる文字列を随時分割し、前後する所定単位における前側の所定単位に含まれる文字列中の末尾から所定数の単語を、後側の所定単位に含まれる文字列の先頭に付加し、各文字列を抽出する抽出ステップと、前記翻訳装置が、抽出した文字列毎に第2言語に翻訳するステップと、前記翻訳装置が、翻訳結果を、前記表示部に表示された文字列に対応付けて前記表示部に表示させるステップとを含み、前記抽出ステップで、前記翻訳装置は、取得した文字列中の各単語が連語を構成するか否かを判断し、連語を構成すると判断した場合、連語を構成する単語の一部が、後側の所定単位に含まれる文字列の先頭に付加される単語であるか否かを判断し、前記連語を構成する単語の一部が、後側の所定単位に含まれる文字列の先頭に付加される単語であると判断した場合、前記連語を構成する単語の全てを後側の所定単位に含まれる文字列の先頭に付加して各文字列を抽出することを特徴とする。
本発明に係るコンピュータプログラムは、コンピュータに、第1言語で記述された文字列を第2言語に翻訳させるためのコンピュータプログラムにおいて、コンピュータに、第1言語で記述された文字列を随時取得して表示部に表示させるステップと、取得した文字列から、翻訳対象とする所定単位に含まれる文字列を随時分割し、前後する所定単位における前側の所定単位に含まれる文字列中の末尾から所定数の単語を、後側の所定単位に含まれる文字列の先頭に付加し、各文字列を抽出する抽出ステップと、抽出した文字列毎に第2言語に翻訳するステップと、翻訳結果を、前記表示部に表示された文字列に対応付けて前記表示部に表示させるステップとを実行させ、前記抽出ステップで、前記コンピュータに、取得した文字列中の各単語が連語を構成するか否かを判断させ、連語を構成すると判断した場合、連語を構成する単語の一部が、後側の所定単位に含まれる文字列の先頭に付加される単語であるか否かを判断させ、前記連語を構成する単語の一部が、後側の所定単位に含まれる文字列の先頭に付加される単語であると判断した場合、前記連語を構成する単語の全てを後側の所定単位に含まれる文字列の先頭に付加して各文字列を抽出させることを特徴とする。
本発明では、随時入力される文字列が、文字列の入力の中断又は終了を待つことなく翻訳されるので、翻訳処理が漸進的に実行される。よって、リアルタイム性の高い翻訳処理を実行でき、文字列を入力した利用者又は文字列を確認する視聴者に対して、翻訳処理の待ち時間に対するストレスを軽減することができる。また、第1言語の文字列と、この文字列を翻訳した第2言語の文字列とが対応付けて表示されるので、利用者及び視聴者は、入力された第1言語の文字列だけでなく、その翻訳結果としての第2言語の文字列も容易に把握できる。
本実施形態の翻訳装置の内部構成を示すブロック図である。 本実施形態の翻訳装置の機能構成を示す機能ブロック図である。 翻訳単位を説明するための説明図である。 翻訳結果の表示例を示す説明図である。 翻訳装置による翻訳処理の手順を示すフローチャートである。 翻訳単位抽出処理の手順を示すフローチャートである。 表示単位制御処理の手順を示すフローチャートである。
以下に、本発明に係る翻訳装置、翻訳方法及びコンピュータプログラムについて、その実施形態を示す図面に基づいて詳述する。なお、以下の実施形態では、本発明に係るコンピュータプログラムを公知のパーソナルコンピュータ、サーバコンピュータ等に読み取らせ、パーソナルコンピュータ又はサーバコンピュータのCPU(Central Processing Unit)等に実行させることによって本発明に係る翻訳装置を実現する構成について説明する。しかし、等価な働きをするハードウェアによって本発明に係る翻訳装置を実現してもよい。
図1は本実施形態の翻訳装置の内部構成を示すブロック図である。本実施形態の翻訳装置10は、制御部1、記憶部2、音声認識処理部3、操作部4、表示部5、音声入力部6及びネットワークI/F部7等を備え、これらのハードウェア各部は、バス1aを介して相互に接続されている。
制御部1は、CPU、MPU(Micro Processing Unit)等であり、上述したようなハードウェア各部を制御すると共に、記憶部2に格納されている制御プログラムを適宜実行する。記憶部2は、EEPROM(Electrically Erasable and Programmable ROM)、フラッシュROM、HDD(Hard Disk Drive)等である。記憶部2は、翻訳装置10を動作させるために必要な種々の制御プログラム、制御部1による制御プログラムの実行時に発生する種々のデータ等を記憶する。記憶部2は、制御プログラムとして、例えば、第1言語を第2言語に翻訳するための翻訳処理プログラム2a及び翻訳用辞書2b等を記憶している。
本実施形態では、翻訳装置10が英語から日本語への翻訳処理を行なう例について説明する。従って、翻訳用辞書2bには、英語の単語、連語(2個以上の単語で構成される複合語、動詞句、熟語、イディオム等)、フレーズ(単語や連語を連結して短い単位の句にしたもの)等について、対応する日本語の訳語が対応付けて登録されている。
記憶部2に記憶される各情報は、記憶部2に予め記憶されている構成に限られない。翻訳装置10が外部メモリ(図示せず)に記憶してあるデータの読み出しが可能なドライバ(図示せず)を備える場合には、外部メモリに記憶された各種情報をドライバによって読み出して記憶部2に記憶させてもよい。また、ネットワークI/F部7等を介して外部装置から各種情報をダウンロードして記憶部2に記憶させてもよい。
音声認識処理部3は、音声信号をテキスト情報に変換する音声認識処理を行なう。音声認識処理部3は、例えば後述する音声入力部6を介して入力された音声信号をテキスト情報(文字列)に変換する。具体的には、音声認識処理部3は、音声信号を音響分析して音響パラメータを抽出し、予め記憶されている音響モデルと照合し、最も類似する音響モデルに対応する単語を認識結果とする。なお、音声認識処理部3は、音声認識処理を制御部1が行なうための音声認識処理プログラム、音声認識処理を行なう際に必要な各種のデータベースを記憶部(図示せず)に記憶させた構成でもよい。この場合、制御部1が、音声認識処理部3の記憶部に記憶された音声認識処理プログラムを実行することにより、音声認識処理を実行できる。
操作部4は、例えば、マウス、キーボード、タブレット等であり、ユーザが翻訳装置10を操作するために必要な各種のボタンを備える。操作部4は、ユーザが入力した各種の情報を制御部1へ送出し、制御部1は、操作部4から取得した情報に応じた処理を実行する。
表示部5は、LCD(Liquid Crystal Display)、CRT(Cathode Ray Tube)、PDP(Plasma Display Panel)等の表示装置である。表示部5は、制御部1からの指示に従って映像信号を表示させる。
音声入力部6は、例えば、マイクロホン、A/D(アナログ/デジタル)変換器を備え、マイクロホンが集音したアナログの音声信号をデジタルの音声信号に変換する。
なお、操作部4、表示部5及び音声入力部6は、翻訳装置10の本体とは別体に構成されて、接続線を介して翻訳装置10の本体にそれぞれ接続されてもよいし、全てが一体に構成されてもよい。また、操作部4及び表示部5は、タッチパネル又はタブレットによって構成されてもよい。
ネットワークI/F部7は、LAN(Local Area Network)又はWAN(Wide Area Network)等のIP(Internet Protocol)ネットワークに接続するためのインタフェースである。ネットワークI/F部7は、IPネットワークを介して外部装置との間で情報の送受信を行なう。
以下に、上述した構成の翻訳装置10において、制御部1が記憶部2に記憶してある制御プログラムを実行することによって実現される各種の機能について説明する。図2は本実施形態の翻訳装置10の機能構成を示す機能ブロック図である。本実施形態の翻訳装置10において、操作部4を介して翻訳処理の実行を要求された場合、制御部1は、記憶部2に記憶してある翻訳処理プログラム2aを実行する。これにより、制御部1は、翻訳単位抽出部11、翻訳部12、表示制御部13等の各機能を実現する。
翻訳装置10は、翻訳処理の対象として、操作部(取得部)4を介して入力されるテキスト情報(文字列)、又は、音声入力部6を介して入力される音声信号を音声認識処理部3による音声認識処理によって随時変換したテキスト情報(文字列)を取得する。操作部4は、第1言語(ここでは英語)で記述された文字列の入力を随時受け付ける入力受付部として動作する。音声入力部6は、第1言語(ここでは英語)で発話された音声の入力を随時受け付け、音声認識処理部(取得部)3は、音声入力部6が受け付けた音声情報を文字列に随時変換する文字列変換部として動作する。
これにより、翻訳装置10が例えばチャットシステム又はテレビ会議システムを実現できる装置である場合に、チャットシステム又はテレビ会議システムを介して送受信される文字情報又は音声情報を翻訳対象とすることができる。
上述したように翻訳装置10が翻訳対象として取得した文字列は、翻訳単位抽出部11に入力される。翻訳単位抽出部(抽出部)11は、入力された文字列を、翻訳処理の単位(以下、翻訳単位という)に随時分割し、各翻訳単位に含まれる文字列を抽出して翻訳単位毎に翻訳部12へ出力する。本実施形態では、翻訳単位抽出部11は、予め設定された単語数(例えば9単語)を所定の翻訳単位とし、入力された文字列から所定の単語数の文字列を随時抽出して翻訳部12へ出力する。
なお、翻訳単位抽出部11が文字列を抽出する際の所定の翻訳単位は、予め設定された単語数に限られない。例えば、操作部4を介して文字列の入力が開始されてから所定時間以上入力が中断されるまでに入力された文字列、予め設定された時間内に操作部4を介して入力された文字列、又は、予め設定されたテキスト長の文字列を、1つの翻訳単位としてもよい。また、音声入力部6を介した音声信号の入力が開始されてから所定時間以上無音が継続するまでに入力された音声信号を変換して得られた文字列、音声認識処理部3が音声信号を文字列に変換する際の処理単位の文字列、又は、予め設定された時間内に音声認識処理部3が変換した文字列を、1つの翻訳単位としてもよい。
また、本実施形態の翻訳単位抽出部11は、入力された文字列から翻訳単位に含まれる文字列を抽出する際に、それぞれ前後する翻訳単位において、前側の翻訳単位に含まれる文字列中の末尾から所定数の単語を、後側の翻訳単位の先頭に付加して抽出するオーバラップ処理を行なう。翻訳単位抽出部11は、操作部4を介したユーザからの指示に従って、オーバラップ処理を行なった抽出処理、又はオーバラップ処理を行なわない抽出処理のいずれかを行なう。なお、オーバラップ処理を行なうか否かの設定は、ユーザによる指定だけでなく、予め設定されていてもよい。
図3は翻訳単位を説明するための説明図である。図3(a),(c)において、「aa」、「bb」…はそれぞれ1つの英単語を示している。また、ここでは、翻訳単位抽出部11が分割する所定の翻訳単位を9単語とし、オーバラップ処理によって、後側の翻訳単位に付加される単語数を3単語とする。
図3(a),(b)は、オーバラップ処理を行なわない抽出処理によって抽出される翻訳単位を示している。操作部4を介してユーザからオーバラップ処理を行なわないことが指示された場合、翻訳単位抽出部11は、図3(a),(b)に示すように、入力される文字列を先頭から順に9単語ずつに分割し、それぞれ分割された翻訳単位を、第1翻訳単位,第2翻訳単位…とする。
図3(c),(d)は、オーバラップ処理を行なった抽出処理によって抽出される翻訳単位を示している。操作部4を介してユーザからオーバラップ処理を行なうことが指示された場合、翻訳単位抽出部11は、まず、入力される文字列を先頭から順に9単語ずつに分割する。そして、翻訳単位抽出部11は、それぞれ前後する翻訳単位において、前側の翻訳単位の末尾から3単語を後側の翻訳単位の先頭に付加し、それぞれの翻訳単位を、第1翻訳単位,第2翻訳単位…とする。具体的には、図3(c)に示すように、第1翻訳単位(前側の翻訳単位)の末尾から3単語(「gg」,「hh」,「ii」)を第2翻訳単位(後側の翻訳単位)の先頭に付加し、第2翻訳単位(前側の翻訳単位)の末尾から3単語(「pp」,「qq」,「rr」)を第3翻訳単位(後側の翻訳単位)の先頭に付加する。また、図3(d)に示すように、第1翻訳単位(前側の翻訳単位)の末尾から3単語(「are」,「hungry」,「around」)を第2翻訳単位(後側の翻訳単位)の先頭に付加する。
このようなオーバラップ処理を行なうことにより、前後する翻訳単位に連語が分断された場合であっても、精度の高い翻訳処理が可能となる。
なお、前側の翻訳単位に含まれる文字列のうちで、後側の所定単位に付加される単語数は、予め設定されていてもよいし、操作部(単語数受付部)4を介してユーザから受け付けるようにしてもよい。これにより、オーバラップ処理において、後側の翻訳単位に付加される単語数を任意に設定でき、翻訳精度がより向上する適切な単語数を設定できる。
翻訳部12は、翻訳単位抽出部11から順次入力される文字列(各翻訳単位に含まれる文字列)を、自身が有するバッファ(図示せず)に順次格納する。翻訳部12は、翻訳用辞書2bを用いて、バッファに順次格納される各文字列に対して翻訳処理を行なう。本実施形態の翻訳部12は、例えば、各文字列に含まれる単語、連語、フレーズ単位で第2言語(ここでは日本語)の訳語を生成する翻訳処理(訳ふり翻訳)を行なう。また、翻訳用辞書2bに、各単語、連語、フレーズに対する難易度レベルが登録されている場合、翻訳部12は、意図的に又はユーザによって予め設定された「訳ふりレベル」に応じて、難易度の低い単語、連語、フレーズには訳語を割り当てないといった処理を行なう。翻訳部12は、各文字列に含まれる単語、連語、フレーズに対応する訳語を翻訳用辞書2bから読み出し、それぞれに日本語の訳語を対応付けて翻訳結果として表示制御部13へ出力する。
このように訳ふり翻訳を行なうことにより、例えば、操作部4を介して入力された文字列に誤りがあった場合、又は音声認識処理部3において音声認識誤りがあった場合であっても、文全体の翻訳結果に影響を与えず、局所的な誤りに止めることができ、翻訳精度を向上させることができる。また、訳ふり翻訳を採用することにより、翻訳単位抽出部11によって分割された翻訳単位が、通常の翻訳処理においては最適ではない単位であったとしても、精度の高い翻訳処理が可能となる。
表示制御部13には、翻訳部12からの翻訳結果のほかに、操作部4又は音声認識処理部3から文字列が入力されている。表示制御部13は、操作部4又は音声認識処理部3から文字列が入力された場合、入力された文字列を随時表示部5に表示させる。また、表示制御部13は、翻訳部12から翻訳結果が入力された場合、入力された翻訳結果(日本訳語)を、既に表示されている文字列(英単語)に対応付けて表示部5に表示させる。表示制御部13は、翻訳部12から順次入力される翻訳結果(各翻訳単位の翻訳結果)を、自身が有するバッファ(図示せず)に順次格納し、格納した各翻訳結果を表示部5に順次表示させる。
表示制御部13は、翻訳結果を表示中の英単語に対応付けて表示させる際に、英単語の先頭から順に翻訳結果を表示させる。また、翻訳単位抽出部11がオーバラップ処理を行なっていた場合、本実施形態の表示制御部13は、オーバラップ処理によって後側の翻訳単位に付加された、前側の翻訳単位の単語については、後側の翻訳単位の翻訳結果として表示させることもできる。
これにより、表示制御部13は、翻訳結果を表示中の英単語の先頭から順に表示させるだけでなく、オーバラップ処理によって後側の翻訳単位に付加されることによって適切に翻訳された結果を適切に表示させることができる。表示制御部13は、操作部4を介したユーザからの指示に従って、オーバラップ処理によって後側の翻訳単位に付加された単語の翻訳結果を、前側の翻訳単位の翻訳結果として表示させるか、又は後側の翻訳単位の翻訳結果として表示させるかを切り替える。
図4は翻訳結果の表示例を示す説明図である。図4(a)は、翻訳結果を表示中の英単語の先頭から順に表示させた状態を示している。操作部4を介してユーザから、オーバラップ処理によって後側の翻訳単位に付加された単語の翻訳結果を、前側の翻訳単位の翻訳結果として表示させることが指示された場合、表示制御部13は、図4(a)に示すように、翻訳結果を表示中の英単語の先頭から順に表示させる。
図4(b),(c)は、オーバラップ処理によって後側の翻訳単位に付加された単語の翻訳結果を、後側の翻訳単位の翻訳結果として表示させた状態を示している。操作部4を介してユーザから、オーバラップ処理によって後側の翻訳単位に付加された単語の翻訳結果を、後側の翻訳単位の翻訳結果として表示させることが指示された場合、表示制御部13は、図4(b),(c)に示すように翻訳結果を表示させる。具体的には、表示制御部13は、オーバラップ処理によって後側の翻訳単位に付加された単語(「are hungry around」)の翻訳結果を、後側の翻訳単位の翻訳結果として表示させる。なお、図4(b)は、上段に第1翻訳単位を、下段に第2翻訳単位をそれぞれ示しており、第1翻訳単位中の「are hungry around」に対する翻訳結果は、第2翻訳単位の翻訳結果として表示されていることを示している。実際には、表示制御部13は、図4(c)に示すような状態で、入力された英単語と日本訳語とを表示部5に表示させる。
このように、オーバラップ処理によって後側の翻訳単位に付加された単語の翻訳結果を、後側の翻訳単位の翻訳結果として表示させることにより、例えば、前後する翻訳単位に連語が分断された場合であっても、翻訳結果を効率よく表示させることができる。また、例えば、前側の翻訳単位の翻訳結果を一旦表示させ、後側の翻訳単位の翻訳結果を表示する際に、オーバラップ処理によって後側の翻訳単位に付加された単語の翻訳結果の表示を削除した場合、表示の書き換えによる画面のチラツキが発生する。しかし、上述したように、オーバラップ処理によって後側の翻訳単位に付加された単語を後側の翻訳単位の翻訳結果として表示させることとした場合、このような状況を回避できる。
以下に、本実施形態の翻訳装置10が行なう翻訳処理についてフローチャートに基づいて説明する。図5は翻訳装置10による翻訳処理の手順を示すフローチャートである。なお、以下の処理は、翻訳装置10の制御部1によって実行される。
翻訳装置10の制御部1は、翻訳対象として、操作部4を介して文字列を取得したか否か、又は、音声入力部6及び音声認識処理部3を介して文字列を取得したか否かを判断する(S1)。文字列を取得していないと判断した場合(S1:NO)、制御部1は、文字列を取得するまで待機する。文字列を取得したと判断した場合(S1:YES)、制御部1は、取得した文字列を表示部5に表示させる(S2)。
制御部1は、順次取得する文字列に対して翻訳単位抽出処理を行ない(S3)、所定の翻訳単位毎に分割し、各翻訳単位に含まれる文字列を抽出する。図6は翻訳単位抽出処理の手順を示すフローチャートである。
制御部1は、操作部4を介したユーザからの設定に基づいて、翻訳単位に含まれる文字列を抽出する際にオーバラップ処理を行なうことを指定されているか否かを判断する(S11)。オーバラップ処理を行なうことを指定されていると判断した場合(S11:YES)、制御部1は、オーバラップ処理において前側の翻訳単位に含まれる文字列のうちで、後側の翻訳単位に付加される単語数(オーバラップ単語数)を設定する(S12)。なお、オーバラップ単語数は、予め設定されていてもよいし、翻訳処理の開始を指示したユーザ毎に変更されてもよい。
制御部1は、順次取得する文字列を、所定の翻訳単位毎に分割し(S13)、オーバラップ処理を行なう(S14)。具体的には、制御部1は、文字列を9単語毎に分割し、それぞれ分割した翻訳単位について、それぞれ前後する翻訳単位の、前側の翻訳単位の末尾から3単語を後側の翻訳単位の先頭に付加し、図3(c),(d)に示すように、第1翻訳単位,第2翻訳単位…とする。なお、本実施形態の翻訳装置10は、9単語を1つの翻訳単位として扱う構成に限らない。
制御部1は、第1翻訳単位,第2翻訳単位…の各翻訳単位に含まれる文字列(単語)を抽出する(S15)。制御部1は、取得した文字列がまだ有るか否かを判断し(S16)、まだ有ると判断した場合(S16:YES)、ステップS13の処理に戻り、取得した全ての文字列に対して、ステップS13〜S15の処理を繰り返す。取得した文字列が無いと判断した場合(S16:NO)、制御部1は、翻訳単位抽出処理を終了し、図5に示す処理に戻る。
ステップS11でオーバラップ処理を行なうことを指定されていないと判断した場合(S11:NO)、制御部1は、順次取得する文字列を、所定の翻訳単位毎に分割し(S17)、各翻訳単位に含まれる文字列(単語)を抽出する(S18)。ここでは、制御部1は、文字列を9単語毎に分割し、それぞれ分割した翻訳単位に含まれる文字列を抽出する。制御部1は、取得した文字列がまだ有るか否かを判断し(S19)、まだ有ると判断した場合(S19:YES)、ステップS17の処理に戻り、取得した全ての文字列に対して、ステップS17,S18の処理を繰り返す。取得した文字列が無いと判断した場合(S19:NO)、制御部1は、翻訳単位抽出処理を終了し、図5に示す処理に戻る。
制御部1は、上述した翻訳単位抽出処理によって順次抽出される翻訳単位毎に翻訳処理を行なう(S4)。制御部1は、各翻訳単位中の単語、連語、フレーズについて、対応する日本語の訳語を翻訳用辞書2bから読み出し、それぞれの英単語と対応する日本訳語とを翻訳結果として翻訳単位毎に所定のバッファに記憶する(S5)。制御部1は、各翻訳単位の翻訳結果に対して表示単位制御処理を行ない(S6)、ステップS2で表示された英単語に対応付けて翻訳結果を表示させる際の表示単位を制御する。
図7は表示単位制御処理の手順を示すフローチャートである。制御部1は、ステップS3で文字列を翻訳単位に分割する際にオーバラップ処理を実行したか否かを判断する(S21)。オーバラップ処理を実行したと判断した場合(S21:YES)、制御部1は、オーバラップ処理によって後側の翻訳単位に付加された、前側の翻訳単位の単語については、後側の翻訳単位の翻訳結果として表示させることが指定されているか否かを判断する(S22)。
後側の翻訳単位の翻訳結果として表示させることが指定されていると判断した場合(S22:YES)、制御部1は、所定の表示制御処理を行なう(S23)。具体的には、制御部1は、オーバラップ処理によって現在の翻訳単位に付加された、1つ前側の翻訳単位の単語の翻訳結果を、現在の翻訳単位の翻訳結果に付加し、オーバラップ処理によって後側の翻訳単位に付加された単語の翻訳結果を、現在の翻訳単位の翻訳結果から除く。
より正確には、ステップS3の翻訳単位抽出処理によって抽出された各翻訳単位から、オーバラップ処理によって後側の翻訳単位に付加された単語を除いた単語(文字列)に対する翻訳結果を、現在の翻訳単位の翻訳結果とする。なお、現在の翻訳単位から除かれた単語の翻訳結果は、次の翻訳単位(後側の翻訳単位)の翻訳結果に含まれる。制御部1は、前後する翻訳単位における各翻訳結果を適切な表示単位に含め、各表示単位に対応する翻訳結果を抽出する(S24)。
制御部1は、ステップS4による翻訳結果がまだ有るか否かを判断し(S25)、まだ有ると判断した場合(S25:YES)、ステップS23の処理に戻り、全ての翻訳結果に対して、ステップS23,S24の処理を繰り返す。翻訳結果が無いと判断した場合(S25:NO)、制御部1は、表示単位制御処理を終了し、図5に示す処理に戻る。
ステップS21でオーバラップ処理を実行していないと判断した場合(S21:NO)、又はステップS22で後側の翻訳単位の翻訳結果として表示させることが指定されていないと判断した場合(S22:NO)、制御部1は、ステップS26に処理を移行する。制御部1は、ステップS4における翻訳処理の単位(翻訳単位)毎に、各翻訳単位に対する翻訳結果を抽出する(S26)。制御部1は、ステップS4による翻訳結果がまだ有るか否かを判断し(S27)、まだ有ると判断した場合(S27:YES)、ステップS26の処理に戻り、全ての翻訳結果に対して、ステップS26の処理を繰り返す。翻訳結果が無いと判断した場合(S27:NO)、制御部1は、表示単位制御処理を終了し、図5に示す処理に戻る。
制御部1は、上述した表示単位制御処理によって順次抽出される翻訳結果を、ステップS2で表示された英単語に対応付けて表示させる(S7)。これにより、制御部1は、翻訳結果を表示中の英単語に対応付けて表示させる際に、英単語の先頭から順に表示させるだけでなく、オーバラップ処理によって後側の翻訳単位に付加された、前側の翻訳単位の単語については、後側の翻訳単位の翻訳結果として表示させることもできる。
制御部1は、操作部4を介して翻訳処理の終了が指示されたか否かを判断しており(S8)、終了が指示されていないと判断した場合(S8:NO)、ステップS1に処理を戻し、ステップS1〜S7の処理を繰り返す。終了が指示されたと判断した場合(S8:YES)、制御部1は、上述した翻訳処理を終了する。
上述したように、本実施形態の翻訳装置10は、入力された翻訳前の英語の文字列を表示部5に表示させると共に、随時日本語に翻訳し、翻訳結果を、表示中の英単語に対応付けて表示させる。よって、入力された英単語と、その翻訳結果である日本語の訳語とが対応付けて表示されるので、視聴者は、入力された英単語だけでなく、その翻訳結果も容易に把握できる。また、本実施形態の翻訳装置10は、随時入力される英単語から、所定の翻訳単位に含まれる英単語を随時抽出し、抽出した単位毎に翻訳する。よって、文字列の入力の中断又は終了を待つことなく、翻訳処理を漸進的に行なうことができ、文字列の入力から翻訳結果の表示までの処理において、リアルタイム性の高い処理が可能となる。なお、翻訳装置10は、翻訳すべき言語に対応する翻訳用辞書が予め用意されていれば、英語を日本語に翻訳する構成に限らない。
本実施形態の翻訳装置10は、入力された英単語から、各翻訳単位の英単語を抽出する際にオーバラップ処理を行なうので、前後する翻訳単位に連語が分断された場合のように、制御部1が分割する翻訳単位が必ずしも翻訳処理に最適な単位であるとは限らない場合であっても、精度の高い翻訳処理を実行できる。また、オーバラップ処理によって後側の翻訳単位に付加された、前側の翻訳単位の単語の翻訳結果を、後側の翻訳単位の翻訳結果として表示させるので、翻訳結果をより正確に表示させることができる。
本実施形態では、翻訳部12が、翻訳単位抽出部11によって抽出された各翻訳単位に含まれる文字列をバッファに順次記憶し、表示制御部13が、翻訳部12による翻訳結果を翻訳単位毎にバッファに順次記憶する構成であった。このほかに、例えば、操作部4、又は、音声入力部6及び音声認識処理部3を介して順次入力される文字列を単語単位でそれぞれバッファに記憶する構成としてもよい。この場合、翻訳単位抽出部11が、オーバラップ処理を行なう際に、前後する翻訳単位において重複して抽出される各単語を効率よく抽出することができる。
本実施形態では、1つの翻訳単位に含まれる単語数及びオーバラップ単語数をそれぞれ、予め設定された単語数又はユーザによって任意に変更された単語数とした。このほかに、例えば、前側の翻訳単位の末尾に連語が含まれる場合、この連語を構成する全ての単語を後側の翻訳単位に含めるようにしてもよい。具体的には、第1翻訳単位が、第1単語,第2単語,第3単語,第4単語,第5単語を含んでおり、第2単語及び第3単語が連語である場合、第2単語〜第5単語を後側の翻訳単位に回すようにしてもよい。この場合、例えば、翻訳単位抽出部11が、翻訳用辞書2bに登録されている連語に基づいて、入力された文字列中の各単語が連語を構成するか否かを判断する。また、連語を構成すると判断した場合に、翻訳単位抽出部11が、連語を構成する各単語が、オーバラップ処理によって後側の翻訳単位に回されるか否かの境界部分で分断されるか否かを判断する。そして、境界部分で連語が分断されると判断した場合に、翻訳単位抽出部11が、連語を構成する全ての単語を後側の翻訳単位に回すようにすればよい。
本実施形態では、翻訳装置10に設けられた操作部4を介して入力された文字情報、音声入力部6を介して入力された音声情報を音声認識処理によって変換して得られた文字情報を翻訳する構成について説明した。しかし、翻訳装置10は、翻訳対象の文字列を取得する手段として、操作部4又は音声認識処理部3の一方のみ備える構成であってもよい。
また、例えば、翻訳装置10が、ネットワークI/F部7を介して外部装置に接続されており、外部装置が自身の操作部又は音声入力部を介して取得した文字情報又は音声情報を翻訳する構成としてもよい。このような構成とした場合、ネットワークを介して複数の端末装置を接続して構成されるテレビ会議システムにおいて、1つの端末装置に本願の翻訳装置の機能を搭載することによって、各端末装置のユーザが書き込んだ文字情報又は発話した音声と、これらの翻訳結果とを、ネットワークを介して他の端末装置のユーザに通知することができる。
以上、本発明の好適な実施形態についてそれぞれ具体的に説明したが、各構成及び動作等は適宜変更可能であって、上述の実施形態に限定されることはない。
10 翻訳装置
1 制御部
3 音声認識処理部(取得部、文字列変換部)
4 操作部(取得部、入力受付部、単語数受付部)
11 翻訳単位抽出部(抽出部)
12 翻訳部
13 表示制御部

Claims (9)

  1. 第1言語で記述された文字列を第2言語に翻訳する翻訳装置において、
    第1言語で記述された文字列を随時取得する取得部と、
    該取得部が取得した文字列を随時表示する表示部と、
    前記取得部が取得した文字列から、翻訳対象とする所定単位に含まれる文字列を随時分割し、前後する所定単位における前側の所定単位に含まれる文字列中の末尾から所定数の単語を、後側の所定単位に含まれる文字列の先頭に付加し、各文字列を抽出する抽出部と、
    該抽出部が抽出した文字列毎に第2言語に翻訳する翻訳部と、
    該翻訳部による翻訳結果を、前記表示部に表示された文字列に対応付けて前記表示部に表示させる表示制御部と
    を備え
    前記抽出部は、前記取得部が取得した文字列中の各単語が連語を構成するか否かを判断し、連語を構成すると判断した場合、連語を構成する単語の一部が、後側の所定単位に含まれる文字列の先頭に付加される単語であるか否かを判断し、前記連語を構成する単語の一部が、後側の所定単位に含まれる文字列の先頭に付加される単語であると判断した場合、前記連語を構成する単語の全てを後側の所定単位に含まれる文字列の先頭に付加して各文字列を抽出するようにしてあることを特徴とする翻訳装置。
  2. 前記翻訳部は、前記抽出部が抽出した文字列に含まれる単語に、第2言語の訳語を割り当てるようにしてあることを特徴とする請求項1に記載の翻訳装置。
  3. 前記表示制御部は、前記前側の所定単位の文字列中の末尾の、前記後側の所定単位に含まれる文字列の先頭に付加された単語に対する翻訳結果を、前記後側の所定単位の文字列に対する翻訳結果として前記表示部に表示させるようにしてあることを特徴とする請求項1又は2に記載の翻訳装置。
  4. 前記前側の所定単位の文字列のうちで、前記後側の所定単位の文字列に付加される単語数を受け付ける単語数受付部を備え、
    前記抽出部は、前記前側の所定単位の文字列中の末尾から、前記単語数受付部が受け付けた単語数の単語を、前記後側の所定単位の文字列の先頭に付加するようにしてあることを特徴とする請求項1から3までのいずれかひとつに記載の翻訳装置。
  5. 前記取得部は、第1言語で記述された文字列の入力を随時受け付ける入力受付部と、第1言語で発話された音声の入力を随時受け付け、文字列に随時変換する文字列変換部との少なくとも一方を備えることを特徴とする請求項1からまでのいずれかひとつに記載の翻訳装置。
  6. 前記抽出部は、前記文字列の入力が開始されてから所定時間以上中断されるまでに前記入力受付部が受け付けた文字列、予め設定された時間内に前記入力受付部が受け付けた文字列、予め設定された単語数の文字列、又は、予め設定されたテキスト長の文字列を、前記所定単位とするようにしてあることを特徴とする請求項に記載の翻訳装置。
  7. 前記抽出部は、前記音声の入力が開始されてから所定時間以上無音が継続するまでに前記文字列変換部が受け付けた音声を変換した文字列、前記文字列変換部が音声を文字列に変換する際の処理単位の文字列、予め設定された時間内に前記文字列変換部が受け付けた音声を変換した文字列、予め設定された単語数の文字列、又は、予め設定されたテキスト長の文字列を、前記所定単位とするようにしてあることを特徴とする請求項5又は6に記載の翻訳装置。
  8. 第1言語で記述された文字列を翻訳装置にて第2言語に翻訳する翻訳方法において、
    前記翻訳装置が、第1言語で記述された文字列を随時取得して表示部に表示させるステップと、
    前記翻訳装置が、取得した文字列から、翻訳対象とする所定単位に含まれる文字列を随時分割し、前後する所定単位における前側の所定単位に含まれる文字列中の末尾から所定数の単語を、後側の所定単位に含まれる文字列の先頭に付加し、各文字列を抽出する抽出ステップと、
    前記翻訳装置が、抽出した文字列毎に第2言語に翻訳するステップと、
    前記翻訳装置が、翻訳結果を、前記表示部に表示された文字列に対応付けて前記表示部に表示させるステップと
    を含み、
    前記抽出ステップで、前記翻訳装置は、取得した文字列中の各単語が連語を構成するか否かを判断し、連語を構成すると判断した場合、連語を構成する単語の一部が、後側の所定単位に含まれる文字列の先頭に付加される単語であるか否かを判断し、前記連語を構成する単語の一部が、後側の所定単位に含まれる文字列の先頭に付加される単語であると判断した場合、前記連語を構成する単語の全てを後側の所定単位に含まれる文字列の先頭に付加して各文字列を抽出することを特徴とする翻訳方法。
  9. コンピュータに、第1言語で記述された文字列を第2言語に翻訳させるためのコンピュータプログラムにおいて、
    コンピュータに、
    第1言語で記述された文字列を随時取得して表示部に表示させるステップと、
    取得した文字列から、翻訳対象とする所定単位に含まれる文字列を随時分割し、前後する所定単位における前側の所定単位に含まれる文字列中の末尾から所定数の単語を、後側の所定単位に含まれる文字列の先頭に付加し、各文字列を抽出する抽出ステップと、
    抽出した文字列毎に第2言語に翻訳するステップと、
    翻訳結果を、前記表示部に表示された文字列に対応付けて前記表示部に表示させるステップとを実行させ
    前記抽出ステップで、前記コンピュータに、取得した文字列中の各単語が連語を構成するか否かを判断させ、連語を構成すると判断した場合、連語を構成する単語の一部が、後側の所定単位に含まれる文字列の先頭に付加される単語であるか否かを判断させ、前記連語を構成する単語の一部が、後側の所定単位に含まれる文字列の先頭に付加される単語であると判断した場合、前記連語を構成する単語の全てを後側の所定単位に含まれる文字列の先頭に付加して各文字列を抽出させることを特徴とするコンピュータプログラム。
JP2010056366A 2010-03-12 2010-03-12 翻訳装置、翻訳方法及びコンピュータプログラム Active JP5058280B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2010056366A JP5058280B2 (ja) 2010-03-12 2010-03-12 翻訳装置、翻訳方法及びコンピュータプログラム
CN201110058868.3A CN102193913B (zh) 2010-03-12 2011-03-11 翻译装置及翻译方法
US13/046,249 US8521508B2 (en) 2010-03-12 2011-03-11 Translation apparatus and translation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010056366A JP5058280B2 (ja) 2010-03-12 2010-03-12 翻訳装置、翻訳方法及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2011191922A JP2011191922A (ja) 2011-09-29
JP5058280B2 true JP5058280B2 (ja) 2012-10-24

Family

ID=44560783

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010056366A Active JP5058280B2 (ja) 2010-03-12 2010-03-12 翻訳装置、翻訳方法及びコンピュータプログラム

Country Status (3)

Country Link
US (1) US8521508B2 (ja)
JP (1) JP5058280B2 (ja)
CN (1) CN102193913B (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9304712B2 (en) * 2011-10-10 2016-04-05 Alcatel Lucent Automated word substitution for contextual language learning
CN104504005A (zh) * 2012-03-31 2015-04-08 北京奇虎科技有限公司 一种对输入数据的控制方法和装置
JP6233798B2 (ja) * 2013-09-11 2017-11-22 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation データを変換する装置及び方法
JP6235280B2 (ja) 2013-09-19 2017-11-22 株式会社東芝 音声同時処理装置、方法およびプログラム
JP6234188B2 (ja) * 2013-11-27 2017-11-22 シャープ株式会社 翻訳表示装置、翻訳表示方法、および制御プログラム
JP2016057986A (ja) * 2014-09-11 2016-04-21 株式会社東芝 音声翻訳装置、方法およびプログラム
JP6556473B2 (ja) * 2015-03-12 2019-08-07 株式会社東芝 送信装置、音声認識システム、送信方法、およびプログラム
CN108700981B (zh) * 2016-02-08 2022-06-28 三菱电机株式会社 输入显示控制装置、输入显示控制方法和输入显示系统
JP6631930B2 (ja) * 2017-02-07 2020-01-15 パナソニックIpマネジメント株式会社 翻訳装置および翻訳方法
JP2018128925A (ja) * 2017-02-09 2018-08-16 富士通株式会社 情報出力プログラム、情報出力方法及び情報出力装置
CN107329960B (zh) * 2017-06-29 2019-01-01 哈尔滨工业大学 一种上下文敏感的神经网络机器翻译中未登录词翻译装置和方法
CN111104016B (zh) * 2019-08-02 2021-07-20 广州三星通信技术研究有限公司 提供翻译结果的方法及设备

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6465662A (en) * 1987-09-07 1989-03-10 Hitachi Ltd Language processor
JP3356536B2 (ja) * 1994-04-13 2002-12-16 松下電器産業株式会社 機械翻訳装置
JP3066274B2 (ja) * 1995-01-12 2000-07-17 シャープ株式会社 機械翻訳装置
JP2758851B2 (ja) 1995-03-28 1998-05-28 株式会社エイ・ティ・アール音声翻訳通信研究所 自動翻訳装置及び自動通訳装置
JPH1074204A (ja) * 1996-06-28 1998-03-17 Toshiba Corp 機械翻訳方法及び原文・訳文表示方法
US6282507B1 (en) * 1999-01-29 2001-08-28 Sony Corporation Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
US7860706B2 (en) * 2001-03-16 2010-12-28 Eli Abir Knowledge system method and appparatus
SE525338C2 (sv) * 2002-03-27 2005-02-01 Touch & Turn Ab Anordning och förfarande för att vända blad i ett digitaliserat virtuellt dokument
JP4050950B2 (ja) * 2002-07-26 2008-02-20 富士通株式会社 対訳候補表示装置および対訳候補表示プログラム
JP4428266B2 (ja) * 2005-03-22 2010-03-10 富士ゼロックス株式会社 翻訳装置およびプログラム
JP4087400B2 (ja) * 2005-09-15 2008-05-21 株式会社東芝 音声対話翻訳装置、音声対話翻訳方法および音声対話翻訳プログラム
US8209162B2 (en) * 2006-05-01 2012-06-26 Microsoft Corporation Machine translation split between front end and back end processors

Also Published As

Publication number Publication date
US20110224968A1 (en) 2011-09-15
JP2011191922A (ja) 2011-09-29
CN102193913B (zh) 2014-07-16
CN102193913A (zh) 2011-09-21
US8521508B2 (en) 2013-08-27

Similar Documents

Publication Publication Date Title
JP5058280B2 (ja) 翻訳装置、翻訳方法及びコンピュータプログラム
KR102484967B1 (ko) 음성 전환 방법, 장치 및 전자 기기
AU2012227212B2 (en) Consolidating speech recognition results
JP4064413B2 (ja) コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
US20150179173A1 (en) Communication support apparatus, communication support method, and computer program product
KR100859532B1 (ko) 대응 문형 패턴 기반 자동통역 방법 및 장치
JP2011182125A (ja) 会議システム、情報処理装置、会議支援方法、情報処理方法、及びコンピュータプログラム
JP6336749B2 (ja) 音声合成システム及び音声合成方法
JP2009186820A (ja) 音声処理システム、音声処理プログラム及び音声処理方法
CN109256133A (zh) 一种语音交互方法、装置、设备及存储介质
US20170372695A1 (en) Information providing system
KR20170035529A (ko) 전자 기기 및 그의 음성 인식 방법
JPWO2017217046A1 (ja) 情報処理装置及び情報処理方法
JP5271299B2 (ja) 音声認識装置、音声認識システム、及び音声認識プログラム
JPWO2011033834A1 (ja) 音声翻訳システム、音声翻訳方法および記録媒体
JP2010160608A (ja) 対話装置、対話プログラムおよび対話方法
JP5396530B2 (ja) 音声認識装置および音声認識方法
JP4436087B2 (ja) 文字データ修正装置、文字データ修正方法および文字データ修正プログラム
JP6555553B2 (ja) 翻訳装置
JP5160594B2 (ja) 音声認識装置および音声認識方法
JP6090785B2 (ja) テキストデータ分割装置、テキストデータ分割方法、テキストデータ分割プログラム及び翻訳装置
EP2283481A1 (en) Method and system for converting speech into text
JP2011027971A (ja) 音声認識装置、音声認識方法及びそのプログラム
JP7403569B2 (ja) 音声認識結果処理方法および装置、電子機器、コンピュータ可読記憶媒体並びにコンピュータプログラム
JP6640788B2 (ja) 言語変換プログラム及び言語変換装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111213

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120201

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120710

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120731

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150810

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5058280

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150