JP2008083855A - 機械翻訳を行う装置、システム、方法およびプログラム - Google Patents

機械翻訳を行う装置、システム、方法およびプログラム Download PDF

Info

Publication number
JP2008083855A
JP2008083855A JP2006261350A JP2006261350A JP2008083855A JP 2008083855 A JP2008083855 A JP 2008083855A JP 2006261350 A JP2006261350 A JP 2006261350A JP 2006261350 A JP2006261350 A JP 2006261350A JP 2008083855 A JP2008083855 A JP 2008083855A
Authority
JP
Japan
Prior art keywords
source language
translation
document
ambiguity
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006261350A
Other languages
English (en)
Other versions
JP4398966B2 (ja
Inventor
Satoshi Kamaya
聡史 釜谷
Tetsuro Chino
哲朗 知野
Kentaro Kohata
建太郎 降幡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2006261350A priority Critical patent/JP4398966B2/ja
Priority to CNA2007101469666A priority patent/CN101154219A/zh
Priority to US11/898,298 priority patent/US8214197B2/en
Publication of JP2008083855A publication Critical patent/JP2008083855A/ja
Application granted granted Critical
Publication of JP4398966B2 publication Critical patent/JP4398966B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)

Abstract

【課題】高精度に翻訳する機械翻訳装置を提供すること。
【解決手段】原言語による文である原言語文を少なくとも1つ含む原言語文書の入力を受付ける文書受付部101と、原言語文書を対訳文書に翻訳し対訳文書と曖昧情報とを記憶部120に保存する翻訳部102と、原言語による発話を受付ける発話受付部103と、受付けた発話を音声認識し、認識結果である原言語発話文を生成する音声認識部104と、原言語文に曖昧部分が存在する場合に、原言語発話文の曖昧部分に対応する発話内容に基づいて原言語文の曖昧部分を再翻訳し、記憶部120に記憶された対訳文書を更新する翻訳更新部105と、対訳文書を表示する表示制御部106と、を備えた。
【選択図】 図1

Description

この発明は、会議資料や講演資料などの文書を翻訳する装置、システム、方法およびプログラムに関するものである。
近年、会議や講演会などにおいて、電子的に作成した資料等を参加者に配布する、または、投影装置を利用して表示するなどのように、IT技術を取り入れたプレゼンテーション活動が頻繁に行われるようになってきた。また、国際化の進展に伴って、異なる言語を母語とする者が参加する国際的な交流の場も頻繁に設けられるようになっている。また、テレビ電話やIPネットワークなどの種々の通信網を活用することが可能となったことにより、電子的な資料を用いた国際交流の機会は、今後さらに増加していくものと予想される。
一方、自然言語処理技術の進展に伴い、例えば日本語で書かれた任意のテキストを、英語などの他言語テキストに変換する機械翻訳装置が実用化されている。これにより、話し手の母語で作成した会議資料等を、聞き手側の母語に翻訳して提供することができる。
また、音声処理技術の進展に伴い、電子データとして存在する自然言語文字列を、音声出力に変換する音声合成装置や、ユーザにより入力された音声発話を文字列変換し、音声による自然言語文字列の入力を可能にする音声入力装置が実用化されている。
さらに、自然言語処理技術、および音声処理技術の進展に伴い、これら技術の統合することにより、異なる言語を母語とする者同士のコミュニケーションを支援する通訳コミュニケーション支援装置も実現されつつある。これにより、前述したような会議資料の翻訳のみならず、プレゼンテーション中の異言語発話を翻訳することが可能となり、母語の異なる者が参加する場において、その言葉の壁を緩和することができるようになってきた。
以上述べたように、これら翻訳の技術は、国際的な会議、講演といった、異言語を母語とする者どうしの交流の場において、相互理解の一助となり、非常に有益である。
ところが、会議資料や公演資料は、口頭での説明や参加者の背景知識を前提に作られており、必要最小限の情報しか含まれていない場合が多いため、翻訳処理の過程で生じる解釈の曖昧性を解決するための知識を得ることが難しい。このため、会議資料や講演資料の機械翻訳が困難となる場合が多い。特に、近年盛んに利用されているスライドを用いたプレゼンテーションではその傾向が顕著である。さらに、自然言語固有の曖昧さも依然として存在しており、本質的に機械翻訳が困難な場合も多い。
このような課題に対応するため、特許文献1では、会議資料と同様に文脈の少なさを有する英文ニュース記事のヘッドラインを、記事本文の内容を参照しながら高精度に翻訳するための技術が提案されている。
特開2002−222189号公報
しかしながら、会議などで用いられる資料は、背景知識や詳細な情報を口頭で発表することを前提とし、最小限度の表現にとどめられることが多いため、特許文献1のように資料の内容を参照したとしても、その資料内のみから得られる知識で高精度な翻訳を提供することは非常に困難であるという問題があった。
本発明は、上記に鑑みてなされたものであって、会議資料の文書などの最小限の内容で構成される文書であっても高精度に翻訳することができる機械翻訳装置、機械翻訳システム、機械翻訳方法および機械翻訳プログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明は、原言語で記載された原言語文書の入力を受付ける文書受付手段と、前記原言語文書を対象言語で記載された対訳文書に翻訳するとともに、翻訳処理で曖昧性が生じた語または文である曖昧部分に関する曖昧情報を生成する翻訳手段と、前記対訳文書と、前記曖昧情報とを記憶する記憶手段と、原言語による発話を受付ける発話受付手段と、前記発話受付手段が受付けた前記発話を音声認識し、認識結果である原言語発話文を生成する認識手段と、前記原言語文書に前記曖昧部分が存在する場合に、前記原言語発話文の前記曖昧部分に対応する発話内容に基づいて前記原言語文書の前記曖昧部分を再翻訳し、前記記憶手段に記憶された前記対訳文書を更新する翻訳更新手段と、更新された前記対訳文書を表示手段に表示する表示制御手段と、
を備えたことを特徴とする。
また、本発明は、上記装置を実行することができる方法およびプログラムである。
また、本発明は、原言語で記載された原言語文書を表示する表示装置と、前記表示装置とネットワークで接続され、前記原言語文書を対象言語への翻訳結果である対訳文書に翻訳する機械翻訳装置とを有する機械翻訳システムであって、前記機械翻訳装置は、前記原言語文書の入力を受付ける文書受付手段と、前記原言語文書を前記対訳文書に翻訳するとともに、翻訳処理で曖昧性が生じた語または文である曖昧部分に関する曖昧情報を生成する翻訳手段と、前記対訳文書と、前記曖昧情報とを記憶する記憶手段と、原言語による発話を受付ける発話受付手段と、前記発話受付手段が受付けた前記発話を音声認識し、認識結果である原言語発話文を生成する認識手段と、前記原言語文書に前記曖昧部分が存在する場合に、前記原言語発話文の前記曖昧部分に対応する発話内容に基づいて前記原言語文書の前記曖昧部分を再翻訳し、前記記憶手段に記憶された前記対訳文書を更新する翻訳更新手段と、更新された前記対訳文書を第1表示手段に表示する第1表示制御手段と、前記記憶手段に記憶された前記曖昧情報を前記表示装置に送信する送信手段と、備え、前記表示装置は、前記曖昧情報を前記機械翻訳装置から受信する受信手段と、前記受信手段が受信した前記曖昧情報に基づいて、前記曖昧性が生じた部分に前記曖昧性が生じたことを示す情報を関連づけた前記原言語文書を、第2表示手段に表示する第2表示制御手段と、を備えたことを特徴とする。
本発明によれば、発話の翻訳結果を参照して資料の翻訳結果で生じた曖昧性を解消することができる。このため、会議資料の文書などの最小限の内容で構成される文書であっても高精度に翻訳することができるという効果を奏する。
以下に添付図面を参照して、この発明にかかる機械翻訳装置、機械翻訳システム、機械翻訳方法および機械翻訳プログラムの最良な実施の形態を詳細に説明する。なお、以下では、日本語と英語との間の翻訳を例に説明を進めるが、翻訳対象となる言語は当該2言語に限られることなく、あらゆる言語を対象とすることができる。
(第1の実施の形態)
第1の実施の形態にかかる機械翻訳装置は、会議資料、プレゼンテーション資料などを説明するために発話された内容を参照して会議資料等に含まれる文書の翻訳結果で生じた曖昧性を解消するものである。
なお、以下では、句点、疑問符、感嘆符などで区切られる文字列の単位を文といい、少なくとも1つの文を含み1つのまとまった内容を表す文字列の単位を文書という。
図1は、第1の実施の形態にかかる機械翻訳装置100の構成を示すブロック図である。同図に示すように、機械翻訳装置100は、記憶部120と、文書受付部101と、翻訳部102と、発話受付部103と、音声認識部104と、翻訳更新部105と、表示制御部106と、音声出力制御部107と、を備えている。
記憶部120は、翻訳結果テーブル121と、曖昧性テーブル122とを記憶する記憶媒体であり、HDD(Hard Disk Drive)、光ディスク、メモリカード、RAM(Random Access Memory)などの一般的に利用されているあらゆる記憶媒体により構成することができる。
翻訳結果テーブル121は、翻訳処理結果を格納するテーブルである。図2は、翻訳結果テーブル121のデータ構造の一例を示す説明図である。同図に示すように、翻訳結果テーブル121は、資料内の文を一意に識別する文IDと、資料内の文の翻訳結果とを対応づけて格納している。同図では、英語で記載された資料を日本語に翻訳した場合の翻訳結果の一例が示されている。
また、本実施の形態では、説明を簡便なものとするために、資料内の文書の各行には1つの文が記載されていることを前提としており、各行に連番付与する行番号を文IDとして用いる。なお、各行に2以上の文が含まれるような資料の場合は、行ごとではなく文ごとに文IDを付与することで、資料中の文を一意に特定できるようにする。
曖昧性テーブル122は、翻訳処理で生じた曖昧性に関する曖昧情報を格納するテーブルである。図3は、曖昧性テーブル122のデータ構造の一例を示す説明図である。同図に示すように、曖昧性テーブル122は、文IDと、曖昧性の種類および曖昧性が生じた部分の位置情報を含む曖昧情報とを対応づけて格納している。
曖昧性の種類としては、文に含まれる単語の訳語を選択する際に曖昧性が生じたことを表す「訳語選択」、文に含まれる単語間の係り受け関係を特定する際に曖昧性が生じたことを表す「係り受け」などの、翻訳結果に影響を与えるあらゆる曖昧性の種類を指定できる。
曖昧性が生じた部分の位置情報は、「(k、l)、(m、n)」の形式で指定する。(k、l)のkおよびlは、それぞれ曖昧性が生じた単語の翻訳の原言語による文における開始位置および終端位置を表す。例えば、(k、l)が(2、5)であれば、原言語による文の先頭から2番目の単語から5番目の単語までの部分で曖昧性が生じたことを表す。同様に、(m、n)のmおよびnは、それぞれ曖昧性が生じた単語の翻訳の対象言語による文における開始位置および終端位置を表す。
なお、以下では、曖昧性テーブル122に格納されたレコードを曖昧性レコードという。
文書受付部101は、プレゼンテーション資料や会議資料などのテキスト形式の文書情報の入力を受付けるものである。文書受付部101は、電子的に作成された文書を、磁気テープ、磁気ディスク、光ディスクなどに代表されるコンピュータ読み取り可能な記憶媒体を介して入力する方法、インターネットなどのネットワーク経由でダウンロードする方法、紙媒体等コンピュータが直接扱えない形式の文書をOCR(光学式文字読取装置)などによって電子的形式に変換して入力する方法など、従来から用いられているあらゆる文書情報の入力方法を適用することができる。
以降の説明では、文書受付部101が受付けた文書を原言語文書と呼び、原言語文書を構成する文を原言語文と呼ぶことにする。
翻訳部102は、文書受付部101が受付けた原言語文書を翻訳の対象言語で記述された文書である対訳文書に翻訳する処理を制御するものである。また、翻訳部102は、翻訳結果である対訳文書を翻訳結果テーブル121に保存し、翻訳処理で生じた曖昧性に関する曖昧情報を曖昧性テーブル122に保存する。
具体的には、翻訳部102は、原言語文書から原言語文を取り出しながら、取り出した原言語文を指定された対象言語で逐次翻訳し、翻訳結果である対訳文と、その翻訳処理過程で生じた曖昧性を表す曖昧情報とを対応づけて翻訳結果テーブル121に保存する。曖昧情報は、上述のように、翻訳過程で生じた曖昧性の種類と、曖昧性が生じた原言語による文での位置と、曖昧性が生じた対訳文での位置と、を対応付けた情報として表される。
例えば、英語の文「Difficulties of processing SL」を日本語に翻訳するときに、英語文中の単語「SL」の訳語として、「原言語(Source Language)」「話し言葉(Spoken Language)」「回収損(Salvage Loss)」「海面(Sea Level)」「記号原語(Symbolic Language)」を意味する5種類の日本語が考えられたと仮定する。この場合、翻訳部102はデフォルト処理として最初の訳語「原言語」を選択した日本語の対訳文(「原言語を処理する障害」)を出力する。
また、この場合は訳語が複数考えられるという曖昧性が生じた場合に該当するため、翻訳部102は、曖昧性の種類として「訳語選択」を指定し、曖昧性が発生した英語文内の単語「SL」の開始位置を表す4、終端位置を表す4、および、対訳文内の単語(「原言語」)の開始位置を表す1、終端位置を表す1とを対応付けて、(訳語選択、(4、4)、(1、1))を曖昧情報として出力する。
また、例えば、英語の文「It requires a special mechanism for a recognizer.」を日本語に翻訳する過程で、2通りの係り受けの解釈曖昧性が生じたと仮定する。図4は、係り受けの解釈曖昧性の一例を示す説明図である。
同図の解釈401は、「a recognizer」が「special mechanisms」に依存する解釈であることを表したものである。日本語訳では「それは認識装置用の特別なメカニズムを要求する」を意味する。なお、同図の矢印は、単語間の係り受けの関係を示すものである。
同図の402は、「a recognizer」が「requires」に依存する解釈であることを表したものである。日本語訳では「それは認識装置に特別なメカニズムを要求する」を意味する。
この場合、翻訳部102は、デフォルト処理として最初の解釈401を選択するとともに、曖昧性の種類として「係り受け」を指定し、曖昧性が発生した英語文中の開始位置を表す1、終端位置を表す7、および、対訳文内の開始位置を表す1、同終端位置を表す8とを対応付けて、(係り受け、(1、7)、(1、8))を曖昧情報として出力する。
なお、翻訳部102より行われる翻訳処理は、一般的なトランスファ方式、用例ベース方式、統計ベース方式、中間言語方式の機械翻訳システムで利用されているあらゆる方法を適用することができる。また、曖昧性を検知するために、A*アルゴリズムを用いた形態素解析や、アーリー法、チャート法、一般化LR法による構文解析、あるいは、Shankのスクリプト、談話表示理論に基づく文脈解析や談話解析など、一般的に広く知られ、利用されているあらゆる方法を適用することが可能である。
発話受付部103は、ユーザからの音声入力を受付けるものであり、図示しないマイク等から入力された音声のアナログ信号に対してサンプリングを行い、ステレオのデジタル信号に変換して出力する処理を行う。発話受付部103の処理では、従来から用いられているA/D変換技術などを適用することができる。
音声認識部104は、発話受付部103が受付けた音声に対し音声認識処理を行い、テキスト形式で出力するものである。この際に行われる音声認識処理は、LPC分析、隠れマルコフモデル(HMM:Hidden Markov Model)などを用いた、一般的に利用されているあらゆる音声認識方法を適用することができる。以降、音声認識部104によって出力されたテキストを原言語発話文と呼ぶことにする。
なお、発話受付部103および音声認識部104を用いて発話をテキスト形式に変換する代わりに、例えば、キーボード、マウスなどによって発話の内容(原言語発話文)を直接入力する構成、または、文書受付部101と同様に発話音声を書き起こした原言語発話文を入力する構成とすることも可能である。
翻訳更新部105は、原言語発話文を翻訳の対象言語で記述された文である発話対訳文に翻訳し、発話対訳文と曖昧性テーブル122に保存された曖昧情報とを参照して、対訳文書の翻訳で生じた曖昧性を解消し、曖昧性を解消した対訳文書で記憶部120の翻訳結果テーブル121を更新する処理を制御するものである。
具体的には、翻訳更新部105は、発話受付部103によって受付けられた原言語発話文を、翻訳しながら、文書受付部101によって受付けられた原言語文書中の原言語文と、原言語発話文とを対応付けることによって、翻訳時に生じた曖昧性を解消する。また、翻訳更新部105は、解消した曖昧性を翻訳部102の出力である対訳文書に反映するとともに、曖昧性を記憶している曖昧性テーブル122を更新する。
図5は、翻訳更新部105の具体的な構成の一例を示すブロック図である。翻訳更新部105は、抽出部501と、翻訳結果選択部502と、を備えている。
抽出部501は、文書受付部101によって受付けられた原言語文書から、発話受付部103によって受付けられた原言語発話文と最も類似する原言語文を1つ抽出するものである。
具体的には、抽出部501は、入力された原言語発話文が原言語文書中のどの範囲に対応する発話であるかを推定する処理である第1のアライメント処理を実行する。第1のアライメント処理で対応付けされる範囲は、スライドで構成されるプレゼンテーション資料であれば、例えば各スライド単位であり、また、章立てされた会議資料であれば、例えば章や節単位である。
このように、抽出部501の最終出力である原言語発話文に最も類似する原言語文を探す範囲を、話し手が現在説明している範囲に絞り込むことで、抽出部501は、より高速かつ高精度に対応付け処理ができるようなる。
第1のアライメント処理は、例えば、「次は」、「さて」、「次に示します」などのように、スライドやトピックの移り変わりに出現する表現を予め記憶部(図示せず)に登録しておき、登録した表現と話し手の発話に現れる表現とをキーワードマッチさせることで、スライドや説明箇所の移り変わりを検出する技術を利用することができる。この他、発話とテキストの対応関係を類似度として算出し、ダイナミックプログラミング等を用いて算出値が最大となる対応づけを検出する技術や、話し手の発話が入力された時点で表示されているスライドや場所をそのまま対応づけ位置に設定する技術など、従来から用いられているあらゆる対応づけ技術を利用することができる。
さらに、第1のアライメント処理は、話し手側が聞き手に向けて提示しているページや、指示装置(図示せず)によって話し手が指し示している位置の情報や、例えば「第3.3節について説明する」などのように発話に含まれる説明位置を指示するキーワードなどを検出する方法を組み合わせることで、その精度を向上させるように構成することも可能である。
具体的には、抽出部501は、事前に記憶部(図示せず)に記憶された、頁、章、節、段落などの文書の範囲情報を表すキーワードと照合することにより、原言語発話文から当該キーワードを検出し、検出したキーワードに対応する原言語文書内の範囲を特定する。そして、抽出部501は、特定した範囲から原言語文を抽出する。
次に、抽出部501は、第1のアライメント処理によって推定された範囲に含まれる原言語文のうち、原言語発話文と最も類似するものを対応付ける処理である、第2のアライメント処理を実行する。
本実施の形態では、第1のアライメント処理によって推定された範囲に含まれる原言語文それぞれに対して、各原言語文を構成する単語と、原言語発話文を構成する単語との全ての組み合わせについて類似度を計算しながら、以下の(1)式の左辺である文類似度SIMsを最大化するような単語の対応付けを実現する原言語文を出力する。
Figure 2008083855
ただし、(1)式の文類似度SIMsが示す類似度が予め定められた閾値以下である場合は、対応する原言語文が存在しないと判断し、第2のアライメント処理が失敗したものとして処理を終了する。
なお、(1)式のMは原言語発話文であり、Nは、第1のアライメント処理によって推定された範囲に含まれる原言語文であり、wiはMに含まれるi番目の語句であり、wjはNに含まれるj番目の語句であり、mは、Mに含まれる語句の数を表す。また、SIMw(wi、wj)は、単語の類似度を計算する関数を示し、シソーラスに配置された概念間の距離を計算する手法などの、従来から用いられているあらゆる単語間の類似度算出方法を適用することができる。
以上の処理によって、入力された原言語文書に含まれる原言語文の内、原言語発話文と最も類似するものが対応付けられ、さらに、原言語文と原言語発話文それぞれを構成する単語の類似度に基づく対応関係が得られる。
翻訳結果選択部502は、抽出部501のアライメント結果に従って、翻訳結果の再選択を行うことにより、曖昧性テーブル122に記憶された曖昧性を解消するものである。例えば、曖昧性が訳語選択であった場合、翻訳結果選択部502は、抽出部501のアライメント結果で対応付けられた原言語発話内の単語の訳語を優先して選択し直す。また、例えば、曖昧性が係り受けであった場合、翻訳結果選択部502は、原言語発話文の解析で採用された依存関係を優先して、原言語文の解析結果を選択する。
表示制御部106は、原言語文の対訳文と、記憶部120が保持する曖昧性テーブル122と、を参照し翻訳曖昧性が生じた場所を明示して原言語文書の訳出結果を画面に表示する。具体的には、表示制御部106は、曖昧性が発生した部分を「<」と「>」とで対応付けて括ることで翻訳曖昧性が生じたことを表す。
音声出力制御部107は、原言語発話文を翻訳した結果である発話対訳文を音声合成し、合成した音声を出力するものである。音声出力制御部107により行われる音声合成処理は、音声素片編集音声合成、フォルマント音声合成、音声コーパスベースの音声合成、テキストトゥスピーチなどの一般的に利用されているあらゆる方法を適用することができる。
なお、テキストを画面表示するディスプレイなどの表示部に対象言語のテキストを出力する方法、プリンタなどへのテキスト印刷により対象言語文を出力する方法などの従来から用いられているあらゆる出力方法を、音声出力制御部107による出力と併用または代用するように構成してもよい。
次に、このように構成された第1の実施の形態にかかる機械翻訳装置100による機械翻訳処理について説明する。図6は、第1の実施の形態における機械翻訳処理の全体の流れを示すフローチャートである。
まず、入力されたテキスト形式の原言語文書を翻訳する静的翻訳処理が実行される(ステップS601)。次に、原言語文書の説明等のために発話された原言語発話文を参照して静的翻訳処理で生じた曖昧性を解消する動的翻訳処理が実行される(ステップS602)。静的翻訳処理および動的翻訳処理の詳細については以下に説明する。
次に、このように構成された第1の実施の形態にかかる機械翻訳装置100による静的翻訳処理について説明する。図7は、第1の実施の形態における静的翻訳処理の全体の流れを示すフローチャートである。
まず、文書受付部101が、原言語文書(以下、Dsとする。)の入力を受付ける(ステップS701)。次に、翻訳部102が、原言語文書Dsから1行分の情報(以下、Wsとする。)を取得する(ステップS702)。本実施の形態では、1行に1文が記述されている文書を扱うことを前提としているため、本ステップの処理は翻訳部102が1つの原言語文を取得することを意味する。
次に、翻訳部102が、Wsを翻訳し、曖昧情報(以下、Waとする。)と、Wsの対訳文(以下、Wtとする。)を出力する(ステップS703)。なお、翻訳部102の翻訳処理で曖昧性が生じなかった場合は、曖昧情報Waは出力されない。
次に、翻訳部102が、対訳文Wtを対訳文書(以下、Dtとする。)に反映する(ステップS704)。対訳文Wtを対訳文書Dtに反映するとは、対訳文書DtのうちWsに相当する部分として対訳文Wtを出力することを意味する。
次に、翻訳部102は、曖昧情報Waが出力されたか否かを判断し(ステップS705)、出力されていない場合は(ステップS705:NO)、次の行を取得して処理を繰り返す(ステップS702)。
曖昧情報Waが出力された場合は(ステップS705:YES)、翻訳部102は、曖昧情報Waを曖昧性テーブル122に保存する(ステップS706)。
次に、翻訳部102は、原言語文書Dsのうち、すべての行を処理したか否かを判断し(ステップS707)、すべての行を処理していない場合は(ステップS707:NO)、次の行を取得して処理を繰り返す(ステップS702)。
すべての行を処理した場合は(ステップS707:YES)、表示制御部106は、対訳文書Dtを表示部(図示せず)に表示する対訳文書表示処理を実行し(ステップS708)、静的翻訳処理を終了する。対訳文書表示処理の詳細については後述する。
次に、このように構成された第1の実施の形態にかかる機械翻訳装置100による動的翻訳処理について説明する。図8は、第1の実施の形態における動的翻訳処理の全体の流れを示すフローチャートである。
まず、翻訳更新部105が、翻訳結果テーブル121から対訳文書Dtを取得する(ステップS801)。次に、発話受付部103が、原言語発話文(以下、Ssとする。)の入力を受付ける(ステップS802)。
次に、翻訳更新部105が、原言語発話文Ssを翻訳した結果である発話対訳文(以下、Tsとする。)を出力する(ステップS803)。次に、翻訳更新部105に含まれる抽出部501が、原言語発話文Ssが原言語文書Ds中のいずれの範囲に対応する発話であるかを推定する第1のアライメント処理を実行する(ステップS804)。
次に、抽出部501が、推定した範囲から発話対訳文Tsに対応する原言語文(以下、Saとする。)を抽出する第2のアライメント処理を実行する(ステップS805)。具体的には、抽出部501は、第1のアライメント処理で推定した範囲から、上記(1)式を用いて発話対訳文Tsに最も類似する原言語文Saを抽出する。なお、この処理により、原言語文Saの単語と、原言語発話文Ssの単語との間の対応づけも決定する。
図9および図10は、抽出部501により抽出された原言語文Saと、原言語発話文Ssとの対応の一例を示す説明図である。
例えば、図9では、「Difficulties of processing SL」という原言語文Saに対し、「Today、 I'll talked about difficulties of processing spoken language.」という原言語発話文Ssが対応づけられた場合の例が示されている。また、原言語文Saおよび原言語発話文Ssに含まれるそれぞれの単語間の対応づけが、実線で示されている。同図では、曖昧性の生じていた原言語文Saの単語901(「SL」)と、原言語発話文Ssに含まれる単語902(「spoken-language」)とが実線903で対応づけられた例が示されている。
また、図10では、「It requires a special mechanism for a recognizer」という原言語文Saに対し、「So, It requires a recognizer with special mechanisms.」という原言語発話文Ssが対応付けられた例が示されている。
次に、翻訳更新部105は、原言語文Saが抽出されたか否かを判断する(ステップS806)。上述のように、文類似度SIMsが予め定められた閾値以下である場合は、原言語文Saが抽出されない場合も存在するからである。
原言語文Saが抽出された場合は(ステップS806:YES)、翻訳更新部105は、曖昧性テーブル122に、原言語文Saに関連する曖昧性レコードが存在するか否かを判断する(ステップS807)。具体的には、翻訳更新部105は、原言語文Saに対応する文ID(行番号)と一致する文IDの曖昧性レコードが、曖昧性テーブル122に存在するか否かを判断する。
原言語文Saに関連する曖昧性レコードが存在する場合は(ステップS807:YES)、翻訳結果選択部502は、原言語発話文Ssの翻訳結果を参照して原言語文Saを再翻訳し、対訳文Taを出力する(ステップS808)。
例えば、原言語文Sa中の単語「SL」に対し、上述の5種類の訳語候補が存在するという曖昧性が生じ、曖昧性テーブル122に保存されていたとする。そして、原言語発話文Ssの翻訳により、「SL」が「Spoken Language」の略語であることが判明した場合、翻訳結果選択部502は、原言語文Saの単語「SL」の訳語として「Spoken Language」を選択するように再翻訳処理を行う。
なお、原言語文書Dsの複数の箇所に発生した曖昧性であって、同種の曖昧性については、いずれかの曖昧性が解決した場合に、同時に解決するように構成してもよい。
次に、翻訳更新部105は、曖昧性テーブル122から曖昧性を解消した曖昧性レコードを削除する(ステップS809)。続いて、翻訳更新部105は、対訳文書Dt中の原言語文Saの対訳文をTaと置換して翻訳結果テーブル121を更新する(ステップS810)。
次に、表示制御部106は、更新済みの対訳文書Dtを表示部(図示せず)に表示する対訳文書表示処理を実行する(ステップS811)。対訳文書表示処理の詳細については後述する。
ステップS806で原言語文Saが抽出されなかったと判断された場合(ステップS806:NO)、ステップS807で原言語文Saに関連する曖昧性レコードが存在しないと判断された場合(ステップS807:NO)、または表示制御部106が対訳文書Dtを表示後(ステップS811)、音声出力制御部107は、発話対訳文Tsを音声合成した音声をスピーカなどの音声出力部(図示せず)に出力する(ステップS812)。
次に、翻訳更新部105は、ユーザによるボタン操作などにより、原言語発話文Ssが終了したか否か、すなわち、スライド等の資料の説明が終了したか否かを判断し(ステップS813)、終了していない場合は(ステップS813:NO)、次に原言語発話文Ssを受付けて処理を繰り返す(ステップS802)。終了した場合は(ステップS813:YES)、動的翻訳処理を終了する。
次に、ステップS708およびステップS811の対訳文書表示処理の詳細について説明する。図11は、第1の実施の形態における対訳文書表示処理の全体の流れを示すフローチャートである。
まず、表示制御部106は、翻訳結果テーブル121から対訳文書Dtを取得する(ステップS1101)。次に、表示制御部106は、曖昧性テーブル122から曖昧性レコードを1レコード取得する(ステップS1102)。
次に、表示制御部106は、取得した曖昧性レコードに従い、対訳文を曖昧性提示用に編集して対訳文書表示画面に表示する(ステップS1103)。具体的には、表示制御部106は、曖昧性レコード内の曖昧性が生じた部分の位置情報を参照し、対訳文の曖昧性が生じた部分の単語を記号「<」および「>」で括って対訳文書表示画面に表示する。
図12は、対訳文書表示画面の表示内容の一例を示す説明図である。同図では、日本語で表された対訳文書のうち、日本語の単語1201の部分に曖昧性が生じ、記号「<」および「>」で括って表示された例が示されている。また、同図では、日本語の文1202全体で係り受けの曖昧性が生じ、記号「<」および「>」で括って表示された例が示されている。
このように、翻訳過程で曖昧性が生じた部分を記号等で明示することが可能となり、聞き手側に注意を喚起することが可能となる。なお、翻訳曖昧性を示すための目印は上記記号に限られるものではなく、曖昧性が生じたことを認識可能なものであれば、他の記号や下線を付す方法、文字色を変更する方法などのあらゆる方法を適用できる。
また、曖昧性の種類によって付与する記号を変更するように構成してもよいし、記号を付すだけでなく、曖昧性の内容や他の候補などを示すさらに詳細な情報を提示するように構成してもよい。
図11に戻り、対訳文書表示画面に対訳文を表示した後(ステップS1103)、表示制御部106は、すべての曖昧性レコードを処理したか否かを判断する(ステップS1104)。すべての曖昧性レコードを処理していない場合は(ステップS1104:NO)、次の曖昧性レコードを取得して処理を繰り返す(ステップS1102)。
このように、第1の実施の形態にかかる機械翻訳装置100では、会議資料、プレゼンテーション資料などの説明のために発話された内容を参照して会議資料等の翻訳結果で生じた曖昧性を解消することができる。このため、最小限の内容で構成される文書であっても高精度に翻訳することが可能となる。
また、話し手の発話内容と資料に記述された内容とを、発話の進行に従って動的に対応付け、さらに、翻訳内容をこれに同期して更新することにより、常に最新の翻訳結果を得ることが可能となり、話し手の意図を正しく理解する支援が可能となる。
(第2の実施の形態)
一般に、会議などに参加する聞き手側全員の母語への翻訳を、話し手自らが成すことは希であり、参加者自身が用意した翻訳装置により資料を翻訳することが多い。このため、一端資料を聞き手に配布した後は、通常、話し手はその訳出結果を知ることはできない。話し手自らが聞き手側の母語に訳したものを提供する場合であっても、聞き手側の母語に関する十分な知識を要求するため、訳文品質が十分に保証されるとは言えない。このように、一般に資料を配付した後は、聞き手側の理解や聞き手側母語に訳された資料と、話し手側の意図との間に齟齬が存在しても、これを修正することや補足することが困難であった。
特許文献1の方法では、聞き手側の言語に翻訳された後の資料に関しては、依然話し手側の管理から離れたままであり、適切な知識を補うための説明などができず、結果、相互理解の齟齬を解決できなかった。
第2の実施の形態にかかる機械翻訳装置は、会議資料等の翻訳で曖昧性が生じた場合に、曖昧性が生じた箇所を資料の提供者に表示可能とすることにより、齟齬が発生した箇所を提供者が把握することができるようにするものである。
図13は、第2の実施の形態にかかる機械翻訳システムの構成を示すブロック図である。本実施の形態にかかる機械翻訳システムは、機械翻訳装置1300と、表示装置200とを含んでいる。なお、同図では機械翻訳装置1300が1つのみ記載されているが、表示装置200には複数の機械翻訳装置を接続することができる。
表示装置200は、話し手であるユーザが利用する装置であり、原言語文書の翻訳結果ではなく、原言語話者である話し手自身に原言語文書をそのまま表示する装置である。表示装置200は、例えば、ディスプレイ装置を備えたパーソナルコンピュータなどの通常のコンピュータにより構成することができる。
同図に示すように、表示装置200は、記憶部220と、文書受付部201と、表示制御部202と、受信部203と、を備えている。
記憶部220は、曖昧性管理テーブル222を記憶する記憶媒体であり、HDD、光ディスク、メモリカード、RAMなどの一般的に利用されているあらゆる記憶媒体により構成することができる。
曖昧性管理テーブル222は、表示装置200に接続された機械翻訳装置ごとに、翻訳処理で生じた曖昧性に関する曖昧情報を格納するテーブルである。図14は、曖昧性管理テーブル222のデータ構造の一例を示す説明図である。同図に示すように、曖昧性管理テーブル222は、接続された機械翻訳装置を一意に識別する端末IDと、文IDと、曖昧情報とを対応づけて格納している。
すなわち、曖昧性管理テーブル222は、端末IDと、機械翻訳装置1300の曖昧性テーブル122の各レコードである曖昧性レコードとを対応づけたレコード(以下、曖昧性管理レコードとする。)を格納している。
このように、端末IDと曖昧性レコードと対応付けて記憶することにより、複数の聞き手側端末(機械翻訳装置)が存在する場合であっても、同じ種類の曖昧性を区別して管理することが可能となる。すなわち、ある聞き手側端末で解消された曖昧性が、別の端末で解消されていない場合でも、解消済みとして誤って削除されることなく、曖昧情報を適切に管理することが可能となる。
文書受付部201は、プレゼンテーション資料や会議資料などのテキスト形式の文書情報の入力を受付けるものである。文書受付部201は、機械翻訳装置1300の文書受付部101と同様の機能で実現できる。
表示制御部202は、文書受付部201が受付けた原言語文書と、記憶部220が保持する曖昧性管理テーブル222とを参照して、翻訳曖昧性が生じた場所を明示して原言語文書を表示するものである。表示制御部202は、第1の実施の形態の表示制御部106と同様に、曖昧性が発生した部分を「<」と「>」とで対応付けて括ることで翻訳曖昧性が生じたことを表す。
受信部203は、機械翻訳装置1300の送信部1308(後述)から送信された曖昧性レコードを受信するものである。受信部203と、機械翻訳装置1300の送信部1308との間の通信では、有線LAN(Local Area Network)、無線LAN、インターネットなどのあらゆる通信方法を適用することができる。
また、受信部203は、送信元の機械翻訳装置1300の端末IDを、受信した曖昧性レコードに付したレコードを曖昧性管理テーブル222に保存する。端末IDは、機械翻訳装置1300から受信する。
機械翻訳装置1300は、記憶部120と、文書受付部101と、翻訳部102と、発話受付部103と、音声認識部104と、翻訳更新部105と、表示制御部106と、音声出力制御部107と、送信部1308とを備えている。
第2の実施の形態では、送信部1308を追加したことが第1の実施の形態と異なっている。その他の構成および機能は、第1の実施の形態にかかる機械翻訳装置100の構成を表すブロック図である図1と同様であるので、同一符号を付し、ここでの説明は省略する。
送信部1308は、表示装置200の受信部203に対して、曖昧性テーブル122に保存されている曖昧性レコードを送信するものである。送信部1308は、原言語文書を翻訳した際に、曖昧性レコードを受信部203に対して送信する。
次に、このように構成された第2の実施の形態にかかる機械翻訳装置1300による機械翻訳処理について説明する。第2の実施の形態の機械翻訳処理の全体の流れは、第1の実施の形態における機械翻訳処理を示す図6と同様であるのでその説明を省略する。
第2の実施の形態では、静的翻訳処理および動的翻訳処理の詳細が第1の実施の形態と異なる。以下に、第2の実施の形態にかかる機械翻訳装置1300による静的翻訳処理および動的翻訳処理について説明する。
図15は、第2の実施の形態における静的翻訳処理の全体の流れを示すフローチャートである。
ステップS1501からステップS1507までの、テキスト受付処理、翻訳制御処理は、第1の実施の形態にかかる機械翻訳装置100におけるステップS701からステップS707までと同様の処理なので、その説明を省略する。
ステップS1507で、すべての行を処理したと判断された場合は(ステップS1507:YES)、送信部1308は、曖昧性テーブル122(以下、Atとする。)を原言語話者の表示装置200に送信する(ステップS1508)。
次に、表示制御部106は、対訳文書Dtを表示部(図示せず)に表示する対訳文書表示処理を実行し(ステップS1509)、静的翻訳処理を終了する。
図16は、第2の実施の形態における動的翻訳処理の全体の流れを示すフローチャートである。
ステップS1601からステップS1610までの、発話受付処理、曖昧性抽出・更新処理は、第1の実施の形態にかかる機械翻訳装置100におけるステップS801からステップS810までと同様の処理なので、その説明を省略する。
ステップS810で、翻訳更新部105が対訳文の置換を実行した後、送信部1308は、曖昧性テーブルAtを原言語話者の表示装置200に送信する(ステップS1611)。
ステップS1612からステップS1614までの、対訳文書表示処理、音声合成出力処理、終了判定処理は、第1の実施の形態にかかる機械翻訳装置100におけるステップS811からステップS813までと同様の処理なので、その説明を省略する。
このように、第2の実施の形態では、静的翻訳処理を実行するたび、および動的翻訳処理で曖昧性テーブル122を更新するたびに、曖昧性テーブル122を表示装置200に送信する。これにより、表示装置200側に曖昧性が生じていることを通知できるため、表示装置200側で通知内容を参照した表示内容を動的に編集することが可能となる。
次に、表示装置200で実行される原言語文書表示処理について説明する。原言語文書表示処理とは、表示装置200側で、曖昧性管理テーブル222の曖昧情報を参照して表示内容を編集した原言語文書の表示を行う処理である。
図17は、第2の実施の形態における原言語文書表示処理の全体の流れを示すフローチャートである。
まず、受信部203が、機械翻訳装置1300から端末ID(以下、Idとする。)と曖昧性テーブルAtとを受信する(ステップS1701)。次に、文書受付部201が、原言語文書Dsの入力を受付ける(ステップS1702)。
次に、表示制御部202が、曖昧性管理テーブル222の不要な曖昧性管理レコードを削除する(ステップS1703)。具体的には、表示制御部202は、曖昧性管理テーブル222から、端末IDが受信したIdと等しく、かつ、曖昧性レコードの内容が一致しない曖昧性管理レコードを削除する。
送信元の機械翻訳装置1300で曖昧性が解消された場合、曖昧性テーブル122から曖昧性レコードが削除され、表示装置200に送信される。表示装置200側の曖昧性管理テーブル222には対応するレコードが残っているため、両者の差分を取ることにより曖昧性が解消されたレコードを検出し、検出したレコードを削除している。
次に、表示制御部202は、曖昧性管理テーブル222に保存済みの曖昧性レコードをAtから削除する(ステップS1704)。重複する曖昧性レコードを曖昧性管理テーブル222に登録しないようにするためである。具体的には、表示制御部202は、曖昧性テーブルAtのレコードのうち、端末IDおよび曖昧性レコードが等しいレコードが曖昧性管理テーブル222に存在する曖昧性レコードを削除する。
次に、表示制御部202は、Atに含まれる各曖昧性レコードと端末IDとを対応づけて曖昧性管理テーブル222に保存する(ステップS1705)。
このようにして、受信した曖昧性レコードを反映した最新の曖昧情報を格納した曖昧性管理テーブル222を作成することができる。
次に、表示制御部202は、曖昧性管理テーブル222から曖昧性管理レコードを1レコード取得する(ステップS1706)。次に、表示制御部202は、取得した曖昧性管理レコードに含まれる曖昧性が生じた部分の位置情報に対応する部分が、既に編集済みか否かを判断する(ステップS1707)。
編集済みでない場合は(ステップS1707:NO)、表示制御部202は、取得した曖昧性管理レコードに従い、原言語文書Ds内の対応する原言語文を曖昧性提示用に編集して原言語文書表示画面に表示する(ステップS708)。具体的には、表示制御部202は、曖昧性管理レコード内の曖昧性が生じた部分の位置情報を参照し、原言語文の曖昧性が生じた部分の単語を記号「<」および「>」で括って原言語文書表示画面に表示する。
図18は、原言語文書表示画面の表示内容の一例を示す説明図である。同図では、英語で表された原言語文書のうち、英語の単語1801の部分に曖昧性が生じ、記号「<」および「>」で括って表示された例が示されている。また、同図では、英語の文1802全体で係り受けの曖昧性が生じ、記号「<」および「>」で括って表示された例が示されている。
このように、聞き手側だけでなく、原言語話者である話し手側に対しても、翻訳過程で曖昧性が生じた部分を記号等で明示することができる。このため、曖昧性が生じた部分を認識した話し手は、当該部分を補足する説明を発話することなどが可能となる。これにより、話し手と聞き手と理解の齟齬が発生する可能性を低減することができる。
図17に戻り、曖昧性が生じた部分の位置情報に対応する部分が編集済みであると判断された場合(ステップS1707:YES)、またはステップS1708で編集後の原言語文を表示した後、表示制御部202は、すべての曖昧性管理レコードを処理したか否かを判断する(ステップS1709)。
すべての曖昧性管理レコードを処理していない場合は(ステップS1709:NO)、次に曖昧性管理レコードを取得して処理を繰り返す(ステップS1706)。すべての曖昧性管理レコードを処理した場合は(ステップS1709:YES)、原言語文書表示処理を終了する。
次に、図19〜図29を用いて、本実施の形態における機械翻訳処理の具体例について説明する。図19は、入力される原言語文書の一例を示す説明図である。
以下では、同図に示すようなスライドを会議資料として電子的に配布する状況を仮定して説明する。また、会議の参加者が利用する装置として、英語を母語とする話し手が利用し、端末IDとして「Eng001」を付与された話し手側端末(表示装置200)、および日本語を母語とする聞き手が利用し、端末IDとして「Jpn001」を付与された聞き手側端末(機械翻訳装置1300)が用いられるものとする。
まず、同図に示すようなスライドが電子的に配布され、聞き手側端末(Jpn001)に入力されると、これを聞き手側ユーザが設定した言語、すなわち日本語に向けて静的翻訳処理が実行される(ステップS601)。
静的翻訳処理では、入力された図19に示すスライド資料を原言語文書Dsとして処理が実行される(ステップS1501)。原言語文書Dsから最初の行の情報である「Difficulties of processing SL」を読み出しWsとする(ステップS1502)。
ここで、Wsを翻訳部102によって処理した結果、曖昧情報Waとして(訳語選択、(4、4)、(1、1))が、対訳文Wtとして「原言語を処理する障害」を意味する日本語が得られたと仮定する(ステップS1503)。
翻訳部102は、対訳文Wtの内容を対訳文書Dtに配置する(ステップS1504)。また、翻訳処理過程に曖昧性に関する問題が発生しているため(ステップS1505:YES)、翻訳部102は、曖昧性の問題が生じた原言語文書Ds中の文を特定するための行数の情報と、曖昧情報Waの値と、を対応付けて、曖昧性テーブルAtに登録する(ステップS1506)。図20は、この処理の後の、曖昧性テーブルAtのデータ格納状態の一例を示す説明図である。
次に、翻訳部102は、2行目の情報である「Differ with WL in vocabularies」を読み出しWsとする(ステップS1502)。
ここで、Wsを翻訳部102によって処理した結果、曖昧情報Waが出力されず、対訳文Wtとして「書き言葉との語彙の異なり」を意味する日本語が得られたと仮定する(ステップS1503)。
翻訳部102は、対訳文Wtの内容を対訳文書Dtに配置し(ステップS1504)、翻訳処理過程に曖昧性に関する問題は発生していないため(ステップS1505:NO)、ステップS1502へ移動する。
以降、原言語文書Dsの最後の行の情報である「It requires a special mechanism for a recognizer.」まで、同様の処理が繰り返される。なお、この処理の後の曖昧性テーブルAtは、例えば、図3に示すような状態となる。
以上によって、原言語文書Dsの翻訳処理が終了し、その翻訳過程で生じた曖昧性テーブルAtが完成することから、曖昧性テーブルAtを話し手側端末に送信する(ステップS1508)。なお、この時の状態を中間状態1と呼び、後述する原言語文書表示処理の動作の説明時に参照する。
次に、表示制御部106が、対訳文書表示処理を実行する(ステップS1509)。まず、静的翻訳処理によって生成された対訳文書Dtを取得する(ステップS1101)。次に、図3に示した曖昧性テーブルAtから、最初の曖昧性レコード(以下、tとする。)(文ID=1、曖昧情報=(訳語選択、(4、4)、(1、1))を取得する(ステップS1102)。
この曖昧性レコードtによれば、曖昧性の問題が原言語文書Dsの1行目で発生しており、その影響を受ける対訳文の位置は1単語目〜1単語目であることが分かる。このため、表示制御部106は、曖昧性が発生した範囲を「<」記号と「>」記号で括る処理を行う(ステップS1103)。図21は、このような処理を実行した後の、対訳文書Dtの表示内容の一例を示す説明図である。
以降、曖昧性テーブルAtにおける2番目以降の曖昧性レコードについても同様の処理が繰り返される。なお、この処理の後の対訳文書Dtは、例えば、図12に示すような内容で表示される。
このように、本実施の形態によれば、図12の単語1201(<原言語>)または文1202(<それは認識装置用の特別なメカニズムを要求する>)のように、聞き手に対して、翻訳過程で曖昧性が生じた部分を明示することができるため、聞き手側に注意を喚起することが可能となる。
上記のような静的翻訳処理の後、動的翻訳処理が実行される(ステップS602)。
まず、翻訳部102の出力である対訳文書Dtを取得する(ステップS1601)。ここで、発話受付部103が原言語発話文Ssとして「Today、I'll talk about difficulties of processing spoken-language.」を受付けた(ステップS1602)と仮定する。また、原言語発話文Ssを翻訳更新部105によって処理した結果、発話対訳文Tsとして「今日、私は話し言葉を処理する障害について話すつもりです。」を意味する日本語が得られたと仮定する。
続いて、原言語発話文Ssと、原言語文書Ds内の原言語文とを対応付けるために、抽出部501によってアライメント処理が実行される(ステップS1604、ステップS1605)。ここでは、対応する原言語文Saとして、図19に示した原言語文書中の第1行目に当たる、「Difficulties of processing SL」が抽出されたと仮定する。なお、このときのアライメント結果を示した図が図9に相当する。
原言語文Saが得られていることから、ステップS1606でアライメント処理が成功していると判断し(ステップS1606:YES)、ステップS1607へ移動する。アライメント先として得られた原言語文Saは、原言語文書Ds中の1行目であり、原言語文Saに対応する曖昧性として、図3の曖昧性テーブルAtの最初の曖昧性レコードが存在するため(ステップS1607:YES)、ステップS1608へ移動する。
ここでは、図9に示すアライメント結果のように、原言語文Sa中の単語901(SL)と、原言語発話文Ss中の単語902(spoken-language)が対応付けられている。また、原言語文Saに発生した曖昧性は、「SL」の訳語選択の問題であり、訳語候補として、「原言語(Source Language)」「話し言葉(Spoken Language)」「回収損(Salvage Loss)」「海面(Sea Level)」「記号原語(Symbolic Language)」を意味する5種類の日本語が得られたと仮定する。
これに対して、アライメント処理によって対応付けられた「spoken-language」の訳語は一意に「話し言葉」であると決められると仮定すると、翻訳結果選択部502は、訳語候補の中から対応付けられた単語が同じ訳語になるように「話し言葉」を一意に選択する。
すなわち、原言語文Saの翻訳課程で生じた訳語選択の曖昧性の問題を解決し、一意に選択した訳語で新たな対訳文Ta(「話し言葉を処理する障害」)を得ることができる(ステップS1608)。
以上のように曖昧性が解消されたことから、曖昧性テーブルAtから、曖昧性に対応する図3の最初の曖昧性レコードを削除する(ステップS1609)と共に、新たに得られた対訳文Taを、対訳文書Dtに反映する(ステップS1610)。図22は、この処理によって更新された曖昧性テーブルAtの状態の一例を示す説明図である。
次に、更新された曖昧性テーブルAtを話し手側端末に送信する(ステップS1611)。なお、この時の状態を中間状態2と呼び、後述する原言語文書表示処理の動作の説明時に参照する。
次に、対訳文書表示処理が実行される。図23は、このときの対訳文書表示処理で表示される対訳文書表示画面の表示内容の一例を示す説明図である。
静的翻訳処理が実行された直後の対訳文書表示画面を表す図12では、単語1201に曖昧性が存在することが示されていたが、図23の対応する単語2301では「話し言葉」を意味する日本語が正しく表示されている。すなわち、話し手の意図が正しく反映され、かつ、聞き手側にも処理過程で生じた曖昧性が解決されたことが明確に示されている。
このように、本実施の形態によれば、翻訳過程で生じた曖昧性を正しく解決し、話し手の説明の内容、すなわち意図と聞き手側の理解との間に生じた齟齬を解消することが可能となる。
対訳文書表示処理の後、音声出力制御部107が、発話対訳文Tsを音声合成した音声出力しステップS1614へ移動する。
ここでは、さらに継続して発話が入力され(ステップS1614:NO)、次の入力として、発話受付部103が「Of course、 as you know、 there are several difficulties.」という原言語発話文Ssを受付けたものと仮定する(ステップS1602)。
また、原言語発話文Ssを翻訳更新部105によって処理した結果、「もちろん、皆様ご存じのように、種々の障害があります。」を意味する日本語が、発話対訳文Tsとして出力されたものと仮定する(ステップS1603)。
続いて、原言語発話文Ssと、原言語文書Ds内の原言語文とを対応付けるために、抽出部501によってアライメント処理が実行される(ステップS1604、ステップS1605)。ここでは、対応する原言語文書Dsの文が得られなかったと仮定すると、原言語文Saは空となる。したがって、アライメント処理が失敗していると判断され(ステップS1606:NO)、音声合成出力処理が実行される(ステップS1613)。
このように、新しい発話が得られた場合であっても、曖昧性解消に貢献しない入力であった場合には、曖昧性を解消する処理は実行されないため、誤って対訳文書Dtを更新することを抑止することができる。
続いて、さらに継続して発話が入力され(ステップS1614:NO)、次の入力として、発話受付部103が「It requires a recognizer with special mechanisms.」という原言語発話文Ssを受付けたものと仮定する(ステップS1602)。
また、原言語発話文Ssを翻訳更新部105によって処理した結果、「それは特別なメカニズムを備えた認識装置を要求します」を意味する日本語が、発話対訳文Tsとして出力されたものと仮定する(ステップS1603)。
続いて、原言語発話文Ssと、原言語文書Ds内の原言語文とを対応付けるために、抽出部501によってアライメント処理が実行される(ステップS1604、ステップS1605)。ここでは、対応する原言語文Saとして、図19に示した原言語文書中の第10行目に相当する「It requires a special mechanism for a recognizer」が抽出されたと仮定する。なお、このときのアライメント結果を表した図が図10に相当する。
原言語文Saが得られていることから、ステップS1606でアライメント処理が成功していると判断し(ステップS1606:YES)、ステップS1607へ移動する。アライメント先として得られた原言語文Saは、原言語文書Ds中の10行目であり、原言語文Saに対応する曖昧性として、図22の曖昧性テーブルAtの曖昧性レコードが存在するため(ステップS1607:YES)、ステップS1608へ移動する。
図22の曖昧性レコードによれば、原言語文Saは、その翻訳課程で係り受けの曖昧性を生じている。ここでは、この曖昧性が、図4の解釈401および解釈402に示す2通りの係り受けの解釈曖昧性であったと仮定する。
すなわち、前者は、「a recognizer」が「special mechanisms」に依存することを意味する解釈である(日本語では「それは認識装置用の特別なメカニズムを要求する」に対応)。後者は、「a recognizer」が「requires」に依存することを意味する解釈である(日本語では「それは認識装置に特別なメカニズムを要求する」に対応)。なお、静的翻訳処理では、前者が選択されていたことになる。
これに対して、原言語発話文Ssを翻訳更新部105で処理した過程で、係り受け構造が一意に決められたと仮定する。図24は、一意に決定された係り受け構造の一例を示す説明図である。同図の例では、「a recognizer」が「requires」に依存することを意味する解釈を優先すべきであることが分かる。したがって、原言語文Saの解釈としても、図4の解釈402に示すものが優先されると判定できる。
すなわち、原言語文Saの翻訳課程で生じた係り受け解釈の曖昧性の問題を解決し、一意に決定した係り受け解釈で新たな対訳文Ta(「それは認識装置に特別なメカニズムを要求する」)を得ることができる(ステップS1608)。
以上のように曖昧性が解消されたことから、曖昧性テーブルAtから、曖昧性に対応する図22曖昧性レコードを削除する(ステップS1609)と共に、新たに得られた対訳文Taを、対訳文書Dtに反映する(ステップS1610)。なお、以上の処理によって原言語文書Dsの静的翻訳過程で生じた全ての曖昧性が解消されるため、話し手側端末が有する曖昧性テーブルAtは空集合となる。
次に、空集合となった曖昧性テーブルAtを話し手側端末に送信する(ステップS1611)。なお、この時の状態を中間状態3と呼び、後述する原言語文書表示処理の動作の説明時に参照する。
次に、対訳文書表示処理が実行される。図25は、このときの対訳文書表示処理で表示される対訳文書表示画面の表示内容の一例を示す説明図である。
図23では、文2302に曖昧性が存在することが示されていたが、図25の対応する文2501では係り受けの解釈が正しく翻訳された日本語が表示されている。すなわち、話し手の意図が正しく反映され、かつ、聞き手側にも処理過程で生じた曖昧性が解決されたことが明確に示されている。
次に、原言語文書表示処理の具体例について説明する。原言語文書表示処理は、聞き手側端末から曖昧性テーブルAtが送信されるごとに実行される。
最初に、上述の中間状態1の時に送信された、図3に示すような曖昧性テーブルAtを受信した際の処理例について説明する。ただし、図3に示す曖昧性テーブルAtを受信するまで、話し手側端末が保持する曖昧性管理テーブル222は空集合であったと仮定する。
まず、送信元端末ID(Id)として「Jpn001」と、図3に示す曖昧性テーブルAtとを受信する(ステップS1701)。次に、原言語文書Dsの入力を受付ける(ステップS1702)。
ここでは、曖昧性管理テーブル222には曖昧性管理レコードが保存されていないため、受信した曖昧性テーブルAtに含まれるすべての曖昧性レコードがIdと対応付けられて曖昧性管理テーブル222に登録される(ステップS1703、ステップS1704、ステップS1705)。以上の処理を経た後の、曖昧性管理テーブル222を示した図が、図14に相当する。
図14に示すように、曖昧性管理テーブル222には2つの曖昧性管理レコードが登録されていることから、曖昧性管理テーブル222から最初の曖昧性管理レコード(端末ID=Jpn001、文ID=1、曖昧情報=(訳語選択、(4、4)、(1、1))を取り出す。
この曖昧性管理レコードは、曖昧性の問題が原言語文書Dsの1行目で発生しており、その影響を受ける原言語文内の単語の位置は4単語目〜4単語目であることが分かる。このため、表示制御部106は、曖昧性が発生した範囲を「<」記号と「>」記号で括って表示する。図26は、このような処理を実行した後の、対訳文書Dtの表示内容の一例を示す説明図である。
以降、曖昧性テーブルAtにおける2番目以降の曖昧性レコードにつても同様の処理が繰り返される。なお、この処理の後の対訳文書Dtは、例えば、図18に示すような内容で表示される。
このように、本実施の形態によれば、図18の単語1801(<SL>)または文1802(<It requires special mechanisms for a recognition.>)のように、話し手に対して、翻訳過程で曖昧性が生じた部分を明示することができるため、話し手側に注意を喚起することが可能となる。
次に、上述の中間状態2の時に送信された、図22に示すような曖昧性テーブルAtを受信した際の処理例について説明する。この場合、曖昧性管理テーブル222には、図14に示した曖昧性管理レコードが記憶されているものとする。
まず、送信元端末ID(Id)として「Jpn001」と、図22に示す曖昧性テーブルAtとを受信する(ステップS1701)。次に、原言語文書Dsの入力を受付ける(ステップS1702)。
次に、曖昧性管理テーブル222に登録されている端末IDが「Jpn001」である曖昧性管理レコードのうち、受信した曖昧性テーブルAtに含まれない曖昧性レコードに相当する、図14の最初の曖昧性管理レコードを削除する(ステップS1703)。
次に、すでに曖昧性管理テーブル222に登録されている曖昧性レコード、すなわち、図22の曖昧性レコードを、曖昧性テーブルAtから削除する(ステップS1704)。これにより、受信した曖昧性テーブルAtは空集合となるため、曖昧性管理テーブル222には新たなレコードは追加されない(ステップS1705)。図27は、この処理の後の、曖昧性管理テーブル222のデータ格納状態の一例を示す説明図である。
以降、上述と同様の処理が繰り返され、曖昧部分を明示した原言語文書Dsが表示される。図28は、このような処理を実行した後の、原言語文書Dsの表示内容の一例を示す説明図である。
図18では曖昧性が生じているものとして表示されていた単語1801(<SL>)が、図28では記号「<」、「>」が削除された単語2801に動的に更新されることで、聞き手側端末における翻訳過程で生じた曖昧性が話し手の発話によって解決できたことを話し手が動的に知ることが可能となり、円滑な説明支援を実現することができる。
中間状態3では、空集合である曖昧性テーブルAtを受信するため、曖昧性管理テーブル222も空集合となる(ステップS1703、ステップS1704、ステップS1705)。したがって、曖昧性表示のための編集は行われず、話し手には曖昧性の生じていないことを示す原言語文書Dsが画面に表示される。
図29は、このときの、原言語文書Dsの表示内容の一例を示す説明図である。同図に示すように、中間状態3では、曖昧性が生じたことを表す記号を含まない原言語文書Dsが表示される。
図28では曖昧性が生じているものとして表示されていた文2802(<It requires special mechanisms for a recognition.>)が、図29では記号「<」、「>」が削除された文2901(It requires special mechanisms for a recognition.)に動的に更新されることで、聞き手側端末における翻訳過程で生じた曖昧性が話し手の発話によって解決できたことを話し手が動的に知ることが可能となる。
このように、第2の実施の形態にかかる機械翻訳装置1300では、会議資料等の翻訳で曖昧性が生じた場合に、曖昧性が生じた箇所を資料の提供者に表示することができる。このため、聞き手側が参照している訳出された翻訳資料における解釈にかかる問題を、話し手も共有することが可能となり、その問題を解決するような説明を促す支援を実現することが可能となる。また、発話によって曖昧性が解消された場合、動的に提示情報を更新し、聞き手側の理解との間に生じた齟齬を解消することが可能となる。
なお、第1および第2の実施の形態では、ユーザへの原言語文書または対訳文書の提示を画面表示によって行っていたが、発話と同様に、音声合成した音声を出力するように構成してもよい。この場合は、曖昧性が生じた箇所の音質、音量などの音声の属性を変更して出力することにより、曖昧性が生じた箇所をユーザに提示する。
図30は、第1または第2の実施の形態にかかる機械翻訳装置のハードウェア構成を示す説明図である。
第1または第2の実施の形態にかかる機械翻訳装置は、CPU(Central Processing Unit)51などの制御装置と、ROM(Read Only Memory)52やRAM53などの記憶装置と、ネットワークに接続して通信を行う通信I/F54と、各部を接続するバス61を備えている。
第1または第2の実施の形態にかかる機械翻訳装置で実行される機械翻訳プログラムは、ROM52等に予め組み込まれて提供される。
第1または第2の実施の形態にかかる機械翻訳装置で実行される機械翻訳プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM(Compact Disk Read Only Memory)、フレキシブルディスク(FD)、CD−R(Compact Disk Recordable)、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。
さらに、第1または第2の実施の形態にかかる機械翻訳装置で実行される機械翻訳プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、第1または第2の実施の形態にかかる機械翻訳装置で実行される機械翻訳プログラムをインターネット等のネットワーク経由で提供または配布するように構成してもよい。
第1または第2の実施の形態にかかる機械翻訳装置で実行される機械翻訳プログラムは、上述した各部(文書受付部、翻訳制御部、翻訳部、更新部、音声認識部、発話受付部、表示制御部、音声出力制御部)を含むモジュール構成となっており、実際のハードウェアとしてはCPU51が上記ROM52から機械翻訳プログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、各部が主記憶装置上に生成されるようになっている。
以上のように、本発明にかかる機械翻訳装置、機械翻訳システム、機械翻訳方法および機械翻訳プログラムは、音声入力または文字入力した原言語文を対象言語に翻訳して文字出力または音声出力する機械翻訳装置、機械翻訳システム、機械翻訳方法および機械翻訳プログラムに適している。
第1の実施の形態にかかる機械翻訳装置の構成を示すブロック図である。 翻訳結果テーブルのデータ構造の一例を示す説明図である。 曖昧性テーブルのデータ構造の一例を示す説明図である。 係り受けの解釈曖昧性の一例を示す説明図である。 更新部の構成の一例を示すブロック図である。 第1の実施の形態における機械翻訳処理の全体の流れを示すフローチャートである。 第1の実施の形態における静的翻訳処理の全体の流れを示すフローチャートである。 第1の実施の形態における動的翻訳処理の全体の流れを示すフローチャートである。 原言語文と、原言語発話文との対応の一例を示す説明図である。 原言語文と、原言語発話文との対応の一例を示す説明図である。 第1の実施の形態における対訳文書表示処理の全体の流れを示すフローチャートである。 対訳文書表示画面の表示内容の一例を示す説明図である。 第2の実施の形態にかかる機械翻訳システムの構成を示すブロック図である。 曖昧性管理テーブルのデータ構造の一例を示す説明図である。 第2の実施の形態における静的翻訳処理の全体の流れを示すフローチャートである。 第2の実施の形態における動的翻訳処理の全体の流れを示すフローチャートである。 第2の実施の形態における原言語文書表示処理の全体の流れを示すフローチャートである。 原言語文書表示画面の表示内容の一例を示す説明図である。 原言語文書の一例を示す説明図である。 曖昧性テーブルのデータ格納状態の一例を示す説明図である。 対訳文書の表示内容の一例を示す説明図である。 曖昧性テーブルの状態の一例を示す説明図である。 対訳文書表示画面の表示内容の一例を示す説明図である。 係り受け構造の一例を示す説明図である。 対訳文書表示画面の表示内容の一例を示す説明図である。 対訳文書の表示内容の一例を示す説明図である。 曖昧性管理テーブルのデータ格納状態の一例を示す説明図である。 原言語文書の表示内容の一例を示す説明図である。 原言語文書の表示内容の一例を示す説明図である。 第1または第2の実施の形態にかかる機械翻訳装置のハードウェア構成を示す説明図である。
符号の説明
51 CPU
52 ROM
53 RAM
54 通信I/F
61 バス
100 機械翻訳装置
101 文書受付部
102 翻訳制御部
103 発話受付部
104 音声認識部
105 翻訳更新部
106 表示制御部
107 音声出力制御部
120 記憶部
121 翻訳結果テーブル
122 曖昧性テーブル
200 表示装置
201 文書受付部
202 表示制御部
203 受信部
220 記憶部
222 曖昧性管理テーブル
401、402 解釈
501 抽出部
502 翻訳結果選択部
901、902 単語
903 実線
1201 単語
1202 文
1300 機械翻訳装置
1308 送信部
1801 単語
1802 文
2301 単語
2302 文
2501 文
2801 単語
2802 文
2901 文

Claims (13)

  1. 原言語で記載された原言語文書の入力を受付ける文書受付手段と、
    前記原言語文書を対象言語で記載された対訳文書に翻訳するとともに、翻訳処理で曖昧性が生じた語または文である曖昧部分に関する曖昧情報を生成する翻訳手段と、
    前記対訳文書と、前記曖昧情報とを記憶する記憶手段と、
    原言語による発話を受付ける発話受付手段と、
    前記発話受付手段が受付けた前記発話を音声認識し、認識結果である原言語発話文を生成する認識手段と、
    前記原言語文書に前記曖昧部分が存在する場合に、前記原言語発話文の前記曖昧部分に対応する発話内容に基づいて前記原言語文書の前記曖昧部分を再翻訳し、前記記憶手段に記憶された前記対訳文書を更新する翻訳更新手段と、
    更新された前記対訳文書を表示手段に表示する表示制御手段と、
    を備えたことを特徴とする機械翻訳装置。
  2. 前記翻訳更新手段は、
    前記原言語発話文に関連する文である原言語文を前記原言語文書から抽出する抽出手段と、
    抽出した前記原言語文に前記曖昧部分が存在する場合に、前記原言語発話文の前記曖昧部分に対応する発話内容の翻訳結果を前記曖昧部分の翻訳結果として選択する選択手段と、
    を備えたことを特徴とする請求項1に記載の機械翻訳装置。
  3. 前記抽出手段は、前記原言語文書に含まれる頁、章、節、段落の少なくとも1つを含む文書の範囲のそれぞれについて、前記原言語発話文と、前記範囲に含まれる文との間の類似度を算出し、算出した類似度が最大となる前記範囲を抽出し、抽出した前記範囲から前記原言語文を抽出すること、
    を特徴とする請求項2に記載の機械翻訳装置。
  4. 前記抽出手段は、さらに前記範囲に含まれる文のそれぞれについて、前記文に含まれる単語と、前記原言語発話文に含まれる単語との間の類似度を算出し、算出した類似度が最大となる前記文である前記原言語文を抽出すること、
    を特徴とする請求項3に記載の機械翻訳装置。
  5. 前記抽出手段は、前記原言語発話文から、前記原言語文書の頁、章、節、段落の少なくとも1つを含む文書の範囲に関する範囲情報を取得し、前記原言語文書のうち、取得した前記範囲情報で表される前記範囲から前記原言語文を抽出すること、
    を特徴とする請求項2に記載の機械翻訳装置。
  6. 前記抽出手段は、さらに前記範囲に含まれる文のそれぞれについて、前記文に含まれる単語と、前記原言語発話文に含まれる単語との間の類似度を算出し、算出した類似度が最大となる前記文である前記原言語文を抽出すること、
    を特徴とする請求項5に記載の機械翻訳装置。
  7. 前記翻訳手段は、単語の訳語の選択処理で前記曖昧性の生じた前記曖昧部分に関する前記曖昧情報を生成し、
    前記選択手段は、前記原言語文に訳語の選択処理で前記曖昧性の生じた前記曖昧部分が存在する場合に、前記原言語発話文の前記曖昧部分に対応する発話内容に対して選択した訳語を、前記曖昧部分の訳語として選択すること、
    を特徴とする請求項2に記載の機械翻訳装置。
  8. 前記翻訳手段は、単語の係り受け関係の選択処理で前記曖昧性の生じた前記曖昧部分に関する前記曖昧情報を生成し、
    前記選択手段は、前記原言語文に係り受け関係の選択処理で前記曖昧性の生じた前記曖昧部分が存在する場合に、前記原言語発話文の前記曖昧部分に対応する発話内容の係り受け関係を、前記曖昧部分の係り受け関係として選択すること、
    を特徴とする請求項2に記載の機械翻訳装置。
  9. 前記記憶手段は、前記対訳文書と、前記原言語文書および前記対訳文書における曖昧性が生じた語または文である曖昧部分に関する曖昧情報とを記憶可能であり、
    前記表示制御手段は、前記曖昧情報に基づいて、前記対訳文書の前記曖昧部分に前記曖昧性が生じたことを示す情報を関連づけて表示すること、
    を特徴とする請求項1に記載の機械翻訳装置。
  10. 前記記憶手段は、前記対訳文書と、前記曖昧性の種別をさらに含む前記曖昧情報とを記憶可能であり、
    前記表示制御手段は、前記曖昧情報に基づいて、前記対訳文書の前記曖昧部分に前記種別をさらに関連づけて表示すること、
    を特徴とする請求項9に記載の機械翻訳装置。
  11. 原言語で記載された原言語文書を表示する表示装置と、前記表示装置とネットワークで接続され、前記原言語文書を対象言語への翻訳結果である対訳文書に翻訳する機械翻訳装置とを有する機械翻訳システムであって、
    前記機械翻訳装置は、
    前記原言語文書の入力を受付ける文書受付手段と、
    前記原言語文書を前記対訳文書に翻訳するとともに、翻訳処理で曖昧性が生じた語または文である曖昧部分に関する曖昧情報を生成する翻訳手段と、
    前記対訳文書と、前記曖昧情報とを記憶する記憶手段と、
    原言語による発話を受付ける発話受付手段と、
    前記発話受付手段が受付けた前記発話を音声認識し、認識結果である原言語発話文を生成する認識手段と、
    前記原言語文書に前記曖昧部分が存在する場合に、前記原言語発話文の前記曖昧部分に対応する発話内容に基づいて前記原言語文書の前記曖昧部分を再翻訳し、前記記憶手段に記憶された前記対訳文書を更新する翻訳更新手段と、
    更新された前記対訳文書を第1表示手段に表示する第1表示制御手段と、
    前記記憶手段に記憶された前記曖昧情報を前記表示装置に送信する送信手段と、
    を備え、
    前記表示装置は、
    前記曖昧情報を前記機械翻訳装置から受信する受信手段と、
    前記受信手段が受信した前記曖昧情報に基づいて、前記曖昧性が生じた部分に前記曖昧性が生じたことを示す情報を関連づけた前記原言語文書を、第2表示手段に表示する第2表示制御手段と、
    を備えたことを特徴とする機械翻訳システム。
  12. 原言語で記載された原言語文書の入力を受付ける文書受付ステップと、
    前記原言語文書を対象言語による対訳文書に翻訳するとともに、翻訳処理で曖昧性が生じた語または文である曖昧部分に関する曖昧情報を生成する翻訳ステップと、
    前記対訳文書と、前記曖昧情報とを記憶手段に記憶する記憶ステップと、
    原言語による発話を受付ける発話受付ステップと、
    前記発話受付ステップが受付けた前記発話を音声認識し、認識結果である原言語発話文を生成する認識ステップと、
    前記原言語文書に前記曖昧部分が存在する場合に、前記原言語発話文の前記曖昧部分に対応する発話内容に基づいて前記原言語文書の前記曖昧部分を再翻訳し、前記記憶手段に記憶された前記対訳文書を更新する翻訳更新ステップと、
    更新された前記対訳文書を表示手段に表示する表示制御ステップと、
    を備えたことを特徴とする機械翻訳方法。
  13. 原言語で記載された原言語文書の入力を受付ける文書受付手順と、
    前記原言語文書を対象言語による対訳文書に翻訳するとともに、翻訳処理で曖昧性が生じた語または文である曖昧部分に関する曖昧情報を生成する翻訳手順と、
    前記対訳文書と、前記曖昧情報とを記憶手段に記憶する記憶手順と、
    原言語による発話を受付ける発話受付手順と、
    前記発話受付手順が受付けた前記発話を音声認識し、認識結果である原言語発話文を生成する認識手順と、
    前記原言語文書に前記曖昧部分が存在する場合に、前記原言語発話文の前記曖昧部分に対応する発話内容に基づいて前記原言語文書の前記曖昧部分を再翻訳し、前記記憶手段に記憶された前記対訳文書を更新する翻訳更新手順と、
    更新された前記対訳文書を表示手段に表示する表示制御手順と、
    をコンピュータに実行させる機械翻訳プログラム。
JP2006261350A 2006-09-26 2006-09-26 機械翻訳を行う装置、システム、方法およびプログラム Active JP4398966B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2006261350A JP4398966B2 (ja) 2006-09-26 2006-09-26 機械翻訳を行う装置、システム、方法およびプログラム
CNA2007101469666A CN101154219A (zh) 2006-09-26 2007-09-03 用于机器翻译的方法、装置和系统
US11/898,298 US8214197B2 (en) 2006-09-26 2007-09-11 Apparatus, system, method, and computer program product for resolving ambiguities in translations

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006261350A JP4398966B2 (ja) 2006-09-26 2006-09-26 機械翻訳を行う装置、システム、方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2008083855A true JP2008083855A (ja) 2008-04-10
JP4398966B2 JP4398966B2 (ja) 2010-01-13

Family

ID=39226151

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006261350A Active JP4398966B2 (ja) 2006-09-26 2006-09-26 機械翻訳を行う装置、システム、方法およびプログラム

Country Status (3)

Country Link
US (1) US8214197B2 (ja)
JP (1) JP4398966B2 (ja)
CN (1) CN101154219A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101377459B1 (ko) * 2009-12-21 2014-03-26 한국전자통신연구원 자동 통역 장치 및 그 방법
JP2016177311A (ja) * 2016-05-25 2016-10-06 株式会社東芝 テキスト処理装置、テキスト処理方法およびテキスト処理プログラム
JPWO2017183127A1 (ja) * 2016-04-20 2018-12-27 マクセル株式会社 表示装置、出力装置、および情報表示方法
US10304457B2 (en) 2011-07-26 2019-05-28 Kabushiki Kaisha Toshiba Transcription support system and transcription support method
JP2021048609A (ja) * 2020-11-26 2021-03-25 マクセル株式会社 出力装置および情報表示方法
JP7048141B1 (ja) 2022-01-05 2022-04-05 株式会社Airobo プログラム、ファイル生成方法、情報処理装置、及び情報処理システム

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8219407B1 (en) 2007-12-27 2012-07-10 Great Northern Research, LLC Method for processing the output of a speech recognizer
US9323854B2 (en) * 2008-12-19 2016-04-26 Intel Corporation Method, apparatus and system for location assisted translation
US10140320B2 (en) 2011-02-28 2018-11-27 Sdl Inc. Systems, methods, and media for generating analytical data
US20120221319A1 (en) * 2011-02-28 2012-08-30 Andrew Trese Systems, Methods and Media for Translating Informational Content
JP2013016036A (ja) * 2011-07-04 2013-01-24 Hitachi Ltd 文書部品生成方法及び計算機システム
US9984054B2 (en) 2011-08-24 2018-05-29 Sdl Inc. Web interface including the review and manipulation of a web document and utilizing permission based control
JP2013206253A (ja) * 2012-03-29 2013-10-07 Toshiba Corp 機械翻訳装置、方法、およびプログラム
JP2014078132A (ja) * 2012-10-10 2014-05-01 Toshiba Corp 機械翻訳装置、方法およびプログラム
US9916306B2 (en) 2012-10-19 2018-03-13 Sdl Inc. Statistical linguistic analysis of source content
US9678953B2 (en) * 2013-06-11 2017-06-13 Facebook, Inc. Translation and integration of presentation materials with cross-lingual multi-media support
US9892115B2 (en) 2013-06-11 2018-02-13 Facebook, Inc. Translation training with cross-lingual multi-media support
JP6178198B2 (ja) * 2013-09-30 2017-08-09 株式会社東芝 音声翻訳システム、方法およびプログラム
JP2016091266A (ja) * 2014-11-04 2016-05-23 富士通株式会社 翻訳装置、翻訳方法、及び翻訳プログラム
US11062228B2 (en) 2015-07-06 2021-07-13 Microsoft Technoiogy Licensing, LLC Transfer learning techniques for disparate label sets
CN109074239A (zh) * 2016-07-28 2018-12-21 松下知识产权经营株式会社 翻译装置以及翻译系统
CN108538284A (zh) * 2017-03-06 2018-09-14 北京搜狗科技发展有限公司 同声翻译结果的展现方法及装置、同声翻译方法及装置
US10885900B2 (en) * 2017-08-11 2021-01-05 Microsoft Technology Licensing, Llc Domain adaptation in speech recognition via teacher-student learning
US11049501B2 (en) 2018-09-25 2021-06-29 International Business Machines Corporation Speech-to-text transcription with multiple languages
US10936635B2 (en) * 2018-10-08 2021-03-02 International Business Machines Corporation Context-based generation of semantically-similar phrases

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06236410A (ja) 1991-11-12 1994-08-23 Nippon Telegr & Teleph Corp <Ntt> 自動情報提供方法
JP2986345B2 (ja) * 1993-10-18 1999-12-06 インターナショナル・ビジネス・マシーンズ・コーポレイション 音声記録指標化装置及び方法
US5956668A (en) * 1997-07-18 1999-09-21 At&T Corp. Method and apparatus for speech translation with unrecognized segments
US6278968B1 (en) * 1999-01-29 2001-08-21 Sony Corporation Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system
JP2001101187A (ja) * 1999-09-30 2001-04-13 Sony Corp 翻訳装置および翻訳方法、並びに記録媒体
US6999932B1 (en) * 2000-10-10 2006-02-14 Intel Corporation Language independent voice-based search system
US7050979B2 (en) * 2001-01-24 2006-05-23 Matsushita Electric Industrial Co., Ltd. Apparatus and method for converting a spoken language to a second language
JP3768105B2 (ja) 2001-01-29 2006-04-19 株式会社東芝 翻訳装置、翻訳方法並びに翻訳プログラム
JP3737779B2 (ja) * 2002-05-29 2006-01-25 富士通株式会社 翻訳サーバ、翻訳方法及びプログラム
JP3920812B2 (ja) * 2003-05-27 2007-05-30 株式会社東芝 コミュニケーション支援装置、支援方法、及び支援プログラム
US7539619B1 (en) * 2003-09-05 2009-05-26 Spoken Translation Ind. Speech-enabled language translation system and method enabling interactive user supervision of translation and speech recognition accuracy
US7359849B2 (en) * 2003-12-17 2008-04-15 Speechgear, Inc. Translation techniques for acronyms and ambiguities
JP4287386B2 (ja) * 2005-01-31 2009-07-01 株式会社東芝 情報検索システム、方法及びプログラム
US20080249776A1 (en) * 2005-03-07 2008-10-09 Linguatec Sprachtechnologien Gmbh Methods and Arrangements for Enhancing Machine Processable Text Information
JP4263181B2 (ja) * 2005-03-28 2009-05-13 株式会社東芝 コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP4050755B2 (ja) * 2005-03-30 2008-02-20 株式会社東芝 コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP4064413B2 (ja) * 2005-06-27 2008-03-19 株式会社東芝 コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
US7552053B2 (en) * 2005-08-22 2009-06-23 International Business Machines Corporation Techniques for aiding speech-to-speech translation
JP4058071B2 (ja) * 2005-11-22 2008-03-05 株式会社東芝 用例翻訳装置、用例翻訳方法および用例翻訳プログラム
JP2007220045A (ja) * 2006-02-20 2007-08-30 Toshiba Corp コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101377459B1 (ko) * 2009-12-21 2014-03-26 한국전자통신연구원 자동 통역 장치 및 그 방법
US10304457B2 (en) 2011-07-26 2019-05-28 Kabushiki Kaisha Toshiba Transcription support system and transcription support method
JPWO2017183127A1 (ja) * 2016-04-20 2018-12-27 マクセル株式会社 表示装置、出力装置、および情報表示方法
JP2016177311A (ja) * 2016-05-25 2016-10-06 株式会社東芝 テキスト処理装置、テキスト処理方法およびテキスト処理プログラム
JP2021048609A (ja) * 2020-11-26 2021-03-25 マクセル株式会社 出力装置および情報表示方法
JP7051987B2 (ja) 2020-11-26 2022-04-11 マクセル株式会社 出力装置および情報表示方法
JP7048141B1 (ja) 2022-01-05 2022-04-05 株式会社Airobo プログラム、ファイル生成方法、情報処理装置、及び情報処理システム
WO2023132140A1 (ja) * 2022-01-05 2023-07-13 株式会社アーティスソリューションズ プログラム、ファイル生成方法、情報処理装置、及び情報処理システム
JP2023100149A (ja) * 2022-01-05 2023-07-18 株式会社Airobo プログラム、ファイル生成方法、情報処理装置、及び情報処理システム

Also Published As

Publication number Publication date
US8214197B2 (en) 2012-07-03
CN101154219A (zh) 2008-04-02
US20080077392A1 (en) 2008-03-27
JP4398966B2 (ja) 2010-01-13

Similar Documents

Publication Publication Date Title
JP4398966B2 (ja) 機械翻訳を行う装置、システム、方法およびプログラム
US11049493B2 (en) Spoken dialog device, spoken dialog method, and recording medium
US11972227B2 (en) Lexicon development via shared translation database
JP4267081B2 (ja) 分散システムにおけるパターン認識登録
US9753918B2 (en) Lexicon development via shared translation database
EP3387646B1 (en) Text-to-speech processing system and method
US7668718B2 (en) Synchronized pattern recognition source data processed by manual or automatic means for creation of shared speaker-dependent speech user profile
JP4481972B2 (ja) 音声翻訳装置、音声翻訳方法及び音声翻訳プログラム
JP4439431B2 (ja) コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP4559946B2 (ja) 入力装置、入力方法および入力プログラム
EP1330816B1 (en) Language independent voice-based user interface
US20060224378A1 (en) Communication support apparatus and computer program product for supporting communication by performing translation between languages
JP2001100781A (ja) 音声処理装置および音声処理方法、並びに記録媒体
US11093110B1 (en) Messaging feedback mechanism
JP2008077601A (ja) 機械翻訳装置、機械翻訳方法および機械翻訳プログラム
JPWO2008114811A1 (ja) 情報検索システム、情報検索方法及び情報検索用プログラム
JP2007220045A (ja) コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
CN102084417A (zh) 现场维护语音到语音翻译的系统和方法
WO2011094090A1 (en) Enhanced speech-to-speech translation system and methods
JP2008243080A (ja) 音声を翻訳する装置、方法およびプログラム
Granell et al. Multimodality, interactivity, and crowdsourcing for document transcription
Prasad et al. BBN TransTalk: Robust multilingual two-way speech-to-speech translation for mobile platforms
JP2015026054A (ja) 自動通訳装置及び方法
JP2003029779A (ja) 自動通訳システム及びその方法並びにプログラム
Yamamoto Toward speech communications beyond language barrier-research of spoken language translation technologies at ATR-.

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080327

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080902

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081030

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090721

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090827

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090929

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091023

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121030

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4398966

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131030

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

Free format text: JAPANESE INTERMEDIATE CODE: R313114

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350