JP2012168893A - 機械翻訳装置、機械翻訳方法および機械翻訳プログラム - Google Patents

機械翻訳装置、機械翻訳方法および機械翻訳プログラム Download PDF

Info

Publication number
JP2012168893A
JP2012168893A JP2011031240A JP2011031240A JP2012168893A JP 2012168893 A JP2012168893 A JP 2012168893A JP 2011031240 A JP2011031240 A JP 2011031240A JP 2011031240 A JP2011031240 A JP 2011031240A JP 2012168893 A JP2012168893 A JP 2012168893A
Authority
JP
Japan
Prior art keywords
language
translation
acquired
additional information
text information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011031240A
Other languages
English (en)
Other versions
JP5666937B2 (ja
Inventor
Hiroyuki Tanaka
浩之 田中
Tetsuro Chino
哲朗 知野
Satoshi Kamaya
聡史 釜谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2011031240A priority Critical patent/JP5666937B2/ja
Priority to US13/237,016 priority patent/US9262408B2/en
Publication of JP2012168893A publication Critical patent/JP2012168893A/ja
Application granted granted Critical
Publication of JP5666937B2 publication Critical patent/JP5666937B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation

Abstract

【課題】
利用者の現在の利用シーンに対応する適応モデルをオンラインで動的に生成する機械翻訳装置を実現することである。
【解決手段】
実施形態の機械翻訳装置は、第1言語を入力する言語入力手段と、前記言語入力手段に入力された第1言語の利用者もしくは利用場所に関する付加情報を取得する付加情報取得手段と、第2言語と当該第2言語を取得した際の利用者もしくは利用場所に関する付加情報を対応付けた第2言語の参照データを格納する参照データ格納手段と、前記付加情報取得手段で取得された第1言語の付加情報の全部あるいは一部と同一な内容の付加情報を有する第2言語のテキスト情報を取得するテキスト情報取得手段と、前記テキスト情報取得手段によって取得された第2言語のテキスト情報を利用して、前記言語入力手段に入力された第1言語を第2言語に翻訳する翻訳手段とを備える。
【選択図】図1

Description

本発明の実施形態は、機械翻訳装置、機械翻訳方法および機械翻訳プログラムに関する。
近年、コンピュータの高性能化、ブロードバンドインフラの急速な普及に従い、入力された原言語のテキストを目的言語のテキストに翻訳する機械翻訳装置およびサービスが普及してきている。これらの機械翻訳では、翻訳の精度を向上させるために、利用者が予め選択した「買い物」、「乗り物」などの利用シーン毎に翻訳辞書を切り替える方法が提案されている。
しかしながら、上述した方法では、オフラインで予め分類された利用シーンにしか対応することができなかった。
特開平7−141383号公報 特開2002−366545号公報
Philipp Koehn, "Statistical Machine Translation," 第1版, Cambridge University Press, 2009年12月17日, Chapter 7. Philipp Koehn, Josh Schroeder, "Experiments in domain adaptation for statistical machine translation," Proceedings of the Second Workshop on Statistical Machine Translation, Prague, Czech Republic, June 23-23, 2007, p.224-227.
発明が解決しようとする課題は、利用者の現在の利用シーンに対応する機械翻訳装置を提供することである。
実施形態の機械翻訳装置は、第1言語を入力する言語入力手段と、前記言語入力手段に入力された第1言語の利用者もしくは利用場所に関する付加情報を取得する付加情報取得手段と、第2言語と当該第2言語を取得した際の利用者もしくは利用場所に関する付加情報を対応付けた第2言語の参照データを格納する参照データ格納手段と、前記付加情報取得手段で取得された第1言語の付加情報の全部あるいは一部と同一な内容の付加情報を有する第2言語のテキスト情報を取得するテキスト情報取得手段と、前記テキスト情報取得手段によって取得された第2言語のテキスト情報を利用して、前記言語入力手段に入力された第1言語を第2言語に翻訳する翻訳手段とを備える。
第1の実施形態の機械翻訳装置を示すブロック図。 実施形態の付加情報を示す図。 実施形態の翻訳文候補と翻訳スコアを示す図。 実施形態の日本語の参照データを示す図。 実施形態の適応モデルの学習に利用する日本語のテキスト情報を示す図。 実施形態の適応モデルを示す図。 実施形態の翻訳スコアを示す図。 実施形態の機械翻訳装置のフローチャート。 実施形態の機械翻訳装置のフローチャート。 実施形態の参照データを示す図。
以下、本発明の実施形態について図面を参照しながら説明する。
(第1の実施形態)
第1の実施形態の機械翻訳装置は、英語のテキストを目的言語である日本語のテキストに翻訳する装置である。この機械翻訳装置は、例えば、付加情報として利用者のプロファイルデータおよび利用場所に関する情報を取得し、この付加情報に適した翻訳の適応モデルを参照データを用いて学習する。参照データとは、目的言語である日本語と当該日本語を取得した際の利用者および利用場所に関する付加情報を対応付けたデータである。機械翻訳装置は、利用者が入力した英語とその付加情報を取得すると、同様な内容の付加情報を有する日本語の参照データを参照データ格納部から取得する。そして、取得した日本語の参照データのテキスト情報から訳出傾向を表す適応モデルを生成する。このように、翻訳の適応モデルをオンラインで動的に生成することにより、利用者の利用シーンに柔軟に対応した適応モデルを学習できる。本実施形態では、利用者の英語を通常の方法で機械翻訳し、複数の翻訳文候補とその翻訳スコアを算出する。そして、オンラインで動的に生成した適応モデルを利用して翻訳スコアを更新し、最終的な翻訳結果を出力する。
(全体のブロック構成)
図1は、第1の実施形態にかかる機械翻訳装置を示すブロック図である。本実施形態の機械翻訳装置は、原言語である英語を入力する言語入力部101と、言語入力部101に入力された英語の利用者および利用場所に関する付加情報を取得する付加情報取得部102と、目的言語である日本語と当該日本語を取得した際の利用者および利用場所に関する付加情報を対応付けた日本語の参照データを格納する参照データ格納部103と、前記付加情報取得部102で取得された英語に関する付加情報の全部あるいは一部と同一な内容の付加情報を有する日本語の参照データからテキスト情報を取得するテキスト情報取得部104と、テキスト情報取得部104で取得された日本語のテキスト情報を利用して、言語入力部101に入力された英語を日本語に翻訳する翻訳部105と、翻訳部105の翻訳結果を出力する出力部106とを備える。
本実施形態の翻訳部105は、翻訳辞書107を用いて言語入力部101に入力された英語を日本語に翻訳し、複数の翻訳文候補と当該翻訳文候補の翻訳スコアを取得する翻訳文候補取得部108と、テキスト情報取得部104によって取得された日本語のテキスト情報から訳出傾向を表す適応モデルを学習する適応モデル学習部109と、適応モデル学習部109によって学習された適応モデルを用いて翻訳文候補取得部108で取得された複数の翻訳文候補の翻訳スコアを更新する適応翻訳部110とを備える。
(言語取得部)
言語入力部101は、翻訳対象となる英語のテキストを入力する。ここで、入力には、キーボード、ポインティングデバイス、手書き文字認識、OCR、音声認識など、一般的に用いられる様々な方法を用いることができる。
(付加情報取得部)
付加情報取得部102は、言語入力部101に入力された英語の利用者のプロファイルデータおよび利用場所に関する付加情報を取得する。利用者のプロファイルデータは、利用者の性別、年齢、職業、趣味、使用言語等を表すデータである。このデータは、機械翻訳装置の利用登録時に利用者が一度入力すればよい。利用場所に関する情報は、機械翻訳装置に搭載されたGPSセンサで取得できる。例えば、図2(a)は、"It looks good."というテキストが言語入力部101に入力されたときに取得された付加情報を表している。この例では、利用者のプロファイルデータとして性別、生年、使用言語が、利用場所に関する情報として緯度、経度が取得される。
付加情報取得部102は、上述した利用者のプロファイルデータやGPSセンサで取得された利用場所に関する情報を解析して他の付加情報を取得することもできる。例えば、GPSセンサで取得した緯度、経度と実在の地図データを照らし合わせて、利用者が現在いる施設のカテゴリや都市名などの利用場所に関する付加情報を取得できる。また、利用者のプロファイルデータの生年1993年と現在の日にち(2011年)から、利用者に関する付加情報として利用者の年代「20代」を計算することができる(図2(b))。
(翻訳文候補取得部)
翻訳文候補取得部108は、言語入力部101に入力された英語のテキストを目的言語である日本語のテキストに翻訳する。具体的には、基本となる翻訳辞書107を用いて翻訳し、その結果として複数の候補文候補(翻訳文候補群)と各候補の確からしさを表す翻訳スコアを出力する。翻訳処理には、一般的なトランスファ方式、用例ベース方式、統計ベース方式、中間言語方式の機械翻訳システムにおいて利用されている様々な方法を用いることができる。
図3は、言語入力部101に入力された"It looks good."の翻訳文候補群と各翻訳文候補の翻訳スコアを示している。
(参照データ格納部)
参照データ格納部103は、目的言語である日本語と当該日本語を取得した際の利用者および利用場所に関する付加情報とを対応付けた参照データを格納している。この参照データは、後述する適応モデル学習部109で適応モデルを計算する際の学習データとして利用する。図4に、日本語の参照データの例を示す。参照データには、他の利用者の機械翻訳装置で取得された情報を利用する。例えば、日本語を母国語とする他の利用者が別の機械翻訳装置を使用した際に入力した日本語と当該日本語の利用者および利用場所に関する付加情報とを対応付けたデータを参照データとして利用することができる。各言語の参照データは、ネットワークを介した共有サーバ上に蓄積してもよい。これにより、多数の利用者の参照データを容易に蓄積することができる。
(テキスト情報取得部)
テキスト情報取得部104は、翻訳文候補取得部108で取得された翻訳文候補と当該翻訳文候補に対応する英語の利用者および利用場所に関する付加情報を利用して、参照データ格納部103に格納された日本語の参照データから適応モデルの学習に用いる日本語のテキスト情報を取得する。まず、翻訳対象となる英語に関する付加情報と同一内容の付加情報を有する日本語の参照データを参照データ格納部103から取得する。ここで、本実施形態では、取得された全ての付加情報ではなく「性別」、「年代」、「施設カテゴリ」について内容の同一性を判断する。次に、取得された参照データの日本語テキストから、翻訳文候補取得部108で取得された翻訳文候補群との類似度が所定値以上になるテキストを取得し、後述する適応モデル学習部109に出力する。
図2(a)および(b)の場合、付加情報の内容のうち性別が「女性」、年代が「10代」、施設カテゴリが「Restaurant」となっている日本語の参照データを参照データ格納部103から取得する。図5(a)は、参照データ格納部103から取得された参照データの日本語テキストを表している。次に、テキスト情報取得部104は、図5(a)の各日本語テキストについて、図3の翻訳文候補群との類似度を後述する方法で計算する。図5(b)は、計算された類似度を表している。最後に、テキスト情報取得部104は、図5(b)の類似度が所定値以上となる日本語テキストを取得し、適応モデル学習部109に出力する。図5(c)は、所定値を0.4に設定した場合にテキスト情報取得部104が出力する日本語テキストを表している。
日本語テキストと翻訳文候補群の類似度の計算方法について説明する。類似度計算には、編集距離、ワードエラーレート、トランスレーションエラーレート、BLEUなどのn-gram情報を用いた指標などを用いることができる。本実施形態では、日本語テキストと翻訳文候補との文字トライグラムの一致度を2つの文の全文字トライグラム数で割った値を類似度として用いる。例えば、「これおいしそうだね−。」と「おいしそうだね!」の2文をトライグラムに分解すると、それぞれ「これお、れおい、おいし、いしそ、しそう、そうだ、うだね、だねー、ねー。」と「おいし、いしそ、しそう、そうだ、うだね、だね!」となる。この2文は5つのトライグラムが一致していることから、類似度として5/10=0.5という値が得られる。以上の方法で、各日本語テキストについて全ての翻訳文候補との類似度を計算する。そして、得られた類似度のうち最大の値を当該日本語テキストの最終的な類似度とする。
なお、本実施形態では、「性別」、「年代」、「施設カテゴリ」の付加情報について同一性を判断しているが、全ての付加情報が一致する日本語の参照データを参照データ格納部103から取得するようにしてもよい。
(適応モデル学習部)
適応モデル学習部109は、テキスト情報取得部104によって取得された日本語テキストから訳出傾向を表す適応モデルを学習する。本実施形態では、適応モデルとして適応文群から学習した単語バイグラム言語モデル(非特許文献1)を用いる。図6は、対数確率で表した単語バイグラムの適応モデルを示している。
この他にも、適応モデルとして他のグラム数を有するnーgram言語モデルや隠れマルコフモデル、最大エントロピーモデル、WFST、CRF、対数線形モデル等の確率モデルや、TF−IDFなどの特徴語抽出方法などの方法を用いることができる。
(適応翻訳部)
適応翻訳部110は、適応モデル学習部109で学習された適応モデルを用いて、翻訳文候補取得部108で取得された複数の翻訳文候補の翻訳スコアを更新する。具体的には、翻訳文候補取得部108で取得された翻訳スコアと適応モデルによって計算された適応スコアとの平均を更新後の翻訳スコアとして取得する。
図7(a)は、適応モデルを用いて図3の翻訳文候補の適応スコアを計算した例である。同図に示すID8の「おいしそうー!」なる文の適応スコアは、図6に示す適応モデルの(おいしそう,ー)と(ー,!)から0.310+0.147=0.457と計算される。適応翻訳部110は、図7(a)に示された更新前の翻訳スコアと適応スコアを用いて更新後の翻訳スコアを算出する。図7(b)は、更新後の翻訳スコアが大きい順に翻訳文候補をリスト表示している。同図において、ID1の「それはよさそうですね。」なる文の更新後の翻訳スコアは(0.358+0.093)/2=0.226となり、ID8の「おいしそうー!」なる文の更新後の翻訳スコアは(0.268+0.457)/2=0363となる。以上のように、適応スコアを用いて翻訳スコアを更新した結果、性別が「女性」、年代が「10代」、施設カテゴリが「Restaurant」の付加情報に適した翻訳文候補の翻訳スコアが大きくなる。
このように、オンラインで動的に学習した適応モデルを用いた翻訳スコアの更新により、例えば、”It looks good.”を「男性」が入力した場合には、図7(a)に示すID7の「うまそうー!」の翻訳スコアが最も大きくなり、”It looks good.”を「clothing store」で入力した場合には、ID17の「かわいいー!」の翻訳スコアが最も大きくなるなど、現在の付加情報が示す利用者および利用場所に適した翻訳結果を得ることができる。
(出力部)
出力部106は、適応翻訳部110によって翻訳スコアが更新された翻訳文候補のうち最大の翻訳スコアをもつ翻訳文候補を最終的な翻訳結果として出力する。出力形式としては、ディスプレイ装置による画像出力、プリンタ装置による印字出力、音声合成装置による合成音声出力など、従来から用いられている方式を用いることができる。
(フローチャート)
図8は、本実施形態にかかる機械翻訳装置のフローチャートである。まず、言語入力部101は、翻訳対象となる英語を入力する(ステップS81)。次に、付加情報取得部102は、入力された英語に関する付加情報として、利用者のプロファイルデータと当該英語の利用場所に関する情報を取得する(ステップS82)。翻訳文候補取得部108は、言語入力部101に入力された英語を日本語に翻訳して、複数の翻訳文候補と各翻訳文候補の翻訳スコアを取得する(ステップS83)。テキスト情報取得部104は、翻訳文候補取得部108で取得された翻訳文候補と当該翻訳文候補に対応する英語に関する付加情報を利用して、参照データ格納部103に格納された日本語の参照データから適応モデル学習に用いる日本語のテキストを取得する(ステップS84)。ステップS84の詳細は後述する。適応モデル学習部109は、ステップS84で取得された日本語のテキストを学習データとして適応モデルを学習する(ステップS85)。適応翻訳部110は、適応モデル学習部109によって学習された適応モデルを用いて、翻訳文候補取得部108で取得された複数の翻訳文候補の翻訳スコアを更新する(ステップS86)。最後に、出力部106は、更新後の翻訳スコアが最大となる翻訳文候補を最終的な翻訳結果として出力する(ステップS87)。
次に、図9のフローチャートを用いてステップS84の詳細を説明する。まず、言語入力部101に入力された英語に関する付加情報と同一な内容の付加情報(性別、年代、施設カテゴリ)を有する日本語の参照データを参照データ格納部103から取得する(ステップS91)。ステップS91で参照データを取得した場合(ステップS92のYesの分岐)、当該参照データから類似度を計算する1つの日本語テキストPを選択する(ステップS93)。次に、この日本語テキストPと翻訳文候補群Cの類似度を計算する(ステップS94)。そして、計算された類似度が所定値以上となる場合(ステップS95のYesの分岐)は、当該日本語テキストPを適応モデルの学習データに追加する(ステップS96)。一方、計算された類似度が所定値を下回る場合(ステップS95のNoの分岐)は、ステップS97に移行して他の日本語テキストに対する類似度計算の必要性を確認する。以上の処理を繰り返して、全ての日本語テキストの類似度計算が終了したら(ステップS97のYesの分岐)、取得した日本語の学習データを適応モデル学習部109に出力する(ステップS98)。
(効果)
このように、本実施形態にかかる機械翻訳装置は、付加情報の内容が一致する日本語のテキスト情報から訳出傾向を表す適応モデルをオンラインで動的に生成し、当該適応モデルを用いて翻訳スコアを更新している。これにより、利用者の現在の利用シーンに適した翻訳を行うことができる。また、機械翻訳装置で取得した付加情報から適応モデルを自動的に生成することにより、利用者が予め利用シーンを選択する手間を除くことができる。
本実施形態にかかる機械翻訳装置は、ネットワークを介した共有サーバ上に蓄積された他の利用者の日本語と当該日本語の利用者および利用場所に関する付加情報を参照データとして利用する。これにより、様々な状況に対応した参照データを利用できる。
(変形例1)
本実施形態で取得した英語と当該英語の利用者および利用場所に関する付加情報を、英語の参照データとして参照データ格納部103に格納することもできる。この参照データは、日本語のテキストを英語のテキストに翻訳する際に利用できる。また、上記英語の参照データを、ネットワークを介した共有サーバ上に蓄積することもできる。これにより、他の利用者が適応モデルを学習する際の英語の参照データを、別途コストをかけることなく収集できる。ここで、参照データ格納部103は、図10に示すように、複数の言語の参照データを一括して格納するものであってもよい。
(変形例2)
付加情報を取得するために、加速度センサ、ジャイロセンサ、環境光センサ、血圧センサ等の各種センサによるセンシングデータや、カメラデバイスによる周辺画像を用いることもできる。また、特開2010−74278記載の方法を用いて、加速度センサの情報から、車に乗っている、電車に乗っている、走っている、歩いている、立ち止まっている、などの利用者の行動に関する情報を抽出して付加情報として利用することもできる。さらに、機械翻訳装置が外部と通信する手段を有する場合は、基地局IDを利用場所に関する付加情報として取得することもできる。
(変形例3)
本実施形態では、複数の翻訳文候補とその翻訳スコアを翻訳文候補取得部108で取得し、その後適応翻訳部110で翻訳スコアを更新するようにしたが、例えば非特許文献2のように、適応モデル学習部109で学習されたる適応モデルをインドメイン言語モデルとして使用し、最終的な翻訳スコアを直接計算するようにしてもよい。
(変形例4)
参照データ格納部103に格納されている参照データの日本語を、テキスト形式でなく音声データの形式で格納することもできる。適応モデルを学習する際は、音声認識を使って当該音声データから日本語のテキスト情報を抽出することができる。
(変形例5)
本実施形態では、1つの適応モデルを学習したが、参照データから複数の適応モデルを学習するようにしてもよい。例えば、年代が同一な参照データと場所が同一な参照データからそれぞれ適応モデルを学習し、学習された適応モデルを所定の重みで足し合わせるなどして翻訳スコアを計算することもできる。
本実施の形態にかかる機械翻訳装置をコンピュータで実行可能なプログラムで実現し、そのプログラムをコンピュータで読み取り可能な記憶媒体として提供することも可能である。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
101 言語入力部
102 付加情報取得部
103 参照データ格納部
104 テキスト情報取得部
105 翻訳部
106 出力部
107 翻訳辞書
108 翻訳文候補取得部
109 適応モデル学習部
110 適応翻訳部

Claims (9)

  1. 第1言語を第2言語に翻訳する機械翻訳装置であって、
    第1言語を入力する言語入力手段と、
    前記言語入力手段に入力された第1言語の利用者もしくは利用場所に関する付加情報を取得する付加情報取得手段と、
    第2言語と当該第2言語を取得した際の利用者もしくは利用場所に関する付加情報を対応付けた第2言語の参照データを格納する参照データ格納手段と、
    前記参照データ格納手段から、前記付加情報取得手段で取得された第1言語の付加情報の全部あるいは一部と同一な内容の付加情報を有する第2言語のテキスト情報を取得するテキスト情報取得手段と、
    前記テキスト情報取得手段によって取得された第2言語のテキスト情報を利用して、前記言語入力手段に入力された第1言語を第2言語に翻訳する翻訳手段と、
    を備える機械翻訳装置。
  2. 前記翻訳手段が、前記言語入力手段に入力された第1言語を第2言語に翻訳して複数の翻訳文候補と当該翻訳文候補の翻訳スコアを取得する翻訳文候補取得手段と、
    前記テキスト情報取得手段によって取得された第2言語のテキスト情報から訳出傾向を表す適応モデルを学習する適応モデル学習手段と、
    前記適応モデル学習手段によって学習された適応モデルを用いて前記翻訳文候補取得手段で取得された複数の翻訳文候補の翻訳スコアを更新する適応翻訳手段とを備え、
    前記テキスト情報取得手段が、前記翻訳文候補取得手段で取得された翻訳文候補を利用して、前記第2言語の参照データから第2言語のテキスト情報を取得する請求項1記載の機械翻訳装置。
  3. 前記テキスト情報取得手段が、前記翻訳文候補取得手段で取得された翻訳文候補と前記参照データ格納手段に格納された第2言語のテキストの類似度を利用して、前記第2言語の参照データから第2言語のテキスト情報を取得する請求項2記載の機械翻訳装置。
  4. 前記参照データ格納手段に格納された参照データが、前記機械翻訳装置以外の装置で取得された第2言語と当該第2言語を取得した際の利用者もしくは利用場所に関する付加情報を対応付けた第2言語の参照データを含む請求項1から請求項3の何れか1項に記載の機械翻訳装置。
  5. 前記参照データ格納手段が、前記言語入力手段に入力された第1言語と前記付加情報取得手段で取得された当該第1言語の付加情報とを対応付けたデータを第1言語の参照データとして格納する請求項1から請求項4の何れか1項に記載の機械翻訳装置。
  6. 第1言語を第2言語に翻訳する機械翻訳方法であって、
    第1言語を入力する言語入力工程と、
    前記言語入力工程で入力された第1言語の利用者もしくは利用場所に関する付加情報を取得する付加情報取得工程と、
    第2言語と当該第2言語を取得した際の利用者もしくは利用場所に関する付加情報を対応付けた第2言語の参照データを格納した参照データ格納手段から、前記付加情報取得工程で取得された第1言語の付加情報の全部あるいは一部と同一な内容の付加情報を有する第2言語のテキスト情報を取得するテキスト情報取得工程と、
    前記テキスト情報取得工程によって取得された第2言語のテキスト情報を利用して、前記言語入力工程で入力された第1言語を第2言語に翻訳する翻訳工程と、
    を備える機械翻訳方法。
  7. 前記翻訳工程が、前記言語入力工程で入力された第1言語を第2言語に翻訳して複数の翻訳文候補と当該翻訳文候補の翻訳スコアを取得する翻訳文候補取得工程と、
    前記テキスト情報取得工程によって取得された第2言語のテキスト情報から訳出傾向を表す適応モデルを学習する適応モデル学習工程と、
    前記適応モデル学習工程によって学習された適応モデルを用いて前記翻訳文候補取得工程で取得された複数の翻訳文候補の翻訳スコアを更新する適応翻訳工程とを備え、
    前記テキスト情報取得工程が、前記翻訳文候補取得工程で取得された翻訳文候補を利用して、前記第2言語の参照データから第2言語のテキスト情報を取得する請求項6記載の機械翻訳方法。
  8. 第1言語を第2言語に翻訳する機械翻訳装置に、
    第1言語を入力する言語入力工程と、
    前記言語入力工程で入力された第1言語の利用者もしくは利用場所に関する付加情報を取得する付加情報取得工程と、
    第2言語と当該第2言語を取得した際の利用者もしくは利用場所に関する付加情報を対応付けた第2言語の参照データを格納した参照データ格納手段から、前記付加情報取得工程で取得された第1言語の付加情報の全部あるいは一部と同一な内容の付加情報を有する第2言語のテキスト情報を取得するテキスト情報取得工程と、
    前記テキスト情報取得工程によって取得された第2言語のテキスト情報を利用して、前記言語入力工程で入力された第1言語を第2言語に翻訳する翻訳工程と、
    を実現させるための機械翻訳プログラム。
  9. 前記翻訳工程が、前記言語入力工程で入力された第1言語を第2言語に翻訳して複数の翻訳文候補と当該翻訳文候補の翻訳スコアを取得する翻訳文候補取得工程と、
    前記テキスト情報取得工程によって取得された第2言語のテキスト情報から訳出傾向を表す適応モデルを学習する適応モデル学習工程と、
    前記適応モデル学習工程によって学習された適応モデルを用いて前記翻訳文候補取得工程で取得された複数の翻訳文候補の翻訳スコアを更新する適応翻訳工程とを備え、
    前記テキスト情報取得工程が、前記翻訳文候補取得工程で取得された翻訳文候補を利用して、前記第2言語の参照データから第2言語のテキスト情報を取得する請求項8記載の機械翻訳プログラム。
JP2011031240A 2011-02-16 2011-02-16 機械翻訳装置、機械翻訳方法および機械翻訳プログラム Active JP5666937B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2011031240A JP5666937B2 (ja) 2011-02-16 2011-02-16 機械翻訳装置、機械翻訳方法および機械翻訳プログラム
US13/237,016 US9262408B2 (en) 2011-02-16 2011-09-20 Machine translation apparatus, machine translation method and computer program product for machine translation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011031240A JP5666937B2 (ja) 2011-02-16 2011-02-16 機械翻訳装置、機械翻訳方法および機械翻訳プログラム

Publications (2)

Publication Number Publication Date
JP2012168893A true JP2012168893A (ja) 2012-09-06
JP5666937B2 JP5666937B2 (ja) 2015-02-12

Family

ID=46637572

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011031240A Active JP5666937B2 (ja) 2011-02-16 2011-02-16 機械翻訳装置、機械翻訳方法および機械翻訳プログラム

Country Status (2)

Country Link
US (1) US9262408B2 (ja)
JP (1) JP5666937B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017058865A (ja) * 2015-09-15 2017-03-23 株式会社東芝 機械翻訳装置、機械翻訳方法および機械翻訳プログラム
CN107704456A (zh) * 2016-08-09 2018-02-16 松下知识产权经营株式会社 识别控制方法以及识别控制装置

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9519639B2 (en) * 2012-06-08 2016-12-13 Facebook, Inc. Community translation of user-generated content
US9026425B2 (en) * 2012-08-28 2015-05-05 Xerox Corporation Lexical and phrasal feature domain adaptation in statistical machine translation
US9183198B2 (en) 2013-03-19 2015-11-10 International Business Machines Corporation Customizable and low-latency interactive computer-aided translation
KR20150085145A (ko) * 2014-01-13 2015-07-23 한국전자통신연구원 사용자 반응 기반 통역 시스템 및 그 방법
WO2015192313A1 (en) * 2014-06-17 2015-12-23 Google Inc. Input method editor for inputting names of geographic locations
US9519643B1 (en) 2015-06-15 2016-12-13 Microsoft Technology Licensing, Llc Machine map label translation
CN109145282B (zh) * 2017-06-16 2023-11-07 贵州小爱机器人科技有限公司 断句模型训练方法、断句方法、装置及计算机设备
US20210034824A1 (en) * 2018-08-24 2021-02-04 Ntt Docomo, Inc. Machine translation control device
CN109284503B (zh) * 2018-10-22 2023-08-18 传神语联网网络科技股份有限公司 翻译语句结束判断方法与系统
KR102206181B1 (ko) * 2018-12-19 2021-01-22 엘지전자 주식회사 단말기 및 그의 동작 방법
CN110083842B (zh) * 2019-03-27 2023-10-03 华为技术有限公司 译文质量检测方法、装置、机器翻译系统和存储介质
US11341340B2 (en) * 2019-10-01 2022-05-24 Google Llc Neural machine translation adaptation
CN112560511B (zh) * 2020-12-14 2024-04-23 北京奇艺世纪科技有限公司 台词翻译方法、装置及翻译模型训练方法、装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5004A (en) * 1847-03-06 Improvement in refining turpentine
US6021A (en) * 1849-01-09 Cast-iron cab-wheel
US10013A (en) * 1853-09-13 Revolving- mandrel for lining- cylinders with metal
JPH07141383A (ja) * 1993-11-19 1995-06-02 Sharp Corp 会話文翻訳装置
US6192332B1 (en) * 1998-04-06 2001-02-20 Mitsubishi Electric Research Laboratories, Inc. Adaptive electronic phrase book
JP2005100335A (ja) * 2003-09-01 2005-04-14 Advanced Telecommunication Research Institute International 機械翻訳装置、機械翻訳コンピュータプログラム及びコンピュータ
JP2006277119A (ja) * 2005-03-28 2006-10-12 Toshiba Corp コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP2007072663A (ja) * 2005-09-06 2007-03-22 Advanced Telecommunication Research Institute International 用例翻訳装置、及び用例翻訳方法
JP2007323476A (ja) * 2006-06-02 2007-12-13 National Institute Of Information & Communication Technology 機械翻訳装置及びコンピュータプログラム

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996010795A1 (en) * 1994-10-03 1996-04-11 Helfgott & Karas, P.C. A database accessing system
US5987402A (en) * 1995-01-31 1999-11-16 Oki Electric Industry Co., Ltd. System and method for efficiently retrieving and translating source documents in different languages, and other displaying the translated documents at a client device
JP2001101187A (ja) * 1999-09-30 2001-04-13 Sony Corp 翻訳装置および翻訳方法、並びに記録媒体
US7107204B1 (en) * 2000-04-24 2006-09-12 Microsoft Corporation Computer-aided writing system and method with cross-language writing wizard
JP2002082987A (ja) * 2000-09-06 2002-03-22 Seiko Epson Corp 文書情報閲読支援装置、ディジタルコンテンツ作成システム、ディジタルコンテンツ配信システム及び記憶媒体
JP2002366545A (ja) 2001-06-08 2002-12-20 Sony Corp 外国語会話支援装置
US7249012B2 (en) * 2002-11-20 2007-07-24 Microsoft Corporation Statistical method and apparatus for learning translation relationships among phrases
JP3920812B2 (ja) * 2003-05-27 2007-05-30 株式会社東芝 コミュニケーション支援装置、支援方法、及び支援プログラム
US7539619B1 (en) * 2003-09-05 2009-05-26 Spoken Translation Ind. Speech-enabled language translation system and method enabling interactive user supervision of translation and speech recognition accuracy
CN1942875B (zh) * 2004-04-12 2010-05-26 松下电器产业株式会社 对话支援装置
JP4064413B2 (ja) 2005-06-27 2008-03-19 株式会社東芝 コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
US8185377B2 (en) * 2007-08-11 2012-05-22 Microsoft Corporation Diagnostic evaluation of machine translators
US8271260B2 (en) * 2007-12-05 2012-09-18 Facebook, Inc. Community translation on a social network
US9323854B2 (en) * 2008-12-19 2016-04-26 Intel Corporation Method, apparatus and system for location assisted translation
US8539359B2 (en) * 2009-02-11 2013-09-17 Jeffrey A. Rapaport Social network driven indexing system for instantly clustering people with concurrent focus on same topic into on-topic chat rooms and/or for generating on-topic search results tailored to user preferences regarding topic
JP5208795B2 (ja) 2009-02-12 2013-06-12 株式会社東芝 通訳装置、方法、及びプログラム
WO2011036769A1 (ja) 2009-09-25 2011-03-31 株式会社東芝 翻訳装置、及びプログラム

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5004A (en) * 1847-03-06 Improvement in refining turpentine
US6021A (en) * 1849-01-09 Cast-iron cab-wheel
US10013A (en) * 1853-09-13 Revolving- mandrel for lining- cylinders with metal
JPH07141383A (ja) * 1993-11-19 1995-06-02 Sharp Corp 会話文翻訳装置
US6192332B1 (en) * 1998-04-06 2001-02-20 Mitsubishi Electric Research Laboratories, Inc. Adaptive electronic phrase book
JP2005100335A (ja) * 2003-09-01 2005-04-14 Advanced Telecommunication Research Institute International 機械翻訳装置、機械翻訳コンピュータプログラム及びコンピュータ
JP2006277119A (ja) * 2005-03-28 2006-10-12 Toshiba Corp コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP2007072663A (ja) * 2005-09-06 2007-03-22 Advanced Telecommunication Research Institute International 用例翻訳装置、及び用例翻訳方法
JP2007323476A (ja) * 2006-06-02 2007-12-13 National Institute Of Information & Communication Technology 機械翻訳装置及びコンピュータプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017058865A (ja) * 2015-09-15 2017-03-23 株式会社東芝 機械翻訳装置、機械翻訳方法および機械翻訳プログラム
CN107704456A (zh) * 2016-08-09 2018-02-16 松下知识产权经营株式会社 识别控制方法以及识别控制装置
CN107704456B (zh) * 2016-08-09 2023-08-29 松下知识产权经营株式会社 识别控制方法以及识别控制装置

Also Published As

Publication number Publication date
JP5666937B2 (ja) 2015-02-12
US9262408B2 (en) 2016-02-16
US20120209587A1 (en) 2012-08-16

Similar Documents

Publication Publication Date Title
JP5666937B2 (ja) 機械翻訳装置、機械翻訳方法および機械翻訳プログラム
CN107038158B (zh) 对译语料库制作方法、装置、记录介质以及机器翻译系统
US10796105B2 (en) Device and method for converting dialect into standard language
CN109933785B (zh) 用于实体关联的方法、装置、设备和介质
JP5997217B2 (ja) 言語変換において複数の読み方の曖昧性を除去する方法
US8275600B2 (en) Machine learning for transliteration
JP5449521B2 (ja) 検索装置及び検索プログラム
US20170075883A1 (en) Machine translation apparatus and machine translation method
US20140289238A1 (en) Document creation support apparatus, method and program
US8209346B2 (en) Named entity database or mining rule database update apparatus and method using named entity database and mining rule merged ontology schema
JP4266222B2 (ja) 単語翻訳装置およびそのプログラム並びにコンピュータ読み取り可能な記録媒体
Şenel et al. Measuring cross-lingual semantic similarity across European languages
CN107870900B (zh) 提供翻译文的方法、装置以及记录介质
CN111133429A (zh) 提取表达以供自然语言处理
KR20210147368A (ko) 개체명 인식을 위한 학습 데이터 생성 방법 및 장치
Lin et al. Leveraging entity linking and related language projection to improve name transliteration
CN102609410B (zh) 规范文档辅助写作系统及规范文档生成方法
CN113868389A (zh) 基于自然语言文本的数据查询方法、装置及计算机设备
CN113408302A (zh) 一种机器翻译结果的评估方法、装置、设备及存储介质
JP2023507881A (ja) ドメインベースのテキスト抽出方法およびシステム
JP6640618B2 (ja) 言語処理装置、方法、およびプログラム
Celikkaya et al. A mobile assistant for Turkish
Evtimova Validation algorithm for aligning postal addresses available on the Internet
US20230109411A1 (en) Computer-implemented method of searching large-volume un-structured data with feedback loop and data processing device or system for the same
CN112560493B (zh) 命名实体纠错方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131025

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140421

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140516

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140715

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141114

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141211

R151 Written notification of patent or utility model registration

Ref document number: 5666937

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313114

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350