JP5763830B1 - 翻訳装置、翻訳方法、および翻訳プログラム - Google Patents

翻訳装置、翻訳方法、および翻訳プログラム Download PDF

Info

Publication number
JP5763830B1
JP5763830B1 JP2014263380A JP2014263380A JP5763830B1 JP 5763830 B1 JP5763830 B1 JP 5763830B1 JP 2014263380 A JP2014263380 A JP 2014263380A JP 2014263380 A JP2014263380 A JP 2014263380A JP 5763830 B1 JP5763830 B1 JP 5763830B1
Authority
JP
Japan
Prior art keywords
sentence
language
template
translation
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014263380A
Other languages
English (en)
Other versions
JP2016122417A (ja
Inventor
有一 塚本
有一 塚本
功 進藤
功 進藤
望月 亮
亮 望月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2014263380A priority Critical patent/JP5763830B1/ja
Application granted granted Critical
Publication of JP5763830B1 publication Critical patent/JP5763830B1/ja
Publication of JP2016122417A publication Critical patent/JP2016122417A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】文の翻訳を正確に、即座に、かつ簡単に行うことができる翻訳装置を提供すること。【解決手段】翻訳装置100は、関連性管理テーブル210およびアライメント管理テーブル220を備え、翻訳対象文を構成する要素もしくは属性と第1の言語のテンプレート文の要素もしくは属性との一致の度合いに基づいて、第1の言語のテンプレート文を選択するか否かを判断するテンプレート選択部400と、選択された第1の言語のテンプレート文の置き換え可能要素に属性一致要素が存在するとき、かかる要素を翻訳対象文の対応する要素と置き換えて編集済み翻訳対象文を生成し、第1の言語のテンプレート文から編集済み翻訳対象文への意味の変化を第1の言語のテンプレート文と意味が等価な第2の言語のテンプレート文に与えて、編集済み翻訳文を生成する要素置換部500と、編集済み翻訳文に基づく情報を出力する情報出力部600と、を有する。【選択図】図1

Description

本発明は、文を翻訳する翻訳装置、翻訳方法、および翻訳プログラムに関する。
従来、ある言語で作成された文を他の言語の文に翻訳するための技術として、例えば、特許文献1に記載の技術が存在する。
特許文献1に記載の技術(以下「従来技術」という)は、翻訳対象文を構成する文節のそれぞれと、予め用意された第1の言語のテンプレート文を構成する文節のそれぞれとを総当りで比較し、文節の文字列の類似度に基づいて、文全体の類似性および文節の対応関係を判定する。そして、従来技術は、類似性が高いと判定された第1の言語のテンプレート文の翻訳文である第2の言語のテンプレート文に対して、翻訳対象文と第1の言語のテンプレート文とで文字列が相違する文節に対応する部分の編集を行い、翻訳対象文の翻訳文を生成する。
このような従来技術によれば、予め用意された各テンプレート文の文構造を利用して翻訳文を生成することができる。
特開平8−180057号公報
しかしながら、従来技術では、文字列は類似しているものの、翻訳対象文と第1の言語のテンプレート文のそれぞれの文における意味的な位置付けが異なるような文節が存在する場合、不適切な第1の言語のテンプレート文が選択されたり、誤った文節の対応付けがされたりする可能性がある。また、翻訳対象文内の文字列のみで第1の言語のテンプレート文との類似性を算出すると、類似していると判断される第1の言語のテンプレート文の数が制限される可能性があり、その場合、以降の文節の対応関係の判定処理その他が行えず、翻訳対象文の翻訳文を得られない可能性がある。すなわち、従来技術では、精度の低い翻訳が行われてしまうおそれがある。
一方で、テンプレート文の文構造を利用せずに翻訳を行う機械翻訳では、翻訳精度と処理負荷および時間とがトレードオフの関係となる。また、翻訳者による人力翻訳では、時間とコストが掛かる。したがって、文の翻訳を正確に、即座に、かつ低コストに行うことができる技術が望まれる。
本発明の目的は、文の翻訳を正確に、即座に、かつ低コストに行うことができる翻訳装置、翻訳方法、および翻訳プログラムを提供することである。
本発明の一態様に係る翻訳装置は、第1の言語の文字列である要素と、前記要素が属する情報である属性と、当該要素と意味が等価な第2の言語の要素と、を記述した関連性管理テーブルと、複数の第1の言語のテンプレート文のそれぞれについて、前記第1の言語のテンプレート文と意味が等価な第2の言語のテンプレート文と、前記第1の言語のテンプレート文を構成する各要素と、前記第1の言語のテンプレート文の各要素に定められた置き換え可否と、前記第1の言語のテンプレート文の置き換え可能と定められた要素である各置き換え可能要素と意味が等価な前記第2の言語のテンプレート文の各要素との対応関係と、を記述したアライメント管理テーブルと、を備え、翻訳対象文を構成する要素もしくは属性と前記第1の言語のテンプレート文の要素もしくは属性との一致の度合いに基づいて、前記第1の言語のテンプレート文を選択するか否かを判断するテンプレート選択部と、選択された前記第1の言語のテンプレート文の前記置き換え可能要素に、前記翻訳対象文を構成する要素と属性が同一である属性一致要素が存在するとき、前記属性一致要素を前記翻訳対象文の対応する要素と置き換えて、編集済み翻訳対象文を生成し、前記第1の言語のテンプレート文から前記編集済み翻訳対象文への意味の変化を前記第1の言語のテンプレート文と意味が等価な第2の言語のテンプレート文に与えて、編集済み翻訳文を生成する要素置換部と、生成された前記編集済み翻訳文に基づく情報を出力する情報出力部と、を有する。
本発明の一態様に係る翻訳方法は、第1の言語の文字列である要素と、前記要素が属する情報である属性と、当該要素と意味が等価な第2の言語の要素と、を記述した関連性管理テーブルと、複数の第1の言語のテンプレート文のそれぞれについて、前記第1の言語のテンプレート文と意味が等価な第2の言語のテンプレート文と、前記第1の言語のテンプレート文を構成する各要素と、前記第1の言語のテンプレート文の各要素に定められた置き換え可否と、前記第1の言語のテンプレート文の置き換え可能と定められた要素である各置き換え可能要素と意味が等価な前記第2の言語のテンプレート文の各要素との対応関係と、を記述したアライメント管理テーブルと、を参照するステップと、翻訳対象文を構成する要素もしくは属性と前記第1の言語のテンプレート文の要素もしくは属性との一致の度合いに基づいて、前記第1の言語のテンプレート文を選択するか否かを判断するステップと、選択された前記第1の言語のテンプレート文の前記置き換え可能要素に、前記翻訳対象文を構成する要素と属性が同一である属性一致要素が存在するか否かを判定するステップと、前記置き換え可能要素に前記属性一致要素が存在するとき、前記属性一致要素を前記翻訳対象文の対応する要素と置き換えて、編集済み翻訳対象文を生成するステップと、前記第1の言語のテンプレート文から前記編集済み翻訳対象文への意味の変化を前記第1の言語のテンプレート文と意味が等価な第2の言語のテンプレート文に与えて、編集済み翻訳文を生成するステップと、生成された前記編集済み翻訳文に基づく情報を出力するステップと、を有する。
本発明の一態様に係る翻訳プログラムは、コンピュータに、第1の言語の文字列である要素と、前記要素が属する情報である属性と、当該要素と意味が等価な第2の言語の要素と、を記述した関連性管理テーブルと、複数の第1の言語のテンプレート文のそれぞれについて、前記第1の言語のテンプレート文と意味が等価な第2の言語のテンプレート文と、前記第1の言語のテンプレート文を構成する各要素と、前記第1の言語のテンプレート文の各要素に定められた置き換え可否と、前記第1の言語のテンプレート文の置き換え可能と定められた要素である各置き換え可能要素と意味が等価な前記第2の言語のテンプレート文の各要素との対応関係と、を記述したアライメント管理テーブルと、を参照する処理と、翻訳対象文を構成する要素もしくは属性と前記第1の言語のテンプレート文の要素もしくは属性との一致の度合いに基づいて、前記第1の言語のテンプレート文を選択するか否かを判断する処理と、選択された前記第1の言語のテンプレート文の前記置き換え可能要素に、前記翻訳対象文を構成する要素と属性が同一である属性一致要素が存在するか否かを判定する処理と、前記置き換え可能要素に前記属性一致要素が存在するとき、前記属性一致要素を前記翻訳対象文の対応する要素と置き換えて、編集済み翻訳対象文を生成する処理と、前記第1の言語のテンプレート文から前記編集済み翻訳対象文への意味の変化を前記第1の言語のテンプレート文と意味が等価な第2の言語のテンプレート文に与えて、編集済み翻訳文を生成する処理と、生成された前記編集済み翻訳文に基づく情報を出力する処理と、を実行させる。
本開示によれば、文の翻訳を正確に、即座に、かつ低コストに行うことができる。
本発明の一実施の形態に係る翻訳装置の構成の一例を示すブロック図 本実施の形態における関連性管理テーブルの構成の一例を示す図 本実施の形態におけるアライメント管理テーブルの構成の一例を示す図 本実施の形態における文対応テーブルの構成の一例を示す図 本実施の形態におけるテンプレート情報テーブルの構成の一例を示す図 本実施の形態における要素対応テーブルの構成の一例を示す図 本実施の形態における要素置換部の構成の一例を示すブロック図 本実施の形態における情報出力部の構成の一例を示すブロック図 本実施の形態に係る翻訳装置の動作の一例を示すフローチャート 本実施の形態における翻訳対象文の一例を示す図 本実施の形態におけるテンプレート選択処理の一例を示すフローチャート 本実施の形態における翻訳対象文の分割結果の一例を示す図 本実施の形態における翻訳対象文に対する解析結果の一例を示す図 本実施の形態における対比対象要素テーブルの内容の一例を示す図 本実施の形態における第1言語テンプレート文の例を示す図 本実施の形態における要素置換処理の一例を示すフローチャート 本実施の形態における編集済み翻訳対象文および編集済み翻訳文の例を示す図 本実施の形態におけるユーザ修正受付処理の一例を示すフローチャート 本実施の形態における修正前の修正受付画面の一例を示す図 本実施の形態における修正後の修正受付画面の一例を示す図 本実施の形態における関連性管理テーブルの構成の他の例を示す図 本実施の形態における修正受付画面の他の例を示す図
以下、本発明の一実施の形態について、図面を参照して詳細に説明する。
本実施の形態は、本発明を、日本国内の観光地、施設、店舗、商品、あるいはサービス等を説明する文を、ウェブサイト、あるいはデジタルサイネージ等の情報出力装置から出力する目的で、日本語(以下「第1の言語」という)から英語(以下「第2の言語」という)へと翻訳する用途に適用した例である。本実施の形態に係る翻訳装置は、例えば、タッチパネル付き液晶ディスプレイを備えた、タブレット型情報処理端末の形態を採る。
以下の説明において、「要素」とは、文字列であり、本実施の形態では、形態素を指す。また、「属性」とは、要素に関する情報のうち、「要素の文字列、表示形態、読み、および意味」以外の1つ以上の、要素が属する情報で、例えば概念的な意味を示す情報である。本実施の形態では、「属性」とは、要素の文における意味の上位概念を指す。
<翻訳装置の構成>
まず、本実施の形態に係る翻訳装置の構成について説明する。
図1は、本実施の形態に係る翻訳装置の構成の一例を示すブロック図である。図1において、翻訳装置100は、情報格納部200、翻訳対象入力部300、テンプレート選択部400、要素置換部500、および情報出力部600を有する。
情報格納部は、関連性管理テーブル210およびアライメント管理テーブル220を、予め格納している。
関連性管理テーブル210は、第1の言語の要素毎に、当該要素の属性と、当該要素と意味が等価の、第2の言語の要素とを記述したテーブルである。
図2は、関連性管理テーブル210の構成の一例を示す図である。図2に示すように、関連性管理テーブル210は、第1言語指定文字列211、第2言語指定文字列212、および属性213を、対応付けて記述している。
第1言語指定文字列211は、第1の言語の要素を、第1の言語の原形で表した文字列である。言い換えると、第1言語指定文字列211は、第1の言語の要素の意味を示す情報である。第2言語指定文字列212は、第1言語指定文字列211の第2の言語における訳語である。なお、例えば、原形とは、要素の活用前の文字列、または「舌平目」と「ゲタ」との関係に相当する、意味が同じで表記が異なる文字列の組み合わせの中の1つの文字列を指す。
例えば、「バッグ」という第1言語指定文字列211には、「bag」という第2言語指定文字列212と、「CLOTHES」という属性213とが、対応付けられている。これは、第1の言語における「バッグ」が、第2の言語では「bag」であり、衣類(CLOTHES)という種別に属するということを示す。
このような関連性管理テーブル210を用いることにより、翻訳装置100は、第1の言語の各要素が、どの属性を有するか、および、第2言語のどの要素に対応するかを、容易に判断することができる。
図1のアライメント管理テーブル220は、複数の第1の言語のテンプレート文のそれぞれについて、第1の言語のテンプレート文と意味が等価な第2の言語のテンプレート文を記述したテーブルである。また、アライメント管理テーブル220は、第1の言語のテンプレート文の各要素について、第1の言語のテンプレート文の各要素に定められた置き換え可否と、第1の言語のテンプレート文の各置き換え可能要素と意味が等価な第2の言語のテンプレート文の各要素との対応関係を記述したテーブルである。ここで、置き換え可能要素とは、他の要素への置き換えが可能であると定められた要素である。
アライメント管理テーブル220は、例えば、複数のサブテーブルの組み合わせから成る。
図3は、アライメント管理テーブル220の構成の一例を示す図である。図3に示すように、アライメント管理テーブル220は、文対応テーブル230、テンプレート情報テーブル240、および要素対応テーブル250を含む。
文対応テーブル230は、複数の第1の言語のテンプレート文のそれぞれについて、第1の言語のテンプレート文と、当該第1の言語のテンプレート文(以下「第1言語テンプレート文」という)と意味が等価な第2の言語のテンプレート文(以下「第2言語テンプレート文」という)と、を対応付けて記述したテーブルである。
図4は、文対応テーブル230の構成の一例を示す図である。図4に示すように文対応テーブル230は、テンプレート文ID231、第1言語テンプレート文232、および第2言語テンプレート文233を、対応付けて記述している。
例えば、「人気のバッグ、シューズが10%OFF。」という第1言語テンプレート文232には、「10% off for the purchase of popular bags and shoes.」という第2言語テンプレート文233が対応付けられている。これは、「人気のバッグ、シューズが10%OFF。」という第1の言語の文を第2の言語に翻訳したとき、「10% off for the purchase of popular bags and shoes.」となるということを示している。なお、テンプレート文ID231は、第1言語テンプレート文232、あるいは、第1言語テンプレート文232と第2言語テンプレート文233との組を識別するための識別情報である。
図3のテンプレート情報テーブル240は、文対応テーブル230に記述された第1言語テンプレート文232(図4参照)の要素毎に、当該要素の属性を記述したテーブルである。
図5は、テンプレート情報テーブル240の構成の一例を示す図である。図5において、テンプレート情報テーブル240は、テンプレート文ID241、インデックス242、テンプレート内表記243、検索対象文字列244、置き換え可否245、および属性246を対応付けて記述している。
テンプレート文ID241は、第1言語テンプレート文の識別情報であり、文対応テーブル230のテンプレート文ID231(図4参照)に対応するものである。インデックス242は、テンプレート文ID241が示す第1言語テンプレート文を構成する複数の要素の識別情報であり、第2言語テンプレート文内の当該要素に相当する文字列との対応関係を示している。
テンプレート内表記243は、テンプレート文ID241とインデックス242との組が示す要素の、第1言語テンプレート文における表記である。検索対象文字列244は、テンプレート内表記243の、第1の言語における原形の文字列であり、関連性管理テーブル210の第1言語指定文字列211(図2参照)に対応する。言い換えると、検索対象文字列244は、第1言語テンプレート文の要素の意味を示す情報である。なお、本実施の形態では、テンプレート内表記243も検索対象文字列244も同様であるが、異なる例としては動詞の活用前と活用後等である。
置き換え可否245は、テンプレート文ID241とインデックス242との組が示す要素が、テンプレート文ID241が示す第1言語テンプレート文において他の文字列と置き換えられた時に、当該第1言語テンプレート文もしくは対応する第2言語テンプレート文の、意味上もしくは文法上の誤りが生じる可能性があるか否かを示す。つまり、置き換え可否245は、他の文字列と置き換えることが可能な要素であるか否か(〇/×)を示す。そして、属性246は、テンプレート文ID241とインデックス242との組が示す要素の上位概念の種別を表す。
例えば、「2」というテンプレート文ID241と「2」というインデックス242との組には、「バッグ」というテンプレート内表記243が記載されている。これは、図4に示す「人気のバッグ、シューズが10%OFF。」という第1言語テンプレート文232における「バッグ」という要素を指している。
そして、かかる「バッグ」には、「バッグ」という検索対象文字列244と、「〇」という置き換え可否245と、「CLOTHES」という属性246とが対応付けられている。これは、「バッグ」が、原形(意味)でも同じ「バッグ」であり、他の文字列(要素)に置き換え可能な要素であり、「CLOTHES」(衣類)という種別に属する要素であるということを示す。
このようなテンプレート情報テーブル240を用いることにより、翻訳装置100は、第1言語テンプレート文の各要素について、翻訳対象となる文字列である翻訳対象文の要素との間の、意味および属性の比較を、簡単に行うことができる。また、翻訳装置100は、第1言語テンプレート文の各要素について、関連性管理テーブル210の第1言語指定文字列211(図2参照)との間の、意味および属性の比較についても、簡単に行うことができる。更に、翻訳装置100は、文において意味上もしくは文法上の誤りが生じるのを、回避することができる。
なお、本実施の形態において、属性の同一(一致)とは、上記各テーブルに記述された属性の同一を意味する。また、意味の同一(一致)とは、上記各テーブルに記述された原形の同一を意味する。すなわち、属性の同一および意味の同一は、それぞれ、必ずしも一般的な概念における完全同一を示すものではない。
図3の要素対応テーブル250は、第1言語テンプレート文と前記第2言語テンプレート文との間の、それぞれを構成する各要素の対応関係を示すテーブルである。
図6は、要素対応テーブル250の構成の一例を示す図である。図6に示すように、要素対応テーブル250は、テンプレート文ID251、インデックス252、および第2言語置き換え対象文字列253を、対応付けて記述している。
テンプレート文ID251およびインデックス252は、テンプレート情報テーブル240のテンプレート文ID241およびインデックス242(図5参照)に対応するものである。第2言語置き換え対象文字列253は、テンプレート文ID251とインデックス252との組み合わせが示す第1言語テンプレート文の要素に対応する、第2言語テンプレート文の要素を示す。
例えば、図6に示すように、要素対応テーブル250は、「1」というテンプレート文ID241と「6」というインデックス242に対応する要素「アクロバットショー」の第2言語置き換え対象文字列253が、「Acrobat Show」であることを示している。
このような要素対応テーブル250を用いることにより、翻訳装置100は、第1言語テンプレート文の要素のいずれかが置き換え対象となったときに、対応する第2言語テンプレート文のどの要素を置き換えの対象とすべきかを、簡単に判断することができる。
図1の翻訳対象入力部300は、翻訳対象文を入力する。本実施の形態において、翻訳対象文は、1文字以上の文字列データである。翻訳対象入力部300は、例えば、上記タッチパネルを介して、第1の言語による自由文の入力を、翻訳対象文としてユーザから受け付ける。そして、翻訳対象入力部300は、入力された翻訳対象文を、テンプレート選択部400へ出力する。なお、翻訳対象入力部300は、マウスおよびキーボードを介して、翻訳対象文を入力してもよい。
テンプレート選択部400は、入力された翻訳対象文と第1言語テンプレート文との間の、文を構成する要素の一致の度合い、もしくは、その属性の一致の度合いを判定し、判定結果に基づいて、第1言語テンプレート文を選択する。そして、テンプレート選択部400は、選択した第1言語テンプレート文を示す情報と、入力された翻訳対象文とを、要素置換部500へ出力する。
例えば、テンプレート選択部400は、文対応テーブル230(図4参照)、関連性管理テーブル210(図2参照)、およびテンプレート情報テーブル240(図5参照)を参照して、各第1言語テンプレート文の意味一致要素および属性一致要素のそれぞれの個数を求める。そして、テンプレート選択部400は、求められた個数から、複数の第1言語テンプレート文のそれぞれの優先度を決定し、決定された優先度に従って、1つまたは複数の第1言語テンプレート文を選択する。
ここで、意味一致要素とは、第1言語テンプレート文を構成する要素(以下「第1言語テンプレート文の要素」という)のうち、翻訳対象文の要素のいずれかと意味が同一である要素である。また、属性一致要素とは、第1言語テンプレート文の要素のうち、翻訳対象文の要素のいずれかと属性が同一であって意味が異なる要素である。なお、属性一致要素は、第1言語テンプレート文の要素のうち、翻訳対象文の要素のいずれかと属性が同一である要素でもよい。
要素置換部500は、選択された第1言語テンプレート文の要素のうち、置き換え可否245が「〇」である置き換え可能要素に、翻訳対象文を構成する要素(以下「翻訳対象文の要素」という)と属性が同一であって意味が異なる置き換え可能要素が存在するか否かを判定する。そして、要素置換部500は、該当する置き換え可能要素が存在するとき、当該置き換え可能要素を、翻訳対象文の対応する上記要素に置き換える。そして、要素置換部500は、かかる置き換えによって第1言語テンプレート文に生じる意味の変化を、対応する第2言語テンプレート文に与えて、編集済み翻訳文を生成する。
図7は、要素置換部500の構成の一例を示すブロック図である。図7において、要素置換部500は、一致要素検索部510、第1の要素置換部520、および第2の要素置換部530を有する。
一致要素検索部510は、選択された第1言語テンプレート文が、属性一致要素を含むか否かを判定する。そして、一致要素検索部510は、第1言語テンプレート文および各要素の判定結果を、第1の要素置換部520へ出力する。
より具体的には、一致要素検索部510は、文対応テーブル230(図4参照)、関連性管理テーブル210(図2参照)、およびテンプレート情報テーブル240(図5参照)を参照して、第1言語テンプレート文の各置き換え可能要素が、意味一致要素、属性一致要素、および属性不一致要素のいずれであるかを判定する。そして、一致要素検索部510は、第1言語テンプレート文の各置き換え可能要素に対して、それぞれの判定結果を示す情報を付与する。更に、一致要素検索部510は、属性一致要素については、翻訳対象文の要素のどの要素と対応しているかを示す情報も併せて付与する。
ここで、属性不一致要素とは、第1言語テンプレート文の要素のうち、翻訳対象文の要素のいずれとも、属性が一致せず、意味も一致しない要素である。
第1の要素置換部520は、入力された第1言語テンプレート文の置き換え可能要素が属性一致要素を含むとき、当該第1言語テンプレート文の置き換え可能要素のうち、属性一致要素を翻訳対象文の対応する要素と置き換えて、編集済み翻訳対象文を生成する。なお、かかる要素の置換は、翻訳対象文の対応する要素の原形の文字列への置換を意味するものであってもよい。そして、第1の要素置換部520は、生成された編集済み翻訳対象文を、第2の要素置換部530へ出力する。この際、第1の要素置換部520は、かかる置き換えを行った要素に対して、置換済み要素であることを示す情報を付与する。
但し、第1の要素置換部520は、属性一致要素毎に、翻訳対象文の要素のいずれか1つのみに対応するか否かを判定し、対応しないと判定された属性一致要素については、上記置き換えを行わずに、編集済み翻訳対象文を生成する。この際、第1の要素置換部520は、かかる置き換えを行わなかった要素に対して、要置換要素であることを示す情報を付与する。
ここで、要置換要素とは、属性の一致性に基づく置換以外の手法(例えば、ユーザによる修正操作)により、翻訳対象文の要素と同一の意味の要素へと置換すべき要素である。なお、要置換要素は、第1の要素置換部520で置き換えを行った要素を含んでもよい。すなわち、翻訳装置100は、置換済み要素についても、要置換要素として扱ってもよい。
なお、第1の要素置換部520は、属性一致要素が存在しない場合には、入力された第1言語テンプレート文を、そのまま編集済み翻訳対象文とする。
第2の要素置換部530は、元の第1言語テンプレート文から入力された編集済み翻訳対象文への意味の変化を、対応する第2言語テンプレート文に与えて、編集済み翻訳文を生成する。そして、第2の要素置換部530は、生成した編集済み翻訳文を、編集済み翻訳対象文と共に、図1の情報出力部600へ出力する。この際、第2の要素置換部530は、編集済み翻訳対象文と編集済み翻訳文との間の、それぞれを構成する各要素の対応関係を示す情報を、編集済み翻訳文および編集済み翻訳対象文に付与する。
より具体的には、第2の要素置換部530は、関連性管理テーブル210(図2参照)を参照して、置換済み要素の第2の言語における訳語を取得する。そして、第2の要素置換部530は、文対応テーブル230(図4参照)および要素対応テーブル250(図6参照)を参照し、第2言語テンプレート文の要素のうち置換済み要素に対応する要素を取得した訳語で置き換えて、上記編集済み翻訳文を生成する。
なお、第2の要素置換部530は、第1言語テンプレート文から編集済み翻訳対象文への意味の変化が無い場合、当該第1言語テンプレート文に対応する第2言語テンプレート文を、そのまま、編集済み翻訳文として出力する。なお、翻訳装置100はテンプレート選択部400の処理と要素置換部500の処理で、参照する関連性管理テーブル210は共通しているので、省メモリ化および運用上の管理負担の低減が図れる。
図1の情報出力部600は、例えば、生成された編集済み翻訳文に基づく情報を出力する。より具体的には、情報出力部600は、編集済み翻訳文を表示しつつ、編集済み翻訳対象文に対する修正をユーザから受け付けることにより、当該編集済み翻訳文を元の翻訳対象文の意味に近付ける。
図8は、情報出力部600の構成の一例を示すブロック図である。図8において、情報出力部600は、修正受付部610、翻訳文生成部620、および翻訳結果出力部630を有する。
修正受付部610は、例えば、上記タッチパネル付き液晶ディスプレイを介して、編集済み翻訳対象文に対する修正の操作をユーザから受け付け、修正済み翻訳対象文を生成する。そして、修正受付部610は、生成された修正済み翻訳対象文を、翻訳文生成部620へ出力する。この際、修正受付部610は、修正後の要素に対して、修正済み要素であることを示す情報を付与する。なお、修正受付部610は、マウスおよびキーボードを介して、修正の操作を受け付けてもよい。
より具体的には、修正受付部610は、例えば、上記タッチパネル付き液晶ディスプレイを用いて、要素置換部500から入力された編集済み翻訳対象文および編集済み翻訳対象文を、並べて表示する。また、修正受付部610は、編集済み翻訳対象文に要置換要素が存在するとき、関連性管理テーブル210(図2参照)を参照して、要置換要素との間で属性が一致する要素(第1言語指定文字列211)を抽出する。修正受付部610は、抽出された要素を、要置換要素と置き換える要素の候補として表示し、これに対する選択の操作をユーザから受け付ける。そして、修正受付部610は、ユーザからの選択の操作に従い、選択された要素を編集済み翻訳対象文の該当要素と置き換えて、修正済み翻訳対象文を生成する。
翻訳文生成部620は、編集済み翻訳対象文から修正済み翻訳対象文への意味の変化を、要素置換部500から入力された編集済み翻訳文に与えて、修正済み翻訳文を生成する。そして、翻訳文生成部620は、入力された修正済み翻訳対象文と、生成された修正済み翻訳文とを、翻訳結果出力部630へ出力する。
より具体的には、翻訳文生成部620は、関連性管理テーブル210(図2参照)および要素対応テーブル250(図6参照)を参照する。そして、翻訳文生成部620は、修正済み翻訳対象文のうち修正後の要素に対応する編集済み翻訳文の要素を、当該要素の第2言語指定文字列で置き換えて、修正済み翻訳文を生成する。
翻訳結果出力部630は、入力された修正済み翻訳文を出力する。より具体的には、翻訳結果出力部630は、上記タッチパネル付き液晶ディスプレイに表示されている編集済み翻訳文を、入力された修正済み翻訳文で置き換える。また、翻訳結果出力部630は、例えば、上記タッチパネル付き液晶ディスプレイを介して、ユーザから、表示内容に対する確定操作を受け付ける。そして、翻訳結果出力部630は、かかる確定操作が行われたとき、表示中の編集済み翻訳文あるいは修正済み翻訳文を、翻訳対象文の翻訳文として、上記情報出力装置、あるいは、かかる装置の情報出力を制御する情報処理装置へ送信する。
翻訳装置100は、図示しないが、例えば、CPU(Central Processing Unit)、制御プログラムを格納したROM(Read Only Memory)等の記憶媒体、RAM(Random Access Memory)等の作業用メモリ、および通信回路を有する。この場合、上記した各部の機能は、CPUが制御プログラムを実行することにより実現される。
このような構成を有する翻訳装置100は、文を構成する要素の属性に基づいて、第1言語テンプレート文の選択、および、意味の異なる要素の置換を行うことができる。更に、翻訳装置100は、自動で置き換えを行った場合に翻訳精度がかえって低下する可能性がある要素については、置き換えを行わずに、属性に基づいて選択された置き換え候補を選択肢としてユーザに提示することができる。
<翻訳装置の動作>
次に、翻訳装置100の動作について、各段階で処理される各種情報を例示しながら説明する。
図9は、翻訳装置100の動作の一例を示すフローチャートである。
ステップS1000において、翻訳対象入力部300は、翻訳対象文を入力する。
図10は、ステップS1000で入力される翻訳対象文の一例を示す図である。図10に示すように、例えば、「本日20時からタイムセール実施。コートとジャケットが30%OFF。」という翻訳対象文710が入力される。
図9のステップS2000において、テンプレート選択部400は、テンプレート選択処理を行う。テンプレート選択処理は、入力された翻訳対象文に近い第1言語テンプレート文を、各要素の属性に基づいて選択する処理である。ここで、選択とは、例えば1つの第1言語テンプレート文を抽出する処理、あるいは、複数の第1言語テンプレート文をソートする処理等である。
図11は、テンプレート選択処理の一例を示すフローチャートである。
ステップS2010において、テンプレート選択部400は、翻訳対象文を解析する。より具体的には、テンプレート選択部400は、翻訳対象文が複数の文から構成されるときこれを判定して分割し、翻訳対象文に対する形態素解析を行い、第1の言語のテンプレート文との対比の対象となる要素(以下「対比対象要素」という)を決定する。
テンプレート選択部400は、例えば、「。」「!」「?」等の予め定められた文字の位置やSVM(Support Vector Machine)等の識別器を用いて文末を検出することにより、翻訳対象文を複数の文に分割する。そして、テンプレート選択部400は、分割された文のそれぞれを、第1言語テンプレート文との対比の単位となる翻訳対象文として扱う。
図12は、図10に示す翻訳対象文710の分割結果の一例を示す図である。図12に示すように、図10の翻訳対象文710の場合、「本日20時からタイムセール実施。」という第1の翻訳対象文721と、「コートとジャケットが30%OFF。」という第2の翻訳対象文722とに分割される。翻訳装置100は、後続の処理を、分割されたそれぞれの翻訳対象文毎に行う。
テンプレート選択部400は、翻訳対象文に対して形態素解析を行い、翻訳対象文に含まれる要素のうち、名詞を含む要素のみを、対比対象要素とする。そして、テンプレート選択部400は、対比対象要素の原形を、第1言語テンプレート文から対比対象要素に対応する要素を検索するための検索キーとして取得する。なお、対比対象要素とする品詞は、名詞だけでなく、形容詞、動詞等でもよい。
図13は、図12に示す第1および第2の翻訳対象文721、722に対する解析結果の一例を示す図である。図13に示すように、テンプレート選択部400は、まず、第1の翻訳対象文721および第2の翻訳対象文722のそれぞれを構成する要素731毎に、当該要素731の品詞732を判定する。そして、テンプレート選択部400は、品詞732が名詞である要素731を対比対象要素とし、対比対象要素の原形733を取得する。
対比対象要素の原形733は、言い換えると、翻訳装置100のテンプレート選択部400が第1言語テンプレート文を選択するための、各要素の意味を示す情報と置き換えの対象とする要素の意味を示す情報とを含んでいる。すなわち、テンプレート選択部400は、各対比対象要素を、関連性管理テーブル210の第1言語指定文字列211(図2参照)およびテンプレート情報テーブル240の検索対象文字列244(図5参照)と同じ形式の文字列に変換する。これにより、テンプレート選択部400は、要素の意味が同一であるか否かを、簡単に判定することができる。すなわち、翻訳装置100は、各テーブルの記述および検索キーに共に各要素の原形の文字列を用いることにより、検索処理負荷および検索性能を向上させるように構成されている。
なお、テンプレート選択部400は、翻訳対象文の要素の全てを、対比対象要素としてもよい。また、この場合、テンプレート選択部400は、必ずしも形態素解析を行わなくても良く、例えば、半角スペースで区切られる文字列のそれぞれを、対比対象要素としてもよい。
図11のステップS2020において、テンプレート選択部400は、各対比対象要素について、関連性管理テーブル210(図2参照)で対比対象要素の原形を検索し、対比対象要素の属性を取得する。
例えば、第2の翻訳対象文722の「コート」という要素731(図13参照)の場合、関連性管理テーブル210(図2参照)では、「CLOTHES」という属性213が対応付けられている。したがって、テンプレート選択部400は、かかる要素731の属性として、「CLOTHES」を取得する。また、第2の翻訳対象文721の「20」という要素731(図13参照)の場合、関連性管理テーブル210(図2参照)では、数字列の属性である「NUM」という属性213が対応付けられている。したがって、テンプレート選択部400は、かかる要素731の属性として、「NUM」を取得する。
そして、テンプレート選択部400は、各対比対象要素の原形および属性の取得結果をリスト化した対比対象要素テーブルを生成し、一時的に記憶する。
図14は、図12に示す第1および第2の翻訳対象文721、722に基づいて生成された対比対象要素テーブルの内容の一例を示す図である。図14に示すように、対比対象要素テーブル740は、各対比対象要素について取得された原形741および属性742を、対応付けて記述する。なお、「NONE」は、関連性管理テーブル210(図2参照)に対応する属性213が登録されていなかったことを示す。「NONE」に対応する要素は、属性が一致しているか否かの判定の対象から除外される。
図11のステップS2030において、テンプレート選択部400は、翻訳対象文の要素のうち、原形および属性のうち少なくとも1つが一致する要素を含む第1言語テンプレート文が存在するか否かを判定する。
より具体的には、テンプレート選択部400は、対比対象要素テーブル740に記載された対比対象要素の原形741および属性742(図14参照)で、テンプレート情報テーブル240の検索対象文字列244および属性246(図5参照)をそれぞれ検索する。
テンプレート選択部400は、原形あるいは属性が一致する要素を含む第1言語テンプレート文が存在する場合(S2030:YES)、処理をステップS2040へ進める。また、テンプレート選択部400は、原形あるいは属性が一致する要素を含む第1言語テンプレート文が存在しない場合(S2030:NO)、処理を後述のステップS2050へ進める。
ステップS2040において、テンプレート選択部400は、第1言語テンプレート文毎に、意味一致要素の個数および属性一致要素の個数を算出する。そして、テンプレート選択部400は、算出された個数に基づいて、各第1言語テンプレート文の優先度を決定する。
より具体的には、テンプレート選択部400は、第1言語テンプレート文の要素毎に、当該要素の原形(テンプレート情報テーブル240の検索対象文字列244(図5参照))を、対比対象要素テーブル740の対比対象要素の原形741(図14参照)で検索する。そして、テンプレート選択部400は、第1言語テンプレート文毎に、第1言語テンプレート文の要素のうち同一の原形が検索された要素の個数を、意味一致要素の個数として取得する。
更に、テンプレート選択部400は、第1言語テンプレート文の要素毎に、当該要素の属性(テンプレート情報テーブル240の属性246(図5参照))を、対比対象要素テーブル740の属性742(図14参照)で検索する。そして、テンプレート選択部400は、第1言語テンプレート文毎に、第1言語テンプレート文の要素のうち同一の属性が検索された要素の個数から、意味一致要素の個数を差し引いた個数を、属性一致要素の個数として取得する。
そして、テンプレート選択部400は、例えば、以下の式(1)を用いて、各第1言語テンプレート文の優先度Pを算出する。優先度Pは、選択の優先度の高さを示す指標値である。ここで、記号Dは、意味一致要素の個数を示し、記号Aは、属性一致要素の個数を示す。
P = α・D + β・A ・・・(1)
ここで、α、βはそれぞれ係数であり、例えば、α=1、β=0.7である。係数α、βは、つまり、翻訳対象文の各要素と、第1言語テンプレート文の各要素との間の、関連の度合いの高さに対応する係数である。
なお、係数α、βは、意味一致要素もしくは属性一致要素の属性毎に設定されてもよい。また、テンプレート選択部400は、各第1言語テンプレート文の各要素に対し、重み(例えばtf(Term Frequency)−idf(Inverse Document Frequency))を計算し、翻訳対象文の各要素との間で類似度(例えばcosθ)を計算し、当該類似度を優先度としてもよい。なお、優先度Pは、各第1言語テンプレート文の要素の内の意味一致要素もしくは属性一致要素の出現確率としてもよいし、翻訳対象文と各第1言語テンプレート文の文字列長の類似度としてもよい。
例えば、図12に示す第1の翻訳対象文「本日20時からタイムセール実施」と、第1言語テンプレート文「本日15時〜17時『アクロバットショー』を開催いたします。」とが、比較対象となる。この場合、「本日」および「時」は、意味一致要素である。また、「アクロバットショー」は、「タイムセール」と同一の属性「EVENT」を有していることから、属性一致要素である。また、「15」と「17」は、「20」と同一の属性「NUM」を有していることから、属性一致要素である。したがって、第1の翻訳対象文「本日20時からタイムセール実施」についての第1言語テンプレート文「本日15時〜17時『アクロバットショー』を開催いたします。」の優先度Pは、P=1×3+0.7×3=5.1となる。なお、属性一致要素の属性がNUMの場合、属性一致要素となる要素の間で編集距離(レーベンシュタイン距離)、最小二乗誤差等を計算し、それを当該属性一致要素に対する係数として利用してもよい。
一方、図11のステップS2050において、テンプレート選択部400は、アライメント管理テーブル220に記載された全ての第1言語テンプレート文に対して、同一の優先度を決定する。この場合、テンプレート選択部400は、全ての第1言語テンプレート文を選択してもよいし、更にテンプレート文ID順でこれらをソートしてもよい。あるいは、テンプレート選択部400は、優先度に従って、テンプレート文IDの先頭から所定の個数(例えば3)を選択してもよい。
そして、ステップS2060において、テンプレート選択部400は、決定された優先度に基づいて、ユーザへの提示対象(表示対象)となる第1言語テンプレートを決定して、処理を図9のステップS3000へ進める。
より具体的には、テンプレート選択部400は、翻訳対象文毎に、例えば、優先度Pが高いものから順に、所定の個数(例えば3)の第1言語テンプレート文を選択する。なお、テンプレート選択部400は、優先度Pが所定値以上となる第1言語テンプレート文のみを、選択の対象としてもよい。
図15は、図12に示す第1および第2の翻訳対象文721、722について選択された、第1言語テンプレート文の例を示す図である。なお、ここでは、それぞれの翻訳対象文について、最も優先度Pが高い第1言語テンプレート文が1つのみ選択された場合を例示する。
図15に示すように、テンプレート選択部400は、例えば、図12に示す第1の翻訳対象文721に対応して、「1」のテンプレート文ID751の第1言語テンプレート文752を選択する。また、テンプレート選択部400は、例えば、図12に示す第2の翻訳対象文722に対応して、「2」のテンプレート文ID751の第1言語テンプレート文752を選択する。
なお、選択された第1言語テンプレート文752には、文対応テーブル230(図4参照)に基づき、図15に示すように、それぞれの第2言語への翻訳文である第2言語テンプレート文753が存在している。
図9のステップS3000において、要素置換部500は、要素置換処理を行う。要素置換処理は、選択された第1言語テンプレート文の要素を、文の意味が翻訳対象文の意味に近付くように、翻訳対象文の要素で置換する処理である。
図16は、要素置換処理の一例を示すフローチャートである。
ステップS3010において、一致要素検索部510は、テンプレート選択部400により選択された1つまたは複数の第1言語テンプレートの中から、1つを選択する。
ステップS3020において、一致要素検索部510は、選択中の第1言語テンプレートの置き換え可能要素に、属性一致要素が存在するか否かを判定する。
より具体的には、一致要素検索部510は、例えば、まず、第1言語テンプレート文の置き換え可能要素毎に、当該要素の属性(テンプレート情報テーブル240の属性246(図5参照))を、対比対象要素テーブル740の属性742(図14参照)で検索する。なお、置き換え可能要素とは、上述の通り、テンプレート情報テーブル240の置き換え可否245(図5参照)が「〇」の要素である。そして、検索された属性742に対応する対比対象要素の原形741が、上記第1言語テンプレート文の要素の原形(検索対象文字列244)と異なるか否かを判定する。
なお、属性一致要素の判定は、既にテンプレート選択部400において行われている。したがって、一致要素検索部510は、テンプレート選択部400から、どの要素が属性一致要素であるかを示す情報を取得して、選択中の第1言語テンプレートに属性一致要素が存在するか否かを判定してもよい。
一致要素検索部510は、選択中の第1言語テンプレートの置き換え可能要素に属性一致要素が存在する場合(S3020:YES)、処理をステップS3030へ進める。また、一致要素検索部510は、選択中の第1言語テンプレートに属性一致要素が存在しない場合(S3020:NO)、後述のステップS3100へ処理を進める。
ステップS3030において、第1の要素置換部520は、1つまたは複数の置き換え可能要素に該当する属性一致要素の中から、1つを選択する。
ステップS3040において、第1の要素置換部520は、選択中の属性一致要素と属性が一致する要素が、翻訳対象文および選択中の第1の言語のテンプレート文のそれぞれに1つずつのみ存在するか否かを判定する。かかる判定は、テンプレート情報テーブル240(図5参照)および対比対象要素テーブル740(図14参照)に基づいて行うことができる。また、かかる判定は、第1の言語もしくは第2の言語の文法上の誤りが生じないようにするための判定であり、これにより正確な要素置換処理が可能となる。
第1の要素置換部520は、選択中の属性一致要素と属性が一致する要素が1つずつのみ存在する場合(S3040:YES)、処理をステップS3050へ進める。また、第1の要素置換部520は、選択中の属性一致要素と属性が一致する要素が、翻訳対象文および選択中の第1の言語のテンプレート文のうち少なくとも一方に2つ以上存在する場合(S3040:NO)、処理をステップS3060へ進める。
ステップS3050において、第1の要素置換部520は、選択中の属性一致要素を、翻訳対象文の属性が一致する要素もしくはかかる要素の原形と置換し、置換後の要素を、置換済み要素として記録する。かかる置換は、対比対象要素テーブル740(図14参照)に基づいて行うことができる。
なお、要素置換部500は、置き換え済み要素に対応する第2の言語の要素もしくは要素の原形を、第2の言語の文法ルールに従って適宜変形して、編集済み翻訳文を生成する。かかる変形には、例えば、文の先頭に位置する要素の先頭文字の大文字化、複数名詞化、活用変換等が含まれる。また、かかる変形の具体的手法としては、例えば、特許文献1に記載された手法を採用することができる。
一方、ステップS3060において、第1の要素置換部520は、選択中の属性一致要素を、そのままとし、要置換要素として記録する。なお、第1の要素置換部520は、必ずしも要置換要素と置換済み要素を区別して記録する必要はなく、置換済み要素を要置換要素に含んでもよい。
そして、ステップS3070において、第1の要素置換部520は、選択中の第1言語テンプレート文に、未選択の属性一致要素が存在するか否かを判断する。第1の要素置換部520は、未選択の属性一致要素が存在する場合(S3070:YES)、処理をステップS3030へ戻す。また、第1の要素置換部520は、未選択の属性一致要素が存在しない場合(S3070:NO)、処理をステップS3080へ進める。
ステップS3080において、ステップS3030〜S3070の処理により、必要に応じて要素の置換が行われた第1言語テンプレート文を、編集済み翻訳対象文に設定する。
ステップS3090において、第2の要素置換部530は、選択中の第1言語テンプレート文の訳語である第2言語テンプレート文に対し、第1言語テンプレート文で置換された要素に対応する要素の置換を行って、編集済み翻訳文を生成する。かかる置換は、関連性管理テーブル210(図2参照)および要素対応テーブル250(図6参照)に基づいて行うことができる。
ステップS3100において、一致要素検索部510は、テンプレート選択部400により選択された1つまたは複数の第1言語テンプレートに、ステップS3010において未選択の第1言語テンプレートが存在するか否かを判断する。一致要素検索部510は、未選択の第1言語テンプレートが存在する場合(S3100:YES)、処理をステップS3010へ戻す。また、一致要素検索部510は、未選択の第1言語テンプレートが存在しない場合(S3100:NO)、処理を図9のステップS4000へ進める。
図17は、図12に示す第1および第2の翻訳対象文721、722について、図15に示す第1言語テンプレート文に基づいて生成された、編集済み翻訳対象文および編集済み翻訳文の例を示す図である。
図17に示すように、テンプレート文ID761が示す各第1言語テンプレート文に対応して、編集済み翻訳対象文762および編集済み翻訳文763が生成される。なお、ここでは、置換済み要素を、太字および下線で示している。なお、置換済み要素を識別可能にする表示方法としては、太字、下線に限らず、色、網掛け等を採用してもよい。
例えば、「2」というテンプレート文ID761が示す第1言語テンプレート文に対応して、「人気のバッグ、シューズが30%OFF。」という編集済み翻訳対象文762が生成される。
テンプレート文ID「2」の第1言語テンプレート文は、「人気のバッグ、シューズが10%OFF。」であり(図15等参照)、かかる第1言語テンプレート文は、「コートとジャケットが30%OFF。」という第2の翻訳対象文722(図12参照)に対して選択されたものである。
すなわち、編集済み翻訳対象文762では、「10」から、「30」に置き換わっている。これは、「NUM」の属性を有する要素が、それぞれの文に1つずつのみ存在するためである(図5および図14参照)。
一方、「バッグ」および「シューズ」は、「コート」および「ジャケット」に置き換わるべきであるが、元のままとなっている。これは、対比対象要素テーブル740(図14参照)およびテンプレート情報テーブル240(図5参照)に示すように、「CLOTHES」の属性を有する要素が、それぞれの文に1つずつを超えて存在するためである。
この例では、「コート」および「ジャケット」の順序を逆にしても、第1の言語および第2の言語共に意味の変化および文法上の誤りは生じない。しかしながら、文によっては、1つの文の中に存在する複数の属性一致要素の位置を入れ替えたときに、文の意味が変化してしまう場合がある。
そこで、翻訳装置100は、上述の通り、属性一致要素と属性が一致する要素が、翻訳対象文および選択中の第1の言語のテンプレート文のそれぞれに1つずつ以上存在する場合、要素の置換処理を行わず、ユーザに置換操作を委ねる。
図9のステップS4000において、情報出力部600は、ユーザ修正受付処理を行う。ユーザ修正受付処理は、要素置換部500が生成した編集済み翻訳対象文に対する修正をユーザから受け付け、対応する修正を編集済み翻訳文に加える処理である。
図18は、ユーザ修正受付処理の一例を示すフローチャートである。
ステップS4010において、修正受付部610は、編集済み翻訳対象文毎に、編集済み翻訳対象文と、対応する編集済み翻訳文とを並べて表示する。また、修正受付部610は、表示されている編集済み翻訳対象文の各要素をユーザが任意に選択するためのカーソルを表示する等して、編集済み翻訳対象文の各要素に対する選択操作をユーザから受け付ける。
なお、修正受付部610は、編集済み翻訳対象文の要置換要素については、下線等の記号の付加や、太線にする等の字体の変更等により、要置換要素であることを示す情報を表示する。
なお、修正受付部610は、置き換え可能要素についても、下線等の記号の付加や、太線にする等の字体の変更等により、置き換え可能要素であることを示す情報を表示してもよい。また、修正受付部610は、置換済み要素についても、下線等の記号の付加や、太線にする等の字体の変更等により、置換済み要素であることを示す情報を表示してもよい。また、修正受付部610は、同様に、編集済み翻訳文あるいは修正済み翻訳文の該当する要置換要素または置き換え可能要素についても、下線等の記号の付加や、太線にする等の字体の変更等により、識別可能に表示してもよい。
ステップS4020において、修正受付部610は、ユーザにより、いずれかの要置換要素を指定する操作が行われたか否かを判断する。修正受付部610は、いずれかの要置換要素が指定された場合(S4020:YES)、処理をステップS4030へ進める。また、修正受付部610は、いずれの要置換要素も指定されていない場合(S4020:NO)、処理を後述のステップS4080へ進める。なお、修正受付部610は、置き換え可能要素を、ユーザからの修正を受け付ける対象としてもよい。
ステップS4030において、修正受付部610は、指定された要置換要素と属性が一致する要素が、関連性管理テーブル210(図2参照)に存在するか否かを判断する。
より具体的には、修正受付部610は、関連性管理テーブル210の属性213(図2参照)を、指定された要置換要素の属性で検索する。指定された要置換要素の属性は、例えば、テンプレート情報テーブル240(図5参照)に基づいて特定することができる。
修正受付部610は、指定された要置換要素と属性が一致する要素が関連性管理テーブル210(図2参照)に存在する場合(S4030:YES)、処理をステップS4040へ進める。また、修正受付部610は、指定された要置換要素と属性が一致する要素が関連性管理テーブル210(図2参照)に存在しない場合(S4030:NO)、処理を後述のステップS4080へ進める。
ステップS4040において、修正受付部610は、修正受付画面において、指定された要置換要素と属性が一致する要素を、要置換要素の置き換え候補として表示する。
図19は、修正受付部610が表示する修正受付画面の一例を示す図である。ここでは、第2の翻訳対象文722(図12参照)に関する表示内容の一例を示す。図19に示すように、修正受付画面770は、例えば、テンプレート文ID表示領域771、翻訳対象文候補表示領域772、および翻訳文候補表示領域773を有する。
テンプレート文ID表示領域771は、表示の対象となっている情報の生成に用いられた、第1言語テンプレート文および第2言語テンプレート文のテンプレート文IDを表示する。翻訳対象文候補表示領域772は、編集済み翻訳対象文あるいは修正済み翻訳対象文を表示する。翻訳文候補表示領域773は、編集済み翻訳文あるいは修正済み翻訳文を表示する。
例えば、修正受付部610は、カーソル774等によりいずれかの要置換要素に対するロールオーバー、クリック、長押し等の指定操作が行われると、修正受付画面770の指定された要置換要素の近傍に、当該要置換要素の置き換え候補のリスト775を表示する。修正受付部610は、更に、リスト775内に表示された置き換え候補に対する選択操作をユーザから受け付ける。そして、修正受付部610は、リスト775においてユーザにより選択された置き換え候補で、要置換要素を置き換える。
なお、要置換要素に対する指定操作が行われた際、修正受付部610は、対応する編集済み翻訳文あるいは修正済み翻訳文の該当要素を、下線等の記号の付加や、太線にする等の字体の変更等により、識別可能に表示してよい。
図19に示すように、例えば、「バッグ」という要置換要素に対して、「バッグ、シューズ、・・・、コート、ジャケット」という、複数の置き換え候補が表示される。これらの要素が表示されるのは、図2の関連性管理テーブル210に記載の通り、いずれも「CLOTHES」という、「バッグ」と同一の属性を有しているからである。ユーザは、このように適切に絞り込まれた選択肢の中から、例えば、所望の文字列である「コート」を速やかに見付け出し、これを選択することができる。
なお、修正受付部610は、図19に示すように、要置換要素については太字にし、置換済み要素については太字にした上で下線を付している。これにより、ユーザは、要置換要素および置換済み要素、並びに、対応する翻訳文の要素を、識別することができ、意味内容の確認および修正を速やかに行うことができる。
なお、修正受付部610は、要置換要素および置換済み要素を同じ形態で表示してもよいし、意味一致要素および置換済み要素を同じ形態で表示してもよい。また、修正受付部610は、要置換要素からユーザ操作により修正された要素を、他の要素と区別されるような形態で表示してもよい。
図18のステップS4050において、修正受付部610は、いずれかの置き換え候補を選択する操作がユーザにより行われたか否かを判断する。修正受付部610は、いずれかの置き換え候補が選択された場合(S4050:YES)、処理をステップS4060へ進める。また、修正受付部610は、いずれかの置き換え候補も選択されないまま、要置換要素に対する指定操作が解除された場合(S4050:NO)、処理を後述のステップS4080へ進める。
ステップS4060において、修正受付部610は、選択された置き換え候補で指定された要置換要素を置き換えて、修正済み翻訳対象文を生成する。そして、修正受付部610は、生成された修正済み翻訳対象文を、修正受付画面770の翻訳対象文候補表示領域772(図19参照)に表示させる。
ユーザは、例えば、「バッグ」という要置換要素を指定して、置き換え候補の中から「コート」を選択することができる。この場合、修正受付部610は、「人気のバッグ、シューズが30%OFF。」という編集済み翻訳対象文は、「人気のコート、シューズが30%OFF。」という修正済み翻訳対象文に置き換えられることになる。
ステップS4070において、翻訳文生成部620は、編集済み翻訳文の要素のうち、ステップS4060で置き換えられた要素に対応する要素を置換して、修正済み翻訳文を生成する。そして、翻訳文生成部620は、生成された修正済み翻訳文を、修正受付画面770の翻訳文候補表示領域773(図19参照)に表示させる。
例えば、「バッグ」が「コート」に置き換わったとする。この場合、修正受付部610は、編集済み翻訳文に含まれる「bag」を、「coat」に置き換えて、修正済み翻訳文を生成する。
なお、翻訳文生成部620は、置き換え済み要素に対応する第2の言語の要素の原形を、第2の言語の文法ルールに従って適宜変形して、修正済み翻訳文を生成する。かかる変形には、例えば、文の先頭に位置する要素の先頭文字の大文字化、複数名詞化、活用変換等が含まれる。また、かかる変形の具体的手法としては、例えば、特許文献1に記載された手法を採用することができる。
ステップS4080において、翻訳結果出力部630は、ユーザにより確定操作が行われたか否かを判断する。かかる確定操作は、例えば、修正受付画面770に表示された確定ボタン776(図19参照)を押下する操作である。翻訳結果出力部630は、確定操作が行われていない場合(S4080:NO)、処理をステップS4020へ戻す。
すなわち、ステップS4020〜S4070の処理が繰り返され、各要素の置換が、ユーザ操作に基づいて行われる。
図20は、ユーザにより必要な修正が行われた後の修正受付画面の一例を示す図であり、図19に対応するものである。例えば、要素置換部500により生成された「人気のバッグ、シューズが30%OFF。」という編集済み翻訳対象文762(図17参照)のうち、要修正要素である「バッグ」および「シューズ」は、ユーザ操作によりそれぞれ「コート」および「ジャケット」に修正される。
その結果、図20に示すように、修正受付画面770には、「人気のコート、ジャケットが30%OFF。」という修正済み翻訳対象文と、「30% off for the purchase of popular coats and jackets.」という修正済み翻訳文とが、表示される。すなわち、元の翻訳対象文の意味とほぼ同一の修正済み翻訳対象文と、その正確な翻訳文である修正済み翻訳文とが得られる。
ユーザは、修正済み翻訳対象文の意味が元の翻訳対象文の意味とほぼ同一であることを確認すると、確定ボタン776を押下する。
翻訳結果出力部630は、このような確定操作が行われた場合(S4080:YES)、処理を図9のステップS5000へ進める。
図9のステップS5000において、翻訳結果出力部630は、修正受付画面770の翻訳文候補表示領域773(図19および図20参照)にその時点で表示されている文字列を、最終的な翻訳文として記録すると共に、上記情報出力装置あるいは情報処理装置へ出力する。
このような動作により、翻訳装置100は、翻訳対象文が入力される毎に、予め用意されたテンプレートを用いて、意味がほぼ同一となる翻訳対象文候補および翻訳文候補を対にして表示することができる。また、翻訳装置100は、翻訳対象文候補の要素に対する修正操作がユーザによって行われる毎に、表示される翻訳対象文候補および翻訳文候補を簡単に、即座に修正することができる。
なお、情報出力部600は、複数の修正済み翻訳対象文と修正済み翻訳文との組を、1つの修正受付画面770に表示してもよい。この場合、翻訳結果出力部630は、上記組毎に確定ボタンを表示し、押下操作に応じて順次、翻訳文の記録および出力を行ってもよい。
<本実施の形態の変形例>
なお、以上の説明では、1つの要素(第1言語指定文字列)に対して1つの属性のみが設定されている場合を例示したが、1つの要素(第1言語指定文字列)に対して複数の属性が設定されていてもよい。また、かかる複数の属性は、同一の階層の概念であってもよいし、異なる階層の概念であってもよい。
図21は、1つの要素に複数の属性が設定された場合の関連性管理テーブルの構成の一例を示す図であり、図2に対応するものである。図21に示すように、関連性管理テーブル210aは、第1言語指定文字列211および第2言語指定文字列212に対応付けて、下位属性214a、中位属性215a、および上位属性216aを記述している。
下位属性214aは、例えば、「コート」等の具体的な物品の種別を示す属性である。中位属性215aは、下位属性214aの上位概念の属性であり、例えば、「アウター」等の物品の用途による分類を示す属性である。上位属性216aは、中位属性215aの上位概念の属性であり、例えば、「衣類」等のより抽象的な種別を示す属性である。
例えば、「トレンチコート」と「ダッフルコート」との間では、下位属性214a、中位属性215a、および上位属性216aの全てが一致する。「バッグ」と「ダッフルコート」との間では、上位属性216aのみが一致する。すなわち、下位属性214aが一致している要素は、意味的な関連の度合いが非常に高いが、中位属性215aおよび上位属性216aのみが一致している要素、並びに、上位属性216aのみが一致している要素は、この順に意味的な関連の度合いがより低くなる。
翻訳装置100は、例えば、第1言語テンプレート文の選択および要素の置換処理については、下位属性214aのみに基づいて行い、ユーザへの置換候補の提示については、下位属性214a、中位属性215a、および上位属性216aの全てを用いてもよい。
なお、テンプレート選択部400は、第1言語テンプレート文を選択する際の優先度の算出において、翻訳対象文の要素と第1言語テンプレート文の要素の一致する属性(下位属性214a、中位属性215a、もしくは上位属性216a)によって係数の値を変化させてもよい。
図22は、このようなツリー型の属性を用いた場合の修正受付画面の一例を示す図であり、図19に対応するものである。図22に示すように、修正受付部610は、例えば、いずれかの要置換要素に対する指定操作が行われたとき、指定された要素の上位属性216aに属する全ての中位属性215aの一覧を、第1のリスト777aとして表示する。
そして、修正受付部610は、第1のリスト777aに含まれる中位属性215aに対する選択操作をユーザから受け付け、選択された中位属性215aに属する全ての下位属性214aの一覧を、第2のリスト778aとして表示する。更に、修正受付部610は、第2のリスト778aに含まれる下位属性214aに対する選択操作をユーザから受け付け、選択された下位属性214aに属する全ての要素(第1言語指定文字列)の一覧を、第3のリスト779aとして表示する。
すなわち、翻訳装置100は、例えば、第1言語指定文字列のそれぞれに、ツリー状に概念が階層化された属性を予め設定し、上位概念の属性から下位概念の属性へと順に絞り込んでいき、最終的に最下位概念の属性を有する要素のみを置換候補として提示する。
例えば、「衣類」という属性を有する第1言語指定文字列の数は膨大である。したがって、このような置換候補の提示の仕方が行われることにより、ユーザは、効率良く所望の第1言語指定文字列を選択することができる。
<本実施の形態の効果>
以上のように、本実施の形態に係る翻訳装置100は、翻訳対象文と第1の言語のテンプレート文との間の、文を構成する要素もしくは要素の属性の一致の度合いに基づいて、第1の言語のテンプレート文を選択するか否かを判断する。また、翻訳装置100は、選択された第1の言語のテンプレート文の要素に、翻訳対象文の要素と属性が同一であって意味が異なる属性一致要素が存在するとき、当該属性一致要素を、翻訳対象文の対応する上記要素に置き換える。そして、翻訳装置100は、かかる置き換えにより第1の言語のテンプレート文に生じる意味の変化を、第1の言語のテンプレート文の翻訳文である第2の言語のテンプレート文に与えて、編集済み翻訳文を生成する。
文を構成する要素の属性は、かかる要素の文における意味的な位置付けに対応している。したがって、翻訳装置100は、翻訳対象文との間の、各要素のそれぞれの文における意味的な位置付けの一致の度合いがより高い第1の言語のテンプレート文を選択して、翻訳文生成に用いることができる。そして、意味的な位置付けの一致の度合いがより高い要素を、置換の対象およびユーザに提示する置換候補として選択することができる。
すなわち、本実施の形態に係る翻訳装置100は、各要素の属性の一致性に着目しているため、翻訳対象文と似たような事柄を説明するテンプレート文を選択し、精度を損なわずにテンプレート文の意味を翻訳対象文の意味に近付けることができる。したがって、翻訳装置100は、文の翻訳を、従来に比べて正確に、即座にかつより低コストに行うことができる。
日本を訪れる外国人の数は、2013年に1000万人を越え、更に、東京オリンピックが開催される2020年に向けて増加が期待されている。これに伴い、ショッピングモール、家電量販店、レストラン、ホテル等、多くの業界でその需要の増大が期待されている。
一方で、かかる需要の増大に備えて、店舗や商品の特徴等の情報を、訪日外国人に対し正確に伝えるための施策が必要である。また、訪日外国人の消費を更に促進するためには、日本人消費者に対するのと同様に、割引やイベント開催等の各種情報を、即座にかつ正確に訪日外国人にも伝える必要がある。
そこで、日本人消費者向けに作成された、各種情報を日本語で伝える文を、外国語に翻訳することが考えられる。ところが、従来技術では、上述の通り、翻訳の精度と、翻訳に要する時間およびコストとは、トレードオフの関係にある。
この点、本実施の形態に係る翻訳装置100は、即時性が求められる文の翻訳を、少ない時間およびコストで正確に行うことができるため、このようなユースケースに好適である。更に、店舗や商品の特徴等を伝える文は、比較的、形式化している。したがって、本実施の形態に係る翻訳装置100は、正確にかつ汎用的に目的の翻訳を実現することができる。
<その他の変形例>
なお、翻訳装置100は、関連性管理テーブル210(図2参照)および文対応テーブル230(図4参照)に基づいて、テンプレート情報テーブル240(図5参照)および要素対応テーブル250(図6参照)を生成する、テーブル生成部を有してもよい。
また、文対応テーブル230(図4参照)、テンプレート情報テーブル240(図5参照)、および要素対応テーブル250(図6参照)のうちの一部または全部は、1つのテーブルとして構成されていてもよい。
また、翻訳装置100は、置き換え可否245を除くテンプレート情報テーブル240(図5参照)については、保持せずに、関連性管理テーブル210(図2参照)、文対応テーブル230(図4参照)および要素対応テーブル250(図6参照)に基づき、都度作成してもよい。
また、翻訳対象入力部300は、音声の翻訳対象文を入力するマイクロフォン等の音声入力部と、入力された音声を音声認識処理によりテキストの翻訳対象文に変換する音声認識部と、を有してもよい。
また、情報出力部600は、生成された翻訳文をテキスト読み上げ処理により音声データに変換する音声読み上げ処理部と、得られた音声データを音声に変換して出力するラウドスピーカ等の音声出力部と、を有してもよい。
また、情報出力部600は、要置換要素が存在しない場合、編集済み翻訳対象文に対する修正をユーザから受け付けないようにしてもよい。また、この場合、情報出力部600は、必ずしも、編集済み翻訳対象文を表示しなくてもよい。
また、修正受付部610は、要置換要素以外の要素についても、ユーザから修正を受け付けるようにしてもよい。
また、翻訳装置100は、必要ではない場合には、必ずしも、各要素の原形への変換、置き換え可否に応じた判定、テンプレート文IDおよびインデックスの使用、および優先度の決定等を、行わなくてもよい。また、インデックスは、第2言語テンプレート文の各要素の通し番号であってもよいし、第1言語テンプレート文と第2言語テンプレート文とで異なるインデックスが割り当てられ、文の間のインデックスの対応関係が別途設定されていてもよい。
また、各種処理の単位となる要素は、上述の例に限定されない。例えば、要素とは、単語や文節、複数の文節であってもよい。
また、翻訳対象文は、上述の例に限定されない。例えば、翻訳対象文は、単語や文節、複数の単語、複数の文節、複数の文であってもよい。
また、第1言語テンプレート文および第2言語テンプレート文は、上述の例に限定されない。例えば、第1言語テンプレート文および第2言語テンプレート文は、単語や文節であってもよい。
また、各種処理に用いられる属性は、上述の例に限定されない。例えば、属性とは、要素に関する識別子、要素の概念、要素の品詞、あるいは、要素の構文的な特徴(他の要素との構文的な位置関係あるいは意味的な繋がり、品詞の組み合わせ等)であってもよい。
また、第1の言語および第2の言語は、上述の例に限定されない。例えば、第1の言語は韓国語であってもよいし、第2の言語は中国語であってもよい。また、第2の言語は複数言語であってもよく、本発明と同様の構成を例えば第3の言語に適用すれば、第1の言語から第3の言語に対する翻訳を行う事ができる。
また、翻訳装置100の構成は、パーソナルコンピュータあるいはスマートフォンであってもよく、翻訳装置100の構成の一部は、ネットワーク上のサーバ等に配置される等して、翻訳装置100の構成の他の部分と離隔していてもよい。この場合、これら部分のそれぞれは、互いに通信を行うための通信部を備える必要がある。
<本開示のまとめ>
本開示の翻訳装置は、第1の言語の文字列である要素と、前記要素が属する情報である属性と、当該要素と意味が等価な第2の言語の要素と、を記述した関連性管理テーブルと、複数の第1の言語のテンプレート文のそれぞれについて、前記第1の言語のテンプレート文と意味が等価な第2の言語のテンプレート文と、前記第1の言語のテンプレート文を構成する各要素と、前記第1の言語のテンプレート文の各要素に定められた置き換え可否と、前記第1の言語のテンプレート文の置き換え可能と定められた要素である各置き換え可能要素と意味が等価な前記第2の言語のテンプレート文の各要素との対応関係と、を記述したアライメント管理テーブルと、を備え、翻訳対象文を構成する要素もしくは属性と前記第1の言語のテンプレート文の要素もしくは属性との一致の度合いに基づいて、前記第1の言語のテンプレート文を選択するか否かを判断するテンプレート選択部と、選択された前記第1の言語のテンプレート文の前記置き換え可能要素に、前記翻訳対象文を構成する要素と属性が同一である属性一致要素が存在するとき、前記属性一致要素を前記翻訳対象文の対応する要素と置き換えて、編集済み翻訳対象文を生成し、前記第1の言語のテンプレート文から前記編集済み翻訳対象文への意味の変化を前記第1の言語のテンプレート文と意味が等価な第2の言語のテンプレート文に与えて、編集済み翻訳文を生成する要素置換部と、生成された前記編集済み翻訳文に基づく情報を出力する情報出力部と、を有する。
なお、上記翻訳装置において、前記情報出力部は、前記編集済み翻訳対象文に対する修正の操作をユーザから受け付けて、修正済み翻訳対象文を生成する修正受付部と、前記編集済み翻訳対象文から前記修正済み翻訳対象文への意味の変化を前記編集済み翻訳文に与えて、修正済み翻訳文を生成する翻訳文生成部と、生成された修正済み翻訳文を出力する翻訳結果出力部と、を有してもよい。
また、上記翻訳装置において、前記修正受付部は、前記編集済み翻訳対象文の前記置き換え可能要素に対する選択の操作を前記ユーザから受け付け、前記編集済み翻訳対象文の前記置き換え可能要素と、前記関連性管理テーブルに基づき、属性が一致する要素を、置き換え可能要素の置き換え候補として表示し、前記ユーザに選択された置き換え可能要素を前記置き換え候補に置き換えて前記修正済み翻訳対象文を生成してもよい。
また、上記翻訳装置において、前記要素は、形態素、単語、文節、および複数の文節のうちの少なくとも1つを含み、前記属性は、前記要素に関する識別子、前記要素の概念、前記要素の品詞、および前記要素の構文的な特徴、のうち少なくとも1つを含んでもよい。
また、上記翻訳装置において、前記関連性管理テーブルは、前記第1の言語の文を構成する要素毎に当該要素の意味を示す情報を記述し、前記アライメント管理テーブルは、前記第1の言語のテンプレート文の前記要素毎に当該要素の意味を示す情報を記述し、前記テンプレート選択部は、前記翻訳対象文の前記要素の意味を取得し、前記関連性管理テーブルおよび前記アライメント管理テーブルに基づいて、前記第1の言語のテンプレート文が、前記翻訳対象文の前記要素と意味が同一である意味一致要素、および、前記属性一致要素を含むか否かを判断してもよい。
また、上記翻訳装置において、前記テンプレート選択部は、前記第1の言語のテンプレート文に含まれる、前記意味一致要素の個数と、前記属性一致要素の個数と、に基づいて、前記第1の言語のテンプレート文を選択するか否かを判断してもよい。
また、上記翻訳装置において、前記テンプレート選択部は、複数の前記第1の言語のテンプレート文のそれぞれに対して、前記意味一致要素の個数および前記属性一致要素の個数に基づいて優先度を決定し、決定された前記優先度に従って、1つまたは複数の前記第1の言語のテンプレート文を選択してもよい。
また、上記翻訳装置において、前記テンプレート選択部は、複数の前記第1の言語のテンプレート文のそれぞれに対して、前記属性一致要素の一致している属性毎に定められた値に基づいて優先度を決定し、決定された前記優先度に従って、1つまたは複数の前記第1の言語のテンプレート文を選択してもよい。
また、上記翻訳装置において、前記要素置換部は、前記属性一致要素毎に、前記属性一致要素を前記翻訳対象文の対応する要素に置き換えて得られる前記第1の言語のテンプレート文が、予め定められた前記第1の言語の文法的条件と合致するという条件、および、前記属性一致要素を前記翻訳対象文の対応する要素に置き換えて得られる前記第1の言語のテンプレート文と意味が等価な前記第2の言語のテンプレート文が、予め定められた前記第2の言語の文法的条件と合致するという条件、のうち少なくとも1つが満たされるか否かを判定し、満たされると判定された前記属性一致要素について、前記翻訳対象文の対応する要素との置き換えを行い、前記編集済み翻訳対象文を生成してもよい。
また、上記翻訳装置において、前記情報出力部は、前記編集済み翻訳対象文の前記置き換え可能要素を識別可能に表示してもよい。
また、上記翻訳装置において、前記情報出力部は、前記編集済み翻訳対象文に、前記置き換えが行われた要素が存在するとき、当該要素を識別可能に表示してもよい。
また、上記翻訳装置において、前記情報出力部は、前記編集済み翻訳対象文に、前記識別可能に表示する要素と意味が等価な前記編集済み翻訳文の要素を識別可能に表示してもよい。
また、上記翻訳装置において、前記関連性管理テーブルは、要素毎に保持する前記属性について、前記属性に対する複数の下位概念の属性を含み、前記修正受付部は、前記置き換え可能要素の前記複数の下位概念の属性のそれぞれを選択肢として表示し、ユーザにより選択された前記下位概念の属性を有する要素を、前記置き換え可能要素と置き換える要素の候補としてもよい。
本開示の翻訳方法は、第1の言語の文字列である要素と、前記要素が属する情報である属性と、当該要素と意味が等価な第2の言語の要素と、を記述した関連性管理テーブルと、複数の第1の言語のテンプレート文のそれぞれについて、前記第1の言語のテンプレート文と意味が等価な第2の言語のテンプレート文と、前記第1の言語のテンプレート文を構成する各要素と、前記第1の言語のテンプレート文の各要素に定められた置き換え可否と、前記第1の言語のテンプレート文の置き換え可能と定められた要素である各置き換え可能要素と意味が等価な前記第2の言語のテンプレート文の各要素との対応関係と、を記述したアライメント管理テーブルと、を参照するステップと、翻訳対象文を構成する要素もしくは属性と前記第1の言語のテンプレート文の要素もしくは属性との一致の度合いに基づいて、前記第1の言語のテンプレート文を選択するか否かを判断するステップと、選択された前記第1の言語のテンプレート文の前記置き換え可能要素に、前記翻訳対象文を構成する要素と属性が同一である属性一致要素が存在するか否かを判定するステップと、前記置き換え可能要素に前記属性一致要素が存在するとき、前記属性一致要素を前記翻訳対象文の対応する要素と置き換えて、編集済み翻訳対象文を生成するステップと、前記第1の言語のテンプレート文から前記編集済み翻訳対象文への意味の変化を前記第1の言語のテンプレート文と意味が等価な第2の言語のテンプレート文に与えて、編集済み翻訳文を生成するステップと、生成された前記編集済み翻訳文に基づく情報を出力するステップと、を有する。
本開示の翻訳プログラムは、コンピュータに、第1の言語の文字列である要素と、前記要素が属する情報である属性と、当該要素と意味が等価な第2の言語の要素と、を記述した関連性管理テーブルと、複数の第1の言語のテンプレート文のそれぞれについて、前記第1の言語のテンプレート文と意味が等価な第2の言語のテンプレート文と、前記第1の言語のテンプレート文を構成する各要素と、前記第1の言語のテンプレート文の各要素に定められた置き換え可否と、前記第1の言語のテンプレート文の置き換え可能と定められた要素である各置き換え可能要素と意味が等価な前記第2の言語のテンプレート文の各要素との対応関係と、を記述したアライメント管理テーブルと、を参照する処理と、翻訳対象文を構成する要素もしくは属性と前記第1の言語のテンプレート文の要素もしくは属性との一致の度合いに基づいて、前記第1の言語のテンプレート文を選択するか否かを判断する処理と、選択された前記第1の言語のテンプレート文の前記置き換え可能要素に、前記翻訳対象文を構成する要素と属性が同一である属性一致要素が存在するか否かを判定する処理と、前記置き換え可能要素に前記属性一致要素が存在するとき、前記属性一致要素を前記翻訳対象文の対応する要素と置き換えて、編集済み翻訳対象文を生成する処理と、前記第1の言語のテンプレート文から前記編集済み翻訳対象文への意味の変化を前記第1の言語のテンプレート文と意味が等価な第2の言語のテンプレート文に与えて、編集済み翻訳文を生成する処理と、生成された前記編集済み翻訳文に基づく情報を出力する処理と、を実行させる。
本発明は、文の翻訳を正確に、即座にかつ低コストに行うことができる翻訳装置、翻訳方法、および翻訳プログラムとして有用である。
100 翻訳装置
200 情報格納部
210 関連性管理テーブル
220 アライメント管理テーブル
230 文対応テーブル
240 テンプレート情報テーブル
250 要素対応テーブル
300 翻訳対象入力部
400 テンプレート選択部
500 要素置換部
510 一致要素検索部
520 第1の要素置換部
530 第2の要素置換部
600 情報出力部
610 修正受付部
620 翻訳文生成部
630 翻訳結果出力部

Claims (12)

  1. 第1の言語の文字列である要素毎に、前記要素が属する情報である属性と、前記要素と意味が等価な第2の言語の要素と、前記要素の意味を示す情報と、を記述した関連性管理テーブルと、
    複数の第1の言語のテンプレート文のそれぞれについて、前記第1の言語のテンプレート文と意味が等価な第2の言語のテンプレート文と、前記第1の言語のテンプレート文を構成する各要素と、前記第1の言語のテンプレート文の各要素に定められた置き換え可否と、前記第1の言語のテンプレート文の置き換え可能と定められた要素である各置き換え可能要素と意味が等価な前記第2の言語のテンプレート文の各要素との対応関係と、を記述したアライメント管理テーブルと、
    翻訳対象文を構成する要素の意味を取得し、前記関連性管理テーブルおよび前記アライメント管理テーブルに基づいて、前記第1の言語のテンプレート文に含まれる、前記翻訳対象文の前記要素と意味が同一である意味一致要素、および、前記翻訳対象文を構成する要素と属性が同一である属性一致要素のそれぞれの個数を求め、求められた前記意味一致要素の個数および前記属性一致要素の個数に基づいて、複数の前記第1の言語のテンプレート文のそれぞれに対して優先度を決定し、決定された前記優先度に従って、1つまたは複数の前記第1の言語のテンプレート文を選択するテンプレート選択部と、
    選択された前記第1の言語のテンプレート文の前記置き換え可能要素に、前記属性一致要素が存在するとき、前記属性一致要素を前記翻訳対象文の対応する要素と置き換えて、編集済み翻訳対象文を生成し、前記第1の言語のテンプレート文から前記編集済み翻訳対象文への意味の変化を前記第1の言語のテンプレート文と意味が等価な第2の言語のテンプレート文に与えて、編集済み翻訳文を生成する要素置換部と、
    生成された前記編集済み翻訳文に基づく情報を出力する情報出力部と、を有し、
    前記テンプレート選択部は、
    前記意味一致要素の個数に対して第1の重みを適用し、前記属性一致要素の個数に対して前記第1の重みよりも小さい第2の重みを適用して、前記意味一致要素の個数および前記属性一致要素の個数を統合することにより、前記優先度を算出する、
    翻訳装置。
  2. 前記情報出力部は、
    前記編集済み翻訳対象文に対する修正の操作をユーザから受け付けて、修正済み翻訳対象文を生成する修正受付部と、
    前記編集済み翻訳対象文から前記修正済み翻訳対象文への意味の変化を前記編集済み翻訳文に与えて、修正済み翻訳文を生成する翻訳文生成部と、
    生成された修正済み翻訳文を出力する翻訳結果出力部と、を有する、
    請求項1に記載の翻訳装置。
  3. 前記修正受付部は、
    前記編集済み翻訳対象文の前記置き換え可能要素に対する選択の操作を前記ユーザから受け付け、
    前記編集済み翻訳対象文の前記置き換え可能要素と、前記関連性管理テーブルに基づき、属性が一致する要素を、置き換え可能要素の置き換え候補として表示し、前記ユーザに選択された置き換え可能要素を前記置き換え候補に置き換えて前記修正済み翻訳対象文を生成する、
    請求項2に記載の翻訳装置。
  4. 前記要素は、形態素、単語、文節、および複数の文節のうちの少なくとも1つを含み、
    前記属性は、前記要素に関する識別子、前記要素の概念、前記要素の品詞、および前記要素の構文的な特徴、のうち少なくとも1つを含む、
    請求項1に記載の翻訳装置。
  5. 前記第2の重みは、属性毎に定められた値である、
    請求項1に記載の翻訳装置。
  6. 前記要素置換部は、
    前記属性一致要素毎に、前記属性一致要素と一致する要素が、前記翻訳対象文および前記第1の言語のテンプレート文のそれぞれに1つずつのみ存在するという条件が満たされるか否かを判定し、満たされると判定された前記属性一致要素について、前記翻訳対象文の対応する要素との置き換えを行い、前記編集済み翻訳対象文を生成する、
    請求項1に記載の翻訳装置。
  7. 前記情報出力部は、
    前記編集済み翻訳対象文の前記置き換え可能要素を識別可能に表示する、
    請求項1〜請求項3のいずれかに記載の翻訳装置。
  8. 前記情報出力部は、
    前記編集済み翻訳対象文に、前記置き換えが行われた要素が存在するとき、当該要素を識別可能に表示する、
    請求項1〜請求項3および請求項7のいずれかに記載の翻訳装置。
  9. 前記情報出力部は、
    前記編集済み翻訳対象文に、前記識別可能に表示する要素と意味が等価な前記編集済み翻訳文の要素を識別可能に表示する、
    請求項7または請求項8に記載の翻訳装置。
  10. 前記関連性管理テーブルは、
    要素毎に保持する前記属性について、前記属性に対する複数の下位概念の属性を含み、
    前記修正受付部は、
    前記置き換え可能要素の前記複数の下位概念の属性のそれぞれを選択肢として表示し、ユーザにより選択された前記下位概念の属性を有する要素を、前記置き換え可能要素と置き換える要素の候補とする、
    請求項3に記載の翻訳装置。
  11. 第1の言語の文字列である要素毎に、前記要素が属する情報である属性と、前記要素と意味が等価な第2の言語の要素と、前記要素の意味を示す情報と、を記述した関連性管理テーブルと、複数の第1の言語のテンプレート文のそれぞれについて、前記第1の言語のテンプレート文と意味が等価な第2の言語のテンプレート文と、前記第1の言語のテンプレート文を構成する各要素と、前記第1の言語のテンプレート文の各要素に定められた置き換え可否と、前記第1の言語のテンプレート文の置き換え可能と定められた要素である各置き換え可能要素と意味が等価な前記第2の言語のテンプレート文の各要素との対応関係と、を記述したアライメント管理テーブルと、を参照するステップと、
    翻訳対象文を構成する要素の意味を取得し、前記関連性管理テーブルおよび前記アライメント管理テーブルに基づいて、前記第1の言語のテンプレート文に含まれる、前記翻訳対象文の前記要素と意味が同一である意味一致要素、および、前記翻訳対象文を構成する要素と属性が同一である属性一致要素のそれぞれの個数を求め、求められた前記意味一致要素の個数および前記属性一致要素の個数に基づいて、複数の前記第1の言語のテンプレート文のそれぞれに対して優先度を決定し、決定された前記優先度に従って、1つまたは複数の前記第1の言語のテンプレート文を選択するステップと、
    選択された前記第1の言語のテンプレート文の前記置き換え可能要素に、前記属性一致要素が存在するか否かを判定するステップと、
    前記置き換え可能要素に前記属性一致要素が存在するとき、前記属性一致要素を前記翻訳対象文の対応する要素と置き換えて、編集済み翻訳対象文を生成するステップと、
    前記第1の言語のテンプレート文から前記編集済み翻訳対象文への意味の変化を前記第1の言語のテンプレート文と意味が等価な第2の言語のテンプレート文に与えて、編集済み翻訳文を生成するステップと、
    生成された前記編集済み翻訳文に基づく情報を出力するステップと、を有し、
    前記第1の言語のテンプレート文を選択するステップは、
    前記意味一致要素の個数に対して第1の重みを適用し、前記属性一致要素の個数に対して前記第1の重みよりも小さい第2の重みを適用して、前記意味一致要素の個数および前記属性一致要素の個数を統合することにより、前記優先度を算出する、
    翻訳方法。
  12. コンピュータに、
    第1の言語の文字列である要素毎に、前記要素が属する情報である属性と、前記要素と意味が等価な第2の言語の要素と、前記要素の意味を示す情報と、を記述した関連性管理テーブルと、複数の第1の言語のテンプレート文のそれぞれについて、前記第1の言語のテンプレート文と意味が等価な第2の言語のテンプレート文と、前記第1の言語のテンプレート文を構成する各要素と、前記第1の言語のテンプレート文の各要素に定められた置き換え可否と、前記第1の言語のテンプレート文の置き換え可能と定められた要素である各置き換え可能要素と意味が等価な前記第2の言語のテンプレート文の各要素との対応関係と、を記述したアライメント管理テーブルと、を参照する処理と、
    翻訳対象文を構成する要素の意味を取得し、前記関連性管理テーブルおよび前記アライメント管理テーブルに基づいて、前記第1の言語のテンプレート文に含まれる、前記翻訳対象文の前記要素と意味が同一である意味一致要素、および、前記翻訳対象文を構成する要素と属性が同一である属性一致要素のそれぞれの個数を求め、求められた前記意味一致要素の個数および前記属性一致要素の個数に基づいて、複数の前記第1の言語のテンプレート文のそれぞれに対して優先度を決定し、決定された前記優先度に従って、1つまたは複数の前記第1の言語のテンプレート文を選択する処理と、
    選択された前記第1の言語のテンプレート文の前記置き換え可能要素に、前記属性一致要素が存在するか否かを判定する処理と、
    前記置き換え可能要素に前記属性一致要素が存在するとき、前記属性一致要素を前記翻訳対象文の対応する要素と置き換えて、編集済み翻訳対象文を生成する処理と、
    前記第1の言語のテンプレート文から前記編集済み翻訳対象文への意味の変化を前記第1の言語のテンプレート文と意味が等価な第2の言語のテンプレート文に与えて、編集済み翻訳文を生成する処理と、
    生成された前記編集済み翻訳文に基づく情報を出力する処理と、を実行させ、
    前記第1の言語のテンプレート文を選択する処理は、
    前記意味一致要素の個数に対して第1の重みを適用し、前記属性一致要素の個数に対して前記第1の重みよりも小さい第2の重みを適用して、前記意味一致要素の個数および前記属性一致要素の個数を統合することにより、前記優先度を算出する、
    翻訳プログラム。
JP2014263380A 2014-12-25 2014-12-25 翻訳装置、翻訳方法、および翻訳プログラム Active JP5763830B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014263380A JP5763830B1 (ja) 2014-12-25 2014-12-25 翻訳装置、翻訳方法、および翻訳プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014263380A JP5763830B1 (ja) 2014-12-25 2014-12-25 翻訳装置、翻訳方法、および翻訳プログラム

Publications (2)

Publication Number Publication Date
JP5763830B1 true JP5763830B1 (ja) 2015-08-12
JP2016122417A JP2016122417A (ja) 2016-07-07

Family

ID=53887808

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014263380A Active JP5763830B1 (ja) 2014-12-25 2014-12-25 翻訳装置、翻訳方法、および翻訳プログラム

Country Status (1)

Country Link
JP (1) JP5763830B1 (ja)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06325072A (ja) * 1993-05-14 1994-11-25 Fuji Xerox Co Ltd 電子翻訳機
JPH08314939A (ja) * 1995-05-23 1996-11-29 Sony Corp 翻訳装置および翻訳方法
JPH10254881A (ja) * 1997-03-11 1998-09-25 Sharp Corp 機械翻訳装置
JP2008076865A (ja) * 2006-09-22 2008-04-03 Toshiba Corp 機械翻訳装置、機械翻訳方法および機械翻訳プログラム
JP2009015512A (ja) * 2007-07-03 2009-01-22 Toshiba Corp 機械翻訳を行う装置、方法およびプログラム
JP2012113459A (ja) * 2010-11-24 2012-06-14 Toshiba Corp 用例翻訳システム、用例翻訳方法及び用例翻訳プログラム
JP2012230460A (ja) * 2011-04-25 2012-11-22 Toshiba Corp 機械翻訳システム、方法及びプログラム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06325072A (ja) * 1993-05-14 1994-11-25 Fuji Xerox Co Ltd 電子翻訳機
JPH08314939A (ja) * 1995-05-23 1996-11-29 Sony Corp 翻訳装置および翻訳方法
JPH10254881A (ja) * 1997-03-11 1998-09-25 Sharp Corp 機械翻訳装置
JP2008076865A (ja) * 2006-09-22 2008-04-03 Toshiba Corp 機械翻訳装置、機械翻訳方法および機械翻訳プログラム
JP2009015512A (ja) * 2007-07-03 2009-01-22 Toshiba Corp 機械翻訳を行う装置、方法およびプログラム
JP2012113459A (ja) * 2010-11-24 2012-06-14 Toshiba Corp 用例翻訳システム、用例翻訳方法及び用例翻訳プログラム
JP2012230460A (ja) * 2011-04-25 2012-11-22 Toshiba Corp 機械翻訳システム、方法及びプログラム

Also Published As

Publication number Publication date
JP2016122417A (ja) 2016-07-07

Similar Documents

Publication Publication Date Title
CN107025217B (zh) 同义转换文生成方法、装置、记录介质以及机器翻译系统
EP0686286B1 (en) Text input transliteration system
US9916304B2 (en) Method of creating translation corpus
Karimi et al. Machine transliteration survey
US8554537B2 (en) Method and device for transliteration
US10460162B2 (en) Method, device, and system, for identifying data elements in data structures
US8407040B2 (en) Information processing device, method and program
US8655641B2 (en) Machine translation apparatus and non-transitory computer readable medium
JP6404511B2 (ja) 翻訳支援システム、翻訳支援方法、および翻訳支援プログラム
JP6096489B2 (ja) 外国語文章作成支援装置、方法、及びプログラム
CN112035675A (zh) 医疗文本标注方法、装置、设备及存储介质
US11537795B2 (en) Document processing device, document processing method, and document processing program
CN111488466A (zh) 中文带标记错误语料生成方法、计算装置和存储介质
Aswani et al. A hybrid approach to align sentences and words in English-Hindi parallel corpora
JPS62287336A (ja) 電子辞書
JP5763830B1 (ja) 翻訳装置、翻訳方法、および翻訳プログラム
WO2014170965A1 (ja) 文書処理方法、文書処理装置および文書処理プログラム
JP5298834B2 (ja) 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置
Saharia et al. LuitPad: a fully unicode compatible Assamese writing software
JPH08106474A (ja) 類似例文検索結果表示方法及び装置
JP2000194721A (ja) 文書群分類装置および文書群分類方法
Eyecioglu et al. Knowledge-lean paraphrase identification using character-based features
US20130080148A1 (en) Information processing apparatus, information processing method, and computer readable medium
Aransa et al. Semi-supervised transliteration mining from parallel and comparable corpora
JP2009075748A (ja) 機械翻訳装置及びプログラム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150602

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150611

R151 Written notification of patent or utility model registration

Ref document number: 5763830

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151