JP2015022430A - 対訳評価装置、翻訳装置、対訳評価方法、及びプログラム - Google Patents
対訳評価装置、翻訳装置、対訳評価方法、及びプログラム Download PDFInfo
- Publication number
- JP2015022430A JP2015022430A JP2013148720A JP2013148720A JP2015022430A JP 2015022430 A JP2015022430 A JP 2015022430A JP 2013148720 A JP2013148720 A JP 2013148720A JP 2013148720 A JP2013148720 A JP 2013148720A JP 2015022430 A JP2015022430 A JP 2015022430A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- unit
- parallel translation
- translation
- evaluation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013519 translation Methods 0.000 title claims abstract description 403
- 238000011156 evaluation Methods 0.000 title claims abstract description 240
- 238000003860 storage Methods 0.000 claims abstract description 72
- 238000006243 chemical reaction Methods 0.000 claims abstract description 68
- 239000000470 constituent Substances 0.000 claims description 7
- 230000014616 translation Effects 0.000 description 370
- 239000011159 matrix material Substances 0.000 description 83
- 238000000034 method Methods 0.000 description 66
- 238000012545 processing Methods 0.000 description 37
- 238000000605 extraction Methods 0.000 description 36
- 238000004364 calculation method Methods 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 11
- 239000000284 extract Substances 0.000 description 11
- 238000012854 evaluation process Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 230000008707 rearrangement Effects 0.000 description 9
- 235000008314 Echinocereus dasyacanthus Nutrition 0.000 description 6
- 240000005595 Echinocereus dasyacanthus Species 0.000 description 6
- 239000002245 particle Substances 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 3
- 230000000877 morphologic effect Effects 0.000 description 3
- 230000001174 ascending effect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 235000010586 Sophora japonica Nutrition 0.000 description 1
- 244000046101 Sophora japonica Species 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Abstract
Description
対訳コーパスの作成に関する技術としては、例えば、特許文献1に記載の技術が知られている。この特許文献1に記載の技術では、複数の翻訳結果に含まれる単語の頻度が高いものを正しいとする判断処理に基づいて対訳コーパスの作成が行われる。
[第1の実施形態]
まず、本発明に係る第1の実施形態について、図面を参照して説明する。
図1は、本実施形態による対訳評価装置1の一例を示す概略ブロック図である。
なお、第1の実施形態では、一例として、日本語文と英語文とを対応付けた対訳文の評価を行う対訳評価装置1について説明する。
この図において、対訳文DB記憶部21は、「対訳文ID」、「日本語文」、及び「英語文」を関連付けて記憶する。ここで、「対訳文ID」は、対訳文を識別する識別情報を示し、「日本語文」及び「英語文」は、日本語と英語との対応する文を示している。対訳文DB記憶部21は、このような「対訳文ID」、「日本語文」、及び「英語文」を複数有している。
変換部50は、例えば、“he”、“works”、“for”、“a”、“company”、“in”、“tokyo”、及び“.”と分割された英語文を、後述する図4に示す英語文ES2のように“he”、“ga”、“tokyo”、“in”、“company”、“for”、“works”、及び“.”に並べ替える。このように、変換部50は、対訳文取得部10が取得した対訳文の2つの文において、2つの言語の対応する語句の順(単語や句の順序)が等しくなるように、2つの文のうちの少なくとも1つの文を変換する。すなわち、変換部50は、文の構成要素である語句の並び順が所定の順となるように対訳文の少なくとも1つの言語の文を変換する。また、変換部50は、構文解析部51と、並び替え部52とを備えている。
なお、英語文を主辞後置英語(HFE)に変換する手法は、例えば、特開2011-175500号公報に記載されている。また、主辞後置英語(HFE)には、助詞の代わりに、助詞に相当する語が入る可能性を示す助詞相当語が補完されてもよいし、主辞後置英語(HFE)は、助詞を補完されなくてもよい。
図4に示す例は、分割HFE文の分割数(単語数)が8個であり、分割日本語文の分割数(単語数)が12個である場合の一例を示しており、この場合、対応抽出部60は、8行×12列の対応パターン行列(8行×12列の行列)を抽出する。なお、この図において、英語文ES2は、HFE変換された分割英語文を示し、日本語文NS1は、分割日本語文を示している。ずなわち、図4は、列に英語の単語、行に形態素解析された日本語の単語を割り当てた行列の情報を示した図である。
また、この対応パターン行列において、8行×12列のうち、対応抽出部60によって抽出された、英語文の単語と日本語文の単語とが対応する単語の数は、8個であることを示している。ここでは、対応抽出部60は、分割HFE文と、分割日本語文との対応づけを抽出しているため、対応パターン行列は、対角線状に近い要素に「1」(マーク“●”)が挿入される状態になっていることを示している。
このように、対応抽出部60は、単語の対応づけそれぞれに対して行列の要素を「1」とした結果である対応パターン行列を作成する。
対応抽出部60は、抽出した対応パターン行列と、「対訳文ID」とを評価部70に出力する。
この図において、英語文ES1は、HFE変換される前の分割英語文を示し、日本語文NS1は、分割日本語文を示している。
HFE変換処理を実施しない場合には、図3に示すように、対応パターン行列は、対角線状に近い要素に「1」(マーク“●”)が挿入される状態にならないことを示している。
具体的に、評価部70は、例えば、部分空間法の類似度を対訳文の評価値として算出する。評価部70は、固有ベクトル生成部71と、評価値算出部72とを備えている。
ここでは、対応抽出部60が、8行×12列の対応パターン行列であって、対応が抽出された単語数が8個である場合における対角線状のパターン行列の一例を示している。
固有ベクトル生成部71は、0〜1の間の乱数Rを生成し、生成した乱数Rに基づいて、対応が抽出された単語数の数だけ、「1」を挿入する。なお、ここでは、図4に示す対応パターン行列と同様に、値が「1」となる要素にマーク“●”(黒丸印)を記入している。また、●印が記入されていない要素の値は、初期値の「0」である。具体的に、固有ベクトル生成部71は、乱数Rに英語文の分割数“8”を積算して小数点以下を切り捨てた値に“1”を加算した行数と、乱数Rに日本語文の分割数“12”を積算して小数点以下を切り捨てた値に“1”を加算した列数とが交差する要素に、「1」(マーク“●”)を追加する。固有ベクトル生成部71は、この値「1」を追加する処理を、複数回実行(例えば、対応が抽出された単語数である8回実行)し、図5に示すような対角線状のパターン行列を生成する。
また、固有ベクトル生成部71は、この対角線状のパターン行列を生成する処理を複数回実行して、対角線状のパターン行列群を生成する。固有ベクトル生成部71は、例えば、対応が抽出された単語数である“8”を十倍した数の回数だけ実行して、対角線状のパターン行列群を生成する。
このように、評価部70は、変換部50によって語順が変換された英語文(HFE変換英語文)と、日本語文との2つの文における語順に基づいて、対訳文を評価する評価値を算出する。また、評価部70は、HFE変換英語文と日本語文との2つの文における2つの言語(英語及び日本語)の対応する語句の順(単語や句の順序)が一致する程、評価値が高くなるように評価値を算出する。すなわち、評価値算出部72は、日本語文と英語文で対応する単語の語順が一致する程、高い評価値を算出する。評価部70は、例えば、類似度が大きくなれば大きくなるほど大きな値を与える関数を用いて類似度から評価値を求め、評価値が大きければ大きいほど対訳文として適切と判断することとしてもよい。また、評価部70は、評価値の大小と、対訳文としての適不適との間の対応関係は予め定めておき、予め定めた関係に沿う所定の評価関数を用いて評価値を算出してもよい。
評価部70は、算出した評価値と「対訳文ID」とを対応付けて、選択部80に出力する。
選択部80は、例えば、対訳文DBが有する対訳文数の所定の割合以下(例えば、5%以下)にランキングされた対訳文を品質の悪い対訳文として選択する。なお、選択部80は、例えば、対訳文DBが有する対訳文数の所定の割合以上にランキングされた対訳文を品質の良い対訳文として選択してもよい。また、選択部80は、ランキングを算出せずに、評価部70によって算出された評価値(類似度)が所定の閾値以上である場合に、品質の良い対訳文として選択し、評価部70によって算出された評価値(類似度)が所定の閾値未満である場合に、品質の悪い対訳文として選択してもよい。
選択部80は、対訳文の選択結果をクリーンアップ処理装置3に出力する。
対訳評価装置1は、例えば、対訳文DB(対訳コーパス)を新規に作成する場合、既に作成されている対訳文DBに対訳文を追加する場合、統計的機械翻訳の品質を改善したい場合などに、対訳文の評価処理を実行する。
図6は、本実施形態における対訳文の評価処理の一例を示すフローチャートである。
この図において、対訳評価装置1の対訳文取得部10は、対訳文DB記憶部21から評価対象となる対訳文を取得する(ステップS101)。対訳文取得部10は、例えば、「対訳文ID」と、「対訳文ID」と関連付けられた対訳文とを対訳文DB記憶部21から取得し、取得した「対訳文ID」と、対訳文とを単語分割部20に出力する。
具体的には、変換部50の構文解析部51は、単語分割部20から出力された単語に分割された英語文(分割英語文)の構文を解析する。次に、変換部50の並び替え部52は、構文解析部51が解析した構文情報と、変換ルール記憶部30が記憶する変換ルール情報とに基づいて、分割英語文を、HFE(主辞後置英語)に並び替える。変換部50は、並べ替えた分割HFE文と「対訳文ID」とを対応抽出部60に出力する。
また、選択部80は、「対訳文ID」が“N”に達している場合(ステップS107:YNO)に、次の評価対象の対訳文がないと判定し、処理をステップS108に進める。
ステップS108の処理が完了した後、対訳評価装置1は、選択結果を対訳評価装置1の外部に出力して処理を終了する。
<評価部70による評価処理>
図7は、本実施形態における評価部70による評価処理の一例を示すフローチャートである。
この図において、評価部70の固有ベクトル生成部71は、まず、対角線状のパターン行列群を生成する(ステップS201)。固有ベクトル生成部71は、例えば、評価するn行×m列の対応パターン行列における対角線状のパターン行列群を生成する。ここで、対角線状のパターン行列群は、対応が抽出された単語数だけ対角線状にランダムに「1」が並ぶように生成されたパターンの集合である。また、固有ベクトル生成部71は、対応が抽出された単語数を十倍した数の対角線状のパターン行列を対角線状のパターン行列群として生成する。
ステップS204の処理が完了した後に、評価部70は、選択部80に算出した類似度を出力して、評価処理を終了する。
なお、評価部70は、ステップS201からステップS204の処理を、対訳文ごとに、複数回実行する。
<対訳文の選択処理及びクリーンアップ処理>
図8は、本実施形態における対訳文の選択処理及びクリーンアップ処理の一例を示すフローチャートである。
これにより、対訳文を評価することができるので、本実施形態による対訳評価装置1は、例えば、統計的機械翻訳に適した適切な対訳文を得ることができる。そのため、対訳文を利用する統計的機械翻訳における誤訳を低減することができるので、本実施形態による対訳評価装置1は、対訳文を利用する翻訳装置における統計的機械翻訳の品質を向上させることができる。
また、本実施形態による対訳評価装置1は、非特許文献1に記載のような技術と比べて、対訳文として不適切なものを除外することができる。
このように、本実施形態による対訳評価装置1は、誤った対訳文が作成されることを低減することができる。
これにより、本実施形態における対訳評価装置1は、統計的機械翻訳に適した適切な対訳文を得ることができる。また、本実施形態における対訳評価装置1は、選択された適切な対訳文を統計的機械翻訳に利用することで、統計的機械翻訳の品質を向上させることができる。
これにより、本実施形態における対訳評価装置1は、日英翻訳における統計的機械翻訳に適した適切な対訳文を得ることができる。
これにより、本実施形態における対訳評価装置1は、部分空間法の類似度という簡易な手法により、対訳文の単語数が異なる場合であっても、対訳文を定量的に評価することができる。なお、ここでの対訳文の単語数が異なる場合とは、英語文と日本語文との単語数が異なる場合、及び、英語文の単語数と日本語文の単語数との組み合わせが異なる場合を含んでいる。
これにより、本実施形態における対訳評価方法は、統計的機械翻訳に適した適切な対訳文を得ることができる。そのため、本実施形態における対訳評価方法は、統計的機械翻訳の品質を向上させることができる。
次に、本発明に係る第2の実施形態について、図面を参照して説明する。
第2の実施形態では、第1の実施形態の対訳評価装置1が算出した評価値に基づいて、生成、又はクリーンアップ処理された対訳文DBを利用した翻訳システム及び翻訳装置の一例について説明する。
図9において、翻訳システム200は、対訳評価装置1、クリーンアップ処理装置3、及び翻訳装置100を備えている。また、翻訳装置100は、対訳文DB記憶部21、学習モデル生成部110、及び翻訳処理部120を備えている。また、翻訳処理部120は、学習モデル121を有している。この図において、図1に示す第1の実施形態と同一の構成には、同一の符号を付与している。
なお、本実施形態では、翻訳装置100が、対訳文DB記憶部21及び学習モデル生成部110を含む場合の一例について説明する。
これにより、本実施形態における翻訳装置100は、対訳評価装置1により統計的機械翻訳に適した対訳文を得ることができるので、統計的機械翻訳の品質を向上させることができる。
例えば、上記の各実施形態では、日本語文と英語文との対訳文を評価し、日本語文と英語文との翻訳を行う場合について説明したが、日本語及び英語以外の言語の翻訳にてきようしてもよい。対訳評価装置1及び翻訳装置100は、例えば、日本語及び英語の他に、フランス語、ドイツ語、中国語、韓国語などの自然言語のうちのいずれかの2つの言語に対して適用してもよい。
また、上記の各実施形態では、対訳文に含まれる英語文を、後述のHFE変換処理を用いて句や単語の修飾関係が日本語と同じになるように変換しているが、対訳文に含まれる言語のいずれの言語文を変換するのかは適宜決定すればよく、変換処理についても変換元と先の言語に応じて適宜定めればよい。
例えば、対応抽出部60は、句や語の出現順序の整合が取れるように少なくとも1つの言語の対訳文を変換した後、変換された対訳文の中で対応する単語同士の出現位置を示す情報を受け渡すこととしてもよい。図4の例では、対応抽出部60は、例えば、(彼、1;he、1)、(は、2;ga、2)、(東京、4;Tokyo、3)、・・・、(。、12;.、8)の様な形式で情報を受け渡すこととしてもよい。
また、対応抽出部60での語の対応付けは、例えば、単語アライメントツールのGIZA++による対訳文集合における言語間の単語の翻訳の期待値最大化処理により実現してもよい。また、別の方法としては、単語に分割された日本語文(分割日本語文)に含まれる単語と、分割HFE文に含まれる単語の中で、翻訳関係にあるもの(例えば、日本語の“彼”と英語の“he”)を対応づけてもよい。対応抽出部60は、さらに、分割日本語文と分割HFE文とで対応付けられた語句の出現順序を特定して評価部に受け渡し、評価部70が単語の出現順序の類似度合(あるいは、一致度合)を求めてもよい。
例えば、対応抽出部から(彼、1;he、1)、(は、2;ga、2)、(東京、3;tokyo、3)、・・・、(。、12;.、8)の様な形式で情報を受け取った場合、評価部70は、次のように、評価することとしてもよい。評価部70は、日本語単語の出現位置(語順)をx座標値、英単語の出現位置をy座標値として、単語の対応づけ毎に座標値を作成する。評価部70は、作成した座標値群を最小二乗法により一次関数で近似し、近似した一次関数と座標値群に含まれる座標値との間の最小距離を求め、最小距離の和を座標群に含まれる座標値の数の逆数を乗じて正規化した値を求める。そして、評価部70は、正規化した値が小さければ小さいほど、その対訳文が適していると評価することとしても良い。
また、別の一例として、評価部70は、例えば、一方の言語での単語の出現順序により受け取った情報(単語のペアと出現順序の情報)を昇順あるいは降順にソートし、並べ替えに用いなかった言語での単語の出現順序の中でソートに用いた規則(昇順あるいは降順)に合致しないものを抽出する。評価部70は、抽出された規則に合致しないものの数を対応抽出部60から受け取った単語ペアの数で正規化し、正規化した値が小さければ小さいほど、その対訳文が適していると評価することとしてもよい。
このように、評価部70は、固有ベクトル生成部71と評価値算出部72を用いない方法であってもよい。
また、上記の実施形態では、単語分割部20、変換部50、対応抽出部60、及び評価部70の各構成が、取得した「対訳文ID」を出力する形態を説明したが、対訳文取得部10が取得した「対訳文ID」を不図示の記憶部に記憶させて、各構成が、それぞれこの記憶部から「対訳文ID」を読み出してもよい。
また、上記の実施形態において、対訳評価装置1は、選択部80を含む場合について説明したが、選択部80を含まない形態であってもよい。また、クリーンアップ処理をクリーンアップ処理装置3が実行する場合について説明したが、人手によって、クリーンアップ処理が実施されてもよい。また、対訳評価装置1がクリーンアップ処理装置3を含み、クリーンアップ処理まで含めて対訳評価装置1が実行してもよい。
図10は、本実施形態における翻訳装置100(100a)の別の一例を示す概略ブロック図である。この図において、図9と同一の構成には、同一の符号が不要されている。この図において、翻訳装置100aは、対訳評価装置1、クリーンアップ処理装置3、対訳文DB記憶部21、学習モデル生成部110、及び翻訳処理部120を備えている。このように構成された翻訳装置100aにおいても、図9に示す翻訳装置100と同様に、統計的機械翻訳の品質を向上させることができる。また、翻訳装置100aは、対訳評価装置1及びクリーンアップ処理装置3を備えているので、対訳文DBに対して、対訳文の追加、編集、削除などの対訳文DBの更新処理(クリーンアップ処理)を随時実行することができる。よって、翻訳装置100aは、動的に統計的機械翻訳の品質を向上させることができる。
2 記憶装置
3 クリーンアップ処理装置
10 対訳文取得部
20 単語分割部
21 対訳文DB記憶部
30 変換ルール記憶部
40 単語対応辞書記憶部
50 変換部
51 構文解析部
52 並び替え部
60 対応抽出部
70 評価部
71 固有ベクトル生成部
72 評価値算出部
80 選択部
100、100a 翻訳装置
110 学習モデル生成部
120 翻訳処理部
121 学習モデル
200 翻訳システム
Claims (7)
- 言語の異なる文を対応付けた対訳文を記憶する対訳文記憶部から前記対訳文を取得する取得部と、
文の構成要素である語句の並び順が所定の順となるように前記対訳文の少なくとも1つの言語の文を変換する変換部と、
前記変換部によって前記少なくとも1つの言語の文が変換された前記対訳文における語順に基づいて、前記対訳文を評価する評価値を算出する評価部と
を備えることを特徴とする対訳評価装置。 - 前記評価部は、
対訳文において対応する単語を抽出し、前記少なくとも1つの文が変換された前記対訳文において対応する語句の並び順が類似する程、当該対訳文の適正度合が高くなるように前記評価値を算出する
ことを特徴とする請求項1に記載の対訳評価装置。 - 前記対訳文における異なる言語とは、日本語と英語とであり、
前記変換部は、前記対訳文に含まれる英語の文を主辞後置英語に変換する
ことを特徴とする請求項1又は請求項2に記載の対訳評価装置。 - 前記評価部によって算出された前記評価値に基づいて、前記対訳文を選択する選択部
を備えることを特徴とする請求項1から請求項3のいずれか一項に記載の対訳評価装置。 - 請求項1から請求項4のいずれか一項に記載の対訳評価装置による前記評価値に基づき選択された前記対訳文に基づいて学習モデルを生成し、生成した前記学習モデルに基づいて、翻訳対象の文を翻訳する翻訳装置。
- 取得部が、言語の異なる文を対応付けた対訳文を記憶する対訳文記憶部から前記対訳文を取得する取得ステップと、
変換部が、文の構成要素である語句の並び順が所定の順となるように前記対訳文の少なくとも1つの言語の文を変換する変換ステップと、
評価部が、前記変換部によって前記少なくとも1つの言語の文が変換された前記対訳文における語順に基づいて、前記対訳文を評価する評価値を算出する評価ステップと
を含むことを特徴とする対訳評価方法。 - コンピュータに、
取得部が、言語の異なる文を対応付けた対訳文を記憶する対訳文記憶部から前記対訳文を取得する取得ステップと、
変換部が、文の構成要素である語句の並び順が所定の順となるように前記対訳文の少なくとも1つの言語の文を変換する変換ステップと、
評価部が、前記変換部によって前記少なくとも1つの言語の文が変換された前記対訳文における語順に基づいて、前記対訳文を評価する評価値を算出する評価ステップと
を実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013148720A JP6259599B2 (ja) | 2013-07-17 | 2013-07-17 | 対訳評価装置、翻訳装置、対訳評価方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013148720A JP6259599B2 (ja) | 2013-07-17 | 2013-07-17 | 対訳評価装置、翻訳装置、対訳評価方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015022430A true JP2015022430A (ja) | 2015-02-02 |
JP6259599B2 JP6259599B2 (ja) | 2018-01-10 |
Family
ID=52486844
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013148720A Active JP6259599B2 (ja) | 2013-07-17 | 2013-07-17 | 対訳評価装置、翻訳装置、対訳評価方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6259599B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113642337A (zh) * | 2020-05-11 | 2021-11-12 | 阿里巴巴集团控股有限公司 | 数据处理方法和装置、翻译方法、电子设备以及计算机可读存储介质 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210017063A (ko) | 2019-08-06 | 2021-02-17 | 삼성전자주식회사 | 전자 장치 및 그의 필기 입력을 처리하는 방법 |
-
2013
- 2013-07-17 JP JP2013148720A patent/JP6259599B2/ja active Active
Non-Patent Citations (2)
Title |
---|
今村賢治 他1名: "直訳性に着目した対訳コーパスフィルタリング", FIT2002 情報科学技術フォーラム 一般講演論文集 第2分冊, JPN6017011758, 13 September 2002 (2002-09-13), JP, pages 185−186頁 * |
磯崎秀樹: "英日翻訳における語順について", 言語処理学会第16回年次大会発表論文集, JPN6017011757, 8 March 2010 (2010-03-08), JP, pages 884−887頁 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113642337A (zh) * | 2020-05-11 | 2021-11-12 | 阿里巴巴集团控股有限公司 | 数据处理方法和装置、翻译方法、电子设备以及计算机可读存储介质 |
CN113642337B (zh) * | 2020-05-11 | 2023-12-19 | 阿里巴巴集团控股有限公司 | 数据处理方法和装置、翻译方法、电子设备以及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP6259599B2 (ja) | 2018-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11328006B2 (en) | Word semantic relation estimation device and word semantic relation estimation method | |
CN110147558B (zh) | 一种翻译语料处理的方法和装置 | |
CN109815390B (zh) | 多语言信息的检索方法、装置、计算机设备及计算机存储介质 | |
CN100454294C (zh) | 用于将日文翻译成中文的设备 | |
JP6186198B2 (ja) | 学習モデル作成装置、翻訳装置、学習モデル作成方法、及びプログラム | |
CN108701126B (zh) | 主题推定装置、主题推定方法以及存储介质 | |
CN101308512A (zh) | 一种基于网页的互译翻译对抽取方法及装置 | |
JP6259599B2 (ja) | 対訳評価装置、翻訳装置、対訳評価方法、及びプログラム | |
US20140358522A1 (en) | Information search apparatus and information search method | |
Hocking et al. | Optical character recognition for South African languages | |
JP6590723B2 (ja) | 単語並べ替え学習方法、単語並べ替え方法、装置、及びプログラム | |
CN114462427A (zh) | 基于术语保护的机器翻译方法及装置 | |
JP2009181301A (ja) | 表現テンプレート生成装置、その方法およびそのプログラム | |
Nawab et al. | External Plagiarism Detection using Information Retrieval and Sequence Alignment-Notebook for PAN at CLEF 2011. | |
KR101735314B1 (ko) | 하이브리드 번역 장치 및 그 방법 | |
JP2004348514A (ja) | 対訳語抽出方法、対訳辞書構築方法及び翻訳メモリ構築方法 | |
CN107622058A (zh) | 制作外文地名库的方法、装置、电子导航芯片及服务器 | |
JP2017129994A (ja) | 文書き換え装置、方法、及びプログラム | |
CN113268600B (zh) | 检索名称的错别字纠正方法、装置、电子设备和存储介质 | |
JP2019153056A (ja) | 情報処理装置、及び情報処理プログラム | |
JP5521670B2 (ja) | パターンマッチング装置、翻訳装置、翻訳システム及び翻訳プログラム | |
Martynov et al. | Rupaws: A russian adversarial dataset for paraphrase identification | |
JP5521669B2 (ja) | パターンマッチング装置、翻訳装置、翻訳システム及び翻訳プログラム | |
CN118673119A (zh) | 答案生成方法、装置、电子设备及存储介质 | |
JP2016177341A (ja) | 対訳文生成装置、翻訳装置、対訳文生成方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160621 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170327 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170404 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170530 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170905 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171027 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171114 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171211 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6259599 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |