JP6262122B2

Patents

Full documents

Title

Abstract

Claims

All

Any

Exact

Not

Add AND condition

These CPCs and their children

These exact CPCs

Add AND condition

Exact

Exact Batch

Similar

Substructure

Substructure (SMARTS)

Full documents

Claims only

Add AND condition

Application Numbers

Publication Numbers

Either

Add AND condition

翻訳学習装置、固有表現学習装置、方法、及びプログラム

Images (0)

Landscapes

Machine Translation

JP6262122B2

Japan

Download PDF

Find Prior Art

Similar

Other languages: English
Inventor: 九月貞光; 九月貞光; 松尾　義博; 義博松尾; 久子浅野; 久子浅野; いつみ斉藤; いつみ斉藤
Current Assignee The listed assignees may be inaccurate. : Nippon Telegraph and Telephone Corp

2014

2014-11-18

Application filed by Nippon Telegraph and Telephone Corp

2014-11-18

Priority to JP2014233928A

2016-05-30

Publication of JP2016099675A

2018-01-17

Application granted

2018-01-17

Publication of JP6262122B2

Status

Active

2034-11-18

Anticipated expiration

Info: Patent citations (1); Cited by (5); Legal events; Similar documents; Priority and Related Applications
External links: Espacenet; Global Dossier; Discuss

Description

本発明は、翻訳学習装置、翻訳装置、固有表現学習装置、方法、及びプログラムに係り、特に、固有表現を含む文を翻訳するための翻訳学習装置、翻訳装置、固有表現学習装置、方法、及びプログラムに関する。

従来より、文中の固有表現（NE：Named Entity)を抽出する手法として、固有表現抽出(NER：Named Entity Recognition)が知られている。固有表現とは、固有物や数量等に対して与えられる名称であり、「東京」「葛飾北斎」等が固有表現の例として挙げられる。また、固有表現の境界と共に、その固有表現のラベルも付与される。ラベル数には様々な定義があり、例えば、関根らの定義した「拡張固有表現（Extended NE）」を用いることができる。拡張固有表現は２００のラベルが定義され、それぞれ階層構造を持つ（非特許文献１参照）。固有表現抽出（NER：Named Entity Recognition）においては、一般的に条件付き確率場（CRF）等が用いられる。

また、従来のルールベースの手法ではなく、大量の翻訳対データを元に翻訳モデルを統計的に学習、デコードする統計的機械翻訳（SMT：Statistical Machine Translation）の技術が知られている（非特許文献２参照）。

関根の拡張固有表現階層-7.1.0-，インターネット＜URL：https://sites.google.com/site/extendednamedentityhierarchy/＞統計的機械翻訳ツールmoses，インターネット＜URL：http://www.statmt.org/moses/＞

もっとも、固有表現は、その種類数の多さに起因して、他の一般名詞や動詞、助詞等と比較して同じ固有表現が現れにくい特徴を持つ。また、統計的機械翻訳では学習データが重要であるが、上記固有表現の特徴は、データの疎性を生じるため、固有表現や、その周辺単語での翻訳精度が落ちてしまうという問題がある。そこで、翻訳を実行する前段階において、固有表現を固有表現ラベルへと抽象化することで、データの疎性を解消することが可能である。実際、非特許文献２の手法でも、翻訳データ対に基づき、単語の抽象化を行っている。

しかし、固有表現抽出単独としては、教師ありデータに基づく等、高精度な手法を適用することもできるが、翻訳モデルを用いた学習、及びデコードとの融合が必要となってくるため、そこには以下の３つの課題が存在する。

第１の課題は、固有表現抽出で抽象化すべき固有表現ラベルの粒度として、いずれの程度が適切であるかは自明でなく、また、翻訳モデルの学習コストが非常に高いことから、どのラベルを使うべきか、すべての組み合わせを総当りで試すことは現実的ではないというものである。

第２の課題は、片方の言語についてのみ固有表現抽出が存在しているような状況下においては、もう一方の言語の固有表現ラベルが不明であり、翻訳モデルを学習することが困難というものである。

第３の課題は、固有表現化及び固有表現に基づく翻訳ができたとして、その固有表現化された箇所を目的言語に変換する方法が自明ではないというものである。

本発明は、上記問題点を解決するために成されたものであり、精度よく、固有表現を含む文を翻訳するための翻訳学習装置、翻訳装置、方法、及びプログラムを提供することを目的とする。

また、精度よく、固有表現を抽出するための固有表現学習装置、方法、及びプログラムを提供することを目的とする。

上記目的を達成するために、第１の発明に係る翻訳学習装置は、入力された、翻訳対となる元言語文及び目的言語文のペアの集合に基づいて、前記元言語文及び前記目的言語文のペアの各々について、前記ペアの前記元言語文及び前記目的言語文の何れか一方である注目言語の言語文から、予め定められた条件を満たす固有表現部分を抽出すると共に、前記ペアの前記元言語文及び前記目的言語文の他方である対言語の言語文から、前記抽出された固有表現部分に対応する固有表現部分を抽出し、前記元言語文及び前記目的言語文のペアの各々について抽出された前記固有表現部分の対応関係に基づいて、元言語及び目的言語の間で翻訳対となる固有表現部分を格納した固有表現翻訳辞書、並びに元言語及び目的言語の間で固有表現部分を翻訳するための固有表現翻字モデルを生成する固有表現学習部と、前記元言語文及び前記目的言語文のペアの各々についての、前記抽出された固有表現部分を固有表現ラベルで置換した前記元言語文及び前記目的言語文の間の固有表現ラベル又は単語の対応付けである単語アラインメントに基づいて、前記元言語文の固有表現ラベル又は単語と前記目的言語文の固有表現ラベル又は単語の各ペアについて、前記元言語文の固有表現ラベル又は単語が、前記目的言語文の固有表現ラベル又は単語に翻訳される単語翻訳確率モデルを算出する単語翻訳確率学習部と、前記抽出された固有表現部分を固有表現ラベルで置換した前記元言語文及び前記目的言語文のペアの集合と、前記元言語文及び前記目的言語文のペアの各々についての、前記抽出された固有表現部分を固有表現ラベルで置換した前記元言語文及び前記目的言語文の間の固有表現ラベル又は単語の対応付けである単語アラインメントとに基づいて、前記元言語文を前記目的言語文に翻訳するための翻訳モデルを学習する翻訳モデル学習部と、を含んで構成されている。

また、第１の発明に係る翻訳学習装置において、前記固有表現学習部は、予め用意された固有表現ラベルに対応する固有表現の抽出精度、学習用の注目言語の言語文に対して固有表現ラベルに対応する固有表現の抽出を行った結果から予め求められた固有表現ラベルの出現頻度、学習用の前記元言語文及び前記目的言語文の何れか一方から他方へ翻訳する翻訳処理を行った結果から予め求められた固有表現ラベルに対応する固有表現の翻訳精度、及び学習用の前記元言語文及び前記目的言語文について求めた前記元言語文及び前記目的言語文の間の単語の対応付けである単語アラインメントに基づいて予め求められた固有表現ラベルに対応する固有表現のアラインメントの歪み距離の少なくとも１つ、又は組み合わせが一定基準より劣っている固有表現ラベルを除いた固有表現ラベルに対応する固有表現を、前記予め定められた条件を満たす固有表現部分として、前記注目言語の言語文から抽出してもよい。
また、第１の発明に係る翻訳学習装置において、前記固有表現学習部は、注目言語の固有表現の翻字に基づく表層類似度、注目言語及び対言語の各々で提供され、かつ、翻訳関係にある注目言語の見出し語及び対言語の見出し語の間でリンクを有する辞書における、注目言語の固有表現に対応する見出し語が有するリンク、又は予め求めた前記元言語文及び前記目的言語文の間の単語の対応付けである単語アラインメントに基づいて、前記対言語の言語文から、前記抽出された固有表現部分に対応する固有表現部分を抽出してもよい。
また、第２の発明に係る翻訳装置は、入力された翻訳対象の元言語文に含まれる固有表現部分を固有表現ラベルに置き換える固有表現置換部と、上記第１の発明に係る翻訳学習装置により生成された前記単語翻訳確率モデル及び前記翻訳モデルに基づいて、前記固有表現置換部で固有表現が前記固有表現ラベルに置き換えられた元言語文を目的言語文に翻訳するデコーディング部と、前記生成された前記固有表現翻訳辞書及び前記固有表現翻字モデルに基づいて、前記でコーディング部によって翻訳された目的言語文に含まれる前記固有表現ラベルを、目的言語の固有表現部分の文字列に変換する固有表現デコード部と、を含んで構成されている。
また、第３の発明に係る固有表現学習装置は、入力された、翻訳対となる元言語文及び目的言語文のペアの集合に基づいて、前記元言語文及び前記目的言語文のペアの各々について、予め用意された固有表現ラベルに対応する固有表現の抽出精度、学習用の注目言語の言語文に対して固有表現ラベルに対応する固有表現の抽出を行った結果から予め求められた固有表現ラベルの出現頻度、学習用の前記元言語文及び前記目的言語文の何れか一方から他方へ翻訳する翻訳処理を行った結果から予め求められた固有表現ラベルに対応する固有表現の翻訳精度、及び学習用の前記元言語文及び前記目的言語文について求めた前記元言語文及び前記目的言語文の間の単語の対応付けである単語アラインメントに基づいて予め求められた固有表現ラベルに対応する固有表現のアラインメントの歪み距離の少なくとも１つ、又は組み合わせが一定基準より劣っている固有表現ラベルを除いた固有表現ラベルに対応する固有表現を、前記予め定められた条件を満たす固有表現部分として、前記注目言語の言語文から抽出すると共に、前記ペアの前記元言語文及び前記目的言語文の他方である対言語の言語文から、前記抽出された固有表現部分に対応する固有表現部分を抽出し、前記元言語文及び前記目的言語文のペアの各々について抽出された前記固有表現部分の対応関係に基づいて、元言語及び目的言語の間で翻訳対となる固有表現部分を格納した固有表現翻訳辞書、並びに元言語及び目的言語の間で固有表現部分を翻訳するための固有表現翻字モデルを生成する固有表現学習部と、を含んで構成されている。

第１の発明に係る翻訳学習方法は、固有表現学習部、単語翻訳確率学習部、及び翻訳モデル学習部を含む学習装置における翻訳学習方法であって、前記固有表現学習部が、入力された、翻訳対となる元言語文及び目的言語文のペアの集合に基づいて、前記元言語文及び前記目的言語文のペアの各々について、前記ペアの前記元言語文及び前記目的言語文の何れか一方である注目言語の言語文から、予め定められた条件を満たす固有表現部分を抽出すると共に、前記ペアの前記元言語文及び前記目的言語文の他方である対言語の言語文から、前記抽出された固有表現部分に対応する固有表現部分を抽出し、前記元言語文及び前記目的言語文のペアの各々について抽出された前記固有表現部分の対応関係に基づいて、元言語及び目的言語の間で翻訳対となる固有表現部分を格納した固有表現翻訳辞書、並びに元言語及び目的言語の間で固有表現部分を翻訳するための固有表現翻字モデルを生成するステップと、前記単語翻訳確率学習部が、前記元言語文及び前記目的言語文のペアの各々についての、前記抽出された固有表現部分を固有表現ラベルで置換した前記元言語文及び前記目的言語文の間の固有表現ラベル又は単語の対応付けである単語アラインメントに基づいて、前記元言語文の固有表現ラベル又は単語と前記目的言語文の固有表現ラベル又は単語の各ペアについて、前記元言語文の固有表現ラベル又は単語が、前記目的言語文の固有表現ラベル又は単語に翻訳される単語翻訳確率モデルを算出するステップと、前記翻訳モデル学習部が、前記抽出された固有表現部分を固有表現ラベルで置換した前記元言語文及び前記目的言語文のペアの集合と、前記元言語文及び前記目的言語文のペアの各々についての、前記抽出された固有表現部分を固有表現ラベルで置換した前記元言語文及び前記目的言語文の間の固有表現ラベル又は単語の対応付けである単語アラインメントとに基づいて、前記元言語文を前記目的言語文に翻訳するための翻訳モデルを学習するステップと、を含んで実行することを特徴とする。
第２の発明に係る翻訳方法は、固有表現置換部、デコーディング部、及び固有表現デコード部を含む翻訳装置における翻訳方法であって、前記固有表現置換部が、入力された翻訳対象の元言語文に含まれる固有表現部分を固有表現ラベルに置き換えるステップと、前記デコーディング部が、第１の発明に係る翻訳学習方法により生成された前記単語翻訳確率モデル及び前記翻訳モデルに基づいて、前記固有表現置換部で固有表現が前記固有表現ラベルに置き換えられた元言語文を目的言語文に翻訳するステップと、前記固有表現デコード部が、前記生成された前記固有表現翻訳辞書及び前記固有表現翻字モデルに基づいて、前記でコーディング部によって翻訳された目的言語文に含まれる前記固有表現ラベルを、目的言語の固有表現部分の文字列に変換するステップと、を含んで実行することを特徴とする。
第４の発明に係るプログラムは、コンピュータを、請求項１若しくは請求項２に記載の学習装置、請求項３に記載の翻訳装置、又は請求項４に記載の固有表現学習装置の各部として機能させるためのプログラムである。

本発明の翻訳学習装置、翻訳装置、固有表現学習装置、方法、及びプログラムによれば、精度よく、固有表現を含む文を翻訳することができる、という効果が得られる。

第１の実施の形態に係る翻訳学習装置の機能的構成を示すブロック図である。第１の実施の形態に係る翻訳装置の機能的構成を示すブロック図である。第１の実施の形態に係る翻訳学習装置における学習処理ルーチンを示すフローチャートである。第１の実施の形態に係る翻訳装置における翻訳処理ルーチンを示すフローチャートである。第２の実施の形態に係る固有表現学習装置の機能的構成を示すブロック図である。

以下、図面を参照して本発明の実施の形態を詳細に説明する。

＜本発明の実施の形態に係る概要＞

まず、本発明の実施の形態における概要を説明する。

本実施の形態に係る手法は、「日本電信電話（Ｒ）の株価はいくら」という日本語から、自動的に

“How much is the stock price of NTT（Ｒ）?”

という英語へと翻訳する技術である。本実施の形態では、翻訳前の元言語が日本語、翻訳後の目的言語が英語の場合の翻訳を例として説明するが、特に言語の種類は問わない。

＜本発明の第１の実施の形態に係る翻訳学習装置の構成＞

次に、本発明の第１の実施の形態に係る翻訳学習装置の構成について説明する。図１に示すように、本発明の実施の形態に係る翻訳学習装置１００は、ＣＰＵと、ＲＡＭと、後述する翻訳学習処理ルーチンを実行するためのプログラムや各種データを記憶したＲＯＭと、を含むコンピュータで構成することが出来る。この翻訳学習装置１００は、機能的には図１に示すように入力部１０と、演算部２０とを備えている。

入力部１０は、翻訳対となる元言語文及び目的言語文のペアの集合を受け付ける。また、ラベル決定部３０の事前処理で用いる開発用データ(development data)、及びテストデータ(test data)として、元言語文及び目的言語文と同種類の、学習用の元言語文及び目的言語文を受け付ける（図示省略）。なお、学習用の元言語文及び目的言語文のデータは、翻訳対となる元言語文及び目的言語文のペアの集合とは別に用意することが望ましい。

演算部２０は、ラベル決定部３０と、固有表現学習部３２と、単語翻訳確率学習部３４と、単語アラインメント記憶部３６と、翻訳モデル学習部３８と、必要固有表現ラベル記憶部４０と、固有表現翻訳辞書４２と、固有表現翻字モデル記憶部４４と、単語翻訳確率モデル記憶部４６と、翻訳モデル記憶部４８とを含んで構成されている。

ラベル決定部３０は、元言語目的言語の何れか一方である注目言語の固有表現ラベルから、一定基準より劣っている固有表現ラベルを除いた固有表現ラベルを決定する。なお、本実施の形態では、最初に高精度な固有表現抽出を行うことから、固有表現抽出を行う言語側を注目言語と呼び、統計量に従って自動的に対となる固有表現を得る言語側を対言語と呼び、元言語が注目言語であり、目的言語が対言語となる場合について説明する。

ラベル決定部３０の具体的な処理について以下に説明する。

ラベル決定部３０は、まず事前処理として、以下の第１〜４の統計量を取得する。第１及び第２の統計量は別途、従来の翻訳モデル学習・テスト（上記非特許文献１参照）の走行が必要ないものであり、第３及び第４の統計量は、学習用の元言語文及び目的言語文を用いて、従来の翻訳モデル学習・テストの走行が必要である。なお、以下の４種類全てではなく、部分的に算出し、使用するようにしてもよい。

ラベル決定部３０は、第１の統計量として、注目言語について予め用意された固有表現ラベルに対応する固有表現の抽出精度表（図示省略）に記憶された、固有表現抽出の各ラベルの精度値を取得する。また、固有表現が階層構造を持つ場合には、各階層における精度値を持っているとする。

ラベル決定部３０は、第２の統計量として、学習用の注目言語の言語文（元言語文）に対して固有表現ラベルに対応する固有表現の抽出を行った結果から、各固有表現ラベルの出現頻度を算出する。

ラベル決定部３０は、第３の統計量として、入力部１０で受け付けた学習用の元言語文及び目的言語文の何れか一方から他方へ翻訳する翻訳処理を行った結果から、固有表現ラベルに対応する固有表現の翻訳精度を算出する。例えば、固有表現が未知語として扱われた結果、翻訳に失敗している場合の統計量のことであり、英日翻訳において、“Nippon”がそのまま“Nippon”として日本語として出力されるような場合、Countryでの誤りが１回、とカウントする。単純に誤り数としてもよいし、出現数による正規化等、従来提案されている統計量を任意に選択してよい。なお、近似値として、当該固有表現ラベルを含む文を全て集めてきた場合の翻訳精度値を用いても良い。例えば、固有表現ラベルCountryを含む文のBLEU値：15.0、固有表現ラベルBookを含む文のBLEU値：10.5、というものである。BLEU値とは、翻訳精度を自動計測するための尺度の１つである。

ラベル決定部３０は、学習用の元言語文及び目的言語文について求めた、元言語文及び目的言語文の間の単語の対応付けである単語アラインメントに基づいて、固有表現ラベルに対応する固有表現のアラインメントの平均的な歪み距離を、第４の統計量として算出する。注目言語側では連続している固有表現部分が、対言語側では分割して出現している場合、例えば、注目言語文が「NTT（Ｒ）株の価格が高騰」、対言語文が「Soaring the stock price of NTT（Ｒ）」であれば、固有表現によって抽象化することで悪影響が生じる可能性が高い。そのため、自動推定された単語アラインメント結果を用いて、任意の固有表現ラベルにおいて、注目言語側の固有表現部分が、アラインメントされる対の言語側でどの程度歪んで出現しているかを算出する。上記例の場合、「NTT（Ｒ）／株」という２単語が、“NTT（Ｒ）”、“the stock”にアラインメントされたとして、その間の単語数の２が歪距離となる。この時の統計値は両言語における単純な単語出現位置の距離（単語数）の差の和算でもよいし、従来提案されている統計量を任意に選択してよい。

次に、ラベル決定部３０は、事前処理で取得した統計量についての以下第１〜第４の閾値に基づいて、注目言語の固有表現ラベルから、一定基準より劣っている固有表現ラベルを除いた固有表現ラベルを決定する。そして、決定した固有表現ラベルを、必要固有表現ラベル記憶部４０に記憶する。

ラベル決定部３０は、第１の閾値として、上記第１の統計量の固有表現抽出精度５０％を用い、ある固有表現ラベルに対応する固有表現において、上記第１の統計量の固有表現抽出精度が５０％に満たない固有表現ラベルは除外する。また、固有表現抽出の精度が、固有表現の下位階層で低く、上位階層で高い場合には、マージして固有表現を抽出すればよい。例えば、「恒星名」「惑星名」の固有表現抽出精度が低く、上位階層の「天体名」での固有表現抽出精度が高い場合、「恒星名」「惑星名」を上位階層の「天体名」としてマージして固有表現を抽出すればよい。

また、ラベル決定部３０は、第２の閾値として、上記第２の統計量の固有表現ラベルの出現頻度の一定値を用い、上記第２の統計量の固有表現ラベルの出現頻度が一定値以下である固有表現ラベルを除外し、固有表現抽出を行わない。例えば、固有表現ラベル「星座名」出現頻度が低い場合、その固有表現ラベルは除外する。

また、ラベル決定部３０は、第３の閾値として、固有表現ラベルに対応する固有表現の翻訳誤り数の一定数を用いて、翻訳誤り数が多い固有表現ラベルを除外する。例えば、テスト用データにおいて、固有表現ラベル「恒星名」に対応する固有表現が抽出された文字列の翻訳の誤り数が一定数以上である場合には、その固有表現ラベルは除外する。

また、ラベル決定部３０は、第４の閾値として、上記第４の統計量の平均的な歪み距離２を用いて、ある固有表現ラベルにおいて、上記第４の統計量の平均的な歪み距離が２以上の場合、その固有表現ラベルは除外する。なお、上記第１〜第４の統計量について、条件の和や積をとって、各値に重みをつけた上で、全体スコアに基づいて閾値を定めるようにしてもよい。また、階層構造を持つ固有表現の場合、矛盾を生じないように決定する必要がある。例えば、親ノードと子ノードが同時に「必要」となることはあってはいけないため、必要ノードの優先順位を任意に設定する必要がある。例えば、子ノードを優先するが、上記第２の統計量の出現頻度が親ノードを採用する場合に比べ１／１０以下になる場合には、親ノードを優先する等である。また、上記第１〜第４の統計量の少なくとも１つを用いて、一定基準より劣っている固有表現ラベルを除いた固有表現ラベルを決定するようにしてもよい。

固有表現学習部３２は、入力部１０で受け付けた翻訳対となる元言語文及び目的言語文のペアの各々について、当該ペアの注目言語の言語文から、必要固有表現ラベル記憶部４０に記憶された固有表現ラベルに対応する固有表現部分を抽出すると共に、ペアの元言語文及び目的言語文の他方である対言語の言語文から、抽出された固有表現部分に対応する固有表現部分を抽出し、元言語文及び目的言語文のペアの各々について抽出された固有表現部分の対応関係に基づいて、元言語及び目的言語の間で翻訳対となる固有表現部分を格納した固有表現翻訳辞書４２、並びに元言語及び目的言語の間で固有表現部分を翻訳するための固有表現翻字モデルを生成する。

固有表現学習部３２の具体的な処理について以下に説明する。

固有表現学習部３２は、第１の処理として、注目言語の言語文から、必要固有表現ラベル記憶部４０に記憶された固有表現ラベルに対応する固有表現を抽出し、抽出された固有表現部分を、必要固有表現ラベル記憶部４０に記憶された固有表現ラベルで置換した注目言語の言語文を生成する。この際の固有表現抽出手法は任意の従来手法でよい。例えば、固有表現の置換前の注目言語文が「日本電信電話（Ｒ）の株価はいくら」であれば、固有表現の置換後は「[Company]の株価はいくら」という注目言語の言語文を生成する。

固有表現学習部３２は、第２の処理として、対言語の言語文から、第１の処理で抽出された固有表現部分に対応する固有表現部分を抽出し、抽出された固有表現部分を、必要固有表現ラベル記憶部４０に記憶された固有表現ラベルで置換した目的言語文を生成する。例えば、固有表現の置換前の対言語が“How much is the stock price of NTT（R） ?”であれば、固有表現の置換後の対言語は“How much is the stock price of [Company]?”という対言語の言語文を生成する。

固有表現学習部３２の第２の処理では、以下の第１の手法〜第３の手法を用いる。

固有表現学習部３２の第２の処理における第１の手法としては、注目言語の固有表現の翻字に基づく表層類似度を用いる。主に音的な類似性に基づいた翻字による表層類似度を用いて、第１の処理で抽出された固有表現部分に対応する固有表現部分を同定し、抽出する。翻字の手法は従来多数提案されており、任意の手法を用いてよい（非特許文献３：“Machine transliteration”Kevin Knight,Jonathan Graehl,Journal of Computational Linguistics,Volume 24 Issue 4, December 1998,Pages 599-612）。例えば、「エヌティティ（Ｒ）」⇔“NTT（Ｒ）”や「安倍」⇔“Abe”という翻字である。

固有表現学習部３２の第２の処理における第２の手法としては、注目言語及び対言語の各々で提供され、かつ、翻訳関係にある注目言語の見出し語及び対言語の見出し語の間でリンクを有する辞書における、注目言語の固有表現に対応する見出し語が有するリンクを用いる。本実施の形態では、wikipedia（登録商標）等の２言語間のリンクが存在する辞書の見出し語の他言語へのリンクが存在する場合にはそのリンク先を翻訳関係にあるとみなす。第１の処理で抽出された注目言語の固有表現部分が見出し語となっているエントリにおいて、対言語の辞書の見出し語のリンクが存在する場合、そのリンク先において対応する文字列を、対言語の辞書内から探索し、該当する文字列を、第１の処理で抽出された固有表現部分に対応する固有表現部分とする。例えば、「日本電信電話（Ｒ）（日本語）」→“NTT（Ｒ）（English）”への辞書の見出し語のリンクが存在する場合である。

固有表現学習部３２の第２の処理における第３の手法としては、予め求めた元言語文及び目的言語文の間の単語の対応付けである単語アラインメントを用いる。ラベル決定部３０と同様、学習用の元言語文及び目的言語文に基づいて計算される単語アラインメントを用いて、第１の処理で抽出された固有表現部分に対応する、対言語内の固有表現部分を同定し、抽出する。なお、ラベル決定部３０と同様、対言語においてアラインメントされた単語が離れて存在する場合、その固有表現部分は用いない、といった閾値を用いてもよい。例えば、「日本電信電話（Ｒ）」→“NTT（Ｒ）”へのアラインメントが存在する場合である。なお、上記第１〜第３の手法のいずれの場合も、完全一致以外にも、多少の表記揺れを許容するように編集距離による閾値等を用いてもよい。例えば、編集距離１以下であれば同一の固有表現部分とみなす等である。

固有表現学習部３２は、第３の処理として、元言語及び目的言語の間で翻訳対となる固有表現部分を格納した固有表現翻訳辞書４２を生成し、元言語及び目的言語の間で固有表現部分を翻訳するための固有表現翻字モデルを学習する。固有表現翻訳辞書４２は、第１の処理で抽出された固有表現部分及び第２の処理で抽出された対となる固有表現部分と、固有表現ラベルとの組み合わせの各々が記憶されたものである。上記第２の処理で得られた固有表現の対訳対や、wikipedia（登録商標）等からの対訳リンクを固有表現翻訳辞書４２として記憶する。固有表現翻字モデルは、固有表現翻訳辞書４２を用いて、新たに翻字モデルを学習したものを固有表現翻字モデルとして固有表現翻字モデル記憶部４４に記憶する。翻字モデルの学習には従来提案されている任意の手法を用いればよい（上記非特許文献３参照）。なお、固有表現翻訳辞書４２が、離れた２フレーズを扱えるようにしてもよい。例えば、翻訳対「NTT（Ｒ）株⇔the stock * NTT（Ｒ）」を格納すればよい。ただし、*はワイルドカードを表す。

単語翻訳確率学習部３４は、元言語文及び目的言語文のペアの各々について、固有表現学習部３２で抽出された固有表現部分を固有表現ラベルで置換した元言語文及び目的言語文を生成し、固有表現ラベルで置換した元言語文及び目的言語文のペアの各々について、元言語文及び目的言語文の間の固有表現ラベル又は単語の対応付けである単語アラインメントを求め、求められた単語アライメントに基づいて、元言語文の固有表現ラベル又は単語と目的言語文の固有表現ラベル又は単語の各ペアについて、元言語文の固有表現ラベル又は単語が、目的言語文の固有表現ラベル又は単語に翻訳される単語翻訳確率モデルを算出する。単語アラインメントは、置換した元言語文及び目的言語文の間の単語は、置換されていない単語と、固有表現ラベルで置換された単語を区別なくアラインメントした単語翻訳確率モデルを推定し、単語翻訳確率モデル記憶部４６に記憶する。ここで用いる手法は既存の技術を用いればよい。

翻訳モデル学習部３８は、固有表現学習部３２で抽出された固有表現部分を固有表現ラベルで置換した元言語文及び目的言語文のペアの集合と、元言語文及び目的言語文のペアの各々についての、固有表現学習部３２で抽出された固有表現部分を固有表現ラベルで置換した元言語文及び目的言語文の間の固有表現ラベル又は単語の対応付けである単語アラインメントとに基づいて、元言語文を目的言語文に翻訳するための翻訳モデルを学習し、翻訳モデル記憶部４８に記憶する。この時の学習方式は既存手法でよく、例えばフリーツールとして公開されているmoses（上記非特許文献１参照）を用いることができる。

＜本発明の第１の実施の形態に係る翻訳装置の構成＞

次に、本発明の第１の実施の形態に係る翻訳装置の構成について説明する。図２に示すように、本発明の実施の形態に係る翻訳装置２００は、ＣＰＵと、ＲＡＭと、後述する翻訳処理ルーチンを実行するためのプログラムや各種データを記憶したＲＯＭと、を含むコンピュータで構成することが出来る。この翻訳装置２００は、機能的には図２に示すように入力部２１０と、演算部２２０と、出力部２５０とを備えている。

入力部２１０は、翻訳対象の元言語文を受け付ける。

演算部２２０は、固有表現置換部２３０と、デコーディング部２３２と、固有表現デコード部２３４と、必要固有表現ラベル記憶部２４０と、固有表現翻訳辞書２４２と、固有表現翻字モデル記憶部２４４と、単語翻訳確率モデル記憶部２４６と、翻訳モデル記憶部２４８とを含んで構成されている。

必要固有表現ラベル記憶部２４０には、必要固有表現ラベル記憶部４０と同じ固有表現ラベルが記憶されている。

固有表現翻訳辞書２４２には、固有表現翻訳辞書４２と同じものが格納されている。

固有表現翻字モデル記憶部２４４には、固有表現翻字モデル記憶部４４と同じ固有表現翻字モデルが記憶されている。

単語翻訳確率モデル記憶部２４６には、単語翻訳確率モデル記憶部４６と同じ単語翻訳確率モデルが記憶されている。

翻訳モデル記憶部２４８には、翻訳モデル記憶部４８と同じ翻訳モデルが記憶されている。

固有表現置換部２３０は、必要固有表現ラベル記憶部２４０に記憶された固有表現ラベル又は固有表現翻訳辞書２４２に基づいて、入力部２１０で受け付けた翻訳対象の元言語文に含まれる固有表現部分を固有表現ラベルに置き換える。

固有表現置換部２３０において、元言語が、翻訳学習装置１００の学習における注目言語（日本語）の場合、必要固有表現ラベル記憶部２４０に記憶された固有表現ラベルを用いて、固有表現抽出を行い、抽出された固有表現部分が固有表現ラベルに置き換えられた元言語文を出力する。例えば、固有表現の置換前の元言語文が「日本電信電話（Ｒ）の株価はいくら」であれば、固有表現の置換後の元言語文は「[Company]の株価はいくら」となる。なお、元言語が、翻訳学習装置１００の学習における対言語（英語）の場合、固有表現翻訳辞書２４２を用いて固有表現部分と固有表現ラベルを抽出し、固有表現が固有表現ラベルに置き換えられた元言語文を出力する。なお、元言語が翻訳学習装置１００の学習における注目言語であっても、固有表現翻訳辞書２４２を用いて固有表現部分の固有表現ラベルへの置き換えを行ってもよい。

デコーディング部２３２は、単語翻訳確率モデル２４６及び翻訳モデル記憶部２４８に記憶された翻訳モデルに基づいて、固有表現置換部２３０で固有表現が固有表現ラベルに置き換えられた元言語文を目的言語文に翻訳する。この時の方式は既存手法でよく、例えばフリーツールとして公開されているmoses（上記非特許文献１参照）を用いることができる。

固有表現デコード部２３４は、固有表現翻訳辞書２４２及び固有表現翻字モデル記憶部２４４に記憶された固有表現翻字モデルに基づいて、デコーディング部２３２によって翻訳された目的言語文に含まれる固有表現ラベルを、目的言語の固有表現部分の文字列に変換する。ここで、固有表現デコード部２３４は、元言語の固有表現部分が固有表現翻訳辞書２４２に存在する場合は、当該固有表現部分と対訳関係にある目的言語文の固有表現に該当する文字列に置換する。一方、元言語の固有表現部分が固有表現翻訳辞書２４２に存在しない場合は、元言語固有表現部分と固有表現翻字モデル記憶部２４２に記憶された固有表現翻字モデルを元に翻訳を行う。固有表現翻字モデル記憶部２４２に記憶された固有表現翻字モデルは翻字モデルの一種であるため、従来の翻字モデルに基づく手法を使った最適化により、最適な固有表現の生成を行うことができる（上記非特許文献３参照）。

＜本発明の第１の実施の形態に係る翻訳学習装置の作用＞

次に、本発明の第１の実施の形態に係る翻訳学習装置１００の作用について説明する。入力部１０において翻訳対となる元言語文及び目的言語文のペアの集合を受け付けると、翻訳学習装置１００は、図３に示す翻訳学習処理ルーチンを実行する。

まず、ステップＳ１００では、入力部１０において受け付けた翻訳対となる元言語文及び目的言語文のペアの集合を取得する。

次に、ステップＳ１０２では、事前処理で取得した第１の統計量〜第４の統計量と、第１の統計量〜第４の統計量について予め定められた第１〜第４の閾値とに基づいて、注目言語としての元言語の固有表現ラベルから、一定基準より劣っている固有表現ラベルを除いた固有表現ラベルを決定し、必要固有表現ラベル記憶部４０に記憶する。

ステップＳ１０４では、ステップＳ１００で取得した、元言語文及び目的言語文のペアの集合に含まれる、注目言語である元言語文の各々から、必要固有表現ラベル記憶部４０に記憶された固有表現ラベルに対応する固有表現を抽出し、抽出された固有表現部分を、必要固有表現ラベル記憶部４０に記憶された固有表現ラベルで置換した注目言語の言語文を生成する。

ステップＳ１０６では、ステップＳ１００で取得した、元言語文及び目的言語文のペアの集合に含まれる、対言語である目的言語文の各々から、ステップＳ１０４で抽出された固有表現部分に対応する固有表現部分を抽出し、抽出された固有表現部分を、必要固有表現ラベル記憶部４０に記憶された固有表現ラベルで置換した目的言語文を生成する。

ステップＳ１０８では、元言語文及び目的言語文のペアの各々についてステップＳ１０４及びステップＳ１０６で抽出された固有表現部分の対応関係に基づいて、元言語及び目的言語の間で翻訳対となる固有表現部分を格納した固有表現翻訳辞書４２、並びに元言語及び目的言語の間で固有表現部分を翻訳するための固有表現翻字モデルを生成する。

ステップＳ１１０では、元言語文及び目的言語文のペアの各々について、ステップＳ１０４及びＳ１０６で抽出された固有表現部分を固有表現ラベルで置換した元言語文及び目的言語文を生成し、固有表現ラベルで置換した元言語文及び目的言語文のペアの各々について、元言語文及び目的言語文の間の固有表現ラベル又は単語の対応付けである単語アラインメントを求め、求められた単語アライメントに基づいて、元言語文の固有表現ラベル又は単語と目的言語文の固有表現ラベル又は単語の各ペアについて、元言語文の固有表現ラベル又は単語が、目的言語文の固有表現ラベル又は単語に翻訳される単語翻訳確率モデルを算出し、単語翻訳確率モデル記憶部４６に記憶する。

ステップＳ１１２では、ステップＳ１１０で得られた固有表現部分を固有表現ラベルで置換した元言語文及び目的言語文のペアの集合と、元言語文及び目的言語文のペアの各々についての、ステップＳ１１０で得られた固有表現部分を固有表現ラベルで置換した元言語文及び目的言語文の間の固有表現ラベル又は単語の対応付けである単語アラインメントとに基づいて、元言語文を目的言語文に翻訳するための翻訳モデルを学習し、翻訳モデル記憶部４８に記憶する。

以上説明したように、第１の実施の形態に係る翻訳学習装置によれば、注目言語の固有表現ラベルから、一定基準より劣っている固有表現ラベルを除いた固有表現ラベルを決定し、注目言語の言語文から、固有表現ラベルに対応する固有表現を抽出し、抽出された固有表現部分を、固有表現ラベルで置換した注目言語の言語文を生成し、対言語の言語文から、抽出された固有表現部分に対応する固有表現部分を抽出し、抽出された固有表現部分を、固有表現ラベルで置換した目的言語文を生成し、固有表現部分の対応関係に基づいて、固有表現翻訳辞書を生成し、固有表現翻字モデルを学習し、抽出された固有表現部分の対応関係に基づいて、単語翻訳確率モデルを算出し、元言語文を目的言語文に翻訳するための翻訳モデルを学習することにより、精度よく、固有表現を含む文を翻訳するための固有表現ラベル、固有表現翻訳辞書、固有表現翻字モデル、単語翻訳確率モデル、及び翻訳モデルを得ることができる。

＜本発明の第１の実施の形態に係る翻訳装置の作用＞

次に、本発明の第１の実施の形態に係る翻訳装置２００の作用について説明する。入力部２１０において翻訳対象の元言語文を受け付けると、翻訳学習装置２００は、図４に示す翻訳処理ルーチンを実行する。

まず、ステップＳ２００では、入力部１０において受け付けた翻訳対象の元言語文を取得する。

次に、ステップＳ２０２では、必要固有表現ラベル記憶部２４０に記憶された固有表現ラベル又は固有表現翻訳辞書２４２に基づいて、ステップＳ２００で取得した翻訳対象の元言語文に含まれる固有表現部分を固有表現ラベルに置き換える。

ステップＳ２０４では、単語翻訳確率モデル２４６及び翻訳モデル記憶部２４８に記憶された翻訳モデルに基づいて、ステップＳ２０２で固有表現が固有表現ラベルに置き換えられた元言語文を目的言語文に翻訳する。

ステップＳ２０６では、固有表現翻訳辞書２４２及び固有表現翻字モデル記憶部２４４に記憶された固有表現翻字モデルに基づいて、ステップＳ２０４で翻訳された目的言語文に含まれる固有表現ラベルを、目的言語の固有表現部分の文字列に変換する。

ステップＳ２０８では、ステップＳ２０６で固有表現ラベルが目的言語の固有表現部分の文字列に変換された目的言語文を出力して処理を終了する。

以上説明したように、第１の実施の形態に係る翻訳装置によれば、必要固有表現ラベル記憶部２４０に記憶された固有表現ラベル又は固有表現翻訳辞書２４２に基づいて、翻訳対象の元言語文に含まれる固有表現部分を固有表現ラベルに置き換え、単語翻訳確率モデル記憶部２４６及び翻訳モデル記憶部２４８に記憶された翻訳モデルに基づいて、固有表現ラベルに置き換えられた元言語文を目的言語文に翻訳し、固有表現翻訳辞書２４２及び固有表現翻字モデルに基づいて、固有表現ラベルを、目的言語の固有表現部分の文字列に変換することにより、精度よく、固有表現を含む文を翻訳することができる。

＜本発明の第２の実施の形態に係る固有表現学習装置の構成＞

次に、本発明の第２の実施の形態に係る固有表現学習装置の構成について説明する。なお、第１の実施の形態の翻訳学習装置１００と同様の構成となる部分については、同一符号を付して説明を省略する。

図５に示すように、本発明の実施の形態に係る固有表現学習装置３００は、ＣＰＵと、ＲＡＭと、後述する学習処理ルーチンを実行するためのプログラムや各種データを記憶したＲＯＭと、を含むコンピュータで構成することが出来る。この固有表現学習装置３００は、機能的には図５に示すように入力部１０と、演算部３２０とを備えている。

演算部３２０は、ラベル決定部３０と、固有表現学習部３２と、必要固有表現ラベル記憶部４０と、固有表現翻訳辞書４２と、固有表現翻字モデル記憶部４４とを含んで構成されている。

なお、第２の実施の形態に係る固有表現学習装置の他の構成は、第１の実施の形態の翻訳学習装置１００と同様であるため詳細な説明を省略する。

＜本発明の第２の実施の形態に係る固有表現学習装置の作用＞

次に、本発明の第２の実施の形態に係る実施の形態に係る固有表現学習装置３００の作用について説明する。入力部１０において翻訳対となる元言語文及び目的言語文のペアの集合、並びに学習用の元言語文及び目的言語文を受け付けると、固有表現学習装置３００は、上記図３に示す翻訳学習処理ルーチンと同様の処理ルーチンが実行される。ただし、ステップＳ１００〜ステップＳ１０８のみを実行し、以降のステップの処理は実行しない。

なお、第２の実施の形態に係る固有表現学習装置の他の作用については、第１の実施の形態の翻訳学習装置１００と同様の作用となるため、詳細な説明を省略する。

以上説明したように、第２の実施の形態に係る固有表現学習装置によれば、精度よく、固有表現を含む文を翻訳するための固有表現ラベル、固有表現翻訳辞書、及び固有表現翻字モデルを得ることができる。

また、本発明は、上述した実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。

１０、２１０入力部
２０、２２０、３２０演算部
３０ラベル決定部
３２固有表現学習部
３４単語翻訳確率学習部
３６単語アラインメント記憶部
３８翻訳モデル学習部
４０、２４０必要固有表現ラベル記憶部
４２、２４２固有表現翻訳辞書
４４、２４４固有表現翻字モデル記憶部
４６、２４６単語翻訳確率モデル記憶部
４８、２４８翻訳モデル記憶部
１００翻訳学習装置
２００翻訳装置
２３０固有表現置換部
２３２デコーディング部
２３４固有表現デコード部
２５０出力部
３００固有表現学習装置

Claims (7)

Hide Dependent

入力された、翻訳対となる元言語文及び目的言語文のペアの集合に基づいて、前記元言語文及び前記目的言語文のペアの各々について、前記ペアの前記元言語文及び前記目的言語文の何れか一方である注目言語の言語文から、予め定められた条件を満たす固有表現部分を抽出すると共に、前記ペアの前記元言語文及び前記目的言語文の他方である対言語の言語文から、前記抽出された固有表現部分に対応する固有表現部分を抽出し、前記元言語文及び前記目的言語文のペアの各々について抽出された前記固有表現部分の対応関係に基づいて、元言語及び目的言語の間で翻訳対となる固有表現部分を格納した固有表現翻訳辞書、並びに元言語及び目的言語の間で固有表現部分を翻訳するための固有表現翻字モデルを生成する固有表現学習部と、
前記元言語文及び前記目的言語文のペアの各々についての、前記抽出された固有表現部分を固有表現ラベルで置換した前記元言語文及び前記目的言語文の間の固有表現ラベル又は単語の対応付けである単語アラインメントに基づいて、前記元言語文の固有表現ラベル又は単語と前記目的言語文の固有表現ラベル又は単語の各ペアについて、前記元言語文の固有表現ラベル又は単語が、前記目的言語文の固有表現ラベル又は単語に翻訳される単語翻訳確率モデルを算出する単語翻訳確率学習部と、
前記抽出された固有表現部分を固有表現ラベルで置換した前記元言語文及び前記目的言語文のペアの集合と、前記元言語文及び前記目的言語文のペアの各々についての、前記抽出された固有表現部分を固有表現ラベルで置換した前記元言語文及び前記目的言語文の間の固有表現ラベル又は単語の対応付けである単語アラインメントとに基づいて、前記元言語文を前記目的言語文に翻訳するための翻訳モデルを学習する翻訳モデル学習部と、
を含む翻訳学習装置。
前記固有表現学習部は、
予め用意された固有表現ラベルに対応する固有表現の抽出精度、
学習用の注目言語の言語文に対して固有表現ラベルに対応する固有表現の抽出を行った結果から予め求められた固有表現ラベルの出現頻度、
学習用の前記元言語文及び前記目的言語文の何れか一方から他方へ翻訳する翻訳処理を行った結果から予め求められた固有表現ラベルに対応する固有表現の翻訳精度、及び
学習用の前記元言語文及び前記目的言語文について求めた前記元言語文及び前記目的言語文の間の単語の対応付けである単語アラインメントに基づいて予め求められた固有表現ラベルに対応する固有表現のアラインメントの歪み距離の少なくとも１つ、又は組み合わせが一定基準より劣っている固有表現ラベルを除いた固有表現ラベルに対応する固有表現を、
前記予め定められた条件を満たす固有表現部分として、前記注目言語の言語文から抽出する請求項１に記載の翻訳学習装置。
前記固有表現学習部は、
注目言語の固有表現の翻字に基づく表層類似度、
注目言語及び対言語の各々で提供され、かつ、翻訳関係にある注目言語の見出し語及び対言語の見出し語の間でリンクを有する辞書における、注目言語の固有表現に対応する見出し語が有するリンク、又は
予め求めた前記元言語文及び前記目的言語文の間の単語の対応付けである単語アラインメントに基づいて、前記対言語の言語文から、前記抽出された固有表現部分に対応する固有表現部分を抽出する請求項１又は２に記載の翻訳学習装置。
入力された、翻訳対となる元言語文及び目的言語文のペアの集合に基づいて、前記元言語文及び前記目的言語文のペアの各々について、
予め用意された固有表現ラベルに対応する固有表現の抽出精度、学習用の注目言語の言語文に対して固有表現ラベルに対応する固有表現の抽出を行った結果から予め求められた固有表現ラベルの出現頻度、
学習用の前記元言語文及び前記目的言語文の何れか一方から他方へ翻訳する翻訳処理を行った結果から予め求められた固有表現ラベルに対応する固有表現の翻訳精度、及び
学習用の前記元言語文及び前記目的言語文について求めた前記元言語文及び前記目的言語文の間の単語の対応付けである単語アラインメントに基づいて予め求められた固有表現ラベルに対応する固有表現のアラインメントの歪み距離の少なくとも１つ、又は組み合わせが一定基準より劣っている固有表現ラベルを除いた固有表現ラベルに対応する固有表現を、前記予め定められた条件を満たす固有表現部分として、前記注目言語の言語文から抽出すると共に、
前記ペアの前記元言語文及び前記目的言語文の他方である対言語の言語文から、前記抽出された固有表現部分に対応する固有表現部分を抽出し、
前記元言語文及び前記目的言語文のペアの各々について抽出された前記固有表現部分の対応関係に基づいて、元言語及び目的言語の間で翻訳対となる固有表現部分を格納した固有表現翻訳辞書、並びに元言語及び目的言語の間で固有表現部分を翻訳するための固有表現翻字モデルを生成する固有表現学習部と、
を含む固有表現学習装置。
固有表現学習部、単語翻訳確率学習部、及び翻訳モデル学習部を含む学習装置における翻訳学習方法であって、
前記固有表現学習部が、入力された、翻訳対となる元言語文及び目的言語文のペアの集合に基づいて、前記元言語文及び前記目的言語文のペアの各々について、前記ペアの前記元言語文及び前記目的言語文の何れか一方である注目言語の言語文から、予め定められた条件を満たす固有表現部分を抽出すると共に、前記ペアの前記元言語文及び前記目的言語文の他方である対言語の言語文から、前記抽出された固有表現部分に対応する固有表現部分を抽出し、前記元言語文及び前記目的言語文のペアの各々について抽出された前記固有表現部分の対応関係に基づいて、元言語及び目的言語の間で翻訳対となる固有表現部分を格納した固有表現翻訳辞書、並びに元言語及び目的言語の間で固有表現部分を翻訳するための固有表現翻字モデルを生成するステップと、
前記単語翻訳確率学習部が、前記元言語文及び前記目的言語文のペアの各々についての、前記抽出された固有表現部分を固有表現ラベルで置換した前記元言語文及び前記目的言語文の間の固有表現ラベル又は単語の対応付けである単語アラインメントに基づいて、前記元言語文の固有表現ラベル又は単語と前記目的言語文の固有表現ラベル又は単語の各ペアについて、前記元言語文の固有表現ラベル又は単語が、前記目的言語文の固有表現ラベル又は単語に翻訳される単語翻訳確率モデルを算出するステップと、
前記翻訳モデル学習部が、前記抽出された固有表現部分を固有表現ラベルで置換した前記元言語文及び前記目的言語文のペアの集合と、前記元言語文及び前記目的言語文のペアの各々についての、前記抽出された固有表現部分を固有表現ラベルで置換した前記元言語文及び前記目的言語文の間の固有表現ラベル又は単語の対応付けである単語アラインメントとに基づいて、前記元言語文を前記目的言語文に翻訳するための翻訳モデルを学習するステップと、
を含む翻訳学習方法。
コンピュータを、請求項１〜請求項３のいずれか１項に記載の翻訳学習装置の各部として機能させるためのプログラム。
コンピュータを、請求項４に記載の固有表現学習装置の各部として機能させるためのプログラム。

Patent Citations (1)

Publication number Priority date Publication date Assignee Title

Family To Family Citations

CN102084417B

* 2008-04-15 2014-05-21 飞书博公司现场维护语音到语音翻译的系统和方法

* Cited by examiner, † Cited by third party

Cited By (5)

Publication number Priority date Publication date Assignee Title

Family To Family Citations

US10713593B2

* 2016-11-04 2020-07-14 Google Llc Implicit bridging of machine learning tasks

JP7287062B2

* 2019-03-29 2023-06-06 富士通株式会社翻訳方法、翻訳プログラム及び学習方法

CN111368531B

* 2020-03-09 2023-04-14 腾讯科技（深圳）有限公司翻译文本处理方法、装置、计算机设备和存储介质

CN112149423B

* 2020-10-16 2024-01-26 中国农业科学院农业信息研究所一种面向领域实体关系联合抽取的语料标注方法及系统

CN112257462A

* 2020-11-03 2021-01-22 沈阳雅译网络技术有限公司一种基于神经机器翻译技术的超文本标记语言翻译方法

* Cited by examiner, † Cited by third party, ‡ Family to family citation

Priority And Related Applications

Priority Applications (1)

Application Priority date Filing date Title

JP2014233928A

2014-11-18 2014-11-18 翻訳学習装置、固有表現学習装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Filing date Title

JP2014233928A

2014-11-18 翻訳学習装置、固有表現学習装置、方法、及びプログラム

Legal Events

Date Code Title Description

2016-12-09 A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161209

2017-09-11 A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170911

2017-09-19 A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170919

2017-11-17 A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171117

2017-11-27 TRDD Decision of grant or rejection written

2017-12-05 A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171205

2017-12-21 A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171213

2017-12-22 R150 Certificate of patent or registration of utility model

Ref document number: 6262122

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Data provided by IFI CLAIMS Patent Services