Patents
Search within the title, abstract, claims, or full patent document: You can restrict your search to a specific field using field names.
Use TI= to search in the title, AB= for the abstract, CL= for the claims, or TAC= for all three. For example, TI=(safety belt).
Search by Cooperative Patent Classifications (CPCs): These are commonly used to represent ideas in place of keywords, and can also be entered in a search term box. If you're searching forseat belts, you could also search for B60R22/00 to retrieve documents that mention safety belts or body harnesses. CPC=B60R22 will match documents with exactly this CPC, CPC=B60R22/low matches documents with this CPC or a child classification of this CPC.
Learn MoreKeywords and boolean syntax (USPTO or EPO format): seat belt searches these two words, or their plurals and close synonyms. "seat belt" searches this exact phrase, in order. -seat -belt searches for documents not containing either word.
For searches using boolean logic, the default operator is AND with left associativity. Note: this means safety OR seat belt is searched as (safety OR seat) AND belt. Each word automatically includes plurals and close synonyms. Adjacent words that are implicitly ANDed together, such as (safety belt), are treated as a phrase when generating synonyms.
Learn MoreChemistry searches match terms (trade names, IUPAC names, etc. extracted from the entire document, and processed from .MOL files.)
Substructure (use SSS=) and similarity (use ~) searches are limited to one per search at the top-level AND condition. Exact searches can be used multiple times throughout the search query.
Searching by SMILES or InChi key requires no special syntax. To search by SMARTS, use SMARTS=.
To search for multiple molecules, select "Batch" in the "Type" menu. Enter multiple molecules separated by whitespace or by comma.
Learn MoreSearch specific patents by importing a CSV or list of patent publication or application numbers.
翻訳学習装置、固有表現学習装置、方法、及びプログラム
JP6262122B2
Japan
- Other languages
English - Inventor
九月 貞光 九月 貞光 松尾 義博 義博 松尾 久子 浅野 久子 浅野 いつみ 斉藤 いつみ 斉藤 - Current Assignee
- Nippon Telegraph and Telephone Corp
Description
translated from
また、第1の発明に係る翻訳学習装置において、前記固有表現学習部は、注目言語の固有表現の翻字に基づく表層類似度、注目言語及び対言語の各々で提供され、かつ、翻訳関係にある注目言語の見出し語及び対言語の見出し語の間でリンクを有する辞書における、注目言語の固有表現に対応する見出し語が有するリンク、又は予め求めた前記元言語文及び前記目的言語文の間の単語の対応付けである単語アラインメントに基づいて、前記対言語の言語文から、前記抽出された固有表現部分に対応する固有表現部分を抽出してもよい。
また、第2の発明に係る翻訳装置は、入力された翻訳対象の元言語文に含まれる固有表現部分を固有表現ラベルに置き換える固有表現置換部と、上記第1の発明に係る翻訳学習装置により生成された前記単語翻訳確率モデル及び前記翻訳モデルに基づいて、前記固有表現置換部で固有表現が前記固有表現ラベルに置き換えられた元言語文を目的言語文に翻訳するデコーディング部と、前記生成された前記固有表現翻訳辞書及び前記固有表現翻字モデルに基づいて、前記でコーディング部によって翻訳された目的言語文に含まれる前記固有表現ラベルを、目的言語の固有表現部分の文字列に変換する固有表現デコード部と、を含んで構成されている。
また、第3の発明に係る固有表現学習装置は、入力された、翻訳対となる元言語文及び目的言語文のペアの集合に基づいて、前記元言語文及び前記目的言語文のペアの各々について、予め用意された固有表現ラベルに対応する固有表現の抽出精度、学習用の注目言語の言語文に対して固有表現ラベルに対応する固有表現の抽出を行った結果から予め求められた固有表現ラベルの出現頻度、学習用の前記元言語文及び前記目的言語文の何れか一方から他方へ翻訳する翻訳処理を行った結果から予め求められた固有表現ラベルに対応する固有表現の翻訳精度、及び学習用の前記元言語文及び前記目的言語文について求めた前記元言語文及び前記目的言語文の間の単語の対応付けである単語アラインメントに基づいて予め求められた固有表現ラベルに対応する固有表現のアラインメントの歪み距離の少なくとも1つ、又は組み合わせが一定基準より劣っている固有表現ラベルを除いた固有表現ラベルに対応する固有表現を、前記予め定められた条件を満たす固有表現部分として、前記注目言語の言語文から抽出すると共に、前記ペアの前記元言語文及び前記目的言語文の他方である対言語の言語文から、前記抽出された固有表現部分に対応する固有表現部分を抽出し、前記元言語文及び前記目的言語文のペアの各々について抽出された前記固有表現部分の対応関係に基づいて、元言語及び目的言語の間で翻訳対となる固有表現部分を格納した固有表現翻訳辞書、並びに元言語及び目的言語の間で固有表現部分を翻訳するための固有表現翻字モデルを生成する固有表現学習部と、を含んで構成されている。
第2の発明に係る翻訳方法は、固有表現置換部、デコーディング部、及び固有表現デコード部を含む翻訳装置における翻訳方法であって、前記固有表現置換部が、入力された翻訳対象の元言語文に含まれる固有表現部分を固有表現ラベルに置き換えるステップと、前記デコーディング部が、第1の発明に係る翻訳学習方法により生成された前記単語翻訳確率モデル及び前記翻訳モデルに基づいて、前記固有表現置換部で固有表現が前記固有表現ラベルに置き換えられた元言語文を目的言語文に翻訳するステップと、前記固有表現デコード部が、前記生成された前記固有表現翻訳辞書及び前記固有表現翻字モデルに基づいて、前記でコーディング部によって翻訳された目的言語文に含まれる前記固有表現ラベルを、目的言語の固有表現部分の文字列に変換するステップと、を含んで実行することを特徴とする。
第4の発明に係るプログラムは、コンピュータを、請求項1若しくは請求項2に記載の学習装置、請求項3に記載の翻訳装置、又は請求項4に記載の固有表現学習装置の各部として機能させるためのプログラムである。
20、220、320 演算部
30 ラベル決定部
32 固有表現学習部
34 単語翻訳確率学習部
36 単語アラインメント記憶部
38 翻訳モデル学習部
40、240 必要固有表現ラベル記憶部
42、242 固有表現翻訳辞書
44、244 固有表現翻字モデル記憶部
46、246 単語翻訳確率モデル記憶部
48、248 翻訳モデル記憶部
100 翻訳学習装置
200 翻訳装置
230 固有表現置換部
232 デコーディング部
234 固有表現デコード部
250 出力部
300 固有表現学習装置
Claims (7)
Hide Dependent
translated from
- 入力された、翻訳対となる元言語文及び目的言語文のペアの集合に基づいて、前記元言語文及び前記目的言語文のペアの各々について、前記ペアの前記元言語文及び前記目的言語文の何れか一方である注目言語の言語文から、予め定められた条件を満たす固有表現部分を抽出すると共に、前記ペアの前記元言語文及び前記目的言語文の他方である対言語の言語文から、前記抽出された固有表現部分に対応する固有表現部分を抽出し、前記元言語文及び前記目的言語文のペアの各々について抽出された前記固有表現部分の対応関係に基づいて、元言語及び目的言語の間で翻訳対となる固有表現部分を格納した固有表現翻訳辞書、並びに元言語及び目的言語の間で固有表現部分を翻訳するための固有表現翻字モデルを生成する固有表現学習部と、
前記元言語文及び前記目的言語文のペアの各々についての、前記抽出された固有表現部分を固有表現ラベルで置換した前記元言語文及び前記目的言語文の間の固有表現ラベル又は単語の対応付けである単語アラインメントに基づいて、前記元言語文の固有表現ラベル又は単語と前記目的言語文の固有表現ラベル又は単語の各ペアについて、前記元言語文の固有表現ラベル又は単語が、前記目的言語文の固有表現ラベル又は単語に翻訳される単語翻訳確率モデルを算出する単語翻訳確率学習部と、
前記抽出された固有表現部分を固有表現ラベルで置換した前記元言語文及び前記目的言語文のペアの集合と、前記元言語文及び前記目的言語文のペアの各々についての、前記抽出された固有表現部分を固有表現ラベルで置換した前記元言語文及び前記目的言語文の間の固有表現ラベル又は単語の対応付けである単語アラインメントとに基づいて、前記元言語文を前記目的言語文に翻訳するための翻訳モデルを学習する翻訳モデル学習部と、
を含む翻訳学習装置。 - 前記固有表現学習部は、
予め用意された固有表現ラベルに対応する固有表現の抽出精度、
学習用の注目言語の言語文に対して固有表現ラベルに対応する固有表現の抽出を行った結果から予め求められた固有表現ラベルの出現頻度、
学習用の前記元言語文及び前記目的言語文の何れか一方から他方へ翻訳する翻訳処理を行った結果から予め求められた固有表現ラベルに対応する固有表現の翻訳精度、及び
学習用の前記元言語文及び前記目的言語文について求めた前記元言語文及び前記目的言語文の間の単語の対応付けである単語アラインメントに基づいて予め求められた固有表現ラベルに対応する固有表現のアラインメントの歪み距離の少なくとも1つ、又は組み合わせが一定基準より劣っている固有表現ラベルを除いた固有表現ラベルに対応する固有表現を、
前記予め定められた条件を満たす固有表現部分として、前記注目言語の言語文から抽出する請求項1に記載の翻訳学習装置。 - 前記固有表現学習部は、
注目言語の固有表現の翻字に基づく表層類似度、
注目言語及び対言語の各々で提供され、かつ、翻訳関係にある注目言語の見出し語及び対言語の見出し語の間でリンクを有する辞書における、注目言語の固有表現に対応する見出し語が有するリンク、又は
予め求めた前記元言語文及び前記目的言語文の間の単語の対応付けである単語アラインメントに基づいて、前記対言語の言語文から、前記抽出された固有表現部分に対応する固有表現部分を抽出する請求項1又は2に記載の翻訳学習装置。 - 入力された、翻訳対となる元言語文及び目的言語文のペアの集合に基づいて、前記元言語文及び前記目的言語文のペアの各々について、
予め用意された固有表現ラベルに対応する固有表現の抽出精度、学習用の注目言語の言語文に対して固有表現ラベルに対応する固有表現の抽出を行った結果から予め求められた固有表現ラベルの出現頻度、
学習用の前記元言語文及び前記目的言語文の何れか一方から他方へ翻訳する翻訳処理を行った結果から予め求められた固有表現ラベルに対応する固有表現の翻訳精度、及び
学習用の前記元言語文及び前記目的言語文について求めた前記元言語文及び前記目的言語文の間の単語の対応付けである単語アラインメントに基づいて予め求められた固有表現ラベルに対応する固有表現のアラインメントの歪み距離の少なくとも1つ、又は組み合わせが一定基準より劣っている固有表現ラベルを除いた固有表現ラベルに対応する固有表現を、前記予め定められた条件を満たす固有表現部分として、前記注目言語の言語文から抽出すると共に、
前記ペアの前記元言語文及び前記目的言語文の他方である対言語の言語文から、前記抽出された固有表現部分に対応する固有表現部分を抽出し、
前記元言語文及び前記目的言語文のペアの各々について抽出された前記固有表現部分の対応関係に基づいて、元言語及び目的言語の間で翻訳対となる固有表現部分を格納した固有表現翻訳辞書、並びに元言語及び目的言語の間で固有表現部分を翻訳するための固有表現翻字モデルを生成する固有表現学習部と、
を含む固有表現学習装置。 - 固有表現学習部、単語翻訳確率学習部、及び翻訳モデル学習部を含む学習装置における翻訳学習方法であって、
前記固有表現学習部が、入力された、翻訳対となる元言語文及び目的言語文のペアの集合に基づいて、前記元言語文及び前記目的言語文のペアの各々について、前記ペアの前記元言語文及び前記目的言語文の何れか一方である注目言語の言語文から、予め定められた条件を満たす固有表現部分を抽出すると共に、前記ペアの前記元言語文及び前記目的言語文の他方である対言語の言語文から、前記抽出された固有表現部分に対応する固有表現部分を抽出し、前記元言語文及び前記目的言語文のペアの各々について抽出された前記固有表現部分の対応関係に基づいて、元言語及び目的言語の間で翻訳対となる固有表現部分を格納した固有表現翻訳辞書、並びに元言語及び目的言語の間で固有表現部分を翻訳するための固有表現翻字モデルを生成するステップと、
前記単語翻訳確率学習部が、前記元言語文及び前記目的言語文のペアの各々についての、前記抽出された固有表現部分を固有表現ラベルで置換した前記元言語文及び前記目的言語文の間の固有表現ラベル又は単語の対応付けである単語アラインメントに基づいて、前記元言語文の固有表現ラベル又は単語と前記目的言語文の固有表現ラベル又は単語の各ペアについて、前記元言語文の固有表現ラベル又は単語が、前記目的言語文の固有表現ラベル又は単語に翻訳される単語翻訳確率モデルを算出するステップと、
前記翻訳モデル学習部が、前記抽出された固有表現部分を固有表現ラベルで置換した前記元言語文及び前記目的言語文のペアの集合と、前記元言語文及び前記目的言語文のペアの各々についての、前記抽出された固有表現部分を固有表現ラベルで置換した前記元言語文及び前記目的言語文の間の固有表現ラベル又は単語の対応付けである単語アラインメントとに基づいて、前記元言語文を前記目的言語文に翻訳するための翻訳モデルを学習するステップと、
を含む翻訳学習方法。 - コンピュータを、請求項1〜請求項3のいずれか1項に記載の翻訳学習装置の各部として機能させるためのプログラム。
- コンピュータを、請求項4に記載の固有表現学習装置の各部として機能させるためのプログラム。