JP5194920B2 - 例文集合ベース翻訳装置、方法およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置 - Google Patents
例文集合ベース翻訳装置、方法およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置 Download PDFInfo
- Publication number
- JP5194920B2 JP5194920B2 JP2008076497A JP2008076497A JP5194920B2 JP 5194920 B2 JP5194920 B2 JP 5194920B2 JP 2008076497 A JP2008076497 A JP 2008076497A JP 2008076497 A JP2008076497 A JP 2008076497A JP 5194920 B2 JP5194920 B2 JP 5194920B2
- Authority
- JP
- Japan
- Prior art keywords
- translation
- example sentence
- phrase
- language
- appearances
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
(2)x >= θ1 かつ x - y > θ2 の場合、T1を訳文として出力する
(3)x >= θ1 かつ x / y > θ3の場合、T1を訳文として出力する
但し、θ1、θ2、θ3は非負の実数である。
14:翻訳メモリ装置 16:例文パターンベース翻訳装置
18:単語直訳翻訳装置 20:目的言語テキスト出力部
22:翻訳不適切文自動回収部 24:学習装置
26c:例文パターン対訳辞書 26a:単語対訳辞書
26b:例文対訳辞書 26:形態素解析部
26:翻訳辞書 28:写像変換部
30:例文パターン対訳辞書 32:句翻訳部
34:訳文生成部 40:句翻訳装置
42:入力部 44:辞書ベース翻訳部
46:例文完全マッチング翻訳部 48:形態素解析部
50:単語アライメント例文ベース翻訳部 52:例文集合ベース翻訳部
54:例文ベース翻訳部 56:ルールベース翻訳部
58:出力部 60:単語/句対訳辞書
62:例文対訳辞書 64:単語アライメント対訳辞書
66:例文対訳辞書 1102:例文対訳ペア選択部
1104:句ペア抽出部 1106:支持度算出部
1108:訳文選択部 1700:入力装置
1702:表示装置 1704:主記憶装置
1706:記憶装置 1708:中央処理装置(CPU)
1710:バス
Claims (8)
- 第1言語の例文とその対訳である第2言語の対訳例文を例文対訳組として多数記憶する例文対訳辞書と、
第1言語の句を入力する手段と、
前記例文対訳辞書から前記入力された句を含む複数の例文対訳組を選択する手段と、
前記複数の例文対訳組において、第1言語による例文相互間の共通部分を抽出するとともに第2言語による訳文相互間の共通部分の組をそれぞれ抽出する手段と、
前記抽出した複数の共通部分の組の、前記入力された句に対する支持度合を算出する算出手段であって、当該算出手段は、第1言語による例文間の共通部分が、入力された句に対して完全一致する場合には、対応訳文の共通部分を強支持の訳文候補とし、かつ第1言語による例文間の共通部分が入力された句を完全一致ではなく包含する場合には、対応訳文の共通部分を前記強支持とは支持度合が異なる弱支持の訳文候補とし、前記選択された複数の例文対訳組間において前記訳文候補の強支持および弱支持の出現回数を加算することにより前記支持度合を算出する、前記算出手段と、
前記算出手段で算出された支持度合に基づいて選択された訳文候補を、前記入力された句に対する第2言語の訳文として出力する出力手段と、
を備えた例文集合ベース翻訳装置。 - 前記出力手段は、最も出現回数が多い訳文候補の該出現回数が第1の閾値を超える場合、または、該出現回数が第1の閾値以下、かつ該出現回数と次に出現回数の多い訳文候補の該出現回数との差が第2の閾値を超える場合、または、該出現回数が第1の閾値以下、かつ該出現回数と次に出現回数の多い訳文候補の該出現回数との比が第3の閾値を超える場合の何れかの場合に、該最も出現回数が多い訳文候補を、前記入力された句に対する第2言語の訳文として出力する、請求項1に記載の例文集合ベース翻訳装置。
- 請求項1または2に記載の例文集合ベース翻訳装置を含み、複数の翻訳手法に基づく翻訳部を多段に構成した句翻訳装置。
- 前記句翻訳装置が、辞書ベース翻訳方式による辞書ベース翻訳部と、例文完全マッチング翻訳方式による例文完全マッチング翻訳部と、単語アライメント例文ベース翻訳方式による単語アライメント例文ベース翻訳部と、請求項1、2、3または4に記載の例文集合ベース翻訳装置からなる例文集合ベース翻訳部と、例文ベース翻訳方式による例文ベース翻訳部と、ルールベース翻訳方式によるルールベース翻訳部とを備え、
入力された句が、順次これらの翻訳部に段階的に入力されるよう構成された請求項3に記載の句翻訳装置。 - 第1言語の例文とその対訳である第2言語の対訳例文を例文対訳組として多数記憶する例文対訳辞書を利用した例文集合ベース翻訳装置における翻訳方法であって、
第1言語の句を入力するステップと、
前記例文対訳辞書から前記入力された句を含む複数の例文対訳組を選択するステップと、
前記複数の例文対訳組において、第1言語による例文相互間の共通部分を抽出するとともに第2言語による訳文相互間の共通部分の組をそれぞれ抽出するステップと、
前記抽出した複数の共通部分の組の、前記入力された句に対する支持度合を算出するステップであって、当該算出するステップは、第1言語による例文間の共通部分が、入力された句に対して完全一致する場合には、対応訳文の共通部分を強支持の訳文候補とし、かつ第1言語による例文間の共通部分が入力された句を完全一致ではなく包含する場合には、対応訳文の共通部分を前記強支持とは支持度合が異なる弱支持の訳文候補とし、前記選択された複数の例文対訳組間において前記訳文候補の強支持および弱支持の出現回数を加算することにより前記支持度合を算出する、前記算出するステップと、
前記算出された支持度合に基づいて選択された訳文候補を、前記入力された句に対する第2言語の訳文として出力するステップと、
を備えた例文集合ベース翻訳方法。 - 前記出力するステップは、最も出現回数が多い訳文候補の該出現回数が第1の閾値を超える場合、または、該出現回数が第1の閾値以下、かつ該出現回数と次に出現回数の多い訳文候補の該出現回数との差が第2の閾値を超える場合、または、該出現回数が第1の閾値以下、かつ該出現回数と次に出現回数の多い訳文候補の該出現回数との比が第3の閾値を超える場合の何れかの場合に、該最も出現回数が多い訳文候補を、前記入力された句に対する第2言語の訳文として出力する、請求項5に記載の例文集合ベース翻訳方法。
- 第1言語の例文とその対訳である第2言語の対訳例文を例文対訳組として多数記憶する例文対訳辞書を利用した例文集合ベース翻訳プログラムであって、
第1言語の句を入力するステップと、
前記例文対訳辞書から前記入力された句を含む複数の例文対訳組を選択するステップと、
前記複数の例文対訳組において、第1言語による例文相互間の共通部分を抽出するとともに第2言語による訳文相互間の共通部分の組をそれぞれ抽出するステップと、
前記抽出した複数の共通部分の組の、前記入力された句に対する支持度合を算出するステップであって、当該算出するステップは、第1言語による例文間の共通部分が、入力された句に対して完全一致する場合には、対応訳文の共通部分を強支持の訳文候補とし、かつ第1言語による例文間の共通部分が入力された句を完全一致ではなく包含する場合には、対応訳文の共通部分を前記強支持とは支持度合が異なる弱支持の訳文候補とし、前記選択された複数の例文対訳組間において前記訳文候補の強支持および弱支持の出現回数を加算することにより前記支持度合を算出する、前記算出するステップと、
前記算出された支持度合に基づいて選択された訳文候補を、前記入力された句に対する第2言語の訳文として出力するステップと、
を備えた例文集合ベース翻訳プログラム。 - 前記出力するステップは、最も出現回数が多い訳文候補の該出現回数が第1の閾値を超える場合、または、該出現回数が第1の閾値以下、かつ該出現回数と次に出現回数の多い訳文候補の該出現回数との差が第2の閾値を超える場合、または、該出現回数が第1の閾値以下、かつ該出現回数と次に出現回数の多い訳文候補の該出現回数との比が第3の閾値を超える場合の何れかの場合に、該最も出現回数が多い訳文候補を、前記入力された句に対する第2言語の訳文として出力する、請求項7に記載の例文集合ベース翻訳プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008076497A JP5194920B2 (ja) | 2008-03-24 | 2008-03-24 | 例文集合ベース翻訳装置、方法およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置 |
CN 200810183795 CN101546304B (zh) | 2008-03-24 | 2008-12-18 | 基于例句集合的翻译装置、方法以及短语翻译装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008076497A JP5194920B2 (ja) | 2008-03-24 | 2008-03-24 | 例文集合ベース翻訳装置、方法およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009230561A JP2009230561A (ja) | 2009-10-08 |
JP5194920B2 true JP5194920B2 (ja) | 2013-05-08 |
Family
ID=41193446
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008076497A Active JP5194920B2 (ja) | 2008-03-24 | 2008-03-24 | 例文集合ベース翻訳装置、方法およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5194920B2 (ja) |
CN (1) | CN101546304B (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102467498A (zh) * | 2010-11-18 | 2012-05-23 | 阿里巴巴集团控股有限公司 | 翻译方法及装置 |
JP2014075073A (ja) | 2012-10-05 | 2014-04-24 | Fuji Xerox Co Ltd | 翻訳処理装置及びプログラム |
CN109190099B (zh) * | 2018-08-23 | 2022-12-13 | 上海互教教育科技有限公司 | 句模提取方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3437782B2 (ja) * | 1999-03-12 | 2003-08-18 | 日本電信電話株式会社 | 機械翻訳方法及びその装置並びに機械翻訳プログラムを記憶した媒体 |
JP2008065395A (ja) * | 2006-09-04 | 2008-03-21 | Fuji Xerox Co Ltd | 翻訳装置、翻訳方法および翻訳プログラム |
-
2008
- 2008-03-24 JP JP2008076497A patent/JP5194920B2/ja active Active
- 2008-12-18 CN CN 200810183795 patent/CN101546304B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN101546304B (zh) | 2013-02-06 |
CN101546304A (zh) | 2009-09-30 |
JP2009230561A (ja) | 2009-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Munteanu et al. | Improving machine translation performance by exploiting non-parallel corpora | |
Snyder et al. | Unsupervised multilingual learning for morphological segmentation | |
JP4961755B2 (ja) | 単語アライメント装置、単語アライメント方法、単語アライメントプログラム | |
JP4404211B2 (ja) | マルチリンガル翻訳メモリ、翻訳方法および翻訳プログラム | |
CN110866399B (zh) | 一种基于增强字符向量的中文短文本实体识别与消歧方法 | |
CN105068997B (zh) | 平行语料的构建方法及装置 | |
JP2002215619A (ja) | 翻訳文書からの翻訳文抽出方法 | |
JP5710581B2 (ja) | 質問応答装置、方法、及びプログラム | |
JPS6211932A (ja) | 情報検索方法 | |
Zhikov et al. | An efficient algorithm for unsupervised word segmentation with branching entropy and MDL | |
Uthayamoorthy et al. | Ddspell-a data driven spell checker and suggestion generator for the tamil language | |
JP5194920B2 (ja) | 例文集合ベース翻訳装置、方法およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置 | |
JP5298834B2 (ja) | 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置 | |
Bakari et al. | Logic-based approach for improving Arabic question answering | |
JP2018072979A (ja) | 対訳文抽出装置、対訳文抽出方法およびプログラム | |
US20110106849A1 (en) | New case generation device, new case generation method, and new case generation program | |
JP5439776B2 (ja) | 単語アライメント装置及び単語アライメントプログラム | |
JP2009289219A (ja) | 翻訳メモリ翻訳装置および翻訳プログラム | |
Torunoglu-Selamet et al. | Exploring spelling correction approaches for turkish | |
Venkatapathy et al. | Discriminative machine translation using global lexical selection | |
Janarthanam et al. | Named entity transliteration for cross-language information retrieval using compressed word format mapping algorithm | |
Fawi et al. | Italian-Arabic domain terminology extraction from parallel corpora | |
Stehouwer | Statistical language models for alternative sequence selection | |
Xu et al. | Partitioning parallel documents using binary segmentation | |
Bircher | Toulouse and Cahors are French Cities, but Ti* louse and Caa. Qrs as well |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110223 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121009 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121206 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130108 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130121 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160215 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5194920 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |