JP2010152420A - 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置 - Google Patents
例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置 Download PDFInfo
- Publication number
- JP2010152420A JP2010152420A JP2008326704A JP2008326704A JP2010152420A JP 2010152420 A JP2010152420 A JP 2010152420A JP 2008326704 A JP2008326704 A JP 2008326704A JP 2008326704 A JP2008326704 A JP 2008326704A JP 2010152420 A JP2010152420 A JP 2010152420A
- Authority
- JP
- Japan
- Prior art keywords
- translation
- example sentence
- language
- phrase
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】 句翻訳装置は、辞書ベース翻訳部、例文マッチング翻訳部、単語アライメント例文ベース翻訳部、例文集合ベース翻訳部、例文ベース翻訳部、ルールベース翻訳部を備え、入力された句が、順次これらの翻訳部に段階的に入力されるよう構成される。例文マッチング翻訳部では、例文対訳辞書から、入力句を含む複数の例文対訳組が取り出され保持部に保持される。保持された例文対訳組に対応する例文パターン対訳組を例文パターン検索部が例文パターン対訳辞書から検索する。例文マッチング部が例文対訳組と例文パターン対訳組間での第1言語の例文と例文パターン間、および第2言語の例文と例文パターン間のマッチグを行い、これらのマッチグ結果に基づいて、訳文抽出部が入力句の訳文を抽出する。
【選択図】 図4
Description
第1のステップで保持された例文対訳組の第1言語の例文と第2のステップで検索された例文パターン対訳組の第1言語の例文パターン間、および当該例文対訳組での第2言語の例文と当該例文パターン対訳組での第2言語の例文パターン間のマッチングを行う第3のステップと、第3のステップのマッチング結果に基づいて入力句の訳文を抽出する第4のステップと、を備えたものである。
(2)x >= θ1 かつ x - y > θ2 の場合、T1を訳文として出力する
(3)x >= θ1 かつ x / y > θ3の場合、T1を訳文として出力する
但し、θ1、θ2、θ3は非負の実数である。
(ステップS1206)。また、訳文候補が所定の基準を満たさない場合は、本翻訳部における訳文は得られなかったとして、入力された句を次段の翻訳部に出力する。
F2(T1,T2) = { (1:1),(2:3),(3:4,5),(5:6),(4:0),(0:2) }
について説明する。対応関係情報 F2(T1,T2) は、例文パターンT1で1番目に使用される文字列 a1 の表す意味が例文パターンT2で1番目に使用される文字列 b1 の意味と同じであり、これらは対応する。同様に、例文パターンT1で2番目に使用される文字列 a2 の表す意味が例文パターンT2で3番目に使用される文字列 b3 の意味と同じであり、例文パターンT1で3番目に使用される文字列 a3 の表す意味が例文パターンT2で4番目及び5番目に使用される文字列 b4 及び b5 の意味と同じであり、例文パターンT1で5番目に使用される文字列 a5 の表す意味が例文パターンT2で6番目に使用される文字列 b6 の意味と同じであり、それぞれ対応する。さらに例文パターンT1で4番目に使用されるa4 と同じ意味を表す文字列が例文パターンT2で使用されず、かつ例文パターンT2で2番目に使用される文字列 b2 と同じ意味を表す文字列が例文パターンT1で使用されないという対応関係を表す。対応関係さえ表現できれば、どのような表現でもよく、本発明に係る翻訳装置等は、以上述べた表現に限定されない。
即ち、F1set(S’)= F1set(S’)+F1set(S’,A)
即ち、F1set(S’,A)=F1set(S’,A)-F1i(S’,A)
14:翻訳メモリ装置 16:例文パターンベース翻訳装置
18:単語直訳翻訳装置 20:目的言語テキスト出力部
22:翻訳不適切文自動回収部 24:学習装置
26c:例文パターン対訳辞書 26a:単語対訳辞書
26b:例文対訳辞書 26:形態素解析部
26:翻訳辞書 28:写像変換部
30:例文パターン対訳辞書 32:句翻訳部
34:訳文生成部 40:句翻訳装置
42:入力部 44:辞書ベース翻訳部
47:例文マッチング翻訳部 48,74:形態素解析部
50:単語アライメント例文ベース翻訳部 52:例文集合ベース翻訳部
54:例文ベース翻訳部 56:ルールベース翻訳部
58:出力部 60:単語/句対訳辞書
62:例文対訳辞書 621:第1保持部
63:例文パターン対訳辞書 631:第2保持部
64:単語アライメント対訳辞書
66:例文対訳辞書 72:例文部分マッチング翻訳部
73:判断部 75:例文パターン検索部
76:例文パターンマッチング部 77:訳文抽出部
1102:例文対訳ペア選択部
1104:句ペア抽出部 1106:支持度算出部
1108:訳文選択部 1700:入力装置
1702:表示装置 1704:主記憶装置
1706:記憶装置 1708:中央処理装置(CPU)
1710:バス
Claims (5)
- 第1言語の例文とその対訳である第2言語の対訳例文を例文対訳組として記憶する第1の辞書を検索して得られる入力句を含む例文対訳組を保持する保持手段と、
第1言語の例文パターンとその対訳である第2言語の対訳例文パターンを例文パターン対訳組として記憶する第2の辞書と、
前記保持手段に保持された入力句を含む例文対訳組に対応する例文パターン対訳組を第2の辞書から検索する検索手段と、
前記保持手段で保持された例文対訳組の第1言語の例文と前記検索手段で検索された例文パターン対訳組の第1言語の例文パターン間、および当該例文対訳組での第2言語の例文と当該例文パターン対訳組での第2言語の例文パターン間のマッチングを行うマッチング手段と、
前記マッチグ手段のマッチング結果に基づいて入力句の訳文を抽出する抽出手段と、
を備えた例文マッチング翻訳装置。 - 前記抽出手段が、第1言語の例文内の入力句が第1言語の例文パターンでの特定の可変部分に対応し、第1言語の例文パターンでの特定の可変部分が第2言語の例文パターンでの特定の可変部分に対応し、第2言語の例文パターンでの特定の可変部分が第1言語の例文に対応することにより、入力句の訳文として、当該第2言語の例文パターンでの特定の可変部分に対応する第1言語の例文の部分を抽出することを特徴とする請求項1記載の例文マッチング翻訳装置。
- 請求項1または2に記載の例文マッチング翻訳装置を含み、複数の翻訳手法に基づく翻訳部を多段に構成した句翻訳装置。
- 前記句翻訳装置が、辞書ベース翻訳方式による辞書ベース翻訳部と、請求項1または2に記載の例文マッチング翻訳装置からなる例文マッチング翻訳部と、単語アライメント例文ベース翻訳方式による単語アライメント例文ベース翻訳部と、例文集合ベース翻訳方式による例文集合ベース翻訳部と、例文パターンベース翻訳方式による例文パターンベース翻訳部と、ルールベース翻訳方式によるルールベース翻訳部とを備え、入力された句が、順次これらの翻訳部に段階的に入力されるよう構成された請求項3に記載の句翻訳装置。
- 第1言語の例文とその対訳である第2言語の対訳例文を例文対訳組として記憶する第1の辞書、および第1言語の例文パターンとその対訳である第2言語の対訳例文パターンを例文パターン対訳組として記憶する第2の辞書を利用した例文マッチング翻訳プログラムであって、
前記第1の辞書を検索して得られる入力句を含む例文対訳組を保持する第1のステップと、
第1のステップで保持された入力句を含む例文対訳組に対応する例文パターン対訳組を第2の辞書から検索する第2のステップと、
第1のステップで保持された例文対訳組の第1言語の例文と第2のステップで検索された例文パターン対訳組の第1言語の例文パターン間、および当該例文対訳組での第2言語の例文と当該例文パターン対訳組での第2言語の例文パターン間のマッチングを行う第3のステップと、
第3のステップのマッチング結果に基づいて入力句の訳文を抽出する第4のステップと
を備えた例文マッチング翻訳プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008326704A JP5298834B2 (ja) | 2008-12-23 | 2008-12-23 | 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008326704A JP5298834B2 (ja) | 2008-12-23 | 2008-12-23 | 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010152420A true JP2010152420A (ja) | 2010-07-08 |
JP5298834B2 JP5298834B2 (ja) | 2013-09-25 |
Family
ID=42571479
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008326704A Expired - Fee Related JP5298834B2 (ja) | 2008-12-23 | 2008-12-23 | 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5298834B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102591898A (zh) * | 2011-01-05 | 2012-07-18 | 富士施乐株式会社 | 双语信息检索设备、翻译设备及双语信息检索方法 |
JP2018163629A (ja) * | 2017-03-24 | 2018-10-18 | 世丞 莊 | 翻訳支援システム |
KR20210045960A (ko) * | 2020-07-15 | 2021-04-27 | 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. | 정보 출력 방법, 장치, 기기 및 저장 매체 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001013863A (ja) * | 1999-06-28 | 2001-01-19 | San Furea:Kk | 最適テンプレートパターン探索方法,探索装置および記録媒体 |
JP2006506692A (ja) * | 2002-02-12 | 2006-02-23 | 株式会社サン・フレア | テンプレート・オートマトンとレイテント・セマンティック・インデックス原理に基づく新しいコンピュータ支援メモリ翻訳スキーム |
JP2008065395A (ja) * | 2006-09-04 | 2008-03-21 | Fuji Xerox Co Ltd | 翻訳装置、翻訳方法および翻訳プログラム |
-
2008
- 2008-12-23 JP JP2008326704A patent/JP5298834B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001013863A (ja) * | 1999-06-28 | 2001-01-19 | San Furea:Kk | 最適テンプレートパターン探索方法,探索装置および記録媒体 |
JP2006506692A (ja) * | 2002-02-12 | 2006-02-23 | 株式会社サン・フレア | テンプレート・オートマトンとレイテント・セマンティック・インデックス原理に基づく新しいコンピュータ支援メモリ翻訳スキーム |
JP2008065395A (ja) * | 2006-09-04 | 2008-03-21 | Fuji Xerox Co Ltd | 翻訳装置、翻訳方法および翻訳プログラム |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102591898A (zh) * | 2011-01-05 | 2012-07-18 | 富士施乐株式会社 | 双语信息检索设备、翻译设备及双语信息检索方法 |
US8909511B2 (en) | 2011-01-05 | 2014-12-09 | Fuji Xerox Co., Ltd. | Bilingual information retrieval apparatus, translation apparatus, and computer readable medium using evaluation information for translation |
CN102591898B (zh) * | 2011-01-05 | 2017-04-26 | 富士施乐株式会社 | 双语信息检索设备、翻译设备及双语信息检索方法 |
JP2018163629A (ja) * | 2017-03-24 | 2018-10-18 | 世丞 莊 | 翻訳支援システム |
KR20210045960A (ko) * | 2020-07-15 | 2021-04-27 | 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. | 정보 출력 방법, 장치, 기기 및 저장 매체 |
JP2022017173A (ja) * | 2020-07-15 | 2022-01-25 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 情報を出力するための方法および装置、電子機器、コンピュータ可読記憶媒体並びにコンピュータプログラム |
KR102531507B1 (ko) * | 2020-07-15 | 2023-05-12 | 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. | 정보 출력 방법, 장치, 기기 및 저장 매체 |
US11687735B2 (en) | 2020-07-15 | 2023-06-27 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method, apparatus, device and storage medium for outputting information |
Also Published As
Publication number | Publication date |
---|---|
JP5298834B2 (ja) | 2013-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3906356B2 (ja) | 構文解析方法及び装置 | |
US5895446A (en) | Pattern-based translation method and system | |
US20050216253A1 (en) | System and method for reverse transliteration using statistical alignment | |
CN110378409A (zh) | 一种基于要素关联注意力机制的汉越新闻文档摘要生成方法 | |
WO2005073874A1 (ja) | 他言語のテキスト生成方法及びテキスト生成装置 | |
JP2006012168A (ja) | 翻訳メモリシステムにおいてカバレージおよび質を改良する方法 | |
JP2010519655A (ja) | 名前照合システムの名前インデックス付け | |
JP2018055670A (ja) | 類似文生成方法、類似文生成プログラム、類似文生成装置及び類似文生成システム | |
Kettunen et al. | Analyzing and improving the quality of a historical news collection using language technology and statistical machine learning methods | |
JP3831357B2 (ja) | 対訳情報作成装置及び対訳情報検索装置 | |
Khairova et al. | The aligned Kazakh-Russian parallel corpus focused on the criminal theme | |
Aswani et al. | A hybrid approach to align sentences and words in English-Hindi parallel corpora | |
Wax | Automated grammar engineering for verbal morphology | |
JP5298834B2 (ja) | 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置 | |
Bakari et al. | Logic-based approach for improving Arabic question answering | |
JP5194920B2 (ja) | 例文集合ベース翻訳装置、方法およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置 | |
JP2018072979A (ja) | 対訳文抽出装置、対訳文抽出方法およびプログラム | |
CN116306594A (zh) | 一种医学ocr识别纠错方法 | |
Stehouwer | Statistical language models for alternative sequence selection | |
Lohar | Machine translation of user-generated content | |
Chen et al. | Semi-supervised dependency parsing | |
Steingrímsson | Effectively compiling parallel corpora for machine translation in resource-scarce conditions | |
Naeem et al. | Exploiting Transliterated Words for Finding Similarity in Inter-Language News Articles using Machine Learning | |
Gupta et al. | Identification and extraction of multiword expressions from Hindi & Urdu language in natural language processing | |
Samir et al. | Training and evaluation of TreeTagger on Amazigh corpus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130328 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130521 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130603 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5298834 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |