JP2005507524A5 - - Google Patents

Download PDF

Info

Publication number
JP2005507524A5
JP2005507524A5 JP2003540855A JP2003540855A JP2005507524A5 JP 2005507524 A5 JP2005507524 A5 JP 2005507524A5 JP 2003540855 A JP2003540855 A JP 2003540855A JP 2003540855 A JP2003540855 A JP 2003540855A JP 2005507524 A5 JP2005507524 A5 JP 2005507524A5
Authority
JP
Japan
Prior art keywords
restrictions
language
translation
translation unit
language item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003540855A
Other languages
English (en)
Other versions
JP2005507524A (ja
Filing date
Publication date
Priority claimed from EP01309152A external-priority patent/EP1306773A1/en
Priority claimed from EP01309153A external-priority patent/EP1306774A1/en
Application filed filed Critical
Priority claimed from PCT/GB2002/004893 external-priority patent/WO2003038663A2/en
Publication of JP2005507524A publication Critical patent/JP2005507524A/ja
Publication of JP2005507524A5 publication Critical patent/JP2005507524A5/ja
Pending legal-status Critical Current

Links

Claims (17)

  1. それぞれが、ソースおよびターゲット言語の少なくとも1において、同じ言語の第1の言語項目と第2の言語項目を備える翻訳単位を生成するために、対応するソース例テキストとターゲット例テキストを利用するための手段と、
    それぞれの前記第1の言語項目と結合できる候補第2言語項目に関する制限を以後に生成するための手段と、
    を備える、翻訳に使用されるデータを作成するためのコンピュータ言語翻訳開発システム。
  2. 前記生成手段は、制限の初期集合を選択し、前記制限の初期集合を一般化し、一般化された制限の集合を提供するように構成される、請求項1に記載のシステム。
  3. 制限の初期集合の前記選択は、その複数の候補翻訳を生成するために前記翻訳単位を使用して、前記ソース例テキストとターゲット例テキストを翻訳し直し、前記ソース例テキストとターゲット例テキストを翻訳するために使用される場合に前記ソース例テキストとターゲット例テキストの生成を可能にするが、前記ソース例テキストと前記ターゲット例テキストに一致しない候補翻訳の数を制限する制限のリストを作成することによって実行される、請求項2に記載のシステム。
  4. 前記制限の初期集合は、制限のすべての可能な集合の内、相対的に少ない数の制限を表現するために選択される、請求項2または請求項3に記載のシステム。
  5. 前記制限の初期集合は、制限の可能な最小の集合を表現するために選択される、請求項4に記載のシステム。
  6. 前記生成手段は、類似する制限を示す第1の言語項目の部分集合の位置を突き止めることによって、およびその制限を修正し、それらの制限の類似性を高めることによって前記制限の初期集合を一般化するように構成される、請求項2乃至請求項5のいずれか1項に記載のシステム。
  7. 前記生成手段は、その部分集合のすべての構成要素のすべての制限の結合に対応する制限の集合を第1の項目の各部分集合に割り当てるように構成される、請求項6に記載のシステム。
  8. 前記一般化が帰納によって実行される、請求項2乃至請求項7のいずれか1項に記載のシステム。
  9. 前記一般化は、初期動作の数に比較して識別可能な動作の数を削減するために実行される、請求項2乃至請求項8のいずれか1項に記載のシステム。
  10. 前記制限は、ソーステキストの分析およびターゲットテキストの生成の少なくとも1の間にその第1の言語項目が結合されてはならない第2の言語項目のリストを、第1の言語項目ごとに備える、請求項1乃至請求項9のいずれか1項に記載のシステム。
  11. 初期制約の集合の選択と、
    最小複雑度原則に従った前記初期制約の一般化と、
    を備える、翻訳単位または分析単位の許可された組み合わせに関する制約を推論する方法。
  12. それぞれがソース言語およびターゲット言語の少なくとも1の中で、第1の言語項目と、その第1の言語項目がどの第2の言語項目とともに発生できるのかを制限するプロパティデータとを備える、元の翻訳単位を生成するための手段と、
    前記元の翻訳単位の第1の言語項目とプロパティデータの新しい組み合わせを備える追加の合成翻訳単位を生成するための手段と、
    を備える、翻訳に使用されるデータを作成するためのコンピュータ言語翻訳開発システム。
  13. 前記合成翻訳単位は、
    類似するプロパティデータを有する翻訳単位の位置を突き止めることによって生成される、請求項12に記載のシステム。
  14. 前記合成翻訳単位は、
    第1に対して異なる第1の言語項目を備える第1と同じプロパティデータとを備える少なくとも第1の翻訳単位および第2の翻訳単位の位置を突き止め、
    第1の翻訳単位と同じ第1の言語項目と異なるプロパティデータとを備える第3の翻訳単位の位置を突き止め、
    第2の翻訳単位と同じ第1の言語項目と、第3の翻訳単位と同じプロパティデータをと備える合成第4の翻訳単位を生成する
    ことによって生成される、請求項13に記載のシステム。
  15. 前記プロパティデータは、
    第1の言語項目と同じ言語であって、その翻訳単位の中で第1の言語項目とともに発生しなければならない少なくとも1つの第2の言語項目と、
    を備える、請求項12乃至請求項14のいずれか1項に記載のシステム。
  16. 前記第1の言語項目は翻訳単位の主要語を備え、前記プロパティデータはその主要語のドーターのリストを備える、請求項15に記載のシステム。
  17. それぞれが少なくとも1つの言語項目を備える、翻訳単位の相似する対の識別と、
    識別可能な言語項目動作の数を削減する新しい翻訳単位の作成と、
    を備える、翻訳単位の例の集合から翻訳単位の一般化を推論するための方法。
JP2003540855A 2001-10-29 2002-10-29 機械翻訳 Pending JP2005507524A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP01309152A EP1306773A1 (en) 2001-10-29 2001-10-29 Machine translation
EP01309153A EP1306774A1 (en) 2001-10-29 2001-10-29 Machine translation
PCT/GB2002/004893 WO2003038663A2 (en) 2001-10-29 2002-10-29 Machine translation

Publications (2)

Publication Number Publication Date
JP2005507524A JP2005507524A (ja) 2005-03-17
JP2005507524A5 true JP2005507524A5 (ja) 2006-01-05

Family

ID=26077185

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003540855A Pending JP2005507524A (ja) 2001-10-29 2002-10-29 機械翻訳

Country Status (6)

Country Link
US (1) US7447623B2 (ja)
EP (1) EP1456770A2 (ja)
JP (1) JP2005507524A (ja)
CN (1) CN1578954B (ja)
CA (1) CA2464932A1 (ja)
WO (1) WO2003038663A2 (ja)

Families Citing this family (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002316581A1 (en) * 2001-07-03 2003-01-21 University Of Southern California A syntax-based statistical translation model
US7620538B2 (en) 2002-03-26 2009-11-17 University Of Southern California Constructing a translation lexicon from comparable, non-parallel corpora
US8548794B2 (en) 2003-07-02 2013-10-01 University Of Southern California Statistical noun phrase translation
US8296127B2 (en) * 2004-03-23 2012-10-23 University Of Southern California Discovery of parallel text portions in comparable collections of corpora and training using comparable texts
US8666725B2 (en) 2004-04-16 2014-03-04 University Of Southern California Selection and use of nonstatistical translation components in a statistical machine translation framework
DE202005022113U1 (de) * 2004-10-12 2014-02-05 University Of Southern California Training für eine Text-Text-Anwendung, die eine Zeichenketten-Baum-Umwandlung zum Training und Decodieren verwendet
JP4404211B2 (ja) * 2005-03-14 2010-01-27 富士ゼロックス株式会社 マルチリンガル翻訳メモリ、翻訳方法および翻訳プログラム
US8676563B2 (en) 2009-10-01 2014-03-18 Language Weaver, Inc. Providing human-generated and machine-generated trusted translations
US8886517B2 (en) 2005-06-17 2014-11-11 Language Weaver, Inc. Trust scoring for language translation systems
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US8943080B2 (en) 2006-04-07 2015-01-27 University Of Southern California Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections
US8886518B1 (en) 2006-08-07 2014-11-11 Language Weaver, Inc. System and method for capitalizing machine translated text
US9633005B2 (en) 2006-10-10 2017-04-25 Abbyy Infopoisk Llc Exhaustive automatic processing of textual information
US9047275B2 (en) 2006-10-10 2015-06-02 Abbyy Infopoisk Llc Methods and systems for alignment of parallel text corpora
US8548795B2 (en) 2006-10-10 2013-10-01 Abbyy Software Ltd. Method for translating documents from one language into another using a database of translations, a terminology dictionary, a translation dictionary, and a machine translation system
US9235573B2 (en) 2006-10-10 2016-01-12 Abbyy Infopoisk Llc Universal difference measure
US20080086298A1 (en) * 2006-10-10 2008-04-10 Anisimovich Konstantin Method and system for translating sentences between langauges
US8195447B2 (en) * 2006-10-10 2012-06-05 Abbyy Software Ltd. Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US9984071B2 (en) 2006-10-10 2018-05-29 Abbyy Production Llc Language ambiguity detection of text
US8214199B2 (en) * 2006-10-10 2012-07-03 Abbyy Software, Ltd. Systems for translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US9645993B2 (en) 2006-10-10 2017-05-09 Abbyy Infopoisk Llc Method and system for semantic searching
US8145473B2 (en) 2006-10-10 2012-03-27 Abbyy Software Ltd. Deep model statistics method for machine translation
US8433556B2 (en) * 2006-11-02 2013-04-30 University Of Southern California Semi-supervised training for statistical word alignment
US9122674B1 (en) 2006-12-15 2015-09-01 Language Weaver, Inc. Use of annotations in statistical machine translation
US8468149B1 (en) 2007-01-26 2013-06-18 Language Weaver, Inc. Multi-lingual online community
US8615389B1 (en) 2007-03-16 2013-12-24 Language Weaver, Inc. Generation and exploitation of an approximate language model
US8959011B2 (en) 2007-03-22 2015-02-17 Abbyy Infopoisk Llc Indicating and correcting errors in machine translation systems
US8831928B2 (en) 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
US8825466B1 (en) 2007-06-08 2014-09-02 Language Weaver, Inc. Modification of annotated bilingual segment pairs in syntax-based machine translation
US8812296B2 (en) 2007-06-27 2014-08-19 Abbyy Infopoisk Llc Method and system for natural language dictionary generation
JP5100445B2 (ja) * 2008-02-28 2012-12-19 株式会社東芝 機械翻訳する装置および方法
US20100017293A1 (en) * 2008-07-17 2010-01-21 Language Weaver, Inc. System, method, and computer program for providing multilingual text advertisments
US9262409B2 (en) 2008-08-06 2016-02-16 Abbyy Infopoisk Llc Translation of a selected text fragment of a screen
JP2010044637A (ja) * 2008-08-14 2010-02-25 Just Syst Corp データ処理装置、方法、及びプログラム
US8990064B2 (en) 2009-07-28 2015-03-24 Language Weaver, Inc. Translating documents based on content
US8380486B2 (en) 2009-10-01 2013-02-19 Language Weaver, Inc. Providing machine-generated translations and corresponding trust levels
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
US11003838B2 (en) 2011-04-18 2021-05-11 Sdl Inc. Systems and methods for monitoring post translation editing
US8694303B2 (en) 2011-06-15 2014-04-08 Language Weaver, Inc. Systems and methods for tuning parameters in statistical machine translation
US8886515B2 (en) 2011-10-19 2014-11-11 Language Weaver, Inc. Systems and methods for enhancing machine translation post edit review processes
US8942973B2 (en) 2012-03-09 2015-01-27 Language Weaver, Inc. Content page URL translation
US8989485B2 (en) 2012-04-27 2015-03-24 Abbyy Development Llc Detecting a junction in a text line of CJK characters
US8971630B2 (en) 2012-04-27 2015-03-03 Abbyy Development Llc Fast CJK character recognition
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
CN102693322B (zh) 2012-06-01 2014-10-22 杭州海康威视数字技术股份有限公司 支持多国语言的网页处理方法、网页加载方法及其系统
JP2014078132A (ja) * 2012-10-10 2014-05-01 Toshiba Corp 機械翻訳装置、方法およびプログラム
US9152622B2 (en) 2012-11-26 2015-10-06 Language Weaver, Inc. Personalized machine translation via online adaptation
US9213694B2 (en) 2013-10-10 2015-12-15 Language Weaver, Inc. Efficient online domain adaptation
US9779087B2 (en) * 2013-12-13 2017-10-03 Google Inc. Cross-lingual discriminative learning of sequence models with posterior regularization
RU2592395C2 (ru) 2013-12-19 2016-07-20 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Разрешение семантической неоднозначности при помощи статистического анализа
RU2586577C2 (ru) 2014-01-15 2016-06-10 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Фильтрация дуг в синтаксическом графе
RU2595531C2 (ru) * 2014-04-21 2016-08-27 Общество С Ограниченной Ответственностью "Яндекс" Способ и система генерирования определения слова на основе множественных источников
RU2596600C2 (ru) 2014-09-02 2016-09-10 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы обработки изображений математических выражений
US9626358B2 (en) 2014-11-26 2017-04-18 Abbyy Infopoisk Llc Creating ontologies by analyzing natural language texts
US10108611B1 (en) 2016-09-23 2018-10-23 Amazon Technologies, Inc. Preemptive machine translation
US10108610B1 (en) * 2016-09-23 2018-10-23 Amazon Technologies, Inc. Incremental and preemptive machine translation
JP2019121241A (ja) * 2018-01-09 2019-07-22 パナソニックIpマネジメント株式会社 翻訳装置、翻訳方法、及びプログラム
CN111488742B (zh) * 2019-08-19 2021-06-29 北京京东尚科信息技术有限公司 用于翻译的方法和装置
US20220318523A1 (en) * 2021-03-31 2022-10-06 International Business Machines Corporation Clause extraction using machine translation and natural language processing
US11811626B1 (en) * 2022-06-06 2023-11-07 International Business Machines Corporation Ticket knowledge graph enhancement

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5510981A (en) * 1993-10-28 1996-04-23 International Business Machines Corporation Language translation apparatus and method using context-based translation models
JPH0981568A (ja) * 1995-09-11 1997-03-28 Matsushita Electric Ind Co Ltd 機械翻訳用の中国語生成装置
US6161083A (en) * 1996-05-02 2000-12-12 Sony Corporation Example-based translation method and system which calculates word similarity degrees, a priori probability, and transformation probability to determine the best example for translation
US6233544B1 (en) * 1996-06-14 2001-05-15 At&T Corp Method and apparatus for language translation
US6393389B1 (en) * 1999-09-23 2002-05-21 Xerox Corporation Using ranked translation choices to obtain sequences indicating meaning of multi-token expressions
JP2004501429A (ja) * 2000-05-11 2004-01-15 ユニバーシティ・オブ・サザン・カリフォルニア 機械翻訳技法
JP3813911B2 (ja) * 2002-08-22 2006-08-23 株式会社東芝 機械翻訳システム、機械翻訳方法及び機械翻訳プログラム
JP2005100335A (ja) * 2003-09-01 2005-04-14 Advanced Telecommunication Research Institute International 機械翻訳装置、機械翻訳コンピュータプログラム及びコンピュータ

Similar Documents

Publication Publication Date Title
JP2005507524A5 (ja)
Diefenbach et al. Wdaqua-core0: A question answering component for the research community
CN106462399B (zh) 代码推荐
US9224103B1 (en) Automatic annotation for training and evaluation of semantic analysis engines
Chang et al. Semantic parsing for text to 3d scene generation
WO2003038663A3 (en) Machine translation
CN108139891A (zh) 针对外部文件的缺失包括建议
Mahmood et al. Query based information retrieval and knowledge extraction using Hadith datasets
CN103927164B (zh) 一种脚本混淆方法及系统
Stancheva et al. A model for generation of test questions
Joko et al. Conversational entity linking: problem definition and datasets
Jain et al. A sentence is known by the company it keeps: Improving Legal Document Summarization Using Deep Clustering
Okur et al. Named entity recognition on Twitter for Turkish using semi-supervised learning with word embeddings
Sarvazyan et al. Supervised machine-generated text detectors: Family and scale matters
Sales et al. Semeval-2017 task 11: end-user development using natural language
US10416971B2 (en) Method of creating the balanced parse tree having optimized height
Plu et al. Adel@ oke 2017: A generic method for indexing knowledge bases for entity linking
Bhargava et al. Referring to screen texts with voice assistants
Cevoli et al. Shades of meaning: Natural language models offer insights and challenges to psychological understanding of lexical ambiguity
KR102130779B1 (ko) 기계 독해를 위한 문서를 제공하는 시스템 및 이를 포함하는 질의 응답 시스템
Maeta et al. A framework for recipe text interpretation
Jockers et al. Topic modeling
US20150356076A1 (en) System and method of machine translation
Tirskikh et al. Zero-Shot NER via Extractive Question Answering
CN103019801A (zh) 一种应用于高速数字io波形引擎的编译器