JP2005507524A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2005507524A5 JP2005507524A5 JP2003540855A JP2003540855A JP2005507524A5 JP 2005507524 A5 JP2005507524 A5 JP 2005507524A5 JP 2003540855 A JP2003540855 A JP 2003540855A JP 2003540855 A JP2003540855 A JP 2003540855A JP 2005507524 A5 JP2005507524 A5 JP 2005507524A5
- Authority
- JP
- Japan
- Prior art keywords
- restrictions
- language
- translation
- translation unit
- language item
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000000875 corresponding Effects 0.000 claims 2
- 230000014616 translation Effects 0.000 claims 2
- 230000001747 exhibiting Effects 0.000 claims 1
- 230000001939 inductive effect Effects 0.000 claims 1
Claims (17)
- それぞれが、ソースおよびターゲット言語の少なくとも1において、同じ言語の第1の言語項目と第2の言語項目を備える翻訳単位を生成するために、対応するソース例テキストとターゲット例テキストを利用するための手段と、
それぞれの前記第1の言語項目と結合できる候補第2言語項目に関する制限を以後に生成するための手段と、
を備える、翻訳に使用されるデータを作成するためのコンピュータ言語翻訳開発システム。 - 前記生成手段は、制限の初期集合を選択し、前記制限の初期集合を一般化し、一般化された制限の集合を提供するように構成される、請求項1に記載のシステム。
- 制限の初期集合の前記選択は、その複数の候補翻訳を生成するために前記翻訳単位を使用して、前記ソース例テキストとターゲット例テキストを翻訳し直し、前記ソース例テキストとターゲット例テキストを翻訳するために使用される場合に前記ソース例テキストとターゲット例テキストの生成を可能にするが、前記ソース例テキストと前記ターゲット例テキストに一致しない候補翻訳の数を制限する制限のリストを作成することによって実行される、請求項2に記載のシステム。
- 前記制限の初期集合は、制限のすべての可能な集合の内、相対的に少ない数の制限を表現するために選択される、請求項2または請求項3に記載のシステム。
- 前記制限の初期集合は、制限の可能な最小の集合を表現するために選択される、請求項4に記載のシステム。
- 前記生成手段は、類似する制限を示す第1の言語項目の部分集合の位置を突き止めることによって、およびその制限を修正し、それらの制限の類似性を高めることによって前記制限の初期集合を一般化するように構成される、請求項2乃至請求項5のいずれか1項に記載のシステム。
- 前記生成手段は、その部分集合のすべての構成要素のすべての制限の結合に対応する制限の集合を第1の項目の各部分集合に割り当てるように構成される、請求項6に記載のシステム。
- 前記一般化が帰納によって実行される、請求項2乃至請求項7のいずれか1項に記載のシステム。
- 前記一般化は、初期動作の数に比較して識別可能な動作の数を削減するために実行される、請求項2乃至請求項8のいずれか1項に記載のシステム。
- 前記制限は、ソーステキストの分析およびターゲットテキストの生成の少なくとも1の間にその第1の言語項目が結合されてはならない第2の言語項目のリストを、第1の言語項目ごとに備える、請求項1乃至請求項9のいずれか1項に記載のシステム。
- 初期制約の集合の選択と、
最小複雑度原則に従った前記初期制約の一般化と、
を備える、翻訳単位または分析単位の許可された組み合わせに関する制約を推論する方法。 - それぞれがソース言語およびターゲット言語の少なくとも1の中で、第1の言語項目と、その第1の言語項目がどの第2の言語項目とともに発生できるのかを制限するプロパティデータとを備える、元の翻訳単位を生成するための手段と、
前記元の翻訳単位の第1の言語項目とプロパティデータの新しい組み合わせを備える追加の合成翻訳単位を生成するための手段と、
を備える、翻訳に使用されるデータを作成するためのコンピュータ言語翻訳開発システム。 - 前記合成翻訳単位は、
類似するプロパティデータを有する翻訳単位の位置を突き止めることによって生成される、請求項12に記載のシステム。 - 前記合成翻訳単位は、
第1に対して異なる第1の言語項目を備える第1と同じプロパティデータとを備える少なくとも第1の翻訳単位および第2の翻訳単位の位置を突き止め、
第1の翻訳単位と同じ第1の言語項目と異なるプロパティデータとを備える第3の翻訳単位の位置を突き止め、
第2の翻訳単位と同じ第1の言語項目と、第3の翻訳単位と同じプロパティデータをと備える合成第4の翻訳単位を生成する
ことによって生成される、請求項13に記載のシステム。 - 前記プロパティデータは、
第1の言語項目と同じ言語であって、その翻訳単位の中で第1の言語項目とともに発生しなければならない少なくとも1つの第2の言語項目と、
を備える、請求項12乃至請求項14のいずれか1項に記載のシステム。 - 前記第1の言語項目は翻訳単位の主要語を備え、前記プロパティデータはその主要語のドーターのリストを備える、請求項15に記載のシステム。
- それぞれが少なくとも1つの言語項目を備える、翻訳単位の相似する対の識別と、
識別可能な言語項目動作の数を削減する新しい翻訳単位の作成と、
を備える、翻訳単位の例の集合から翻訳単位の一般化を推論するための方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP01309152A EP1306773A1 (en) | 2001-10-29 | 2001-10-29 | Machine translation |
EP01309153A EP1306774A1 (en) | 2001-10-29 | 2001-10-29 | Machine translation |
PCT/GB2002/004893 WO2003038663A2 (en) | 2001-10-29 | 2002-10-29 | Machine translation |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005507524A JP2005507524A (ja) | 2005-03-17 |
JP2005507524A5 true JP2005507524A5 (ja) | 2006-01-05 |
Family
ID=26077185
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003540855A Pending JP2005507524A (ja) | 2001-10-29 | 2002-10-29 | 機械翻訳 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7447623B2 (ja) |
EP (1) | EP1456770A2 (ja) |
JP (1) | JP2005507524A (ja) |
CN (1) | CN1578954B (ja) |
CA (1) | CA2464932A1 (ja) |
WO (1) | WO2003038663A2 (ja) |
Families Citing this family (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2002316581A1 (en) * | 2001-07-03 | 2003-01-21 | University Of Southern California | A syntax-based statistical translation model |
US7620538B2 (en) | 2002-03-26 | 2009-11-17 | University Of Southern California | Constructing a translation lexicon from comparable, non-parallel corpora |
US8548794B2 (en) | 2003-07-02 | 2013-10-01 | University Of Southern California | Statistical noun phrase translation |
US8296127B2 (en) * | 2004-03-23 | 2012-10-23 | University Of Southern California | Discovery of parallel text portions in comparable collections of corpora and training using comparable texts |
US8666725B2 (en) | 2004-04-16 | 2014-03-04 | University Of Southern California | Selection and use of nonstatistical translation components in a statistical machine translation framework |
DE202005022113U1 (de) * | 2004-10-12 | 2014-02-05 | University Of Southern California | Training für eine Text-Text-Anwendung, die eine Zeichenketten-Baum-Umwandlung zum Training und Decodieren verwendet |
JP4404211B2 (ja) * | 2005-03-14 | 2010-01-27 | 富士ゼロックス株式会社 | マルチリンガル翻訳メモリ、翻訳方法および翻訳プログラム |
US8676563B2 (en) | 2009-10-01 | 2014-03-18 | Language Weaver, Inc. | Providing human-generated and machine-generated trusted translations |
US8886517B2 (en) | 2005-06-17 | 2014-11-11 | Language Weaver, Inc. | Trust scoring for language translation systems |
US10319252B2 (en) | 2005-11-09 | 2019-06-11 | Sdl Inc. | Language capability assessment and training apparatus and techniques |
US8943080B2 (en) | 2006-04-07 | 2015-01-27 | University Of Southern California | Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections |
US8886518B1 (en) | 2006-08-07 | 2014-11-11 | Language Weaver, Inc. | System and method for capitalizing machine translated text |
US9633005B2 (en) | 2006-10-10 | 2017-04-25 | Abbyy Infopoisk Llc | Exhaustive automatic processing of textual information |
US9047275B2 (en) | 2006-10-10 | 2015-06-02 | Abbyy Infopoisk Llc | Methods and systems for alignment of parallel text corpora |
US8548795B2 (en) | 2006-10-10 | 2013-10-01 | Abbyy Software Ltd. | Method for translating documents from one language into another using a database of translations, a terminology dictionary, a translation dictionary, and a machine translation system |
US9235573B2 (en) | 2006-10-10 | 2016-01-12 | Abbyy Infopoisk Llc | Universal difference measure |
US20080086298A1 (en) * | 2006-10-10 | 2008-04-10 | Anisimovich Konstantin | Method and system for translating sentences between langauges |
US8195447B2 (en) * | 2006-10-10 | 2012-06-05 | Abbyy Software Ltd. | Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions |
US9984071B2 (en) | 2006-10-10 | 2018-05-29 | Abbyy Production Llc | Language ambiguity detection of text |
US8214199B2 (en) * | 2006-10-10 | 2012-07-03 | Abbyy Software, Ltd. | Systems for translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions |
US9645993B2 (en) | 2006-10-10 | 2017-05-09 | Abbyy Infopoisk Llc | Method and system for semantic searching |
US8145473B2 (en) | 2006-10-10 | 2012-03-27 | Abbyy Software Ltd. | Deep model statistics method for machine translation |
US8433556B2 (en) * | 2006-11-02 | 2013-04-30 | University Of Southern California | Semi-supervised training for statistical word alignment |
US9122674B1 (en) | 2006-12-15 | 2015-09-01 | Language Weaver, Inc. | Use of annotations in statistical machine translation |
US8468149B1 (en) | 2007-01-26 | 2013-06-18 | Language Weaver, Inc. | Multi-lingual online community |
US8615389B1 (en) | 2007-03-16 | 2013-12-24 | Language Weaver, Inc. | Generation and exploitation of an approximate language model |
US8959011B2 (en) | 2007-03-22 | 2015-02-17 | Abbyy Infopoisk Llc | Indicating and correcting errors in machine translation systems |
US8831928B2 (en) | 2007-04-04 | 2014-09-09 | Language Weaver, Inc. | Customizable machine translation service |
US8825466B1 (en) | 2007-06-08 | 2014-09-02 | Language Weaver, Inc. | Modification of annotated bilingual segment pairs in syntax-based machine translation |
US8812296B2 (en) | 2007-06-27 | 2014-08-19 | Abbyy Infopoisk Llc | Method and system for natural language dictionary generation |
JP5100445B2 (ja) * | 2008-02-28 | 2012-12-19 | 株式会社東芝 | 機械翻訳する装置および方法 |
US20100017293A1 (en) * | 2008-07-17 | 2010-01-21 | Language Weaver, Inc. | System, method, and computer program for providing multilingual text advertisments |
US9262409B2 (en) | 2008-08-06 | 2016-02-16 | Abbyy Infopoisk Llc | Translation of a selected text fragment of a screen |
JP2010044637A (ja) * | 2008-08-14 | 2010-02-25 | Just Syst Corp | データ処理装置、方法、及びプログラム |
US8990064B2 (en) | 2009-07-28 | 2015-03-24 | Language Weaver, Inc. | Translating documents based on content |
US8380486B2 (en) | 2009-10-01 | 2013-02-19 | Language Weaver, Inc. | Providing machine-generated translations and corresponding trust levels |
US10417646B2 (en) | 2010-03-09 | 2019-09-17 | Sdl Inc. | Predicting the cost associated with translating textual content |
US11003838B2 (en) | 2011-04-18 | 2021-05-11 | Sdl Inc. | Systems and methods for monitoring post translation editing |
US8694303B2 (en) | 2011-06-15 | 2014-04-08 | Language Weaver, Inc. | Systems and methods for tuning parameters in statistical machine translation |
US8886515B2 (en) | 2011-10-19 | 2014-11-11 | Language Weaver, Inc. | Systems and methods for enhancing machine translation post edit review processes |
US8942973B2 (en) | 2012-03-09 | 2015-01-27 | Language Weaver, Inc. | Content page URL translation |
US8989485B2 (en) | 2012-04-27 | 2015-03-24 | Abbyy Development Llc | Detecting a junction in a text line of CJK characters |
US8971630B2 (en) | 2012-04-27 | 2015-03-03 | Abbyy Development Llc | Fast CJK character recognition |
US10261994B2 (en) | 2012-05-25 | 2019-04-16 | Sdl Inc. | Method and system for automatic management of reputation of translators |
CN102693322B (zh) | 2012-06-01 | 2014-10-22 | 杭州海康威视数字技术股份有限公司 | 支持多国语言的网页处理方法、网页加载方法及其系统 |
JP2014078132A (ja) * | 2012-10-10 | 2014-05-01 | Toshiba Corp | 機械翻訳装置、方法およびプログラム |
US9152622B2 (en) | 2012-11-26 | 2015-10-06 | Language Weaver, Inc. | Personalized machine translation via online adaptation |
US9213694B2 (en) | 2013-10-10 | 2015-12-15 | Language Weaver, Inc. | Efficient online domain adaptation |
US9779087B2 (en) * | 2013-12-13 | 2017-10-03 | Google Inc. | Cross-lingual discriminative learning of sequence models with posterior regularization |
RU2592395C2 (ru) | 2013-12-19 | 2016-07-20 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Разрешение семантической неоднозначности при помощи статистического анализа |
RU2586577C2 (ru) | 2014-01-15 | 2016-06-10 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Фильтрация дуг в синтаксическом графе |
RU2595531C2 (ru) * | 2014-04-21 | 2016-08-27 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система генерирования определения слова на основе множественных источников |
RU2596600C2 (ru) | 2014-09-02 | 2016-09-10 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способы и системы обработки изображений математических выражений |
US9626358B2 (en) | 2014-11-26 | 2017-04-18 | Abbyy Infopoisk Llc | Creating ontologies by analyzing natural language texts |
US10108611B1 (en) | 2016-09-23 | 2018-10-23 | Amazon Technologies, Inc. | Preemptive machine translation |
US10108610B1 (en) * | 2016-09-23 | 2018-10-23 | Amazon Technologies, Inc. | Incremental and preemptive machine translation |
JP2019121241A (ja) * | 2018-01-09 | 2019-07-22 | パナソニックIpマネジメント株式会社 | 翻訳装置、翻訳方法、及びプログラム |
CN111488742B (zh) * | 2019-08-19 | 2021-06-29 | 北京京东尚科信息技术有限公司 | 用于翻译的方法和装置 |
US20220318523A1 (en) * | 2021-03-31 | 2022-10-06 | International Business Machines Corporation | Clause extraction using machine translation and natural language processing |
US11811626B1 (en) * | 2022-06-06 | 2023-11-07 | International Business Machines Corporation | Ticket knowledge graph enhancement |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5510981A (en) * | 1993-10-28 | 1996-04-23 | International Business Machines Corporation | Language translation apparatus and method using context-based translation models |
JPH0981568A (ja) * | 1995-09-11 | 1997-03-28 | Matsushita Electric Ind Co Ltd | 機械翻訳用の中国語生成装置 |
US6161083A (en) * | 1996-05-02 | 2000-12-12 | Sony Corporation | Example-based translation method and system which calculates word similarity degrees, a priori probability, and transformation probability to determine the best example for translation |
US6233544B1 (en) * | 1996-06-14 | 2001-05-15 | At&T Corp | Method and apparatus for language translation |
US6393389B1 (en) * | 1999-09-23 | 2002-05-21 | Xerox Corporation | Using ranked translation choices to obtain sequences indicating meaning of multi-token expressions |
JP2004501429A (ja) * | 2000-05-11 | 2004-01-15 | ユニバーシティ・オブ・サザン・カリフォルニア | 機械翻訳技法 |
JP3813911B2 (ja) * | 2002-08-22 | 2006-08-23 | 株式会社東芝 | 機械翻訳システム、機械翻訳方法及び機械翻訳プログラム |
JP2005100335A (ja) * | 2003-09-01 | 2005-04-14 | Advanced Telecommunication Research Institute International | 機械翻訳装置、機械翻訳コンピュータプログラム及びコンピュータ |
-
2002
- 2002-10-29 CA CA002464932A patent/CA2464932A1/en not_active Abandoned
- 2002-10-29 WO PCT/GB2002/004893 patent/WO2003038663A2/en active Application Filing
- 2002-10-29 JP JP2003540855A patent/JP2005507524A/ja active Pending
- 2002-10-29 EP EP02772573A patent/EP1456770A2/en not_active Withdrawn
- 2002-10-29 CN CN028216989A patent/CN1578954B/zh not_active Expired - Fee Related
- 2002-10-29 US US10/493,948 patent/US7447623B2/en not_active Expired - Fee Related
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2005507524A5 (ja) | ||
Diefenbach et al. | Wdaqua-core0: A question answering component for the research community | |
CN106462399B (zh) | 代码推荐 | |
US9224103B1 (en) | Automatic annotation for training and evaluation of semantic analysis engines | |
Chang et al. | Semantic parsing for text to 3d scene generation | |
WO2003038663A3 (en) | Machine translation | |
CN108139891A (zh) | 针对外部文件的缺失包括建议 | |
Mahmood et al. | Query based information retrieval and knowledge extraction using Hadith datasets | |
CN103927164B (zh) | 一种脚本混淆方法及系统 | |
Stancheva et al. | A model for generation of test questions | |
Joko et al. | Conversational entity linking: problem definition and datasets | |
Jain et al. | A sentence is known by the company it keeps: Improving Legal Document Summarization Using Deep Clustering | |
Okur et al. | Named entity recognition on Twitter for Turkish using semi-supervised learning with word embeddings | |
Sarvazyan et al. | Supervised machine-generated text detectors: Family and scale matters | |
Sales et al. | Semeval-2017 task 11: end-user development using natural language | |
US10416971B2 (en) | Method of creating the balanced parse tree having optimized height | |
Plu et al. | Adel@ oke 2017: A generic method for indexing knowledge bases for entity linking | |
Bhargava et al. | Referring to screen texts with voice assistants | |
Cevoli et al. | Shades of meaning: Natural language models offer insights and challenges to psychological understanding of lexical ambiguity | |
KR102130779B1 (ko) | 기계 독해를 위한 문서를 제공하는 시스템 및 이를 포함하는 질의 응답 시스템 | |
Maeta et al. | A framework for recipe text interpretation | |
Jockers et al. | Topic modeling | |
US20150356076A1 (en) | System and method of machine translation | |
Tirskikh et al. | Zero-Shot NER via Extractive Question Answering | |
CN103019801A (zh) | 一种应用于高速数字io波形引擎的编译器 |