KR100956794B1 - 다단계 용언구 패턴을 적용한 번역장치와 이를 위한적용방법 및 추출방법 - Google Patents
다단계 용언구 패턴을 적용한 번역장치와 이를 위한적용방법 및 추출방법 Download PDFInfo
- Publication number
- KR100956794B1 KR100956794B1 KR1020080084626A KR20080084626A KR100956794B1 KR 100956794 B1 KR100956794 B1 KR 100956794B1 KR 1020080084626 A KR1020080084626 A KR 1020080084626A KR 20080084626 A KR20080084626 A KR 20080084626A KR 100956794 B1 KR100956794 B1 KR 100956794B1
- Authority
- KR
- South Korea
- Prior art keywords
- phrase
- pattern
- default
- word
- matching
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/45—Example-based machine translation; Alignment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
Description
Claims (12)
- 입력문을 목적언어로 변환하기 위한 용언구 패턴 구조의 단문 단위로 구성하는 용언구 패턴 매칭을 위한 단문 생성부와,상기 단문 단위로 구성된 입력 단문과 기 구축된 용언구 패턴 중 각 격 성분의 의미코드 성분이 모두 매칭되도록 기본 용언구 패턴 DB를 통해 기본 용언구 패턴에 적용하여 매칭을 진행하는 기본 용언구 패턴 매칭부와,상기 기본 용언구 패턴의 매칭이 비매칭될 경우 어순 및 대역어 중의성을 해소하기 위해 디폴트 용언구 패턴 DB를 통해 디폴트 용언구 패턴에 적용하여 매칭을 진행하는 디폴트 용언구 패턴 매칭부와,상기 디폴트 용언구 패턴의 매칭이 비매칭될 경우 디폴트 어순 용언구 패턴 DB를 통해 디폴트 어순 용언구 패턴에 적용하여 매칭을 진행하는 디폴트 어순 매칭부와,상기 디폴트 어순 용언구 패턴의 매칭이 비매칭될 경우 격 성분의 조사 중의성을 해소하기 위하여 디폴트 조사 DB를 통해 디폴트 조사 패턴에 적용하여 디폴트 생성을 진행시킨 대역문을 출력하는 디폴트 조사 매칭부를 포함하는 다단계 용언구 패턴을 적용한 번역장치.
- 제 1 항에 있어서,상기 기본 용언구 패턴 DB에는, 선별 구축된 기본 용언구 패턴들이 저장되어 있는 것을 특징으로 하는 다단계 용언구 패턴을 적용한 번역장치.
- 제 1 항에 있어서,상기 디폴트 용언구 패턴 DB에는, 디폴트 용언구 패턴 DB 자동 추출부에 의해 자동 추출 및 각 용언 별로 정렬되어 선별 구축된 디폴트 용언구 패턴과 각 용언 당 구축된 격성분의 구조에 따라 다시 정렬된 디폴트 용언구 패턴이 저장되어 있는 것을 특징으로 하는 다단계 용언구 패턴을 적용한 번역장치.
- 제 1 항에 있어서,상기 디폴트 어순 용언구 패턴 DB에는, 디폴트 어순 용언구 패턴 DB 자동 추출부에 의해 자동 추출되어 정렬된 디폴트 어순 용언구 패턴이 저장되어 있는 것을 특징으로 하는 다단계 용언구 패턴을 적용한 번역장치.
- 제 1 항에 있어서,상기 디폴트 조사 DB에는, 디폴트 조사 DB 자동 추출부에 의해 빈도순으로 추출되어 정렬된 디폴트 조사 패턴이 저장되어 있는 것을 특징으로 하는 다단계 용 언구 패턴을 적용한 번역장치.
- 제 1 항에 있어서,상기 디폴트 조사 매칭부는,상기 입력문이 특허문서 혹은 기술 논문인 경우 디폴트 용언 DB 후보 자동 추출부에 의해 추출된 동사별 고빈도 대역어가 저장되어 있는 특정 도메인 적용 디폴트 용언 DB에 적용하여 매칭시킨 대역문을 출력하는 것을 특징으로 하는 다단계 용언구 패턴을 적용한 번역장치.
- 제 1 항에 있어서,상기 디폴트 용언구 패턴 매칭부는, 의미 기반의 용언구 패턴에서 '*' 디폴트 개념을 이용하여 주격의 가중치를 하향 조정하고, 주격 이외의 격으로서 부사격 또는 목적격을 포함하는 다른 격 성분의 가중치를 상향 조정하는 것을 특징으로 하는 다단계 용언구 패턴을 적용한 번역장치.
- 원시언어의 입력문의 형태소를 분석하는 단계와,상기 형태소가 분석된 상기 입력문의 구조를 분석하는 단계와,구조가 분석된 상기 입력문을 목적언어로 변환하기 위한 용언구 패턴 구조의 단문 단위로 구성하는 단계와,상기 단문 단위로 구성된 입력 단문과 기 구축된 용언구 패턴 중 각 격 성분의 의미코드 성분이 모두 매칭되도록 기본 용언구 패턴 DB를 통해 기본 용언구 패턴에 적용하여 매칭을 진행하는 단계와,상기 기본 용언구 패턴의 매칭이 비매칭될 경우 어순 및 대역어 중의성을 해소하기 위해 디폴트 용언구 패턴 DB를 통해 디폴트 용언구 패턴에 적용하여 매칭을 진행하는 단계와,상기 디폴트 용언구 패턴의 매칭이 비매칭될 경우 디폴트 어순 용언구 패턴 DB를 통해 디폴트 어순 용언구 패턴에 적용하여 매칭을 진행하는 단계와,상기 디폴트 어순 용언구 패턴의 매칭이 비매칭될 경우 격 성분의 조사 중의성을 해소하기 위하여 디폴트 조사 DB를 통해 디폴트 조사 패턴에 적용하여 디폴트 생성을 진행시킨 대역문을 출력하는 단계를 포함하는 번역장치를 위한 적용방법.
- 제 8 항에 있어서,상기 기본 용언구 패턴이 매칭될 경우, 기본 용언구 매칭이 진행된 패턴을 사용하는 것을 특징으로 하는 번역장치를 위한 적용방법.
- 제 8 항에 있어서,상기 디폴트 용언구 패턴이 매칭될 경우, 디폴트 용언구 매칭이 진행된 패턴을 사용하는 것을 특징으로 하는 번역장치를 위한 적용방법.
- 제 8 항에 있어서,상기 디폴트 어순 용언구 패턴이 매칭될 경우, 어순과 동사의 대역어와 격조사에 대한 대역어를 생성하는 것을 특징으로 하는 번역장치를 위한 적용방법.
- 선별 구축된 용언구 패턴들을 저장하는 단계와,상기 선별 구축된 용언구 패턴을 각 용언 별로 정렬하고, 정렬된 상기 각 용언 별로 구축된 격성분의 구조에 따라 재정렬을 진행하는 단계와,상기 선별 구축된 용언구 패턴 중 디폴트 용언구 패턴으로 정렬된 디폴트 어순 용언구 패턴을 추출하는 단계와,상기 선별 구축된 용언구 패턴에서 조사 대역어를 빈도 순으로 추출하는 단계와,상기 선별 구축된 용언구 패턴에서 각 동사별로 고빈도 대역어를 추출하는 단계를 포함하는 다단계 용언구 패턴을 적용한 번역장치를 위한 추출방법.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080084626A KR100956794B1 (ko) | 2008-08-28 | 2008-08-28 | 다단계 용언구 패턴을 적용한 번역장치와 이를 위한적용방법 및 추출방법 |
US12/464,121 US8335681B2 (en) | 2008-08-28 | 2009-05-12 | Machine-translation apparatus using multi-stage verbal-phrase patterns, methods for applying and extracting multi-stage verbal-phrase patterns |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080084626A KR100956794B1 (ko) | 2008-08-28 | 2008-08-28 | 다단계 용언구 패턴을 적용한 번역장치와 이를 위한적용방법 및 추출방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20100025885A KR20100025885A (ko) | 2010-03-10 |
KR100956794B1 true KR100956794B1 (ko) | 2010-05-11 |
Family
ID=41726646
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020080084626A KR100956794B1 (ko) | 2008-08-28 | 2008-08-28 | 다단계 용언구 패턴을 적용한 번역장치와 이를 위한적용방법 및 추출방법 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8335681B2 (ko) |
KR (1) | KR100956794B1 (ko) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9201871B2 (en) | 2010-06-11 | 2015-12-01 | Microsoft Technology Licensing, Llc | Joint optimization for machine translation system combination |
KR101356417B1 (ko) * | 2010-11-05 | 2014-01-28 | 고려대학교 산학협력단 | 병렬 말뭉치를 이용한 동사구 번역 패턴 구축 장치 및 그 방법 |
WO2012079245A1 (zh) * | 2010-12-17 | 2012-06-21 | 北京交通大学 | 知识获取装置及方法 |
WO2015063536A1 (en) * | 2013-10-28 | 2015-05-07 | Translation Management Systems Ltd. | Networked language translation system and method |
US11017172B2 (en) | 2018-08-01 | 2021-05-25 | Signals Analytics Ltd. | Proposition identification in natural language and usage thereof for search and retrieval |
CN110750989B (zh) * | 2019-10-28 | 2023-09-19 | 北京金山数字娱乐科技有限公司 | 一种语句分析的方法及装置 |
CN110991196B (zh) * | 2019-12-18 | 2021-10-26 | 北京百度网讯科技有限公司 | 多义词的翻译方法、装置、电子设备及介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100574887B1 (ko) | 1999-12-31 | 2006-04-27 | 주식회사 케이티 | 기계번역 시스템에서의 어휘 중의성 해소 장치 및 그 방법 |
US7254531B2 (en) * | 2000-09-05 | 2007-08-07 | Nir Einat H | In-context analysis and automatic translation |
KR100561227B1 (ko) | 2003-12-19 | 2006-03-15 | 한국전자통신연구원 | 한-중 기계번역시스템의 용언구 패턴 자동 확장 및 검증장치 및 방법 |
KR100617319B1 (ko) | 2004-12-14 | 2006-08-30 | 한국전자통신연구원 | 영한 자동번역을 위하여 동사구 패턴 및 의미 벡터를 사용하는 동사/명사 대역어 선택 장치 및 그 방법 |
-
2008
- 2008-08-28 KR KR1020080084626A patent/KR100956794B1/ko active IP Right Grant
-
2009
- 2009-05-12 US US12/464,121 patent/US8335681B2/en not_active Expired - Fee Related
Non-Patent Citations (2)
Title |
---|
제13회 한글 및 한국어 정보처리 학술대회 |
한국컴퓨터정보학회논문지 v.10 no.4 |
Also Published As
Publication number | Publication date |
---|---|
KR20100025885A (ko) | 2010-03-10 |
US20100057437A1 (en) | 2010-03-04 |
US8335681B2 (en) | 2012-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100956794B1 (ko) | 다단계 용언구 패턴을 적용한 번역장치와 이를 위한적용방법 및 추출방법 | |
KR100853173B1 (ko) | 통계적 자동 번역 방식에 기반한 음성 자동 통역 시스템 및그에 적용되는 번역 처리 방법 및 그 훈련방법 | |
KR20080052282A (ko) | 통계적 기계번역 시스템에서 단어 및 구문들간의 번역관계를 자율적으로 학습하기 위한 장치 및 그 방법 | |
Barman et al. | Assamese WordNet based quality enhancement of bilingual machine translation system | |
Smadja et al. | Translating collocations for use in bilingual lexicons | |
KR101092354B1 (ko) | 복합 명사 인식 장치 및 그 방법 | |
Leidig et al. | Automatic detection of anglicisms for the pronunciation dictionary generation: a case study on our German IT corpus. | |
KR100513161B1 (ko) | 기계번역 대역어 선정을 위한 한국어 복합명사 의미결정장치 및 방법 | |
Sagemo et al. | The uu submission to the machine translation quality estimation task | |
Ariaratnam et al. | A shallow parser for Tamil | |
Shukla et al. | A Framework of Translator from English Speech to Sanskrit Text | |
KR100831037B1 (ko) | 병렬 말뭉치를 이용한 신조어의 대역어 자동 선정 방법 및장치 | |
Vogel-Fernandez et al. | esT5s: A Spanish Model for Text Summarization | |
Kirchhoff et al. | Morphological modeling for machine translation of english-iraqi arabic spoken dialogs | |
Chhetri et al. | Development of a morph analyser for Nepali noun token | |
Itagaki et al. | Post-MT Term Swapper: Supplementing a Statistical Machine Translation System with a User Dictionary. | |
KR101416098B1 (ko) | 구단위 번역 지식 학습 방법 및 이를 수행하는 장치 | |
Rahman et al. | An implementation of Apertium based Assamese morphological analyzer | |
Och et al. | What can machine translation learn from speech recognition? | |
Mansour et al. | Automatic dialect classification for statistical machine translation | |
Pham et al. | Adaptation in Statistical Machine Translation for Low-resource Domains in English-Vietnamese Language | |
Williams et al. | Tools and resources for speech synthesis arising from a Welsh TTS project. | |
Heryono | Comparing Rule-Based Translation to Syntax Tree Diagram Translation | |
Tukeyev et al. | Computational Model of Morphology and Stemming of Karakalpak Words on a Complete Set of Inflectional Endings | |
Dyer | The University of Maryland translation system for IWSLT 2007 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130325 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20140403 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20150423 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20160408 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20170417 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20180102 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20190102 Year of fee payment: 10 |