KR20200066009A - 한국어 구문 분석을 활용한 정보 처리 시스템 - Google Patents
한국어 구문 분석을 활용한 정보 처리 시스템 Download PDFInfo
- Publication number
- KR20200066009A KR20200066009A KR1020180153014A KR20180153014A KR20200066009A KR 20200066009 A KR20200066009 A KR 20200066009A KR 1020180153014 A KR1020180153014 A KR 1020180153014A KR 20180153014 A KR20180153014 A KR 20180153014A KR 20200066009 A KR20200066009 A KR 20200066009A
- Authority
- KR
- South Korea
- Prior art keywords
- user
- unit
- input sentence
- translation
- dependency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Machine Translation (AREA)
Abstract
Description
도 2는 본 발명의 예시적 실시 예에 따른 한국어 구문 분석을 활용한 정보 처리 시스템의 자연어 이해부의 구성을 나타내는 블록도이다.
도 3은 본 발명의 예시적 실시 예에 따른 한국어 구문 분석을 활용한 정보 처리 시스템의 의존 구문 분석부의 구성을 나타내는 블록도이다.
도 4는 본 발명의 예시적 실시 예에 따른 한국어 구문 분석을 활용한 정보 처리 시스템의 언어 번역부의 구성을 나타내는 블록도이다.
도 5는 본 발명의 예시적 실시 예에 따른 한국어 구문 분석을 활용한 정보 처리 시스템의 의존 구문 분석 수행부의 구성을 나타내는 블록도이다.
도 6은 본 발명의 예시적 실시 예에 따른 한국어 구문 분석을 활용한 정보 처리 시스템의 의존 구문 구조 대응부의 구성을 나타내는 블록도이다.
도 7은 본 발명의 예시적 실시 예에 따른 한국어 구문 분석을 활용한 정보 처리 시스템을 나타내는 블록도이다.
Claims (9)
- 네트워크를 통하여 사용자로부터 입력 문장을 받고, 상기 사용자의 입력 문장에 대하여 처리된 결과물인 출력을 상기 사용자에게 제공하는 사용자 인터페이스;
상기 사용자의 입력 문장에 대한 번역을 수행하는 언어 번역부;
상기 사용자의 입력 문장에 대한 번역 결과에 대하여 의존 구문 분석을 수행하는 의존 구문 분석부;
상기 사용자의 입력 문장에 대한 번역 결과에 대하여 수행된 의존 구문 분석 결과를 상기 사용자의 입력 문장에 대응하여, 상기 사용자의 입력 문장에 대한 의존 구문 분석을 수행하는 의존 구문 구조 대응부; 및
상기 사용자의 입력 문장, 및 그에 대한 의존 구문 분석 결과로부터, 상기 출력을 생성하는 질의 응답/검색 요청 처리부;를 포함하는 것을 특징으로 하는 정보 처리 시스템. - 제1 항에 있어서,
상기 언어 번역부는,
상기 사용자의 입력 문장을 어절 단위로 엔그램(n-Gram)들로 분리하는 엔그램 분리부;
상기 사용자의 입력 문장 및 분리된 상기 엔그램들 각각에 대하여 번역을 수행하는 번역 수행부; 및
상기 사용자의 입력 문장과 그 번역 결과, 및 분리된 상기 엔그램들과 그 각각의 번역 결과를 비교하여 대응시키는 엔그램 비교부;를 포함하는 것을 특징으로 하는 정보 처리 시스템. - 제2 항에 있어서,
상기 의존 분석 수행부는,
상기 사용자의 입력 문장에 대한 번역 결과, 및 분리된 상기 엔그램들 각각에 대한 번역 결과에 대하여 의존 구문 분석을 수행하는 번역문 분석 수행부;를 포함하는 것을 특징으로 하는 정보 처리 시스템. - 제3 항에 있어서,
상기 의존 분석 수행부는,
상기 사용자의 입력 문장, 및 분리된 상기 엔그램들 각각에 대하여 의존 구문 분석을 수행하는 원문 분석 수행부;를 더 포함하는 것을 특징으로 하는 정보 처리 시스템. - 제3 항에 있어서,
상기 의존 구문 구조 대응부는,
상기 사용자의 입력 문장과 그에 대한 번역 결과 각각의 어절을 대응시켜 상기 사용자의 입력 문장과 그에 대한 번역 결과 각각의 서술어를 분석하는 서술어 분석부;
형태소 번역 사전을 참조하여 분석된 상기 사용자의 입력 문장과 그에 대한 번역 결과 각각의 서술어를 매칭하여, 의존 구문 구조에서 의존 관계의 중심이 되는 기준 서술어를 정하는 서술어 매칭부; 및
상기 기준 서술어를 기준으로, 상기 사용자의 입력 문장 및 그에 대한 번역 결과 각각의 나머지 어절들의 의존 관계를 대응하여, 상기 사용자의 입력 문장에 대한 의존 구문 구조를 생성하는 의존 관계 대응부;를 포함하는 것을 특징으로 하는 정보 처리 시스템. - 제5 항에 있어서,
상기 서술어 매칭부는,
상기 사용자의 입력 문장, 및 분리된 상기 엔그램들 각각에 대한 번역 결과의 서술어들에 가중치를 반영하고 빈도를 고려하여 상기 기준 서술어를 결정하는 것을 특징으로 하는 정보 처리 시스템. - 제5 항에 있어서,
한국어 의존 관계 기본 원칙을 참조하여, 상기 의존 관계 대응부에서 생성한 상기 사용자의 입력 문장에 대한 의존 구문 구조에 대한 보정을 수행하여, 상기 질의 응답/검색 요청 처리부에 제공하는 의존 구문 분석 보정부를 더 포함하는 것을 특징으로 하는 정보 처리 시스템. - 제5 항에 있어서,
상기 서술어 매칭부는 기본형 사전을 참조하여, 상기 사용자의 입력 문장, 및 분리된 상기 엔그램들 각각에 대한 번역 결과의 서술어에 대한 기본형을 구한 후, 상기 사용자의 입력 문장, 및 분리된 상기 엔그램들 각각에 대한 번역 결과의 서술어를 종합하여 상기 기준 서술어를 결정하는 것을 특징으로 하는 정보 처리 시스템.. - 제1 항에 있어서,
상기 사용자의 입력 문장은 한국어로 이루어지고, 상기 언어 번역부는 한국어에 대한 영어 번역을 수행하는 것을 특징으로 하는 정보 처리 시스템.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180153014A KR102143158B1 (ko) | 2018-11-30 | 2018-11-30 | 한국어 구문 분석을 활용한 정보 처리 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180153014A KR102143158B1 (ko) | 2018-11-30 | 2018-11-30 | 한국어 구문 분석을 활용한 정보 처리 시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200066009A true KR20200066009A (ko) | 2020-06-09 |
KR102143158B1 KR102143158B1 (ko) | 2020-08-11 |
Family
ID=71082177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180153014A Active KR102143158B1 (ko) | 2018-11-30 | 2018-11-30 | 한국어 구문 분석을 활용한 정보 처리 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102143158B1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102689779B1 (ko) | 2023-01-27 | 2024-07-30 | 델타인덱스 주식회사 | 목표 시스템 설계를 위한 고객의 요구사항 객체화 방법 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR950013128B1 (ko) * | 1993-03-15 | 1995-10-25 | 김영택 | 기계번역장치 및 방법 |
KR20150010145A (ko) * | 2013-07-18 | 2015-01-28 | 에스케이텔레콤 주식회사 | 구문 분석 장치 및 이를 위한 기록매체 |
KR101818598B1 (ko) * | 2016-08-09 | 2018-03-02 | 주식회사 에버트란 | 자동 번역 엔진 서버 및 자동 번역 방법 |
KR20180093157A (ko) * | 2017-02-09 | 2018-08-21 | 서울대학교산학협력단 | 의존구문 분석 기술 및 의미 표현 기술을 활용한 질문 번역 시스템 및 방법 |
-
2018
- 2018-11-30 KR KR1020180153014A patent/KR102143158B1/ko active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR950013128B1 (ko) * | 1993-03-15 | 1995-10-25 | 김영택 | 기계번역장치 및 방법 |
KR20150010145A (ko) * | 2013-07-18 | 2015-01-28 | 에스케이텔레콤 주식회사 | 구문 분석 장치 및 이를 위한 기록매체 |
KR101818598B1 (ko) * | 2016-08-09 | 2018-03-02 | 주식회사 에버트란 | 자동 번역 엔진 서버 및 자동 번역 방법 |
KR20180093157A (ko) * | 2017-02-09 | 2018-08-21 | 서울대학교산학협력단 | 의존구문 분석 기술 및 의미 표현 기술을 활용한 질문 번역 시스템 및 방법 |
Non-Patent Citations (2)
Title |
---|
오태환, 한국어 보편 의존 구문 분석 방법론 연구, 연세대 석사학위논문 (2019) * |
이도경, 의존 구문 분석을 이용한 질의 기반 정답 추출에 관한 연구, 연세대 석사학위 논문 (2019) * |
Also Published As
Publication number | Publication date |
---|---|
KR102143158B1 (ko) | 2020-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101130444B1 (ko) | 기계번역기법을 이용한 유사문장 식별 시스템 | |
US8275605B2 (en) | Machine language translation with transfer mappings having varying context | |
US20030023422A1 (en) | Scaleable machine translation system | |
US20040243390A1 (en) | Unilingual translator | |
KR101500617B1 (ko) | 한국어 어휘 의미망을 이용한 문맥 철자오류 교정 장치 및 방법 | |
JPH02165378A (ja) | 機械翻訳システム | |
US20090043564A1 (en) | Method and apparatus for constructing translation knowledge | |
JP2011118689A (ja) | 検索方法及びシステム | |
US10223349B2 (en) | Inducing and applying a subject-targeted context free grammar | |
Sun et al. | Towards accurate and efficient Chinese part-of-speech tagging | |
Li et al. | Improving semantic parsing with enriched synchronous context-free grammar | |
JPH0261763A (ja) | 機械翻訳装置 | |
KR102143158B1 (ko) | 한국어 구문 분석을 활용한 정보 처리 시스템 | |
JP2005284723A (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
JP4033011B2 (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
JP4007413B2 (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
Garje et al. | Transmuter: an approach to rule-based English to Marathi machine translation | |
Atrey et al. | Issues in parsing and POS tagging of hybrid language | |
JP4114526B2 (ja) | 機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラム | |
JP4039205B2 (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
Horvat | Hierarchical statistical semantic translation and realization | |
Yellin et al. | Paths to relation extraction through semantic structure | |
Enache et al. | Handling non-compositionality in multilingual CNLs | |
JP4033093B2 (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
JP4708682B2 (ja) | 対訳単語対の学習方法、装置、及び、対訳単語対の学習プログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20181130 |
|
PA0201 | Request for examination | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20200122 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20200727 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20200804 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20200805 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20230703 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20240701 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20250701 Start annual number: 6 End annual number: 6 |