KR20060063345A - 정보검색 및 질문응답시스템에서의 하이브리드 기반 질문분류 시스템 및 방법 - Google Patents
정보검색 및 질문응답시스템에서의 하이브리드 기반 질문분류 시스템 및 방법 Download PDFInfo
- Publication number
- KR20060063345A KR20060063345A KR1020040102494A KR20040102494A KR20060063345A KR 20060063345 A KR20060063345 A KR 20060063345A KR 1020040102494 A KR1020040102494 A KR 1020040102494A KR 20040102494 A KR20040102494 A KR 20040102494A KR 20060063345 A KR20060063345 A KR 20060063345A
- Authority
- KR
- South Korea
- Prior art keywords
- question
- classification
- name
- type
- hybrid
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Algebra (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (14)
- 입력된 질문에 포함된 작품명을 인식하는 질문 작품명 처리부;질문을 형태소분석, 개체명 인식, 어휘 의미태깅 과정을 통해 개개의 어휘를 의미 있는 코드로 변환하는 질문 언어분석부;질문의 의미 있는 LSP 형태 코드와 미리 정의된 질문분류 규칙을 이용하여 질문이 요구하는 정답 유형을 분류하는 규칙기반 질문분류부;질문의 정답유형이 태깅된 학습문서로부터 구축된 통계정보를 이용하여, 질문의 LSP 코드에 대한 분류를 수행하는 통계기반 질문분류부; 및규칙기반 질문분류와 통계기반 질문분류의 결과를 이용하여 최종적으로 사용자의 질문에 대한 정답의 유형을 판별하는 질문 정답유형 결정부를 포함하는 것을 특징으로 하는 정보검색 및 질문응답시스템에서의 하이브리드 기반 질문 분류 시스템.
- 제 1 항에 있어서, 상기 질문 작품명 처리부는 작품명을 인식하기 위한 작품명 테이블 및 작품명 좌/우 문맥 규칙을 저장한 작품명 및 인식문맥 DB를 더 포함하는 것을 특징으로 하는 정보검색 및 질문응답시스템에서의 하이브리드 기반 질문 분류 시스템.
- 제 1 항에 있어서, 상기 질문 언어분석부에는 질문언어분석을 위한 개체명 사전, 개체명 인식문맥, 어휘개념망, 명사 의미분별을 위한 상호정보를 포함하는 언어분석지식 DB를 더 포함하는 것을 특징으로 하는 정보검색 및 질문응답시스템에서의 하이브리드 기반 질문 분류 시스템.
- 제 1 항에 있어서, 상기 규칙기반 질문분류부는 규칙기반 질문분류를 위한 LSP(Lexico-Semantic Pattern) 기반의 질문분류규칙 DB(31)를 더 포함하는 것을 특징으로 하는 정보검색 및 질문응답시스템에서의 하이브리드 기반 질문 분류 시스템.
- 제 1 항에 있어서, 상기 통계기반 질문분류부는 Naive- Bayesian을 이용한 통계기반 질문분류를 위해 학습문서로부터 자동으로 학습한 질문코퍼스 통계정보 DB를 더 포함하는 것을 특징으로 하는 정보검색 및 질문응답시스템에서의 하이브리드 기반 질문 분류 시스템.
- 입력된 질문에 포함된 작품명을 인식하는 질문 작품명 처리 단계;질문을 형태소분석, 개체명 인식, 어휘 의미태깅 과정을 통해 개개의 어휘를 의미 있는 코드로 변환하는 질문 언어분석 단계;질문의 의미 있는 LSP 형태 코드와 미리 정의된 질문분류 규칙을 이용하여 질문이 요구하는 정답 유형을 분류하는 규칙기반 질문분류 단계;질문의 정답유형이 태깅된 학습문서로부터 구축된 통계정보를 이용하여, 질문의 LSP 코드에 대한 분류를 수행하는 통계기반 질문분류 단계; 및규칙기반 질문분류와 통계기반 질문분류의 결과를 이용하여 최종적으로 사용자의 질문에 대한 정답의 유형을 판별하는 질문 정답유형 결정 단계를 포함하는 것을 특징으로 하는 정보검색 및 질문응답시스템에서의 하이브리드 기반 질문 분류 방법.
- 제 6 항에 있어서, 상기 질문 작품명 처리 단계는,미리 구축한 작품명 사전과 고유코드를 이용하여 질문을 작품명으로 변환하는 단계;상기 변환된 질문에 대해 구축된 작품명 좌/우 문맥 정보를 이용하여 작품명 이외의 영역을 필터링하는 단계; 및상기 필터링된 질문을 출력시키는 단계를 포함하는 것을 특징으로 하는 정보검색 및 질문응답시스템에서의 하이브리드 기반 질문 분류 방법.
- 제 6 항에 있어서, 상기 질문 언어분석 단계는,형태소 사전을 이용하여 각 형태소의 품사를 결정하는 단계;미리 정의한 다수개의 의미적 분류를 개체명으로 정의한 개체명 사전을 이용 하여 개체명에 대한 인식을 수행하는 단계;명사 어휘 개념망을 이용하여 각 명사에 개념을 할당하는 단계; 및대용량 코퍼스로부터 한 문장에 공기하는 어휘들간의 상호정보를 통해 어휘 의미태깅 과정에서 부착한 정보중 유일한 하나의 어휘 의미를 결정하는 단계를 포함하는 것을 특징으로 하는 정보검색 및 질문응답시스템에서의 하이브리드 기반 질문 분류 방법.
- 제 8 항에 있어서, 상기 개체명은 인명, 학술분야명, 이론, 인공물, 조직명, 지명, 문화/문명, 날짜, 시간, 수량, 사건, 동물, 식물, 물질, 전문용어를 포함하는 것을 특징으로 하는 정보검색 및 질문응답시스템에서의 하이브리드 기반 질문 분류 방법.
- 제 6 항에 있어서, 상기 규칙기반 질문분류 단계는,상기 질문 언어분석 단계에서 질문에 포함된 각 어휘의 특성에 따라 미리 정의한 LSP 규칙과 비교하여 LSP 형태로 코드화하되, 질문의 유형을 분류하기 위해 질문에 연산자를 포함시켜 구성한 것을 특징으로 하는 정보검색 및 질문응답시스템에서의 하이브리드 기반 질문 분류 방법.
- 제 6 항에 있어서, 상기 질문 정답유형 결정 단계는,규칙기반의 질문분류와 통계기반의 질문분류 중에서 임계값을 만족하는 질문분류만을 선택적으로 질문의 정답유형으로 결정하는 것을 특징으로 하는 정보검색 및 질문응답시스템에서의 하이브리드 기반 질문 분류 방법.
- 제 6 항 또는 제 13 항에 있어서, 상기 질문 정답유형 결정 단계는,규칙기반의 질문분류와 통계기반의 질문분류에서 학습을 통해 얻어진 결과값이 임계값 이하일 경우, 질문에 대한 분류를 포기하고, 질문의 가장 뒤 어휘에서부터, 그 어휘가 가지는 의미표현을 질문분류의 결과값으로 반환하는 것을 특징으로 하는 정보검색 및 질문응답시스템에서의 하이브리드 기반 질문 분류 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040102494A KR100597435B1 (ko) | 2004-12-07 | 2004-12-07 | 정보검색 및 질문응답시스템에서의 하이브리드 기반 질문분류 시스템 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040102494A KR100597435B1 (ko) | 2004-12-07 | 2004-12-07 | 정보검색 및 질문응답시스템에서의 하이브리드 기반 질문분류 시스템 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20060063345A true KR20060063345A (ko) | 2006-06-12 |
KR100597435B1 KR100597435B1 (ko) | 2006-07-10 |
Family
ID=37159361
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020040102494A KR100597435B1 (ko) | 2004-12-07 | 2004-12-07 | 정보검색 및 질문응답시스템에서의 하이브리드 기반 질문분류 시스템 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100597435B1 (ko) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100904049B1 (ko) * | 2007-07-06 | 2009-06-23 | 주식회사 예스피치 | 음성 인식에 대한 통계적 의미 분류 시스템 및 방법 |
KR20120064559A (ko) * | 2010-12-09 | 2012-06-19 | 한국전자통신연구원 | 오픈 웹 질의응답을 위한 질문분석 장치 및 방법 |
KR101409298B1 (ko) * | 2012-08-02 | 2014-06-30 | 주식회사 와이즈넛 | 한국어 구문 인식을 위한 어휘의미패턴 재구성 방법 |
KR101589621B1 (ko) * | 2015-02-23 | 2016-01-28 | 주식회사 와이즈넛 | 텍스트 분석 및 응답 시스템을 위한 어휘의미패턴의 사전 구축 방법 |
KR20160060253A (ko) * | 2014-11-19 | 2016-05-30 | 한국전자통신연구원 | 자연어 질의 응답 시스템 및 방법 |
KR20170091904A (ko) * | 2016-02-02 | 2017-08-10 | 한국전자통신연구원 | 어절 단위 변수화 패턴에 기반한 문장 재구성 장치 및 방법 |
CN111966706A (zh) * | 2020-08-19 | 2020-11-20 | 中国银行股份有限公司 | 官微答复方法及装置 |
WO2022097909A1 (ko) * | 2020-11-09 | 2022-05-12 | 한국과학기술원 | 비지도 기반 질의 생성 모델의 학습 방법 및 장치 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101042515B1 (ko) | 2008-12-11 | 2011-06-17 | 주식회사 네오패드 | 사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법 |
-
2004
- 2004-12-07 KR KR1020040102494A patent/KR100597435B1/ko active IP Right Grant
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100904049B1 (ko) * | 2007-07-06 | 2009-06-23 | 주식회사 예스피치 | 음성 인식에 대한 통계적 의미 분류 시스템 및 방법 |
KR20120064559A (ko) * | 2010-12-09 | 2012-06-19 | 한국전자통신연구원 | 오픈 웹 질의응답을 위한 질문분석 장치 및 방법 |
KR101409298B1 (ko) * | 2012-08-02 | 2014-06-30 | 주식회사 와이즈넛 | 한국어 구문 인식을 위한 어휘의미패턴 재구성 방법 |
KR20160060253A (ko) * | 2014-11-19 | 2016-05-30 | 한국전자통신연구원 | 자연어 질의 응답 시스템 및 방법 |
KR101589621B1 (ko) * | 2015-02-23 | 2016-01-28 | 주식회사 와이즈넛 | 텍스트 분석 및 응답 시스템을 위한 어휘의미패턴의 사전 구축 방법 |
KR20170091904A (ko) * | 2016-02-02 | 2017-08-10 | 한국전자통신연구원 | 어절 단위 변수화 패턴에 기반한 문장 재구성 장치 및 방법 |
CN111966706A (zh) * | 2020-08-19 | 2020-11-20 | 中国银行股份有限公司 | 官微答复方法及装置 |
CN111966706B (zh) * | 2020-08-19 | 2023-08-22 | 中国银行股份有限公司 | 官微答复方法及装置 |
WO2022097909A1 (ko) * | 2020-11-09 | 2022-05-12 | 한국과학기술원 | 비지도 기반 질의 생성 모델의 학습 방법 및 장치 |
KR20220062986A (ko) * | 2020-11-09 | 2022-05-17 | 한국과학기술원 | 비지도 기반 질의 생성 모델의 학습 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
KR100597435B1 (ko) | 2006-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Long et al. | Literary pattern recognition: Modernism between close reading and machine learning | |
Meyer | Compound comprehension in isolation and in context: the contribution of conceptual and discourse knowledge to the comprehension of German novel noun-noun compounds | |
Leech et al. | Word frequencies in written and spoken English: Based on the British National Corpus | |
KR100533810B1 (ko) | 백과사전 질의응답 시스템의 지식베이스 반자동 구축 방법 | |
CN107463607B (zh) | 结合词向量和自举学习的领域实体上下位关系获取与组织方法 | |
Schmitz | Inducing ontology from flickr tags | |
CN102262634B (zh) | 一种自动问答方法及系统 | |
CN110674252A (zh) | 一种面向司法领域的高精度语义搜索系统 | |
CN108681574A (zh) | 一种基于文本摘要的非事实类问答答案选择方法及系统 | |
CN112328800A (zh) | 自动生成编程规范问题答案的系统及方法 | |
Guzmán Naranjo | Analogical classification in formal grammar | |
KR100597435B1 (ko) | 정보검색 및 질문응답시스템에서의 하이브리드 기반 질문분류 시스템 및 방법 | |
Fredriksson | A corpus-based contrastive study of the passive and related constructions in English and Swedish | |
KR101881398B1 (ko) | 생물학적 시스템 정보 처리 장치 및 방법 | |
Smith | The use of lexicons in information retrieval in legal databases | |
Jebbor et al. | Overview of knowledge extraction techniques in five question-answering systems | |
JP2007241900A (ja) | ネーミングシステム及びネーミング自動化方法 | |
Ahmad | People centered HMI’s for deaf and functionally illiterate users | |
Ihalainen | A source of data for the study of English dialectal syntax: The Helsinki corpus | |
Dash | Language Corpora and Applied Linguistics | |
Stauber | Prophetic Scribalism: A Semantic, Textual and Hypertextual Study of the Serek Texts | |
Cucurullo et al. | Dialectal resources on-line: the ALT-Web experience. | |
bin Mohd Rosman et al. | Bringing together over-and under-represented languages: Linking Wordnet to the SIL Semantic Domains | |
CN116226677B (zh) | 平行语料构建方法及装置、存储介质及电子设备 | |
CN116069948B (zh) | 内容风控知识库构建方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130527 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20140529 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20150527 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20160502 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20170425 Year of fee payment: 12 |
|
FPAY | Annual fee payment |
Payment date: 20180420 Year of fee payment: 13 |
|
FPAY | Annual fee payment |
Payment date: 20190409 Year of fee payment: 14 |