KR20090108530A - 지능형 정보 서비스를 위한 계층적 문서 분류 장치 및 방법 - Google Patents
지능형 정보 서비스를 위한 계층적 문서 분류 장치 및 방법 Download PDFInfo
- Publication number
- KR20090108530A KR20090108530A KR1020090023569A KR20090023569A KR20090108530A KR 20090108530 A KR20090108530 A KR 20090108530A KR 1020090023569 A KR1020090023569 A KR 1020090023569A KR 20090023569 A KR20090023569 A KR 20090023569A KR 20090108530 A KR20090108530 A KR 20090108530A
- Authority
- KR
- South Korea
- Prior art keywords
- document
- hierarchical
- classification
- subject
- unit
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/263—Language identification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (10)
- 대상 문서를 언어 분석이 가능한 형태로 정제 및 보정하는 문서 전처리부와,상기 정제 및 보정된 대상 문서에 대한 단어별, 구문별 언어 분석을 수행하는 언어 분석부와,상기 언어분석된 대상 문서의 주제를 계층적 분류 체계로 할당하는 문서 분류부와,상기 할당된 계층적 분류 체계 상에서 주제 의미 단위로 문서를 분할 및 재구성하는 문서 분할부와,상기 분할 및 재구성된 문서의 내용을 대표할 수 있는 키워드를 선정하는 대표어 선정부를 포함하는 지능형 정보 서비스를 위한 계층적 문서 분류 장치.
- 제1항에 있어서,상기 언어 분석부는,상기 정제 및 보정된 대상 문서에 대한 형태소 분석과, 개체명 인식, 청킹 및 구문 분석을 수행하는 것을 특징으로 하는 지능형 정보 서비스를 위한 계층적 문서 분류 장치.
- 제1항에 있어서,상기 문서 분류부는,상기 언어분석의 결과를 바탕으로 분류 자질을 추출하고,상기 계층적 분류 체계에 상향식 계층 분류 알고리즘을 활용하여 대상 문서의 주제를 할당하고,특정 계층간의 변별력이 낮거나 특정 분류 노드에 다량의 문서가 할당된 경우, 클러스터링을 수행하고,상기 클러스터링 이후 새로운 범주의 정의가 필요한 경우, 이를 상기 계층적 분류 체계에 추가하고, 해당 정보를 다시 상기 상향식 계층 분류 알고리즘을 이용하여 재할당하는 것을 특징으로 하는 지능형 정보 서비스를 위한 계층적 문서 분류 장치.
- 제1항에 있어서,상기 문서 분할부는,상기 대상문서에 나타난 주제 의미 단위에 따라 문서를 분할하고, 주제별로 재구성하여 형성된 문서 조각을 상기 계층적 분류 체계의 하위 인스턴스로 저장하는 것을 특징으로 하는 지능형 정보 서비스를 위한 계층적 문서 분류 장치.
- 제 1항에 있어서,상기 대표어 선정부는,의미 확장을 통하여 연관된 키워드를 포함하는 주제별 최종 대표어를 상기 키워드로 선정하는 것을 특징으로 하는 지능형 정보 서비스를 위한 계층적 문서 분류 장치.
- 대상 문서를 정제하고 언어분석을 수행하는 과정과,상기 언어분석된 대상 문서의 주제를 계층적 분류 체계로 할당하는 과정과,상기 할당된 계층적 분류 체계 상에서 주제 의미 단위로 문서를 분할 및 재구성하는 과정과,상기 분할 및 재구성된 문서의 내용을 대표할 수 있는 키워드를 선정하는 과정을 포함하는 지능형 정보 서비스를 위한 계층적 문서 분류 방법.
- 제 6항에 있어서,상기 언어 분석을 수행하는 과정은,다양한 문체와 오류가 포함되어 있는 상기 대상 문서를 입력 받아 정제하고 보정하는 과정과,상기 정제하고 보정된 대상 문서에 대한 형태소 분석과, 개체명 인식, 청킹 및 구문 분석을 수행하는 과정을 포함하는 것을 특징으로 하는 지능형 정보 서비스를 위한 계층적 문서 분류 방법.
- 제 6항에 있어서,상기 계층적 분류 체계로 할당하는 과정은,상기 언어분석의 결과를 바탕으로 분류 자질을 추출하는 과정과,상기 계층적 분류 체계에 상향식 계층 분류 알고리즘을 활용하여 대상 문서의 주제를 할당하는 과정과,특정 계층간의 변별력이 낮거나 특정 분류 노드에 다량의 문서가 할당된 경우, 클러스터링을 수행하는 과정과,상기 클러스터링 이후 새로운 범주의 정의가 필요한 경우, 이를 상기 계층적 분류 체계에 추가하고, 해당 정보를 다시 상기 상향식 계층 분류 알고리즘을 이용하여 재할당하는 과정을 포함하는 것을 특징으로 하는 지능형 정보 서비스를 위한 계층적 문서 분류 방법.
- 제 6항에 있어서,상기 문서를 분할 및 재구성하는 과정은,상기 대상문서에 나타난 주제 의미 단위에 따라 문서를 분할하고, 주제별로 재구성하여 형성된 문서 조각을 상기 계층적 분류 체계의 하위 인스턴스로 저장하는 것을 특징으로 하는 지능형 정보 서비스를 위한 계층적 문서 분류 방법.
- 제 6항에 있어서,상기 키워드를 선정하는 과정은,의미 확장을 통하여 연관된 키워드를 포함하는 주제별 최종 대표어를 상기 키워드로 선정하는 것을 특징으로 하는 지능형 정보 서비스를 위한 계층적 문서 분류 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090023569A KR101112989B1 (ko) | 2008-04-11 | 2009-03-19 | 지능형 정보 서비스를 위한 계층적 문서 분류 장치 및 방법 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080033761 | 2008-04-11 | ||
KR1020090023569A KR101112989B1 (ko) | 2008-04-11 | 2009-03-19 | 지능형 정보 서비스를 위한 계층적 문서 분류 장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20090108530A true KR20090108530A (ko) | 2009-10-15 |
KR101112989B1 KR101112989B1 (ko) | 2012-04-23 |
Family
ID=41551905
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020090023569A KR101112989B1 (ko) | 2008-04-11 | 2009-03-19 | 지능형 정보 서비스를 위한 계층적 문서 분류 장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101112989B1 (ko) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101035038B1 (ko) * | 2010-10-12 | 2011-05-19 | 한국과학기술정보연구원 | 분류기의 동적 결합에 의한 대용량 분류기 자동 생성 시스템 및 방법 |
KR101067819B1 (ko) * | 2009-11-27 | 2011-09-27 | 동국대학교 산학협력단 | 온톨로지를 이용한 문서의 군집화 방법 및 장치 |
WO2011096690A3 (ko) * | 2010-02-03 | 2011-12-15 | 고려대학교 산학협력단 | 사용자 관심 주제를 추출하는 휴대용 통신 단말기 및 그 방법 |
KR20190097496A (ko) * | 2018-02-12 | 2019-08-21 | 전북대학교산학협력단 | 콘텐츠의 토픽 유사도를 결정하는 시스템 및 방법 |
KR20190113191A (ko) * | 2018-03-28 | 2019-10-08 | 주식회사 에이제이케이 | 미디어를 활용한 지수 결정 방법 및 그를 위한 시스템 |
KR20200103170A (ko) * | 2019-02-12 | 2020-09-02 | 주식회사 자이냅스 | 문서 학습 프로그램 |
KR20200103172A (ko) * | 2019-02-12 | 2020-09-02 | 주식회사 자이냅스 | 문서 학습 장치 |
KR20200103174A (ko) * | 2019-02-12 | 2020-09-02 | 주식회사 자이냅스 | 문서 학습 프로그램 |
KR20200103175A (ko) * | 2019-02-12 | 2020-09-02 | 주식회사 자이냅스 | 기록매체 |
KR20200103169A (ko) * | 2019-02-12 | 2020-09-02 | 주식회사 자이냅스 | 문서 학습 방법 |
KR20200103171A (ko) * | 2019-02-12 | 2020-09-02 | 주식회사 자이냅스 | 기록매체 |
KR20200103173A (ko) * | 2019-02-12 | 2020-09-02 | 주식회사 자이냅스 | 문서 학습 방법 |
WO2021263138A1 (en) * | 2020-06-25 | 2021-12-30 | Pryon Incorporated | Document processing and response generation system |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08272822A (ja) * | 1995-03-29 | 1996-10-18 | Fuji Xerox Co Ltd | 文書登録装置及び文書検索装置 |
-
2009
- 2009-03-19 KR KR1020090023569A patent/KR101112989B1/ko active IP Right Grant
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101067819B1 (ko) * | 2009-11-27 | 2011-09-27 | 동국대학교 산학협력단 | 온톨로지를 이용한 문서의 군집화 방법 및 장치 |
WO2011096690A3 (ko) * | 2010-02-03 | 2011-12-15 | 고려대학교 산학협력단 | 사용자 관심 주제를 추출하는 휴대용 통신 단말기 및 그 방법 |
US9323845B2 (en) | 2010-02-03 | 2016-04-26 | Korea University Research And Business Foundation | Portable communication terminal for extracting subjects of interest to the user, and a method therefor |
KR101035038B1 (ko) * | 2010-10-12 | 2011-05-19 | 한국과학기술정보연구원 | 분류기의 동적 결합에 의한 대용량 분류기 자동 생성 시스템 및 방법 |
WO2012050252A1 (ko) * | 2010-10-12 | 2012-04-19 | 한국과학기술정보연구원 | 분류기의 동적 결합에 의한 대용량 분류기 자동 생성 시스템 및 방법 |
KR20190097496A (ko) * | 2018-02-12 | 2019-08-21 | 전북대학교산학협력단 | 콘텐츠의 토픽 유사도를 결정하는 시스템 및 방법 |
KR20190113191A (ko) * | 2018-03-28 | 2019-10-08 | 주식회사 에이제이케이 | 미디어를 활용한 지수 결정 방법 및 그를 위한 시스템 |
KR20200103172A (ko) * | 2019-02-12 | 2020-09-02 | 주식회사 자이냅스 | 문서 학습 장치 |
KR20200103170A (ko) * | 2019-02-12 | 2020-09-02 | 주식회사 자이냅스 | 문서 학습 프로그램 |
KR20200103174A (ko) * | 2019-02-12 | 2020-09-02 | 주식회사 자이냅스 | 문서 학습 프로그램 |
KR20200103175A (ko) * | 2019-02-12 | 2020-09-02 | 주식회사 자이냅스 | 기록매체 |
KR20200103169A (ko) * | 2019-02-12 | 2020-09-02 | 주식회사 자이냅스 | 문서 학습 방법 |
KR20200103171A (ko) * | 2019-02-12 | 2020-09-02 | 주식회사 자이냅스 | 기록매체 |
KR20200103173A (ko) * | 2019-02-12 | 2020-09-02 | 주식회사 자이냅스 | 문서 학습 방법 |
WO2021263138A1 (en) * | 2020-06-25 | 2021-12-30 | Pryon Incorporated | Document processing and response generation system |
US11593364B2 (en) | 2020-06-25 | 2023-02-28 | Pryon Incorporated | Systems and methods for question-and-answer searching using a cache |
GB2611716A (en) * | 2020-06-25 | 2023-04-12 | Pryon Incorporated | Document processing and response generation system |
US11734268B2 (en) | 2020-06-25 | 2023-08-22 | Pryon Incorporated | Document pre-processing for question-and-answer searching |
Also Published As
Publication number | Publication date |
---|---|
KR101112989B1 (ko) | 2012-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101112989B1 (ko) | 지능형 정보 서비스를 위한 계층적 문서 분류 장치 및 방법 | |
US9495358B2 (en) | Cross-language text clustering | |
US7461044B2 (en) | It resource event situation classification and semantics | |
US9588958B2 (en) | Cross-language text classification | |
Linhares Pontes et al. | Impact of OCR quality on named entity linking | |
CN104281702B (zh) | 基于电力关键词分词的数据检索方法及装置 | |
US20190392035A1 (en) | Information object extraction using combination of classifiers analyzing local and non-local features | |
CN106815310A (zh) | 一种对海量文档集的层次聚类方法及系统 | |
US11983501B2 (en) | Apparatus and method for automatic generation of machine reading comprehension training data | |
CN112131876A (zh) | 一种基于相似度确定标准问题的方法及系统 | |
Ogada et al. | N-gram based text categorization method for improved data mining | |
Ju et al. | Leveraging information bottleneck for scientific document summarization | |
Touahri et al. | Deep analysis of an Arabic sentiment classification system based on lexical resource expansion and custom approaches building | |
Wehnert et al. | Concept Hierarchy Extraction from Legal Literature. | |
Fard et al. | Seed-guided deep document clustering | |
Leotta et al. | My MOoD, a Multimedia and Multilingual Ontology Driven MAS: Design and First Experiments in the Sentiment Analysis Domain. | |
KR100659370B1 (ko) | 시소러스 매칭에 의한 문서 db 형성 방법 및 정보검색방법 | |
Eick et al. | Hardware accelerated algorithms for semantic processing of document streams | |
El Idrissi et al. | HCHIRSIMEX: An extended method for domain ontology learning based on conditional mutual information | |
Chen et al. | Novel word features for keyword extraction | |
Todor et al. | Enriching topic models with DBpedia | |
Gope et al. | Medical document classification from OHSUMED dataset | |
Rigutini et al. | Automatic term categorization by extracting knowledge from the Web | |
Li et al. | Hierarchical topic model and summarization | |
Rozeva | Classification of text documents supervised by domain ontologies |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20141229 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20151228 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20161228 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20171226 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20190115 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20200114 Year of fee payment: 9 |