KR100858035B1 - 형태소 분석용 다차원 해석 사전 구축 방법 및 그 다차원해석 사전 구축 장치 - Google Patents
형태소 분석용 다차원 해석 사전 구축 방법 및 그 다차원해석 사전 구축 장치 Download PDFInfo
- Publication number
- KR100858035B1 KR100858035B1 KR1020070024439A KR20070024439A KR100858035B1 KR 100858035 B1 KR100858035 B1 KR 100858035B1 KR 1020070024439 A KR1020070024439 A KR 1020070024439A KR 20070024439 A KR20070024439 A KR 20070024439A KR 100858035 B1 KR100858035 B1 KR 100858035B1
- Authority
- KR
- South Korea
- Prior art keywords
- information
- dictionary
- analysis
- database
- dictionary database
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
Abstract
Description
Claims (10)
- 형태소 분석 시스템에 이용되는 다차원 해석 사전을 구축하는 방법으로서,온톨로지 데이터베이스로부터 태스크 온톨로지로 작성된 데이터 엔트리들을 추출하고, 상기 데이터 엔트리들의 의미 정보를 추출하며, 상기 데이터 엔트리들의 의미 정보 사이의 관계를 추출하는 단계와,상기 추출된 각각의 정보에 n차원의 벡터 정보를 부가하여 품사 사전 데이터베이스를 구축하는 단계와,상기 추출된 각각의 정보에 n차원의 벡터 정보를 부가함과 아울러 여러 형태소로 이루어지는 단어들을 하나의 의미를 갖는 것으로 규정하여 어휘 사전 데이터베이스를 구축하는 단계와,특수 문법 연산자를 이용하여 상기 품사 사전 데이터베이스에 정의된 각각의 정보가 상호 연결가능한지 여부를 규정하는 문법 사전 데이터베이스를 구축하는 단계를 포함하는 것을 특징으로 하는 다차원 해석 사전 구축 방법.
- 청구항 1에 있어서, 상기 데이터베이스들에 등록되지 않은 정보가 n차원 벡터 정보가 부가되어 구축되어 있고 상기 어휘 사전 데이터베이스의 정보보다 우선적으로 적용되도록 되어 있는 사용자 사전 데이터베이스를 구축하는 단계를 더 포함하는 것을 특징으로 하는 다차원 해석 사전 구축 방법.
- 청구항 1 또는 청구항 2에 있어서, 상기 n차원의 벡터 정보는 어류 태그 정보, 형태적 정보, 통사적 정보, 의미적 정보 및 화용 정보의 5차원의 벡터 정보이고, 각각의 벡터 정보는 특수 문자를 포함하고 그 특수 문자 안에 형태소 분석 및 온톨로지 데이터베이스에의 접근을 용이하게 하는 단어 부류 및 단어의 속성이 표현되어 있는 것을 특징으로 하는 다차원 해석 사전 구축 방법.
- 청구항 3에 있어서, 상기 벡터 정보는 각각 {}의 특수 문자를 포함하며, {}의 특수 문자 안에 형태소 분석 및 온톨로지 데이터베이스에의 접근을 용이하게 하는 단어 부류 및 단어의 속성이 표현되어 있는 것인 다차원 해석 사전 구축 방법.
- 청구항 4에 있어서, 상기 특수 문법 연산자는 양방향 화살표(<->)와 단방향 화살표(->, <-)를 포함하는 것을 특징으로 하는 다차원 해석 사전 구축 방법.
- 온톨로지 데이터베이스와,어휘 사전 데이터베이스와, 품사 사전 데이터베이스 및 문법 사전 데이터베이스를 포함하는 다차원 해석 사전 데이터베이스와,상기 온톨로지 데이터베이스에 저장되어 있는 태스크 온톨로지로 작성된 표현들을 추출하고, 상기 표현들의 의미 정보를 추출하며, 상기 표현들의 의미 정보 사이의 관계를 추출하여 다차원 해석 사전 데이터베이스에 반영하는 임포터를 포함하고,상기 품사 사전 데이터베이스의 각각의 품사는 어류 태그 정보, 형태적 정보, 통사적 정보, 의미적 정보 및 화용 정보의 5차원의 벡터 정보가 부가되어 정의되어 있으며,상기 어휘 사전 데이터베이스에는 각각의 기본 형태소에 상기 5차원의 벡터 정보가 부가되어 정의됨과 아울러, 여러 형태소로 이루어지는 단어들이 하나의 의미를 갖는 것으로 규정되어 태스크 온톨로지에 정의된 정보의 단위와 일치되어 등록되어 있으며,상기 문법 사전 데이터베이스에는 특수 문법 연산자를 이용하여 상기 품사 사전 데이터베이스에 정의된 각각의 품사가 서로 연결가능한지 여부를 규정하는 문법이 구축되어 있는 것을 특징으로 하는 형태소 분석 시스템에 이용되는 다차원 해석 사전 구축 장치.
- 청구항 6에 있어서, 상기 데이터베이스들에 등록되지 않은 정보가 n차원 벡터 정보가 부가되어 구축되어 있고 상기 어휘 사전 데이터베이스의 정보보다 우선적으로 적용되도록 되어 있는 사용자 사전 데이터베이스를 더 포함하는 것을 특징으로 하는 형태소 분석 시스템에 이용되는 다차원 해석 사전 구축 장치.
- 청구항 6 또는 청구항 7에 있어서, 상기 각각의 벡터 정보는 특수 문자를 포함하고 그 특수 문자 안에 형태소 분석 및 온톨로지 데이터베이스에의 접근을 용이 하게 하는 단어 부류 및 단어의 속성이 표현되어 있는 것을 특징으로 하는 형태소 분석 시스템에 이용되는 다차원 해석 사전 구축 장치.
- 청구항 8에 있어서, 상기 특수 문자는 {}의 특수 문자를 포함하며, {}의 특수 문자 안에 형태소 분석 및 온톨로지 데이터베이스에의 접근을 용이하게 하는 단어 부류 및 단어의 속성이 표현되어 있는 것을 특징으로 하는 형태소 분석 시스템에 이용되는 다차원 해석 사전 구축 장치.
- 청구항 8에 있어서, 상기 특수 문법 연산자는 양방향 화살표(<->)와 단방향 화살표(->, <-)를 포함하는 것을 특징으로 하는 형태소 분석 시스템에 이용되는 다차원 해석 사전 구축 장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070024439A KR100858035B1 (ko) | 2007-03-13 | 2007-03-13 | 형태소 분석용 다차원 해석 사전 구축 방법 및 그 다차원해석 사전 구축 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070024439A KR100858035B1 (ko) | 2007-03-13 | 2007-03-13 | 형태소 분석용 다차원 해석 사전 구축 방법 및 그 다차원해석 사전 구축 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR100858035B1 true KR100858035B1 (ko) | 2008-09-10 |
Family
ID=40022952
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070024439A KR100858035B1 (ko) | 2007-03-13 | 2007-03-13 | 형태소 분석용 다차원 해석 사전 구축 방법 및 그 다차원해석 사전 구축 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100858035B1 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101100848B1 (ko) | 2010-04-30 | 2012-01-02 | 정규홍 | 어휘 데이터베이스를 생성하는 방법 및 그 어휘 데이터베이스를 저장하는 컴퓨터 판독가능 매체 |
KR101339103B1 (ko) * | 2011-10-05 | 2013-12-09 | (주)워드워즈 | 의미적 자질을 이용한 문서 분류 시스템 및 그 방법 |
CN111723162A (zh) * | 2020-06-19 | 2020-09-29 | 广州小鹏车联网科技有限公司 | 词典处理方法、处理装置、服务器和语音交互系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20060064778A (ko) * | 2004-12-09 | 2006-06-14 | 학교법인 울산공업학원 | 문장추상화와 개연규칙을 활용하는 문서요약 방법 및 시스템 |
KR20060067073A (ko) * | 2004-12-14 | 2006-06-19 | 한국전자통신연구원 | 영한 자동번역을 위하여 동사구 패턴 및 의미 벡터를 사용하는 동사/명사 대역어 선택 장치 및 그 방법 |
KR20060067785A (ko) * | 2004-12-15 | 2006-06-20 | 한국전자통신연구원 | 복합 명사 전문용어 사전 엔트리의 재분석 방법 및 그 장치 |
-
2007
- 2007-03-13 KR KR1020070024439A patent/KR100858035B1/ko active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20060064778A (ko) * | 2004-12-09 | 2006-06-14 | 학교법인 울산공업학원 | 문장추상화와 개연규칙을 활용하는 문서요약 방법 및 시스템 |
KR20060067073A (ko) * | 2004-12-14 | 2006-06-19 | 한국전자통신연구원 | 영한 자동번역을 위하여 동사구 패턴 및 의미 벡터를 사용하는 동사/명사 대역어 선택 장치 및 그 방법 |
KR20060067785A (ko) * | 2004-12-15 | 2006-06-20 | 한국전자통신연구원 | 복합 명사 전문용어 사전 엔트리의 재분석 방법 및 그 장치 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101100848B1 (ko) | 2010-04-30 | 2012-01-02 | 정규홍 | 어휘 데이터베이스를 생성하는 방법 및 그 어휘 데이터베이스를 저장하는 컴퓨터 판독가능 매체 |
KR101339103B1 (ko) * | 2011-10-05 | 2013-12-09 | (주)워드워즈 | 의미적 자질을 이용한 문서 분류 시스템 및 그 방법 |
CN111723162A (zh) * | 2020-06-19 | 2020-09-29 | 广州小鹏车联网科技有限公司 | 词典处理方法、处理装置、服务器和语音交互系统 |
CN111723162B (zh) * | 2020-06-19 | 2023-08-25 | 北京小鹏汽车有限公司 | 词典处理方法、处理装置、服务器和语音交互系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101339103B1 (ko) | 의미적 자질을 이용한 문서 분류 시스템 및 그 방법 | |
KR101136007B1 (ko) | 문서 감성 분석 시스템 및 그 방법 | |
Perkins | Python text processing with NLTK 2.0 cookbook | |
US9152623B2 (en) | Natural language processing system and method | |
RU2509350C2 (ru) | Способ семантической обработки естественного языка с использованием графического языка-посредника | |
US20100121630A1 (en) | Language processing systems and methods | |
Tabassum et al. | A survey on text pre-processing & feature extraction techniques in natural language processing | |
Abbas | Quran'search for a concept'tool and website | |
Arumugam et al. | Hands-On Natural Language Processing with Python: A practical guide to applying deep learning architectures to your NLP applications | |
US9460076B1 (en) | Method for unsupervised learning of grammatical parsers | |
JP2011118689A (ja) | 検索方法及びシステム | |
Rodrigues et al. | Advanced applications of natural language processing for performing information extraction | |
Pinto et al. | A graph-based multi-level linguistic representation for document understanding | |
KR20120064559A (ko) | 오픈 웹 질의응답을 위한 질문분석 장치 및 방법 | |
Thomas | Natural language processing with spark NLP: learning to understand text at scale | |
Zouaoui et al. | A novel quranic search engine using an ontology-based semantic indexing | |
KR100858035B1 (ko) | 형태소 분석용 다차원 해석 사전 구축 방법 및 그 다차원해석 사전 구축 장치 | |
EP2184685A1 (en) | Method for semantic processing of natural language using graphical interlingua | |
WO2022134824A1 (en) | Tuning query generation patterns | |
Antić | Python Natural Language Processing Cookbook: Over 50 recipes to understand, analyze, and generate text for implementing language processing tasks | |
JP2997469B2 (ja) | 自然言語理解方法および情報検索装置 | |
Ceglarek | Semantic compression for text document processing | |
Oudah et al. | Studying the impact of language-independent and language-specific features on hybrid Arabic Person name recognition | |
Dung et al. | Ontology-based information extraction and information retrieval in health care domain | |
Testas | Natural Language Processing with Pandas, Scikit-Learn, and PySpark |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20120924 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20130816 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20140902 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20150909 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20160720 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20170829 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20180830 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20190826 Year of fee payment: 12 |