KR20190140534A - 컨셉넷을 이용한 소정 언어의 관계 분석 시스템 및 방법 - Google Patents
컨셉넷을 이용한 소정 언어의 관계 분석 시스템 및 방법 Download PDFInfo
- Publication number
- KR20190140534A KR20190140534A KR1020180062761A KR20180062761A KR20190140534A KR 20190140534 A KR20190140534 A KR 20190140534A KR 1020180062761 A KR1020180062761 A KR 1020180062761A KR 20180062761 A KR20180062761 A KR 20180062761A KR 20190140534 A KR20190140534 A KR 20190140534A
- Authority
- KR
- South Korea
- Prior art keywords
- keyword
- relationship
- extracting
- unit
- language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G06F17/289—
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
Abstract
Description
언어 | 단어 개수 | 언어 | 단어 개수 |
English | 1,803,873 | Czech | 129,183 |
French | 3,023,144 | Filipino | 17,620 |
Italian | 1,078,629 | Korean | 47,268 |
Japanese | 363,663 | Slovak | 29,768 |
Chinese | 242,746 | Turkish | 65,892 |
도 2는 본 발명의 일 실시예에 따른 도 1의 전처리부의 구성을 나타낸 블록 구성도.
도 3은 본 발명의 일 실시예에 따른 도 1의 추출부의 구성을 나타낸 블록 구성도.
도 4는 본 발명의 일 실시예에 따른 도 3의 관계추출부의 구성을 보다 상세하게 나타낸 블록 구성도.
도 5는 본 발명의 일 실시예에 따른 데이터 관계를 컨셉넷을 이용하여 추출한 일 예를 나타낸 표.
도 6은 본 발명의 일 실시예에 따른 도 1의 데이터수집부의 구성을 나타낸 블록 구성도.
도 7은 본 발명의 일 실시예에 따른 컨셉넷을 이용한 소정 언어의 언어관계를 분석하는 과정을 나타낸 순서도.
도 8은 본 발명의 일 실시예에 따른 도 7의 키워드를 추출하는 단계를 나타낸 순서도.
도 9는 본 발명의 일 실시예에 따른 도 7의 상기 카테고리를 추출하고 관계를 추출하는 단계를 나타낸 순서도.
도 10은 본 발명의 일 실시예에 따른 도 9의 관계를 추출하는 단계를 나타낸 순서도.
도 11은 본 발명의 일 실시예에 따른 도 7의 데이터를 수집하는 단계를 나타낸 순서도.
30 : 인터넷사전 40 : 컨셉넷
100 : 전처리부 110 : 뉴스크롤링부
120 : 키워드추출부 200 : 추출부
210 : 카테고리 추출부 220 : 관계추출부
222 : 제1 번역부 224 : 단어관계추출부
226 : 제2 번역부 300 : 데이터수집부
310 : 결합부 320 : 검색부
330 : 데이터베이스 400 ; 입출력부
Claims (12)
- 소정 언어의 주제어가 입력되면 상기 소정 언어의 주제어로부터 네트웍에 접속하여 키워드를 추출하는 전처리부;
상기 소정 언어의 주제어와 연결된 카테고리를 추출하고 관계를 추출하는 추출부;
상기 주제어, 키워드, 카테고리 및 관계를 합산하거나 조합하고 네트웍에 접속하여 상기 합산된 주제어, 키워드, 가테고리 및 관계 데이터와 관련된 데이터를 수집하는 데이터수집부; 및
소정 언어의 상기 주제어를 입력하고 상기 데이터수집부에 수집된 데이터를 출력하는 입출력부;를 포함하는 컨셉넷을 이용한 소정 언어의 관계 분석 시스템. - 제1항에 있어서, 상기 전처리부는,
상기 주제어와 관련된 뉴스를 크롤링하는 뉴스크롤링부;
상기 뉴스크롤링부에 의해 크롤링된 뉴스들로부터 키워드를 추출하는 키워드추출부;를 포함하는 것인 컨셉넷을 이용한 소정 언어의 관계 분석 시스템. - 제1항에 있어서, 상기 추출부는,
상기 주제어와 상기 키워드를 이용하여 네트웍으로 연결된 인터넷사전의 API로부터 카테고리를 추출하는 카테고리 추출부; 및
상기 주제어, 키워드 및 카테고리를 컨셉넷에 연결하여 관계를 추출하는 관계추출부;를 포함하는 것인 컨셉넷을 이용한 소정 언어의 관계 분석 시스템. - 제3항에 있어서, 상기 관계추출부는,
상기 주제어, 키워드 및 카테고리를 상기 컨셉넷에 통용되는 언어로 번역하는 제1 번역부;
상기 제1 번역부에 의해 번역된 상기 주제어, 키워드 및 카테고리를 컨셉넷에 연결하여 관계를 추출하는 단어관계추출부;
상기 추출부에 의해 추출된 관계를 상기 소정의 언어로 번역하는 제2 번역부;를 포함하는 것인 컨셉넷을 이용한 소정 언어의 관계 분석 시스템. - 제4항에 있어서, 상기 단어관계추출부는,
상기 주제어, 키워드 및 카테고리에 대응하는 "이다(IsA)", "관계다(RelatedTo)", "로 만든(MadeOf)", "갖는다(HasA)", "부분(PartOf)"에 대응하는 단어들을 검색하는 것인 컨셉넷을 이용한 소정 언어의 관계 분석 시스템. - 제1항에 있어서, 상기 데이터수집부는,
주제어, 키워드, 카테고리 및 관계를 결합하는 결합부;
네트웍에 접속하여 결합된 주제어, 키워드, 카테고리 및 관계에 관련된 데이터를 검색하는 검색부; 및
상기 주제어, 키워드, 카테고리 및 관계에 의해 검색된 데이터를 저장하는 데이터베이스;를 포함하여 구성되는 것인 컨셉넷을 이용한 소정 언어의 관계 분석 시스템. - 소정 언어의 주제어를 입력받는 단계;
네트웍에 접속하여 상기 주제어에 대응하는 키워드를 추출하는 단계;
상기 소정 언어의 주제어와 전처리부에 의해 추출된 키워드를 이용하여 상기 주제어에 대응하는 카테고리를 추출하고 관계를 추출하는 단계;
상기 주제어, 키워드 및 카테고리를 컨셉넷에 연결하여 관계를 추출하는 단계;
상기 주제어, 키워드, 카테고리 및 관계를 합산하거나 조합하는 단계;
네트웍에 접속하여 상기 합산되거나 조합된 주제어, 키워드, 카테고리 및 관계 데이터를 수집하는 단계; 및
상기 합산된 주제어, 키워드 및 관계와 관련된 데이터를 출력하는 단계;를 포함하는 것인 컨셉넷을 이용한 소정 언어의 관계 분석 방법. - 제7항에 있어서, 상기 키워드를 추출하는 단계는,
상기 주제어와 관련된 뉴스를 크롤링하는 단계;
상기 크롤링된 뉴스들로부터 키워드를 추출하는 단계;를 포함하는 것인 컨셉넷을 이용한 소정 언어의 관계 분석 방법. - 제7항에 있어서, 상기 카테고리를 추출하고 관계를 추출하는 단계는,
상기 주제어와 상기 키워드를 이용하여 네트웍으로 연결된 인터넷사전의 API로부터 카테고리를 추출하는 단계; 및
상기 주제어, 키워드 및 카테고리를 컨셉넷에 연결하여 관계를 추출하는 단계;를 포함하여 구성되는 것인 컨셉넷을 이용한 소정 언어의 관계 분석 방법. - 제9항에 있어서, 상기 관계를 추출하는 단계는,
상기 주제어, 키워드 및 카테고리를 상기 컨셉넷에 통용되는 언어로 번역하는 제1 번역단계;
상기 제1 번역단계에서 번역된 상기 주제어, 키워드 및 카테고리를 컨셉넷에 연결하여 관계를 추출하는 단계;
상기 추출하는 단계에서 추출된 관계를 상기 소정의 언어로 번역하는 제2 번역단계;를 포함하여 구성되는 것인 컨셉넷을 이용한 소정 언어의 관계 분석 방법. - 제9항에 있어서, 상기 관계를 추출하는 단계는,
"이다(IsA)", "관계다(RelatedTo)", "로 만든(MadeOf)", "갖는다(HasA)", "부분(PartOf)"에 대응하는 단어들을 검색하는 것인 컨셉넷을 이용한 소정 언어의 관계 분석 방법. - 제7항에 있어서, 상기 데이터를 수집하는 단계는,
네트웍에 접속하여 결합된 주제어, 키워드, 카테고리 및 관계에 관련된 데이터를 검색하는 단계; 및
상기 주제어, 키워드, 카테고리 및 관계에 의해 검색된 데이터를 저장하는 단계;를 포함하여 구성되는 것인 컨셉넷을 이용한 소정 언어의 관계 분석 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180062761A KR102102345B1 (ko) | 2018-05-31 | 2018-05-31 | 컨셉넷을 이용한 소정 언어의 관계 분석 시스템 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180062761A KR102102345B1 (ko) | 2018-05-31 | 2018-05-31 | 컨셉넷을 이용한 소정 언어의 관계 분석 시스템 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190140534A true KR20190140534A (ko) | 2019-12-20 |
KR102102345B1 KR102102345B1 (ko) | 2020-04-20 |
Family
ID=69062961
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180062761A Active KR102102345B1 (ko) | 2018-05-31 | 2018-05-31 | 컨셉넷을 이용한 소정 언어의 관계 분석 시스템 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102102345B1 (ko) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20100125682A (ko) * | 2009-05-21 | 2010-12-01 | 주식회사 아이네크 | 다수 분류 체계를 연동한 시멘틱 검색 방법 및 시스템 |
KR101589621B1 (ko) | 2015-02-23 | 2016-01-28 | 주식회사 와이즈넛 | 텍스트 분석 및 응답 시스템을 위한 어휘의미패턴의 사전 구축 방법 |
-
2018
- 2018-05-31 KR KR1020180062761A patent/KR102102345B1/ko active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20100125682A (ko) * | 2009-05-21 | 2010-12-01 | 주식회사 아이네크 | 다수 분류 체계를 연동한 시멘틱 검색 방법 및 시스템 |
KR101589621B1 (ko) | 2015-02-23 | 2016-01-28 | 주식회사 와이즈넛 | 텍스트 분석 및 응답 시스템을 위한 어휘의미패턴의 사전 구축 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR102102345B1 (ko) | 2020-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7424421B2 (en) | Word collection method and system for use in word-breaking | |
KR20160060253A (ko) | 자연어 질의 응답 시스템 및 방법 | |
KR20060124632A (ko) | 대역 판단 장치, 방법 및 프로그램 | |
CN110162768B (zh) | 实体关系的获取方法、装置、计算机可读介质及电子设备 | |
CN102200975A (zh) | 一种利用语义分析的垂直搜索引擎系统与方法 | |
US7440938B2 (en) | Method and apparatus for calculating similarity among documents | |
KR102083017B1 (ko) | 플레이스의 소셜 리뷰 분석 방법 및 시스템 | |
Dalton et al. | A neighborhood relevance model for entity linking | |
CN101763403A (zh) | 面向多语言信息检索系统的查询翻译方法 | |
CN103020311B (zh) | 一种用户检索词的处理方法及系统 | |
Alkhatib et al. | Paraphrasing Arabic metaphor with neural machine translation | |
JP2003150623A (ja) | 言語横断型特許文献検索方法 | |
KR101505673B1 (ko) | 단어의 의미를 기반으로 하는 다국어 검색 시스템, 다국어 검색 방법 및 이를 이용한 이미지 검색 시스템 | |
KR100892990B1 (ko) | 검색사이트의 자동비교 검색시스템 및 검색방법 | |
KR102102345B1 (ko) | 컨셉넷을 이용한 소정 언어의 관계 분석 시스템 및 방법 | |
US9336317B2 (en) | System and method for searching aliases associated with an entity | |
KR102102344B1 (ko) | 컨셉넷을 이용한 한국어 관계 분석 시스템 및 방법 | |
KR20010097802A (ko) | 다국어 검색과 검색정보 자동번역/분류 시스템과 그를이용한 다국어 검색방법 | |
TW201629801A (zh) | 資訊取得系統與方法、以及儲存裝置 | |
Lu et al. | Translation disambiguation in web-based translation extraction for English-Chinese CLIR | |
KR102309802B1 (ko) | Sns 사이트 트렌드 분석방법 | |
KR100956413B1 (ko) | 언어 교차 검색 방법 및 시스템 | |
Kim et al. | A study on the construction of national R&D data-based customized information curation system | |
Huang et al. | Creating Chinese-English Comparable Corpora | |
JP3025847B2 (ja) | 電子化辞書検索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20180531 |
|
PA0201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20191020 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20200408 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20200413 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20200414 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20230412 Start annual number: 4 End annual number: 4 |