KR102151858B1 - 링크드 데이터와 문자열 데이터를 이용한 온톨로지 인스턴스 확장 방법 및 시스템 - Google Patents
링크드 데이터와 문자열 데이터를 이용한 온톨로지 인스턴스 확장 방법 및 시스템 Download PDFInfo
- Publication number
- KR102151858B1 KR102151858B1 KR1020180160898A KR20180160898A KR102151858B1 KR 102151858 B1 KR102151858 B1 KR 102151858B1 KR 1020180160898 A KR1020180160898 A KR 1020180160898A KR 20180160898 A KR20180160898 A KR 20180160898A KR 102151858 B1 KR102151858 B1 KR 102151858B1
- Authority
- KR
- South Korea
- Prior art keywords
- ontology
- instance
- concept
- existing
- instances
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000000153 supplemental effect Effects 0.000 title 1
- 238000007781 pre-processing Methods 0.000 claims abstract description 16
- 238000013507 mapping Methods 0.000 claims abstract description 12
- 238000000605 extraction Methods 0.000 claims description 20
- 238000001914 filtration Methods 0.000 claims description 6
- 238000013500 data storage Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 11
- 230000009193 crawling Effects 0.000 description 4
- 238000009825 accumulation Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
Description
도 2는 본 발명의 일 실시예에 따른 링크드 데이터와 문자열 데이터를 이용하는 온톨로지 인스턴스 확장 방법을 설명하기 위한 흐름도이다.
도 3은 본 발명의 일 실시예에 따른 온톨로지 전처리 과정을 설명하기 위한 흐름도이다.
도 4는 본 발명의 일 실시예에 따른 인스턴스 및 트리플 추출 과정 중 유사 개념 매핑 과정을 설명하기 위한 흐름도이다.
도 5는 본 발명의 일 실시예에 따른 인스턴스 및 트리플 추출 과정 중 트리플 추출 과정을 설명하기 위한 흐름도이다.
Claims (12)
- 기존 온톨로지와 참조 온톨로지를 전처리하는 과정을 거쳐 지식 맵을 만드는 단계;
지식 맵을 이용하여 기존 온톨로지의 개념과 유사도가 가장 높은 참조 온톨로지의 개념을 매핑하는 단계;
지식 맵을 이용하여 기존 온톨로지의 개념 각각에 매핑된 참조 온톨로지의 개념이 갖고 있는 인스턴스 중 기존 온톨로지에 존재하지 않는 새로운 인스턴스 및 트리플을 추출하는 단계;
새로운 인스턴스와 기존 인스턴스 간에 생길 수 있는 잠재관계를 찾기 위해 키워드를 만들고, 웹 상에서 검색 후 검색결과를 문자열 데이터로 축적하는 단계; 및
축적된 문자열 데이터를 분석하여 잠재관계가 유효한지 검증하는 단계
를 포함하고,
지식 맵을 이용하여 기존 온톨로지의 개념 각각에 매핑된 참조 온톨로지의 개념이 갖고 있는 인스턴스 중 기존 온톨로지에 존재하지 않는 새로운 인스턴스 및 트리플을 추출하는 단계는,
매핑된 참조 온톨로지의 개념이 갖는 인스턴스들 중에서 기존 온톨로지의 개념이 가지고 있지 않은 인스턴스들을 추출하는 단계;
추출된 인스턴스들과 관련이 있고, 기존 온톨로지와 유효한 관계를 나타내는 트리플들 중 새로운 인스턴스를 포함하는 트리플을 추출하는 단계; 및
기존 온톨로지에 유효한 트리플이 되도록 인스턴스와 서술부를 변환하는 단계
를 포함하는 온톨로지 인스턴스 확장 방법. - 제1항에 있어서,
기존 온톨로지와 참조 온톨로지를 전처리하는 과정을 거쳐 지식 맵을 만드는 단계는,
각 온톨로지를 읽는 단계;
각 온톨로지를 RDF 트리플들로 변환하는 단계;
변환된 RDF 트리플들 중 불필요한 지식을 담고 있는 트리플들을 필터링하는 단계; 및
나머지 RDF 트리플들을 이용하여 지식 맵을 생성하는 단계
를 포함하는 온톨로지 인스턴스 확장 방법. - 제1항에 있어서,
지식 맵을 이용하여 기존 온톨로지의 개념과 유사도가 가장 높은 참조 온톨로지의 개념을 매핑하는 단계는,
기존 온톨로지 및 참조 온톨로지의 개념들을 매핑할 뿐만 아니라 각 개념들이 가지는 인스턴스들 간에 유사도가 제일 높은 것끼리 매핑하고,
유사도를 계산하는 방법으로 구문(syntactic) 유사도, 언어(linguistic) 유사도, 인스턴스 유사도에 각각 다른 가중치를 두어 계산하는
를 포함하는 온톨로지 인스턴스 확장 방법. - 삭제
- 제1항에 있어서,
새로운 인스턴스와 기존 인스턴스 간에 생길 수 있는 잠재관계를 찾기 위해 키워드를 만들고, 웹 상에서 검색 후 검색결과를 문자열 데이터로 축적하는 단계는,
찾고자 하는 잠재관계의 주어, 서술어, 목적어 및 온톨로지를 나타내는 최상위 개념의 인스턴스로 구성되고, 온톨로지의 최상위 개념은 다른 개념으로 나아가는 관계를 하나 이상 가지고 있고, 역관계(inverse property)를 제외한 다른 개념으로부터 들어오는 관계가 없는 키워드를 생성하는
온톨로지 인스턴스 확장 방법. - 제1항에 있어서,
축적된 문자열 데이터를 분석하여 잠재관계가 유효한지 검증하는 단계는,
축적된 문자열 데이터는 크롤링된 웹 문서의 제목 및 요약 부분에 잠재 관계의 주어, 서술어, 목적어가 포함된 정도를 이용하여 신뢰값을 계산하고, 신뢰값이 높은 잠재관계를 최종적으로 트리플로 만들어 기존 온톨로지에 추가하는
온톨로지 인스턴스 확장 방법. - 기존 온톨로지와 참조 온톨로지를 전처리하는 과정을 거쳐 지식 맵을 만드는 온톨로지 전처리부;
지식 맵을 이용하여 기존 온톨로지의 개념과 유사도가 가장 높은 참조 온톨로지의 개념을 매핑하고, 지식 맵을 이용하여 기존 온톨로지의 개념 각각에 매핑된 참조 온톨로지의 개념이 갖고 있는 인스턴스 중 기존 온톨로지에 존재하지 않는 새로운 인스턴스 및 트리플을 추출하는 인스턴스 추출부;
새로운 인스턴스와 기존 인스턴스 간에 생길 수 있는 잠재관계를 찾기 위해 키워드를 만들고, 웹 상에서 검색 후 검색결과를 문자열 데이터로 축적하는 웹데이터 축적부; 및
축적된 문자열 데이터를 분석하여 잠재관계가 유효한지 검증하는 잠재관계 추출부
를 포함하고,
인스턴스 추출부는,
매핑된 참조 온톨로지의 개념이 갖는 인스턴스들 중에서 기존 온톨로지의 개념이 가지고 있지 않은 인스턴스들을 추출하고,
추출된 인스턴스들과 관련이 있고, 기존 온톨로지와 유효한 관계를 나타내는 트리플들 중 새로운 인스턴스를 포함하는 트리플을 추출하고,
기존 온톨로지에 유효한 트리플이 되도록 인스턴스와 서술부를 변환하는
온톨로지 인스턴스 확장 시스템. - 제7항에 있어서,
온톨로지 전처리부는,
각 온톨로지를 RDF 트리플들로 변환하여 변환된 RDF 트리플들 중 불필요한 지식을 담고 있는 트리플들을 필터링하고, 나머지 RDF 트리플들을 이용하여 지식 맵을 생성하는
온톨로지 인스턴스 확장 시스템. - 제7항에 있어서,
인스턴스 추출부는,
기존 온톨로지 및 참조 온톨로지의 개념들을 매핑할 뿐만 아니라 각 개념들이 가지는 인스턴스들 간에 유사도가 제일 높은 것끼리 매핑하고,
유사도를 계산하는 방법으로 구문(syntactic) 유사도, 언어(linguistic) 유사도, 인스턴스 유사도에 각각 다른 가중치를 두어 계산하는
온톨로지 인스턴스 확장 시스템. - 삭제
- 제7항에 있어서,
웹데이터 축적부는,
찾고자 하는 잠재관계의 주어, 서술어, 목적어 및 온톨로지를 나타내는 최상위 개념의 인스턴스로 구성되고, 온톨로지의 최상위 개념은 다른 개념으로 나아가는 관계를 하나 이상 가지고 있고, 역관계(inverse property)를 제외한 다른 개념으로부터 들어오는 관계가 없는 키워드를 생성하는
온톨로지 인스턴스 확장 시스템. - 제7항에 있어서,
잠재관계 추출부는,
축적된 문자열 데이터는 크롤링된 웹 문서의 제목 및 요약 부분에 잠재 관계의 주어, 서술어, 목적어가 포함된 정도를 이용하여 신뢰값을 계산하고, 신뢰값이 높은 잠재관계를 최종적으로 트리플로 만들어 기존 온톨로지에 추가하는
온톨로지 인스턴스 확장 시스템.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180160898A KR102151858B1 (ko) | 2018-12-13 | 2018-12-13 | 링크드 데이터와 문자열 데이터를 이용한 온톨로지 인스턴스 확장 방법 및 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180160898A KR102151858B1 (ko) | 2018-12-13 | 2018-12-13 | 링크드 데이터와 문자열 데이터를 이용한 온톨로지 인스턴스 확장 방법 및 시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200072851A KR20200072851A (ko) | 2020-06-23 |
KR102151858B1 true KR102151858B1 (ko) | 2020-09-03 |
Family
ID=71137821
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180160898A KR102151858B1 (ko) | 2018-12-13 | 2018-12-13 | 링크드 데이터와 문자열 데이터를 이용한 온톨로지 인스턴스 확장 방법 및 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102151858B1 (ko) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102550868B1 (ko) * | 2021-01-22 | 2023-07-04 | 인하대학교 산학협력단 | 교원 업적 검증 시스템 |
CN112966120B (zh) * | 2021-02-26 | 2021-09-17 | 重庆大学 | 一种关系强度分析系统及信息推荐系统 |
CN117852637B (zh) * | 2024-03-07 | 2024-05-24 | 南京师范大学 | 一种基于定义的学科概念知识体系自动构建方法与系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140324750A1 (en) | 2013-04-24 | 2014-10-30 | Alcatel-Lucent | Ontological concept expansion |
KR101521112B1 (ko) * | 2013-12-20 | 2015-05-19 | 동국대학교 산학협력단 | 데이터를 연결 및 병합하는 방법 및 장치 |
US20160335544A1 (en) | 2015-05-12 | 2016-11-17 | Claudia Bretschneider | Method and Apparatus for Generating a Knowledge Data Model |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101301077B1 (ko) * | 2011-01-14 | 2013-09-03 | 경북대학교 산학협력단 | 온톨로지 정렬 방법 및 이를 적용한 온톨로지 정렬 시스템 |
KR101991320B1 (ko) * | 2017-03-24 | 2019-06-21 | (주)아크릴 | 온톨로지에 의해 표현되는 자원들을 이용하여 상기 온톨로지를 확장하는 방법 |
-
2018
- 2018-12-13 KR KR1020180160898A patent/KR102151858B1/ko active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140324750A1 (en) | 2013-04-24 | 2014-10-30 | Alcatel-Lucent | Ontological concept expansion |
KR101521112B1 (ko) * | 2013-12-20 | 2015-05-19 | 동국대학교 산학협력단 | 데이터를 연결 및 병합하는 방법 및 장치 |
US20160335544A1 (en) | 2015-05-12 | 2016-11-17 | Claudia Bretschneider | Method and Apparatus for Generating a Knowledge Data Model |
Also Published As
Publication number | Publication date |
---|---|
KR20200072851A (ko) | 2020-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10642938B2 (en) | Artificial intelligence based method and apparatus for constructing comment graph | |
JP5617095B2 (ja) | 新たな画像及びその情報を画像データベースに書き込むための方法、システム、及びプログラム | |
CN111737997A (zh) | 一种文本相似度确定方法、设备及储存介质 | |
KR20130060720A (ko) | 목적 기반 시맨틱 서비스 디스커버리를 위한 서비스 목적 해석 장치 및 방법 | |
KR102151858B1 (ko) | 링크드 데이터와 문자열 데이터를 이용한 온톨로지 인스턴스 확장 방법 및 시스템 | |
CN104598218B (zh) | 用于合并和重用门户信息的方法和系统 | |
WO2014108004A1 (zh) | 一种微博用户身份识别方法及系统 | |
CN112115232A (zh) | 一种数据纠错方法、装置及服务器 | |
CN109643315B (zh) | 基于结构化网络知识自动生成中文本体库的方法、系统、计算机设备和计算机可读介质 | |
WO2015188719A1 (zh) | 结构化数据与图片的关联方法与关联装置 | |
KR20200071877A (ko) | 자율 증강형 반복 학습을 이용한 정보 추출 방법 및 시스템 | |
US20140282393A1 (en) | Jabba language | |
KR20130093889A (ko) | 한국어 키워드 검색문 해석 장치 및 방법 | |
Grigalis | Towards web-scale structured web data extraction | |
KR20210097408A (ko) | 유해 웹사이트 정보의 업데이트 장치 및 이에 의한 방법 | |
KR102091633B1 (ko) | 연관법령 제공 방법 | |
KR20190138037A (ko) | 사이버 보안 특화의 지식 베이스를 이용한 정보 검색 시스템 및 그 방법 | |
CN104778232B (zh) | 一种基于长查询的搜索结果的优化方法和装置 | |
Nethra et al. | WEB CONTENT EXTRACTION USING HYBRID APPROACH. | |
JP6749865B2 (ja) | 情報収集装置、および、情報収集方法 | |
US20240012627A1 (en) | Entity search engine powered by copy-detection | |
KR20180113444A (ko) | 개체명 연결 방법, 장치, 시스템 및 컴퓨터 프로그램 | |
CN103886049B (zh) | 数据空间中异质异构相关数据集合挖掘方法 | |
CN114638225B (zh) | 一种基于科技文献图网络的关键词自动抽取方法 | |
CN105528414B (zh) | 一种搜集深网数据全集的爬虫方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20181213 |
|
PA0201 | Request for examination | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20200218 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20200528 |
|
PG1501 | Laying open of application | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20200828 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20200828 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20230908 Start annual number: 4 End annual number: 4 |