KR101072147B1 - Method and system for transforming blog posting to Ontology-based information - Google Patents
Method and system for transforming blog posting to Ontology-based information Download PDFInfo
- Publication number
- KR101072147B1 KR101072147B1 KR1020090010525A KR20090010525A KR101072147B1 KR 101072147 B1 KR101072147 B1 KR 101072147B1 KR 1020090010525 A KR1020090010525 A KR 1020090010525A KR 20090010525 A KR20090010525 A KR 20090010525A KR 101072147 B1 KR101072147 B1 KR 101072147B1
- Authority
- KR
- South Korea
- Prior art keywords
- ontology
- tag
- based information
- blog
- recommendation
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/117—Tagging; Marking up; Designating a block; Setting of attributes
Abstract
본 발명은 블로그 포스트를 온톨로지 기반 정보로 변환하는 방법 및 그 시스템에 관한 것으로, 블로그의 포스트(게시물)에 대한 태그를 추천하고 사용자에 의해 선택된 태그를 기초로 어노테이션(annotation)하여 온톨로지 기반 정보로 변환할 수 있는 블로그 포스트를 온톨로지 기반 정보로 변환하는 방법 및 그 시스템을 제공한다. 이를 위한 본 발명은 사용자 단말이 웹 브라우저를 통해 블로그의 본문 및 본문에 대한 카테고리를 입력하는 입력 단계와; 상기 입력된 본문의 개체명을 상기 카테고리에 대응하는 관심 온톨로지에서 검색하고 다수의 추천 태그로서 상기 사용자 단말로 제공하는 태그추천 단계와; 상기 사용자 단말이 상기 추천된 다수의 태그를 확인하여 그 중 하나를 선택하는 선택 단계와; 상기 선택된 추천 태그를 기초로 상기 입력된 본문을 온톨로지 기반 정보로 변환하여 저장하는 변환 단계;를 포함하는 것을 특징으로 한다. 상기와 같은 구성에 의해 본 발명은 정확한 시맨틱 어노테이션이 가능하여 인스턴스 분류와 태그에 의해 검색, 인스턴스 분석, 인스턴스들 간의 분석 등 차세대 시맨틱 검색이 용이하게 되는 효과가 있다. The present invention relates to a method and system for converting a blog post into ontology-based information, and recommends a tag for a post (post) of the blog and annotates based on a tag selected by a user to convert into ontology-based information. Provided are methods and systems for converting blog posts into ontology-based information. The present invention for this purpose comprises the input step of the user terminal inputs the body of the blog and the category for the body via a web browser; A tag recommendation step of searching for an object name of the input text in an ontology of interest corresponding to the category and providing the user name as a plurality of recommendation tags to the user terminal; A selection step of checking, by the user terminal, the recommended plurality of tags and selecting one of the tags; And converting the inputted text into ontology-based information based on the selected recommendation tag and storing the ontology-based information. According to the above configuration, the present invention enables accurate semantic annotation, thereby facilitating next-generation semantic search such as searching, instance analysis, and analysis between instances by instance classification and tags.
블로그, 포스트, 온톨로지, 인스턴스, 태그 Blog, post, ontology, instance, tag
Description
본 발명은 블로그 포스트를 온톨로지 기반 정보로 변환하는 방법 및 그 시스템에 관한 것으로, 특히, 블로그의 포스트(게시물)에 대한 태그를 사용자가 선택한 주제(Topic) 및 이벤트(event)에 대한 정보를 기초로 추천하고 선택된 태그를 기초로 어노테이션(annotation)하여 온톨로지 기반 정보로 변환할 수 있는 블로그 포스트를 온톨로지 기반 정보로 변환하는 방법 및 그 시스템에 관한 것이다. The present invention relates to a method and system for converting a blog post into ontology-based information, and more particularly, based on information on a topic and an event selected by a user for a tag for a post (post) of the blog. The present invention relates to a method and system for converting a blog post into ontology-based information that can be annotated based on a selected and selected tag and converted into ontology-based information.
시맨틱 웹(Semantic Web)은 1998년 팀 버나스 리의 제안으로 유명해진, 차세대 웹이다. 이것은 현재의 인터넷과 같은 분산환경에서 웹 문서, 각종 파일, 서비스 등의 리소스에 대한 정보와 자원 사이의 관계-의미 정보를 기계가 처리할 수 있는 온톨로지(Ontology) 형태로 표현하고, 이를 자동화된 기계가 처리하도록 하는 프레임 워크 기술이다. The Semantic Web is a next-generation web that became famous for the suggestion of Tim Bernas Lee in 1998. In the distributed environment such as the Internet, it expresses information about resources such as web documents, various files, and services and relationship-meaning information between resources in the form of ontology that can be processed by a machine. Is a framework technology that allows for processing.
이러한 시맨틱 웹의 프레임 워크는 기계와 사람 간에 의사소통을 위해 중간역할을 하는 온톨로지와 RDF(Resource description) 계층으로 구분될 수 있고, 가장 단순한 형태인 RDF는 <Subject, Predicate, Object>의 트리플 형태로 개념을 표 현한다. The semantic web framework can be divided into ontology and RDF (Resource description) layer that plays an intermediate role for communication between machine and human. The simplest form, RDF, is a triple form of <Subject, Predicate, Object>. Express the concept.
간략한 예로서, 사람이 생각하는 "바나나는 노랑색이다."라는 정보를 기계가 이해할 수 있는 트리플로 표현하면 <S:바나나, P:색, O:노랑>과 같이 표현할 수 있다. 이렇게 표현된 트리플을 컴퓨터가 해석하여 S:바나나 라는 개념은 P:노랑 이라는 O:색 을 가지고 있다는 개념을 해석하고 처리할 수 있게 된다. As a simple example, if a person thinks that "banana is yellow" in triple that the machine can understand, it can be expressed as <S: banana, P: color, O: yellow>. By interpreting the triples expressed in this way, the concept of S: banana can interpret and process the concept of having O: color of P: yellow.
또한 온톨로지는 기계가 이해할 수 있는 형태로 표현된 특정 분야의 지식이다. 온톨로지는 명백한 논리언어(logic language)로 서술되어 있어, 사람의 언어와 달리 모호성이나 혼돈의 여지가 없으며, 논리에 의한 추론이 가능하다는 특징이 있다. 이러한 특징으로 인해, 시맨틱 웹은 기계와 사람의 의미를 소통할 수 있는 차세대 웹으로 각광받고 있다. Ontology is also knowledge of a particular field, expressed in a form that a machine can understand. Ontology is described in clear logic language, and unlike human language, there is no room for ambiguity or confusion, and it is possible to reason by logic. Due to these features, the semantic web is in the spotlight as the next generation web that can communicate the meaning of machines and people.
이와 같이 시맨틱 웹은 이러한 사람-기계 사이의 의미소통을 위하여, 사람의 지식을 기계가 이해할 수 있는 형태로 표현하는 방법을 택하고 있다. As such, the semantic web has chosen a method of expressing human knowledge in a form that can be understood by a machine for meaning communication between people and machines.
그러나, 이와 같은 종래의 시맨틱 웹을 구현하는 방법은 특정 분야(domain)의 지식을 모델링하는 것이 매우 어려운 작업일 뿐만 아니라 모델에 의한 어노테이션의 경우 여전히 실제의 의미와는 다른 비정확성의 가능성을 내포하고 있다. However, such a conventional method of implementing the semantic web is not only very difficult to model knowledge of a specific domain, but also annotated by the model still has the possibility of inaccuracy different from the actual meaning. have.
한편, 최근 들어 블로그(blog)는 많은 사용자들로부터 인기를 얻고 있는 웹 출판 패러다임의 한 형태이다. 현재 대부분의 블로그 서버는 사용자가 작성한 글에 보다 상세한 의미 정보를 추가할 수 있도록 카테고리 분류 정보와 태그 정보를 입력할 수 있는 인터페이스를 제공하고 있다. 즉, 블로그 사용자들은 글을 포스팅하면서 자신이 쓴 글의 주제나 본인이 경험한 이벤트와 관련이 되는 키워드들을 태그 정보로써 입력할 수 있으며, 시스템이 미리 분류해 둔 카테고리 정보 내에서 원하는 카테고리를 선택할 수도 있다. On the other hand, blogs have recently become a form of web publishing paradigm that has become popular with many users. Currently, most blog servers provide an interface for inputting category classification information and tag information so that users can add more detailed semantic information to a written article. In other words, blog users can enter keywords related to the topic of their posts or events they experienced while posting, as tag information, and select the desired category from the category information previously categorized by the system. have.
그러나, 종래의 블로그 서버는 태그 입력에 전혀 제한이 없어 주제를 함축하는 단어 외에도 불규칙한 숫자, 기호, 심지어 긴 문장까지도 입력될 수 있으며 사용자들의 자유로운 언어 사용으로 인하여 다의어, 동형이의어, 동의어 등이 서로 그 의미가 구분되지 않은 혼용되고 있다. 즉, 현재의 사용자 태그 정보에는 정확한 의미 정보가 부착되어 있지 않아 태그 간의 의미적 계층 관계나 포함 관계 등을 식별하기가 쉽지 않으며, 사용자들의 정제되지 않은 태그 정보가 증가할수록 사용자 태그 정보는 글의 검색 및 분류 등의 작업에서 충분히 활용되지 못할 것이다. 또한 블로그 시스템이 가지고 있는 다양한 리소스들을 충분히 활용하기에도 어려운 실정이다. However, the conventional blog server has no restrictions on tag input, so that in addition to the words that imply a topic, irregular numbers, symbols, and even long sentences can be input. It is mixed with meaning. That is, the current user tag information does not have accurate semantic information attached to it, so it is not easy to identify semantic hierarchical relations or inclusion relations between tags, and as user's unrefined tag information increases, user tag information is searched for articles. And will not be fully utilized in such work as classification. In addition, it is difficult to fully utilize the various resources of the blog system.
본 발명은 상기와 같은 문제점을 해결하기 위하여 제안된 것으로, 사용자가 블로그 포스트의 주제나 이벤트와 관련하여 추천된 태그를 선택할 수 있도록 하여 보다 정확하게 온톨로지 기반의 정보로 변환할 수 있는 블로그 포스트를 온톨로지 기반 정보로 변환하는 방법 및 그 시스템을 제공하는 것을 목적으로 한다.The present invention has been proposed to solve the above problems, it is possible for the user to select the recommended tag in relation to the topic or event of the blog post on the ontology-based blog post that can be converted into ontology-based information more accurately It is an object of the present invention to provide a method and system for converting the information into information.
상기와 같은 목적을 달성하기 위한 본 발명은 사용자 단말이 웹 브라우저를 통해 블로그의 본문 및 본문에 대한 카테고리를 입력하는 입력 단계와; 상기 입력 된 본문의 개체명을 상기 카테고리에 대응하는 관심 온톨로지에서 검색하고 다수의 추천 태그로서 상기 사용자 단말로 제공하는 태그추천 단계와; 상기 사용자 단말이 상기 추천된 다수의 태그를 확인하여 그 중 하나를 선택하는 선택 단계와; 상기 선택된 추천 태그를 기초로 상기 입력된 본문을 온톨로지 기반 정보로 변환하여 저장하는 변환 단계;를 포함하는 것을 특징으로 한다. The present invention for achieving the above object is an input step of the user terminal inputs the body of the blog and the category for the body through a web browser; A tag recommendation step of searching for an entity name of the input text in an ontology of interest corresponding to the category and providing the recommendation tag to the user terminal as a plurality of recommendation tags; A selection step of checking, by the user terminal, the recommended plurality of tags and selecting one of the tags; And converting the inputted text into ontology-based information based on the selected recommendation tag and storing the ontology-based information.
바람직하게는 상기 태그추천 단계는 상기 입력된 본문을 분석하여 개체명을 인식하고 상기 개체명을 태그 후보로서 추출하는 후보추출 단계와, 상기 추출된 개체명이 상기 관심 온톨로지에 존재하는지 검색하는 검색 단계와, 상기 검색된 개체명을 추천 태그로서 상기 검색된 속성과 함께 제공하는 제공 단계;를 포함할 수 있다.Preferably, the tag recommendation step includes: a candidate extraction step of recognizing the entity name by analyzing the input text, and extracting the entity name as a tag candidate; and searching for whether the extracted entity name exists in the ontology of interest; And providing the searched entity name as the recommendation tag along with the searched attribute.
바람직하게는 상기 제공 단계는 상기 추천 태그를 단어 빈도 및 상기 속성 정보와 비교하여 순위화하여 상위 N개만 제공할 수 있다.Preferably, in the providing step, the recommendation tag may be compared with the word frequency and the attribute information to rank only the top N items.
바람직하게는 상기 제공 단계는 직접 입력을 속성으로서 제공할 수 있다.Preferably the providing step may provide direct input as an attribute.
바람직하게는 상기 검색 단계는 상기 관심 온톨로지의 인스턴스(instance)를 검색할 수 있다.Advantageously, the retrieving step may retrieve an instance of the ontology of interest.
바람직하게는 상기 변환 단계는 상기 선택된 태그 및 그 속성에 따라 상기 입력된 본문을 온톨로지 기반 정보로 변환할 수 있다.Preferably, the converting step may convert the input text into ontology-based information according to the selected tag and its attributes.
바람직하게는 상기 변환 단계는 상기 사용자 단말의 선택이 없으면 디폴트 추천 태그 및 그 속성에 따라 상기 입력된 본문을 온톨로지 기반 정보로 변환할 수 있다.Preferably, in the converting step, if there is no selection of the user terminal, the input text may be converted into ontology based information according to a default recommendation tag and its attributes.
바람직하게는 상기 변환 단계는 상기 온톨로지 기반 정보가 OWL(Ontology Web Language) 파일로 구성될 수 있다.Preferably, in the converting step, the ontology-based information may be configured as an OWL file.
본 발명의 다른 양태에 따른 블로그에 대한 온톨로지 기반 정보로의 변환 시스템은 웹 브라우저를 통하여 블로그에 접속하여 본문 및 그에 대한 카테고리를 입력하는 사용자 단말과; 상기 카테고리에 대응하는 관심 온톨로지의 인스턴스가 저장된 RDF( Resource description framework) 스토어와; 상기 입력된 본문의 개체명을 상기 RDF 스토어에서 검색하여 다수의 추천 태그로서 상기 사용자 단말로 제공하며, 상기 사용자 단말에서 선택된 추천 태그를 기초로 상기 입력된 본문을 온톨로지 기반 정보로 변환하여 저장하는 블로그 서버;를 포함하는 것을 특징으로 한다.According to another aspect of the present invention, a system for converting ontology-based information on a blog includes: a user terminal accessing a blog through a web browser and inputting a text and a category thereof; A resource description framework (RDF) store in which an instance of the ontology of interest corresponding to the category is stored; A blog that searches for the entity name of the input text in the RDF store and provides the recommendation tag to the user terminal as a plurality of recommendation tags, and converts the input text into ontology based information based on the recommendation tag selected in the user terminal. Server; characterized in that it comprises a.
바람직하게는 상기 블로그 서버는 상기 추천 태그를 순위화하고 상기 RDF 스토어에서 검색된 속성과 함께 상기 사용자 단말로 제공하고, 상기 사용자 단말이 선택한 추천 태그와 그 속성을 상기 변환부로 제공하며, 상기 사용자 단말의 선택이 없으면 디폴트 추천 태그와 그 속성을 상기 변환부로 제공하는 태그 부착부와, 상기 선택된 추천 태그와 그 속성 및 상기 디폴트 태그와 그 속성 중 어느 하나에 따라 상기 입력된 본문을 상기 온톨로지 기반 정보로 변환하는 변환부와, 상기 변환된 온톨로지 기반 정보가 저장되는 저장부;를 포함할 수 있다.Preferably, the blog server ranks the recommendation tag and provides it to the user terminal along with an attribute retrieved from the RDF store, and provides the recommendation tag selected by the user terminal and its attribute to the conversion unit. A tag attaching unit for providing a default recommendation tag and its attributes to the conversion unit if there is no selection, and converting the input text into the ontology-based information according to any one of the selected recommendation tag and its attributes and the default tag and its attributes. And a storage unit for storing the converted ontology-based information.
바람직하게는 상기 태그 부착부는 상기 입력된 본문을 분석하여 개체명을 추출하는 개체명 인식부와, 상기 추천 태그를 단어 빈도 및 상기 속성 정보와 비교하여 순위화하여 상위 N개만 추천 태그로서 제공하고, 상기 사용자 단말이 선택한 추천 태그를 상기 변환부로 제공하는 태그 추천부와, 상기 추출된 개체명이 상기 RDF 스토어의 관심 온톨로지의 인스턴스인지 검색하는 검색부를 포함할 수 있다.Preferably, the tag attaching unit analyzes the input text and extracts an entity name, and ranks the recommendation tag by comparing the word frequency and the attribute information to provide only the top N items as recommendation tags. It may include a tag recommendation unit for providing a recommendation tag selected by the user terminal to the conversion unit, and a search unit for searching whether the extracted entity name is an instance of the ontology of interest of the RDF store.
바람직하게는 상기 변환부는 상기 온톨로지 기반 정보를 OWL 파일로 생성할 수 있다.Preferably, the conversion unit may generate the ontology-based information into an OWL file.
바람직하게는 상기 저장부는 상기 OWL 파일이 저장되는 OWL 파일 저장부와, 상기 블로그의 본문이 저장되는 DBMS(DataBase Management System)를 포함할 수 있다.Preferably, the storage unit may include an OWL file storage unit in which the OWL file is stored, and a DBMS (DataBase Management System) in which the body of the blog is stored.
바람직하게는 상기 RDF 스토어는 웹 통신 기능을 구비할 수 있다.Preferably, the RDF store may have a web communication function.
바람직하게는 상기 추천 태그는 직접 입력이 속성으로서 포함할 수 있다.Preferably, the recommendation tag may include direct input as an attribute.
본 발명에 따른 블로그 포스트를 온톨로지 기반 정보로 변환하는 방법 및 그 시스템은 사용자와의 피드백을 통해 블로그 포스트의 주제나 이벤트와 관련된 태그와 특정 부가 정보를 온톨로지 인스턴스로 생성하여 시간 및 비용 절감뿐만 아니라 사용자에 의한 정확한 시맨틱 어노테이션이 가능함으로써, 인스턴스 분류와 태그에 의해 검색, 인스턴스 분석, 인스턴스들 간의 분석 등 차세대 시맨틱 검색이 용이하게 되는 효과가 있다. The method and system for converting a blog post into ontology-based information according to the present invention generate a tag and specific additional information related to the topic or event of a blog post as an ontology instance through feedback with the user, thereby saving time and money as well as the user. By enabling accurate semantic annotations, there is an effect of facilitating next-generation semantic search such as search, instance analysis, and analysis between instances by instance classification and tag.
본 발명은 블로그 포스트에 대한 사용자 태그 정보를 기계가 이해하고 분류할 수 있도록 블로그 포스트에 대한 내용이 무엇에 대한 것인가의 주제 및 그 주제를 경험한 이벤트를 기초로 어노테이션하여 새로운 블로그 온톨로지의 인스턴스를 생성하는 것이다. The present invention creates an instance of a new blog ontology by annotating on the subject of what the contents of the blog post is about and the events that experienced the subject so that the machine can understand and classify the user tag information on the blog post. It is.
또한, 본 발명은 온톨로지와 블로그 포스트를 연동한 시맨틱 어노테이션을 수행하기 위하여 태그의 입력시 사용자에게 태그 추천의 피드백을 통해 가이드를 제시하고, 사용자가 태그를 직접 입력할 수 있도록 함으로써 사용자가 개입하여 정확한 시맨틱 어노테이션이 가능하므로, 수동 어노테이션의 코스트와 자동 어노테이션의 비정확성을 동시에 극복할 수 있다. In addition, the present invention provides a guide through the feedback of the tag recommendation to the user at the time of input of the tag to perform the semantic annotation linked to the ontology and blog post, allowing the user to directly enter the tag to accurately enter Because semantic annotations are possible, the cost of manual annotations and the inaccuracies of automatic annotations can be overcome simultaneously.
이와 같은 블로그 포스트는 OWL 언어로 변환되어 검색 및 분석, 추론 등을 위한 자료로 활용될 수 있다. These blog posts can be translated into the OWL language and used as a resource for search, analysis, and reasoning.
이하, 본 발명의 바람직한 실시예를 첨부된 도면을 참조하여 상세히 설명한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.
도 1은 본 발명의 실시예에 따른 블로그 포스트를 온톨로지 기반 정보로의 변환 시스템을 개략적으로 나타낸 구성도이고, 도 2는 도 1의 블로그 시스템의 세부 구성을 나타낸 블록도이다.1 is a block diagram schematically illustrating a system for converting a blog post into ontology-based information according to an embodiment of the present invention, and FIG. 2 is a block diagram illustrating a detailed configuration of the blog system of FIG. 1.
블로그 포스트를 온톨로지 기반 정보로의 변환 시스템(10)은 블로그 서버(300)에 접속되어 블로그 포스트를 작성하는 사용자 단말(100)과, 작성된 블로그에 대한 태그를 추천하여 사용자 단말(100)로 제공하는 블로그 서버(300)와, 온톨로지가 저장된 RDF 스토어(400)를 포함한다.The blog post to ontology-based
사용자 단말(100)은 웹 브라우저(200)를 통하여 블로그 서버(300)에 접속하여 블로그 본문을 작성하고 태그 설정시 블로그 서버(300)로부터 제공된 본문에 대한 카테고리와 추천된 태그를 입력한다.The
블로그 서버(300)는 입력된 본문의 개체명을 RDF 스토어(400)에서 검색하여 다수의 추천 태그로서 사용자 단말(100)로 제공하는 태그 부착부(310)와, 사용자 단말(100)에서 선택된 추천 태그를 기초로 입력된 본문을 온톨로지 기반 정보로 변환하는 변환부(320)와, 상기 변환된 온톨로지 기반 정보가 저장되는 저장부(330)를 포함한다. The
시맨틱Semantic 태그 추천 Tag Suggestions
태그 부착부(310)는 입력된 본문을 분석하여 개체명을 추출하는 개체명 인식부(312)와, 추천 태그를 순위화하여 사용자 단말(100)로 제공하는 태그 추천부(314)와, RDF 스토어(400)에서 추천 태그와 그 속성을 검색하는 검색부(316)를 포함한다.The
개체명 인식부(312)는 입력된 본문을 분석하여 태그 후보를 검색하기 위한 개체명을 추출한다. 이는 본문에 포함된 모든 명사를 대상으로 하지 않고 온톨로지 인스턴스로 존재할 것으로 예상되는 개체명을 추출한다. The entity
즉, 개체명 인식부(312)는 본문에서 시맨틱 태그의 후보가 될 수 있는 개체명, 예를 들면 책 제목, 여행지, IT 기기의 제품명 등을 추출한다.That is, the entity
태그 추천부(314)는 상기 추출된 개체명에 대한 RDF 스토어(400) 검색을 검색부(316)로 요청하고, 검색된 다수의 태그를 빈도 및 속성 정보와 비교하여 순위화하여 상위 N개만 추천 태그로서 사용자 단말(100)로 제공한다. The tag recommender 314 requests the
여기서, 사용자 단말(100)로 제공되는 추천 태그의 속성은 직접 입력이 포함되는 것이 바람직하다. Here, the property of the recommendation tag provided to the
이러한 태그 추천부(314)는 태그로 사용될 개체명이 온톨로지와 연동이 되도록 하기 위하여 관심 온톨로지의 인스턴스로 존재하는 개체명을 대상으로 태그를 추천한다. The
또한, 태그 추천부(314)는 사용자 단말(100)이 선택한 추천 태그와 그 속성을 변환부(320)로 제공하며, 사용자 단말(100)의 선택이 없으면 디폴트 추천 태그와 그 속성을 변환부(320)로 제공한다. In addition, the
검색부(316)는 개체명 인식부(312)에서 추출된 개체명이 RDF 스토어(400)의 관심 온톨로지에 존재하는지의 검색을 수행한다. 즉, 검색부(316)는 상기 개체명이 관심 온톨로지의 인스턴스인지를 검색한다. The
OWL파일 생성Create a file
변환부(320)는 사용자 단말(100)에서 선택된 추천 태그와 그 속성에 따라 입력된 본문을 온톨로지 기반 정보로 변환하고, 사용자 단말(100)의 선택이 없으면 최상위 우선순위로 설정된 디폴트 태그와 그 속성에 입력된 본문을 온톨로지 기반 정보로 변환한다. The
여기서, 온톨로지 기반 정보는 OWL 파일 형태로 생성되는데, 보다 상세하게는 사용자가 작성한 포스트와 선택한 태그를 기초로 OWL 파일 형태로 생성되며, OWL을 구성하기 위한 속성 정보의 예는 아래의 표 1과 같다.Here, the ontology-based information is generated in the form of an OWL file. More specifically, the ontology-based information is generated in the form of an OWL file based on a post written by a user and a selected tag. An example of the attribute information for configuring the OWL is shown in Table 1 below. .
eventType
eventType
저장부(330)는 변환된 온톨로지 기반 정보로서 OWL 파일이 저장되는 OWL 파일 저장부(332)와, 블로그의 본문이 저장되는 DBMS(DataBase Management System, 334)를 포함한다. The
RDF 스토어(400)는 카테고리에 대응하는 관심 온톨로지의 인스턴스가 저장되며, 바람직하게는 웹 기반의 블로그 서버(300)와의 통신을 위한 웹 통신 기능을 구비한다. The
예를 들면, RDF 스토어(400)에서 제공하는 공개 소스 프레임 워크인 Sesame를 사용하여 http 프로토콜을 지원한다. For example, the http protocol is supported using Sesame, an open source framework provided by the
이하, 도 3 내지 도 7을 참조하여 본 발명의 블로그 포스트를 온톨로지 기반 정보로 변환하는 방법을 설명한다.Hereinafter, a method of converting a blog post of the present invention into ontology-based information will be described with reference to FIGS. 3 to 7.
도 3은 본 발명의 실시예에 따른 블로그 포스트를 온톨로지 기반 정보로 변환하는 방법을 나타낸 순서도이고, 도 4는 블로그 본문의 저장전 웹 페이지를 나타낸 도면(a) 및 저장후 웹페이지를 나타낸 도면(b)이며, 도 5는 추천된 태그별 속성 정보의 일예를 나타낸 도면이고, 도 6은 최종 선택된 태그와 그 속성 정보의 일예를 나타낸 도면이며, 도 7은 생성된 OWL 파일의 예를 나타낸 도면이다.3 is a flowchart illustrating a method of converting a blog post into ontology-based information according to an embodiment of the present invention, and FIG. 4 is a diagram illustrating a web page before storage of a blog body (a) and a diagram showing a web page after storage ( b), FIG. 5 is a diagram illustrating an example of recommended attribute information for each tag, FIG. 6 is a diagram illustrating an example of the finally selected tag and its attribute information, and FIG. 7 is a diagram illustrating an example of the generated OWL file. .
본 발명의 블로그 포스트를 온톨로지 기반 정보로 변환하는 방법은 사용자 단말(100)이 블로그의 본문 및 본문에 대한 카테고리를 입력하는 입력 단계(단계 S301)와, 상기 입력된 본문의 개체명을 상기 카테고리에 대응하는 관심 온톨로지에서 검색하고 다수의 추천 태그로서 사용자 단말(100)로 제공하는 태그추천 단계(단계 S302 내지 단계 S304)와, 사용자 단말(100)이 상기 추천된 다수의 태그를 확인하여 그 중 하나를 선택하는 선택 단계(단계 S305)와, 상기 선택된 추천 태그를 기초로 상기 입력된 본문을 온톨로지 기반 정보로 변환하여 저장하는 변환 단계(단계 S306 내지 단계 S308)를 포함하는 것을 특징으로 한다. In the method for converting blog posts of the present invention into ontology-based information, an input step (step S301) in which the
보다 구체적으로는, 먼저, 사용자에 의해 사용자 단말(100)이 웹 브라우저(200)를 통하여 블로그 서버(300)에 접속하고 원하는 블로그 포스트를 작성한다(단계 S301).More specifically, first, the
이때, 본문의 내용을 작성한 후 도 4(a)에 도시된 바와 같이 사용자가 주제와 관련된 카테고리를 선택할 수 있도록 미리 정의된 카테고리 분류 중 하나를 선택할 수 있도록 한다. 여기서, 사용자로부터 입력받은 카테고리 정보는 해당 관심 온톨로지를 활성화시키는 역할을 한다.In this case, after the content is written, as shown in FIG. 4A, the user may select one of the predefined category categories so that the user can select a category related to the subject. Here, the category information received from the user serves to activate the ontology of interest.
사용자 단말(100)이 본문을 저장하면, 도 4(b)에 도시된 바와 같이, 태그 추천이 활성화되어 입력된 본문을 분석하여 개체명을 인식하고 개체명을 태그 후보로서 추출한다(단계 S302).When the
즉, 사용자가 작성한 본문에 기반하여 태그 후보가 될 수 있는 개체명들을 개체명 인식부(312)를 통하여 추출한다.That is, the entity
추출된 개체명이 관심 온톨로지에 존재하는지 검색한다(단계 S303).It is searched whether the extracted entity name exists in the ontology of interest (step S303).
예를 들면, RDF 스토어(400)에 저장된 관심 온톨로지의 인스턴스를 검색하여 상기 개체명이 존재하는지를 검색한다. For example, an instance of the ontology of interest stored in the
다음으로 상기 검색된 개체명을 추천 태그로서 상기 검색된 속성과 함께 사용자 단말(100)로 제공한다(단계 S304).Next, the searched entity name is provided as the recommendation tag to the
이때, 상기 검색된 추천 태그를 단어 빈도 및 상기 속성 정보와 비교하여 순위화하여 상위 N개만 제공하는 것이 바람직하다. 또한, 상기 제공되는 속성은 직접 입력을 포함할 수 있다. In this case, it is preferable that the searched recommendation tag is compared with the word frequency and the attribute information and ranked to provide only the top N items. In addition, the provided attribute may include direct input.
여기서, 추천된 태그는 카테고리 정보에 따라 선택된 관심 온톨로지의 인스턴스이다. Here, the recommended tag is an instance of the ontology of interest selected according to the category information.
이와 같이 사용자가 선택한 이벤트 정보에 따라 추천하는 태그 속성은 변화한다. 즉, '여행가다'라는 이벤트에 대해서는 누가, 어디에, 누구와 함께, 언제 등이 어노테이션되도록 가이드한다. 사용자가 선택한 이벤트 카테고리에 따른 추천 태그들의 속성 정보의 예는 아래의 표 2와 같다.As such, the recommended tag attribute changes according to the event information selected by the user. In other words, it is guided to annotate who, where, with whom, when, etc. for the event of 'go to travel'. Examples of attribute information of recommended tags according to an event category selected by a user are shown in Table 2 below.
IT
IT
책
book
여행
Travel
이때, 도 5 및 도 6에 도시된 바와 같이, 추천된 태그는 동일한 속성값이 다른 동일한 개체명들이 존재할 수 있으므로, 이들에 대한 속성 정보를 사용자에게 제공하여 태그 선택시에 발생하는 모호성을 배제한다. In this case, as shown in FIGS. 5 and 6, since the recommended tag may have the same entity name having different attribute values, the user may be provided with attribute information about them to exclude ambiguity generated when selecting a tag. .
사용자 단말(100)이 제공된 추천 태그 목록을 확인하여 원하는 태그를 선택한다(단계 S305).The
즉, 관심 온톨로지에 인스턴스로 존재하는 태그 목록을 사용자 단말(100)에 제공하면, 사용자가 작성된 본문에 적합한 원하는 태그를 선택한다. That is, when the tag list existing as an instance of the ontology of interest is provided to the
사용자가 원하는 태그를 선택하면, 선택된 태그 및 그 속성에 따라 상기 입력된 본문을 온톨로지 기반 정보로 변환한다(단계 S306).When the user selects a desired tag, the input text is converted into ontology based information according to the selected tag and its attributes (step S306).
이때, 사용자 단말(100)은 속성중 하나인 직접 입력을 선택하고 원하는 태그를 입력할 수도 있다. In this case, the
한편, 사용자 단말(100)이 추천 태그를 선택하지 않으면, 디폴트 추천 태그 및 그 속성에 따라 상기 입력된 본문을 온톨로지 기반 정보로 변환한다(단계 S307).On the other hand, if the
여기서, 상기 온톨로지 기반 정보가 OWL 파일로 구성되는 것이 바람직하다. Here, it is preferable that the ontology-based information is composed of an OWL file.
예를 들면, 표 1과 같은 정보들을 이용하여 구축한 OWL 파일의 구조를 바탕으로 각 포스트에 해당하는 내용들을 이용하여 도 7에 도시된 바와 같은 OWL 파일을 생성한다. 이러한 OWL 파일을 생성하기 위하여 RDF 언어를 사용한다. For example, based on the structure of the OWL file constructed using the information shown in Table 1, an OWL file as shown in FIG. 7 is generated using contents corresponding to each post. The RDF language is used to create these OWL files.
이때, 추후 검색시 쉽게 수집할 수 있도록 해당 포스트의 ID와 동일한 값을 가지는 파일 이름으로 설정하여 블로그 서버에 저장한다.(단계 S308).At this time, it is set to a file name having the same value as the ID of the corresponding post so that it can be easily collected at a later search and stored in the blog server (step S308).
이러한 추천 과정을 통해 사용자는 손쉽게 시맨틱 정보를 가진 태그를 부착할 수 있으며, 저장된 포스트는 OWL 파일로 생성되어 블로그 서버(300)에 수집이 된다.Through this recommendation process, the user can easily attach a tag with semantic information, and the stored post is generated as an OWL file and collected in the
이러한 방법에 의하여 보다 정확한 블로그 온톨로지를 구축할 수 있다. In this way, more accurate blog ontology can be built.
이상에서 설명한 본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경할 수 있다는 것은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 당업자에게 있어 명백할 것이다.The present invention described above is not limited to the above-described embodiments and the accompanying drawings, and it is common in the art that various substitutions, modifications, and changes can be made without departing from the technical spirit of the present invention. It will be apparent to those skilled in the art.
도 1은 본 발명의 실시예에 따른 블로그 포스트를 온톨로지 기반 정보로의 변환 시스템을 개략적으로 나타낸 구성도이고,1 is a block diagram schematically illustrating a system for converting a blog post into ontology-based information according to an embodiment of the present invention.
도 2는 도 1의 블로그 시스템의 세부 구성을 나타낸 블록도이며,2 is a block diagram showing a detailed configuration of the blog system of FIG.
도 3은 본 발명의 실시예에 따른 블로그 포스트를 온톨로지 기반 정보로 변환하는 방법을 나타낸 순서도이고,3 is a flowchart illustrating a method of converting a blog post into ontology-based information according to an embodiment of the present invention.
도 4는 블로그 본문의 저장전 웹 페이지를 나타낸 도면(a) 및 저장후 웹페이지를 나타낸 도면(b)이며,4 is a view (a) showing the web page before the storage of the blog body and (b) shows a web page after the storage,
도 5는 추천된 태그별 속성 정보의 일예를 나타낸 도면이고,5 is a diagram illustrating an example of recommended attribute information for each tag.
도 6은 최종 선택된 태그와 그 속성 정보의 일예를 나타낸 도면이며,6 is a diagram illustrating an example of a finally selected tag and its attribute information;
도 7은 생성된 OWL 파일의 예를 나타낸 도면이다.7 is a diagram illustrating an example of a generated OWL file.
* 도면의 주요 부분에 대한 부호의 설명 *Explanation of symbols on the main parts of the drawings
10 : 변환 시스템 100 : 사용자 단말10: conversion system 100: user terminal
200 : 웹 브라우저 300 : 블로그 서버200: Web Browser 300: Blog Server
310 : 태그 부착부 312 : 개체명 인식부310: tag attachment portion 312: object name recognition portion
314 : 태그 추천부 316 : 검색부314: tag recommendation unit 316: search unit
320 : 변환부 330 : 저장부320: conversion unit 330: storage unit
332 : OWL 파일 저장부 334 : DBMS332: OWL file storage unit 334: DBMS
400 : RDF 스토어 400: RDF Store
Claims (15)
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090010525A KR101072147B1 (en) | 2009-02-10 | 2009-02-10 | Method and system for transforming blog posting to Ontology-based information |
PCT/KR2009/004945 WO2010093101A1 (en) | 2009-02-10 | 2009-09-02 | Method and system for transforming blog post to ontology-based information |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090010525A KR101072147B1 (en) | 2009-02-10 | 2009-02-10 | Method and system for transforming blog posting to Ontology-based information |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20100091367A KR20100091367A (en) | 2010-08-19 |
KR101072147B1 true KR101072147B1 (en) | 2011-10-10 |
Family
ID=42561929
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020090010525A KR101072147B1 (en) | 2009-02-10 | 2009-02-10 | Method and system for transforming blog posting to Ontology-based information |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR101072147B1 (en) |
WO (1) | WO2010093101A1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101733230B1 (en) * | 2015-05-21 | 2017-05-08 | 네이버 주식회사 | Method for providing contents sharing service, method for controlling display, and computer program for executing one of the method |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101393247B1 (en) * | 2010-08-23 | 2014-05-22 | 한국전자통신연구원 | Apparatus and method for automatic annotation and publication of semantic information of web services based soap and rest |
CN104317891B (en) * | 2014-10-23 | 2017-11-28 | 华为软件技术有限公司 | A kind of method and device that label is marked to the page |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100851041B1 (en) | 2006-11-08 | 2008-08-12 | 엔에이치엔(주) | Method for recommending advertising keyword by inputting url and system thereof |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MXPA05008670A (en) * | 2003-02-14 | 2005-11-17 | Nervana Inc | Semantic knowledge retrieval management and presentation. |
KR20070065774A (en) * | 2005-12-20 | 2007-06-25 | 한국전자통신연구원 | System and method for managing a semantic blog using the ontology |
KR100720762B1 (en) * | 2007-01-30 | 2007-05-23 | (주) 프람트 | Method for calculating similarity and searching content using context information of user |
KR20090000284A (en) * | 2007-02-14 | 2009-01-07 | (주)인포메딕스프리벤션테크놀로지 | Infomedics prevention system |
-
2009
- 2009-02-10 KR KR1020090010525A patent/KR101072147B1/en active IP Right Grant
- 2009-09-02 WO PCT/KR2009/004945 patent/WO2010093101A1/en active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100851041B1 (en) | 2006-11-08 | 2008-08-12 | 엔에이치엔(주) | Method for recommending advertising keyword by inputting url and system thereof |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101733230B1 (en) * | 2015-05-21 | 2017-05-08 | 네이버 주식회사 | Method for providing contents sharing service, method for controlling display, and computer program for executing one of the method |
Also Published As
Publication number | Publication date |
---|---|
WO2010093101A1 (en) | 2010-08-19 |
KR20100091367A (en) | 2010-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Van Hooland et al. | Exploring entity recognition and disambiguation for cultural heritage collections | |
Kiryakov et al. | Semantic annotation, indexing, and retrieval | |
US7739257B2 (en) | Search engine | |
JP6014725B2 (en) | Retrieval and information providing method and system for single / multi-sentence natural language queries | |
Cantador et al. | Enriching ontological user profiles with tagging history for multi-domain recommendations | |
Lin et al. | An integrated approach to extracting ontological structures from folksonomies | |
Van de Camp et al. | The socialist network | |
Van Hooland et al. | Evaluating the success of vocabulary reconciliation for cultural heritage collections | |
KR20100068532A (en) | Apparatus and method for keyword extraction and associative word network configuration of document data | |
Hienert et al. | Extraction of historical events from wikipedia | |
Fernandez et al. | Linking data across universities: an integrated video lectures dataset | |
Sriharee | An ontology-based approach to auto-tagging articles | |
Chantrapornchai et al. | Information extraction based on named entity for tourism corpus | |
Tonelli et al. | Boosting collaborative ontology building with key-concept extraction | |
Spitz et al. | EVELIN: Exploration of event and entity links in implicit networks | |
US8082240B2 (en) | System for retrieving information units | |
JP6409071B2 (en) | Sentence sorting method and calculator | |
KR20110133909A (en) | Semantic dictionary manager, semantic text editor, semantic term annotator, semantic search engine and semantic information system builder based on the method defining semantic term instantly to identify the exact meanings of each word | |
KR101072147B1 (en) | Method and system for transforming blog posting to Ontology-based information | |
Banu et al. | Semantic-based querying using ontology in relational database of library management system | |
Lucarelli et al. | Florence–Washington Round Trip: Ways and Intersections between Semantic Indexing Tools in Different Languages | |
Weikum et al. | Temporal knowledge for timely intelligence | |
Musabeyezu | Comparative study of annotation tools and techniques | |
Gnoli et al. | Sorting documents by base theme with synthetic classification: the double query method | |
Jo et al. | Web-based semantic web retrieval service for law ontology |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20140925 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20150924 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20170922 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20180920 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20190917 Year of fee payment: 9 |