WO2010134752A2 - 다수 분류 체계를 연동한 시멘틱 검색 방법 및 시스템 - Google Patents

다수 분류 체계를 연동한 시멘틱 검색 방법 및 시스템 Download PDF

Info

Publication number
WO2010134752A2
WO2010134752A2 PCT/KR2010/003156 KR2010003156W WO2010134752A2 WO 2010134752 A2 WO2010134752 A2 WO 2010134752A2 KR 2010003156 W KR2010003156 W KR 2010003156W WO 2010134752 A2 WO2010134752 A2 WO 2010134752A2
Authority
WO
WIPO (PCT)
Prior art keywords
classification
category
categories
keyword
resource
Prior art date
Application number
PCT/KR2010/003156
Other languages
English (en)
French (fr)
Other versions
WO2010134752A3 (ko
Inventor
최현정
신창호
이유진
이승범
이민정
Original Assignee
주식회사 아이네크
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 아이네크 filed Critical 주식회사 아이네크
Publication of WO2010134752A2 publication Critical patent/WO2010134752A2/ko
Publication of WO2010134752A3 publication Critical patent/WO2010134752A3/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions

Definitions

  • the present invention relates to a semantic search method and system, and in particular, by using the ontology classification scheme by integrating the database database in different classification schemes in various fields, different classification concepts in different fields.
  • the present invention relates to a semantic search method and system that can implement a semantic resource retrieval service and recommendation of a classification category with improved user accessibility by mapping and mapping the database according to the degree of association.
  • a system that can quickly and accurately search for information that a user wants to find is required in many fields. For example, a lot of information managed by a system that is useful for searching, such as a book search system in a library, an information search system on a web site, a search system for resources managed on a small network connected to a LAN or a storage device of a personal PC. For example, many methods for retrieving various types of information such as document files, image files, video files, database information, and text data in a faster and more intelligent manner have been developed.
  • a string corresponding to a search word may be extracted from a search target material within a classification system, and the search result may be provided by comparing the matched word with the search word.
  • a search system used in an internet bookstore or a library may provide a list of books or summary information according to the Korea Decimal Classification (KDC) classification system.
  • KDC Korean Decimal Classification
  • Such a search system may similarly provide various materials similar to a search word in an internet shopping mall or an academic information providing site.
  • the present invention has been made to solve the above-described problems, and an object of the present invention is to integrate ontologies by integrating database resources in different classification systems in various fields in order to provide rich and accurate search results with improved user accessibility.
  • Semantic search method and system that can recommend classification categories efficiently and service meaningful resource search results by mapping them according to the degree of association with classifications in other classification concepts of other fields using classification schemas. To provide.
  • the semantic search method for each classification system divided into two or more classification systems having a plurality of classification categories
  • Databases of resources corresponding to each classification category are generated, and for each keyword, an association relation between the two classification categories is based on similarity values of the first classification category of the first classification scheme and the second classification category of the second classification scheme.
  • the association relationship is to extract each keyword included in any one resource of the first classification scheme and the second classification scheme, the classification of each keyword is the first classification scheme based on the predetermined classification information of each resource.
  • Computing a first similarity value having a category and a second similarity value having a classification category of the second classification system, and based on the difference between the first similarity value and the second similarity value considering the level of each classification category. Can be set.
  • the semantic search method extracts a set of keywords included in each classification category in advance, and matches each keyword with keywords extracted from metadata about a resource including a document file, database information, text data, an image, or a video.
  • a semantic search may be provided by setting and associating associations of classification categories.
  • the predetermined classification information of each resource includes information on a classification category of a corresponding classification scheme included in a resource or corresponding metadata, and the classification category has a hierarchical structure including at least one level or more detailed categories.
  • the first similarity value or the second similarity value may be calculated based on a product of a frequency in which a keyword appears in a resource of each classification category and a weight previously set for the classification category to which the resource belongs.
  • an association relationship with another classification scheme may be adopted by setting all the weights set in advance for the classification categories as the same value. Can be.
  • the resources of the classification system including the input keyword are preferentially displayed on the display means for each classification category, and the association system is associated with the classification system adjacent to the resources displayed first.
  • the resources of different classification systems that are set the most can be displayed for each category.
  • a database for storing and managing resources corresponding to each classification category for each classification system divided into two or more classification systems having a plurality of classification categories ; Relationship model setting means for setting an association relationship between two classification categories for each keyword based on similarity values of the first classification category of the first classification scheme and the second classification category of the second classification scheme; And a search result providing means for providing a search result by dividing resources belonging to a plurality of classification systems by each classification system or by each classification category, based on the association, when providing a search result for an input keyword.
  • the semantic retrieval method and system it is possible to integrate resources databased into different classification systems in various fields, and to use the ontology classification schema to separate classifications from other classification concepts in other fields.
  • mapping the database according to the degree of association and efficiently recommending the classification categories and performing the semantic resource search service the user can easily and conveniently provide rich and accurate search results.
  • FIG. 1 is a diagram illustrating a semantic search system according to an embodiment of the present invention.
  • FIG. 2 is a view for explaining the configuration of the relationship between the hierarchical structure and the majority classification between classification systems.
  • FIG. 3 is a diagram for describing an association mapping method between a first classification scheme and keywords.
  • FIG. 4 is a diagram for describing a method for mapping association between a second classification scheme and keywords.
  • FIG. 5 is a diagram for describing an association mapping result between keywords and classification categories.
  • the semantic search system may be implemented to operate in hardware, software, or a combination thereof in a computer, PDA, cellular phone, or other dedicated device, and also may include the Internet, a mobile communication network, Through a wireless Internet network, such as a web (WEB) server, a WAP (WAP) server can be operated to provide a rich and accurate search results easily and conveniently to the user.
  • WEB web
  • WAP WAP
  • FIG. 1 is a diagram illustrating a semantic search system according to an embodiment of the present invention.
  • the semantic search system has a different classification system such as school classification, KDC, DCC, UCC, classification of products or articles of an Internet portal, and classification of books in an internet bookstore.
  • a different classification system such as school classification, KDC, DCC, UCC, classification of products or articles of an Internet portal, and classification of books in an internet bookstore.
  • the academic classification is A000000 Humanities, B000000 Social Sciences, C000000 Natural Sciences, D000000 Engineering, E000000 Medicine, F000000 Agriculture, Ocean, G000000 Arts, Sports, H000000 Complex, etc.
  • the KDC classification includes 000 resources, 100 philosophies, 200 religions, 300 social sciences, 400 pure sciences, 500 technical sciences, 600 arts, 700 languages, 800 literatures, 900 history, etc. It is used to manage the DDC classification, 000 bibliography, collections, collections, 100 philosophy, 200 religions, 300 social sciences, 400 linguistics, 500 natural sciences, 600 technical sciences (medicine, engineering, agriculture, family studies, etc.), 700 arts. It is used to manage and manage resources of books and related fields such as 800 literature, 900 history, geography and people.
  • the above-described classification system is applied to Internet portals and bookstores to provide a unique classification system suitable for the purpose of site operation, thereby easily providing search results necessary for a user's keyword search.
  • Resources in each of these areas may take the form of document files, image files, video files, database information, or text data.
  • predetermined classification information for a classification category having a hierarchical structure divided into a subclass, a subclass, and a subclass is managed in a database corresponding to the resource or metadata of the resource.
  • the metadata referring to the attribute information of the resource includes not only the information about the classification categories of the corresponding classification scheme, but also the resource's location, keywords, types (text, image, video, etc.), author information, rights conditions, Information regarding usage conditions, usage logs, and the like may be included.
  • resources in the corresponding classification system of each field may be constructed in an ontology based on RDF / OWL (Resource Description Framework / Web Ontology Language) syntax.
  • Various resources such as documents, images, videos (videos), database information, and text data provide metadata, and these metadata are maps of semantic relationships centered on classification and keyword concepts. It can be connected to the ontology, and can provide more accurate and rich information to the user through an integrated semantic search in accordance with the association setting according to the present invention.
  • the semantic search system from the information of the database in which the resources corresponding to each classification category is stored and managed for each classification scheme through a predetermined association setting means; For each keyword, an association relationship between classification categories having different classification schemes may be set in advance.
  • each classification system has a classification category having a hierarchical structure, and even when all of a plurality of classification systems are enumerated, it can be seen that an association relationship between categories of different classification systems appears.
  • the present invention proposes a system for generating associations of various characteristics through a semantic relation algorithm.
  • a set of keywords frequently used for each category is extracted in advance, and for each keyword, a resource including a document file, database information, text data, an image, or a video is extracted.
  • the association relationship between the classification categories matched with the keywords extracted from the metadata is set and combined. For example, as shown in FIG. 2, a keyword set including, for example, a human name included in each classification category may be generated, and the same keyword may be included in various classification categories. Semantic relationships between them are assigned as associations to provide semantic search.
  • an association relationship between the two categories may be preset according to the degree of association between each keyword to be input in the first classification category of the first classification scheme and the second classification category of the second classification scheme.
  • each classification category is determined by approaching a concept suitable for the relevant field.
  • the schema is established by identifying the associations between the classification categories in advance. In this case, it is possible to improve the accessibility of the corresponding search target resource with respect to the input keyword, and it is easy to set up a relation model such as similarity, accuracy, upper and lower concepts for the search result, and greatly contribute to the recommendation service of the classification category.
  • the semantic search system may provide a predetermined search result providing means (for example, a search).
  • a search result providing means for example, a search.
  • Engine by using the semantic search to which the above-described correlation is applied to the input keyword, it is possible to provide a search result by dividing resources belonging to a plurality of classification systems by each classification system or by each classification category. For example, if a keyword to be searched is input, the corresponding category of each classification scheme corresponding to the input keyword is searched first, and accordingly, the search result is provided to the display means by dividing the classification scheme by each classification scheme.
  • the resources of the classification system that includes the most input keywords are displayed first for each classification category, and the resources of the other classification systems that have the highest association with the classification system are displayed. It may be displayed for each classification category.
  • a resource may basically include predetermined classification information. Such classification information may be classified into a classification category of a hierarchical structure in each classification system as shown in FIG. 1 used in various fields. Information may be included. Such classification information may be included in metadata that is assigned to a resource as one of attribute information of the corresponding resource.
  • the classification information is included in the resource or the metadata, different classification concepts are applied to each classification system to determine classification categories, and thus it is not easy to grasp the association between classification categories of other classification systems.
  • the KDC or DDC classification system used in the bibliography for the classification of books it is the same classification category that is exactly the same among the corresponding classification categories such as major classification, subclassification, subclassification, and subclassification.
  • the present invention is intended to overcome the difficulty of automatically classifying the classification system and automatically providing the resources of the other classification system with the most established association as a search result.
  • the relevant search results are clearly arranged by automatically associating with a classification category of another classification system. Can be presented and presented.
  • the resource or corresponding metadata includes classification information including a predetermined classification category (classification 1-1, 1-2... / Classification 2-1, 2-2).
  • Each classification category (classifications 1-1, 1-2 ... 1-n) of the first classification system is assigned to one or more classification categories (classifications 2-1, 2-2 ... 2-k) of the second classification system.
  • a predetermined relationship model setting means includes keywords (keywords 1,2..m) required from language information of a resource, for example, information that can be morphologically analyzed, such as a title, a subject, and a content.
  • the keywords (keywords 1,2..m) may be automatically extracted in large quantities by being divided into parts of speech, for example, nouns, adverbs, adjectives, and verbs.
  • the relationship model setting means determines that the first similarity value S1 that each keyword has for the classification category (eg, classification 1-1) of the first classification system. And a second similarity value S2 for a classification category (eg, classification 2-1) of the second classification system, and calculates a difference between the first similarity value S1 and the second similarity value S2. You can set up an association based on that.
  • Each of the first similarity value S1 and the second similarity value S2 is a frequency f 1-1 , f 1-2 , f 1-3 , in which keywords appear in resources of each classification category, as in the above expressions.
  • f 1-n / f 2-1 , f 2-2 , f 2-3 .. f 2-n keywords appear in resources of each classification category, as in the above expressions.
  • f 1-n / f 2-1 , f 2-2 , f 2-3 .. f 2-n the preset weights (W 1-1 , W 1-2 ) for the classification category to which the resource belongs. , W 1-3 .. W 1-n / W 2-1 , W 2-2 , W 2-3 .. W 2-n ).
  • the above weights may be appropriately set in consideration of the level of the corresponding classification category in each classification system.
  • the classification category of the first classification system eg, classification 1-1
  • the classification category of the second classification system eg, classification 2- Association relationship of 1
  • the classification category of the first classification scheme eg, Classification 1-1
  • the classification category of the first classification system eg. For example, classification 1-1) and a classification category (eg, classification 2-1) of the second classification system are set as being related.
  • the threshold value (T%) for the difference between the first similarity value S1 and the second similarity value S2 which is the basis for establishing the association, is not limited to 10%, and in some cases, more or more than that. It can be set to the following values.
  • an association relationship between the classification category of the first classification scheme and the classification category of the second classification scheme may be set, and through the association model setting means based on the similarity value for each keyword, as shown in FIG. It is possible to automatically establish a set of relations of categories between the classification schemes and to database and manage them. Accordingly, in the semantic search service system according to an exemplary embodiment of the present invention, a database is classified based on an ontology classification scheme in a different classification scheme in various fields, and is classified with a classification in another classification concept in another field. Based on the mapped associations, it is possible to efficiently recommend classification categories, perform semantic resource search services, and provide users with rich and accurate search results easily and conveniently.
  • the first similarity value (S1) and the second similarity value ( S2) are applied to [Equation 1] and [Equation 2] so that the first similarity value (S1) and the second similarity value ( S2) can be calculated. Accordingly, when the difference between the first similarity value S1 and the second similarity value S2 is less than or equal to the threshold value T%, for example, 10%, the corresponding resource belonging to the classification category of the first classification scheme may be determined. 2 It may be adopted and set as being related to the classification category of the classification system. In addition, even when a new keyword is extracted and reflected from a corresponding resource that does not have a classification category as described above, the resource including the new keyword may be included to establish an association relationship with another classification system adopted as described above.
  • the setting of the association between classification categories of other classification systems may be updated to learn in the same manner as the resource is added, and the association between the categories is accurate for each update, thereby further improving search accessibility. Accordingly, in the search result providing means for displaying the resources of the classification system including the input keyword for each classification category on the display means, the resources of the classification system with high agreement with the input keywords are preferentially displayed for each classification category. In this case, it is also possible to display and recommend resources of other classification systems in which the related relation is most established with the classification system adjacent to the resources indicated above, for each classification category.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명에 따른 시멘틱 검색 방법은, 복수의 분류 카테고리를 갖는 분류 체계를 두 가지 이상으로 구분하여 구분된 각각의 분류 체계에 대하여 각 분류 카테고리에 대응된 리소스들을 데이터베이스화하고, 각 키워드에 대하여 제1 분류 체계의 제1 분류 카테고리와 제2 분류 체계의 제2 분류 카테고리가 갖는 유사도값에 기초하여 두 분류 카테고리 사이의 연관 관계를 설정하며, 입력 키워드에 대한 검색 결과의 제공 시에, 상기 연관 관계에 기초하여 복수의 분류 체계에 속한 리소스들을 각 분류 체계별 또는 각 분류 카테고리별로 구분하여 검색 결과를 제공할 수 있다.

Description

다수 분류 체계를 연동한 시멘틱 검색 방법 및 시스템
본 발명은 시멘틱(semantic) 검색 방법 및 시스템에 관한 것으로서, 특히, 다양한 분야에서 각기 다른 분류 체계로 데이터베이스화된 리소스들을 통합하여 온톨로지(ontology) 분류 스키마(schema)를 이용하여 다른 분야의 다른 분류 개념에 있는 분류와도 연관성 정도에 따라 매핑시켜서 데이터베이스화함으로써 사용자 접근성이 향상된 분류 카테고리의 추천 및 의미론적 리소스 검색 서비스를 실현할 수 있는 시멘틱 검색 방법 및 시스템에 관한 것이다.
오늘날 각종 정보의 홍수 속에서 사용자가 찾고자 하는 정보를 신속하고 정확하게 검색할 수 있는 시스템이 많은 분야에서 요구되고 있다. 예를 들어, 도서관의 도서 검색 시스템, 웹(web) 사이트의 정보 검색 시스템, LAN으로 연결된 소규모 네트워크나 개인용 PC의 저장 장치에 관리되는 리소스들에 대한 검색 시스템 등 검색에 유용한 시스템이 관리되는 많은 정보, 예를 들어, 문서 파일, 이미지 파일, 비디오 파일, 데이터베이스 정보, 텍스트 데이터 등 다양한 형태의 정보를 보다 빠르고 지능화된 방법으로 검색하기 위한 많은 방법들이 개발되고 있다.
일반적인 검색 시스템에서는 하나의 분류 체계 내에서 검색 대상 자료로부터 검색어에 해당하는 문자열을 추출하고 추출된 문자열에 대한 검색어와의 일치도 비교를 통하여 검색 결과를 제공할 수 있다. 예를 들어, 인터넷 서점이나 도서관에서 사용하는 검색 시스템에서는 KDC(Korea Decimal Classification) 분류 체계에 따른 도서의 목록이나 요약 정보를 제공할 수 있다. 이와 같은 검색 시스템은 인터넷 쇼핑몰이나 학술 정보 제공 사이트에서도 유사하게 검색어에 유사한 각종 자료를 제공할 수 있다.
그러나, 다양한 분류 체계에 따라 데이터베이스화된 리소스들을 운영하는 경우에, 검색 대상 범위가 증가하여 일일이 리소스들을 검색하여 검색어에 해당하는 유사 자료를 제공하는 데에는 어려움이 있다. 예를 들어, 도서 검색 시스템의 경우에, 사용자에 따라서는 KDC의 분류 체계뿐만 아니라, 학진(한국학술진흥재단: KRF: Korea Research Foundation), DDC(Dewey Decimal Classification), UDC(Univeral Decimal Classification) 등의 분류 체계에 따른 검색 결과를 희망할 수 있다. 그러나, 이와 같은 각각의 분류 체계에 따른 리소스들은 서로 산재되어 있어서 검색어에 해당하는 리소스를 일일이 검색하는 시간이 많이 소요될 수 있으며, 분류 체계별로 일목 요연한 검색 결과를 제공하지 못하므로, 사용자로서는 쉽게 필요한 정보에 접근할 수 없는 문제점이 있다.
본 발명은 상술한 문제점을 해결하기 위한 것으로서, 본 발명의 목적은 사용자 접근성이 향상된 풍부하고 정확한 검색결과를 제공하기 위하여, 다양한 분야에서 각기 다른 분류 체계로 데이터베이스화된 리소스들을 통합하여 온톨로지(ontology) 분류 스키마(schema)를 이용하여 다른 분야의 다른 분류 개념에 있는 분류와도 연관성 정도에 따라 매핑시켜서 데이터베이스화하여 효율적으로 분류 카테고리를 추천하며 의미있는 리소스 검색 결과를 서비스할 수 있는 시멘틱 검색 방법 및 시스템을 제공하는 데 있다.
먼저, 본 발명의 특징을 요약하면, 상기의 목적을 달성하기 위한 본 발명의 일면에 따른 시멘틱 검색 방법, 복수의 분류 카테고리를 갖는 분류 체계를 두 가지 이상으로 구분하여 구분된 각각의 분류 체계에 대하여 각 분류 카테고리에 대응된 리소스들을 데이터베이스화하고, 각 키워드에 대하여 제1 분류 체계의 제1 분류 카테고리와 제2 분류 체계의 제2 분류 카테고리가 갖는 유사도값에 기초하여 두 분류 카테고리 사이의 연관 관계를 설정하며, 입력 키워드에 대한 검색 결과의 제공 시에, 상기 연관 관계에 기초하여 복수의 분류 체계에 속한 리소스들을 각 분류 체계별 또는 각 분류 카테고리별로 구분하여 검색 결과를 제공하는 것을 특징으로 한다.
상기 연관 관계는, 제1 분류 체계와 제2 분류 체계 중 어느 하나의 리소스에 포함된 각 키워드를 추출하여, 상기 각 리소스의 미리 정해진 분류 정보에 기초하여 상기 각 키워드가 상기 제1 분류 체계의 분류 카테고리에 대하여 갖는 제1 유사도값과 상기 제2 분류 체계의 분류 카테고리에 대하여 갖는 제2 유사도값을 계산하며, 각 분류 카테고리의 레벨을 고려한 상기 제1 유사도값과 상기 제2 유사도값의 차이에 기초하여 설정될 수 있다.
상기 시멘틱 검색 방법은, 각 분류 카테고리에 포함된 키워드의 집합을 미리 추출해 두고, 각 키워드에 대하여 문서 파일, 데이터베이스 정보, 텍스트 데이터, 이미지, 또는 동영상을 포함한 리소스에 대한 메타 데이터에서 추출되는 키워드와 매칭되는 분류 카테고리들의 연관 관계를 설정하여 조합함으로써 시멘틱 검색을 제공할 수 있다.
상기 각 리소스의 미리 정해진 분류 정보는 리소스 또는 해당 메타데이터에 포함된 해당 분류 체계의 분류 카테고리에 대한 정보를 포함하고, 상기 분류 카테고리는 적어도 한 레벨 이상의 세부 카테고리를 포함한 계층 구조를 갖는다.
상기 제1 유사도 값 또는 상기 제2 유사도 값은, 키워드가 각 분류 카테고리의 리소스에서 출현하는 빈도수와 해당 리소스가 속하는 분류 카테고리에 대하여 미리 설정한 가중치의 곱에 기초하여 계산될 수 있다.
상기 해당 리소스가 속하는 분류 카테고리가 없는 경우에 상기 키워드가 해당 리소스에서 출현하는 빈도수만을 이용하기 위하여, 상기 분류 카테고리들에 대하여 미리 설정한 가중치를 모두 같은 값으로 하여 다른 분류 체계와 연관 관계를 채택할 수 있다.
상기 검색 결과의 제공 시에, 상기 입력 키워드가 포함된 해당 분류 체계의 리소스들을 우선적으로 디스플레이 수단에 각 분류 카테고리별로 표시하고, 상기 우선하여 표시된 리소스들과 인접하게 상기 해당 분류 체계와 상기 연관 관계가 가장 많이 설정된 다른 분류 체계의 리소스들을 각 분류 카테고리별로 표시할 수 있다.
그리고, 본 발명의 다른 일면에 따른 시멘틱 검색 시스템은, 복수의 분류 카테고리를 갖는 분류 체계를 두 가지 이상으로 구분하여 구분된 각각의 분류 체계에 대하여 각 분류 카테고리에 대응된 리소스들을 저장하고 관리하는 데이터베이스; 각 키워드에 대하여 제1 분류 체계의 제1 분류 카테고리와 제2 분류 체계의 제2 분류 카테고리가 갖는 유사도 값에 기초하여 두 분류 카테고리 사이의 연관 관계를 설정하는 관계 모델 설정 수단; 및 입력 키워드에 대한 검색 결과의 제공 시에, 상기 연관 관계에 기초하여 복수의 분류 체계에 속한 리소스들을 각 분류 체계별 또는 각 분류 카테고리별로 구분하여 검색 결과를 제공하는 검색 결과 제공 수단을 포함할 수 있다.
본 발명에 따른 시멘틱 검색 방법 및 시스템에 따르면, 다양한 분야에서 각기 다른 분류 체계로 데이터베이스화된 리소스들을 통합하여 온톨로지(ontology) 분류 스키마(schema)를 이용하여 다른 분야의 다른 분류 개념에 있는 분류와도 연관성 정도에 따라 매핑시켜서 데이터베이스화하여 효율적으로 분류 카테고리를 추천하며 의미론적 리소스 검색 서비스를 수행함으로써, 사용자에게 쉽고 편리하게 풍부하고 정확한 검색 결과를 제공할 수 있다.
도 1은 본 발명의 일실시예에 따른 시멘틱 검색 시스템을 설명하기 위한 도면이다.
도2는 분류체계간의 계층구조와 다수분류간의 연관관계 구성을 설명하기 위한 도면이다.
도 3은 제1 분류 체계와 키워드들 간의 연관성 매핑 방법을 설명하기 위한 도면이다.
도 4은 제2 분류 체계와 키워드들 간의 연관성 매핑 방법을 설명하기 위한 도면이다.
도 5은 키워드들과 분류 카테고리들의 간의 연관성 매핑 결과를 설명하기 위한 도면이다.
본 발명과 본 발명의 동작상의 이점 및 본 발명의 실시에 의하여 달성되는 목적을 충분히 이해하기 위해서는 본 발명의 바람직한 실시예를 예시하는 첨부 도면 및 첨부 도면에 기재된 내용을 참조하여야만 한다.
이하, 첨부한 도면을 참조하여 본 발명의 바람직한 실시예를 설명함으로써, 본 발명을 상세히 설명한다.
이하에서 언급하는 본 발명의 일실시예에 따른 시멘틱 검색 시스템은, 컴퓨터, PDA, 셀룰러 폰이나 기타 전용 기기 등에서 하드웨어, 소프트웨어 또는 이들의 조합으로 동작되도록 구현될 수 있으며, 또한, 인터넷, 이동 통신망, 무선 인터넷 망 등을 통하여 웹(WEB)서버, 왑(WAP)서버 등에서 사용자에게 쉽고 편리하게 풍부하고 정확한 검색 결과를 제공하도록 동작할 수 있다.
도 1은 본 발명의 일실시예에 따른 시멘틱 검색 시스템을 설명하기 위한 도면이다.
도 1을 참조하면, 본 발명의 일실시예에 따른 시멘틱 검색 시스템은, 학진 분류, KDC, DCC, UCC, 인터넷 포털의 상품이나 기사의 분류, 인터넷 서점에서의 도서 분류 등 서로 다른 분류 체계를 갖는 리소스들이 저장 관리된 데이터베이스의 정보에 대하여, 소정 연관 관계 설정 수단을 통하여 서로 다른 분류 체계의 분류 카테고리들 간의 연관 관계를 미리 설정하여 구축하여 둠으로써, 입력 키워드에 대한 검색 결과의 제공 시에, 위와 같은 연관 관계에 기초하여 복수의 분류 체계에 속한 리소스들을 각 분류 체계별 또는 각 분류 카테고리별로 구분하여 검색 결과를 제공할 수 있다.
예를 들어, 학진 분류는 A000000인문학, B000000사회과학, C000000자연과학, D000000공학, E000000의약학, F000000농수해양, G000000예술체육, H000000복합학 등으로 학문 기타 관련 분야의 리소스들을 데이터베이스화하여 관리하기 위하여 사용되고 있으며, KDC 분류는 000 총류, 100 철학, 200 종교, 300 사회과학, 400 순수과학, 500 기술과학, 600 예술, 700 어학, 800 문학, 900 역사 등으로 도서 기타 관련 분야의 리소스들을 데이터베이스화하여 관리하기 위하여 사용되고 있고, DDC 분류는 000 서지정보학, 총서, 전집, 100철학, 200 종교, 300 사회과학, 400 언어학, 500 자연과학, 600 기술과학(의학, 공학, 농학, 가정학 등), 700 예술, 800 문학, 900 역사, 지리, 인물 등으로 도서 기타 관련 분야의 리소스들을 데이터베이스화하여 관리하기 위하여 사용되고 있다. 이외에도, 인터넷 포털이나 서점 등에서도 위와 같은 분류 체계를 응용하여 사이트 운영 목적에 맞는 독자적인 분류 체계를 갖추어 사용자의 키워드 검색에 필요한 검색 결과를 용이하게 제공하고자 하고 있다.
이와 같은 각 분야의 리소스들은 문서 파일, 이미지 파일, 비디오 파일, 데이터베이스 정보, 또는 텍스트 데이터 형식을 취할 수 있는 데, 각 분류 체계에 따라 위와 같은 대분류 하위에 세부 분류 카테고리가 적어도 한 레벨 이상, 예를 들어, 중분류, 소분류, 세분류 등으로 구분되는 계층(hierarchical) 구조의 분류 카테고리에 대하여 미리 정해진 분류 정보가 해당 리소스나 해당 리소스의 메타데이터에 대응되어 데이터베이스에 관리되고 있다. 해당 리소스의 속성 정보를 지칭하는 메타데이터는 위와 같은 해당 분류 체계의 분류 카테고리에 대한 정보를 포함할 뿐만 아니라, 리소스의 위치, 키워드, 타입(텍스트, 이미지, 비디오 등), 작성자 정보, 권리조건, 이용조건, 이용로그 등에 관한 정보가 포함될 수 있다.
특히, 본 발명에서는 각 분야의 해당 분류 체계에서 리소스들은 RDF/OWL(Resource Description Framework /Web Ontology Language) 구문에 기초한 온톨로지(ontology) 형태로 구축될 수 있다. 문서, 이미지, 비디오(동영상), 데이터베이스 정보, 텍스트 데이터 등의 다양한 리소스들은 메타데이터를 제공하고 있으며, 이러한 메타데이터들은 분류나 키워드 컨셉(concept)을 중심으로 한 의미론적 연관 관계의 맵(map)으로 연결되어 온톨로지로 구축될 수 있으며, 본 발명에 따른 연관 관계 설정에 따라 통합적으로 시멘틱한 검색을 통하여 보다 사용자에게 정확하고 풍부한 정보를 제공할 수 있다.
한편, 도 1의 점선과 같이, 본 발명의 일실시예에 따른 시멘틱 검색 시스템은, 소정 연관 관계 설정 수단을 통하여 각각의 분류 체계에 대하여 각 분류 카테고리에 대응된 리소스들이 저장 관리되는 데이터베이스의 정보로부터 각 키워드에 대하여 분류 체계가 다른 분류 카테고리 간의 연관 관계를 미리 설정하여 구축할 수 있다.
도 2와 같이, 각 분류 체계에는 계층구조를 가진 분류 카테고리를 지니고 있으며, 다수의 분류 체계를 모두 열거하였을 때에도 서로 다른 분류체계의 카테고리 간에 연관관계가 나타남을 알 수 있다. 본 발명에서는 이러한 연관관계를 시맨틱한 관계 알고리즘을 통하여 다양한 성격의 연관관계를 생성시켜주는 시스템을 제안하는 것이다. 본 발명의 일실시예에 따른 시멘틱 검색 시스템에서는, 각 분류 카테고리에 자주 이용되는 키워드의 집합을 미리 추출해 두고, 각 키워드에 대하여 문서 파일, 데이터베이스 정보, 텍스트 데이터, 이미지, 또는 동영상을 포함한 리소스에 대한 메타 데이터에서 추출되는 키워드와 매칭되는 분류 카테고리들의 연관 관계를 설정하여 조합한다. 예를 들어, 도 2와 같이 각 분류 카테고리마다 포함하고 있는, 예를 들어, 인명을 포함한 키워드 집합이 생성될 수 있으며, 동일한 키워드가 여러 분류 카테고리에도 포함될 수 있다. 이들 간의 의미적 관계가 연관 관계로 설정 부여되어 시맨틱 검색을 제공하도록 한다.
예를 들어, 입력될 각각의 키워드가 제1 분류 체계의 제1 분류 카테고리와 제2 분류 체계의 제2 분류 카테고리에서 갖는 연관성 정도에 따라 두 카테고리 간의 연관 관계를 미리 설정해 놓을 수 있다. 각 분류 체계에서는 해당 분야에 적합한 컨셉(concept)으로 접근하여 각 분류 카테고리를 정해놓고 있으며, 본 발명의 일실시예에 따른 시멘틱 검색 시스템에서는 이와 같은 분류 카테고리간 연관성을 미리 파악하여 스키마를 설정 구성해 놓음으로써 입력 키워드에 대하여 해당 검색 대상 리소스의 접근성을 향상시킬 수 있고, 검색 결과에 대한 유사도, 정확도, 상하위 개념 등 관계 모델 설정이 용이하여 분류 카테고리의 추천 서비스에도 크게 기여할 수 있다.
예를 들어, 위와 같이 각 키워드에 대하여 분류 체계가 다른 분류 카테고리 간의 연관 관계가 미리 설정되어 구축되면, 본 발명의 일실시예에 따른 시멘틱 검색 시스템에서는 소정의 검색 결과 제공 수단(예를 들어, 검색 엔진)을 통하여, 입력 키워드에 대하여 위와 같은 연관 관계를 적용한 시멘틱 검색을 이용해 복수의 분류 체계에 속한 리소스들을 각 분류 체계별 또는 각 분류 카테고리별로 구분하여 검색 결과를 제공할 수 있게 된다. 일례로, 검색할 키워드가 입력되면, 입력 키워드에 해당하는 각 분류 체계의 해당 분류 카테고리를 우선적으로 검색하고, 이에 따라 각 분류 체계별로 구분하여 디스플레이 수단에 검색 결과를 제공하되, 해당 키워드에 대한 일치도가 높은 리소스를 갖는 분류 카테고리의 리소스에 대한 정보를 우선적으로 추천하여 검색 결과를 제공하는 것이 가능하다. 또한, 검색 결과의 제공 시에, 해당 입력 키워드가 가장 많이 포함된 해당 분류 체계의 리소스들을 각 분류 카테고리별로 가장 먼저 표시하고, 해당 분류 체계와 위와 같은 연관 관계가 가장 많이 설정된 다른 분류 체계의 리소스들을 각 분류 카테고리별로 표시할 수도 있다.
이하, 도 3 내지 도 5을 참조하여, 본 발명의 일실시예에 따른 시멘틱 검색 시스템에서의 분류 카테고리간 연관 관계 설정 방법을 좀더 자세히 설명한다.
수 많은 리소스들에 대한 검색을 용이하게 할 수 있도록 기본적으로 리소스에는 미리 정해진 분류 정보가 포함될 수 있는데, 이와 같은 분류 정보에는 다양한 분야에서 사용되고 있는 도 1과 같은 각 분류 체계에서 계층 구조의 분류 카테고리에 대한 정보가 포함될 수 있다. 이와 같은 분류 정보는 해당 리소스의 속성 정보 중의 하나로서 리소스에 부여되는 메타데이터에 포함될 수 있다.
이와 같이 리소스 또는 메타데이터에는 분류정보가 포함되지만, 각 분류 체계 상에서는 서로 다른 분류 컨셉을 적용하여 분류 카테고리를 정하고 있기 때문에, 타 분류 체계의 분류 카테고리 간 연관성을 파악하기는 쉽지 않다. 예를 들어, 도서 등의 분류를 위하여 서지학에서 사용하는 KDC나 DDC분류 체계에서, 대분류, 중분류, 소분류, 세분류 등의 해당 분류 카테고리들 간에 정확히 일치되는 동일한 분류 카테고리인지 또는 어느 정도 유사성을 가지고 연관성이 있는 분류 카테고리 인지 여부를 파악하기 위하여, 검색 결과를 보고 사용자가 자신의 지식을 바탕으로 구분해 내야만 하는 어려움이 있다. 따라서, 본 발명에서는 분류 체계를 구분하여 연관 관계가 가장 많이 설정된 다른 분류 체계의 리소스들을 검색 결과로서 자동으로 제공하지 못하는 어려움을 극복하고자 하였다. 또한, 본 발명에서는 해당 리소스가 속하는 분류 카테고리가 없는 경우(예를 들어, 분류 정보가 없는 경우)에도 다른 분류 체계의 분류 카테고리와 연관 관계를 맺어 주어 자동 분류함으로써 연관성 있는 검색 결과가 일목 요연하게 정리되어 제시될 수 있도록 지원할 수 있다.
도 3 또는 도 4에서, 리소스 또는 해당 메타데이터에는 미리 정해진 분류 카테고리(분류 1-1, 1-2.../분류 2-1, 2-2...)를 포함한 분류 정보가 포함된다. 제1 분류 체계의 각 분류 카테고리(분류 1-1, 1-2...1-n)를 제2 분류 체계의 어느 하나 이상의 분류 카테고리(분류 2-1, 2-2...2-k)와 연관 관계를 설정하기 위하여, 먼저, 소정 관계 모델 설정 수단은 리소스의 언어 정보, 예를 들어, 제목, 주제, 내용 등 형태소 분석이 가능한 정보로부터 필요한 키워드들(키워드 1,2..m)을 추출하여 학습 셋(set)을 준비할 수 있다. 키워드들(키워드 1,2..m)은 각 품사별, 예를 들어, 명사, 부사, 형용사, 동사 등으로 구분하여 대량으로 자동 추출될 수 있다.
키워드들(키워드 1,2..m)이 추출되면, 관계 모델 설정 수단은 각 키워드가 제1 분류 체계의 분류 카테고리(예를 들어, 분류 1-1)에 대하여 갖는 제1 유사도값(S1)과 제2 분류 체계의 분류 카테고리(예를 들어, 분류 2-1)에 대하여 갖는 제2 유사도값(S2)을 계산하며, 제1 유사도값(S1)과 제2 유사도값(S2)의 차이에 기초하여 연관 관계를 설정할 수 있다.
[수학식 1]
S1 = f1-1*W1-1 + f1-2*W1-2 + f1-3*W1-3 + .. + f1-n*W1-n..
[수학식 2]
S2 = f2-1*W2-1 + f2-2*W2-2 + f2-3*W2-3 + .. + f2-n*W2-n..
제1 유사도값(S1)과 제2 유사도값(S2) 각각은 위의 식들과 같이, 키워드가 각 분류 카테고리의 리소스에서 출현하는 빈도수(f1-1, f1-2, f1-3.. f1-n/ f2-1, f2-2, f2-3.. f2-n)와 해당 리소스가 속하는 분류 카테고리에 대하여 미리 설정한 가중치(W1-1, W1-2, W1-3.. W1-n/ W2-1, W2-2, W2-3.. W2-n)의 곱으로 계산될 수 있다. 각 분류체계에서의 해당 분류 카테고리의 레벨을 고려하여 위와 같은 가중치가 적절히 설정될 수 있다.
이와 같은 방법으로 각 키워드(키워드 1,2..m)에 대하여 제1 분류 체계의 분류 카테고리(예를 들어, 분류 1-1)와 제2 분류 체계의 분류 카테고리(예를 들어, 분류 2-1)의 연관 관계를 설정할 수 있다. 예를 들어, 제1 유사도값(S1)과 제2 유사도값(S2)의 차이가 임계치(T%), 예를 들어, 10% 이하인 경우에, 제1 분류 체계의 분류 카테고리(예를 들어, 분류 1-1) 리소스들의 키워드들과 제2 분류 체계의 분류 카테고리(예를 들어, 분류 2-1) 리소스들의 키워드들 사이에 많은 일치하는 키워드들이 있는 것으로 보아 제1 분류 체계의 분류 카테고리(예를 들어, 분류 1-1)와 제2 분류 체계의 분류 카테고리(예를 들어, 분류 2-1)는 연관 관계가 있는 것으로 설정된다. 또한, 제1 유사도값(S1)과 제2 유사도값(S2)의 차이가 임계치(T%), 예를 들어, 10%를 초과하는 경우에는, 제1 분류 체계의 분류 카테고리(예를 들어, 분류 1-1) 리소스들의 키워드들은 제2 분류 체계의 분류 카테고리(예를 들어, 분류 2-1) 리소스들의 키워드들과 대부분 일치하지 않는 것으로 보아 제1 분류 체계의 분류 카테고리(예를 들어, 분류 1-1)와 제2 분류 체계의 분류 카테고리(예를 들어, 분류 2-1)는 연관 관계가 없는 것으로 결정된다. 여기서, 연관 관계 설정의 기초가 되는 제1 유사도값(S1)과 제2 유사도값(S2)의 차이에 대한 임계치(T%)는 10%에 한정되는 것이 아니라, 경우에 따라서는 그 이상 또는 그 이하의 값으로 설정될 수 있다.
이와 같은 방식으로 제1 분류 체계의 분류 카테고리와 제2 분류 체계의 분류 카테고리의 연관 관계를 설정할 수 있고, 각 키워드에 대한 위와 같은 유사도값에 기초하여 연관 관계 모델 설정 수단을 통하여 도 5과 같이 두 분류 체계간 카테고리의 연관 관계의 셋을 자동으로 구축하여 데이터베이스화하고 관리하는 것이 가능하다. 이에 따라, 본 발명의 일시예예 따른 시멘틱 검색 서비스 시스템에서는, 다양한 분야에서 각기 다른 분류 체계로 온톨로지(ontology) 분류 스키마에 기초하여 데이터베이스화된 리소스들을 통합하여 다른 분야의 다른 분류 개념에 있는 분류와도 매핑된 연관 관계를 토대로 효율적으로 분류 카테고리를 추천하며 의미론적 리소스 검색 서비스를 수행할 수 있고, 사용자에게 쉽고 편리하게 풍부하고 정확한 검색 결과를 제공할 수 있게 된다.
도 3 내지 도 5과 같은 방식으로 연관 관계의 설정에 있어서, 해당 리소스가 속하는 분류 카테고리가 없는 경우, 예를 들어, 분류 카테고리와 같은 분류 정보를 포함한 메타 데이터가 없는 경우에도, 키워드가 해당 리소스에서 출현하는 빈도수만을 [수학식 1] 및 [수학식 2]에 적용하여 위와 같은 방식으로 연관 관계를 설정하여 줄 수 있다. 예를 들어, 해당 리소스가 속하는 분류 카테고리들에 대하여 미리 설정한 가중치(W1-1, W1-2, W1-3.. W1-n/ W2-1, W2-2, W2-3.. W2-n)를 모두 같은 값으로 하고 키워드가 해당 리소스에서 출현하는 빈도수(f1-1, f1-2, f1-3.. f1-n/ f2-1, f2-2, f2-3.. f2-n)를 [수학식 1] 및 [수학식 2]에 적용하여 두 분류 카테고리에 대한 제1 유사도값(S1)과 제2 유사도값(S2)을 계산할 수 있다. 이에 따라, 제1 유사도값(S1)과 제2 유사도값(S2)의 차이가 임계치(T%), 예를 들어, 10% 이하인 경우에, 제1 분류 체계의 분류 카테고리에 속한 해당 리소스는 제2 분류 체계의 분류 카테고리와 연관 관계가 있는 것으로 채택되어 설정될 수 있다. 또한, 위와 같이 분류 카테고리가 없는 해당 리소스에서 새로운 키워드를 추출하여 반영하는 경우에도, 해당 새로운 키워드가 포함된 리소스를 위와 같이 채택된 다른 분류 체계와 연관 관계가 설정되도록 포함시킬 수 있다.
이와 같은 타 분류 체계의 분류 카테고리 간 연관 관계의 설정은 리소스의 추가 시마다 위와 같은 방식으로 학습되도록 업데이트될 수 있으며, 업데이트마다 카테고리 간 연관 관계가 정확해져서 검색의 접근성이 더욱 향상된다. 이에 따라, 검색 결과 제공 수단에서는 입력되는 키워드가 포함된 해당 분류 체계의 리소스들을 디스플레이 수단에 각 분류 카테고리별로 표시하는 데 있어서, 입력 키워드와 일치도가 높은 분류 체계의 리소스들을 각 분류 카테고리별로 우선적으로 표시하여 추천할 수 있으며, 이때, 해당 분류 체계와 위와 같은 연관 관계가 가장 많이 설정된 다른 분류 체계의 리소스들을 상기 우선하여 표시된 리소스들과 인접하게 각 분류 카테고리별로 표시하여 추천하는 것도 가능하다.
이상에서와 같이 도면과 명세서에서 최적 실시예가 개시되었다. 여기서 특정한 용어들이 사용되었으나, 이는 단지 본 발명을 설명하기 위한 목적에서 사용된 것이지 의미한정이나 특허청구범위에 기재된 본 발명의 범위를 제한하기 위하여 사용된 것은 아니다. 그러므로 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다.

Claims (8)

  1. 복수의 분류 카테고리를 갖는 분류 체계를 두 가지 이상으로 구분하여 구분된 각각의 분류 체계에 대하여 각 분류 카테고리에 대응된 리소스들을 데이터베이스화하고,
    각 키워드에 대하여 제1 분류 체계의 제1 분류 카테고리와 제2 분류 체계의 제2 분류 카테고리가 갖는 유사도값에 기초하여 두 분류 카테고리 사이의 연관 관계를 설정하며,
    입력 키워드에 대한 검색 결과의 제공 시에, 상기 연관 관계에 기초하여 복수의 분류 체계에 속한 리소스들을 각 분류 체계별 또는 각 분류 카테고리별로 구분하여 검색 결과를 제공하는 것을 특징으로 하는 시멘틱 검색 방법.
  2. 제1항에 있어서, 상기 연관 관계는,
    제1 분류 체계와 제2 분류 체계 중 어느 하나의 리소스에 포함된 각 키워드를 추출하여,
    상기 각 리소스의 미리 정해진 분류 정보에 기초하여 상기 각 키워드가 상기 제1 분류 체계의 분류 카테고리에 대하여 갖는 제1 유사도값과 상기 제2 분류 체계의 분류 카테고리에 대하여 갖는 제2 유사도값을 계산하며,
    각 분류 카테고리의 레벨을 고려한 상기 제1 유사도값과 상기 제2 유사도값의 차이에 기초하여 설정되는 것을 특징으로 하는 시멘틱 검색 방법.
  3. 제1항에 있어서,
    각 분류 카테고리에 포함된 키워드의 집합을 미리 추출해 두고, 각 키워드에 대하여 문서 파일, 데이터베이스 정보, 텍스트 데이터, 이미지, 또는 동영상을 포함한 리소스에 대한 메타 데이터에서 추출되는 키워드와 매칭되는 분류 카테고리들의 연관 관계를 설정하여 조합함으로써 시멘틱 검색을 제공하는 것을 특징으로 하는 시멘틱 검색 방법.
  4. 제2항에 있어서, 상기 각 리소스의 미리 정해진 분류 정보는 리소스 또는 해당 메타데이터에 포함된 해당 분류 체계의 분류 카테고리에 대한 정보를 포함하고,
    상기 분류 카테고리는 적어도 한 레벨 이상의 세부 카테고리를 포함한 계층 구조를 갖는 것을 특징으로 하는 시멘틱 검색 방법.
  5. 제2항에 있어서, 상기 제1 유사도값 또는 상기 제2 유사도값은,
    키워드가 각 분류 카테고리의 리소스에서 출현하는 빈도수와 해당 리소스가 속하는 분류 카테고리에 대하여 미리 설정한 가중치의 곱에 기초하여 계산되는 것을 특징으로 하는 시멘틱 검색 방법.
  6. 제5항에 있어서, 상기 해당 리소스가 속하는 분류 카테고리가 없는 경우에 상기 키워드가 해당 리소스에서 출현하는 빈도수만을 이용하기 위하여, 상기 분류 카테고리들에 대하여 미리 설정한 가중치를 모두 같은 값으로 하여 다른 분류 체계와 연관 관계를 채택하는 것을 특징으로 하는 시멘틱 검색 방법.
  7. 제5항에 있어서,
    상기 검색 결과의 제공 시에, 상기 입력 키워드가 포함된 해당 분류 체계의 리소스들을 우선적으로 디스플레이 수단에 각 분류 카테고리별로 표시하고, 상기 우선하여 표시된 리소스들과 인접하게 상기 해당 분류 체계와 상기 연관 관계가 가장 많이 설정된 다른 분류 체계의 리소스들을 각 분류 카테고리별로 표시하는 것을 특징으로 하는 시멘틱 검색 방법.
  8. 복수의 분류 카테고리를 갖는 분류 체계를 두 가지 이상으로 구분하여 구분된 각각의 분류 체계에 대하여 각 분류 카테고리에 대응된 리소스들을 저장하고 관리하는 데이터베이스;
    각 키워드에 대하여 제1 분류 체계의 제1 분류 카테고리와 제2 분류 체계의 제2 분류 카테고리가 갖는 유사도값에 기초하여 두 분류 카테고리 사이의 연관 관계를 설정하는 관계 모델 설정 수단; 및
    입력 키워드에 대한 검색 결과의 제공 시에, 상기 연관 관계에 기초하여 복수의 분류 체계에 속한 리소스들을 각 분류 체계별 또는 각 분류 카테고리별로 구분하여 검색 결과를 제공하는 검색 결과 제공 수단
    를 포함하는 것을 특징으로 하는 시멘틱 검색 시스템.
PCT/KR2010/003156 2009-05-21 2010-05-19 다수 분류 체계를 연동한 시멘틱 검색 방법 및 시스템 WO2010134752A2 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020090044508A KR101079769B1 (ko) 2009-05-21 2009-05-21 다수 분류 체계를 연동한 시멘틱 검색 방법 및 시스템
KR10-2009-0044508 2009-05-21

Publications (2)

Publication Number Publication Date
WO2010134752A2 true WO2010134752A2 (ko) 2010-11-25
WO2010134752A3 WO2010134752A3 (ko) 2011-03-17

Family

ID=43126646

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2010/003156 WO2010134752A2 (ko) 2009-05-21 2010-05-19 다수 분류 체계를 연동한 시멘틱 검색 방법 및 시스템

Country Status (2)

Country Link
KR (1) KR101079769B1 (ko)
WO (1) WO2010134752A2 (ko)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103761254A (zh) * 2013-12-26 2014-04-30 清华大学 多领域服务主题匹配推荐方法
CN110245170A (zh) * 2019-04-19 2019-09-17 联通系统集成有限公司 数据处理方法及系统
CN111177412A (zh) * 2019-12-30 2020-05-19 成都信息工程大学 公共标识语双语平行语料库系统
CN113722489A (zh) * 2021-09-02 2021-11-30 珠海市新德汇信息技术有限公司 一种基于nlp算法的关系分析方法
CN114816763A (zh) * 2022-05-27 2022-07-29 江苏控智电子科技有限公司 一种采用大数据技术的计算机资源分配系统及方法
CN114882985A (zh) * 2022-07-11 2022-08-09 北京泽桥医疗科技股份有限公司 基于数据库和ai算法识别的医药多媒体管理系统及方法
CN115098698A (zh) * 2022-06-22 2022-09-23 中电金信软件有限公司 一种构建知识图谱中Schema模型的方法及装置

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8880530B2 (en) * 2011-04-18 2014-11-04 Palo Alto Research Center Incorporated Method for searching related documents based on and guided by meaningful entities
KR101347123B1 (ko) * 2012-04-17 2014-01-03 박석일 정보검색장치 및 정보검색방법, 컴퓨터 판독가능 기록매체
KR102101601B1 (ko) 2014-03-27 2020-04-17 에스케이텔레콤 주식회사 Poi 그룹화를 이용한 poi 정보 제공 장치 및 방법
KR102287482B1 (ko) 2014-03-27 2021-08-09 에스케이플래닛 주식회사 Poi 그룹화를 이용한 poi 정보 제공 장치 및 방법
KR102102344B1 (ko) * 2018-05-31 2020-04-20 가천대학교 산학협력단 컨셉넷을 이용한 한국어 관계 분석 시스템 및 방법
KR102102345B1 (ko) * 2018-05-31 2020-04-20 가천대학교 산학협력단 컨셉넷을 이용한 소정 언어의 관계 분석 시스템 및 방법
KR102133972B1 (ko) * 2018-07-23 2020-07-15 세종대학교산학협력단 다중 분류기 통합 제어 시스템 및 방법
KR102371329B1 (ko) * 2020-05-20 2022-03-07 위인터랙트(주) 과학기술 지식정보의 추천을 위한 운영컴퓨터, 과학기술 지식정보 추천 시스템 및 그 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010104873A (ko) * 2000-05-16 2001-11-28 임갑철 메타 검색엔진을 이용한 인터넷 사이트 검색 서비스 시스템
KR20020069893A (ko) * 2001-02-28 2002-09-05 주식회사 인터넷과 꿈 인터넷 사이트상에서의 검색서비스 제공방법
KR100898454B1 (ko) * 2006-09-27 2009-05-21 야후! 인크. 통합 검색 서비스 시스템 및 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010104873A (ko) * 2000-05-16 2001-11-28 임갑철 메타 검색엔진을 이용한 인터넷 사이트 검색 서비스 시스템
KR20020069893A (ko) * 2001-02-28 2002-09-05 주식회사 인터넷과 꿈 인터넷 사이트상에서의 검색서비스 제공방법
KR100898454B1 (ko) * 2006-09-27 2009-05-21 야후! 인크. 통합 검색 서비스 시스템 및 방법

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103761254A (zh) * 2013-12-26 2014-04-30 清华大学 多领域服务主题匹配推荐方法
CN110245170A (zh) * 2019-04-19 2019-09-17 联通系统集成有限公司 数据处理方法及系统
CN111177412A (zh) * 2019-12-30 2020-05-19 成都信息工程大学 公共标识语双语平行语料库系统
CN111177412B (zh) * 2019-12-30 2023-03-31 成都信息工程大学 公共标识语双语平行语料库系统
CN113722489A (zh) * 2021-09-02 2021-11-30 珠海市新德汇信息技术有限公司 一种基于nlp算法的关系分析方法
CN113722489B (zh) * 2021-09-02 2023-10-31 珠海市新德汇信息技术有限公司 一种基于nlp算法的关系分析方法
CN114816763A (zh) * 2022-05-27 2022-07-29 江苏控智电子科技有限公司 一种采用大数据技术的计算机资源分配系统及方法
CN114816763B (zh) * 2022-05-27 2024-04-05 京闽数科(北京)有限公司 一种采用大数据技术的计算机资源分配系统及方法
CN115098698A (zh) * 2022-06-22 2022-09-23 中电金信软件有限公司 一种构建知识图谱中Schema模型的方法及装置
CN115098698B (zh) * 2022-06-22 2023-04-28 中电金信软件有限公司 一种构建知识图谱中Schema模型的方法及装置
CN114882985A (zh) * 2022-07-11 2022-08-09 北京泽桥医疗科技股份有限公司 基于数据库和ai算法识别的医药多媒体管理系统及方法

Also Published As

Publication number Publication date
WO2010134752A3 (ko) 2011-03-17
KR20100125682A (ko) 2010-12-01
KR101079769B1 (ko) 2011-11-04

Similar Documents

Publication Publication Date Title
WO2010134752A2 (ko) 다수 분류 체계를 연동한 시멘틱 검색 방법 및 시스템
US8051080B2 (en) Contextual ranking of keywords using click data
US7974984B2 (en) Method and system for managing single and multiple taxonomies
Ji et al. Microsoft concept graph: Mining semantic concepts for short text understanding
Tran et al. Encoded summarization: summarizing documents into continuous vector space for legal case retrieval
BRPI0203479B1 (pt) Sistema para enriquecer conteúdo de documento
US9298818B1 (en) Method and apparatus for performing semantic-based data analysis
Yi et al. Revisiting the syntactical and structural analysis of Library of Congress Subject Headings for the digital environment
Sameh et al. Semantic web search results clustering using lingo and wordnet
Chen et al. Topic sense induction from social tags based on non-negative matrix factorization
Wang et al. Data-driven approach for bridging the cognitive gap in image retrieval
Koperwas et al. Intelligent information processing for building university knowledge base
Armentano et al. NLP-based faceted search: Experience in the development of a science and technology search engine
Gladun et al. Semantics-driven modelling of user preferences for information retrieval in the biomedical domain
Nasser et al. n-Gram based language processing using Twitter dataset to identify COVID-19 patients
Ji et al. Mining strong relevance between heterogeneous entities from unstructured biomedical data
JP4534019B2 (ja) 名前及びキーワードのグループ化方法、そのプログラムおよび記録媒体並びに装置
Tabarcea et al. Framework for location-aware search engine
Ren et al. Role-explicit query extraction and utilization for quantifying user intents
Qassimi et al. Towards an emergent semantic of web resources using collaborative tagging
Saraswathi et al. Multi-document text summarization using clustering techniques and lexical chaining
Sathiya et al. Building a knowledge vault with effective data processing and storage
d’Acierno et al. A multimedia summarizer integrating text and images
Locoro et al. MANENT: An infrastructure for integrating, structuring and searching digital libraries
Lobo et al. A novel method for analyzing best pages generated by query term synonym combination

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10777939

Country of ref document: EP

Kind code of ref document: A2

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 10777939

Country of ref document: EP

Kind code of ref document: A2