WO2014092209A1 - Semantic cloud-based semantic annotation method and apparatus - Google Patents

Semantic cloud-based semantic annotation method and apparatus Download PDF

Info

Publication number
WO2014092209A1
WO2014092209A1 PCT/KR2012/010670 KR2012010670W WO2014092209A1 WO 2014092209 A1 WO2014092209 A1 WO 2014092209A1 KR 2012010670 W KR2012010670 W KR 2012010670W WO 2014092209 A1 WO2014092209 A1 WO 2014092209A1
Authority
WO
WIPO (PCT)
Prior art keywords
semantic
annotation
nodes
cloud
query
Prior art date
Application number
PCT/KR2012/010670
Other languages
French (fr)
Korean (ko)
Inventor
고인영
고한규
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to PCT/KR2012/010670 priority Critical patent/WO2014092209A1/en
Publication of WO2014092209A1 publication Critical patent/WO2014092209A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Definitions

  • the present invention relates to a semantic annotation method and apparatus.
  • a method and apparatus for performing semantic annotation on content based on a semantic cloud generated from linked data is disclosed.
  • Annotation is a way for users to add tags to web content according to their ideas.
  • the tag is metadata generated by the user.
  • tags can improve content search results, many Web sites encourage users to add tags. However, since tags are only considered plain text, attempts to improve content search yield only limited results.
  • Semantic annotations exploit ontology to resolve anomalies in searches such as the company "Apple” and fruit “Apple”.
  • semantic web research organizations have used semantic annotations of content as a means to overcome the above limitations.
  • a major drawback of the conventional semantic annotation method is that the conventional semantic annotation method is not intuitive enough to easily resolve semantic ambiguities while the user associates semantic meaning to a given keyword.
  • Korean Laid-Open Patent Publication No. 10-2009-0078986 discloses a semantic annotation apparatus and method for annotating a document using a semantic information knowledge base structured with ontology's semantic information. .
  • One embodiment may provide an apparatus and method for providing semantic annotation for metadata generated by a user.
  • One embodiment may provide an apparatus and method for solving the problem of semantic ambiguity of tags in plain text.
  • generating a query based on a keyword obtaining one or more Resource Description Framework (RDF) nodes associated with the query from linked data, the one or more RDF Generating one or more recommended semantic clouds based on nodes, determining a semantic cloud corresponding to an annotation to be added among the one or more recommended semantic clouds, and annotating the content based on the determined semantic cloud.
  • RDF Resource Description Framework
  • the semantic cloud corresponding to the annotation to be added among the one or more recommended semantic clouds may be determined by selecting an optimal term by the user.
  • Generating the one or more recommended semantic clouds includes retrieving the location of one or more spotting points within the linked data, selectively visiting neighboring nodes connected to the spotting point for each of the one or more spotting points. Thereby traversing a graph and generating the one or more recommended semantic clouds by clustering the spotting point and the selectively visited connected neighboring nodes for each of the one or more spotting points.
  • the one or more spotting points may be representative RDF nodes covering concepts related to the keyword.
  • the connected neighboring nodes may be selectively visited via user context and interlinked relationship terms.
  • the query may be a query to the linked data, the query may be generated based on a sparkle.
  • a query manager for generating a query based on a keyword and obtaining one or more Resource Description Framework (RDF) nodes associated with the query from linked data, the one or more A semantic cloud generator that generates one or more recommended semantic clouds based on RDF nodes and a semantic cloud corresponding to an annotation to be added among the one or more recommended semantic clouds are determined, and the content is based on the determined semantic cloud.
  • RDF Resource Description Framework
  • a semantic annotation device is provided that includes an annotation adder that performs semantic tagging of the content by adding the annotation.
  • providing a first content to a user receiving a keyword associated with the first content from the user, generating a query based on the keyword, Linked Data Obtaining one or more Resource Description Framework (RDF) nodes associated with the query from, generating one or more recommended semantic clouds based on the one or more RDF nodes, the one or more recommended semantics Determining a semantic cloud corresponding to the annotation to be added among the clouds and performing semantic tagging on the second content by adding the annotation to the second content based on the determined semantic cloud; Semantic Annotation Method It is provided.
  • RDF Resource Description Framework
  • a content providing unit for providing a first content to the user, a transceiver for receiving a keyword related to the first content from the user, generates a query based on the keyword, linked data (Linked A query manager that obtains one or more Resource Description Framework (RDF) nodes associated with the query from Data, a semantic cloud generator that generates one or more recommended semantic clouds based on the one or more RDF nodes; Add an annotation to perform semantic tagging on the second content by determining a semantic cloud corresponding to the annotation to be added among the one or more recommended semantic clouds and adding the annotation to the second content based on the determined semantic cloud Containing wealth, Smart devices are provided.
  • RDF Resource Description Framework
  • An apparatus and method are provided for providing semantic annotation for metadata generated by a user.
  • An apparatus and method are provided for solving the problem of semantic ambiguity of tags in plain text.
  • FIG. 1 illustrates a semantic annotation device according to one embodiment.
  • FIG. 2 illustrates a semantic annotation method according to one embodiment.
  • 3 illustrates semantic cloud generation from linked data according to an example.
  • FIG. 4 illustrates a method of finding spotting points in linked data according to an example.
  • FIG. 6 illustrates a result of generating a semantic cloud for the keyword 'apple' according to an example.
  • FIG. 7 illustrates a semantic annotation interface in a web-based IPTV environment according to an example.
  • linked data may refer to data or a service provided by linking open data (LOD).
  • LOD may be the World Wide Web Consortium (W3C) Semantic Web Education and Outreach (SWEO) Community Project.
  • W3C World Wide Web Consortium
  • SWEO Semantic Web Education and Outreach
  • a semantic-cloud-based annotation method which can easily add semantic annotations to web content.
  • the proposed method may provide semantic clouds to the user as a primary interface for semantic annotation. Users can select the most suitable concept among candidate semantic clouds.
  • One of the most important elements of the semantic-cloud based annotation method is the creation of efficient semantic clouds that enable the authoritative recognition of candidate concepts to be annotated without semantic ambiguity.
  • the semantic cloud generation method described below may first determine the location of essential points to begin retrieving relevant concepts within Linked Data to generate semantic clouds. . Next, the semantic cloud generation method can iteratively analyze potential merges of different semantic data. The user can easily resolve the semantic ambiguity and select the most appropriate semantic cloud from the set of candidates.
  • a method for creating a semantic cloud comprising: 1) selective querying of multiple datasets in linked data, and 2) providing a context sensitive traversal to such data to handle large amounts of linked data. It can be focused on reducing the complexity of. Also described below is the quality of the semantic clouds generated by the proposed method through the case of comparing the experimental results.
  • FIG. 1 illustrates a semantic annotation device according to one embodiment.
  • the semantic annotation device 100 may include a transceiver 110, a query manager 120, a semantic cloud generator 130, a semantic cloud searcher 140, and an annotation adder 150.
  • the query manager 120 may be an LOD query manager.
  • the semantic annotation device 100 may be a smart device.
  • the semantic annotation device 100 may further include a content providing unit 160.
  • a smart device may refer to a series of devices that provide interaction with a user in addition to playing content, such as a smart phone and a smart television.
  • FIG. 2 illustrates a semantic annotation method according to one embodiment.
  • semantic clouds can be generated from linked data. Semantic clouds can be used as the primary interface for semantic annotation.
  • the content provider 160 provides multimedia content to the user.
  • a user may input keywords related to the multimedia content while watching the multimedia content.
  • the transceiver 110 may receive a keyword input by a user.
  • the keyword may be text.
  • the query manager 120 may generate a query based on the keyword.
  • query manager 120 may obtain one or more RDF nodes associated with the query from the linked data based on the query.
  • the transceiver 110 may transmit the generated query as linked data.
  • the transceiver 110 may receive RDF and XML data from the linked data.
  • the query manager 120 may generate RDF nodes based on the RDF and XML data.
  • the semantic cloud generator 130 may generate one or more recommended semantic clouds based on one or more RDF nodes.
  • a semantic cloud of one of the one or more recommended semantic clouds may be determined by the user.
  • the user can determine the semantic cloud corresponding to the annotation to be added among the one or more clouds by selecting the optimal term.
  • the semantic cloud searcher 140 may search for and determine an optimal semantic cloud corresponding to an annotation to be added among one or more recommended semantic clouds based on a user's manipulation, for example, left and right slides or a semantic cloud regeneration request.
  • the left and right slides enable horizontal navigation of the multiple semantic clouds created in step 240 in addition to the semantic clouds currently shown on the screen and the regeneration request creates a more detailed semantic cloud for that semantic cloud. Is requested in step 240 to enable vertical search for each semantic cloud.
  • the annotation adding unit 150 may perform semantic tagging on the multimedia content or the web content by selecting and adding an optimal term to the multimedia content or the web content based on the determined semantic cloud. have.
  • the first issue concerns access to large amounts of semantic web data and processing of the large amounts of semantic web data.
  • the second issue relates to the creation of related semantic clouds.
  • a third issue relates to the provision of an efficient user interface that enables intuitive interactions.
  • the first requirement is that the number of clouds is small.
  • the number of semantic clouds recommended at one time may be limited to a maximum of four.
  • the second requirement is the balance of content within the semantic cloud.
  • semantically related terms are preferably included within the same semantic cloud.
  • the third requirement is that there is no ambiguity between the clouds. For example, it is desirable that the semantic ambiguity between generated semantic clouds be minimized.
  • 3 illustrates semantic cloud generation from linked data according to an example.
  • the linked data includes more than 31 billion RDF triples from 295 different datasets that are domain-independent.
  • the linked data can be a large, heterogeneous semantic web data store.
  • the semantic cloud generation method can be incremental and repeated.
  • Step 240 described above may include steps 310 to 330.
  • the semantic cloud generator 130 may search for locations of one or more spotting points for clustering within the linked data.
  • One or more spotting points may be representative RDF nodes that cover concepts related to the keyword. That is, the semantic cloud generator 130 may search for representative RDF nodes covering concepts related to the input keyword.
  • the semantic cloud generator 130 After retrieving the location of the spotting points, in step 320, the semantic cloud generator 130 selectively visits neighboring nodes connected to the spotting point for each of the one or more spotting points, thereby Can be traversed.
  • the semantic cloud generator 130 may selectively visit neighboring nodes connected through user context and interlinked relation terms.
  • Selective visits to neighboring nodes can reduce the complexity of handling large amounts of linked data.
  • selectively visiting neighboring nodes is the quality of the semantic coherence of the semantic coherence generated by filtering out less relevant relationships and corresponding nodes. ) Can be guaranteed.
  • the number of concepts that overlap the spotting pointing and landing nodes may be the basis for measuring the semantic similarity between the spotting pointing and landing nodes. Additionally, determining the maximum number of hops to traverse and the threshold value for semantic similarity can be discussed.
  • the semantic cloud generator 130 may generate the one or more recommended semantic clouds by clustering the spotting point and the selectively visited connected neighboring nodes for each of one or more spotting points. .
  • FIG. 4 illustrates a method of finding spotting points in linked data according to an example.
  • Retrieving 310 the location of one or more spotting points in the linked data may be the most important step in creating high quality semantic clouds that can meet the requirements described above. This is because in generating high quality semantic clouds, it may be more efficient to traverse and retrieve RDF nodes associated with each of the RDF nodes starting from more important and densely connected RDF nodes.
  • Locating the spotting points can be viewed as starting from querying the linked data 230 to obtain relevant RDF nodes.
  • step 220 there are two ways for the query manager 120 to create a query with the linked data.
  • the first approach is query generation via Sparkle, and the second approach is Semantic Web, such as the Semantic Web Search Engine (SWSE), Falcons, and Syndic. ) Query generation through search engines.
  • Sparkle is one of the query languages for RDF.
  • Semantic web search engines can rank RDF nodes with their own algorithms. As a result of the ranking above, RDF nodes retrieved by the second scheme can be biased without covering all datasets.
  • the query manager 120 may generate a query to the linked data based on the SPARQL, according to the first approach.
  • query manager 120 may issue SPARQL queries for the dataset selected for performance.
  • ckan.net is a web site that collects and maintains metadata of datasets such as the number of triples, the number of in-links, the number of out-links, topics, SPARQL endpoints and license information.
  • the transceiver 110 may receive metadata of each data set.
  • the query manager 120 may construct a graph having data sets of linked data by using the metadata.
  • the semantic cloud generation unit 130 may analyze the graph with respect to the degree (or hub) and thebetweenness. The above analysis can explain how many different datasets are connected to the dataset and how often the dataset appears on the shortest paths between the datasets.
  • the semantic cloud generator 130 should be able to efficiently traverse related RDF nodes including all existing semantics through the spotting points. Accordingly, the semantic cloud generator 130 may return improved results by selecting spotting points with different topics, as well as order and interimportance, from the datasets.
  • the query manager 120 may determine the ranking of each dataset by considering the topic, order, and importance of each dataset. More important datasets may be determined by ranking of the dataset. The query manager 120 may selectively query more important data sets based on the ranking of each data set.
  • RDF nodes For example, if a query for the keyword 'apple' is generated and passed to multiple of the datasets from the linked data (410), more than 140,000 related RDF nodes may be returned (420).
  • the returned RDF nodes can be bundled into concepts with one independent meaning. For example, dbpedia.org/resource/Apple and rdf.freebase.com/ns/m/0k8z are the same concept as 'Apple Inc.' RDF nodes that represent. To do this, you can use links that represent relationships between RDF nodes that have the same meaning, such as owl: sameAs or skos: exactMatch.
  • the semantic cloud generator 130 may select the most common concepts of RDF nodes as spotting points by comparing relative concept hierarchies of RDF nodes. This choice ensures the semantic unambiguity between the spotting points above. Thus, this choice may support the requirement that there should be no ambiguity between the generated semantic clouds.
  • SKOS3 Simple Knowledge Organization System 3
  • SKOS3 provides useful relationship terms such as skos: broader and skos: narrower. Relationship terms may be exploited to retrieve relative concept layers for comparing RDF nodes and to select the most common RDF node as a spotting point.
  • the semantic cloud generation unit 130 parses the concept graph of the RDF nodes by parsing identical semantic links such as owl: sameAs or skos: exactMatch and semantic layer links such as skos: broader and skos: narrower links. It may generate and recognize 430 the most common and important concepts of the above RDF nodes. In the case illustrated in FIG. 4, the most common concept is 'Apple Inc.' and 'Apple Inc.' was selected as the spotting point.
  • step 320 is further described.
  • the semantic cloud generator 130 may select relations that link related RDF nodes. Since all the RDF nodes in the linked data are connected as a large graph structure, the semantic cloud generator 130 can retrieve important and related RDF nodes by traversing the graph from spotting points. In the case of Apple Inc., if the semantic node's labels contain 'iPod', 'iPhone', 'MacBook' or 'Steve Jobs', the semantic node above is important even if it does not contain the keyword 'apple' Can be considered a semantic node.
  • the semantic cloud generator 130 may reduce the complexity of the semantic cloud generation by setting the traversal boundaries.
  • the semantic cloud generation unit 130 may reduce the computational complexity for traversing the large RDF graph by considering only related relationships.
  • semantic cloud generator 130 may automatically associate relationship terms with user contexts, such as interests and preferences.
  • user contexts such as interests and preferences.
  • the interests of the user may be interlinked with the relationship terms, and the interests of the user may already be present for each user before the semantic cloud is created. For example, in a case where the user interest is 'movie', relationship terms such as 'actor', 'director', 'rating', 'background music' and 'story' will be the relations to be traversed. Can be.
  • the W3C requires linked data publishers, such as Friend Of A Friend 4 (FOAF4), Dublin Core 5, to ensure interoperability between linked data datasets. 5) It is recommended to use well-defined, popular terms such as DC5) and Semantically-Interlinked Online Communities 6 (SIOC6) and SKOS.
  • the semantic cloud generator 130 may first traverse the relationships and may take into account the relationships selected by the user in consideration of contexts. This traversal and reference facilitates visiting related nodes while reducing the complexity for clustering these nodes.
  • step 330 is further described.
  • the semantic cloud generator 130 may measure semantic similarity between RDF nodes to determine whether to include visited PDF nodes in the same cloud in the semantic cloud.
  • the semantic cloud generator 130 calculates the number of query responses from the semantic web search engine to measure the similarity between nodes. Can be used.
  • l 1 and l 2 are labels of RDF nodes.
  • n ( l ) represents the number of query responses for RDF node l .
  • h represents the number of hops to traverse.
  • w is a weight.
  • TermFreq ( l 1 , l 2 ) may indicate the term frequency between l 1 and l 2 .
  • SemSim ( l 1 , l 2 ) representing the semantic similarity between two RDF nodes l 1 and l 2 may be proportional to the inverse of w h .
  • the semantic cloud generator 130 may determine a weight w and a threshold h for clustering to include semantically related concepts towards keywords.
  • the first four graphs 510, 520, 530 and 540 show that for each experimental term, the sets of datasets generated based on domain and intercriticality show high coverage rates, respectively. , Triple and type respectively. In the triple coverage of the keyword 'tiger', the domain and interimportance are much higher than in other cases. This is because the domain and inter importance include a dataset with multiple RDF nodes for the above keywords.
  • the final graph 550 is the parsing of the same semantic links (eg owl: sameAs, skos: exactMatch) and semantic layer links (eg skos: broader, skos: narrower, rdf: subClassOf) used to find the spotting points. It shows the percentage of RDF nodes that are reduced.
  • the tag terms used in the experiment were selected from some of the terms used for tagging on the Internet, and the maximum decrease rate was 75.44% (term 'Nature'), and the average was 19.05%. The higher the reduction rate, the higher the probability that RDF nodes that are not duplicated and have a significant meaning for the term are selected as spotting points.
  • FIG. 6 illustrates a result of generating a semantic cloud for the keyword 'apple' according to an example.
  • FIG. 6 the results 610, 620, and 630 of generating the semantic cloud by rdf: type, SKOS parsing, and the proposed method (see FIGS. 1-4), respectively, are shown.
  • the first method is to cluster RDF nodes according to the rdf; type of RDF nodes.
  • the first method may not guarantee high quality semantic cloud generation.
  • 'Apple Inc' with rdf: type 'company' has been separated from groups such as 'Apple I' and 'Apple II GS' with rdf: type 'Personal Computer'. It is clear that there is a semantic relationship between Apple Inc, Apple I and Apple II GS.
  • the second method is to use SKOS relationships.
  • the second method is useful for understanding the relative concept layer between RDF nodes.
  • the clouds generated by the second method only contain RDF nodes that contain only the keyword 'apple', the result obtained by the second method failed to meet the balance of content in each cloud.
  • some of the generated clouds have only a single node.
  • Semantic clouds generated by the third method provide better results than semantic clouds generated by other methods.
  • the semantic clouds generated by the third method also include related RDF nodes such as 'ITunes' and 'Macintosh' via relationship traversal. Related RDF nodes do not contain the keyword 'apple'.
  • FIG. 7 illustrates a semantic annotation interface in a web-based IPTV environment according to an example.
  • the user can add annotations to the multimedia content by selecting semantic options from semantic clouds generated from the linked data.
  • Annotation results can be used to provide semantic search.
  • Semantic search can improve search results for multimedia content.
  • annotation timing 710 to which annotations are added keyword 720 used to generate semantic clouds, generated semantic cloud 730, selected linked data 740, cloud generation through search 750, cloud generation through input 760, start button 770, and the like are shown as examples of interfaces.
  • Method according to an embodiment is implemented in the form of program instructions that can be executed by various computer means may be recorded on a computer readable medium.
  • the computer readable medium may include program instructions, data files, data structures, etc. alone or in combination.
  • Program instructions recorded on the media may be those specially designed and constructed for the purposes of the embodiments, or they may be of the kind well-known and available to those having skill in the computer software arts.
  • Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks, such as floppy disks.
  • Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like.
  • the hardware device described above may be configured to operate as one or more software modules to perform the operations of the embodiments, and vice versa.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

A semantic cloud-based semantic annotation method and apparatus are provided. The semantic annotation apparatus generates one or more RDF nodes on the basis of linked data. The semantic annotation apparatus generates one or more recommended semantic clouds on the basis of the RDF nodes. One semantic cloud is selected from among the semantic clouds recommended by a user. An annotation is added to content on the basis of the selected semantic cloud, according to the semantic cloud that has been selected by the user.

Description

시맨틱 클라우드에 기반한 시맨틱 어노테이션 방법 및 장치Method and apparatus for semantic annotation based on semantic cloud
본 발명은 시맨틱 어노테이션 방법 및 장치에 관한 것이다.The present invention relates to a semantic annotation method and apparatus.
링크드 데이터로부터 생성된 시맨틱 클라우드를 기반하여 콘텐츠에 대한 시맨틱 어노테이션을 수행하는 방법 및 장치가 개시된다. A method and apparatus for performing semantic annotation on content based on a semantic cloud generated from linked data is disclosed.
사용자들이 웹 환경의 콘텐츠 생성 및 보급(dissemination)의 중심에 서게 되면서, 사용자들은 메타데이터 생성에 있어서 더 중요한 역할을 수행한다.As users become at the center of content creation and dissemination in the web environment, users play a more important role in metadata generation.
메타데이터(metadata)를 웹 콘텐츠에 부가하는 많은 방식들이 존재한다. 이러한 방식 중 가장 대중적인 것으로 어노테이션(annotation)을 들 수 있다. 어노테이션은 사용자들이 자신의 생각에 따라 태그(tag)를 웹 콘텐츠에 부가하는 방식이다. 여기서, 태그는 사용자에 의해 생성된 메타데이터(metadata)이다.There are many ways to add metadata to web content. The most popular of these methods is annotation. Annotation is a way for users to add tags to web content according to their ideas. Here, the tag is metadata generated by the user.
태그들은 콘텐츠 검색 결과를 향상시킬 수 있기 때문에, 많은 웹 사이트들은 사용자들에게 태그들을 부가할 것을 독려한다. 그러나, 태그들은 단지 플레인 텍스트(plain text)로 간주되기 때문에, 콘텐츠 검색을 향상시키려는 시도들은 단지 제한된 결과들 만을 낳는다.Because tags can improve content search results, many Web sites encourage users to add tags. However, since tags are only considered plain text, attempts to improve content search yield only limited results.
특히, 태그를 웹 콘텐츠에 부가하는 접근 방식은 태그들의 시맨틱 모호성(semantic ambiguity)의 문제에 봉착한다. 예컨대, "Apple"이 과일 "Apple" 및 회사 "Apple" 중 어떤 것을 의미하는지 불분명하다.In particular, the approach of adding tags to web content encounters the problem of semantic ambiguity of tags. For example, it is unclear whether "Apple" means fruit "Apple" or company "Apple".
시맨틱 어노테이션은 예컨대 회사 "Apple" 및 과일 "Apple"과 같은 검색에서의 어노말리(anomaly)들을 해결(resolve)하기 위해 온톨로지(ontology)를 활용(exploit)한다. 따라서, 시맨틱(semantic) 웹 연구 단체에서는 상기의 제한들을 극복하기 위한 수단으로서 콘텐츠들의 시맨틱 어노테이션을 활용해 왔다.Semantic annotations exploit ontology to resolve anomalies in searches such as the company "Apple" and fruit "Apple". Thus, semantic web research organizations have used semantic annotations of content as a means to overcome the above limitations.
그러나, 웹 콘텐츠의 시맨틱 어노테이션에 대한 이전의 노력들(efforts)은 확장성(scalability) 및 사용성(usability)의 요구사항(requirement)들을 충족(fulfill)시키는 것을 실패하였다. 대부분의 기존의 시맨틱 어노테이션 툴(tool)들은 도메인(domain) 전문가(expert)들에 의해 생성된 온톨로지 내의 용어(term)들을 사용한다. 그러나, 이러한 온톨로지들은 다종(various kinds)의 시맨틱들을 커버(cover)하기 위한 충분한 옵션(option)들을 제공하지 않는다. 즉, 단지 도메인에 특정한(domain specific) 용어들 만이 가용하다. 또한, 도메인에 특정한 용어들이 반드시 새롭게 생성된 지식(knowledge)를 최신의(up-to-date) 방식으로 반영하는 것은 아니다. 온톨로지로부터 최적의 시맨틱 용어(term)를 찾는 것은 사용자 및 어노테이션 툴 간의 수 회의 상호작용(interaction)을 요구한다.However, previous efforts to semantic annotation of web content have failed to satisfy the requirements of scalability and usability. Most existing semantic annotation tools use terms in the ontology generated by domain experts. However, these ontologies do not provide enough options to cover various kinds of semantics. In other words, only domain specific terms are available. In addition, domain-specific terms do not necessarily reflect newly generated knowledge in an up-to-date manner. Finding the optimal semantic term from the ontology requires several interactions between the user and the annotation tool.
즉, 종래의 시맨틱 어노테이션 방법의 주요한 결점(drawback)은 종래의 시맨틱 어노테이션 방법은 사용자가 주어진 키워드에 시맨틱 의미(semantic meaning)를 연관시키는 동안 시맨틱 모호성들을 쉽게 해결할 수 있도록 충분히 직관적이지 않다는 것이다.That is, a major drawback of the conventional semantic annotation method is that the conventional semantic annotation method is not intuitive enough to easily resolve semantic ambiguities while the user associates semantic meaning to a given keyword.
한국공개특허 제10-2009-0078986호(공개일 2011년 05월 18일)에는 문서의 의미 정보를 온톨로지로 구조화시킨 의미정보 지식베이스를 이용하여 문서에 어노테이션을 하는 시맨틱 어노테이션 장치 및 방법을 개시한다.Korean Laid-Open Patent Publication No. 10-2009-0078986 (published May 18, 2011) discloses a semantic annotation apparatus and method for annotating a document using a semantic information knowledge base structured with ontology's semantic information. .
일 실시예는 사용자에 의해 생성된 메타데이터를 위한 시맨틱 어노테이션을 제공하는 장치 및 방법을 제공할 수 있다.One embodiment may provide an apparatus and method for providing semantic annotation for metadata generated by a user.
일 실시예는 플레인 텍스트의 태그들의 시맨틱 모호성의 문제를 해결하는 장치 및 방법을 제공할 수 있다.One embodiment may provide an apparatus and method for solving the problem of semantic ambiguity of tags in plain text.
일 측에 있어서, 키워드에 기반하여 쿼리를 생성하는 단계, 링크된 데이터(Linked Data)로부터 상기 쿼리와 관련된 하나 이상의 리소스 디스크립션 프레임워크(Resource Description Framework; RDF) 노드들을 획득하는 단계, 상기 하나 이상의 RDF 노드들에 기반하여 하나 이상의 추천된 시맨틱 클라우드들을 생성하는 단계, 상기 하나 이상의 추천된 시맨틱 클라우드들 중 추가될 어노테이션에 대응하는 시맨틱 클라우드를 결정하는 단계 및 상기 결정된 시맨틱 클라우드에 기반하여 콘텐츠에 상기 어노테이션을 추가함으로써 상기 콘텐츠에 대한 시맨틱 태깅을 수행하는 단계를 포함한다.In one aspect, generating a query based on a keyword, obtaining one or more Resource Description Framework (RDF) nodes associated with the query from linked data, the one or more RDF Generating one or more recommended semantic clouds based on nodes, determining a semantic cloud corresponding to an annotation to be added among the one or more recommended semantic clouds, and annotating the content based on the determined semantic cloud. Adding to perform semantic tagging of the content.
상기 하나 이상의 추천된 시맨틱 클라우드들 중 상기 추가될 어노테이션에 대응하는 시맨틱 클라우드는 최적의 용어가 사용자에 의해 선택됨으로써 결정될 수 있다.The semantic cloud corresponding to the annotation to be added among the one or more recommended semantic clouds may be determined by selecting an optimal term by the user.
상기 하나 이상의 추천된 시맨틱 클라우드들을 생성하는 단계는, 상기 링크된 데이터 내에서 하나 이상의 스포팅 포인트들의 위치를 검색하는 단계, 상기 하나 이상의 스포팅 포인트들 각각에 대해 스포팅 포인트에 연결된 이웃하는 노드들을 선택적으로 방문함으로써 그래프를 순회하는 단계 및 상기 하나 이상의 스포팅 포인트들 각각에 대해 상기 스포팅 포인트 및 상기 선택적으로 방문된 연결된 이웃하는 노드들을 클러스터링함으로써 상기 하나 이상의 추천된 시맨틱 클라우드들을 생성하는 단계를 포함할 수 있다.Generating the one or more recommended semantic clouds includes retrieving the location of one or more spotting points within the linked data, selectively visiting neighboring nodes connected to the spotting point for each of the one or more spotting points. Thereby traversing a graph and generating the one or more recommended semantic clouds by clustering the spotting point and the selectively visited connected neighboring nodes for each of the one or more spotting points.
상기 하나 이상의 스포팅 포인트들은 상기 키워드에 관련된 컨셉들을 커버하는 대표 RDF 노드들일 수 있다.The one or more spotting points may be representative RDF nodes covering concepts related to the keyword.
상기 연결된 이웃하는 노드들은 사용자 컨텍스트 및 인터링크된 관계 용어들을 통해 선택적으로 방문될 수 있다.The connected neighboring nodes may be selectively visited via user context and interlinked relationship terms.
상기 쿼리는 상기 링크된 데이터로의 쿼리일 수 있다, 상기 쿼리는 스파클에 기반하여 생성될 수 있다.The query may be a query to the linked data, the query may be generated based on a sparkle.
다른 일 측에 따르면, 키워드에 기반하여 쿼리를 생성하고, 링크된 데이터(Linked Data)로부터 상기 쿼리와 관련된 하나 이상의 리소스 디스크립션 프레임워크(Resource Description Framework; RDF) 노드들을 획득하는 쿼리 매니저, 상기 하나 이상의 RDF 노드들에 기반하여 하나 이상의 추천된 시맨틱 클라우드들을 생성하는 시맨틱 클라우드 생성부 및 상기 하나 이상의 추천된 시맨틱 클라우드들 중 추가될 어노테이션에 대응하는 시맨틱 클라우드를 결정하고, 상기 결정된 시맨틱 클라우드에 기반하여 콘텐츠에 상기 어노테이션을 추가함으로써 상기 콘텐츠에 대한 시맨틱 태깅을 수행하는 어노테이션 추가부를 포함하는, 시맨틱 어노테이션 장치가 제공된다.According to another aspect, a query manager for generating a query based on a keyword and obtaining one or more Resource Description Framework (RDF) nodes associated with the query from linked data, the one or more A semantic cloud generator that generates one or more recommended semantic clouds based on RDF nodes and a semantic cloud corresponding to an annotation to be added among the one or more recommended semantic clouds are determined, and the content is based on the determined semantic cloud. A semantic annotation device is provided that includes an annotation adder that performs semantic tagging of the content by adding the annotation.
또 다른 일 측에 따르면, 사용자에게 제1 콘텐츠를 제공하는 단계, 상기 사용자로부터 상기 제1 콘텐츠와 관련된 키워드를 수신하는 단계, 상기 키워드에 기반하여 쿼리를 생성하는 단계, 링크된 데이터(Linked Data)로부터 상기 쿼리와 관련된 하나 이상의 리소스 디스크립션 프레임워크(Resource Description Framework; RDF) 노드들을 획득하는 단계, 상기 하나 이상의 RDF 노드들에 기반하여 하나 이상의 추천된 시맨틱 클라우드들을 생성하는 단계, 상기 하나 이상의 추천된 시맨틱 클라우드들 중 추가될 어노테이션에 대응하는 시맨틱 클라우드를 결정하는 단계 및 상기 결정된 시맨틱 클라우드에 기반하여 제2 콘텐츠에 상기 어노테이션을 추가함으로써 상기 제2 콘텐츠에 대한 시맨틱 태깅을 수행하는 단계를 포함하는, 스마트 디바이스의 시맨틱 어노테이션 방법이 제공된다.According to another aspect, providing a first content to a user, receiving a keyword associated with the first content from the user, generating a query based on the keyword, Linked Data Obtaining one or more Resource Description Framework (RDF) nodes associated with the query from, generating one or more recommended semantic clouds based on the one or more RDF nodes, the one or more recommended semantics Determining a semantic cloud corresponding to the annotation to be added among the clouds and performing semantic tagging on the second content by adding the annotation to the second content based on the determined semantic cloud; Semantic Annotation Method It is provided.
또 다른 일 측에 따르면, 사용자에게 제1 콘텐츠를 제공하는 콘텐츠 제공부, 상기 사용자로부터 상기 제1 콘텐츠와 관련된 키워드를 수신하는 송수신부, 상기 키워드에 기반하여 쿼리를 생성하고, 링크된 데이터(Linked Data)로부터 상기 쿼리와 관련된 하나 이상의 리소스 디스크립션 프레임워크(Resource Description Framework; RDF) 노드들을 획득하는 쿼리 매니저, 상기 하나 이상의 RDF 노드들에 기반하여 하나 이상의 추천된 시맨틱 클라우드들을 생성하는 시맨틱 클라우드 생성부 및 상기 하나 이상의 추천된 시맨틱 클라우드들 중 추가될 어노테이션에 대응하는 시맨틱 클라우드를 결정하고, 상기 결정된 시맨틱 클라우드에 기반하여 제2 콘텐츠에 상기 어노테이션을 추가함으로써 상기 제2 콘텐츠에 대한 시맨틱 태깅을 수행하는 어노테이션 추가부를 포함하는, 스마트 디바이스가 제공된다.According to another aspect, a content providing unit for providing a first content to the user, a transceiver for receiving a keyword related to the first content from the user, generates a query based on the keyword, linked data (Linked A query manager that obtains one or more Resource Description Framework (RDF) nodes associated with the query from Data, a semantic cloud generator that generates one or more recommended semantic clouds based on the one or more RDF nodes; Add an annotation to perform semantic tagging on the second content by determining a semantic cloud corresponding to the annotation to be added among the one or more recommended semantic clouds and adding the annotation to the second content based on the determined semantic cloud Containing wealth, Smart devices are provided.
사용자에 의해 생성된 메타데이터를 위한 시맨틱 어노테이션을 제공하는 장치 및 방법이 제공된다.An apparatus and method are provided for providing semantic annotation for metadata generated by a user.
플레인 텍스트의 태그들의 시맨틱 모호성의 문제를 해결하는 장치 및 방법이 제공된다.An apparatus and method are provided for solving the problem of semantic ambiguity of tags in plain text.
도 1은 일 실시예에 따른 시맨틱 어노테이션 장치를 설명한다.1 illustrates a semantic annotation device according to one embodiment.
도 2는 일 실시예에 따른 시맨틱 어노테이션 방법을 설명한다.2 illustrates a semantic annotation method according to one embodiment.
도 3은 일 예에 따른 링크된 데이터로부터의 시맨틱 클라우드 생성을 설명한다.3 illustrates semantic cloud generation from linked data according to an example.
도 4는 일 예에 따른 링크된 데이터 내에서 스포팅 포인트들을 찾는 방법을 설명한다.4 illustrates a method of finding spotting points in linked data according to an example.
도 5는 일 예에 따른 각 선택된 데이터셋들의 집합에 대한 실혐 결과들을 도시한다.5 shows demonstration results for each set of selected datasets according to an example.
도 6은 일 예에 따른 키워드 'apple'에 대한 시맨틱 클라우드 생성의 결과를 도시한다.6 illustrates a result of generating a semantic cloud for the keyword 'apple' according to an example.
도 7은 일 예에 따른 웹-기반 IPTV 환경에서의 시맨틱 어노테이션 인터페이스를 설명한다.7 illustrates a semantic annotation interface in a web-based IPTV environment according to an example.
이하에서, 실시예들을, 첨부된 도면을 참조하여 상세하게 설명한다. 그러나, 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.Hereinafter, embodiments will be described in detail with reference to the accompanying drawings. However, the present invention is not limited or limited by the embodiments. Like reference numerals in the drawings denote like elements.
이하에서, 링크된 데이터(Linked Data)는 링킹 오픈 데이터(Linking Open Data; LOD)에 의해 제공되는 데이터 또는 서비스를 의미할 수 있다. LOD는 월드 와이드 웹 컨소시움(World Wide Web Consortium; W3C) 시맨틱 웹 교육 및 봉사(Semantic Web Education and Outreach; SWEO) 커뮤니티(Community) 프로젝트(Project)일 수 있다.In the following description, linked data may refer to data or a service provided by linking open data (LOD). The LOD may be the World Wide Web Consortium (W3C) Semantic Web Education and Outreach (SWEO) Community Project.
이하에서, 웹 콘텐츠에 시맨틱 어노테이션들을 용이하게 추가할 수 있는 시맨틱-클라우드(cloud)-기반의 어노테이션 방법이 제안된다. 제안된 방법은 시맨틱 어노테이션을 위한 주요한(primary) 인터페이스(interface)로서 시맨틱 클라우드들을 사용자에게 제공할 수 있다. 사용자들은 후보 시맨틱 클라우드들 중 가장 적합한 컨셉을 선택할 수 있다. 시맨틱-클라우드 기반 어노테이션 방법의 가장 주요한 요소 중 하나는 시맨틱 모호성 없이 어노테이트될 후보 컨셉들을 직권적으로 인식할 수 있게 하는 효율적인 시맨틱 클라우드들을 생성하는 것이다.In the following, a semantic-cloud-based annotation method is proposed which can easily add semantic annotations to web content. The proposed method may provide semantic clouds to the user as a primary interface for semantic annotation. Users can select the most suitable concept among candidate semantic clouds. One of the most important elements of the semantic-cloud based annotation method is the creation of efficient semantic clouds that enable the authoritative recognition of candidate concepts to be annotated without semantic ambiguity.
후술될 시맨틱 클라우드 생성 방법은 시맨틱 클라우드들을 생성하기 위해 우선 링크된 데이터(Linked Data) 내에서 관련된 컨셉(relevant concept)들을 검색하는 것을 시작하기 위한 본질적인(essential) 포인트(point)들의 위치를 결정할 수 있다. 다음으로, 시맨틱 클라우드 생성 방법은 상이한 시맨틱 데이터의 잠재적인(potential) 병합(merge)을 되풀이하여(iteratively) 분석할 수 있다. 사용자는 손쉽게 시맨틱 모호성을 해결할 수 있고, 후보(candidate)들의 집합으로부터 가장 적합한 시맨틱 클라우드를 선택할 수 있다.The semantic cloud generation method described below may first determine the location of essential points to begin retrieving relevant concepts within Linked Data to generate semantic clouds. . Next, the semantic cloud generation method can iteratively analyze potential merges of different semantic data. The user can easily resolve the semantic ambiguity and select the most appropriate semantic cloud from the set of candidates.
시맨틱 클라우드 생성 방법에 있어서, 1) 링크된 데이터 내의 다중의 데이터셋들에 대한 선택적인 쿼리 및 2) 이러한 데이터에 대한 컨텍스트에 민감한(sensitive) 순회를 제공함으로써 링크된 데이터의 많은 양을 다룸에 있어서의 복잡도를 감소시키는 것에 초점이 맞추어질 수 있다. 또한, 하기에서 실험적인 결과들을 비교하는 케이스를 통해 제안된 방법에 의해 생성된 시맨틱 클라우드들의 품질이 설명된다.A method for creating a semantic cloud, comprising: 1) selective querying of multiple datasets in linked data, and 2) providing a context sensitive traversal to such data to handle large amounts of linked data. It can be focused on reducing the complexity of. Also described below is the quality of the semantic clouds generated by the proposed method through the case of comparing the experimental results.
도 1은 일 실시예에 따른 시맨틱 어노테이션 장치를 설명한다.1 illustrates a semantic annotation device according to one embodiment.
시맨틱 어노테이션 장치(100)는 송수신부(110), 쿼리 매니저(120), 시맨틱 클라우드 생성부(130), 시맨틱 클라우드 탐색부(140) 및 어노테이션 추가부(150)를 포함할 수 있다.The semantic annotation device 100 may include a transceiver 110, a query manager 120, a semantic cloud generator 130, a semantic cloud searcher 140, and an annotation adder 150.
쿼리 매니저(120)는 LOD 쿼리 매니저일 수 있다.The query manager 120 may be an LOD query manager.
시맨틱 어노테이션 장치(100)는 스마트 디바이스일 수 있다. 시맨틱 어노테이션 장치(100)가 스마트 디바이스일 경우, 시맨틱 어노테이션 장치(100)는 콘텐츠 제공부(160)를 더 포함할 수 있다. 여기서, 스마트 디바이스는, 스마트 폰 및 스마트 텔레비전(television)과 같은, 콘텐츠를 재생하는 것 외에도 사용자와의 상호작용을 제공하는 일련의 장치들을 의미할 수 있다.The semantic annotation device 100 may be a smart device. When the semantic annotation device 100 is a smart device, the semantic annotation device 100 may further include a content providing unit 160. Here, a smart device may refer to a series of devices that provide interaction with a user in addition to playing content, such as a smart phone and a smart television.
도 2는 일 실시예에 따른 시맨틱 어노테이션 방법을 설명한다.2 illustrates a semantic annotation method according to one embodiment.
도 1에서, 시맨틱 클라우드들은 링크된 데이터로부터 생성될 수 있다. 시맨틱 클라우드들은 시맨틱 어노테이션을 위한 주요한 인터페이스로서 사용될 수 있다.In FIG. 1, semantic clouds can be generated from linked data. Semantic clouds can be used as the primary interface for semantic annotation.
단계(200)에서, 콘텐츠 제공부(160)는 사용자에게 멀티미디어 콘텐츠를 제공한다.In operation 200, the content provider 160 provides multimedia content to the user.
단계(210)에서, 사용자는 멀티미디어 콘텐츠를 시청(watching)하면서 멀티미디어 콘텐츠와 관련된 키워드를 입력할 수 있다. 송수신부(110)는 사용자에 의해 입력된 키워드를 수신할 수 있다. 여기서, 키워드는 텍스트(text)일 수 있다.In operation 210, a user may input keywords related to the multimedia content while watching the multimedia content. The transceiver 110 may receive a keyword input by a user. Here, the keyword may be text.
단계(220)에서, 쿼리 매니저(120)는 키워드에 기반하여 쿼리를 생성할 수 있다.In operation 220, the query manager 120 may generate a query based on the keyword.
단계(230)에서, 쿼리 매니저(120)는 쿼리에 기반하여 링크된 데이터로부터 쿼리와 관련된 하나 이상의 RDF 노드(node)들을 획득할 수 있다.In step 230, query manager 120 may obtain one or more RDF nodes associated with the query from the linked data based on the query.
예컨대, 송수신부(110)는 생성된 쿼리를 링크된 데이터로 전송할 수 있다. 송수신부(110)는 링크된 데이터로부터 RDF 및 XML 데이터를 수신할 수 있다. 쿼리 매니저(120)는 RDF 및 XML 데이터에 기반하여 RDF 노드들을 생성할 수 있다.For example, the transceiver 110 may transmit the generated query as linked data. The transceiver 110 may receive RDF and XML data from the linked data. The query manager 120 may generate RDF nodes based on the RDF and XML data.
단계(240)에서, 시맨틱 클라우드 생성부(130)는 하나 이상의 RDF 노드들에 기반하여 하나 이상의 추천된(recommended) 시맨틱 클라우드들을 생성할 수 있다.In operation 240, the semantic cloud generator 130 may generate one or more recommended semantic clouds based on one or more RDF nodes.
단계(250)에서, 하나 이상의 추천된 시맨틱 클라우드들 중 하나의 시맨틱 클라우드가 사용자에 의해 결정될 수 있다. 사용자는 최적의 용어를 선택함으로써 하나 이상의 클라우드들 중 추가될 어노테이션에 대응하는 시맨틱 클라우드를 결정할 수 있다. 시맨틱 클라우드 탐색부(140)는 사용자의 조작, 예컨대 좌우 슬라이드나 시맨틱 클라우드 재생성 요청에 기반하여 하나 이상의 추천된 시맨틱 클라우드들 중 추가될 어노테이션에 대응하는 최적의 시맨틱 클라우드를 탐색하고 결정할 수 있다. 좌우 슬라이드는 단계(240)에서 만들어진 다수의 시맨틱 클라우드들 중 현재 화면에 보이는 시맨틱 클라우드 이외에 것들에 대한 수평적(horizontal) 탐색을 가능하게 하고 재생성 요청은 해당 시맨틱 클라우드에 대해 더 세부적인 시맨틱 클라우드의 생성을 단계(240)에 요청함으로써 각각의 시맨틱 클라우드에 대한 수직적(vertical) 탐색을 가능하게 한다.At 250, a semantic cloud of one of the one or more recommended semantic clouds may be determined by the user. The user can determine the semantic cloud corresponding to the annotation to be added among the one or more clouds by selecting the optimal term. The semantic cloud searcher 140 may search for and determine an optimal semantic cloud corresponding to an annotation to be added among one or more recommended semantic clouds based on a user's manipulation, for example, left and right slides or a semantic cloud regeneration request. The left and right slides enable horizontal navigation of the multiple semantic clouds created in step 240 in addition to the semantic clouds currently shown on the screen and the regeneration request creates a more detailed semantic cloud for that semantic cloud. Is requested in step 240 to enable vertical search for each semantic cloud.
단계(260)에서, 어노테이션 추가부(150)는 결정된 시맨틱 클라우드에 기반하여 멀티미디어 콘텐츠 또는 웹 콘텐츠에 최적의 용어가 선택되고 추가됨으로써 상기 멀티미디어 콘텐츠 또는 웹 콘텐츠에 대한 시맨틱 태깅(tagging)을 수행할 수 있다.In operation 260, the annotation adding unit 150 may perform semantic tagging on the multimedia content or the web content by selecting and adding an optimal term to the multimedia content or the web content based on the determined semantic cloud. have.
상술된 시맨틱 어노테이션 방법에서, 3 개의 해결되어야 할 기술적인(technical) 이슈(issue)들이 지적될 수 있다.In the semantic annotation method described above, three technical issues to be addressed can be pointed out.
제1 이슈는, 대규모의 시맨틱 웹 데이터에 대한 접근 및 상기의 대규모의 시맨틱 웹 데이터의 처리에 관련된 것이다.The first issue concerns access to large amounts of semantic web data and processing of the large amounts of semantic web data.
제2 이슈는, 관련된 시맨틱 클라우드들의 생성에 관련된 것이다.The second issue relates to the creation of related semantic clouds.
제3 이슈는, 직관적인(intuitive) 상호작용들을 가능하게 하는 효율적인 사용자 인터페이스의 제공에 관련된 것이다.A third issue relates to the provision of an efficient user interface that enables intuitive interactions.
이러한 이슈들 중, 대규모 웹 데이터로부터 시맨틱 클라우드를 생성하는 문제에 포커스(focus)가 맞추어질 수 있다. 대규모 웹 데이터로부터 시맨틱 클라우드를 생성한다는 목적을 달성하기 위해 잘-조직된(well-organized) 시맨틱 클라우드들을 위한 요구사항들이 하기에서와 같이 제안될 수 있다.Among these issues, the focus can be on creating semantic clouds from large scale web data. Requirements for well-organized semantic clouds can be proposed as follows to achieve the goal of generating a semantic cloud from large scale web data.
제1 요구사항은, 클라우드들의 개수가 적은 것이다. 예컨대, 한 번에 추천된 시맨틱 클라우드들의 개수는 최대 4 개로 제한될 수 있다.The first requirement is that the number of clouds is small. For example, the number of semantic clouds recommended at one time may be limited to a maximum of four.
제2 요구사항은, 시맨틱 클라우드 내에서의 콘텐츠의 균형(balance)이다. 예컨대, 의미론적으로(semantically) 관련된 용어들은 동일한 시맨틱 클라우드 내에 포함되는 것이 바람직하다.The second requirement is the balance of content within the semantic cloud. For example, semantically related terms are preferably included within the same semantic cloud.
제3 요구사항은, 클라우드들 간에 모호성이 존재하지 않는 것이다. 예컨대, 생성된 시맨틱 클라우드들 간의 시맨틱 모호성이 최소화되는 것이 바람직하다.The third requirement is that there is no ambiguity between the clouds. For example, it is desirable that the semantic ambiguity between generated semantic clouds be minimized.
이러한 요구사항들을 충족시킬 수 있는 시맨틱 클라우드를 생성하기 위한 방법이 하기에서 상세히 설명된다.A method for creating a semantic cloud that can meet these requirements is described in detail below.
도 3은 일 예에 따른 링크된 데이터로부터의 시맨틱 클라우드 생성을 설명한다.3 illustrates semantic cloud generation from linked data according to an example.
링크된 데이터에 대한 통계(statistics)에 따르면, 링크된 데이터는 도메인 독립적인(domain-independent) 295 개의 상이한 데이터셋(dataset)들로부터의 310억 이상의 RDF 트리플들을 포함한다. 따라서, 링크된 데이터는 대규모의 이종(heterogeneous) 시맨틱 웹 데이터 스토어(store)일 수 있다. 링크된 데이터로부터 시맨틱 클라우드들을 생성하기 위해, 시맨틱 클라우드 생성 방법은 점진적(incremental)일 수 있고 되풀이될 수 있다.According to statistics on the linked data, the linked data includes more than 31 billion RDF triples from 295 different datasets that are domain-independent. Thus, the linked data can be a large, heterogeneous semantic web data store. In order to generate semantic clouds from the linked data, the semantic cloud generation method can be incremental and repeated.
전술된 단계(240)는 단계(310) 내지 단계(330)을 포함할 수 있다.Step 240 described above may include steps 310 to 330.
단계(310)에서, 시맨틱 클라우드 생성부(130)는 링크된 데이터 내에서 클러스터링(clustering)을 위한 하나 이상의 스포팅 포인트(spotting point)들의 위치를 검색할 수 있다.In operation 310, the semantic cloud generator 130 may search for locations of one or more spotting points for clustering within the linked data.
하나 이상의 스포팅 포인트들은 키워드에 관련된 컨셉들을 커버하는 대표(representative) RDF 노드들일 수 있다. 즉, 시맨틱 클라우드 생성부(130)는 입력된 키워드에 관련된 컨셉들을 커버하는 대표 RDF 노드들을 검색할 수 있다.One or more spotting points may be representative RDF nodes that cover concepts related to the keyword. That is, the semantic cloud generator 130 may search for representative RDF nodes covering concepts related to the input keyword.
스포팅 포인트들의 위치를 검색한 후, 단계(320)에서, 시맨틱 클라우드 생성부(130)는 하나 이상의 스포팅 포인트들 각각에 대해 스포팅 포인트에 연결된 이웃하는(neighboring) 노드(node)들을 선택적으로 방문함으로써 그래프를 순회할 수 있다.After retrieving the location of the spotting points, in step 320, the semantic cloud generator 130 selectively visits neighboring nodes connected to the spotting point for each of the one or more spotting points, thereby Can be traversed.
시맨틱 클라우드 생성부(130)는 사용자 컨텍스트(context) 및 인터링크(interlink)된 관계(relation) 용어들을 통해 연결된 이웃하는 노드들을 선택적으로 방문할 수 있다.The semantic cloud generator 130 may selectively visit neighboring nodes connected through user context and interlinked relation terms.
이웃하는 노드들을 선택적으로 방문하는 것은 다량의 링크된 데이터를 다루는(handling) 복잡함을 감소시킬 수 있다. 또한, 이웃하는 노드들을 선택적으로 방문하는 것은 덜 관련된(relevant) 관계(relationship)들 및 대응하는(corresponding) 노드들을 걸러냄으로써(filtering out) 생성된 시맨틱 클라우드의 시맨틱 정합성(semantic coherence)의 품질(quality)을 보장할 수 있다.Selective visits to neighboring nodes can reduce the complexity of handling large amounts of linked data. In addition, selectively visiting neighboring nodes is the quality of the semantic coherence of the semantic coherence generated by filtering out less relevant relationships and corresponding nodes. ) Can be guaranteed.
동일한 태그 클라우드 내의 시맨틱 노드들 방문하는 것을 포함할지 여부를 결정하기 위해, 스포팅 포인트 및 방문(visiting) 노드 간의 시맨틱 유사도(similarity)를 측정하는 것이 요구된다. 기본적으로, 스포팅 포인팅 및 방문 노드를 서로 오버랩(overlap)하는 컨셉들의 개수가 상기의 스포팅 포인팅 및 방문 노드 간의 시맨틱 유사성의 측정의 기준이 될 수 있다. 추가적으로, 순회(traverse)할 홉(hop)들의 최대 개수 및 시맨틱 유사성에 대한 문턱치(threshold value)를 결정하는 것이 논의(discussion)될 수 있다.In order to determine whether to include visiting semantic nodes in the same tag cloud, it is necessary to measure the semantic similarity between the spotting point and the visiting node. Basically, the number of concepts that overlap the spotting pointing and landing nodes may be the basis for measuring the semantic similarity between the spotting pointing and landing nodes. Additionally, determining the maximum number of hops to traverse and the threshold value for semantic similarity can be discussed.
단계(330)에서, 시맨틱 클라우드 생성부(130)는 하나 이상의 스포팅 포인트들 각각에 대해 상기 스포팅 포인트 및 상기 선택적으로 방문된 연결된 이웃하는 노드들을 클러스터링함으로써 상기 하나 이상의 추천된 시맨틱 클라우드들을 생성할 수 있다.In step 330, the semantic cloud generator 130 may generate the one or more recommended semantic clouds by clustering the spotting point and the selectively visited connected neighboring nodes for each of one or more spotting points. .
도 4는 일 예에 따른 링크된 데이터 내에서 스포팅 포인트들을 찾는 방법을 설명한다.4 illustrates a method of finding spotting points in linked data according to an example.
링크된 데이터 내에서 하나 이상의 스포팅 포인트들의 위치를 검색하는 단계(310)는, 전술된 요구사항들을 충족시킬 수 있는 고품질 시맨틱 클라우드들을 생성함에 있어서 가장 중요한 단계일 수 있다. 고품질 시맨틱 클라우드들을 생성함에 있어서, 더 중요하고 밀집되어(densely) 연결된 RDF 노드들로부터 출발하여 상기의 RDF 노드들 각각과 관련된 RDF 노드들을 순회 및 검색하는 것이 더 효율적일 수 있기 때문이다..Retrieving 310 the location of one or more spotting points in the linked data may be the most important step in creating high quality semantic clouds that can meet the requirements described above. This is because in generating high quality semantic clouds, it may be more efficient to traverse and retrieve RDF nodes associated with each of the RDF nodes starting from more important and densely connected RDF nodes.
스포팅 포인트들의 위치를 알아내는 것은 관련된 RDF 노드들을 획득하기 위해 링크된 데이터에게 쿼리하는 단계(230) 로부터 시작하는 것으로 볼 수 있다.Locating the spotting points can be viewed as starting from querying the linked data 230 to obtain relevant RDF nodes.
단계(220)에서, 쿼리 매니저(120)가 링크된 데이터로의 쿼리를 생성하기 위한 2 가지 방식이 있다. 첫 번째 방식은 스파클(SPARQL)을 통한 쿼리 생성 방식이고, 두 번째 방식은 시맨틱 웹 검색 엔진(Semantic Web Search Engine; SWSE), 팰콘스(Falcons) 및 신디체(Sindice)와 같은 시맨틱 웹(Semantic Web) 검색 엔진들을 통한 쿼리 생성 방식이다. 여기서, 스파클은 RDF를 위한 쿼리 언어 중 하나이다.In step 220, there are two ways for the query manager 120 to create a query with the linked data. The first approach is query generation via Sparkle, and the second approach is Semantic Web, such as the Semantic Web Search Engine (SWSE), Falcons, and Syndic. ) Query generation through search engines. Here, Sparkle is one of the query languages for RDF.
시맨틱 웹 검색 엔진들은 RDF 노드들을 시맨틱 웹 검색 엔진들 자신의 알고리즘(algorithm)들을 가지고 랭크(rank)할 수 있다. 상기의 랭킹(ranking)의 결과(consequently)로, 두 번째 방식에 의해 추출된(retrieved) RDF 노드들은 모든 데이터셋들을 커버하지 않은 채 바이어스(bias)될 수 있다. 따라서, 단계(220)에서, 쿼리 매니저는(120), 첫 번째 방식에 따라, SPARQL에 기반하여 링크된 데이터로의 쿼리를 생성할 수 있다.Semantic web search engines can rank RDF nodes with their own algorithms. As a result of the ranking above, RDF nodes retrieved by the second scheme can be biased without covering all datasets. Thus, at step 220, the query manager 120 may generate a query to the linked data based on the SPARQL, according to the first approach.
디비피디아(DBpedia), 프리베이스(Freebase) 및 지오네임스(Geonames)와 같은 각 링크된 데이터의 데이터셋에 대한 SPARQL 종점(endpoint)들을 다뤄야함에도 불구하고, 최신 버전(version)의 관련된 RDF 노드들이 획득될 수 있다.Although the SPARQL endpoints for each linked dataset such as DBpedia, Freebase and Geonames must be handled, the latest version of relevant RDF nodes are obtained. Can be.
링크된 데이터 내의 모든 데이터셋들에게 질의하는 것은 상당히 긴 시간이 걸릴 수 있다. 따라서, 단계(230)에서, 쿼리 매니저(120)는 성능을 위해 선택된 데이터셋에 대해서 SPARQL 쿼리들을 발부(issue)할 수 있다.Querying all datasets in the linked data can take a long time. Thus, at step 230, query manager 120 may issue SPARQL queries for the dataset selected for performance.
ckan.net은 트리플들의 개수, 인-링크들의 개수, 아웃-링크들의 개수, 토픽들, SPARQL 종점 및 라이선스(license) 정보 등과 같은 데이터셋의 메타데이터를 수집하고 유지(maintain)하는 웹 사이트이다.ckan.net is a web site that collects and maintains metadata of datasets such as the number of triples, the number of in-links, the number of out-links, topics, SPARQL endpoints and license information.
송수신부(110)는 각 데이터셋의 메타데이터를 수신할 수 있다. 또한, 쿼리 매니저(120)는 상기의 메타데이터를 사용함으로써, 링크된 데이터의 데이터셋들을 갖는 그래프를 구성할 수 있다. 또한, 시맨틱 클라우드 생성부(130)는 차수(degree)(또는, 허브(hub)) 및 사이중요도(betweenness)에 대하여 상기의 그래프를 분석할 수 있다. 상기의 분석은, 얼마나 많은 다른 데이터셋들이 데이터셋에 연결되었는가를 설명할 수 있고, 데이터셋들 간의 최단 경로들 상에서 데이터셋이 얼마나 자주 나타나는 가를 설명할 수 있다.The transceiver 110 may receive metadata of each data set. In addition, the query manager 120 may construct a graph having data sets of linked data by using the metadata. In addition, the semantic cloud generation unit 130 may analyze the graph with respect to the degree (or hub) and thebetweenness. The above analysis can explain how many different datasets are connected to the dataset and how often the dataset appears on the shortest paths between the datasets.
시맨틱 클라우드 생성부(130)는 스포팅 포인트들을 통해 모든 존재하는 시맨틱들을 포함하여 관련된 RDF 노드들을 효율적으로 순회할 수 있어야 한다. 따라서, 시맨틱 클라우드 생성부(130)는 데이터셋들로부터, 차수 및 사이중요도 뿐만 아니라, 상이한 토픽들을 갖는 스포팅 포인트들을 선택함으로써 향상된 결과들을 반환(return)할 수 있다. The semantic cloud generator 130 should be able to efficiently traverse related RDF nodes including all existing semantics through the spotting points. Accordingly, the semantic cloud generator 130 may return improved results by selecting spotting points with different topics, as well as order and interimportance, from the datasets.
쿼리 매니저(120)는 각 데이터셋의 토픽, 차수 및 사이중요도를 고려함으로써 각 데이터셋의 랭킹을 결정할 수 있다. 데이터셋의 랭킹에 의해 더 중요한 데이터셋들이 결정될 수 있다. 쿼리 매니저(120)는 각 데이터 셋의 랭킹에 기반하여 더 중요한 데이터셋들에게 선택적으로 질의할 수 있다.The query manager 120 may determine the ranking of each dataset by considering the topic, order, and importance of each dataset. More important datasets may be determined by ranking of the dataset. The query manager 120 may selectively query more important data sets based on the ranking of each data set.
예컨대, 키워드 'apple'에 대한 쿼리가 생성되어, 링크된 데이터로부터의 데이터셋들 중 다수에게로 전달되면(410), 140,000 개 이상의 관련된 RDF 노드들이 반환될 수 있다(420). 반환된 RDF 노드들은 하나의 독립적인 의미를 갖는 컨셉들로 묶여질 수 있다. 예컨대, dbpedia.org/resource/Apple 과 rdf.freebase.com/ns/m/0k8z 은 동일한 컨셉인 'Apple Inc.' 를 표현한 RDF 노드들이다. 이를 위해 owl:sameAs 나 skos:exactMatch 와 같이 동일한 의미의 RDF 노드들 간의 관계를 표현한 링크들을 사용할 수 있다.For example, if a query for the keyword 'apple' is generated and passed to multiple of the datasets from the linked data (410), more than 140,000 related RDF nodes may be returned (420). The returned RDF nodes can be bundled into concepts with one independent meaning. For example, dbpedia.org/resource/Apple and rdf.freebase.com/ns/m/0k8z are the same concept as 'Apple Inc.' RDF nodes that represent. To do this, you can use links that represent relationships between RDF nodes that have the same meaning, such as owl: sameAs or skos: exactMatch.
또한 모든 RDF 노드들을 갖는 것보다, 몇몇 대표적인 노드들을 선택하는 것이 시맨틱 클라우드 형성에 있어서의 복잡도를 감소시킬 수 있다. 더 추상적인 노드들일수록 더 높은 차수의 연결(connection)들을 가질 수 있다. 따라서, 시맨틱 클라우드 생성부(130)는 RDF 노드들의 상대적인 컨셉 계층(hierarchy)들을 비교함으로써 RDF 노드들의 가장 일반적인 컨셉(concept)들을 스포팅 포인트들로서 선택할 수 있다. 이러한 선택은 상기의 스포팅 포인트들 간의 시맨틱 명료성(unambiguity)을 보장한다. 따라서, 이러한 선택은 생성된 시맨틱 클라우드들 간의 모호성이 없어야 한다는 요구사항을 지지할 수 있다.Also, rather than having all the RDF nodes, selecting some representative nodes can reduce the complexity in forming the semantic cloud. The more abstract the nodes, the higher the order of connections can be. Accordingly, the semantic cloud generator 130 may select the most common concepts of RDF nodes as spotting points by comparing relative concept hierarchies of RDF nodes. This choice ensures the semantic unambiguity between the spotting points above. Thus, this choice may support the requirement that there should be no ambiguity between the generated semantic clouds.
단순 지식 조직 시스템 3(Simple Knowledge Organization System 3; SKOS3)은 지식 조직 시스템들을 공유 및 링킹하기 위한 공통(common) 데이터 모델이다. SKOS3은 skos:broader 및 skos:narrower과 같은 유용한 관계 용어들을 제공한다. 관계 용어들은 RDF 노드들을 비교하기 위한 상대적인 컨셉 계층들을 검색하고, 가장 일반적인 RDF 노드를 스포팅 포인트로서 선택하기 위해 활용(exploit)될 수 있다.Simple Knowledge Organization System 3 (SKOS3) is a common data model for sharing and linking knowledge organization systems. SKOS3 provides useful relationship terms such as skos: broader and skos: narrower. Relationship terms may be exploited to retrieve relative concept layers for comparing RDF nodes and to select the most common RDF node as a spotting point.
도 4에서, 'Apple I', 'Apple IIGS' 및 'Apple Lisa'과 같은 몇몇 RDF 노드들이 키워드 'apple'에 의해 추출되었다. 시맨틱 클라우드 생성부(130)는 owl:sameAs 나 skos:exactMatch 와 같은 동일의미 링크들과 skos:broader 와 skos:narrower 링크들과 같은 의미계층 링크들을 파싱(parsing)함으로써 상기의 RDF 노드들의 컨셉 그래프를 생성할 수 있고, 상기의 RDF 노드들 중 가장 일반적이고 중요한 컨셉을 인식(recognize)할 수 있다(430). 도 4에서 예시된 케이스(case)에서, 가장 일반적인 컨셉은 'Apple Inc.'이며, 'Apple Inc.'이 스포팅 포인트로서 선택되었다.In FIG. 4, several RDF nodes such as 'Apple I', 'Apple IIGS' and 'Apple Lisa' have been extracted by the keyword 'apple'. The semantic cloud generation unit 130 parses the concept graph of the RDF nodes by parsing identical semantic links such as owl: sameAs or skos: exactMatch and semantic layer links such as skos: broader and skos: narrower links. It may generate and recognize 430 the most common and important concepts of the above RDF nodes. In the case illustrated in FIG. 4, the most common concept is 'Apple Inc.' and 'Apple Inc.' was selected as the spotting point.
하기에서, 단계(320)가 추가적으로 설명된다.In the following, step 320 is further described.
단계(320)에서, 시맨틱 클라우드 생성부(130)는 관련된 RDF 노드들을 링크하는 관계(relation)들을 선택할 수 있다. 링크된 데이터 내의 모든 RDF 노드들은 대규모 그래프 구조(structure)로서 연결되었기 때문에, 시맨틱 클라우드 생성부(130)는 스포팅 포인트들로부터 상기의 그래프를 순회함으로써 중요하고 관련된 RDF 노드들을 검색할 수 있다. 'Apple Inc.'의 케이스에서, 어떤 시맨틱 노드의 레이블들이 'iPod', 'iPhone', 'MacBook' 또는 'Steve Jobs'를 포함할 경우, 상기의 시맨틱 노드는 키워드 'apple'을 포함하지 않더라도 중요한 시맨틱 노드로 간주될 수 있다.In step 320, the semantic cloud generator 130 may select relations that link related RDF nodes. Since all the RDF nodes in the linked data are connected as a large graph structure, the semantic cloud generator 130 can retrieve important and related RDF nodes by traversing the graph from spotting points. In the case of Apple Inc., if the semantic node's labels contain 'iPod', 'iPhone', 'MacBook' or 'Steve Jobs', the semantic node above is important even if it does not contain the keyword 'apple' Can be considered a semantic node.
따라서, 시맨틱 클라우드 생성부(130)는 순회 경계(bound)들을 세팅함으로써 시맨틱 클라우드 생성에 대한 복잡도를 감소시킬 수 있다. 시맨틱 클라우드 생성부(130)는 관련된 관계들만을 고려함으로써 대규모 RDF 그래프를 순회하기 위한 계산적인 복잡도를 감소시킬 수 있다. 의미론적으로 관련된 관계들을 이상적으로 선택하기 위해, 시맨틱 클라우드 생성부(130)는 관계 용어들을 흥미(interest)들 및 선호(preference)들과 같은 사용자 컨텍스트들과 자동으로 연관시킬 수 있다. 여기서, 컨텍스트 정보 및 관계 용어들 간의 자동 연관은 현재의 기술적으로 가능하지 않을 수 있기 때문에, 사용자의 흥미들은 관계 용어들과 인터링크될 수 있고, 사용자의 흥미들은 시맨틱 클라우드가 생성되기 이전에 이미 각 사용자에 의해 정의될 수 있다.. 예컨대, 사용자 흥미가 'movie'인 케이스에서, 'actor', 'director', 'rating', 'background music' 및 'story'와 같은 관계 용어들이 순회할 관계들이 될 수 있다.Accordingly, the semantic cloud generator 130 may reduce the complexity of the semantic cloud generation by setting the traversal boundaries. The semantic cloud generation unit 130 may reduce the computational complexity for traversing the large RDF graph by considering only related relationships. To ideally select semantically related relationships, semantic cloud generator 130 may automatically associate relationship terms with user contexts, such as interests and preferences. Here, since automatic association between contextual information and relationship terms may not be currently technically possible, the interests of the user may be interlinked with the relationship terms, and the interests of the user may already be present for each user before the semantic cloud is created. For example, in a case where the user interest is 'movie', relationship terms such as 'actor', 'director', 'rating', 'background music' and 'story' will be the relations to be traversed. Can be.
추가로, W3C는 링크된 데이터 데이터셋들 간의 상호운용성(interoperability)을 보장하기 위해 링크된 데이터 배포자(publisher)가 예컨대 프렌드 오브 어 프랜드(Friend Of A Friend 4; FOAF4), 더블린 코어 5(Dublin Core 5; DC5) 및 의미론적으로-인터링크된 온라인 커뮤니티들 6(Semantically-Interlinked Online Communities 6; SIOC6) 및 SKOS와 같은 잘-정의되고, 대중적인 용어들을 사용할 것을 권고한다. 단계(320)에서, 시맨틱 클라우드 생성부(130)는 우선 상기의 관계들을 순회할 수 있고, 컨텍스트들을 고려하여 사용자에 의해 선택된 관계들을 참작할 수 있다. 이러한 순회 및 참작은 이러한 노드들을 클러스터링하기 위한 복잡도를 감소시키면서 관련된 노드들을 방문하는 것을 용이하게 한다.In addition, the W3C requires linked data publishers, such as Friend Of A Friend 4 (FOAF4), Dublin Core 5, to ensure interoperability between linked data datasets. 5) It is recommended to use well-defined, popular terms such as DC5) and Semantically-Interlinked Online Communities 6 (SIOC6) and SKOS. In step 320, the semantic cloud generator 130 may first traverse the relationships and may take into account the relationships selected by the user in consideration of contexts. This traversal and reference facilitates visiting related nodes while reducing the complexity for clustering these nodes.
하기에서, 단계(330)가 추가적으로 설명된다.In the following, step 330 is further described.
단계(330)에서, 시맨틱 클라우드 생성부(130)는 시맨틱 클라우드 내에 동일한 클라우드 내의 방문된 PDF 노드들을 포함할 것인가를 결정하기 위해 RDF 노드들 간의 시맨틱 유사도가 측정할 수 있다.In operation 330, the semantic cloud generator 130 may measure semantic similarity between RDF nodes to determine whether to include visited PDF nodes in the same cloud in the semantic cloud.
정보 검색(retrieval) 분야에서의 '용어 빈도(term frequency)'와 유사하게, 시맨틱 클라우드 생성부(130)는 노드들 간의 유사도를 측정하기 위해 시맨틱 웹 검색 엔진으로부터의 질의 응답(response)들의 개수를 사용할 수 있다. 하기의 수학식 1 및 수학식 2에서, l 1l 2는 RDF 노드들의 레이블(label)들이다. n(l)은 RDF 노드 l에 대한 질의 응답들의 개수를 나타낸다. h는 순회해야 할 홉들의 개수를 나타낸다. w는 가중치이다.Similar to 'term frequency' in the field of information retrieval, the semantic cloud generator 130 calculates the number of query responses from the semantic web search engine to measure the similarity between nodes. Can be used. In Equations 1 and 2 below, l 1 and l 2 are labels of RDF nodes. n ( l ) represents the number of query responses for RDF node l . h represents the number of hops to traverse. w is a weight.
수학식 1
Figure PCTKR2012010670-appb-M000001
Equation 1
Figure PCTKR2012010670-appb-M000001
수학식 2
Figure PCTKR2012010670-appb-M000002
Equation 2
Figure PCTKR2012010670-appb-M000002
TermFreq(l 1, l 2)는 l 1l 2 간의 용어 빈도를 나타날 수 있다. TermFreq ( l 1 , l 2 ) may indicate the term frequency between l 1 and l 2 .
스포팅 포인트로부터의 홉들의 개수가 증가함에 따라, 시맨틱 유사도의 값은 기하급수적으로(exponentially) 감소할 수 있다. 이러한 이유로, 2 개의 RDF 노드들 l 1l 2 간의 시맨틱 유사도를 나타내는 SemSim(l 1, l 2)는 w h 의 역수에 비례할 수 있다..As the number of hops from the spotting point increases, the value of semantic similarity may decrease exponentially. For this reason, SemSim ( l 1 , l 2 ) representing the semantic similarity between two RDF nodes l 1 and l 2 may be proportional to the inverse of w h .
시맨틱 클라우드 생성부(130)는 키워드를 향한 의미론적으로 연관된 컨셉들을 포함하도록 클러스터링을 위한 가중치 w 및 문턱치 h를 결정할 수 있다.The semantic cloud generator 130 may determine a weight w and a threshold h for clustering to include semantically related concepts towards keywords.
도 5는 일 예에 따른 각 선택된 데이터셋들의 집합에 대한 실혐 결과들을 도시한다.5 shows demonstration results for each set of selected datasets according to an example.
처음 4 개의 그래프들(510, 520, 530 및 540)은 각 실험 용어에 대해서, 도메인 및 사이중요도에 기반하여 생성된 데이터셋들의 집합들이 높은 커버리지(coverage) 비율을 보인다는 것을 각각 도메인, 데이터셋, 트리플 및 타입에 대해 각각 나타낸다. 키워드 'tiger'의 트리플 커버리지에 있어서, 도메인 및 사이중요도가 다른 케이스들에 비해 훨씬 높다. 이는, 도메인 및 사이중요도가 상기의 키워드에 대한 다수의 RDF 노드들을 갖는 데이터셋을 포함하기 때문이다.The first four graphs 510, 520, 530 and 540 show that for each experimental term, the sets of datasets generated based on domain and intercriticality show high coverage rates, respectively. , Triple and type respectively. In the triple coverage of the keyword 'tiger', the domain and interimportance are much higher than in other cases. This is because the domain and inter importance include a dataset with multiple RDF nodes for the above keywords.
타입 커버리지의 경우에 있어서, 데이터셋들의 생성된 집합들 사이에서 중요한 차이를 인식하는 것은 어렵다. 이는, 각 RDF 노드는 다중 타입들을 가지며, 다중 타입들 중 다수는 중복된 것이기 때문이다.In the case of type coverage, it is difficult to recognize significant differences between the generated sets of datasets. This is because each RDF node has multiple types, many of which are redundant.
마지막 그래프(550)는 스포팅 포인트를 구하는데 있어서 사용된 동일의미 링크 (예, owl:sameAs, skos:exactMatch) 파싱과 의미계층 링크 (예, skos:broader, skos:narrower, rdf:subClassOf) 파싱으로 인해 줄어든 RDF 노드들의 비율을 나타내고 있다. 실험에 사용된 태그 용어들은 인터넷 상에서 태깅에 많이 사용되는 용어들 중에 일부를 선택한 것으로서 최대 75.44% (용어 'Nature'), 평균 19.05% 의 감소 비율을 보인다. 감소 비율이 높을수록 중복되지 않고 해당 용어에 대한 중요한 의미를 갖는 RDF 노드들이 스포팅 포인트로 선택될 확률이 높음을 의미한다.The final graph 550 is the parsing of the same semantic links (eg owl: sameAs, skos: exactMatch) and semantic layer links (eg skos: broader, skos: narrower, rdf: subClassOf) used to find the spotting points. It shows the percentage of RDF nodes that are reduced. The tag terms used in the experiment were selected from some of the terms used for tagging on the Internet, and the maximum decrease rate was 75.44% (term 'Nature'), and the average was 19.05%. The higher the reduction rate, the higher the probability that RDF nodes that are not duplicated and have a significant meaning for the term are selected as spotting points.
도 6은 일 예에 따른 키워드 'apple'에 대한 시맨틱 클라우드 생성의 결과를 도시한다.6 illustrates a result of generating a semantic cloud for the keyword 'apple' according to an example.
시맨틱 클라우드를 생성함에 있어서, 3 가지 방법이 있다. 도 6에서, rdf:type, SKOS 파싱 및 (도 1 내지 도 4를 참조하여) 제안된 방법에 의해 각각 시맨틱 클라우드를 생성한 결과들(610, 620 및 630)이 도시되었다.In creating a semantic cloud, there are three ways. In FIG. 6, the results 610, 620, and 630 of generating the semantic cloud by rdf: type, SKOS parsing, and the proposed method (see FIGS. 1-4), respectively, are shown.
제1 방법은 RDF 노드들을 RDF 노드들의 rdf;type에 따라 클러스터하는 것이다. 그러나, 제1 방법은 고품질의 시맨틱 클라우드 생성을 보장하지 못할 수 있다. 예컨대, rdf:type이 'company'인 'Apple Inc'는 rdf:type이 'Personal Computer'인 'Apple I' 및 'Apple II GS' 등의 그룹들과 분리되었다. 'Apple Inc', 'Apple I' 및 'Apple II GS' 간에 시맨틱 관련이 있는 것은 분명하다.The first method is to cluster RDF nodes according to the rdf; type of RDF nodes. However, the first method may not guarantee high quality semantic cloud generation. For example, 'Apple Inc' with rdf: type 'company' has been separated from groups such as 'Apple I' and 'Apple II GS' with rdf: type 'Personal Computer'. It is clear that there is a semantic relationship between Apple Inc, Apple I and Apple II GS.
제2 방법은 SKOS 관계들을 사용하는 것이다. 제2 방법은 RDF 노드들 간의 상대적인 컨셉 계층을 이해함에 있어 유용하다. 그러나, 제2 방법에 의해 생성된 클라우드들은 단지 키워드 'apple'만을 포함하는 RDF 노드들만을 포함하기 때문에, 제2 방법에 의해 획득된 결과는 각 클라우드 내의 콘텐츠의 균형을 충족시키는 것을 실패하였다. 또한, 생성된 클라우드들 중 단지 단일한 노드만을 갖는 것도 있다.The second method is to use SKOS relationships. The second method is useful for understanding the relative concept layer between RDF nodes. However, since the clouds generated by the second method only contain RDF nodes that contain only the keyword 'apple', the result obtained by the second method failed to meet the balance of content in each cloud. In addition, some of the generated clouds have only a single node.
제3 방법에 의해 생성된 시맨틱 클라우드들은 다른 방법에 의해 생성된 시맨틱 클라우드들에 비해 더 낳은 결과를 제공한다. 제3 방법에 의해 생성된 시맨틱 클라우드들은 관계 순회를 통해 'ITunes' 및 'Macintosh'와 같은 관련된 RDF 노드들 또한 포함한다. 관련된 RDF 노드들은 키워드 'apple'을 포함하지 않는다.Semantic clouds generated by the third method provide better results than semantic clouds generated by other methods. The semantic clouds generated by the third method also include related RDF nodes such as 'ITunes' and 'Macintosh' via relationship traversal. Related RDF nodes do not contain the keyword 'apple'.
도 7은 일 예에 따른 웹-기반 IPTV 환경에서의 시맨틱 어노테이션 인터페이스를 설명한다.7 illustrates a semantic annotation interface in a web-based IPTV environment according to an example.
사용자는 링크된 데이터로부터 생성된 시맨틱 클라우드들로부터 시맨틱 옵션들을 선택함으로써 멀티미디어 콘텐츠 상에 어노테이션들을 추가할 수 있다. 어노테이션 결과들은 시맨틱 검색을 제공하기 위해 사용될 수 있다. 시맨틱 검색은 멀티미디어 콘텐츠에 대한 검색 결과를 향상시킬 수 있다.The user can add annotations to the multimedia content by selecting semantic options from semantic clouds generated from the linked data. Annotation results can be used to provide semantic search. Semantic search can improve search results for multimedia content.
도 7에서, 어노테이션이 추가되는 어노테이선 타이밍(710), 시맨틱 클라우드들을 생성하기 위해 사용된 키워드(720), 생성된 시맨틱 클라우드(730), 선택된 링크된 데이터(740), 검색을 통한 클라우드 생성(750), 입력을 통한 클라우드 생성(760) 및 시작 버튼(770) 등이 인터페이스의 예로서 도시되었다.In FIG. 7, annotation timing 710 to which annotations are added, keyword 720 used to generate semantic clouds, generated semantic cloud 730, selected linked data 740, cloud generation through search 750, cloud generation through input 760, start button 770, and the like are shown as examples of interfaces.
일 실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예들을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예들의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.Method according to an embodiment is implemented in the form of program instructions that can be executed by various computer means may be recorded on a computer readable medium. The computer readable medium may include program instructions, data files, data structures, etc. alone or in combination. Program instructions recorded on the media may be those specially designed and constructed for the purposes of the embodiments, or they may be of the kind well-known and available to those having skill in the computer software arts. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks, such as floppy disks. Magneto-optical media, and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like. The hardware device described above may be configured to operate as one or more software modules to perform the operations of the embodiments, and vice versa.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.As described above, the present invention has been described by way of limited embodiments and drawings, but the present invention is not limited to the above embodiments, and those skilled in the art to which the present invention pertains various modifications and variations from such descriptions. This is possible.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.Therefore, the scope of the present invention should not be limited to the described embodiments, but should be determined not only by the claims below but also by the equivalents of the claims.
시맨틱 클라우드를 기반하여 멀티미디어 콘텐츠 또는 웹 콘텐츠에 대한 시맨틱 어노테이션을 수행하는 분야에 적용된다.Applied to the field of performing semantic annotation on multimedia content or web content based on the semantic cloud.

Claims (14)

  1. 키워드에 기반하여 쿼리를 생성하는 단계;Generating a query based on the keyword;
    링크된 데이터(Linked Data)로부터 상기 쿼리와 관련된 하나 이상의 리소스 디스크립션 프레임워크(Resource Description Framework; RDF) 노드들을 획득하는 단계:Obtaining one or more Resource Description Framework (RDF) nodes associated with the query from Linked Data:
    상기 하나 이상의 RDF 노드들에 기반하여 하나 이상의 추천된 시맨틱 클라우드들을 생성하는 단계;Generating one or more recommended semantic clouds based on the one or more RDF nodes;
    상기 하나 이상의 추천된 시맨틱 클라우드들 중 추가될 어노테이션에 대응하는 시맨틱 클라우드를 탐색하고 결정하는 단계; 및Searching for and determining a semantic cloud corresponding to an annotation to be added among the one or more recommended semantic clouds; And
    상기 결정된 시맨틱 클라우드에 기반하여 콘텐츠에 상기 어노테이션을 추가함으로써 상기 콘텐츠에 대한 시맨틱 태깅을 수행하는 단계Performing semantic tagging on the content by adding the annotation to the content based on the determined semantic cloud
    를 포함하는, 시맨틱 어노테이션 방법.Including, semantic annotation method.
  2. 제1항에 있어서,The method of claim 1,
    상기 하나 이상의 추천된 시맨틱 클라우드들 중 상기 추가될 어노테이션에 대응하는 시맨틱 클라우드는 최적의 용어가 사용자에 의해 선택됨으로써 결정되는, 시맨틱 어노테이션 방법.The semantic annotation method of the one or more recommended semantic clouds corresponding to the annotation to be added is determined by selecting an optimal term by the user.
  3. 제1항에 있어서,The method of claim 1,
    상기 하나 이상의 추천된 시맨틱 클라우드들을 생성하는 단계는,Generating the one or more recommended semantic clouds,
    상기 링크된 데이터 내에서 하나 이상의 스포팅 포인트들의 위치를 검색하는 단계;Retrieving the location of one or more spotting points within the linked data;
    상기 하나 이상의 스포팅 포인트들 각각에 대해 스포팅 포인트에 연결된 이웃하는 노드들을 선택적으로 방문함으로써 그래프를 순회하는 단계; 및Traversing a graph by selectively visiting neighboring nodes connected to the spotting point for each of the one or more spotting points; And
    상기 하나 이상의 스포팅 포인트들 각각에 대해 상기 스포팅 포인트 및 상기 선택적으로 방문된 연결된 이웃하는 노드들을 클러스터링함으로써 상기 하나 이상의 추천된 시맨틱 클라우드들을 생성하는 단계Generating the one or more recommended semantic clouds by clustering the spotting point and the optionally visited connected neighboring nodes for each of the one or more spotting points
    를 포함하는, 시맨틱 어노테이션 방법.Including, semantic annotation method.
  4. 제2항에 있어서,The method of claim 2,
    상기 하나 이상의 스포팅 포인트들은 상기 키워드에 관련된 컨셉들을 커버하는 대표 RDF 노드들인, 시맨틱 어노테이션 방법.The one or more spotting points are representative RDF nodes that cover concepts related to the keyword.
  5. 제3항에 있어서,The method of claim 3,
    상기 연결된 이웃하는 노드들은 사용자 컨텍스트 및 인터링크된 관계 용어들을 통해 선택적으로 방문되는, 시맨틱 어노테이션 방법.The connected neighboring nodes are selectively visited via user context and interlinked relationship terms.
  6. 제1항에 있어서,The method of claim 1,
    상기 쿼리는 상기 링크된 데이터로의 쿼리이며, 스파클에 기반하여 생성되는, 시맨틱 어노테이션 방법.The query is a query to the linked data, the semantic annotation method being generated based on a sparkle.
  7. 키워드에 기반하여 쿼리를 생성하고, 링크된 데이터(Linked Data)로부터 상기 쿼리와 관련된 하나 이상의 리소스 디스크립션 프레임워크(Resource Description Framework; RDF) 노드들을 획득하는 쿼리 매니저;A query manager that generates a query based on a keyword and obtains one or more Resource Description Framework (RDF) nodes associated with the query from Linked Data;
    상기 하나 이상의 RDF 노드들의 일시적인(temporary) 그래프를 구성하고 하나 이상의 스포팅 포인트를 검색하고, 상기 하나 이상의 스포팅 포인트들에 기반하여 하나 이상의 추천된 시맨틱 클라우드들을 생성하는 시맨틱 클라우드 생성부;A semantic cloud generator for constructing a temporary graph of the one or more RDF nodes, searching for one or more spotting points, and generating one or more recommended semantic clouds based on the one or more spotting points;
    상기 하나 이상의 추천된 시맨틱 클라우드들 중 추가될 어노테이션에 대응하는 클라우드를 탐색하는 시맨틱 클라우드 탐색부; 및A semantic cloud search unit for searching a cloud corresponding to an annotation to be added among the one or more recommended semantic clouds; And
    상기 탐색된 시맨틱 클라우드에 기반하여 최적의 용어를 선택하고 콘텐츠에 상기 어노테이션을 추가함으로써 상기 콘텐츠에 대한 시맨틱 태깅을 수행하는 어노테이션 추가부An annotation adder that performs semantic tagging on the content by selecting an optimal term based on the searched semantic cloud and adding the annotation to the content.
    를 포함하는, 시맨틱 어노테이션 장치.It includes, a semantic annotation device.
  8. 제7항에 있어서,The method of claim 7, wherein
    상기 하나 이상의 추천된 시맨틱 클라우드들 중 상기 추가될 어노테이션에 대응하는 시맨틱 클라우드를 탐색하고 해당 시맨틱 클라우드가 포함하고 있는 최적의 용어가 사용자에 의해 선택됨으로써 결정되는, 시맨틱 어노테이션 장치.The semantic annotation device is determined by searching for a semantic cloud corresponding to the annotation to be added among the one or more recommended semantic clouds and selecting an optimal term included in the semantic cloud by the user.
  9. 제7항에 있어서,The method of claim 7, wherein
    상기 시맨틱 클라우드 생성부는, 상기 링크된 데이터 내에서 하나 이상의 스포팅 포인트들의 위치를 검색하고, 상기 하나 이상의 스포팅 포인트들 각각에 대해 스포팅 포인트에 연결된 이웃하는 노드들을 선택적으로 방문함으로써 그래프를 순회하고, 상기 하나 이상의 스포팅 포인트들 각각에 대해 상기 스포팅 포인트 및 상기 선택적으로 방문된 연결된 이웃하는 노드들을 클러스터링함으로써 상기 하나 이상의 추천된 시맨틱 클라우드들을 생성하는, 시맨틱 어노테이션 장치.The semantic cloud generator retrieves the location of one or more spotting points in the linked data, traverses the graph by selectively visiting neighboring nodes connected to the spotting point for each of the one or more spotting points, and the one Generating the one or more recommended semantic clouds by clustering the spotting point and the optionally visited connected neighboring nodes for each of the spotting points.
  10. 제9항에 있어서,The method of claim 9,
    상기 하나 이상의 쿼리 매니저에 의해 획득된 하나 이상의 RDF 노드들 중 동일한 의미를 갖는 노드들을 묶고 (예, owl:sameAs, skos:exactMatch) RDF 노드들간의 의미적 계층 관계를 파악함으로써 (예, skos:broader, skos:narrower, rdf:subClassOf) 하나 이상의 일시적인(temporary) 컨셉 그래프들을 구성하고 각각의 그래프에서 노드들의 중요도를 분석하여 스포팅 포인트를 결정하는, 시맨틱 어노테이션 장치.By grouping nodes having the same meaning among the one or more RDF nodes obtained by the one or more query managers (eg, owl: sameAs, skos: exactMatch) and identifying semantic hierarchical relationships between RDF nodes (eg, skos: broader , skos: narrower, rdf: subClassOf) A semantic annotation device that constructs one or more temporary concept graphs and analyzes the importance of nodes in each graph to determine spotting points.
  11. 제9항에 있어서,The method of claim 9,
    상기 시맨틱 클라우드 생성부는, 사용자 컨텍스트 및 인터링크된 관계 용어들을 통해 상기 연결된 이웃하는 노드들을 선택적으로 방문하는, 시맨틱 어노테이션 장치.And the semantic cloud generator selectively visits the connected neighboring nodes through a user context and interlinked relationship terms.
  12. 제7항에 있어서,The method of claim 7, wherein
    상기 쿼리는 상기 링크된 데이터로의 쿼리이며, 상기 쿼리 매니저는 스파클에 기반하여 상기 쿼리를 생성하는, 시맨틱 어노테이션 장치.The query is a query to the linked data, and the query manager generates the query based on a sparkle.
  13. 사용자에게 제1 콘텐츠를 제공하는 단계;Providing first content to a user;
    상기 사용자로부터 상기 제1 콘텐츠와 관련된 키워드를 수신하는 단계;Receiving a keyword associated with the first content from the user;
    상기 키워드에 기반하여 쿼리를 생성하는 단계;Generating a query based on the keyword;
    링크된 데이터(Linked Data)로부터 상기 쿼리와 관련된 하나 이상의 리소스 디스크립션 프레임워크(Resource Description Framework; RDF) 노드들을 획득하는 단계:Obtaining one or more Resource Description Framework (RDF) nodes associated with the query from Linked Data:
    상기 하나 이상의 RDF 노드들에 기반하여 하나 이상의 추천된 시맨틱 클라우드들을 생성하는 단계;Generating one or more recommended semantic clouds based on the one or more RDF nodes;
    상기 하나 이상의 추천된 시맨틱 클라우드들 중 어노테이션에 대응하는 클라우드를 탐색하는 단계;Searching for a cloud corresponding to an annotation of the one or more recommended semantic clouds;
    상기 하나 이상의 탐색된 시맨틱 클라우드 내의 용어들 중 추가될 어노테이션에 대응하는 용어를 결정하는 단계; 및Determining a term corresponding to an annotation to be added among terms in the one or more discovered semantic clouds; And
    상기 결정된 시맨틱 클라우드에 기반하여 제2 콘텐츠에 상기 어노테이션을 추가함으로써 상기 제2 콘텐츠에 대한 시맨틱 태깅을 수행하는 단계Performing semantic tagging on the second content by adding the annotation to the second content based on the determined semantic cloud
    를 포함하는, 스마트 디바이스의 시맨틱 어노테이션 방법.Comprising, a semantic annotation method of a smart device.
  14. 사용자에게 제1 콘텐츠를 제공하는 콘텐츠 제공부;A content providing unit providing first content to a user;
    상기 사용자로부터 상기 제1 콘텐츠와 관련된 키워드를 수신하는 송수신부;A transceiver for receiving a keyword related to the first content from the user;
    상기 키워드에 기반하여 쿼리를 생성하고, 링크된 데이터(Linked Data)로부터 상기 쿼리와 관련된 하나 이상의 리소스 디스크립션 프레임워크(Resource Description Framework; RDF) 노드들을 획득하는 쿼리 매니저;A query manager that generates a query based on the keyword and obtains one or more Resource Description Framework (RDF) nodes associated with the query from Linked Data;
    상기 하나 이상의 RDF 노드들에 기반하여 하나 이상의 추천된 시맨틱 클라우드들을 생성하는 시맨틱 클라우드 생성부;A semantic cloud generator for generating one or more recommended semantic clouds based on the one or more RDF nodes;
    상기 하나 이상의 추천된 시맨틱 클라우드들 중 추가될 어노테이션에 대응하는 클라우드를 탐색하는 시맨틱 클라우드 탐색부; 및A semantic cloud search unit for searching a cloud corresponding to an annotation to be added among the one or more recommended semantic clouds; And
    상기 탐색된 시맨틱 클라우드가 포함하고 있는 용어들 중 최적의 용어를 선택하여 제2 콘텐츠에 상기 어노테이션을 추가함으로써 상기 제 2 콘텐츠에 대한 시맨틱 태깅을 수행하는 어노테이션 추가부An annotation adder that performs semantic tagging on the second content by selecting an optimal term among the terms included in the searched semantic cloud and adding the annotation to the second content.
    를 포함하는, 스마트 디바이스.Including, a smart device.
PCT/KR2012/010670 2012-12-10 2012-12-10 Semantic cloud-based semantic annotation method and apparatus WO2014092209A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/KR2012/010670 WO2014092209A1 (en) 2012-12-10 2012-12-10 Semantic cloud-based semantic annotation method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/KR2012/010670 WO2014092209A1 (en) 2012-12-10 2012-12-10 Semantic cloud-based semantic annotation method and apparatus

Publications (1)

Publication Number Publication Date
WO2014092209A1 true WO2014092209A1 (en) 2014-06-19

Family

ID=50934486

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2012/010670 WO2014092209A1 (en) 2012-12-10 2012-12-10 Semantic cloud-based semantic annotation method and apparatus

Country Status (1)

Country Link
WO (1) WO2014092209A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104199838A (en) * 2014-08-04 2014-12-10 浙江工商大学 User model building method based on label disambiguation

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090254540A1 (en) * 2007-11-01 2009-10-08 Textdigger, Inc. Method and apparatus for automated tag generation for digital content
KR20100098028A (en) * 2009-02-27 2010-09-06 주식회사 솔트룩스 Data structurizing method and system using semantic metadata
US20120179680A1 (en) * 2011-01-06 2012-07-12 Isaacson Scott A Semantic associations in data

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090254540A1 (en) * 2007-11-01 2009-10-08 Textdigger, Inc. Method and apparatus for automated tag generation for digital content
KR20100098028A (en) * 2009-02-27 2010-09-06 주식회사 솔트룩스 Data structurizing method and system using semantic metadata
US20120179680A1 (en) * 2011-01-06 2012-07-12 Isaacson Scott A Semantic associations in data

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HAN-GYU KO ET AL.: "Generation of Semantic Clouds Based on Linked Data for Efficient Multimedia Semantic Annotation", ICWE 2011 WORKSHOPS., vol. 7059, 2011, BERLIN HEIDELBERG, pages 127 - 134, XP019173076 *
HAN-GYU KO: "Semantic Cloud Generation based on Linked Data for Efficient Semantic Annotation", JOINT WORKSHOP FOR LOD2 2011, 16 August 2011 (2011-08-16), KOREA - GERMANY, Retrieved from the Internet <URL:http://semanticweb.kaist.ac.kr/workshop2011/presentation/7iyko.pdf> *
JUNG, DO HEON: "A Study on the Ontology Languages and Applications Systems for the Semantic Web", INFORMATION MANAGEMENT RESEARCH, vol. 34, no. 3, 20 September 2003 (2003-09-20), pages 87 - 109 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104199838A (en) * 2014-08-04 2014-12-10 浙江工商大学 User model building method based on label disambiguation
CN104199838B (en) * 2014-08-04 2017-09-29 浙江工商大学 A kind of user model constructing method based on label disambiguation

Similar Documents

Publication Publication Date Title
Bizer et al. Dbpedia-a crystallization point for the web of data
US20130290370A1 (en) Method and process for semantic or faceted search over unstructured and annotated data
US10642935B2 (en) Identifying content and content relationship information associated with the content for ingestion into a corpus
Troullinou et al. Ontology understanding without tears: The summarization approach
Jung Evolutionary approach for semantic-based query sampling in large-scale information sources
JP2012520529A (en) System and method for knowledge research
RU2733482C2 (en) Method and system for updating search index database
WO2018019289A1 (en) Method, system, computer device and computer-readable medium on the basis of chinese language ontology database automatically generated from structured network knowledge
Esmaili et al. A categorization scheme for semantic web search engines
US8046360B2 (en) Reduction of annotations to extract structured web data
Hunter et al. Harvesting community annotations on 3D models of museum artefacts to enhance knowledge, discovery and re-use
KR20090085946A (en) Symantic client, symantic information management server, method for generaing symantic information, method for searching symantic information and computer program recording medium for performing the methods
WO2014092209A1 (en) Semantic cloud-based semantic annotation method and apparatus
KR101272377B1 (en) Method and apparatus for semantic annotation based on semantic-cloud
Lee et al. LifeLogOn: A practical lifelog system for building and exploiting lifelog ontology
KR20100070084A (en) Apparatus and method for in real time retrieving knowledge relevant to user&#39;s query from a large-scale ontology
Daud et al. Modeling ontology of folksonomy with latent semantics of tags
TW578067B (en) Knowledge graphic system and method based on ontology
Carmagnola Handling semantic heterogeneity in interoperable distributed user models
WO2013129888A1 (en) A method and system for non-ephemeral search
Shetty et al. A novel web service composition and web service discovery based on map reduce algorithm
Hakkoymaz Multimedia presentation organization and playout management using intelligent agents
Xu et al. Semantic annotation of traffic video resources
Peeters et al. The Web Data Commons Schema. org Table Corpora
Neffati et al. Semantic web service discovery approaches: A comparative study

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12890135

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 12890135

Country of ref document: EP

Kind code of ref document: A1