WO2017099454A1 - 마인드맵 기반 키워드 검색 방법 및 이를 위한 장치 - Google Patents

마인드맵 기반 키워드 검색 방법 및 이를 위한 장치 Download PDF

Info

Publication number
WO2017099454A1
WO2017099454A1 PCT/KR2016/014249 KR2016014249W WO2017099454A1 WO 2017099454 A1 WO2017099454 A1 WO 2017099454A1 KR 2016014249 W KR2016014249 W KR 2016014249W WO 2017099454 A1 WO2017099454 A1 WO 2017099454A1
Authority
WO
WIPO (PCT)
Prior art keywords
keyword
keywords
mind map
closeness
relationship information
Prior art date
Application number
PCT/KR2016/014249
Other languages
English (en)
French (fr)
Inventor
신사임
장달원
김경원
이종설
Original Assignee
전자부품연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 전자부품연구원 filed Critical 전자부품연구원
Publication of WO2017099454A1 publication Critical patent/WO2017099454A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor

Definitions

  • the present invention relates to a method for searching a keyword mind map and an apparatus therefor, and more particularly, to a method and apparatus for quickly and efficiently searching various contents based on a keyword mind map constructed by automatically analyzing a large amount of domain text. It is about.
  • Keywords are words or phrases extracted from the contents of a title or text to express the contents of the records, which mean words used as an access point when searching the records, and keyword search is provided with a search engine on a browser. This refers to the technique of getting the information you want by typing.
  • the keyword search method is the most common search service method provided by a search service system.
  • the search service system provides a search result including the keyword to the user.
  • a search service provider has built a keyword indexing engine that can automatically perform keyword indexing, and provides a keyword search through keyword indexing.
  • the keyword indexing search technology has a low accuracy in keyword search. There was a case where the content to be searched was not searched, and when building the knowledge base manually, the construction cost was too high, and there was a limit to expand the service.
  • the present invention analyzes the morphemes of the domain corpus, recognizes the entity name, extracts one or more keywords, generates and stores relationship information between the extracted keywords, and the user inputs a specific keyword.
  • the present invention analyzes the morphemes of the domain corpus, recognizes the entity name, extracts one or more keywords, generates and stores relationship information between the extracted keywords, and the user inputs a specific keyword.
  • the extended keyword and the related content associated with a specific keyword based on the stored relationship information, to build a search technology knowledge base based on the unstructured text data to lower the cost, the high-quality trendy expansion based on the relationship information
  • a search method and apparatus for providing a keyword are provided.
  • the extracting of the extended keyword may include setting a weight based on the closeness and the frequency of appearance of the inputted specific keyword and the one or more extended keywords, the specific keyword and the one or more according to the set weight. Calculating a rank of the extended keyword and outputting at least one of one or more keywords and content associated with the keyword based on the calculated rank, wherein the extracting is performed in the entity name recognition step. A keyword whose frequency is greater than a preset frequency may be extracted.
  • the method may further include visualizing relationship information including the received specific keyword based on the closeness and the frequency of appearance and outputting the visualized relationship information.
  • the method may further include tagging the analyzed morpheme-specific parts of speech and analyzing the syntax of each of the domain corpus based on the tagged parts of speech.
  • the keyword mind map search apparatus for achieving the above object collects one or more domain corpus, analyzes the morphemes of each of the collected domain corpus, and recognizes an entity name included in the analyzed morphemes.
  • a sentence analysis module to extract one or more keywords based on the entity name recognition result, calculate a closeness between the extracted keywords, define a relationship between the keywords based on the calculated closeness, and generate relationship information;
  • a mind map configuration module for controlling the mapping between the degree of closeness and the frequency of appearance of each keyword based on the generated relationship information to be stored in the mind map storage module, and storing the relationship information generated and mapped by the mind map configuration module
  • a specific keyword is transmitted from the mind map storage module and the input device, It may include a keyword search module for extracting one or more extended keywords associated with the specific keyword based on the stored relationship information, and extracts one or more related content based on the extended keywords.
  • one or more keywords are extracted by analyzing one or more domain corpus, generating and storing relationship information between each extracted keyword, and extended keywords and related contents associated with a specific keyword input by a user based on the stored relationship information.
  • FIG. 1 is a view showing the configuration of a keyword mind map search system according to an embodiment of the present invention.
  • FIG. 2 is a block diagram showing the configuration of a mind map search apparatus according to the present invention.
  • 3 to 5 are exemplary views for explaining an embodiment of a mind map construction process according to the present invention.
  • FIG. 6 is a flowchart illustrating a keyword mind map construction process according to an exemplary embodiment of the present invention.
  • FIG. 7 is a flowchart illustrating a keyword search process through a keyword mind map according to an embodiment of the present invention.
  • ordinal numbers such as first and second, are used to describe various components, and are used only to distinguish one component from another component, and to limit the components. Not used.
  • the second component may be referred to as the first component, and similarly, the first component may also be referred to as the second component.
  • unit for processing at least one function or operation, which may be implemented by hardware or software or a combination of hardware and software.
  • embodiments within the scope of the present invention include computer readable media having or conveying computer executable instructions or data structures stored on the computer readable medium.
  • Such computer readable media can be any available media that can be accessed by a general purpose or special purpose computer system.
  • Such computer readable media may be in the form of RAM, ROM, EPROM, CD-ROM or other optical disk storage, magnetic disk storage or other magnetic storage, or computer executable instructions, computer readable instructions or data structures. And may include, but are not limited to, any other medium that can be used to store or deliver certain program code means, and can be accessed by a general purpose or special purpose computer system. .
  • the present invention relates to personal computers, laptop computers, handheld devices, multiprocessor systems, microprocessor-based or programmable consumer electronics, network PCs, minicomputers, mainframe computers, mobile phones, PDAs, pagers It may be practiced in a network computing environment having various types of computer system configurations, including (pager) and the like.
  • the invention may also be practiced in distributed system environments where both local and remote computer systems that are linked via wired networks, wireless data links, or combinations of wired and wireless data links perform tasks.
  • program modules may be located in both local and remote memory storage devices.
  • FIG. 1 is a diagram schematically illustrating a structure of a keyword mind map search system according to an exemplary embodiment of the present invention.
  • a keyword mind map search system may include an input device 100, an output device 200, a domain corpus 300, and a mind map search device 400. have.
  • the input device 100 may include at least one of a keypad and a touch pad that generate an input signal according to a user's touch or manipulation.
  • the input device 100 may be configured in the form of a single touch panel (or touch screen) together with the output device 200 to simultaneously perform input and display functions.
  • the input device 100 may be any type of input means that can be developed in the future, in addition to input devices such as a keyboard, a keypad, a mouse, and a joystick.
  • the input device 100 receives a keyword related to content to be searched by a user and transmits the keyword to the mind map search apparatus 400.
  • the mind map search apparatus 400 that receives the keyword from the input apparatus 100 may extract the related keyword associated with the received keyword and the extended keyword expanded based on the keyword and provide the same to the user.
  • the output device 200 displays information about a series of operation states and operation results generated while the function of the mind map retrieval device 400 is performed.
  • the output device 200 includes a liquid crystal display (LCD), an ultra-thin liquid crystal display (TFT-LCD, Thin Film Transistor LCD), a light emitting diode (LED), an organic light emitting diode (OLED) Organic LED), an active organic light emitting diode (AMOLED, Active Matrix OLED), Retina Display (Retina Display), a flexible display (Flexible display) and three-dimensional (three-dimensional) display and the like.
  • LCD liquid crystal display
  • TFT-LCD Thin Film Transistor LCD
  • LED light emitting diode
  • OLED organic light emitting diode
  • AMOLED Active Matrix OLED
  • Retina Display Retina Display
  • Flexible display Flexible display
  • three-dimensional (three-dimensional) display and the like and the like.
  • the output device 200 when configured in the form of a touch screen, the output device 200 may perform some or all of the functions of the input device 100.
  • the output device 200 may receive and output a search result searched by the mind map search device 400 based on the keyword received from the input device 100.
  • the search result may be related content associated with a specific keyword received and an extended keyword related thereto.
  • the related content may be in various forms such as a text, an image, a picture, a Uniform Resource Locator (URL) address, and the like. It may be provided to the user through.
  • URL Uniform Resource Locator
  • the domain corpus 300 is a set of domain texts having a structure, and may be, for example, a set of text contents such as news articles provided by a domain such as a portal search site.
  • the domain corpus 300 is one piece of data for constructing the relationship information between the keywords extracted by the mind map search apparatus 400 and the extracted keywords.
  • the mind map search apparatus 400 is a device that analyzes a domain corpus composed of texts received from the domain corpus 300, extracts keywords, and generates relationship information based on the keywords.
  • the mind map search apparatus 400 collects one or more domain corpus from the domain corpus 300, analyzes the morphemes of the collected domain corpus, and tags the parts of the domain corpus by tagging the analyzed parts of the corpus. Analyze
  • the entity name included in the domain corpus is recognized, and one or more keywords are extracted according to the recognized entity name.
  • the extracted keyword may be extracted by selecting only keywords having a frequency exceeding a predetermined frequency or more, that is, if a specific keyword appears at a frequency equal to or greater than a predetermined frequency in at least one domain corpus, the specific keyword is extracted.
  • the keyword which appears below the preset frequency is not extracted.
  • the degree of closeness between the extracted one or more keywords is calculated, where the degree of closeness is a numerical value indicating how many relations each keyword has.
  • Such closeness may be measured by the number of domain corpus in which two keywords are mentioned together, the number of two keywords in one domain corpus, and the distance of two keywords apart in one domain corpus. .
  • the relationship between the keywords is considered to be greater, and the relationship between the two keywords in the relationship information may be set as a higher relationship.
  • the relationship between one or more keywords is defined based on the calculated closeness, the relationship information is generated, and the closeness between each keyword and the frequency of appearance of each keyword are mapped and stored based on the generated relationship information.
  • the mind map search apparatus 400 constructing the relation information in the above manner receives a specific keyword from the input apparatus 100, extracts one or more extended keywords associated with the specific keyword based on the stored relation information, and Based on the extension keyword, one or more related contents may be extracted and output through the output device 200.
  • the weight is set based on the closeness and the frequency of appearance of the specific keyword and at least one extended keyword, and the ranking is calculated between the specific keyword and the extended keyword according to the set weight, and the related content is output based on the ranking.
  • the expansion keywords that are highly related to a specific keyword are set to have a higher ranking, so that the ranking between the specific keyword and one or more expansion keywords is calculated, and the related contents related to the high ranking keyword are provided to the user based on the calculated result.
  • the related contents related to the high ranking keyword are provided to the user based on the calculated result.
  • relationship information of a specific keyword based on the closeness and the frequency of appearance between the specific keyword and one or more extended keywords, visualize the relationship information between the specific keyword and one or more extended keywords, and outputs the visualized relationship information You may.
  • FIGS. 3 to 5 are embodiments in which the mind map search apparatus 400 according to the present invention constructs relationship information and searches for keywords. A diagram for explaining.
  • the mind map search apparatus 400 includes a sentence analysis module 410, a mind map configuration module 430, a mind map storage module 450, a keyword search module 470, and a ranking. It may be configured to include a configuration module 490.
  • the sentence analysis module 410 is a device for analyzing the text of the collected one or more domain corpus, collecting one or more domain corpus from the domain corpus 300, to analyze the morphemes of each domain corpus, tagging parts of speech by morphemes It parses each of the domain corpus based on the tagged parts of speech.
  • the object name included in the domain corpus is recognized based on the analyzed syntax, and when the object name is recognized, the recognized object name is transmitted to the mind map configuration module 430.
  • the entity name is a word representing an entity or a single concept (a concept of representing a single thing with a limited attribute) and may include a noun, a person name, a place name, and the like.
  • the mind map configuration module 430 extracts one or more keywords based on the entity name received from the sentence analysis module 410. In this case, the mind map configuration module 430 may appear more than a predetermined frequency.
  • the entity name can be extracted as a keyword.
  • FIG. 3 illustrates keywords extracted from a domain corpus generated in July 2015, and the entity name 'Tater' is recognized by the sentence sentence module 1410 of '123'.
  • the word 'other' was extracted as a keyword, and the type of the keyword was designated as 'baseball term'.
  • the object name 'home run' was recognized 943 times by the sentence analysis module 410 and extracted as a keyword.
  • the keyword type is 'baseball term'.
  • the frequency is not set or the frequency is 700 or less. If the preset frequency is 1000, 'home', 'han O', 'yang OO', etc., other than 'other' Will not be extracted as a keyword.
  • the mind map configuration module 430 extracting one or more keywords calculates the degree of closeness between the keywords.
  • the degree of closeness is a measure of how related the two keywords are.
  • the number of domain corpus in which the two keywords are mentioned together It can be calculated by the number of two keywords mentioned together in one domain corpus, the distance between two keywords in one domain corpus, and the like.
  • the relationship between the keywords is defined based on the calculated closeness, generated as relationship information, and stored in the mind map storage module 450.
  • the mind map configuration module 430 may map the closeness between each keyword and the frequency of appearance of each keyword based on the generated relationship information and store the result in the mind map storage module 450.
  • the mind map storage module 450 is a device that stores the relationship information generated and mapped by the mind map configuration module 430.
  • the mind map storage module 450 stores the relationship information generated by the mind map configuration module 430, and, when requested by the keyword search module 470, sends the relationship information to the keyword search module 470.
  • FIG. 4 An embodiment of a form in which the relationship information is stored in the mind map storage module 450 can be described with reference to FIG. 4.
  • FIG. 4 to support fast search by mapping contents associated with each keyword to a mind map. It can be expressed in the form of multidimensional indexing from one dimension.
  • the mind map storage module 450 may provide a multi-dimensional storage space for storing the relationship information in multiple dimensions, and store the keyword in one or more storage spaces with mapping information based on the relationship information in the multi-dimensional storage space. have.
  • the keyword search module 470 receives relationship information including the specific keyword from the mind map storage module 450, and extracts one or more extended keywords associated with the specific keyword.
  • the device extracts related content associated with the specific keyword and the extended keyword and outputs the extracted content through the output device 200.
  • the keyword search module 470 may visualize the relationship information including the received specific keyword based on the closeness and the frequency of appearance, which will be described in detail with reference to FIG. 5.
  • the expansion keyword is 'home run', 'three O', 'hits' ',' Kookmin batter ',' 400 ', etc., and visualize the relational information in consideration of the closeness and appearance frequency of the expansion keyword and the specific keyword' Lee-O-yeop '.
  • the ranking setting module 490 is a device for setting a ranking between the inputted specific keyword and the related extended keyword and providing related contents to the user according to the ranking.
  • the ranking setting module 490 sets weights based on the closeness and frequency of appearance between the inputted specific keywords and one or more extended keywords, and calculates the ranks of the specific keywords and the extended keywords according to the weights, and calculates the calculated ranks. Based on the output based on the output device 200.
  • the weight is set to the highest value, and the extended keyword having a high degree of closeness with the specific keyword and having a high frequency of appearance has a higher weight to calculate the rank and then a higher value.
  • Related content associated with a keyword with a ranking may be preferentially provided to the user.
  • FIG. 6 is a flowchart illustrating a process of building relationship information in the keyword mind map search system according to the present invention
  • FIG. 7 is a flowchart illustrating a process of searching content in the keyword mind map search system according to the present invention.
  • the mind map retrieval apparatus 400 collects corpus data from the domain corpus 300 (S101) and analyzes the morphemes of the collected corpus data ( S103).
  • the part-of-speech tag is tagged for each of the analyzed morphemes (S105), and after analyzing the syntax based on the part-of-speech tagging, the entity name included in the corpus data is recognized (S107).
  • At least one keyword is extracted based on the recognized entity name.
  • the mind map search apparatus 400 extracts a keyword appearing in excess of a preset frequency and may not extract a keyword below the preset frequency. There is (S109).
  • the closeness is calculated between the extracted one or more keywords.
  • the closeness is the number of corpus data in which two keywords are mentioned, the number of times in which two keywords are mentioned, and the number of couples in which two keywords are mentioned in one corpus data. It can calculate by distance etc. (S111).
  • the relationship between the keywords is defined based on the calculated degree of closeness, and relationship information is generated. Based on the generated relationship information, the degree of closeness between each keyword and the frequency of appearance of each keyword are mapped and stored (S115).
  • the mind map search apparatus 400 may visualize and output relationship information for a specific keyword based on the generated relationship information.
  • the mind map search apparatus 400 may visualize and output the closeness between keywords based on the calculated closeness and frequency of appearance. It may be (S113).
  • FIG. 7 referring to a process of searching content in a keyword mind map search system, when a user inputs a specific keyword through the input apparatus 100 (S201), the mind map search apparatus 400 is stored. Based on the relationship information, one or more extended keywords associated with a specific keyword are extracted (S203), and related content is extracted based on the expanded keyword (S205).
  • the weight is set based on the closeness and the frequency of appearance of the specific keyword and the one or more extended keywords, wherein the weight gives the highest weight to the specific keyword input by the user and the frequency of appearance while being closely related to the specific keyword. More extended keywords may be assigned higher weights.
  • the ranking of the specific keyword and the one or more extended keywords is calculated according to the set weight (S207).
  • At least one of the one or more keywords and the content associated with the keyword is searched based on the calculated keyword ranking and the search result is output to the user (S209).
  • a window for selecting the high-ranking content may be arranged at a position most prominent by the user in order to provide the high-ranking content to the user first or to induce the user to first select the high-ranking content.

Abstract

본 발명은 키워드 마인드맵 검색 방법 및 이를 위한 장치에 관한 것으로서, 더욱 상세하게는 하나 이상의 도메인 코퍼스를 분석하여 하나 이상의 키워드를 추출하고, 추출한 각 키워드 간의 관계정보를 생성하여 저장하고, 저장된 관계정보를 기반으로 사용자가 입력한 특정 키워드와 연관된 확장 키워드 및 연관 컨텐츠를 추출하여 사용자에게 제공함으로써, 비정형 데이터의 확보만으로 특정 분야의 검색 시스템을 구축할 수 있으며, 이러한 검색 시스템을 구축하는데 필요한 구축 비용을 낮추고 양질의 트렌디한 확장 키워드를 제공할 수 있다.

Description

마인드맵 기반 키워드 검색 방법 및 이를 위한 장치
본 발명은 키워드 마인드맵 검색 방법 및 이를 위한 장치에 관한 것으로서, 더욱 상세하게는 대용량의 도메인 텍스트를 자동으로 분석하여 구축한 키워드 마인드 맵을 바탕으로 다양한 컨텐츠를 빠르고 효율적으로 검색하기 위한 방법 및 장치에 관한 것이다.
이 부분에 기술된 내용은 단순히 본 실시 예에 대한 배경 정보를 제공할 뿐 종래기술을 구성하는 것은 아니다.
키워드는 기록의 내용을 표현하기 위해 제목이나 글의 내용에서 추출한 단어나 구절로서 기록을 검색할 때, 접근점으로 쓰이는 단어를 의미하고, 키워드 검색은 브라우저상에 검색 엔진 등이 갖춰져, 상기의 키워드를 입력하여 원하는 정보를 얻어내는 기술을 말한다.
이러한 키워드 검색 방법은 검색 서비스 시스템이 제공하는 가장 일반적인 검색 서비스 방식으로써, 사용자가 상기 검색 서비스 시스템에 키워드를 입력하면 상기 키워드를 포함하는 검색결과를 상기 검색 서비스 시스템이 사용자에게 제공한다.
이러한 검색 서비스를 제공하기 위하여 검색 서비스 제공자는 자동으로 키워드 인덱싱을 실행할 수 있는 키워드 인덱싱 엔진을 구축하여, 키워드 인덱싱을 통해 키워드 검색을 제공하였으나, 이러한 키워드 인덱싱 검색 기술은 키워드 검색의 정확도가 떨어져, 사용자가 검색하고자 하는 컨텐츠가 검색되지 않는 경우가 있었으며, 수동으로 지식베이스를 구축하는 경우에는 지나치게 높은 구축 비용이 필요하여, 서비스를 확장하는데 한계가 있었다.
상술한 문제점을 해결하기 위하여 본 발명은 도메인 코퍼스의 형태소를 분석하고, 개체명을 인식하여, 하나 이상의 키워드를 추출하고, 상기 추출된 키워드 간의 관계 정보를 생성하여 저장하고, 사용자가 특정 키워드를 입력하는 경우, 상기 저장된 관계 정보를 기반으로 특정 키워드와 연관된 확장 키워드 및 연관 컨텐츠를 추출함으로써, 비정형 텍스트 데이터를 기반으로 검색 기술 지식베이스를 구축하여 비용을 낮추고, 관계정보를 기반으로 양질의 트렌디한 확장 키워드를 제공하는 검색 방법 및 장치를 제공하고자 한다.
그러나, 이러한 본 발명의 목적은 상기의 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 명확하게 이해될 수 있을 것이다.
상술한 바와 같은 목적을 달성하기 위한 본 발명에 따른 키워드 마인드맵 검색 방법은 마인드맵 검색 장치가 수집한 하나 이상의 도메인 코퍼스의 형태소를 분석하는 단계, 상기 분석된 형태소에 포함되어 있는 개체명을 인식하는 단계, 상기 개체명 인식 결과를 기반으로 하나 이상의 키워드를 추출하는 단계, 상기 추출된 하나 이상의 키워드 간 밀접도를 산출하는 단계, 상기 산출된 밀접도를 기반으로 상기 하나 이상의 키워드 간의 관계를 정의하여, 관계정보를 생성하는 단계, 상기 생성된 관계정보를 기반으로 각 키워드 간의 밀접도 및 출연빈도수를 매핑하여 저장하는 단계, 사용자가 입력한 특정 키워드를 입력받는 단계, 상기 저장된 관계정보 기반으로 상기 특정 키워드와 연관된 하나 이상의 확장 키워드를 추출하는 단계 및 상기 확장 키워드를 기반으로 하나 이상의 연관 컨텐츠를 추출하여, 출력하는 단계를 포함할 수 있다.
이 때, 상기 확장 키워드를 추출하는 단계는 상기 입력받은 특정 키워드와 상기 하나 이상의 확장 키워드의 밀접도 및 출연빈도수를 기반으로 가중치를 설정하는 단계, 상기 설정한 가중치에 따라 상기 특정 키워드 및 상기 하나 이상의 확장 키워드의 순위를 산출하는 단계 및 상기 산출된 순위를 기반으로 하나 이상의 키워드 및 상기 키워드에 연관된 컨텐츠 중 적어도 하나를 출력하는 단계를 포함할 수 있고, 상기 추출하는 단계는 상기 개체명 인식 단계에서 출연하는 빈도수가 기 설정된 빈도수를 초과하는 키워드를 추출할 수 있다.
또한, 상기 입력받은 특정 키워드가 포함된 관계정보를 상기 밀접도 및 출연빈도수를 기반으로 시각화하는 단계 및 상기 시각화된 관계정보를 출력하는 단계를 더 포함할 수 있고, 상기 개체명을 인식하는 단계 이전에, 상기 분석된 형태소 별 품사를 태깅하는 단계 및 상기 태깅된 품사를 기반으로 상기 도메인 코퍼스 각각의 구문을 분석하는 단계를 더 포함할 수 있다.
상술한 바와 같은 목적을 달성하기 위한 본 발명에 따른 키워드 마인드맵 검색 장치는 하나 이상의 도메인 코퍼스를 수집하여 상기 수집한 도메인 코퍼스 각각의 형태소를 분석하고, 상기 분석된 형태소에 포함되어 있는 개체명을 인식하는 문장 분석모듈, 상기 개체명 인식 결과를 기반으로 하나 이상의 키워드를 추출하여, 상기 추출된 키워드 간의 밀접도를 산출하고, 상기 산출된 밀접도를 기반으로 상기 키워드 간의 관계를 정의하여, 관계정보를 생성하며, 상기 생성된 관계정보를 기반으로 각 키워드 간의 밀접도 및 출연빈도수를 매핑하여 마인드맵 저장모듈에 저장하도록 제어하는 마인드맵 구성 모듈, 상기 마인드맵 구성 모듈이 생성하여 매핑한 상기 관계 정보를 저장하는 마인드맵 저장모듈 및 입력장치로부터 특정 키워드가 전달되면, 상기 저장된 관계정보를 기반으로 상기 특정 키워드와 연관된 하나 이상의 확장 키워드를 추출하고, 상기 확장 키워드를 기반으로 하나 이상의 연관 컨텐츠를 추출하는 키워드 검색 모듈을 포함할 수 있다.
본 발명에 따르면, 하나 이상의 도메인 코퍼스를 분석하여 하나 이상의 키워드를 추출하고, 추출한 각 키워드 간의 관계정보를 생성하여 저장하고, 저장된 관계정보를 기반으로 사용자가 입력한 특정 키워드와 연관된 확장 키워드 및 연관 컨텐츠를 추출하여 사용자에게 제공함으로써, 비정형 데이터의 확보만으로 특정 분야의 검색 시스템을 구축할 수 있으며, 이러한 검색 시스템을 구축하는데 필요한 구축 비용을 낮추고 양질의 트렌디한 확장 키워드를 제공할 수 있다.
아울러, 상술한 효과 이외의 다양한 효과들이 후술될 본 발명의 실시 예에 따른 상세한 설명에서 직접적 또는 암시적으로 개시될 수 있다.
도1은 본 발명의 실시 예에 따른 키워드 마인드맵 검색 시스템의 구성을 나타내는 도면이다.
도2는 본 발명에 따른 마인드맵 검색 장치의 구성을 나타내는 블록도이다.
도3 내지 도5는 본 발명에 따른 마인드맵 구축 과정의 실시 예를 설명하기 위한 예시도 이다.
도6은 본 발명의 실시 예에 따른 키워드 마인드맵 구축과정을 설명하기 위한 흐름도이다.
도7은 본 발명의 실시 예에 따른 키워드 마인드맵을 통해 키워드 검색과정을 설명하기 위한 흐름도이다.
본 발명의 과제 해결 수단의 특징 및 이점을 보다 명확히 하기 위하여, 첨부된 도면에 도시된 본 발명의 특정 실시 예를 참조하여 본 발명을 더 상세하게 설명한다.
다만, 하기의 설명 및 첨부된 도면에서 본 발명의 요지를 흐릴 수 있는 공지 기능 또는 구성에 대한 상세한 설명은 생략한다. 또한, 도면 전체에 걸쳐 동일한 구성 요소들은 가능한 한 동일한 도면 부호로 나타내고 있음에 유의하여야 한다.
이하의 설명 및 도면에서 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니 되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위한 용어의 개념으로 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다.
따라서 본 명세서에 기재된 실시 예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시 예에 불과할 뿐이고, 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형 예들이 있을 수 있음을 이해하여야 한다.
또한, 제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하기 위해 사용하는 것으로, 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용될 뿐, 상기 구성요소들을 한정하기 위해 사용되지 않는다.
예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제2 구성요소는 제1 구성요소로 명명될 수 있고, 유사하게 제1 구성요소도 제2 구성요소로 명명될 수 있다.
또한, 본 명세서에서 사용한 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 또한, 본 명세서에서 기술되는 "포함 한다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
또한, 명세서에 기재된 "부", "기", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.
또한, "일(a 또는 an)", "하나(one)", "그(the)" 및 유사 관련어는 본 발명을 기술하는 문맥에 있어서(특히, 이하의 청구항의 문맥에서) 본 명세서에 달리 지시되거나 문맥에 의해 분명하게 반박되지 않는 한, 단수 및 복수 모두를 포함하는 의미로 사용될 수 있다.
상술한 용어들 이외에, 이하의 설명에서 사용되는 특정 용어들은 본 발명의 이해를 돕기 위해서 제공된 것이며, 이러한 특정 용어의 사용은 본 발명의 기술적 사상을 벗어나지 않는 범위에서 다른 형태로 변경될 수 있다.
아울러, 본 발명의 범위 내의 실시 예들은 컴퓨터 실행가능 명령어 또는 컴퓨터 판독가능 매체에 저장된 데이터 구조를 가지거나 전달하는 컴퓨터 판독가능 매체를 포함한다.
이러한 컴퓨터 판독가능 매체는, 범용 또는 특수 목적의 컴퓨터 시스템에 의해 액세스 가능한 임의의 이용 가능한 매체일 수 있다. 예로서, 이러한 컴퓨터 판독가능 매체는 RAM, ROM, EPROM, CD-ROM 또는 기타 광 디스크 저장장치, 자기 디스크 저장장치 또는 기타 자기 저장장치, 또는 컴퓨터 실행가능 명령어, 컴퓨터 판독가능 명령어 또는 데이터 구조의 형태로 된 소정의 프로그램 코드 수단을 저장하거나 전달하는 데에 이용될 수 있고, 범용 또는 특수 목적 컴퓨터 시스템에 의해 액세스 될 수 있는 임의의 기타 매체와 같은 물리적 저장 매체를 포함할 수 있지만, 이에 한정되지 않는다.
아울러, 본 발명은 퍼스널 컴퓨터, 랩탑 컴퓨터, 핸드헬드 장치, 멀티프로세서 시스템, 마이크로프로세서-기반 또는 프로그램 가능한 가전제품(programmable consumer electronics), 네트워크 PC, 미니컴퓨터, 메인프레임 컴퓨터, 모바일 전화, PDA, 페이저(pager) 등을 포함하는 다양한 유형의 컴퓨터 시스템 구성을 가지는 네트워크 컴퓨팅 환경에서 실시될 수 있다.
본 발명은 또한 네트워크를 통해 유선 데이터 링크, 무선 데이터 링크, 또는 유선 및 무선 데이터 링크의 조합으로 링크된 로컬 및 원격 컴퓨터 시스템 모두가 태스크를 수행하는 분산형 시스템 환경에서 실행될 수 있다. 분산형 시스템 환경에서, 프로그램 모듈은 로컬 및 원격 메모리 저장 장치에 위치될 수 있다.
그러면 이제, 본 발명의 실시 예에 따른 키워드 마인드맵 검색 시스템에서의 키워드 검색을 위한 장치에 대하여 도면을 참조하여 상세하게 설명하도록 한다.
도1은 본 발명의 실시 예에 따른 키워드 마인드맵 검색 시스템의 구조를 개략적으로 설명하기 위한 도면이다.
도1을 참조하면, 본 발명의 실시 예에 따른 키워드 마인드맵 검색 시스템은 입력장치(100), 출력장치(200), 도메인코퍼스(300) 및 마인드맵 검색 장치(400)를 포함하여 구성될 수 있다.
그러면 도1을 참조하여 각 구성요소에 대해 개략적으로 설명하도록 한다.
입력장치(100)는 사용자의 터치 또는 조작에 따른 입력 신호를 발생하는 키패드와 터치패드 중 적어도 하나를 포함하여 구성될 수 있다. 이때, 입력 장치(100)은 출력장치(200)와 함께 하나의 터치패널(또는 터치스크린(touch screen))의 형태로 구성되어 입력과 표시 기능을 동시에 수행할 수 있다. 또한, 입력장치(100)은 키보드, 키패드, 마우스, 조이스틱 등과 같은 입력 장치 외에도 향후 개발될 수 있는 모든 형태의 입력 수단이 사용될 수 있다.
특히, 본 발명에 따른 입력장치(100)는 사용자가 검색하고자 하는 컨텐츠에 관련한 키워드를 입력받아 마인드맵 검색장치(400)에 전달한다.
상기 입력장치(100)로부터 키워드를 전달받은 마인드맵 검색장치(400)는 상기 전달받은 키워드 및 상기 키워드를 기반으로 확장시킨 확장 키워드와 연관된 연관 컨텐츠를 추출하여 사용자에게 제공할 수 있다.
출력장치(200)는 마인드맵 검색 장치(400)의 기능 수행 중에 발생하는 일련의 동작상태 및 동작결과 등에 대한 정보를 표시한다.
여기서, 출력장치(200)는 액정표시장치(LCD, Liquid Crystal Display), 초박막 액정표시장치(TFT-LCD, Thin Film Transistor LCD), 발광다이오드(LED, Light Emitting Diode), 유기 발광다이오드(OLED, Organic LED), 능동형 유기발광다이오드(AMOLED, Active Matrix OLED), 레티나 디스플레이(Retina Display), 플렉시블 디스플레이(Flexible display) 및 3차원(3 Dimension) 디스플레이 등으로 구성될 수 있다.
이때, 출력장치(200)이 터치스크린(Touch screen) 형태로 구성된 경우, 출력장치(200)은 입력장치(100)의 기능 중 일부 또는 전부를 수행할 수 있다.
특히, 본 발명에서 출력장치(200)는 마인드맵 검색 장치(400)가 입력장치(100)로부터 전달받은 키워드를 기반으로 검색한 검색 결과를 전달받아 출력할 수 있다.
이 때, 상기 검색 결과는 입력받은 특정 키워드 및 이와 관련된 확장 키워드와 연관된 연관 컨텐츠일 수 있는데, 이러한 연관 컨텐츠는 텍스트, 영상, 그림, URL(Uniform Resource Locator) 주소 등 다양한 형태로 출력장치(200)를 통해 사용자에게 제공될 수 있다.
도메인 코퍼스(300)는 구조를 이루고 있는 도메인 텍스트의 집합으로서, 예를 들면, 포털 검색 사이트 등의 도메인에서 제공하는 뉴스 기사 등과 같은 텍스트 컨텐츠의 집합이 될 수 있다.
이러한 도메인 코퍼스(300)는 마인드맵 검색 장치(400)가 키워드를 추출하여 추출한 키워드 간의 관계정보를 구축하기 위한 하나의 자료가 된다.
마인드맵 검색 장치(400)는 도메인 코퍼스(300)로부터 전달받은 텍스트로 이루어진 도메인 코퍼스를 분석하여, 키워드를 추출하고, 상기 키워드를 기반으로 관계 정보를 생성하는 장치이다.
구체적으로 살펴보면, 마인드맵 검색 장치(400)는 도메인 코퍼스(300)로부터 하나 이상의 도메인코퍼스를 수집하여, 수집한 도메인 코퍼스의 형태소를 분석하고, 분석된 형태소 별 품사를 태깅하여 도메인 코퍼스 각각의 구문을 분석한다.
그리고, 상기 분석된 결과를 바탕으로 상기 도메인코퍼스에 포함되어 있는 개체명을 인식하고, 상기 인식된 개체명에 따라 하나 이상의 키워드를 추출한다.
이 때, 상기 추출되는 키워드는 일정 이상의 빈도수를 초과하는 빈도수를 가지는 키워드만을 선별하여 추출할 수 있는데, 즉, 특정 키워드가 하나 이상의 도메인 코퍼스에서 기 설정된 빈도수 이상의 횟수로 나타난다면, 상기 특정 키워드를 추출하고, 기 설정된 빈도수 미만으로 나타나는 키워드는 추출하지 않는다.
하나 이상의 키워드를 추출하면, 추출된 하나 이상의 키워드 간의 밀접도를 산출하게 되는데, 여기서, 밀접도란, 각 키워드가 얼마나 많은 연관성을 가지고 있느냐를 나타내는 수치이다.
이러한 밀접도는 두 개의 키워드가 같이 언급된 도메인 코퍼스의 수와 하나의 도메인 코퍼스에 두 개의 키워드가 언급되어 있는 수, 하나의 도메인 코퍼스 안에서 두 개의 키워드가 떨어져 있는 거리 등으로 상기 밀접도를 측정할 수 있다.
밀접도가 클수록, 상기 키워드 간의 연관성이 많은 것으로 보고, 관계정보에서 두 키워드 간의 관계를 상위 관계로 설정할 수 있다.
즉, 산출된 밀접도를 기반으로 하나 이상의 키워드 간의 관계를 정의하고, 관계 정보를 생성하며, 이렇게 생성된 관계정보를 기반으로 각 키워드 간의 밀접도 및 각 키워드의 출연빈도수를 매핑하여 저장하게 된다.
상기와 같은 방법으로 관계정보를 구축한 마인드맵 검색 장치(400)는 입력장치(100)로부터 특정 키워드를 입력받게 되고, 상기 저장된 관계정보를 기반으로 상기 특정 키워드와 연관된 하나 이상의 확장 키워드를 추출하고, 상기 확장 키워드를 기반으로 하나 이상의 연관 컨텐츠를 추출하여 출력장치(200)를 통해 출력할 수 있다.
이 때, 특정 키워드와 하나 이상의 확장 키워드의 밀접도 및 출연빈도수를 기반으로 가중치를 설정하고, 설정한 가중치에 따라 특정 키워드와 확장 키워드 간의 순위를 산출하여, 상기 순위를 기반으로 연관 컨텐츠를 출력할 수 있다.
즉, 특정 키워드와 연관성이 높은 확장 키워드일수록 높은 순위를 가지도록 설정하여, 특정 키워드와 하나 이상의 확장 키워드 간의 순위를 산정하고, 산정된 결과에 따라 높은 순위의 키워드와 관련한 연관 컨텐츠부터 사용자에게 제공하도록 함으로써, 양질의 컨텐츠 제공이 가능한 것이다.
또한, 특정 키워드의 관계 정보를 활용하여, 특정 키워드와 하나 이상의 확장 키워드 간의 밀접도 및 출연빈도수를 기반으로 상기의 특정 키워드와 하나 이상의 확장 키워드 간의 관계정보를 시각화하고, 상기 시각화된 관계 정보를 출력할 수도 있다.
이러한, 실시 예에 대해서는 도4를 참조하여 후술하도록 한다.
이상으로 본 발명의 실시 예에 따른 키워드 마인드맵 검색 시스템 구조에 대해 개략적으로 설명하였다.
이하, 상기 시스템의 구성 중, 본 발명에 따른 마인드맵 검색 장치(400)의 구성에 대해 설명하도록 한다.
도2는 마인드맵 검색 장치(400)의 주요 구성을 도시하는 블록도이고, 도3 내지 도5는 본 발명에 따른 마인드맵 검색 장치(400)가 관계정보를 구축하고, 키워드를 검색하는 실시 예를 설명하기 위한 도면이다.
먼저 도2를 참조하면, 본 발명에 따른 마인드맵 검색 장치(400)는 문장 분석모듈(410), 마인드맵 구성모듈(430), 마인드맵 저장모듈(450), 키워드 검색모듈(470) 및 순위설정 모듈(490)을 포함하여 구성될 수 있다.
문장 분석모듈(410)은 수집한 하나 이상의 도메인 코퍼스의 텍스트를 분석하는 장치로서, 도메인 코퍼스(300)로부터 하나 이상의 도메인 코퍼스를 수집하여, 도메인코퍼스 각각의 형태소를 분석하고, 형태소 별 품사를 태깅하여, 태깅된 품사를 기반으로 도메인 코퍼스 각각의 구문을 분석한다.
그리고 상기 분석된 구문을 바탕으로 도메인 코퍼스에 포함되어 있는 개체명을 인식하고, 개체명을 인식하면, 인식한 개체명을 마인드맵 구성 모듈(430)로 전달한다.
이 때, 개체명이란, 개체 또는 단독개념(한정된 속성으로 단독의 사물을 나타내는 개념)을 나타낸 단어로, 명사, 인명, 지명 등을 포함할 수 있다.
마인드맵 구성모듈(430)은 상기 문장분석 모듈(410)로부터 입력받은 개체명을 기반으로 하나 이상의 키워드를 추출하는데, 이 때, 마인드맵 구성모듈(430)은 출연하는 빈도수가 일정 이상을 초과하는 개체명을 키워드로써 추출할 수 있다.
즉, 하나 이상의 도메인 코퍼스에 기 설정된 빈도수를 초과하여 언급되는 키워드만을 추출하고, 기 설정된 빈도수 이하의 키워드는 추출하지 않을 수 있다.
이에 대해, 도3을 참조하여 설명하면, 도 3은 2015년 7월에 생성된 도메인 코퍼스에서 추출된 키워드를 나타낸 것으로서, '타자'라는 개체명이 1123번 문장문석모듈(410)에 의해 인식되어 '타자'라는 단어를 키워드로 추출하였고, 상기 키워드의 타입을 '야구용어'로 지정한 것이다.
마찬가지로, '홈런'이라는 개체명이 문장분석모듈(410)에 의해 943번 인식되어 키워드로 추출하였고, 상기 키워드의 타입은 '야구용어'이다.
한편, 도3의 경우에는 빈도수를 설정하지 않거나, 빈도수가 700이하인 경우를 나타낸 것이고, 만약 기 설정된 빈도수가 1000이라면, '타자' 이외의 '홈’', '한O', '양OO' 등은 키워드로써 추출되지 않을 것이다.
하나 이상의 키워드를 추출한 마인드맵 구성모듈(430)은 상기 키워드 간의 밀접도를 산출하게 되는데, 밀접도는 두 개의 키워드 간의 연관성이 얼마나 큰지를 측정한 척도로서, 두 개의 키워드가 함께 언급된 도메인 코퍼스의 수, 하나의 도메인 코퍼스에서 두 개의 키워드가 함께 언급된 수, 하나의 도메인 코퍼스 안에서 두 개의 키워드 간의 거리 등을 통해 산출할 수 있다.
그리고 상기 산출된 밀접도를 기반으로 키워드 간의 관계를 정의하고, 이를 관계정보로 생성하여, 마인드맵 저장모듈(450)에 저장한다.
이 때, 마인드맵 구성 모듈(430)은 생성된 관계정보를 기반으로 각 키워드 간의 밀접도 및 각 키워드의 출연빈도수를 매핑하여 마인드맵 저장모듈(450)에 저장할 수 있다.
마인드맵 저장모듈(450)은 상기 마인드맵 구성 모듈(430)이 생성하여 매핑한 상기 관계 정보를 저장하는 장치이다.
상기 마인드맵 저장모듈(450)은 마인드맵 구성 모듈(430)이 생성한 관계 정보를 저장하고 있다가, 키워드 검색 모듈(470)의 요청이 있는 경우, 상기 관계 정보를 키워드 검색모듈(470)로 출력한다.
상기 마인드맵 저장모듈(450)에 관계 정보가 저장되는 형태에 관한 실시 예는 도4를 통하여 설명할 수 있는데, 도4를 살펴보면, 마인드맵에 각 키워드와 연관된 컨텐츠를 매핑하여 고속 검색을 지원하기 위하여 1차원부터 다차원 인덱싱 형태로 표현될 수 있다.
즉, 마인드맵 저장모듈(450)은 관계정보를 다차원적으로 저장할 수 있도록 다차원 저장공간을 마련하고, 상기 다차원 저장공간에 키워드를 관계정보에 기반하여 하나 이상의 저장공간에 매핑정보와 함께 저장될 수 있다.
키워드 검색 모듈(470)은 입력장치(100)로부터 특정 키워드가 전달되면, 마인드맵 저장모듈(450)로부터 상기 특정 키워드가 포함된 관계정보를 입력받아, 상기 특정 키워드와 연관된 하나 이상의 확장 키워드를 추출하고, 상기 특정 키워드 및 확장 키워드와 연관된 연관 컨텐츠를 추출하여 출력장치(200)를 통해 출력하는 장치이다.
이러한 키워드 검색 모듈(470)은 입력받은 특정 키워드가 포함된 관계 정보를 상기 밀접도 및 출연빈도수를 기반으로 시각화할 수 있는데, 이에 대하여 도5를 참조하여 자세히 살펴본다.
도5를 보면, 도메인 코퍼스로부터 키워드로 추출된 '이O엽'에 대한 관계정보를 시각화하여 나타난 것인데, '이O엽'의 관계 정보로부터 확장키워드가 '홈런', '삼O', '안타', '국민타자', '400호' 등으로 추출되었고, 이러한 확장 키워드와 특정 키워드인 '이O엽'의 밀접도 및 출연빈도수를 고려하여, 관계정보를 시각화하는데, 즉, 밀접도 측면에서는 '이O엽'과 밀접한 확장 키워드 일수록 '이O엽'과 가까이 위치하도록 시각화 하고, 출연빈도수가 클수록 각 확장키워드가 들어간 동그라미를 크게 그려 시각화할 수 있다.
즉, 출연빈도수를 따지면, '400호'-'삼O'-'국민타자'-'홈런'-'안타' 순이 되는 것이다.
순위 설정 모듈(490)은 입력된 특정 키워드와 이와 관련된 확장 키워드 간의 순위를 설정하고, 상기 순위에 따라 연관 컨텐츠를 사용자에게 제공하기 위한 장치이다.
이러한 순위 설정 모듈(490)은 입력받은 특정 키워드와 하나 이상의 확장 키워드 간의 밀접도 및 출연빈도수를 기반으로 가중치를 설정하고, 상기 가중치에 따라 특정 키워드 및 확장 키워드의 순위를 산출하여, 산출된 순위를 기반으로 연관된 컨텐츠를 출력장치(200)를 통해 출력한다.
예를 들어, 특정 키워드의 경우, 사용자가 직접 입력한 키워드이므로, 가중치를 가장 높게 설정하고, 상기 특정 키워드와 밀접도가 크고, 출연빈도수가 많은 확장 키워드일수록 가중치를 높게 설정하여 순위를 산출하고, 높은 순위를 가진 키워드와 연관된 연관 컨텐츠를 우선적으로 사용자에게 제공할 수 있다.
이상, 상기 시스템의 구성 중, 본 발명에 따른 마인드맵 검색 장치(400)의 구성에 대해 설명하였다.
이하, 본 발명에 따른 키워드 마인드맵 검색 시스템의 동작 과정에 대해서 설명하도록 한다.
도6은 본 발명에 따른 키워드 마인드맵 검색 시스템에서 관계정보를 구축하는 과정을 설명하기 위한 흐름도이고, 도7은 본 발명에 따른 키워드 마인드맵 검색 시스템에서 컨텐츠를 검색하는 과정을 설명하기 위한 흐름도이다.
우선, 도6을 참조하여, 관계정보를 구축하는 과정을 살펴보면, 마인드맵 검색 장치(400)가 도메인코퍼스(300)로부터 코퍼스 데이터를 수집하고(S101), 수집한 코퍼스 데이터의 형태소를 분석한다(S103).
그리고 상기 분석된 형태소 별로 품사를 태깅하고(S105), 품사 태깅을 바탕으로 구문을 분석한 후, 상기 코퍼스 데이터에 포함되어 있는 개체명을 인식한다(S107).
상기 인식된 개체명을 바탕으로 하나 이상의 키워드를 추출하는데, 이 때, 마인드맵 검색 장치(400)는 기 설정된 빈도수를 초과하여 등장하는 키워드를 추출하고, 기 설정된 빈도수 이하의 키워드는 추출하지 않을 수 있다(S109).
그리고 상기 추출된 하나 이상의 키워드 간의 밀접도를 산출하게 되는데, 이러한 밀접도는 두 개의 키워드가 언급된 코퍼스 데이터의 개수 및 두 개의 키워드가 언급된 횟수, 하나의 코퍼스 데이터 내에서 두 개의 키워드가 언급된 부부 간의 거리 등으로 산출할 수 있다(S111).
이렇게 산출된 밀접도를 기반으로 키워드 간의 관계를 정의하여 관계정보를 생성하고, 상기 생성된 관계 정보를 기반으로 각 키워드 간의 밀접도, 각 키워드의 출연빈도수를 매핑하여 저장하게 된다(S115).
한편, 마인드맵 검색 장치(400)는 상기 생성된 관계정보를 기반으로 특정 키워드에 대한 관계정보를 시각화하여 출력할 수 있는데, 상기 산출된 밀접도 및 출연빈도수를 기반으로 키워드 간 밀접도를 시각화하여 출력할 수 있다(S113).
이러한 실시 예에 대하여는 앞서 도5를 참조하여 설명하였다.
이제, 도7을 참조하여, 키워드 마인드맵 검색 시스템에서의 컨텐츠를 검색하는 과정을 살펴보면, 사용자가 입력장치(100)를 통해 특정 키워드를 입력하면(S201), 마인드맵 검색 장치(400)는 저장된 관계정보를 기반으로 특정 키워드와 연관된 하나 이상의 확장 키워드를 추출하고(S203), 확장된 키워드를 기반으로 연관 컨텐츠를 추출한다(S205).
그리고 입력받은 특정 키워드와 상기 하나 이상의 확장 키워드의 밀접도 및 출연빈도수를 기반으로 가중치를 설정하는데, 여기서 가중치는 사용자가 입력한 특정 키워드에 가장 높은 가중치를 부여하고, 특정 키워드와 밀접도가 높으면서 출연빈도수가 많은 확장 키워드일수록 높은 가중치를 부여할 수 있다.
그리고 이렇게 설정한 가중치에 따라 특정 키워드 및 하나 이상의 확장 키워드의 순위를 산출한다(S207).
그 후, 산출된 키워드 순위를 기준으로 하나 이상의 키워드 및 상기 키워드에 연관된 컨텐츠 중 적어도 하나를 검색하여 그 검색결과를 사용자에게 출력한다(S209).
즉, 순위가 높은 컨텐츠를 우선적으로 사용자에게 제공하거나, 사용자가 우선 선택하도록 유도하기 위해 사용자의 눈에 가장 잘 띄는 위치에 상기 높은 순위의 컨텐츠를 선택하는 창을 배치할 수 있다.
이상, 본 발명에 따른 키워드 마인드맵 검색 시스템의 동작 과정에 대해서 설명하였다.
이상에서 설명한 바와 같이, 본 명세서는 다수의 특정한 구현물의 세부사항들을 포함하지만, 이들은 어떠한 발명이나 청구 가능한 것의 범위에 대해서도 제한적인 것으로서 이해되어서는 안되며, 오히려 특정한 발명의 특정한 실시형태에 특유할 수 있는 특징들에 대한 설명으로서 이해되어야 한다.
개별적인 실시형태의 문맥에서 본 명세서에 기술된 특정한 특징들은 단일 실시형태에서 조합하여 구현될 수도 있다.
반대로, 단일 실시형태의 문맥에서 기술한 다양한 특징들 역시 개별적으로 혹은 어떠한 적절한 하위 조합으로도 복수의 실시형태에서 구현 가능하다. 나아가, 특징들이 특정한 조합으로 동작하고 초기에 그와 같이 청구된 바와 같이 묘사될 수 있지만, 청구된 조합으로부터의 하나 이상의 특징들은 일부 경우에 그 조합으로부터 배제될 수 있으며, 그 청구된 조합은 하위 조합이나 하위 조합의 변형물로 변경될 수 있다.
마찬가지로, 특정한 순서로 도면에서 동작들을 묘사하고 있지만, 이는 바람직한 결과를 얻기 위하여 도시된 그 특정한 순서나 순차적인 순서대로 그러한 동작들을 수행하여야 한다거나 모든 도시된 동작들이 수행되어야 하는 것으로 이해되어서는 안 된다.
특정한 경우, 멀티태스킹과 병렬 프로세싱이 유리할 수 있다. 또한, 상술한 실시형태의 다양한 시스템 컴포넌트의 분리는 그러한 분리를 모든 실시형태에서 요구하는 것으로 이해되어서는 안되며, 설명한 프로그램 컴포넌트와 시스템들은 일반적으로 단일의 소프트웨어 제품으로 함께 통합되거나 다중 소프트웨어 제품에 패키징될 수 있다는 점을 이해하여야 한다.
본 명세서에서 설명한 주제의 특정한 실시형태를 설명하였다. 기타의 실시형태들은 이하의 청구항의 범위 내에 속한다. 예컨대, 청구항에서 인용된 동작들은 상이한 순서로 수행되면서도 여전히 바람직한 결과를 성취할 수 있다. 일 예로서, 첨부도면에 도시한 프로세스는 바람직한 결과를 얻기 위하여 반드시 그 특정한 도시된 순서나 순차적인 순서를 요구하지 않는다. 특정한 구현 예에서, 멀티태스킹과 병렬 프로세싱이 유리할 수 있다.
본 기술한 설명은 본 발명의 최상의 모드를 제시하고 있으며, 본 발명을 설명하기 위하여, 그리고 통상의 기술자가 본 발명을 제작 및 이용할 수 있도록 하기 위한 예를 제공하고 있다. 이렇게 작성된 명세서는 그 제시된 구체적인 용어에 본 발명을 제한하는 것이 아니다. 따라서, 상술한 예를 참조하여 본 발명을 상세하게 설명하였지만, 통상의 기술자라면 본 발명의 범위를 벗어나지 않으면서도 본 예들에 대한 개조, 변경 및 변형을 가할 수 있다.
따라서 본 발명의 범위는 설명된 실시 예에 의하여 정할 것이 아니고 특허청구범위에 의해 정하여져야 한다.

Claims (6)

  1. 마인드맵 검색 장치가 수집한 하나 이상의 도메인 코퍼스의 형태소를 분석하는 단계;
    상기 분석된 형태소에 포함되어 있는 개체명을 인식하는 단계;
    상기 개체명 인식 결과를 기반으로 하나 이상의 키워드를 추출하는 단계;
    상기 추출된 하나 이상의 키워드 간 밀접도를 산출하는 단계;
    상기 산출된 밀접도를 기반으로 상기 하나 이상의 키워드 간의 관계를 정의하여, 관계정보를 생성하는 단계;
    상기 생성된 관계정보를 기반으로 각 키워드 간의 밀접도 및 출연빈도수를 매핑하여 저장하는 단계;
    사용자가 입력한 특정 키워드를 입력받는 단계;
    상기 저장된 관계정보 기반으로 상기 특정 키워드와 연관된 하나 이상의 확장 키워드를 추출하는 단계; 및
    상기 확장 키워드를 기반으로 하나 이상의 연관 컨텐츠를 추출하여, 출력하는 단계;
    를 포함하는 키워드 마인드맵 검색 방법.
  2. 제1항에 있어서, 상기 확장 키워드를 추출하는 단계는
    상기 입력받은 특정 키워드와 상기 하나 이상의 확장 키워드의 밀접도 및 출연빈도수를 기반으로 가중치를 설정하는 단계;
    상기 설정한 가중치에 따라 상기 특정 키워드 및 상기 하나 이상의 확장 키워드의 순위를 산출하는 단계; 및
    상기 산출된 순위를 기반으로 하나 이상의 키워드 및 상기 키워드에 연관된 컨텐츠 중 적어도 하나를 출력하는 단계;
    를 포함하는 것을 특징으로 하는 키워드 마인드맵 검색 방법.
  3. 제1항에 있어서, 상기 추출하는 단계는
    상기 개체명 인식 단계에서 출연하는 빈도수가 기 설정된 빈도수를 초과하는 키워드를 추출하는 것을 특징으로 하는 키워드 마인드맵 검색 방법.
  4. 제1항에 있어서,
    상기 입력받은 특정 키워드가 포함된 관계정보를 상기 밀접도 및 출연빈도수를 기반으로 시각화하는 단계; 및
    상기 시각화된 관계정보를 출력하는 단계;
    를 더 포함하는 것을 특징으로 하는 키워드 마인드맵 검색 방법.
  5. 제1항에 있어서, 상기 개체명을 인식하는 단계 이전에,
    상기 분석된 형태소 별 품사를 태깅하는 단계; 및
    상기 태깅된 품사를 기반으로 상기 도메인 코퍼스 각각의 구문을 분석하는 단계;
    를 더 포함하는 것을 특징으로 하는 키워드 마인드맵 검색방법.
  6. 하나 이상의 도메인 코퍼스를 수집하여 상기 수집한 도메인 코퍼스 각각의 형태소를 분석하고, 상기 분석된 형태소에 포함되어 있는 개체명을 인식하는 문장 분석모듈;
    상기 개체명 인식 결과를 기반으로 하나 이상의 키워드를 추출하여, 상기 추출된 키워드 간의 밀접도를 산출하고, 상기 산출된 밀접도를 기반으로 상기 키워드 간의 관계를 정의하여, 관계정보를 생성하며, 상기 생성된 관계정보를 기반으로 각 키워드 간의 밀접도 및 출연빈도수를 매핑하여 마인드맵 저장모듈에 저장하도록 제어하는 마인드맵 구성 모듈;
    상기 마인드맵 구성 모듈이 생성하여 매핑한 상기 관계 정보를 저장하는 마인드맵 저장모듈; 및
    입력장치로부터 특정 키워드가 전달되면, 상기 저장된 관계정보를 기반으로 상기 특정 키워드와 연관된 하나 이상의 확장 키워드를 추출하고, 상기 확장 키워드를 기반으로 하나 이상의 연관 컨텐츠를 추출하는 키워드 검색 모듈;
    을 포함하는 마인드맵 검색 장치.
PCT/KR2016/014249 2015-12-08 2016-12-06 마인드맵 기반 키워드 검색 방법 및 이를 위한 장치 WO2017099454A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020150173784A KR20170067918A (ko) 2015-12-08 2015-12-08 마인드맵 기반 키워드 검색 방법 및 이를 위한 장치
KR10-2015-0173784 2015-12-08

Publications (1)

Publication Number Publication Date
WO2017099454A1 true WO2017099454A1 (ko) 2017-06-15

Family

ID=59014395

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2016/014249 WO2017099454A1 (ko) 2015-12-08 2016-12-06 마인드맵 기반 키워드 검색 방법 및 이를 위한 장치

Country Status (2)

Country Link
KR (1) KR20170067918A (ko)
WO (1) WO2017099454A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019196209A1 (zh) * 2018-04-08 2019-10-17 平安科技(深圳)有限公司 事件信息分析方法、可读存储介质、终端设备及装置
CN113488180A (zh) * 2021-07-28 2021-10-08 中国医学科学院医学信息研究所 一种临床指南知识建模方法及系统

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101934240B1 (ko) * 2018-08-13 2019-04-05 주식회사 아발론교육 키워드를 표시하는 방법 및 그 장치
KR102345818B1 (ko) * 2021-06-23 2021-12-31 주식회사 아티피셜 소사이어티 텍스트 데이터로부터 타겟팅 된 품사의 단어를 통해 사고구조 마인드맵을 생성하는 방법 및 시스템

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100729184B1 (ko) * 2005-07-25 2007-06-19 주식회사 엠파스 연상 키워드를 이용한 관계 정보 검색 방법 및 장치
KR20080080989A (ko) * 2005-12-15 2008-09-05 마이크로소프트 코포레이션 광고 키워드 교차-판매를 용이하게 하는 시스템 및 방법
KR101001834B1 (ko) * 2008-08-28 2010-12-15 엔에이치엔비즈니스플랫폼 주식회사 확장 키워드 풀을 사용한 검색 방법 및 시스템
US20130006958A1 (en) * 2005-10-31 2013-01-03 Lycos, Inc., a Delaware corporation Automatic Identification of Related Search Keywords
KR20130033693A (ko) * 2011-09-27 2013-04-04 엔에이치엔비즈니스플랫폼 주식회사 컨셉 키워드 확장 데이터 셋을 이용한 검색방법, 장치 및 컴퓨터로 판독 가능한 기록매체

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100729184B1 (ko) * 2005-07-25 2007-06-19 주식회사 엠파스 연상 키워드를 이용한 관계 정보 검색 방법 및 장치
US20130006958A1 (en) * 2005-10-31 2013-01-03 Lycos, Inc., a Delaware corporation Automatic Identification of Related Search Keywords
KR20080080989A (ko) * 2005-12-15 2008-09-05 마이크로소프트 코포레이션 광고 키워드 교차-판매를 용이하게 하는 시스템 및 방법
KR101001834B1 (ko) * 2008-08-28 2010-12-15 엔에이치엔비즈니스플랫폼 주식회사 확장 키워드 풀을 사용한 검색 방법 및 시스템
KR20130033693A (ko) * 2011-09-27 2013-04-04 엔에이치엔비즈니스플랫폼 주식회사 컨셉 키워드 확장 데이터 셋을 이용한 검색방법, 장치 및 컴퓨터로 판독 가능한 기록매체

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019196209A1 (zh) * 2018-04-08 2019-10-17 平安科技(深圳)有限公司 事件信息分析方法、可读存储介质、终端设备及装置
CN113488180A (zh) * 2021-07-28 2021-10-08 中国医学科学院医学信息研究所 一种临床指南知识建模方法及系统
CN113488180B (zh) * 2021-07-28 2023-07-18 中国医学科学院医学信息研究所 一种临床指南知识建模方法及系统

Also Published As

Publication number Publication date
KR20170067918A (ko) 2017-06-19

Similar Documents

Publication Publication Date Title
WO2017099454A1 (ko) 마인드맵 기반 키워드 검색 방법 및 이를 위한 장치
JP7232831B2 (ja) 複雑な回答の補強証拠取り出し
WO2018074716A1 (ko) 검색 컨텍스트를 이용한 질의 추천 방법 및 시스템
WO2010120101A2 (ko) 역 벡터 공간 모델을 이용한 키워드 추천방법 및 그 장치
WO2012070840A2 (ko) 컨센서스 검색 장치 및 방법
WO2014035061A1 (en) Display device and speech search method
RU2642413C2 (ru) Способ (варианты) и сервер обработки текста
KR20100068532A (ko) 문서 데이터의 키워드 추출 및 연관어 네트워크 구성 장치 및 방법
WO2016121048A1 (ja) 文章生成装置及び方法
WO2017115994A1 (ko) 인공 지능 기반 연관도 계산을 이용한 노트 제공 방법 및 장치
WO2017026874A1 (ko) 의사 소통 보조 디바이스 및 의사 소통 보조 방법
Sharma et al. StudieMe: college recommendation system
Eisenberg et al. Using association metrics to help users navigate API documentation
WO2017057858A1 (ko) 가중치에 의한 다수 분야별 검색 기능을 구비한 지식관리 시스템
WO2022164691A1 (en) Content based related view recommendations
WO2018090535A1 (zh) 累加检索处理方法和装置、终端和存储介质
KR100757951B1 (ko) 웹페이지의 형태소 분석을 통한 검색 방법
WO2014148664A1 (ko) 단어의 의미를 기반으로 하는 다국어 검색 시스템, 다국어 검색 방법 및 이를 이용한 이미지 검색 시스템
US9679066B2 (en) Search results based on an environment context
WO2020111662A1 (ko) 북마크관리 및 정보검색 서비스 제공시스템 및 이를 이용한 북마크관리 및 정보검색 서비스 제공방법
Huang et al. Pandasearch: A fine-grained academic search engine for research documents
WO2015053472A1 (ko) 과거 검색어를 이용한 추천문장 제공시스템 및 제공방법
WO2010093101A1 (ko) 블로그 포스트를 온톨로지 기반 정보로 변환하는 방법 및 그 시스템
CN102760166B (zh) 一种支持多语言的xml数据库全文检索方法
WO2016204391A1 (ko) 검색 서비스 제공 장치, 방법, 및 컴퓨터 프로그램

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16873319

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 16873319

Country of ref document: EP

Kind code of ref document: A1