KR20190011184A - Method and apparatus for providing information using degree of association between reserved word and attribute language - Google Patents

Method and apparatus for providing information using degree of association between reserved word and attribute language Download PDF

Info

Publication number
KR20190011184A
KR20190011184A KR1020180033093A KR20180033093A KR20190011184A KR 20190011184 A KR20190011184 A KR 20190011184A KR 1020180033093 A KR1020180033093 A KR 1020180033093A KR 20180033093 A KR20180033093 A KR 20180033093A KR 20190011184 A KR20190011184 A KR 20190011184A
Authority
KR
South Korea
Prior art keywords
keyword
reserved word
word
association
reserved
Prior art date
Application number
KR1020180033093A
Other languages
Korean (ko)
Other versions
KR102130145B1 (en
Inventor
도준웅
Original Assignee
주식회사 마이셀럽스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/KR2017/007964 external-priority patent/WO2019022262A1/en
Application filed by 주식회사 마이셀럽스 filed Critical 주식회사 마이셀럽스
Priority to JP2018100394A priority Critical patent/JP6676699B2/en
Priority to JP2018100395A priority patent/JP6676700B2/en
Priority to JP2018100393A priority patent/JP6676698B2/en
Priority to US16/044,247 priority patent/US20190026282A1/en
Priority to US16/044,221 priority patent/US20190026281A1/en
Priority to US16/044,275 priority patent/US11397740B2/en
Publication of KR20190011184A publication Critical patent/KR20190011184A/en
Application granted granted Critical
Publication of KR102130145B1 publication Critical patent/KR102130145B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90324Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Abstract

An embodiment of the present invention relates to an information providing method using a degree of association between a reserve word and an attribute word, and an apparatus thereof. According to an embodiment of the present invention, the information providing method comprises the following steps: storing a degree of association of an object-keyword corresponding to an object item and a pair of representative attribute keywords; storing a degree of association of a basic reserve word-keyword corresponding to a reserve word and the pair of representative attribute keywords; obtaining a receiving reserve word; obtaining the degree of association of a reserve word-object corresponding to the receiving reserve word and each of a pair of object items, by using the degree of association of the object-keyword and the degree of association of the basic reserve word-keyword; and providing the object item according to the degree of association of the reserve word-object corresponding to each of the pair of the object items. According to an embodiment of the present invention, an efficient information providing method using a reserve word and an apparatus thereof can be provided.

Description

예약어 및 속성 언어 간의 연관도를 이용한 정보 제공 방법 및 장치{METHOD AND APPARATUS FOR PROVIDING INFORMATION USING DEGREE OF ASSOCIATION BETWEEN RESERVED WORD AND ATTRIBUTE LANGUAGE}TECHNICAL FIELD [0001] The present invention relates to a method and apparatus for providing information using an association degree between a reserved word and an attribute language,

본 명세서의 적어도 일부의 실시 예는 예약어 및 속성 언어 간의 연관도를 이용한 정보 제공 방법 및 장치에 관한 것이다.At least some embodiments of the present disclosure relate to a method and apparatus for providing information using associations between reserved words and attribute languages.

종래의 검색 방식에 따르면, 사용자는 검색 창에 검색 키워드를 입력하여 원하는 웹 문서 등을 검색하여 찾을 수 있다. 예를 들어 사용자는 영화 제목 "인터스텔라"를 검색창에 입력하여 영화 "인터스텔라"에 관한 정보를 검색할 수 있다. 다만 사용자가 자신이 찾으려는 영화 제목을 기억하지 못할 경우 다른 방식의 정보 제공이 요구된다. 사용자는 예를 들어 자신이 찾으려는 영화에 출연한 배우나 해당 영화의 감독, 제작자 등을 키워드로 입력하여 검색을 시도할 수 있다. 영화 정보 사이트나 영화 리뷰 사이트에는 영화 정보와 함께 출연진 정보도 제공되는 경우가 많으므로, 운이 나쁘지 않다면 사용자는 배우, 감독, 제작자 등을 키워드로 하여 원하는 영화를 찾을 수도 있을 것이다. According to a conventional search method, a user can search a desired web document or the like by inputting a search keyword into a search window. For example, a user may enter the movie title " interstellar " into the search box to retrieve information about the movie " interstellar. &Quot; However, if the user can not remember the movie title he / she wants to find, he / she needs to provide information in a different way. For example, a user can try to search for an actor who is looking for a movie, a director, a producer of the movie, or the like as a keyword. Movie information sites and movie review sites often provide movie information as well as cast information, so if the luck is not bad, the user may be able to find the desired movie by using the actor, director, producer, etc. as keywords.

그런데 더 나아가, 이와 같이 정형화된 정보가 아닌 비정형적 언어, 예를 들어 감정 언어에 기반한 정보 제공이라면 종래의 검색 방식을 사용할 수 없다. 예를 들어 "재미있는 영화" 또는 "슬플 때 보는 영화" 등의 검색어에 대해서 종래 검색엔진들이 제공하는 응답은 누군가가 "재미있는 영화" 또는 "슬플 때 보는 영화"라는 키워드를 포함하여 작성해 둔 문서를 검색하는 것에 불과할 것이다. 하지만 비정형적 언어는 출연 배우, (정형화된) 영화 장르, 개봉 년도 등 정형화된 정보와는 다른 방식의 접근이 필요하다. 누군가가 "재미있는 영화" 또는 "슬플 때 보는 영화"라는 키워드를 포함하여 작성해 두지 않았더라도, 실제로 많은 사람들이 "재미있다"거나 "슬플 때 보면 좋다"고 느낄 수 있는 영화들이 있을 수 있다. 더 나아가 영화 외의 다른 분야에 대해서도, 정형화되지 않은 언어를 이용한 정보 제공 요청에 대해서 다른 접근이 필요할 수 있다.However, if the information is provided based on an atypical language, for example, an emotional language, rather than the stereotyped information, the conventional retrieval method can not be used. For example, the response provided by conventional search engines for search terms such as "funny movies" or "movies when they are sad" is that someone searches for documents that have been created, including keywords such as "funny movies" or " It will be nothing more. However, atypical language requires a different approach than formalized information such as starring actor, (genre) movie genre, and year of release. Even if you did not include someone with a "funny movie" or "sad movie" keyword, there could be a lot of movies that many people might feel like "fun" or "when you're sad." Furthermore, for other areas of the film, a different approach may be required for requesting information using an unstructured language.

KRKR 10-2009-008082210-2009-0080822 AA

본 명세서의 일 실시 예는 예약어를 이용한 효율적 정보 제공 방법 및 장치를 제공하는데 그 목적이 있다.An embodiment of the present invention aims to provide a method and apparatus for efficiently providing information using reserved words.

본 명세서의 일 실시 예에 따르는 정보 제공 방법은 대표 속성 키워드를 포함하는 대표 속성 키워드 후보집합을 추출하는 단계, 예약어를 포함하는 예약어 집합을 설정하는 단계, 객체 항목과 대표 속성 키워드 쌍에 대응하는 객체-키워드 연관도를 저장하는 단계, 대표 속성 키워드와 하위 키워드 쌍에 대응되는 연관 가중치 및 예약어와 하위 키워드 쌍에 대응되는 기본 예약어-하위 키워드 연관도를 이용하여 예약어와 대표 속성 키워드 쌍에 대응하는 기본 예약어-키워드 연관도를 저장하는 단계, 수신 예약어를 획득하는 단계, 상기 객체-키워드 연관도 및 상기 기본 예약어-키워드 연관도를 이용하여 상기 수신 예약어와 각 객체 항목 쌍에 대응하는 예약어-객체 연관도를 획득하는 단계 및 상기 수신 예약어와 각 객체 항목 쌍에 대응하는 상기 예약어-객체 연관도에 따라 객체 항목을 제공하는 단계를 포함할 수 있다.An information providing method according to an embodiment of the present invention includes extracting a representative attribute keyword candidate set including a representative attribute keyword, setting a reserved word set including a reserved word, setting an object corresponding to an object item and a representative attribute keyword pair - storing a keyword association, associating weight values corresponding to the representative attribute keyword and the lower keyword pair, and a basic keyword corresponding to the reserved word and the lower keyword pair, Storing a reserved word-keyword association, acquiring a receiving reserved word, acquiring a reserved word-object association diagram corresponding to the receiving reserved word and each object item pair using the object-keyword association diagram and the basic reserved word- And a step of obtaining the reservation word and the reservation - it may include the steps of providing an object item in accordance with the objects associated degrees.

본 명세서의 일 실시 예에 따르는 정보 제공 장치는 대표 속성 키워드를 포함하는 대표 속성 키워드 후보집합을 추출하고, 예약어를 포함하는 예약어 집합을 설정하고, 객체 항목과 대표 속성 키워드 쌍에 대응하는 객체-키워드 연관도를 저장부에 저장하고, 대표 속성 키워드와 하위 키워드 쌍에 대응되는 연관 가중치 및 예약어와 하위 키워드 쌍에 대응되는 기본 예약어-하위 키워드 연관도를 이용하여 예약어와 대표 속성 키워드 쌍에 대응하는 기본 예약어-키워드 연관도를 상기 저장부에 저장하는 제어부, 상기 객체-키워드 연관도 및 기본 예약어-키워드 연관도를 저장하는 저장부; 및 수신 예약어를 획득하는 통신부를 포함할 수 있다. 상기 제어부는 상기 객체-키워드 연관도 및 상기 기본 예약어-키워드 연관도를 이용하여 상기 수신 예약어와 각 객체 항목 쌍에 대응하는 예약어-객체 연관도를 획득할 수 있다. 상기 제어부는 상기 수신 예약어와 각 객체 항목 쌍에 대응하는 상기 예약어-객체 연관도에 따라 객체 항목을 제공할 수 있다.The information providing apparatus according to an embodiment of the present invention extracts a representative attribute keyword candidate set including a representative attribute keyword, sets a reserved word set including a reserved word, and sets an object keyword corresponding to the object item and the representative attribute keyword pair The association degree is stored in the storage unit, and the association weight corresponding to the representative attribute keyword and the lower keyword pair, and the basic word corresponding to the reserved word and the lower keyword pair corresponding to the reserved word and the lower keyword pair, A storage unit for storing the reserved word-keyword association in the storage unit; a storage unit for storing the object-keyword association degree and the basic reserved word-keyword association degree; And a communication unit for acquiring a reception reservation word. The control unit may obtain the reserved word-object association map corresponding to the reception reservation word and each object item pair using the object-keyword association map and the basic reserved word-keyword association map. The control unit may provide an object item according to the reserved word and the reserved word-object association diagram corresponding to each object item pair.

본 명세서의 일 실시 예에 따르면 예약어를 이용한 효율적 정보 제공 방법 및 장치를 제공할 수 있다.According to an embodiment of the present invention, a method and apparatus for efficiently providing information using reserved words can be provided.

도 1은 본 명세서의 일 실시 예에 따르는 속성 언어를 이용한 정보 제공 시스템의 망 구성도이다.
도 2는 본 명세서의 일 실시 예에 따르는 단말(200)의 블록구성도이다.
도 3은 본 명세서의 일 실시 예에 따르는 정보 제공 장치(300)의 블록구성도이다.
도 4는 본 명세서의 일 실시 예에 따르는 정보 제공 인터페이스를 통한 정보 제공 과정의 순서도이다.
도 5는 본 명세서의 일 실시 예에 따르는 단계 910의 상세순서도이다.
도 6은 본 명세서의 일 실시 예에 따르는 단계 510의 상세 순서도이다.
도 7은 본 명세서의 일 실시 예에 따르는 단계 530의 상세 순서도이다.
도 8은 본 명세서의 다른 실시 예에 따르는 정보 제공 과정의 순서도이다.
도 9는 본 명세서의 일 실시 예에 따르는 정보 제공 과정의 순서도이다.
도 10은 본 명세서의 일 실시 예에 따르는 저장된 객체-키워드 연관도의 예시이다.
도 11은 본 명세서의 일 실시 예에 따르는 기본 예약어-키워드 연관도의 예시이다.
도 12는 본 명세서의 일 실시 예에 따르는 단계 940의 상세 순서도이다.
도 13은 본 명세서의 다른 실시 예에 따르는 정보 제공 과정의 순서도이다.
도 14는 본 명세서의 또 다른 실시 예에 따르는 정보 제공 과정의 순서도이다.
도 15는 본 명세서의 제1 실시 예에 따르는 단계 1340의 상세 순서도이다.
도 16은 본 명세서의 다른 실시 예에 따르는 단계 1340의 상세 순서도이다.
도 17은 본 명세서의 또 다른 실시 예에 따르는 단계 1340의 상세 순서도이다.
도 18은 본 명세서의 변형 예에 따르는 단계 1320의 상세 순서도이다.
도 19는 단계 1840에서 제공되는 인터페이스 정보에 따라 생성된 인터페이스(1900)의 예시이다.
도 20은 본 명세서의 일 실시 예에 따르는 용어 계층을 나타낸 도면이다.
1 is a network diagram of an information providing system using an attribution language according to an embodiment of the present invention.
2 is a block diagram of a terminal 200 according to an embodiment of the present invention.
3 is a block diagram of an information providing apparatus 300 according to an embodiment of the present invention.
4 is a flowchart of an information providing process through an information providing interface according to an embodiment of the present invention.
5 is a detailed flowchart of step 910 in accordance with one embodiment of the present disclosure.
6 is a detailed flowchart of step 510 in accordance with one embodiment of the present disclosure.
7 is a detailed flowchart of step 530 according to one embodiment of the present disclosure.
8 is a flowchart of an information providing process according to another embodiment of the present invention.
9 is a flowchart of an information providing process according to an embodiment of the present invention.
10 is an illustration of a stored object-keyword association diagram in accordance with one embodiment of the present disclosure.
11 is an illustration of a basic reserved word-keyword association according to one embodiment of the present disclosure.
12 is a detailed flowchart of step 940 in accordance with one embodiment of the present disclosure.
13 is a flowchart of an information providing process according to another embodiment of the present invention.
14 is a flowchart of an information providing process according to another embodiment of the present invention.
15 is a detailed flowchart of step 1340 according to the first embodiment of the present invention.
16 is a detailed flowchart of step 1340 according to another embodiment of the present disclosure.
17 is a detailed flowchart of step 1340 in accordance with another embodiment of the present disclosure.
18 is a detailed flowchart of step 1320 according to a modification of the present disclosure.
FIG. 19 is an illustration of interface 1900 generated in accordance with the interface information provided in step 1840.
Figure 20 is a diagram illustrating a hierarchy of terms in accordance with one embodiment of the present disclosure.

이하, 본 명세서의 실시 예를 첨부된 도면을 참조하여 상세하게 설명한다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.

실시 예를 설명함에 있어서 본 명세서가 속하는 기술 분야에 익히 알려져 있고 본 명세서와 직접적으로 관련이 없는 기술 내용에 대해서는 설명을 생략한다. 이는 불필요한 설명을 생략함으로써 본 명세서의 요지를 흐리지 않고 더욱 명확히 전달하기 위함이다.In describing the embodiments, descriptions of techniques which are well known in the technical field to which this specification belongs and which are not directly related to this specification are not described. This is for the sake of clarity without omitting the unnecessary explanation and without giving the gist of the present invention.

마찬가지 이유로 첨부 도면에 있어서 일부 구성요소는 과장되거나 생략되거나 개략적으로 도시되었다. 또한, 각 구성요소의 크기는 실제 크기를 전적으로 반영하는 것이 아니다. 각 도면에서 동일한 또는 대응하는 구성요소에는 동일한 참조 번호를 부여하였다.For the same reason, some of the components in the drawings are exaggerated, omitted, or schematically illustrated. Also, the size of each component does not entirely reflect the actual size. In the drawings, the same or corresponding components are denoted by the same reference numerals.

이하, 도면들을 참고하여 본 명세서의 실시 예들에 대해 설명하도록 한다.Hereinafter, embodiments of the present invention will be described with reference to the drawings.

도 1은 본 명세서의 일 실시 예에 따르는 속성 언어를 이용한 정보 제공 시스템의 망 구성도이다.1 is a network diagram of an information providing system using an attribution language according to an embodiment of the present invention.

도 1을 참조하면, 본 명세서의 일 실시 예에 따르는 정보 제공 시스템은 단말(200), 정보 제공 장치(300) 및 통신망(150)을 포함할 수 있다.Referring to FIG. 1, an information providing system according to an embodiment of the present invention may include a terminal 200, an information providing apparatus 300, and a communication network 150.

단말(200)은 예를 들어 스마트폰, PDA, 태블릿 PC, 노트북 컴퓨터, 랩탑 컴퓨터, 개인용 컴퓨터 기타 통신을 수행하고 사용자의 입력을 수신하고 화면을 출력할 수 있는 전자적 기기 또는 이와 유사한 기기로써 구현될 수 있다.The terminal 200 may be implemented as an electronic or similar device capable of performing communication, receiving input from a user, and outputting a screen, for example, a smart phone, a PDA, a tablet PC, a notebook computer, a laptop computer, .

정보 제공 장치(300)는 예를 들어 워크스테이션, 서버, 일반용 컴퓨터, 기타 통신을 수행할 수 있는 전자적 기기 또는 이와 유사한 기기로써 구현될 수 있다.The information providing device 300 may be implemented with, for example, a workstation, a server, a general purpose computer, an electronic device capable of performing other communications, or the like.

단말(200)과 정보 제공 장치(300)는 통신망(150)을 통해 연결되며 통신망(150)을 통해 서로 통신한다.The terminal 200 and the information providing apparatus 300 are connected through the communication network 150 and communicate with each other through the communication network 150.

통신망(150)은 예를 들어 LTE(Long Term Evolution), LTE-A(LTE-Advanced), WI-FI, LAN(Local Area Network), WAN(Wide Area Network), CDMA(Code Division Multiple Access), TDMA(Time Division Multiple Access), WiBro(Wireless Broadband), GSM(Global System for Mobile Communications) 기타 과거, 현재에 개발되었거나 향후 사용 가능하게 되는 통신 방식 중 적어도 일부를 이용하여 구현될 수 있다. 이하에서는 편의를 위해 통신망(150)을 언급하지 않고 단말(200)과 정보 제공 장치(300)가 직접 통신하는 것처럼 설명한다.The communication network 150 may be, for example, an LTE (Long Term Evolution), an LTE-Advanced (LTE-A), a WI-FI, a LAN (Local Area Network), a WAN (Wide Area Network), a CDMA (TDMA), a wireless broadband (WiBro), a global system for mobile communications (GSM), and other communication methods that have been developed in the past, presently available, or become available in the future. Hereinafter, it is assumed that the terminal 200 and the information providing apparatus 300 directly communicate without referring to the communication network 150 for convenience.

단말(200)과 정보 제공 장치(300)의 구체적인 동작 및 구성에 대해서는 도 2 내지 도 8을 참조하여 후술한다.Specific operations and configurations of the terminal 200 and the information providing apparatus 300 will be described later with reference to Figs. 2 to 8. Fig.

도 2는 본 명세서의 일 실시 예에 따르는 단말(200)의 블록구성도이다.2 is a block diagram of a terminal 200 according to an embodiment of the present invention.

도 2를 참조하면 본 명세서의 일 실시 예에 따르는 단말(200)은 입력부(210), 표시부(220), 통신부(230), 저장부(240) 및 제어부(250)를 포함할 수 있다. Referring to FIG. 2, the terminal 200 according to an embodiment of the present invention may include an input unit 210, a display unit 220, a communication unit 230, a storage unit 240, and a controller 250.

입력부(210)는 사용자의 입력 동작을 입력 신호로 변환하여 제어부(250)에게 송신한다. 입력부(210)는 예를 들어 키보드, 마우스, 터치스크린 상의 터치센서, 터치패드, 키패드, 음성 입력, 기타 현재, 과거에 가능하거나 미래에 가능해질 입력 처리 장치들로써 구현될 수 있다. 입력부(210)는 예를 들어 사용자의 정보 제공 요청 입력을 수신하여 제어부(250)에게 전달할 수 있다.The input unit 210 converts an input operation of a user into an input signal and transmits the input signal to the controller 250. The input unit 210 may be implemented as, for example, a keyboard, a mouse, a touch sensor on a touch screen, a touch pad, a keypad, a voice input, For example, the input unit 210 may receive a user input request and transmit the input information to the control unit 250.

표시부(220)는 제어부(250)의 제어에 따라 화면을 출력한다. 표시부(220)는 예를 들어 LCD(액정표시장치), LED(발광 다이오드), OLED(유기 발광 다이오드), 프로젝터, 기타 현재, 과거에 가능하거나 미래에 가능해질 표시 장치들로써 구현될 수 있다. 표시부(220)는 예를 들어 정보 제공을 위한 인터페이스 페이지나 정보 제공 결과 페이지를 표시할 수 있다. 실시 예에 따라서는 화면 출력 대신 음성 출력이나 진동 등 기타 사용자에게 정보를 전달할 수 있는 다른 방식을 사용하는 구성부가 표시부(220) 대신 사용될 수도 있다.The display unit 220 displays a screen under the control of the control unit 250. [ The display unit 220 may be implemented as a display device which may be, for example, an LCD (Liquid Crystal Display), an LED (Light Emitting Diode), an OLED (Organic Light Emitting Diode), a projector, The display unit 220 can display, for example, an interface page for providing information or an information providing result page. In an embodiment, instead of the display unit 220, a configuration unit using other modes such as voice output, vibration, and the like may be used instead of the display unit 220. [

통신부(230)는 정보 제공 장치(300) 및/또는 기타 외부 장치와 데이터를 주고받는다. 통신부(230)는 정보 제공 장치(300)로부터 수신한 데이터를 제어부(250)에게 전달한다. 또한 통신부(230)는 제어부(250)의 제어에 따라 데이터를 정보 제공 장치(300)에게 전달한다. 통신부(230)가 사용하는 통신 기술은 통신망(150)의 유형이나 기타 사정에 따라 달라질 수 있다.The communication unit 230 exchanges data with the information providing device 300 and / or other external devices. The communication unit 230 transmits the data received from the information providing device 300 to the control unit 250. Also, the communication unit 230 transmits data to the information providing apparatus 300 under the control of the controller 250. The communication technology used by the communication unit 230 may vary depending on the type of the communication network 150 or other circumstances.

저장부(240)는 제어부(250)의 제어에 따라 데이터를 저장하고 요청된 데이터를 제어부(250)에게 전달한다.The storage unit 240 stores data according to the control of the controller 250 and transmits the requested data to the controller 250. [

제어부(250)는 단말(200)의 전반적인 동작과 각 구성부를 제어한다. 제어부(250)는 특히 후술하는 바와 같이 입력부(210)로부터 입력된 정보에 따라 정보 제공 요청, 기타 데이터를 정보 제공 장치(300)에게 송신하고, 정보 제공 장치(300)로부터 수신한 페이지 정보에 따라 결과 페이지 및/또는 인터페이스 페이지를 표시부(220)를 통해 표시한다.The control unit 250 controls the overall operation of the terminal 200 and each component. The control unit 250 transmits an information providing request or other data to the information providing apparatus 300 according to the information input from the input unit 210 as described later, And displays the result page and / or the interface page through the display unit 220.

제어부(250)가 수행하는 동작은 물리적으로 분리돼 있는 여러 연산 장치에 의하여 분산 처리될 수 있다. 제어부(250)가 수행하는 동작 중 일부는 제1 서버가 수행하고 다른 동작은 제2 서버가 수행하는 방식도 가능하다. 이 경우 제어부(250)는 물리적으로 분리돼 있는 연산 장치의 총합으로써 구현될 수 있다.The operations performed by the control unit 250 may be distributed and processed by a plurality of physically separated computing devices. Some of the operations performed by the control unit 250 may be performed by the first server, and the other operations performed by the second server may be performed. In this case, the control unit 250 may be implemented as a sum of physically separated computing devices.

저장부(240)는 물리적으로 분리돼 있는 저장장치의 총합으로 구현될 수도 있다.The storage unit 240 may be implemented as a sum of physically separated storage devices.

제어부(250)나 저장부(240)가 물리적으로 분리돼 있는 여러 장치의 총합으로 구현되는 경우 여러 장치들 사이의 통신이 필요할 수 있다. 여기서는 설명의 단순화를 위하여 저장부(240)나 제어부(250)가 하나의 객체로 구현된 경우를 가정하여 설명할 것이다.When the control unit 250 or the storage unit 240 is implemented as a total of various devices physically separated from each other, communication between various devices may be required. Here, for the sake of simplicity of explanation, it is assumed that the storage unit 240 and the control unit 250 are implemented as one object.

단말(200)이 데이터를 송수신하는 경우 관점에 따라 제어부(250)의 제어에 따라 통신부(230)가 데이터를 송수신한다고 표현할 수도 있고, 제어부(250)가 통신부(230)를 제어하여 데이터를 송수신한다고 표현할 수도 있다. The communication unit 230 may transmit or receive data under the control of the control unit 250 according to the viewpoint when the terminal 200 transmits and receives data or the control unit 250 may control the communication unit 230 to transmit and receive data It can also be expressed.

단말(200)의 각 구성부의 구체적인 동작에 대해서는 도 4 내지 도 8을 참조하여 후술한다.The specific operation of each component of the terminal 200 will be described later with reference to FIG. 4 to FIG.

도 3은 본 명세서의 일 실시 예에 따르는 정보 제공 장치(300)의 블록구성도이다.3 is a block diagram of an information providing apparatus 300 according to an embodiment of the present invention.

도 3을 참조하면 본 명세서의 일 실시 예에 따르는 정보 제공 장치(300)는 통신부(310), 제어부(320) 및 저장부(330)를 포함할 수 있다.Referring to FIG. 3, an information providing apparatus 300 according to an embodiment of the present invention may include a communication unit 310, a control unit 320, and a storage unit 330.

통신부(310)는 단말(200) 및/또는 기타 외부 장치와 데이터를 주고받는다. 통신부(310)는 단말(200)로부터 수신한 데이터를 제어부(320)에게 전달한다. 또한 통신부(310)는 제어부(320)의 제어에 따라 데이터를 단말(200)에게 전달한다. 통신부(310)가 사용하는 통신 기술은 통신망(150)의 유형이나 기타 사정에 따라 달라질 수 있다.The communication unit 310 exchanges data with the terminal 200 and / or other external devices. The communication unit 310 transmits the data received from the terminal 200 to the control unit 320. In addition, the communication unit 310 transmits data to the terminal 200 under the control of the control unit 320. The communication technology used by the communication unit 310 may vary depending on the type of the communication network 150 or other circumstances.

저장부(330)는 제어부(320)의 제어에 따라 데이터를 저장하고 제어부(320)로부터 요청된 데이터를 제어부(320)에게 전달한다.The storage unit 330 stores data according to the control of the control unit 320 and transmits the requested data to the control unit 320 from the control unit 320.

제어부(320)는 정보 제공 장치(300)의 전반적인 동작과 각 구성부를 제어한다. 제어부(320)는 특히 후술하는 바와 같이 인터페이스 페이지 요청, 정보 제공 결과 페이지 요청, 기타 데이터를 통신부(310)를 통해 수신하면 저장부(330)로부터 필요한 데이터를 불러오고(load) 페이지 정보를 생성하여 페이지 정보를 통신부(310)를 통해 단말기(200)에게 전달한다.The control unit 320 controls the overall operation of the information providing device 300 and each component. When receiving the interface page request, the information providing result page request, and other data through the communication unit 310 as described later, the control unit 320 loads necessary data from the storage unit 330 and generates page information And transmits the page information to the terminal 200 through the communication unit 310. [

정보 제공 장치(300)가 데이터를 송수신하는 경우 관점에 따라 제어부(320)의 제어에 따라 통신부(310)가 데이터를 송수신한다고 표현할 수도 있고, 제어부(320)가 통신부(310)를 제어하여 데이터를 송수신한다고 표현할 수도 있다.The control unit 320 may transmit data to the communication unit 310 under the control of the control unit 320 in accordance with a viewpoint when the information providing apparatus 300 transmits and receives data, It can also be expressed as sending and receiving.

정보 제공 장치(300)의 각 구성부의 구체적인 동작에 대해서는 도 4 내지 도 8을 참조하여 후술한다.Specific operations of the respective components of the information providing apparatus 300 will be described later with reference to Figs. 4 to 8. Fig.

다른 실시 예에 따르면 시각적으로 정보를 제공하기 위한 페이지 대신 음성이나 다른 방식으로 정보를 제공하기 위한 데이터가 송수신될 수 있다.According to another embodiment, data may be transmitted and received to provide information in a voice or other manner instead of a page for visually providing information.

도 4는 본 명세서의 일 실시 예에 따르는 정보 제공 인터페이스를 통한 정보 제공 과정의 순서도이다. 4 is a flowchart of an information providing process through an information providing interface according to an embodiment of the present invention.

단계 410에서 정보 제공 장치(300)의 제어부(320)는 인터페이스 페이지 정보를 생성한다. 인터페이스 페이지 정보는 인터페이스 페이지를 생성하기 위해 필요한 정보이다. 인터페이스 페이지는 사용자의 입력을 유도하고 사용자의 입력을 수신하여 정보 제공 장치(300)에게 전달하기 위한 페이지이다. 예를 들어 인터페이스 페이지 정보는 HTML 문서 또는 기타 마크업 언어 문서 형태가 될 수 있다. 다른 실시 예에서, 단말(200)이 인터페이스 페이지의 서식 정보를 미리 가지고 있으며, 컨텐츠에 해당하는 사항만이 정보 제공 장치(300)로부터 단말(200)에 전달될 수도 있다. 이하에서는 편의를 위해 인터페이스 페이지 정보 또는 기타의 페이지 정보는 HTML 문서 형식으로 전달된다고 가정하고 설명한다. 하지만 본 명세서의 권리 범위가 여기에 한정되는 것은 아니다. In step 410, the control unit 320 of the information providing apparatus 300 generates interface page information. The interface page information is the information necessary to generate the interface page. The interface page is a page for guiding an input of a user, receiving a user's input, and transmitting the input to the information providing apparatus 300. For example, the interface page information may be in the form of an HTML document or other markup language document. In another embodiment, the terminal 200 has the format information of the interface page in advance, and only information corresponding to the content may be transmitted from the information providing apparatus 300 to the terminal 200. Hereinafter, it is assumed that the interface page information or other page information is transmitted in the HTML document format for convenience. However, the scope of the present invention is not limited thereto.

단계 420에서 정보 제공 장치(300)의 통신부(310)는 인터페이스 페이지 정보를 단말(200)에게 전달한다.In operation 420, the communication unit 310 of the information providing apparatus 300 transmits the interface page information to the terminal 200.

단계 430에서 단말(200)의 제어부(250)는 인터페이스 페이지 정보를 이용하여 인터페이스 페이지를 구성한다. 예를 들어 제어부(250)은 웹 브라우저를 구동하여 HTML 문서를 해석하여 웹 페이지의 형태로 인터페이스 페이지를 구성할 수 있다. 웹 브라우저 대신 별도의 애플리케이션이 사용될 수도 있다.In operation 430, the controller 250 of the terminal 200 configures the interface page using the interface page information. For example, the control unit 250 may operate a web browser to interpret an HTML document to form an interface page in the form of a web page. A separate application may be used instead of a web browser.

단계 440에서 단말(200)의 표시부(220)는 사용자(400)에게 인터페이스 페이지를 표시한다. 인터페이스 페이지는 예를 들어 사용자(400)가 정보 제공을 요청하고, 정보 제공을 위한 키워드를 입력 및/또는 선택하고 기타 정보 제공을 위한 설정을 할 수 있는 인터페이스를 포함할 수 있다.In step 440, the display unit 220 of the terminal 200 displays an interface page to the user 400. The interface page may include, for example, an interface through which the user 400 requests information, inputs and / or selects keywords for providing information, and makes settings for providing other information.

단계 450에서 단말(200)의 입력부(210)는 인터페이스 페이지를 통해 입력된 사용자(400)의 선택 입력을 수신하여 제어부(250)에 전달한다. In operation 450, the input unit 210 of the terminal 200 receives the selection input of the user 400 input through the interface page and transmits the selection input to the controller 250.

단계 460에서 단말(200)의 통신부(230)는 제어부(250)의 제어에 따라 사용자의 선택 입력을 식별할 수 있는 입력 정보를 정보 제공 장치(300)에게 전달한다.In step 460, the communication unit 230 of the terminal 200 transmits input information for identifying the user's selection input to the information providing apparatus 300 under the control of the controller 250.

단계 470에서 정보 제공 장치(300)의 제어부(320)는 사용자의 입력(예를 들어, 키워드 및/또는 기타 정보 제공 설정)을 이용하여 결과 페이지 정보를 생성한다. 결과 페이지 정보를 생성하는 위한 준비과정과 결과 페이지 정보를 생성하는 과정에 대해서는 도 5 내지 도 8을 참조하여 후술한다. 결과 페이지 정보는 예를 들어 HTML 문서 형식 및/또는 이미지 형식으로 구성될 수 있다.In step 470, the control unit 320 of the information providing apparatus 300 generates the result page information using the input of the user (for example, a keyword and / or other information providing setting). The preparation process for generating the result page information and the process of generating the result page information will be described later with reference to FIG. 5 to FIG. The result page information can be configured, for example, as an HTML document format and / or an image format.

단계 480에서 정보 제공 장치(300)의 통신부(310)는 결과 페이지 정보를 단말(200)에게 전달한다.In step 480, the communication unit 310 of the information providing apparatus 300 transmits the result page information to the terminal 200.

단계 490에서 단말(200)의 제어부(250)는 통신부(230)가 수신한 결과 페이지 정보를 이용하여 결과 페이지를 구성한다. 예를 들어 제어부(250)는 HTML형식의 결과 페이지 정보를 해석하여 결과 페이지를 구성할 수 있다. In step 490, the control unit 250 of the terminal 200 forms a result page using the result page information received by the communication unit 230. [ For example, the control unit 250 can interpret the result page information in the HTML format to form a result page.

단계 495에서 단말(200)의 표시부(220)는 결과 페이지를 사용자(400)에게 제공한다.In step 495, the display unit 220 of the terminal 200 provides the result page to the user 400.

도 4의 실시 예에서 사용자에게 시각적 형태의 페이지를 제공하는 것을 가정하였으나, 음성을 통해 인터페이스나 결과 정보를 제공하는 것도 가능하다. 이 경우 표시부(220) 대신 음성 출력부가 이용될 수 있을 것이다. 시각적/청각적 방식 대신 현재 가능하거나 미래에 가능해질 다른 방식의 인터페이스 방식이 사용자(400)와의 관계에서 사용될 수도 있다. 이 경우 정보 제공 장치(300)는 인터페이스 방식에 맞도록 페이지 정보 대신 다른 방식으로 변환된 정보를 단말(200)에게 제공할 수 있다.In the embodiment of FIG. 4, it is assumed that a page of a visual form is provided to a user, but it is also possible to provide an interface or result information through voice. In this case, the audio output unit may be used instead of the display unit 220. [ Other methods of interfacing that may be presently or in the future instead of a visual / audible approach may be used in connection with the user 400. In this case, the information providing apparatus 300 may provide the terminal 200 with information converted in a different manner instead of the page information in accordance with the interface method.

도 5 이후의 실시 예에서 사용자(400)는 자신이 관심을 가지는 특정 관심 분야의 객체에 관한 정보를 제공받고자 한다. 하지만 본 명세서의 권리 범위가 이에 한정되는 것은 아니다.5, the user 400 desires to receive information on an object of a specific area of interest to which the user 400 is interested. However, the scope of the present invention is not limited thereto.

관심 분야는 예를 들어 객체의 유형이 될 수 있다. 예를 들어 관심 분야가 '유명인' 이라면 이 관심 분야에 해당하는 객체는 '유시민', '유재석', '테일러 스위프트' 등을 포함할 수 있다. 예를 들어 관심 분야가 '영화'라면 이 관심 분야에 해당하는 객체는 '덩케르크', '스파이더맨: 홈커밍', '슈퍼배드 3' 등을 포함할 수 있다. 예를 들어 관심 분야가 '방송 프로그램' 이라면 이 관심 분야에 해당하는 객체는 '무한도전', '아메리칸 아이돌', '왕좌의 게임' 등을 포함할 수 있다.The area of interest can be, for example, the type of the object. For example, if the area of interest is a 'celebrity,' the objects of interest may include 'Yushimin', 'Yoo Jae-seok', 'Taylor Swift', and so on. For example, if your interests are 'movies,' then those objects that interest you can include 'Dunkirk,' 'Spiderman: Homecoming,' and 'Super Bad 3.' For example, if the area of interest is a "program," the objects of interest may include "Infinite Challenge," "American Idol," "Game of the Throne," and so on.

이하의 실시 예들에서 키워드들 간의 관계(연관도/가중치 등등)를 평가하기 위해 문서가 수집된다. 수집된 문서는 모두 동등한 가치를 가지는 것으로 평가될 수도 있고, 최신의 문서가 더 높은 가치를 가지는 것으로 평가될 수도 있다. 즉, 평가 시점 기준 문서의 나이와 그 문서 내에 등장하는 키워드들 간의 연관도는 음의 상관관계를 가질 수 있다.In the following embodiments, documents are collected to evaluate the relationships (associativity / weight, etc.) between the keywords. Collected documents may all be evaluated as having equivalent value, and the latest documents may be evaluated as having higher value. That is, the age of the reference document at the evaluation time point and the relevance between the keywords appearing in the document may have a negative correlation.

후술하는 도 5 이후의 과정에서도 문서의 최신성에 따라 가치가 달리 평가될 수 있다. 예를 들어 평가 시점 기준 1일 지난 문서에 두 키워드가 함께 등장한 경우가, 평가 시점 기준 10일 지난 문서에 두 키워드가 함께 등장한 경우에 비해 10배 더 높은 연관도로 평가될 수 있다. 문서의 나이는 예를 들어 초단위/분단위/시간 단위로 평가되거나 일 단위/월 단위/연 단위 등으로 평가될 수도 있다. 제어부(320)는 문서의 나이가 반영되기 전 평가된 해당 문서에 의하나 부분 연관도 값을 문서의 나이로 나누어 문서 나이가 반영된 부분 연관도를 추출하고, 이러한 부분 연관도를 누적하여 두 키워드 사이의 연관도를 추출할 수 있다. The value can be evaluated differently according to the latestness of the document even in the process of FIG. 5 and later to be described later. For example, two keywords appearing in a document that is one day old at the evaluation time point may be evaluated as 10 times higher than when two keywords appear together in a document that is 10 days old at the evaluation time point. The age of the document can be evaluated, for example, in seconds / minutes / hours, or in days / months / years. The control unit 320 extracts a partial relevance degree reflecting the document age by dividing one partial relevance value of the document evaluated before the age of the document is reflected by the age of the document, Can be extracted.

문서의 나이를 확인하기 위한 문서의 생성 시점은 예를 들어 문서 내에 포함된 게시 시점 및/또는 메타데이터를 이용하여 파악하거나, 주기적인 크롤링을 통해, 이전의 크롤링에 발견되지 않은 문서가 새로 발견되는 경우 새로운 크롤링 시점에 신규 문서가 추가된 것으로 파악할 수도 있다.The document creation time for identifying the age of the document can be determined, for example, by using the publication time and / or metadata included in the document, or by periodically crawling, a document that is not found in the previous crawl is newly found You may also find that a new document has been added at the time of the new crawl.

도 9는 본 명세서의 일 실시 예에 따르는 정보 제공 과정의 순서도이다.9 is a flowchart of an information providing process according to an embodiment of the present invention.

단계 910에서 제어부(320)는 객체 항목과 대표 속성 키워드 쌍에 대응하는 객체-키워드 연관도를 저장부(330)에 저장한다.In step 910, the control unit 320 stores the object-keyword association diagram corresponding to the object attribute and the representative attribute keyword pair in the storage unit 330.

도 10은 본 명세서의 일 실시 예에 따르는 저장된 객체-키워드 연관도의 예시이다.10 is an illustration of a stored object-keyword association diagram in accordance with one embodiment of the present disclosure.

도 10의 실시 예에서 객체 항목은 모두 m개(i1 내지 im)가 있고 대표 속성 키워드는 모두 n개(k1 내지 kn)가 있다. In the embodiment of FIG. 10, there are m (i 1 to i m ) object items and n (k 1 to k n ) are all representative attribute keywords.

예를 들어 객체 항목 i5와 대표 속성 키워드 k3의 객체-키워드 연관도는 w5,3이 된다. For example, the object-keyword association of the object item i 5 and the representative attribute keyword k 3 is w 5,3 .

단계 910의 과정은 예를 들어 도 5 내지 도 8의 실시 예들 중 일부에 따라 수행되거나 이와 유사한 과정, 또는 이에 상응하는 과정으로 수행될 수 있다. 다른 실시 예에 따르면 단계 910의 과정은 관리자의 입력으로 수행되거나 외부 시스템에서 결정된 객체-키워드 연관도를 네트워크 또는 저장매체를 통해 전달받아 수행될 수 있다.The process of step 910 may be performed, for example, in accordance with some of the embodiments of FIGS. 5-8, or a similar process, or a corresponding process. According to another embodiment, the process of step 910 may be performed by inputting by an administrator or by receiving an object-keyword association determined by an external system through a network or a storage medium.

도 5는 본 명세서의 일 실시 예에 따르는 단계 910의 상세순서도이다.5 is a detailed flowchart of step 910 in accordance with one embodiment of the present disclosure.

도 5를 참조하면, 단계 510에서 제어부(320)는 제1 집합 문서들로부터 대표 속성 키워드 후보집합을 추출한다. 제어부(320)는 예를 들어 제1 집합 문서 중 관심 분야에 해당하는 문서에 자주 등장하는 키워드들을 대표 속성 키워드 후보집합으로 수집할 수 있다. Referring to FIG. 5, in step 510, the control unit 320 extracts a representative attribute keyword candidate set from the first set of documents. For example, the control unit 320 may collect keywords frequently appearing in a document corresponding to a field of interest among the first set of documents as a representative attribute keyword candidate set.

도 6은 본 명세서의 일 실시 예에 따르는 단계 510의 상세 순서도이다.6 is a detailed flowchart of step 510 in accordance with one embodiment of the present disclosure.

제어부(320)는 특정 분야에 속하는 객체 항목을 나타내는 객체 키워드와 같은 문서에 등장하는 키워드들 및 특정 분야를 나타내는 분야 키워드와 같은 문서에 등장하는 키워드들을 제1 속성 키워드 후보집합 및 제2 속성 키워드 후보집합으로 설정할 수 있다. The control unit 320 assigns keywords appearing in a document such as keywords appearing in a document such as an object keyword indicating an object item belonging to a specific field and a field keyword indicating a specific field to a first attribute keyword candidate set and a second attribute keyword candidate It can be set as a set.

예를 들어 정보 제공 서비스를 제공하려는 관심 분야가 유명인이라면, 분야 키워드는 '유명인', '연예인', '영화배우', '스타', '셀럽', 'celeb' 등을 포함할 수 있다. 분야 키워드는 관리자에 의하여 설정되거나 제어부(320)에 의하여 추천, 설정될 수 있다. 제어부(320)는 일부 분야 키워드들을 획득한 뒤 이 분야 키워드들과의 연관도가 미리 설정된 값 이상으로 분석된 유사 키워드를 추가적 분야 키워드로 추천/설정할 수 있다.For example, if you are interested in providing informational services, the domain keywords may include "celebrities," "entertainers," "movie stars," "stars," "selves," "celebs, The field keyword can be set by the administrator or recommended and set by the control unit 320. The control unit 320 may acquire some field keywords and recommend / set a similar keyword in which the degree of association with the keyword is greater than or equal to a predetermined value as an additional field keyword.

정보 제공 서비스를 제공하려는 관심 분야가 유명인이라면, 객체 키워드는 해당 관심 분야에 속하는 개별 인물이 될 수 있다. 예를 들어 "유재석", "테일러 스위프트", "스테판 커리" 등이 관심 분야 유명인에 해당하는 객체 키워드가 될 수 있다. If the interest to provide the information service is a celebrity, the object keyword can be an individual person belonging to the interest field. For example, "Yoo Jae-suk", "Taylor Swift", "Stephanie Currie" and so on can be object keywords corresponding to interest celebrities.

분야 키워드와 객체 키워드의 관계를 설명하자면, 예를 들어 분야 키워드가 객체 키워드의 속성 또는 유형에 해당할 수 있다. 분야 키워드가 집합을 나타낸다면 객체 키워드는 그 집합에 속하는 원소들을 나타내는 것이 될 수 있다.To describe the relationship between the field keyword and the object keyword, for example, the field keyword may correspond to the attribute or type of the object keyword. If the field keyword represents a set, then the object keyword can represent the elements belonging to that set.

객체 키워드는 관리자에 의해 설정되거나, 분야 키워드와 비슷한 방식으로 선정될 수 있다. 또 다른 실시 예에 따르면 제어부(320)는 수집된 문서들의 문맥을 분석하여 상기 분야 키워드가 나타내는 집합에 속하는 원소로 판단되는 키워드들을 객체 키워드로 선정할 수 있다. Object keywords can be set by an administrator or in a similar way to field keywords. According to another embodiment of the present invention, the controller 320 may analyze the context of the collected documents and may select, as object keywords, keywords judged as elements belonging to the set represented by the field keyword.

인기 객체 키워드와 비인기 객체 키워드는 해당 객체 키워드의 검색/수집량에 따라 구분될 수 있다. 제어부(320)는 각 객체 키워드가 포함된 문서를 검색/수집하고 수집량이 특정 문턱값 이상인 객체 키워드를 인기 객체 키워드로 설정하고 나머지 객체 키워드를 비인기 객체 키워드로 설정할 수 있다.The popularity object keyword and the non-human object keyword can be classified according to the search / collection amount of the object keyword. The control unit 320 may search for / collect a document including each object keyword, set an object keyword whose collection amount is not less than a threshold value as a popular object keyword, and set the remaining object keywords as a non-target object keyword.

인기 분야 키워드와 비인기 분야 키워드는 해당 분야 키워드의 검색/수집량에 따라 구분될 수 있다. 제어부(320)는 각 분야 키워드가 포함된 문서를 검색/수집하고 수집량이 특정 문턱값 이상인 분야 키워드를 인기 분야 키워드로 설정하고 나머지 분야 키워드를 비인기 분야 키워드로 설정할 수 있다. 다만 인기 객체 키워드와 비인기 객체 키워드를 구분하는 문턱값과 인기 분야 키워드-비인기 분야 키워드를 구분하는 문턱값은 서로 다른 값이 될 수 있다. 이하에서 편의를 위해 인기 객체 키워드와 인기 분야 키워드를 통틀어 인기 분야객체 키워드라고 칭한다. 또한 편의를 위해 비인기 객체 키워드와 비인기 분야 키워드를 통틀어 비인기 분야객체 키워드라고 칭한다.Keywords for popular keywords and non-keyword keywords can be classified according to the search / collection of keywords in the relevant field. The control unit 320 may search for / collect documents containing the keyword of each field, set a keyword of a category having a collection amount of a certain threshold value or more as a popular keyword, and set the keyword of the other keyword as a non- keyword. However, the threshold value for distinguishing the popular object keyword from the non-human object keyword may be different from the threshold value for distinguishing the popular keyword keyword and the non-keyword keyword. For convenience, the popular object keyword and the popular keyword are collectively referred to as a popular field object keyword. For convenience, the non-object keyword and the non-object keyword are collectively referred to as the non-object object keyword.

변형 실시 예에서는 인기 분야객체 키워드 대신 인기 분야 키워드 또는 인기 객체 키워드만이 사용될 수도 있다. 변형 실시 예에서는 비인기 분야객체 키워드 대신 비인기 분야 키워드 또는 비인기 객체 키워드만이 사용될 수도 있다.In an alternative embodiment, only the popular field keywords or popular object keywords may be used instead of the popular field object keywords. In an alternative embodiment, only the non-human field keyword or the non-human object keyword may be used instead of the non-human field object keyword.

단계 610에서 제어부(320)는 인기 분야객체 키워드와 같은 문서에 함께 등장하는 키워드들을 제1 속성 키워드 후보집합으로 설정한다.In step 610, the control unit 320 sets keywords appearing together in a document such as a popular field object keyword as a first attribute keyword candidate set.

제어부(320)는 인기 분야객체 키워드가 포함된 문서들을 검색/수집하고, 수집된 문서에 포함된 키워드들을 제1 속성 키워드 후보집합으로 설정할 수 있다. 다른 실시 예에 따르면 제어부(320)는 수집된 문서에 포함된 키워드들 중 분야 키워드 및 객체 키워드를 제1 속성 키워드 후보집합에서 제외할 수 있다. 아울러 제어부(320)는 미리 설정된 의미 없는 키워드, 예를 들어 조사/관사 등을 제1 속성 키워드 후보집합에서 제외할 수 있다. 또 다른 실시 예에 따르면 제어부(320)는 수집된 문서에 포함된 키워드들 중 미리 설정된 사전(dictionary)에 등록된 키워드를 제1 속성 키워드 후보집합에 포함시킬 수 있다.The control unit 320 can search / collect documents including the popular field object keyword and set the keywords included in the collected document as the first attribute keyword candidate set. According to another embodiment, the control unit 320 may exclude the field keyword and the object keyword among the keywords included in the collected document from the first attribute keyword candidate set. In addition, the control unit 320 may exclude keywords having no meaning set in advance, for example, survey / article, from the first attribute keyword candidate set. According to another embodiment, the controller 320 may include a keyword registered in a preset dictionary among the keywords included in the collected document in the first attribute keyword candidate set.

또 다른 실시 예에 따르면, 제어부(320)는 인기 분야객체 키워드가 포함된 문서를 검색/수집하고, 수집된 문서에서 인기 분야객체 키워드 또는 그 키워드가 포함된 문장으로부터 미리 설정된 거리 이내에 배치된 키워드들을 제1 속성 키워드 후보집합에 포함시킬 수도 있다. 또 다른 실시 예에 따르면, 제어부(320)는 인기 분야객체 키워드가 포함된 문서를 검색/수집하고, 문맥을 분석하여 인기 분야객체 키워드를 수식/설명하는 용도로 사용된 키워드들을 제1 속성 키워드 후보집합에 포함시킬 수도 있다.According to another embodiment, the control unit 320 searches / collects a document including a popular field object keyword, and searches for keywords in a collected document, which are located within a predetermined distance from a sentence containing the popular field object keyword or the keyword May be included in the first attribute keyword candidate set. According to another embodiment, the control unit 320 searches / collects documents containing popular field object keywords, analyzes the contexts, and assigns keywords used for expressing / describing popular field object keywords to first attribute keyword candidates It can also be included in a set.

키워드 사이의 거리 또는 키워드와 문장 사이의 거리는 예를 들어 두 키워드 또는 키워드와 문장 사이에 위치하는 문장의 개수, 두 키워드 또는 키워드와 문장 사이에 위치하는 단어의 개수, 두 키워드 또는 키워드와 문장 사이에 위치하는 어절의 개수, 두 키워드 또는 키워드와 문장 사이에 문자의 개수 중 어느 하나 이상을 기준으로 판단될 수 있다.The distance between keywords, or the distance between a keyword and a sentence, can be, for example, the number of sentences between two keywords or between a keyword and a sentence, the number of words located between two keywords or between a keyword and a sentence, The number of words to be located, the number of words between two keywords, or the number of characters between a keyword and a sentence.

제어부(320)는 키워드 분석을 위해 형태소 분석을 먼저 수행할 수 있다.The control unit 320 may first perform morpheme analysis for keyword analysis.

단계 620에서 제어부(320)는 비인기 분야객체 키워드와 같은 문서에 함께 등장하는 키워드들을 제2 속성 키워드 후보집합으로 설정한다. In step 620, the control unit 320 sets the keywords appearing together in the same document as the non-human field keyword as the second attribute keyword candidate set.

제어부(320)는 비인기 분야객체 키워드가 포함된 문서를 검색/수집하고, 수집된 문서에 포함된 키워드들을 제2 속성 키워드 후보집합으로 설정할 수 있다. 다른 실시 예에 따르면 제어부(320)는 수집된 문서에 포함된 키워드들 중 분야 키워드 및 객체 키워드를 제2 속성 키워드 후보집합에서 제외할 수 있다. 아울러 제어부(320)는 미리 설정된 의미 없는 키워드, 예를 들어 조사/관사 등을 제2 속성 키워드 후보집합에서 제외할 수 있다. 또 다른 실시 예에 따르면 제어부(320)는 수집된 문서에 포함된 키워드들 중 미리 설정된 사전(dictionary)에 등록된 키워드를 제2 속성 키워드 후보집합에 포함시킬 수 있다.The control unit 320 may search / collect documents including non-human field keywords, and may set keywords included in the collected documents as second attribute keyword candidates. According to another embodiment, the control unit 320 may exclude the field keyword and the object keyword among the keywords included in the collected document from the second attribute keyword candidate set. In addition, the control unit 320 may exclude keywords having no meaning set in advance, for example, survey / article, from the second attribute keyword candidate set. According to another embodiment, the controller 320 may include a keyword registered in a preset dictionary among the keywords included in the collected document in the second attribute keyword candidate set.

또 다른 실시 예에 따르면, 제어부(320)는 비인기 분야객체 키워드가 포함된 문서를 검색/수집하고, 수집된 문서에서 비인기 분야객체 키워드 또는 그 키워드가 포함된 문장으로부터 미리 설정된 거리 이내에 배치된 키워드들을 제2 속성 키워드 후보집합에 포함시킬 수도 있다. 또 다른 실시 예에 따르면, 제어부(320)는 비인기 분야객체 키워드가 포함된 문서를 검색/수집하고, 문맥을 분석하여 비인기 분야객체 키워드를 수식/설명하는 용도로 사용된 키워드들을 제2 속성 키워드 후보집합에 포함시킬 수도 있다.According to another embodiment, the control unit 320 searches / collects a document including an unacceptable field object keyword, and extracts keywords that are located within a preset distance from a non-target field object keyword or a sentence including the keyword in the collected document And may be included in the second attribute keyword candidate set. According to another embodiment, the control unit 320 searches / collects a document including an object keyword in the non-object domain, analyzes the context, and assigns keywords used for expressing / describing the object keyword in the non-object domain to a second attribute keyword candidate It can also be included in a set.

키워드 사이의 거리 또는 키워드와 문장 사이의 거리는 예를 들어 두 키워드 또는 키워드와 문장 사이에 위치하는 문장의 개수, 두 키워드 또는 키워드와 문장 사이에 위치하는 단어의 개수, 두 키워드 또는 키워드와 문장 사이에 위치하는 어절의 개수, 두 키워드 또는 키워드와 문장 사이에 문자의 개수 중 어느 하나 이상을 기준으로 판단될 수 있다.The distance between keywords, or the distance between a keyword and a sentence, can be, for example, the number of sentences between two keywords or between a keyword and a sentence, the number of words located between two keywords or between a keyword and a sentence, The number of words to be located, the number of words between two keywords, or the number of characters between a keyword and a sentence.

제어부(320)는 키워드 분석을 위해 형태소 분석을 먼저 수행할 수 있다.The control unit 320 may first perform morpheme analysis for keyword analysis.

단계 630에서 제어부(320)는 상기 제1 속성 키워드 후보집합 및 상기 제2 속성 키워드 후보집합 모두에 속한 키워드들을 상기 대표 속성 키워드 후보집합으로 설정할 수 있다. 즉, 인기 분야객체 키워드를 수식하는 표현으로도 쓰이면서 비인기 분야객체 키워드를 수식하는 표현으로도 쓰이는 키워드들이 대표 속성 키워드 후보집합에 수집될 수 있다.In step 630, the controller 320 may set keywords belonging to both the first attribute keyword candidate set and the second attribute keyword candidate set as the representative attribute keyword candidate set. That is, the keywords used for expressing the keyword of the popular field object and used for expressing the keyword of the non-human field object keyword can be collected in the representative attribute keyword candidate set.

다른 실시 예에 따르면, 단계 510에서 제어부(320)는 인기/비인기 여부에 관계 없이 객체 키워드 및/또는 분야 키워드와 함께 등장하는 키워드들을 대표 속성 키워드 후보집합에 포함시킬 수도 있다.According to another embodiment, in step 510, the control unit 320 may include the keywords appearing together with the object keyword and / or the field keyword in the representative attribute keyword candidate set, regardless of whether the popularity / non-popularity is determined.

도 5로 돌아가서, 단계 520에서 제어부(320)는 제2 집합 문서들로부터 대표 속성 키워드 후보집합에 포함되는 각 대표 속성 키워드와 연관된 둘 이상의 하위 키워드들을 추출한다. Returning to FIG. 5, in step 520, the control unit 320 extracts two or more lower keywords associated with each representative attribute keyword included in the representative attribute keyword candidate set from the second set documents.

단계 520의 하위 키워드 추출에 사용되는 제2 집합 문서와 단계 510의 대표 속성 키워드 후보집합 추출에 사용되는 제1 집합 문서는 서로 다른 문서 집합일 수도 있고 서로 같은 문서 집합일 수도 있다. 예를 들어, 제1 집합 문서는 수집 가능한 문서 전부를 포함하는 집합이고, 제2 집합 문서는 정보 제공 서비스를 제공하고자 하는 특정 관심 분야가 주요한 키워드로 사용된 문서들만을 포함하는 집합이 될 수 있다. 제어부(320)는 수집 가능한 문서들을 분석하여 자주 등장하는 키워드들을 기반으로 각 문서가 정보 제공 서비스를 제공하고자 하는 특정 관심 분야가 주요한 키워드로 사용된 문서인지 분석할 수 있다. 다른 실시 예에 따르면 제1 집합 문서 및 제2 집합 문서 모두 수집 가능한 관련문서 전부를 포함하는 집합이 될 수 있다. 또 다른 실시 예에 따르면, 제1 집합 문서는 수집 가능한 관련문서 전부를 포함하는 집합이고 제2 집합 문서는 정보 제공 서비스를 제공하고자 하는 특정 관심분야에 관련된 문서만을 포함하는 집합이 될 수 있다. 또 다른 실시 예에 따르면 제2 집합 문서는 수집 가능한 관련문서 전부를 포함하는 집합이고 제1 집합 문서는 정보 제공 서비스를 제공하고자 하는 특정 관심분야에 관련된 문서만을 포함하는 집합이 될 수 있다. The second set document used for extracting the lower keyword in step 520 and the first set document used for extracting the representative attribute keyword candidate set in step 510 may be different document sets or may be the same document set. For example, the first set of documents may be a set that includes all of the collectable documents, and the second set of documents may be a set that includes only documents that are used as the main keywords of a particular area of interest to provide the information providing service . The control unit 320 analyzes the collectible documents and analyzes whether the specific interest field in which each document provides the information providing service is the main keyword based on frequently appearing keywords. According to another embodiment, both the first aggregation document and the second aggregation document may be a collection including all of the related documents that can be collected. According to another embodiment, the first aggregation document may be a set that includes all of the related documents that can be collected, and the second aggregation document may be a set that includes only documents related to a specific area of interest in which the information providing service is to be provided. According to another embodiment, the second aggregation document may be a set including all the related related documents that can be collected, and the first aggregation document may be a set that includes only documents related to a specific interest area in which the information providing service is to be provided.

단계 520을 위해, 제어부(320)는 예를 들어, 정보 제공 서비스를 제공하고자 하는 특정 관심분야에 관련된 문서만을 포함하는 집합을 생성하기 위해 해당 관심분야 자체를 나타내는 분야 키워드를 포함하는 문서들 및/또는 해당 관심분야에 속하는 객체 키워드를 포함하는 문서들을 수집하고, 그들 중 분야 키워드/객체 키워드의 비중이 미리 설정된 값 이상인 문서들을 추출하여 특정 관심분야에 관련된 문서만을 포함하는 집합을 생성할 수 있다. 분야 키워드/객체 키워드의 비중은 분야 키워드/객체 키워드의 등장 빈도나 등장 위치, 문맥 등을 통해 판단할 수 있다. 예를 들어 분야 키워드/객체 키워드가 자주 등장하거나 분야 키워드/객체 키워드가 해당 문서의 타이틀로 사용되거나 큰 글자 또는 강조를 위한 글자체로 표시되는 문서는 특정 관심분야에 관련된 문서로 분류할 수 있을 것이다.For step 520, the control unit 320 determines whether the document containing the field keyword representing the interest field itself and / or the document containing the field of interest representing the interest field itself, for example, to generate a set containing only documents related to the particular field of interest, Or a document including an object keyword belonging to the interest field, and extracts documents having a proportion of a field keyword / object keyword of a predetermined value or more among them to generate a set including only documents related to a specific field of interest. The weight of the field keyword / object keyword can be judged through the appearance frequency, appearance position, and context of the field keyword / object keyword. For example, a document in which a field keyword / object keyword appears frequently, a field keyword / object keyword is used as a title of the document, or a letter in a form for large letters or emphasis is classified as a document related to a specific field of interest.

단계 520에서 제어부(320)는 예를 들어 상기 제2 집합 문서 중 적어도 일부를 분석하여 각 대표 속성 키워드와 가장 연관도가 높은 하위 키워드들을 미리 설정된 개수만큼 추출하여 각 대표 속성 키워드와 연관된 둘 이상의 하위 키워드들을 추출할 수 있다.In step 520, the control unit 320 analyzes at least a part of the second set of documents, extracts a predetermined number of sub-keywords having the highest relevance with each representative attribute keyword, and extracts two or more sub- Keywords can be extracted.

제어부(320)는 예를 들어 하위 키워드가 대표 속성 키워드와 동일 또는 유사한 문맥에 등장하는 빈도를 고려하여 대표 속성 키워드와 하위 키워드 사이의 연관도를 판단할 수 있다. 예를 들어 특정 문장에서 키워드 A의 주변에 등장하는 단어들은 다른 문서에서도 키워드 A와 연관된 단어의 주변에 등장할 수 있으리라고 볼 수 있다. The controller 320 may determine the degree of association between the representative attribute keyword and the lower keyword in consideration of, for example, the frequency with which the lower keyword appears in the same or similar context as the representative attribute keyword. For example, words appearing in the vicinity of keyword A in a certain sentence may appear in the vicinity of the word associated with keyword A in another document.

"큰 맘 먹고 여행을 갔으나 7월이라 날씨가 너무 더워서 고생했다.""I went on a big trip, but it was July, and the weather was so hot that I suffered."

"큰 맘 먹고 여행을 갔으나 7월이라 날씨가 너무 습해서 고생했다.""I went on a big trip, but it was July, so the weather was too humid."

위 두 문장을 살펴보면 같은 문맥에서 "더워서"라는 단어가 "습해서"라는 단어로 대체되었다. 제어부(320)는 "덥다"와 "습하다"가 서로 연관된 단어라는 것을 유추할 수 있다.Looking at the two sentences above, the word "hot" was replaced by the word "wet" in the same context. The control unit 320 can infer that "hot" and "wet" are related words.

"큰 맘 먹고 여행을 갔으나 7월이라 날씨가 너무 더워서 고생했다.""I went on a big trip, but it was July, and the weather was so hot that I suffered."

"큰 맘 먹고 휴가를 갔으나 7월이라 날씨가 너무 더워서 고생했다.""I had a great vacation and went on vacation, but it was July, so I had a hard time because the weather was so hot."

마찬가지로 제어부(320)는 위 두 문장을 통해 "여행"과 "휴가"가 연관된 단어라는 것을 유추할 수 있다.Similarly, the control unit 320 can infer that the words " travel " and " vacation " are related words through the above two sentences.

"큰 맘 먹고 여행을 갔으나 7월이라 날씨가 너무 더워서 고생했다.""I went on a big trip, but it was July, and the weather was so hot that I suffered."

"큰 맘 먹고 여행을 갔으나 8월이라 날씨가 너무 더워서 고생했다.""I went on a big trip, but it was August and the weather was so hot that I suffered."

마찬가지로 제어부(320)는 위 두 문장을 통해 "7월"과 "8월"이 연관된 단어라는 것을 유추할 수 있다.Similarly, the control unit 320 can infer that the words " July " and " August " are associated with each other through the above two sentences.

제어부(320)는 이전에 수집된 문서들을 통해 "덥다"와 "습하다"가 서로 연관된 단어이고 "7월"과 "8월"이 서로 연관된 단어이며 "여행"과 "휴가"가 서로 연관된 단어임을 저장해 둘 수 있다 이후 아래와 같은 문장을 수집한다고 가정한다.The control unit 320 is a word associated with "hot" and "wet" through previously collected documents, and a word associated with "July" and "August", and a word associated with "travel" and "vacation" It is assumed that the following sentence is collected.

"큰 맘 먹고 휴가를 갔으나 7월이라 날씨가 너무 습해서 고생했다.""I had a great vacation and went on a vacation, but it was July, and the weather was too humid."

"큰 맘 먹고 여행을 갔으나 8월이라 날씨가 너무 더워서 힘들었다.""I went on a big trip, but it was hard because it was too hot in August."

두 문장이 동일한 문맥은 아니지만 덥다"와 "습하다"가 서로 연관된 단어이고 "7월"과 "8월"이 서로 연관된 단어이며 "여행"과 "휴가"가 서로 연관된 단어임을 알고 있다면, 제어부(320)는 위 문장을 통해 "고생했다"와 "힘들었다" 역시 연관된 단어임을 학습할 수 있을 것이다.If the two sentences are not the same context but know that "hot" and "humid" are related words, "July" and "August" are related words, and "travel" ) Will be able to learn that "suffering" and "hardship" are also related words through the above sentence.

동일/유사한 문맥에 등장하는 빈도가 높은 키워드 쌍은 서로 연관도가 높은 것으로 판단할 수 있다. 아울러 두 키워드가 등장하는 문맥의 유사도가 높을수록 두 키워드 사이의 연관도가 높은 것으로 판단할 수 있다. 제어부(320)는 수집되는 문서들을 이용해 학습을 진행하여 키워드들 사이의 연관도를 설정하고, 설정된 키워드 간 연관도와 문장의 문맥을 이용하여 해당 문장에서 등장하는 키워드들의 연관도를 설정하는 식으로 키워드 간 연관도 판단의 정확성을 높일 수 있다.It is possible to determine that a keyword pair having a high frequency of appearing in the same / similar context has a high degree of correlation with each other. In addition, the higher the degree of similarity of the context in which the two keywords appear, the higher the degree of association between the two keywords can be judged. The control unit 320 performs learning using the collected documents to set the degree of association between the keywords and sets the degree of association of the keywords appearing in the corresponding sentence by using the relation between the set keywords and the context of the sentence. It is possible to improve the accuracy of the determination of the inter-linkage.

이와 유사한 학습 방식으로 NNLM(Neural Net Language Model), RNNLM(Recurrent Neural Net Language Model), word2vec, 스킵그램(skipgram) 및 CBOW(Continuous Bag-of-Words)방식이 알려져 있다. 특히 word2vec을 이용할 경우 word2vec은 문서들을 이용해 학습하여 각 키워드들을 벡터에 대응시키고, 두 키워드 사이의 유사도는 두 벡터의 코사인 유사도 계산을 통해 파악할 수 있다.Similar learning methods are known, such as Neural Net Language Model (NNLM), Recurrent Neural Net Language Model (RNNLM), word2vec, skipgram, and Continuous Bag-of-Word (CBOW) schemes. In particular, when word2vec is used, word2vec learns by using documents and maps each keyword to a vector, and the similarity between two keywords can be grasped through calculation of the cosine similarity of two vectors.

이러한 방식 또는 유사한 방식으로, 제어부(320)는 제2 집합 문서 중 적어도 일부를 분석하여 각 대표 속성 키워드와 가장 연관도가 높은 하위 키워드들을 미리 설정된 개수만큼 추출할 수 있다.In this manner or the like, the control unit 320 may analyze at least a part of the second set of documents and extract a predetermined number of the sub-keywords having the highest relevance with each representative attribute keyword.

단계 530에서 제어부(320)는 상기 제2 집합 문서들로부터 상기 대표 속성 키워드 후보집합 내 각 대표 속성 키워드와 하위 키워드 쌍에 대응되는 연관 가중치를 추출할 수 있다.In step 530, the controller 320 may extract association weight corresponding to each representative attribute keyword and a lower keyword pair in the representative attribute keyword candidate set from the second set documents.

도 7은 본 명세서의 일 실시 예에 따르는 단계 530의 상세 순서도이다.7 is a detailed flowchart of step 530 according to one embodiment of the present disclosure.

단계 710에서 제어부(320)는 상기 제2 집합 문서 중 적어도 일부를 분석하여 상기 하위 키워드들 사이의 상호 연관도를 추출할 수 있다. 예를 들어 대표 속성 키워드 A1에 대해 연관된 하위 키워드로서 수집된 것이 B11 내지 B150의 50개 하위 키워드라고 가정한다. 이 경우 제어부(320)는 이들 50개 하위 키워드들에 대해 두 하위 키워드가 같은 문서에 함께 등장하는 빈도를 이용하여 두 하위 키워드 사이의 상호 연관도를 추출할 수 있다. B11 과 B12가 같은 문서에 등장하는 빈도에 따라 B11 과 B12 사이의 상호 연관도가 결정된다. 다른 실시 예에 따르면 B11 과 B12 같은 문서에 등장하는 빈도가 상호 연관도에 영향을 주는 것에 더하여, B11 과 B12가 같은 문서에 등장하는 경우 두 키워드 B11 과 B12 사이의 거리(또는 두 키워드가 등장하는 문장 사이의 거리)가 가까울수록 높은 상호 연관도가 인정될 수 있다. 비슷한 방식으로 하위 키워드들 사이의 상호 연관도가 추출될 수 있다. 키워드 사이의 거리 또는 키워드와 문장 사이의 거리는 예를 들어 두 키워드 또는 키워드와 문장 사이에 위치하는 문장의 개수, 두 키워드 또는 키워드와 문장 사이에 위치하는 단어의 개수, 두 키워드 또는 키워드와 문장 사이에 위치하는 어절의 개수, 두 키워드 또는 키워드와 문장 사이에 위치하는 문자의 개수 중 어느 하나 이상을 기준으로 판단될 수 있다.In step 710, the control unit 320 may analyze at least a part of the second set of documents to extract the degree of correlation between the sub-keywords. For example, it is assumed that the keyword of the 50 sub-B1 1 to B1 50 collected as the associated sub-keyword for representing attribute keywords A1. In this case, the controller 320 can extract the degree of correlation between the two lower keywords using the frequencies of the two lower keywords appearing in the same document for the 50 lower keywords. B1 is also interconnected between the first B1 and B1 2 and B1 is determined in accordance with the first frequency to the second appearing in the same document. According to another aspect of the B1 and B1 1 2 In addition to the frequency of appearance in the same document affecting the correlation, if B1 1 and B1 2 appear in the same document, the distance between the two keywords B1 1 and B1 2 (or the distance between the sentences where the two keywords appear) ), The higher the degree of correlation can be recognized. In a similar manner, the correlation between sub-keywords can be extracted. The distance between keywords, or the distance between a keyword and a sentence, can be, for example, the number of sentences between two keywords or between a keyword and a sentence, the number of words located between two keywords or between a keyword and a sentence, The number of words to be located, the number of words to be located, and the number of characters located between two keywords or between a keyword and a sentence.

단계 720에서 제어부(320)는 상기 하위 키워드들 사이의 상호 연관도를 기초로 각 대표 속성 키워드와 하위 키워드 간의 연관 가중치를 추출할 수 있다. 제어부(320)는 예를 들어, 각 대표 속성 키워드에 상응하는 하위 키워드 집합에 대하여, 상기 하위 키워드 집합 내의 특정 하위 키워드와 상기 하위 키워드 집합 내의 다른 하위 키워드 간의 상호 연관도와, 상기 특정 하위 키워드와 상기 대표 속성 키워드 사이의 연관 가중치가, 서로 양의 상관관계를 가지도록 상기 특정 하위 키워드와 상기 대표 속성 키워드 사이의 연관 가중치를 설정할 수 있다.In step 720, the control unit 320 may extract association weights between the representative attribute keywords and the sub-keywords based on the degree of correlation between the lower keywords. For example, the control unit 320 determines, for a set of lower keywords corresponding to each representative attribute keyword, a correlation between a specific lower keyword in the lower keyword set and another lower keyword in the lower keyword set, The association weights between the specific sub keyword and the representative attribute keyword can be set so that the association weights between the representative attribute keywords have a positive correlation with each other.

예를 들어 대표 속성 키워드 A1의 하위 키워드 B11과 A1의 다른 하위 키워드들 (B12 내지 B150) 사이의 상호 연관도가 높을 수록 A1과 B11사이의 연관 가중치가 높게 설정될 수 있다. 예를 들면, B11과 A1의 다른 하위 키워드들 (B12 내지 B150) 사이의 상호 연관도 산술평균(또는 총합)이 B11과 A1 사이의 연관 가중치가 될 수 있다. 단순한 산술평균 대신 기하 평균/조화 평균이 사용될 수도 있다. 하위 키워드 B11과 A1의 다른 하위 키워드들 (B12 내지 B150) 사이의 상호 연관도 중 가장 높은 2개(예시)와 가장 낮은 2개(예시)를 제외하고 평균을 구하는 절삭 평균이 사용될 수도 있다. 상호 연관도의 산술 평균 대신 중앙값(median)이 사용될 수도 있다.For example, the higher the degree of correlation between the lower keyword B1 1 of the representative attribute keyword A1 and the other lower keywords B1 2 to B1 50 of A1, the higher the association weight between A1 and B1 1 can be set. For example, the other sub-keyword of 1 B1 and A1 (B1 B1 2 to 50) is also the arithmetic mean (or total) correlation between this association may be a weight between 1 and B1 A1. Instead of simple arithmetic mean, geometric mean / harmonic mean may be used. It is also possible to use a cutting average that averages except for the two highest (example) and lowest (example) interrelation between the sub keyword B1 1 and the other sub keywords (B1 2 to B 150 ) of A1 have. The median may be used instead of the arithmetic mean of the correlation.

일부 실시 예에 따르면, A1에 대한 B11의 연관 가중치를 계산하기 위해서 사용되는 "B11과 B12 같은 문서에 등장하는 빈도"는 단순히 B11과 B12 같이 등장하는(또는 같은 문장에 등장하는, 또는 근접하여 등장하는) 문서의 개수에 따라 달라지는 것이 아니라, B11과 B12 같이 등장하는(또는 같은 문장에 등장하는, 또는 근접하여 등장하는) 문서의 개수를 B11이 등장하는 문서의 개수 및/또는 B12이 등장하는 문서의 개수로 나누어 구할 수 있다. 유사한 방식으로 "B11과 B12 같은 문서에 등장하는 빈도"는 B11과 B12 같이 등장하는(또는 같은 문장에 등장하는, 또는 근접하여 등장하는) 문서의 개수와 양의 상관관계를 가지고 B11이 등장하는 문서의 개수 및/또는 B12이 등장하는 문서의 개수와 음의 상관관계를 가지도록 설정될 수 있다. 단순하게 흔히 사용되는 단어가 대표 속성 키워드 A1에 높은 연관 가중치를 가지는 것을 방지하기 위한 일종의 노멀라이제이션(normalization)이다. According to some embodiments, the "B1 B1 1 and 2 are used to calculate the associated weight for the 1 B1 for A1 Frequently appearing in the same document "is simply B1 1 and B1 2 It does not depend on the number of documents that appear (or appear in the same sentence or appear in the same sentence), but B1 1 and B1 2 The number of documents that appear together (or appear in the same sentence or appear in close proximity) can be found by dividing by the number of documents in which B1 1 appears and / or the number of documents in which B1 2 appears. In a similar manner "B1 1 and B1 2 Frequently appearing in the same document "is B1 1 and B1 2 It appeared to as (to appear or are in the same sentence, or close to the emergence of) correlation of the number and the notes of the document to the number and the positive correlation between the B1 1 appeared number of documents and / or to have B1 2 appeared in the document Can be set to have a relationship. It is a kind of normalization to prevent a simple commonly used word from having a high associative weight on the representative attribute keyword A1.

도 5로 돌아와서, 단계 540에서 제어부(320)는 상기 제1 집합 문서들로부터 객체 항목과 하위 키워드 간의 하위 연관도를 추출할 수 있다. Returning to FIG. 5, in step 540, the control unit 320 may extract a lower degree of association between the object item and the lower keyword from the first set of documents.

제1 집합 문서들 중에서 객체 항목을 나타내는 객체 키워드(예를 들어 "테일러 스위프트")와 같은 문서, 또는 같은 문장 또는 근접한 문장에 자주 등장한 하위 키워드들은 해당 객체 항목과 연관된 것으로 판단할 수 있다. 제어부(320)는 해당 객체 항목의 객체 키워드가 등장한 문서를 수집하고, 그 문서들 내에 함께 등장한 빈도에 따라 하위 키워드와 객체 키워드 사이의 하위 연관도를 추출할 수 있다. 특히 제어부(320)는 하위 키워드가 객체 키워드와 같은 문장에 등장하면 하위 키워드가 객체 키워드와 다른 문장에 등장한 경우에 비해 하위 키워드와 객체 항목 사이의 연관도가 더 높은 것으로 설정할 수 있다. A document such as an object keyword (e.g., " Taylor Swift ") representing an object item among the first set documents, or a lower keyword frequently appearing in the same sentence or a nearby sentence, can be determined to be associated with the object item. The control unit 320 may collect the document in which the object keyword of the corresponding object item is present and extract the lower degree of association between the lower keyword and the object keyword according to the frequency of coexistence in the documents. In particular, when the lower keyword appears in the same sentence as the object keyword, the control unit 320 can set the higher degree of association between the lower keyword and the object item than when the lower keyword appears in a sentence different from the object keyword.

제어부(320)는 하위 키워드가 등장한 문장이 객체 키워드가 등장한 문장과 근접할 수록 하위 키워드와 해당 객체 키워드의 객체 항목 사이의 연관도가 더 높은 것으로 설정할 수 있다. 두 문장의 근접도는 예를 들어 두 문장 사이에 위치하는 문장의 개수, 두 문장 사이에 위치하는 단어의 개수, 두 문장 사이에 위치하는 어절의 개수, 두 문장 사이에 위치하는 문자의 개수 중 어느 하나 이상을 기준으로 판단될 수 있다. The control unit 320 can set the higher the degree of association between the lower keyword and the object item of the object keyword as the sentence in which the lower keyword appears comes closer to the sentence in which the object keyword appears. The degree of proximity of two sentences can be, for example, the number of sentences located between two sentences, the number of words located between two sentences, the number of words located between two sentences, and the number of characters located between two sentences Can be judged on the basis of one or more.

제어부(320)는 하위 키워드가 등장한 위치가 객체 키워드가 등장한 위치와 근접할 수록 하위 키워드와 해당 객체 키워드의 객체 항목 사이의 연관도가 더 높은 것으로 설정할 수 있다. 하위 키워드와 객체 키워드 사이의 근접도는 예를 들어 하위 키워드와 객체 키워드 사이에 위치하는 문장의 개수, 하위 키워드와 객체 키워드 사이에 위치하는 단어의 개수, 하위 키워드와 객체 키워드 사이에 위치하는 어절의 개수, 하위 키워드와 객체 키워드 사이에 위치하는 문자의 개수 중 어느 하나 이상을 기준으로 판단될 수 있다.The control unit 320 can set the higher the degree of association between the lower keyword and the object item of the object keyword as the position where the lower keyword appears is closer to the position where the object keyword appears. The degree of proximity between the lower keyword and the object keyword is determined by, for example, the number of sentences located between the lower keyword and the object keyword, the number of words located between the lower keyword and the object keyword, Number of characters, number of characters located between the lower keyword and the object keyword, and the like.

단계 550에서 제어부(320)는 단계 540의 하위 연관도 및 단계 530의 연관 가중치를 이용하여 상기 객체 항목과 상기 각 대표 속성 키워드 간의 객체-키워드 연관도를 추출할 수 있다.In step 550, the controller 320 may extract an object-keyword association between the object item and each representative attribute keyword using the lower association diagram of step 540 and the association weights of step 530.

예를 들어 객체 항목 C와 대표 속성 키워드 A1 사이의 객체-키워드 연관도는 C와 A1의 하위 키워드들 (예를 들어 B11 내지 B150) 사이의 하위 연관도 및 각 하위 키워드들의 연관 가중치를 이용하여 추출될 수 있다. 예를 들어 객체 항목 C와 대표 속성 키워드 A1 사이의 객체-키워드 연관도는, 객체 항목 C와 B11 내지 B150 사이의 하위 연관도가 높을수록 높게 설정될 수 있다. For example, the object-keyword association between the object item C and the representative attribute keyword A1 may be determined by using the sub-associations between C and A1 lower keywords (for example, B1 1 to B1 50 ) and the association weights of the respective lower keywords . For example, the object-keyword association between the object item C and the representative attribute keyword A1 may be set to be higher as the lower degree of association between the object item C and B1 1 to B1 50 is higher.

아울러 A1과의 관계에서 연관 가중치가 더 높은 하위 키워드에 대해서 객체 항목 C와의 하위 연관도가 높다면, 연관 가중치가 더 낮은 하위 키워드에 대해서 하위 연관도가 높은 경우에 비하여 객체 C와 대표 속성 키워드 A1 사이의 객체-키워드 연관도가 더 높게 설정될 수 있다. 예를 들어 표 1의 경우가 표 2의 경우보다 연관 가중치 높은 쪽(B11)의 하위 연관도가 높으므로, 표 1의 경우가 표 2의 경우보다 객체 C와 대표 속성 키워드 A1 사이의 객체-키워드 연관도가 높게 설정될 수 있다.In addition, when the subordinate association degree with respect to the object item C is high for the subordinate keyword having a higher association weight in relation to A1, the relation between the object C and the representative attribute keyword A1 May be set to a higher value. For example, in Table 1, since the lower associativity of the higher correlation weight (B1 1 ) is higher than that of Table 2, the case of Table 1 is larger than that of the object C between the object C and the representative attribute keyword A1, The keyword association can be set high.

A1과의 연관 가중치Association weights with A1 C와의 하위 연관도Sub-associativity with C B11 B1 1 0.50.5 0.50.5 B12 B1 2 0.20.2 0.20.2

A1과의 연관 가중치Association weights with A1 C와의 하위 연관도Sub-associativity with C B11 B1 1 0.20.2 0.50.5 B12 B1 2 0.50.5 0.20.2

일 실시 예에 따르면 각 하위 키워드에 대응되는 연관가중치 및 하위 연관도를 곱한 값의 총합으로 (또는 이 총합을 이용하여) 객체 C와 대표 속성 키워드 A1 사이의 객체-키워드 연관도를 구할 수도 있다. 표 1의 경우 0.5×0.5+0.2×0.2=0.29가 되고, 표 2의 경우 0.2×0.5+0.5×0.2=0.20이 되므로, 표 1의 경우가 표 2의 경우보다 객체 C와 대표 속성 키워드 A1 사이의 객체-키워드 연관도가 높게 설정될 수 있다. According to an exemplary embodiment, the object-keyword association between the object C and the representative attribute keyword A1 may be obtained by summing (or using the sum) the values obtained by multiplying the association weights corresponding to the respective lower keywords and the lower association degrees. 0.5 × 0.5 + 0.2 × 0.2 = 0.29 in Table 1, and 0.2 × 0.5 + 0.5 × 0.2 = 0.20 in Table 2, so that the case of Table 1 is between the object C and the representative attribute keyword A1 The object-keyword association degree of the object-keyword can be set high.

상술한 객체-키워드 연관도 산정 방식은 예시적인 것에 불과하고, 단계 540의 C와의 하위 연관도 및 단계 530의 A1과의 연관 가중치가 C 및 A1 사이의 객체-키워드 연관도와 양의 상관관계에 있다면 다른 방식이 사용되어도 무방하다.The above-described object-keyword association calculation method is merely an example. If the association weights between A1 and A5 of step 540 and the object-keyword association between A1 and A1 are positive Other methods may be used.

이후 통신부(310)가 특정 대표 속성 키워드와 연관된 정보 제공 요청을 수신하면, 제어부(320)는 단계 550에서 추출한 객체-키워드 연관도를 기반으로 결과 항목을 통신부(310)를 통해 제공할 수 있다. 예를 들어 어느 하나의 대표 속성 키워드를 포함한 정보 제공 요청을 수신한 경우 제어부(320)는 해당 대표 속성 키워드와의 관계에서 객체-키워드 연관도가 가장 높은 순서대로 객체 항목에 관한 정보를 제공할 수 있다. When the communication unit 310 receives the information providing request associated with the specific representative attribute keyword, the control unit 320 can provide the result item through the communication unit 310 based on the object-keyword association extracted in operation 550. For example, when an information provision request including any one representative attribute keyword is received, the control unit 320 can provide information on the object item in the order of highest object-keyword association in relation to the representative attribute keyword have.

다른 실시 예에서, 둘 이상의 대표 속성 키워드 및 그에 대응되는 가중치를 포함한 정보 제공 요청을 수신한 경우 제어부(320)는 각 객체 항목에 대해 정보 제공 요청에 포함된 대표 속성 키워드들과의 객체-키워드 연관도에 가중치를 곱한(또는 이와 유사하게 가중치를 부가한) 값의 총합(또는 평균)이 가장 높은 순서대로 객체 항목에 관한 정보를 제공할 수 있다.In another embodiment, upon receiving an information provision request including two or more representative attribute keywords and corresponding weight values, the control unit 320 determines an object-keyword association with representative attribute keywords included in the information provision request for each object item Information about an object item can be provided in the order in which the sum (or average) of values obtained by multiplying a figure by a weight (or similarly weighted addition) is highest.

도 8은 본 명세서의 다른 실시 예에 따르는 정보 제공 과정의 순서도이다.8 is a flowchart of an information providing process according to another embodiment of the present invention.

도 8의 실시 예는 도 5의 실시 예와 동일한 과정들에 더해서 단계 520과 단계 530의 사이에 두 단계들(523, 526)을 더 포함하고 있다. 여기서는 중복된 설명을 피하고 단계 523 및 단계 526에 대해서만 설명한다.The embodiment of FIG. 8 further includes two steps 523 and 526 between steps 520 and 530, in addition to the same procedures as the embodiment of FIG. Here, duplicate explanation is avoided and only steps 523 and 526 are described.

단계 523에서 제어부(320)는, 단계 520에서 추출된 하위 키워드들 각각이, 감정 언어(감정어)에 해당하는지 판단한다. 이를 위해 저장부(330) 또는 외부 서버가 감정어 사전(dictionary)를 보유할 수 있다. 감정어 사전은 어떤 단어(키워드)가 감정어인지 여부를 판단하기 위한 도구로서, 예를 들어 감정어 목록을 보유할 수 있다. 감정어 목록에 포함된 키워드는 감정어라고 할 수 있고, 그렇지 않은 키워드는 감정어가 아니라고 판단할 수 있다. 다만 이러한 판단은 사전적 의미에 기반한 것이고, 시대에 따라 변하는 대중의 단어 사용을 반영하지 못할 수 있다. 따라서 제어부(320)는 대표 속성 키워드 자체의 감정어 여부를 판단하지 않고, 대표 속성 키워드에 연관된 하위 키워드들의 감정어 여부를 기준으로 대표 속성 키워드를 활용할지 여부를 판단한다.In step 523, the control unit 320 determines whether each of the lower keywords extracted in step 520 corresponds to the emotion language (emotion word). For this, the storage unit 330 or an external server may have a dictionary of emotions. The speech dictionary is a tool for determining whether a word (keyword) is an emotional word, for example, a word list. The keyword included in the evaluation word list can be said to be an emotional word, and the other keywords can be judged not to be an emotional word. However, these judgments are based on lexical meaning and may not reflect the popular word usage that varies with the times. Accordingly, the control unit 320 determines whether to use the representative attribute keyword based on whether or not the emotion word of the lower keyword associated with the representative attribute keyword is used, without determining whether the representative attribute keyword itself is the emotion word.

다른 실시 예에서 제어부(320)는 감정어 사전에 감정어인 것으로 등록된, 미리 설정된 수 이상의 단어와 연관도가 높은(미리 설정된 값 이상인) 것으로 학습된 다른 단어를 감정어 사전에 추가할 수 있다.In another embodiment, the control unit 320 may add another word learned to be associated with a predetermined number of words or more (higher than a predetermined value), which is registered as an emotion word in the emotion word dictionary, to the emotion word dictionary.

단계 526에서 제어부(320)는 연관된 하위 키워드의 감정 언어 비율(또는 숫자)이 높은 순서대로 미리 설정된 개수의 대표 속성 키워드만을 대표 속성 키워드 후보집합 내에 남기고 나머지를 제거할 수 있다. 이러한 과정을 통해 감정 언어와 거리가 먼 키워드가 감정 언어처럼 취급되는 것을 방지할 수 있다.In step 526, the control unit 320 may leave only a predetermined number of representative attribute keywords in the representative attribute keyword candidate set in descending order of the emotional language ratio (or number) of the associated sub keywords, and remove the rest. Through this process, it is possible to prevent the keyword, which is distant from the emotional language, from being treated as an emotional language.

도 9로 돌아와서, 단계 920에서 제어부(320)는 예약어와 대표 속성 키워드 쌍에 대응하는 기본 예약어-키워드 연관도를 저장부(330)에 저장한다.Returning to FIG. 9, in step 920, the control unit 320 stores the basic word-keyword associations corresponding to the reserved words and representative keyword pairs in the storage unit 330. FIG.

예약어는 대표 속성 키워드들의 가중치로 표현될 수 있는 표현들을 포함할 수 있다. 예를 들어, "심심해"도 예약어가 될 수 있고, "예쁜"도 예약어가 될 수 있다. The reserved word may include expressions that can be expressed by weights of representative attribute keywords. For example, "boredom" can be a reserved word, and "pretty" can be a reserved word.

예약어 "심심해"에 대하여 기본 예약어-키워드 연관도가 높은 대표 속성 키워드는 예를 들어 "재미있는", "흥미진진한", "시간때우기용" 등 심심한 상황을 해결할 수 있는 대표 속성 키워드들을 포함할 수 있다. The representative attribute keyword having a basic reserved word-keyword association with respect to the reserved word " boredom " may include representative attribute keywords capable of solving a bored situation such as "interesting", "exciting", " .

예약어 "예쁜"에 대하여 기본 예약어-키워드 연관도가 높은 대표 속성 키워드는 예를 들어 "아름다운", "귀여운", "눈길을 끄는" 등의 "예쁜"과 유사하거나 "예쁜"을 설명하는 대표 속성 키워드들을 포함할 수 있다.Basic reserved word for the reserved word "pretty" - The representative attribute keyword having a high degree of keyword association is a representative attribute describing similar or "pretty" to "pretty" such as "beautiful", "cute", "eye- Keywords.

단계 920의 과정은 예를 들어 관리자의 입력으로 수행되거나 외부 시스템에서 결정된 기본 예약어-키워드 연관도를 네트워크 또는 저장매체를 통해 전달받아 수행될 수 있다. 다른 실시 예에 따르면 단계 920의 과정은 인터넷, SNS, 뉴스 등 수집 가능한 문서들을 분석하여 도 5 내지 도 8의 과정과 비슷한 방식으로 수행될 수도 있다. 아울러 단계 920의 과정은 후술하는 바와 같이 사용자의 피드백을 반영하는 과정을 포함할 수 있다. The process of step 920 may be performed, for example, by an input of an administrator or by receiving a basic keyword-keyword association determined by an external system through a network or a storage medium. According to another embodiment, the process of step 920 may be performed in a manner similar to that of FIGS. 5 to 8 by analyzing collectable documents such as the Internet, SNS, news, and the like. In addition, the process of step 920 may include a process of reflecting user's feedback as described later.

단계 920의 과정은 도 15 내지 도 17 중 어느 하나를 참조하여 후술하는 방식으로 수행될 수도 있다.The process of step 920 may be performed in a manner to be described later with reference to any one of Figs.

도 11은 본 명세서의 일 실시 예에 따르는 기본 예약어-키워드 연관도의 예시이다.11 is an illustration of a basic reserved word-keyword association according to one embodiment of the present disclosure.

도 11의 실시 예에서 예약어는 모두 q개(C1 내지 Cq)가 있고 대표 속성 키워드는 모두 n개(k1 내지 kn)가 있다. In the embodiment of FIG. 11, there are q words (C 1 to C q ) of all reserved words and n (k 1 to k n ) of representative keyword keywords.

예를 들어 예약어 C5와 대표 속성 키워드 k3의 기본 예약어-키워드 연관도는 v3,5이 된다. For example, the basic word-keyword association of the reserved word C 5 and the representative attribute keyword k 3 is v 3,5 .

단계 930에서 통신부(310)가 단말(200)로부터 수신 예약어를 수신하여 획득하고 수신 예약어를 제어부(320)에게 전달한다.In step 930, the communication unit 310 receives and acquires a receiving reservation word from the terminal 200, and transmits the receiving reservation word to the control unit 320. [

수신 예약어는 단말(200)이 검색 사용자로부터 수신한 예약어이다. 단말(200)은 음성 입력을 전기적 신호(음성 신호)로 변환하여 검색 장치(300)에게 전달할 수 있다. 검색 장치(300)의 제어부(320)는 음성 신호를 분석하여 텍스트로 변환하고 변환 텍스트를 예약어에 매칭시킬 수 있다. 제어부(320)는 또한 음성 신호를 분석하여 음성의 억양이나 높낮이, 빠르기, 호흡 상태 등을 분석하여 정황 정보로서 활용할 수도 있다.The reception reservation word is a reserved word received by the terminal 200 from the search user. The terminal 200 may convert the voice input into an electrical signal (voice signal) and transmit it to the search device 300. The control unit 320 of the search apparatus 300 may analyze the voice signal, convert the voice signal into text, and match the converted text with a reserved word. The control unit 320 may also analyze the voice signal and analyze the voice intonation, the height, the speed, the breathing state, and the like to use the information as context information.

다른 실시 예에 따르면 단말(200)은 음성 입력을 텍스트로 변환하여 변환 텍스트를 검색 장치(300)에게 전달할 수 있다. 단말(200)은 수신한 음성 입력의 억양이나 높낮이, 빠르기, 호흡 상태 등을 분석하여 분석 정보를 검색 장치(300)에게 전달할 수 있다. 검색 장치(300)는 분석 정보를 일종의 정황 정보로서 활용할 수도 있다.According to another embodiment, the terminal 200 may convert the voice input into text and transmit the converted text to the search device 300. The terminal 200 can analyze the received voice input, the height, the speed, the breathing state, and the like and transmit the analysis information to the search device 300. The search device 300 may utilize the analysis information as a kind of context information.

단계 940에서 제어부(320)는 객체-키워드 연관도 및 기본 예약어-키워드 연관도를 이용하여 상기 수신 예약어와 각 객체 항목 쌍에 대응하는 예약어-객체 연관도를 획득한다.In step 940, the control unit 320 obtains a reserved word-object association map corresponding to the received reservation word and each object item pair using the object-keyword association map and the basic reserved word-keyword association map.

도 12는 본 명세서의 일 실시 예에 따르는 단계 940의 상세 순서도이다.12 is a detailed flowchart of step 940 in accordance with one embodiment of the present disclosure.

도 12를 참조하면 단계 1210에서 제어부(320)는 수신 예약어에 대한 각 객체 항목 및 대표 속성 키워드 쌍에 상응하는 조정 객체-키워드 연관도를 획득한다. Referring to FIG. 12, in step 1210, the control unit 320 obtains an adjustment object-keyword association corresponding to each object item and a representative attribute keyword pair with respect to a received reservation word.

일 실시 예에 따르면 제어부(320)는 각 객체 항목 및 대표 속성 키워드 쌍에 대하여 상기 객체 항목 및 상기 대표 속성 키워드 쌍에 상응하는 객체-키워드 연관도에 상기 수신 예약어 및 상기 대표 속성 키워드 쌍에 상응하는 기본 예약어-키워드 연관도를 적용하여 상기 수신 예약어에 대한 각 객체 항목 및 대표 속성 키워드 쌍에 상응하는 조정 객체-키워드 연관도를 획득할 수 있다. According to one embodiment, the control unit 320 assigns object-keyword associativity corresponding to the object item and the representative attribute keyword pair to each of the object item and the representative attribute keyword pair, Keyword associations corresponding to the respective object items and the representative attribute keyword pairs for the reception reservation word can be obtained by applying the basic reserved word-keyword association.

특히 제어부(320)는 각 객체 항목 및 대표 속성 키워드 쌍에 대하여 상기 객체 항목 및 상기 대표 속성 키워드 쌍에 상응하는 객체-키워드 연관도에 상기 수신 예약어 및 상기 대표 속성 키워드 쌍에 상응하는 기본 예약어-키워드 연관도를 곱한 값을 이용하여 상기 수신 예약어에 대한 각 객체 항목 및 대표 속성 키워드 쌍에 상응하는 조정 객체-키워드 연관도를 획득할 수 있다. In particular, the control unit 320 assigns, to each object item and representative attribute keyword pair, an object-keyword association corresponding to the object item and the representative attribute keyword pair based on the reception reservation word and a basic reserved word keyword corresponding to the representative attribute keyword pair Keyword association degree corresponding to each object item and the representative attribute keyword pair with respect to the reception reservation word can be obtained by using a value obtained by multiplying the correlation value by the correlation value.

또한 제어부(320)는 각 객체 항목 및 대표 속성 키워드 쌍에 대하여 상기 객체 항목 및 상기 대표 속성 키워드 쌍에 상응하는 객체-키워드 연관도와 양의 상관 관계를 가지고, 상기 수신 예약어 및 상기 대표 속성 키워드 쌍에 상응하는 기본 예약어-키워드 연관도와 양의 상관 관계를 가지도록 상기 수신 예약어에 대한, 각 객체 항목 및 대표 속성 키워드 쌍에 상응하는 조정 객체-키워드 연관도를 설정할 수도 있다. Also, the controller 320 has a positive correlation with the object-keyword association corresponding to the object item and the representative attribute keyword pair with respect to each object item and the representative attribute keyword pair, Keyword associations corresponding to the respective object items and representative attribute keyword pairs for the reception reservation word so as to have a positive correlation with the corresponding basic reserved word-keyword association.

본 명세서에서 객체-키워드 연관도, 기본 예약어-키워드 연관도, 조정 객체-키워드 연관도, 기본 예약어-하위 키워드 연관도와 기타 연관관계를 나타내는 값은 모두 값이 클수록 더 연관관계가 긴밀한 값인 것으로 가정하였다. 다른 실시 예에서 일부 연관도 값은 연관도 값이 작을수록 연관관계가 긴밀하고 다른 연관도 값은 연관도 값이 클수록 연관관계가 긴밀한 경우에는 그에 맞도록 양의 상관관계-음의 상관관계가 적절히 대체하여 사용될 수 있을 것이다.In this specification, it is assumed that the values of object-keyword association, basic reserved word-keyword association, coordination object-keyword association, basic reserved word-lower keyword association and other association relations are more closely related to each other . In other embodiments, some association values are more closely related to each other as the association values become smaller and the association values become larger as the association values become larger. May be used instead.

예를 들어 제어부(320)는 수신 예약어가 C2일 때 객체 항목 i4 및 대표 속성 키워드 k3 쌍에 상응하는 조정 객체-키워드 연관도를 획득하기 위해서 객체 항목 i4 및 대표 속성 키워드 k3 쌍에 상응하는 객체-연관도 w4,3에 수신 예약어 C2 및 대표 속성 키워드 k3 쌍에 상응하는 기본 예약어-키워드 연관도 v3,4를 적용하여 조정 객체-키워드 연관도를 획득할 수 있다. For example, in order to obtain an adjustment object-keyword association corresponding to the object item i 4 and the representative attribute keyword k 3 pair when the reception reservation word is C 2 , the control unit 320 sets the pair of the object item i 4 and the representative attribute keyword k 3 Keyword association can be obtained by applying the basic reserved word-keyword association v 3 , 4 corresponding to the pair of the reception reservation word C 2 and the representative attribute keyword k 3 to the object-association map w 4 , .

특히 연관도의 적용 방식은 객체-연관도와 기본 예약어-키워드 연관도를 곱하는 방식이 될 수 있다. 예를 들어 제어부(320)는 수신 예약어가 C2일 때 객체 항목 i4 및 대표 속성 키워드 k3 쌍에 상응하는 조정 객체-키워드 연관도를 획득하기 위해서 객체 항목 i4 및 대표 속성 키워드 k3 쌍에 상응하는 객체-연관도 w4,3에 수신 예약어 C2 및 대표 속성 키워드 k3 쌍에 상응하는 기본 예약어-키워드 연관도 v3,2를 곱한 값인 (w4,3Хv3, 2)를 이용하여 조정 객체-키워드 연관도를 획득할 수 있다. 다른 실시 예에서 제어부(320)는 곱하기 대신 조정 객체-키워드 연관도가 w4,3 및 v3,2과 양의 상관 관계를 가지도록 하는 다른 연산/이용 방식을 적용한 함수 f(w4,3, v3, 2)를 활용하여 조정 객체-키워드 연관도를 획득할 수도 있다. 또한 (w4,3Хv3,2)를 조정 객체-키워드 연관도로써 활용하는 방법 및 (w4,3Хv3, 2)에 기타 요인에 기반한 보정을 가하여 조정 객체-키워드 연관도로써 활용하는 방법 모두 활용될 수 있다.In particular, the method of applying the association may be a method of multiplying the association between the object-association and the basic reserved word-keyword. For example, in order to obtain an adjustment object-keyword association corresponding to the object item i 4 and the representative attribute keyword k 3 pair when the reception reservation word is C 2 , the control unit 320 sets the pair of the object item i 4 and the representative attribute keyword k 3 (W 4 , 3 Хv 3, 2 ) which is a value obtained by multiplying the object-association degree w 4,3 corresponding to the received reserved word C 2 and the representative attribute keyword k 3 corresponding to the basic reserved word-keyword association v 3,2 To obtain the adjusted object-keyword association. In another embodiment, the control unit 320 may use the function f (w 4,3 (x, y)), which applies another operation / utilization scheme such that the coordination object-keyword association has a positive correlation with w 4,3 and v 3,2 instead of the multiplication , v 3, 2 ) may be used to obtain the adjusted object-keyword association. In addition (w 4,3 Хv 3,2) to adjust the object - how to utilize as the keyword association, and (w 4,3 Хv 3, 2) applying a correction based on other factors in the adjustment object - to utilize keywords as Relevancy All of the methods can be utilized.

단계 1220에서 제어부(320)는 특정 객체 항목에 대한 상기 조정 객체-키워드 연관도를 누적한 값을 이용하여 예약어-객체 연관도를 획득할 수 있다. 예를 들어 제어부(320)는 특정 객체 항목에 대한 상기 조정 객체-키워드 연관도의 누적값과 양의 상관 관계를 가지도록 상기 수신 예약어 및 상기 특정 객체 항목 쌍에 상응하는 상기 예약어-객체 연관도를 설정할 수 있다. 객체 항목 i4 및 수신 예약어 C2 쌍에 상응하는 예약어-객체 연관도는 예를 들어

Figure pat00001
를 이용하여 획득될 수 있다. f(w4,j,vj,2)는 객체 항목 i4 및 수신 예약어 C2, 키워드 kj에 대응하는 조정 객체-키워드 연관도이다.In step 1220, the control unit 320 may obtain the reserved word-object association using the accumulated value of the adjustment object-keyword association for the specific object item. For example, the control unit 320 may associate the reserved word-object association diagram corresponding to the reception reservation word and the specific object item pair so as to have a positive correlation with the accumulated value of the adjustment object- Can be set. The reserved word-object association diagram corresponding to the pair of the object item i 4 and the reception reservation word C 2 is, for example,
Figure pat00001
. ≪ / RTI > f (w 4, j , v j, 2 ) is an adjustment object-keyword association diagram corresponding to the object item i 4 , the reception reservation word C 2 , and the keyword k j .

예를 들어 객체 항목 i4 및 수신 예약어 C2 쌍에 대응하는 예약어-객체 연관도는

Figure pat00002
이 될 수 있다. 다른 예에서 객체 항목 i4 및 수신 예약어 C2 쌍에 대응하는 예약어-객체 연관도는
Figure pat00003
에 대해 기타 요인에 의한 보정을 가한 값이 될 수 있다.For example, the reserved word-object association diagram corresponding to the pair of object item i 4 and reception reservation word C 2
Figure pat00002
. In another example, the reserved word-object association diagram corresponding to the pair of object item i 4 and reception reservation word C 2
Figure pat00003
And the correction by other factors.

도 9로 돌아와서 단계 950에서 제어부(320)는 수신 예약어에 대응하는 예약어-객체 연관도에 따라 객체 항목을 제공할 수 있다. 예를 들어 수신 예약어 C2에 대응하는 예약어-객체 연관도가 아래 표 3과 같다면 제어부(320)는 표 4의 순서로 객체 항목을 제공할 수 있다.Returning to FIG. 9, in step 950, the control unit 320 may provide the object item according to the reserved word-object association map corresponding to the received reservation word. For example, if the reserved word-object association corresponding to the reception reservation word C 2 is as shown in Table 3 below, the control unit 320 can provide the object item in the order of Table 4. [

객체 항목Object item 수신 예약어와의 예약어-객체 연관도Reserved words with recipient reserved words - Object association diagram i1 i 1 0.230.23 i2 i 2 0.330.33 i3 i 3 0.990.99 i4 i 4 0.840.84

순서order 객체 항목Object item 수신 예약어와의 예약어-객체 연관도Reserved words with recipient reserved words - Object association diagram 1One i3 i 3 0.990.99 22 i4 i 4 0.840.84 33 i2 i 2 0.330.33 44 i1 i 1 0.230.23

즉, 제어부(320)는 수신 예약어에 대응하는 예약어-객체 연관도가 높은 순서대로 객체 항목을 제공할 수 있다. 객체 항목을 제공받은 단말(200)은 표시부(220)를 통해 객체 항목 i3에 대한 정보를 사용자에게 제공할 수 있다. 단말(200)은 필요에 따라 하위 순서의 다른 객체 항목에 대한 정보도 제공할 수 있다. 단말(200)은 표시부(220) 대신 스피커를 통해 음성으로 객체 항목 i3에 대한 정보를 사용자에게 제공할 수 있다.That is, the control unit 320 can provide the object items in the descending order of the reserved word-object associations corresponding to the reserved reserved words. The terminal 200 provided with the object item can provide information about the object item i 3 to the user through the display unit 220. The terminal 200 may also provide information on other object items in descending order as needed. The terminal 200 can provide the user with information about the object item i 3 by voice through the speaker instead of the display unit 220.

도 13은 본 명세서의 다른 실시 예에 따르는 정보 제공 과정의 순서도이다.13 is a flowchart of an information providing process according to another embodiment of the present invention.

도 13 내지 도 17의 과정은 도 5 내지 도 12의 과정을 일부 이용하거나 도 5 내지 도 12의 과정을 일부 변경하여 수행될 수도 있다. 도 13 내지 도 17의 과정을 설명하면서 필요한 경우 도 5 내지 도 12에 관한 설명을 원용할 수 있다.13 to 17 may be performed by using some of the processes of FIGS. 5 to 12 or by partially modifying the processes of FIGS. 5 to 12. FIG. The description of FIGS. 5 to 12 can be used when necessary while explaining the processes of FIGS. 13 to 17. FIG.

도 13을 참조하면, 단계 1310에서 제어부(320)는 제1 집합 문서들로부터 대표 속성 키워드 후보집합을 추출한다. 제어부(320)는 예를 들어 제1 집합 문서 중 관심 분야에 해당하는 문서에 자주 등장하는 키워드들을 대표 속성 키워드 후보집합으로 수집할 수 있다. 단계 1310의 과정은 예를 들어 도 5의 단계 510의 과정과 동일 또는 유사하게 진행될 수 있다. 단계 1310의 과정은 도 6의 과정과 동일 또는 유사한 과정을 통해 진행될 수 있다. 도 6의 과정에 대한 설명은 다시 반복하지 않는다.Referring to FIG. 13, in step 1310, the control unit 320 extracts a representative attribute keyword candidate set from the first set documents. For example, the control unit 320 may collect keywords frequently appearing in a document corresponding to a field of interest among the first set of documents as a representative attribute keyword candidate set. The process of step 1310 may proceed in the same or similar process as, for example, step 510 of FIG. The process of step 1310 may be performed through the same or similar process as the process of FIG. The description of the process of FIG. 6 is not repeated.

단계 1320에서 제어부(320)는 예약어 집합을 설정한다. 예를 들어 관리자가 수동으로 입력하여 예약어 집합이 설정될 수 있다. 변형 예에 따르면, 제어부(320)가 예약어로 적합한 어절/구절 등을 예약어 후보로서 설정하고, 예약어 후보 중 하나 이상을 예약어로서 설정할 수 있는 인터페이스를 제공할 수도 있다.In step 1320, the control unit 320 sets a reserved word set. For example, a set of reserved words may be set by the administrator manually. According to the modified example, the control unit 320 may set an appropriate word / phrase as a reserved word as a reserved word candidate and provide an interface by which one or more of the reserved word candidates can be set as a reserved word.

도 18은 본 명세서의 변형 예에 따르는 단계 1320의 상세 순서도이다.18 is a detailed flowchart of step 1320 according to a modification of the present disclosure.

단계 1810에서 제어부(320)는 하나의 언어단위 또는 둘 이상의 연속된 언어단위들의 문서 집합 내 등장 횟수를 획득한다. 여기서 문서 집합은 도 5의 단계 510 과정에서 사용되는 문서 집합과 같은 문서 집합일 수도 있고 다른 문서 집합이 될 수도 있다.In step 1810, the control unit 320 obtains the number of occurrences in the document set of one language unit or two or more consecutive language units. Here, the document set may be the same document set as the document set used in step 510 of FIG. 5, or may be another document set.

언어단위는 예를 들어 어절/단어/형태소/음절/문자 중 어느 하나가 될 수 있다. 기타 문장을 구분하는 여러 기준으로 나누어진 단위가 본 실시 예에서의 언어단위가 될 수 있다. The language unit may be, for example, a word / word / morpheme / syllable / letter. A unit divided into various criteria for distinguishing other sentences can be the language unit in this embodiment.

제어부(320)는 단계 1810 이전에 문서 집합의 각 문서들이 포함하는 문서들을 어절 단위로 나누어 배열 또는 리스트 등의 형태로 저장할 수 있다. 제어부(320)는 실시 예에 따라 각 어절에서 무의미한 단어, 예를 들어 한국어에서 일부 조사나 '이', '저' 등 지시형용사, 기타 분석에 필요하지 않은 단어들을 어절에서 삭제하거나 배열/리스트에서 제거할 수 있다. 또한 제어부(320)는 실시 예에 따라서 어절이 하나의 단어로 이루어진 경우 해당 단어를 기본형(또는 미리 설정된 형식)으로 전환할 수 있다.The control unit 320 may divide the documents included in the respective documents of the document set before the step 1810 into units of words and store them in the form of an array or a list. The control unit 320 deletes words that are not meaningful in each word, for example, some of the surveys in the Korean language, the instruction adjectives such as 'I' and 'Low', and words not necessary for other analysis, Can be removed. In addition, the control unit 320 may convert the word into a basic type (or a preset type) when the word is composed of one word according to the embodiment.

변형 예에 따르면 제어부(320)는 단계 1810 이전에 문서 집합의 각 문서들이 포함하는 문서들을 단어 단위로 나누어 배열 또는 리스트 등의 형태로 저장할 수 있다. 제어부(320)는 실시 예에 따라 각 단어를 기본형(또는 미리 설정된 형식)으로 전환할 수 있다. 제어부(320)는 실시 예에 따라 무의미한 단어, 예를 들어 한국어에서 일부 조사나 '이', '저' 등 지시형용사, 기타 분석에 필요하지 않은 단어들을 배열/리스트에서 제거할 수 있다.According to the modified example, the control unit 320 may divide the documents included in each document of the document set before the step 1810 into words, and store them in the form of an array, a list, or the like. The control unit 320 can convert each word into a basic type (or a preset type) according to an embodiment. The control unit 320 may remove words that are not meaningful according to the embodiment, for example, some of the surveys in Korean, directive adjectives such as 'i' and 'low', and words not necessary for analysis.

제어부(320)가 문서를 형태소 단위로 또는 음절 단위로 또는 문자 단위로 분할하는 변형 예도 가능하다.It is also possible that the control unit 320 divides the document into morpheme units, syllable units, or character units.

이하의 실시 예에서는 편의를 위해 제어부(320)가 문서를 어절 단위로 분할하고, 각 어절이 언어단위가 되는 것으로 가정한다.In the following embodiments, it is assumed that the control unit 320 divides a document into units of words, for convenience, and each word is a language unit.

단일한 언어단위는 예약어가 될 수 있다. 변형 실시 예에 따르면 둘 이상의 연속된 언어단위 또한 예약어가 될 수 있다. 예를 들어 "깔끔한"(단일한 언어 단위)도 예약어가 될 수 있고, "분위기 좋은"(두 개의 연속된 언어단위)도 예약어가 될 수 있다. 다만 둘 이상의 연속된 언어단위는 단일한 언어단위에 비해 자주 나오기 어려우므로 실시 예에 따라 둘 이상의 연속된 언어단위가 예약어로 선정되도록 하기 위해 예약어 선정 시 둘 이상의 연속된 언어단위에 대해 가중치 또는 추가 점수를 줄 수 있다. 변형 예에 따르면, 예약어 선정 시 둘 이상의 연속된 언어단위에 대해 예약어 선정을 위한 기준치를 더 관대하게 설정할 수도 있다. 예를 들어 단일한 언어단위가 적어도 a번 등장하여야 예약어 후보로 추천될 수 있다면 두 개의 연속된 언어단위는 a보다 훨씬 적은 횟수인 b번만 등장하더라도 예약어 후보로 추천되도록 설정될 수 있고 세 개의 연속된 언어단위는 b보다도 적은 c번만 등장하더라도 예약어 후보로 추천되도록 설정될 수도 있다. 이하 본 명세서에서 둘 이상의 연속된 언어단위를 연속 언어단위라 칭한다.A single language unit can be a reserved word. According to an alternative embodiment, two or more consecutive language units may also be reserved words. For example, "clean" (a single language unit) can be a reserved word, and "good mood" (two consecutive language units) can be a reserved word. However, since two or more consecutive language units are frequently unavailable compared to a single language unit, in order to select two or more consecutive language units as reserved words according to the embodiment, a weight or an additional score . According to the modified example, a reference value for selecting a reserved word can be set more generously for two or more consecutive language units when a reserved word is selected. For example, if a single language unit can be recommended as a reserved word candidate by appearing at least a times, two consecutive language units can be set to be recommended as reserved word candidates even if the number of times b, which is much less than a, The language unit may be set to be recommended as a reserved word candidate even if only c times less than b appears. Hereinafter, two or more consecutive language units are referred to as consecutive language units.

또한 연속 언어단위가 예약어로 추천/선정되는 경우 그 예약어(후보)에 포함된 언어단위 또는 그 예약어(후보)에 포함되며 예약어(후보)보다 짧은 연속 언어단위들은 예약어로 추천되지 않도록 하거나 예약어로 추천되기 위한 점수 산정 시 감점을 할 수 있다. 유사한 예약어가 여럿 선정되거나 추천되는 것을 방지하기 위한 것이다. 이하에서는 설명을 단순화하기 위해 연속 언어단위에 대한 설명을 생략하지만 단일 언어단위에 대한 설명이 연속 언어단위에 대해서도 똑같이 또는 유사하게 적용될 수 있다.Also, when consecutive language units are recommended / selected as reserved words, consecutive language units included in the language unit included in the reserved words (candidates) or reserved words (candidates) and shorter than the reserved words (candidates) are not recommended as reserved words, You can deduct points when you score points. This is to prevent similar reserved words from being selected or recommended. Hereinafter, in order to simplify the description, the description of the continuous language unit is omitted, but the description of the single language unit can be equally or similarly applied to the continuous language unit.

단계 1810에서 언어단위의 등장 횟수는 예를 들어 해당 언어단위가 등장한 문서의 수가 될 수 있다. 한 문서에서 여러 번 해당 언어단위가 등장하더라도 등장횟수는 1회만 인정된다. 다른 실시 예에 따르면, 해당 언어단위가 한 문서에서 여러 번 등장할 경우를 모두 등장 횟수로 인정해서 그 등장 횟수가 언어단위의 등장 횟수가 될 수 있다. In step 1810, the number of occurrences of the language unit may be, for example, the number of documents in which the corresponding language unit appears. Even if a language unit appears multiple times in a document, the number of occurrences is recognized only once. According to another embodiment, the case where the corresponding language unit appears plural times in one document is regarded as the number of occurrences, and the number of occurrences can be the number of occurrences of the language unit.

또다른 실시 예에 따르면 한 문서에서 해당 언어단위가 두 번 이상 반복해서 등장하는 경우 두 번째 이후의 등장은 첫 번째 등장에 비해 낮은 값의 등장으로 인정할 수 있다. 또한 한 문서에서 해당 언어단위의 등장이 반복되면 반복될수록 나중의 등장은 더 낮은 점수로 인정될 수 있다. 등장 횟수가 늘어나면 점수가 높아지지만 기울기가 점차 완만해지는 것이다. 예를 들어 등장 횟수의 1/r제곱(r은 1보다 큰 실수(real number))가 해당 문서에서 해당 언어단위의 등장점수로 사용될 수도 있다. 예를 들어 (등장 횟수의 로그 값)+1 (단 등장 횟수가 0인경우 등장점수는 0) 등이 사용될 수도 있다. 또한 한 문서에서 언어단위의 등장점수는 미리 설정된 상한값을 넘지 않도록 제한될 수도 있다. 해당 언어단위의 등장점수를 모든 문서에 대해서 누적한 값이 해당 언어단위의 등장 횟수에 따른 등장점수가 될 수 있을 것이다. 그리고 이러한 등장점수를 단계 1830에서 활용할 수 있다.According to another embodiment, when a language unit repeatedly appears in a document repeatedly two or more times, the second and subsequent occurrences can be recognized as lower values than the first appearances. Also, if repeatedly appearing in the same language unit in a document, the later appearance can be recognized as a lower score. As the number of appearances increases, the score increases, but the gradient becomes gradual. For example, the number of occurrences of 1 / r squared (r is a real number greater than 1) may be used as an entry point for that language unit in the document. For example, the log value of the number of appearances may be +1 (if the number of occurrences is 0, the appearance score is 0) or the like may be used. Also, the appearance score of each language unit in a document may be limited to not exceed a preset upper limit value. The accumulated value of the appearance score of the corresponding language unit with respect to all the documents may be the appearance score according to the appearance frequency of the corresponding language unit. Such an appearance score can be utilized in step 1830.

이하에서는 편의를 위해 언어단위의 등장 횟수는 해당 언어단위가 등장한 문서의 수인 것으로 가정하고 설명한다.For the sake of convenience, the number of occurrences of a language unit is assumed to be the number of documents in which a corresponding language unit appears.

단계 1820에서 제어부(320)는 언어단위로부터 미리 설정된 거리 이내에 감정어가 위치하는 횟수를 획득한다. 언어단위와 감정어 사이의 거리는 예를 들어 언어단위와 감정어 사이에 위치하는 단어의 개수, 언어단위와 감정어 사이에 위치하는 어절의 개수, 언어단위와 감정어 사이에 위치하는 문자의 개수 중 어느 하나 이상을 기준으로 판단될 수 있다.In step 1820, the control unit 320 obtains the number of times the emotion word is located within a predetermined distance from the language unit. The distance between the language unit and the emotion word may be, for example, the number of words located between the language unit and the emotion word, the number of words located between the language unit and the emotion word, the number of characters located between the language unit and the emotion word It can be judged based on any one or more.

또한 언어단위와 감정어가 서로 다른 문장에 속한 경우 언어단위와 감정어 사이에 위치하는 단어/어절/문자 개수와 무관하게 제어부(320)는 감정어가 언어단위로부터 미리 설정된 거리 이내에 위치하지 않는 것으로 판단할 수도 있다. 다른 변형예에 따르면 언어단위와 감정어가 서로 다른 문장에 속한 경우 제어부(320)는 문장에 대한 판단을 배재하여 계산한 거리에 일정한 숫자를 더하여 거리를 계산할 수도 있다. 언어단위와 감정어가 서로 다른 문장에 속하는 경우 서로 연관성이 없을 확률이 비교적 높아지기 때문에 감정어 사이에 위치하는 단어/어절/문자 개수보다 거리를 더 멀게 평가하는 것이 바람직하기 때문이다.Also, when the language unit and the emotion word belong to different sentences, the control unit 320 determines that the emotion word is not located within a predetermined distance from the language unit regardless of the word / word / character positions located between the language unit and the emotion word It is possible. According to another modified example, when the language unit and the emotion word belong to different sentences, the control unit 320 may calculate distances by adding a certain number to the distance calculated by excluding judgment on the sentence. When the language unit and the emotional word belong to different sentences, it is preferable to evaluate the distance more than the number of words / phrases / characters located between the emotional words because the probability that they are not related to each other is relatively high.

특정 단어(어절)의 감정어 여부는 미리 등록된 감정어 사전에 조회하여 확인할 수 있다.Whether or not an emotion word of a specific word (a word phrase) can be confirmed by inquiring in a registered emotion word dictionary.

언어단위로부터 일정 거리 이내에 감정어가 위치하는 횟수는 예를 들어 일정 거리 이내에 해당 언어단위와 감정어가 함께 위치한 문서의 수가 될 수 있다. 한 문서에서 여러 번 해당 언어단위와 감정어가 일정 거리이내에 함께 등장하더라도 등장횟수는 1회만 인정된다. 다른 실시 예에 따르면, 한 문서의 해당 언어단위 중 일정 거리 이내에 감정어가 위치한 언어단위가 여럿인 경우 그 여러 언어단위를 모두 언어단위로부터 일정 거리 이내에 감정어가 위치하는 횟수로 인정할 수 있다. 이하에서는 일정 거리 이내에 감정어가 위치하는 언어단위를 감정어 위치 언어단위라고 칭한다.The number of times the emotion word is located within a certain distance from the language unit may be, for example, the number of documents in which the language unit and the emoticon are located together within a predetermined distance. Even if a language unit and a sentence appear in a document several times within a certain distance, the number of appearances can be recognized only once. According to another embodiment, when there are a plurality of language units in which a language is located within a certain distance of a language unit of a document, all the language units can be recognized as the number of positions where the language is located within a certain distance from the language unit. Hereinafter, a language unit in which an emotion word is located within a certain distance is referred to as an emotion word position language unit.

또다른 실시 예에 따르면 한 문서에서 감정어 위치 언어단위가 두 번 이상 반복해서 등장하는 경우 두 번째 이후의 등장은 첫 번째 등장에 비해 낮은 값의 등장으로 인정할 수 있다. 또한 한 문서에서 해당 감정어 위치 언어단위의 등장이 반복되면 반복될수록 나중의 등장은 더 낮은 점수로 인정될 수 있다. 등장 횟수가 늘어나면 점수가 높아지지만 기울기가 점차 완만해지는 것이다. 예를 들어 등장 횟수의 1/r제곱(r은 1보다 큰 실수(real number))가 해당 문서에서 해당 감정어 위치 언어단위의 등장점수로 사용될 수도 있다. 예를 들어 (등장 횟수의 로그 값)+1 (단, 등장 횟수가 0인경우 등장점수는 0) 등이 사용될 수도 있다. 또한 한 문서에서 감정어 위치 언어단위의 등장점수는 미리 설정된 상한값을 넘지 않도록 제한될 수도 있다. 해당 감정어 위치 언어단위의 등장점수를 모든 문서에 대해서 누적한 값이 해당 언어단위의 등장 횟수에 따른 등장점수가 될 수 있을 것이다. 그리고 이러한 등장 점수가 단계 1830에서 활용될 수 있다. According to another embodiment, when a language unit of a sentence is repeated twice or more in a document, the appearance after the second can be recognized as the appearance of a lower value than the first appearance. In addition, the repetition of the appearance of the corresponding unit of language in a document can be recognized as a lower score as the repetition is repeated. As the number of appearances increases, the score increases, but the gradient becomes gradual. For example, 1 / r squared (r is a real number greater than 1) of the number of occurrences may be used as the appearance score of the corresponding emotional word position language unit in the document. For example, a log value of the number of appearances + 1 (where the appearance score is 0 if the number of occurrences is 0) may be used. In addition, the appearance score of the emotion word position language unit in one document may be limited not to exceed a preset upper limit value. The accumulated value of the appearance score of the corresponding language position language unit for all the documents will be the appearance score according to the appearance frequency of the corresponding language unit. And such an appearance score may be utilized at step 1830. [

또 다른 실시 예에 따르면 하나의 언어단위에 대하여 일정 거리 이내에 위치하는 감정어의 개수가 많을수록 등장점수를 더 높게 인정할 수도 있다. 아울러 하나의 언어단위에 대하여 더 가까운 거리 내에 감정어가 있는 경우 등장점수를 더 높게 인정할 수도 있다. 또한 하나의 언어단위에 대하여 하나가 아닌 둘 이상의 미리 설정된 개수의 감정어가 있을 경우에만 등장점수(등장횟수)가 인정될 수도 있다. According to another embodiment, the more the number of emotion words located within a certain distance with respect to one language unit, the higher the appearance score may be. In addition, if there is an emotional word within a shorter distance for a single language unit, the higher the score of appearance can be. In addition, an appearance score (the number of appearances) may be recognized only when there are two or more predetermined number of emotion words for one language unit.

이하에서는 편의를 위해 감정어 위치 언어단위의 등장 횟수는 해당 언어단위로부터 미리 설정된 거리 이내에 감정어가 등장한 문서의 수인 것으로 가정하고 설명한다.Hereinafter, it is assumed that the number of occurrences of the unit of language in the sentence position language is the number of documents in which the sentence has appeared within a predetermined distance from the corresponding language unit.

단계 1830에서 제어부(320)는 해당 언어단위의 등장 횟수 및 언어단위로부터 일정 거리 이내에 감정어가 위치하는 횟수를 고려하여 예약어 후보를 설정한다.In step 1830, the control unit 320 sets a reserved word candidate in consideration of the appearance frequency of the language unit and the number of times the emotion word is located within a certain distance from the language unit.

예를 들어 제어부(320)는 언어단위의 등장횟수 및 일정 거리 이내에 감정어가 위치한 횟수를 곱해서(또는 기타 두 변수에 대해 양의 상관관계를 가지는 연산 방식에 따라) 감정어 점수로 환산할 수 있다. 그리고 점수가 높은 순서대로 미리 설정된 일정한 개수가 예약어 후보로 설정될 수 있다. 또는 미리 설정된 점수 이상에 해당하는 언어단위가 예약어 후보로 설정될 수도 있다.For example, the control unit 320 may multiply the number of occurrences of the language unit and the number of times the emotion word is located within a certain distance (or according to a calculation method having a positive correlation with respect to the other two variables) as the emotion word score. And a predetermined number of preset words can be set as reserved word candidates in descending order of scores. Alternatively, a language unit corresponding to a predetermined score or more may be set as a reserved word candidate.

언어단위Language unit 등장횟수Number of appearances 감정어 위치 횟수Number of positions 점수score 제1 언어단위First language unit 30033003 11221122 33693663369366 제2 언어단위Second language unit 20012001 18201820 36418203641820 제3 언어단위Third language unit 31213121 13001300 40573004057300 제4 언어단위Fourth language unit 200200 110110 2200022000

표 5의 예시에서는 제3 언어단위->제2 언어단위->제1 언어단위->제4 언어단위 순서로 예약어 후보가 될 수 있다. 제어부(320)가 예약어 후보 2개를 추천한다면 제3 언어단위 및 제2 언어단위가 추천될 것이다. 제어부(320)가 점수 3백만점 이상의 언어단위를 예약어 후보로서 추천한다면 제3 언어단위, 제2 언어단위 및 제1 언어단위가 순서대로 예약어 후보로서 추천될 것이다. In the example of Table 5, a reserved word candidate can be a third language unit -> a second language unit -> a first language unit -> a fourth language unit sequence. If the control unit 320 recommends two reserved word candidates, the third language unit and the second language unit will be recommended. The third language unit, the second language unit, and the first language unit will be recommended as reserved word candidates in order if the control unit 320 recommends a language unit of 3 million or more points as a reserved word candidate.

다른 실시 예에 따르면, 제어부(320)는 언어단위의 등장횟수 순서로 제1 개수만큼의 언어단위들을 뽑아낸 뒤 뽑아낸 언어단위들의 일정거리 내에 감정어가 등장한 횟수(또는 감정어 점수)를 기준으로 한 순서대로 일정한 개수의 예약어 후보를 추출해 낼 수 있다. 표 5의 예시에서 등장횟수 순서로 3개의 언어단위를 뽑아낸다면 제1 내지 제3 언어단위가 추출될 수 있다. 감정어 등장 횟수를 기준으로 하면 제2 언어단위, 제3 언어단위 및 제1 언어단위의 순서대로 예약어 후보가 추천될 수 있다.According to another embodiment, the control unit 320 extracts a first number of language units in order of the number of times of language unit appearance, and then, based on the number of times the emotion word appears (or the score of the emotion word) within a certain distance of the extracted language units A predetermined number of reserved word candidates can be extracted in one sequence. In the example of Table 5, if three language units are extracted in order of appearance frequency, the first to third language units can be extracted. Based on the number of appearance of emotion words, a reserved word candidate can be recommended in order of a second language unit, a third language unit, and a first language unit.

또 다른 실시 예에 따르면, 제어부(320)는 언어단위의 등장횟수 순서로 제1 개수만큼의 언어단위들을 뽑아낸 뒤 뽑아낸 언어단위들의 일정거리 내에 감정어가 등장한 횟수(또는 감정어 점수)를 기준으로 한 순서대로 제2 개수(단, 제2 개수는 제1 개수 미만임)의 예약어 후보를 추출해 낼 수 있다. 표 5의 예시에서 등장횟수 순서로 3개의 언어단위를 뽑아낸다면 제1 내지 제3 언어단위가 추출될 수 있다. 감정어 등장 횟수를 기준으로 2개의 언어단위를 추출한다면 제2 언어단위 및 제3 언어단위의 순서대로 예약어 후보가 추천될 수 있다.According to another embodiment, the control unit 320 extracts a first number of language units in the order of the number of appearance of the language unit, and then sets the number of times (or the number of the words of the sentence) appearing in the predetermined distance of the extracted language units The second number (the second number is less than the first number) can be extracted. In the example of Table 5, if three language units are extracted in order of appearance frequency, the first to third language units can be extracted. If two language units are extracted based on the number of emotion words, a reserved word candidate may be recommended in order of the second language unit and the third language unit.

제어부(320)는 기타 상술한 방식과 유사하거나 다소 상이한 방식으로, 예약어 후보 선택을 위한 점수가 단계 1810의 언어단위의 등장횟수와 양의 상관관계를 가지고 단계 1820의 미리 설정된 거리 이내에 감정어가 위치하는 언어단위의 등장횟수와도 양의 상관관계를 가지도록 예약어 후보 선택을 위한 점수를 설정하고 이 점수를 이용하여 예약어 후보를 추천할 수 있다.The control unit 320 determines whether the score for the reserved word candidate selection is positively correlated with the number of appearances of the language unit of the step 1810 and the emotional word is located within a predetermined distance of the step 1820 in a manner similar or somewhat different from the above- A score for selecting a reserved word can be set so as to have a positive correlation with the number of occurrences of the language unit, and the reserved word candidate can be recommended using the score.

아울러 제어부(320)는 이미 예약어 집합에 포함된 언어단위는 예약어 후보로 추가되지 않도록 처리할 수 있다. 또한, 제어부(320)는 예약어 집합에 포함된 예약어와 실질적으로 동일한 언어단위는 예약어 후보로 추가되지 않도록 처리할 수 있다.In addition, the control unit 320 may process the language unit already included in the reserved word set so as not to be added as a reserved word candidate. In addition, the control unit 320 may process the language unit substantially the same as the reserved words included in the reserved word set so as not to be added as a reserved word candidate.

단계 1840에서 정보 제공 장치(300)는 단말(200)에게 예약어 후보 정보를 포함하는 예약어 선택 인터페이스를 생성하기 위한 인터페이스 정보를 제공한다. 인터페이스 정보는 예를 들어 html형식의 문서가 될 수 있다. 다른 실시 예에 따르면, 인터페이스 정보는 인터페이스를 생성하기 위해 필요한 동적 정보(추천되는 예약어 후보 등)만을 포함하고, 단말(200)은 이러한 동적 정보를 단말(200)에 미리 저장돼 있던 페이지 형태에 반영하는 방식으로 인터페이스를 포함한 페이지를 사용자에게 제공할 수 있다.In step 1840, the information providing apparatus 300 provides the terminal 200 with interface information for generating a reserved word selection interface including the reserved word candidate information. The interface information can be, for example, an HTML document. According to another embodiment, the interface information includes only dynamic information (recommended reserved word candidates, etc.) necessary for generating an interface, and the terminal 200 reflects this dynamic information to the page type previously stored in the terminal 200 To provide the user with a page including the interface.

제어부(320)는 예약어 후보 정보를 포함하는 예약어 선택 인터페이스를 포함하는 페이지를 생성하기 위한 페이지 정보를 생성하고 통신부(310)가 페이지 정보를 단말(200)에게 제공할 수 있다. 단말(200)은 사용자에게 해당 인터페이스를 포함하는 페이지를 렌더링하여 표시할 수 있다. 변형 실시 예에 따르면 시각적 페이지에 포함된 인터페이스 대신 소리에 의한 인터페이스 또는 현재까지 알려졌거나 미래에 알려질 기술에 의한 인터페이스가 제공될 수도 있다. 아래에서는 편의를 위해 시각적 페이지에 포함된 인터페이스가 제공되는 것으로 가정하고 설명한다.The control unit 320 may generate page information for generating a page including a reserved word selection interface including the reserved word candidate information and the communication unit 310 may provide page information to the terminal 200. [ The terminal 200 may render a page including the corresponding interface to the user and display the rendered page. According to an alternative embodiment, an interface by sound instead of an interface included in the visual page, or an interface by a technology known to the future or known in the future may be provided. For the sake of simplicity, it is assumed that the interface included in the visual page is provided below.

도 19는 단계 1840에서 제공되는 인터페이스 정보에 따라 생성된 인터페이스(1900)의 예시이다.FIG. 19 is an illustration of interface 1900 generated in accordance with the interface information provided in step 1840.

도 19를 참조하면, 인터페이스(1900)는 체크박스 열(column)(1910), 예약어 후보 열(1920), 상세보기 열(1930)로 이루어진 표를 포함한다. 또한 인터페이스(1900)는 예약어 추가 버튼(1940), 후보 삭제 버튼(1950), 보관함에 넣기 버튼(1960)을 포함할 수 있다. 사용자는 체크박스 열(1910)에서 원하는 예약어 후보(들)을 선택한 뒤 예약어 추가 버튼(1940), 후보 삭제 버튼(1950), 보관함에 넣기 버튼(1960) 중 어느 하나를 선택하여 예약어 후보를 처리할 수 있다. 어느 하나의 버튼이 선택되면 단말(200)은 사용자의 입력을 변환한 입력 정보를 정보 제공 장치(300)에게 전달할 수 있다. Referring to FIG. 19, the interface 1900 includes a check box column 1910, a reserved word candidate column 1920, and a detail view column 1930. The interface 1900 may also include a reserved word addition button 1940, a candidate deletion button 1950, and a store button 1960. The user selects a desired reserved word candidate (s) from the check box column 1910 and selects either the reserve word add button 1940, the candidate delete button 1950, or the store button 1960 to process reserved word candidates . When one of the buttons is selected, the terminal 200 can transmit the input information converted by the user to the information providing apparatus 300.

정보 제공 장치(300)는 단말(200)로부터 전달받은 입력 정보에 따라 예약어 후보를 처리할 수 있다. 예를 들어, 사용자가 일부 예약어 후보(이하 '선택된 후보')의 체크박스(1910)를 선택하고 예약어 추가 버튼(1940)을 선택하면 이와 관련된 입력 정보를 전달받은 정보 제공 장치(300)의 제어부(320)는 예약어 집합에 선택된 후보들을 추가하고 예약어 후보 집합에서 선택된 후보들을 삭제할 수 있다. 제어부(320)는 향후 예약어 후보 추천 시 예약어 집합에 포함된 언어 단위(들) 및 예약어 집합에 포함된 언어 단위(들)과 실질적으로 동일한 언어단위(들)을 예약어 후보로 추천하지 않도록 제어한다. The information providing apparatus 300 can process a reserved word candidate according to input information received from the terminal 200. [ For example, if the user selects a check box 1910 of a reserved word candidate (hereinafter, 'selected candidate') and selects a reserved word adding button 1940, the control unit of the information providing apparatus 300 320 may add selected candidates to the reserved word set and delete selected candidates from the reserved word candidate set. The control unit 320 controls not to recommend the language unit (s) included in the reserved word set and the language unit (s) substantially identical to the language unit (s) included in the reserved word set as reserved word candidates in the future.

다른 예에 따르면, 사용자가 일부 예약어 후보의 체크박스(1910)를 선택하고 예약어 후보 삭제 버튼(1950)을 선택하면 이와 관련된 입력 정보를 전달받은 정보 제공 장치(300)의 제어부(320)는 예약어 제외 집합에 선택된 후보들을 추가하고 예약어 후보 집합에서 선택된 후보들을 삭제할 수 있다. 제어부(320)는 향후 예약어 후보 추천 시 예약어 제외 집합에 포함된 언어 단위(들) 및 예약어 제외 집합에 포함된 언어 단위(들)과 실질적으로 동일한 언어단위(들)을 예약어 후보로 추천하지 않도록 제어한다. According to another example, when the user selects a check box 1910 of a certain reserved word candidate and selects a reserved word candidate deletion button 1950, the control unit 320 of the information providing apparatus 300, which receives the input information related thereto, Add the selected candidates to the set and delete the selected candidates from the reserved word candidate set. The control unit 320 controls the language unit (s) included in the reserved word excluded set and the language unit (s) substantially included in the reserved word excluded set to be not recommended as reserved word candidates do.

또 다른 예에 따르면, 사용자가 일부 예약어 후보의 체크박스(1910)를 선택하고 보관함에 넣기 버튼(1960)을 선택하면 이와 관련된 입력 정보를 전달받은 정보 제공 장치(300)의 제어부(320)는 예약어 후보 보관 집합에 선택된 후보들을 추가하고 예약어 후보 집합에서 선택된 후보들을 삭제할 수 있다. 제어부(320)는 향후 예약어 후보 추천 시 예약어 후보 보관 집합에 포함된 언어 단위(들) 및 예약어 후보 보관 집합에 포함된 언어 단위(들)과 실질적으로 동일한 언어단위(들)을 예약어 후보로 추천하지 않도록 제어한다. According to another example, when the user selects a check box 1910 of a certain reserved word candidate and selects a put in storage box 1960, the control unit 320 of the information providing apparatus 300, which receives the input information related thereto, The selected candidates may be added to the candidate storage set and the candidates selected from the reserved word candidate set may be deleted. The control unit 320 does not recommend the language unit (s) included in the reserved word candidate storage set and the language unit (s) substantially the same as the reserved language candidate (s) included in the reserved word candidate storage set .

버튼들(1940, 1950, 1960) 대신 버튼과 유사한 다른 인터페이스 또는 버튼의 역할을 대신할 수 있는 다른 인터페이스가 활용될 수도 있다.Other interfaces may be used instead of the buttons 1940, 1950, and 1960, which may take the place of other interfaces or buttons similar to buttons.

또한 제어부(320)는 예약어 집합에서 예약어를 일부 삭제하기 위한 인터페이스를 제공할 수 있다. 제어부(320)는 예약어 제외 집합의 일부 언어단위가 추천에서 제외되지 않도록 예약어 제외 집합에서 언어단위를 제거하기 위한 인터페이스를 제공할 수 있다. 제어부(320)는 예약어 후보 보관 집합의 언어단위를 도 19와 유사한 목록 인터페이스의 형태로 제공하고, 그 목록 인터페이스를 통해 사용자가 예약어 후보 보관 집합의 일부 언어단위를 예약어로 추가하도록 할 수 있다. 또한 사용자는 상기 목록 인터페이스를 통해 예약어 후보 보관 집합의 일부 언어단위를 예약어 제외 집합에 포함되도록 하고 예약어 후보 보관 집합에서 삭제할 수도 있다. 이 경우 해당 언어단위는 더이상 예약어 후보 보관 집합의 목록 인터페이스를 통해 제공되지 않으며 도 19의 인터페이스(1900)를 통해서도 예약어 후보로서 추천되지 않는다. 또한 사용자는 상기 목록 인터페이스를 통해 예약어 후보 보관 집합의 일부 언어단위를 단순히 예약어 후보 보관 집합에서 삭제할 수도 있다. 이 경우 해당 언어단위는 더이상 예약어 후보 보관 집합의 목록 인터페이스를 통해 제공되지 않지만 도 19의 인터페이스(1900)를 통해서 예약어 후보로서 추천될 수는 있다.In addition, the control unit 320 may provide an interface for partially deleting a reserved word from the reserved word set. The control unit 320 may provide an interface for removing the language unit from the reserved word exclusion set so that some language units of the reserved word exclusion set are not excluded from the recommendation. The control unit 320 may provide the language unit of the reserved word candidate storage set in the form of a list interface similar to that of FIG. 19, and allow the user to add a partial language unit of the reserved word candidate storage set as a reserved word. In addition, a user may delete some of the language units of the reserved word candidate storage set from the reserved word candidate storage set so as to be included in the reserved word elimination set through the list interface. In this case, the language unit is no longer provided through the list interface of the reserved word candidate archive set, nor is it recommended as a reserved word candidate through the interface 1900 of FIG. Also, the user may delete some language units of the reserved word candidate storage set from the reserved word candidate storage set through the list interface. In this case, the language unit is no longer provided through the list interface of the reserved word candidate archive set, but it can be recommended as a reserved word candidate through the interface 1900 of FIG.

또한 인터페이스(1900)는 예약어 후보가 한 페이지에 모두 보여지지 못할 경우에 대비하여 페이지 이동을 위한 이전 페이지 버튼(1970) 및/또는 다음 페이지 버튼(1980)을 포함할 수 있다. 이전 페이지 버튼(1970) 및/또는 다음 페이지 버튼(1980)은 실제 후보의 개수 및 현재 페이지 위치에 따라 선택적으로 제공될 수 있다. 아울러 이전 페이지 버튼(1970) 및/또는 다음 페이지 버튼(1980) 대신 스크롤을 통해 확장되는 인터페이스가 제공될 수도 있다. 일부 인터페이스에서는 1910,1920, 1930 항목을 포함하는 표만 스크롤되고 버튼들(1940, 1950, 1960, 1970, 1980)은 스크롤에서 제외될 수도 있다.In addition, the interface 1900 may include a previous page button 1970 and / or a next page button 1980 for page movement in case the reserved word candidate can not be displayed on one page. The previous page button 1970 and / or the next page button 1980 may be optionally provided according to the number of actual candidates and the current page position. An interface may also be provided that expands through scrolling instead of the previous page button 1970 and / or next page button 1980. [ In some interfaces, only the table containing entries 1910, 1920 and 1930 may be scrolled and the buttons 1940, 1950, 1960, 1970, 1980 may be excluded from scrolling.

사용자는 상세보기(1930)를 선택하여 예약어 후보가 추천된 배경이나 관련 정보를 상세히 조회할 수도 있다. 상세보기(1930)를 선택하였을 때 제어부(320)가 제공하는 인터페이스는 해당 예약어 후보에 대한 정보 및 해당 예약어 후보를 예약어로 추가하거나 예약어 후보 보관 집합에 추가하거나 예약어 제외 집합에 추가하기 위한 인터페이스를 포함할 수 있다.The user may select the detailed view 1930 to inquire in detail the background or related information for which the reserved word candidate is recommended. The interface provided by the control unit 320 when the detailed view 1930 is selected includes an interface for adding information about the reserved word candidate and the reserved word candidate to a reserved word or adding it to a reserved word candidate storage set or adding it to a reserved word excluding set can do.

기타 예약어 후보를 관리하기 위한 인터페이스가 제어부(320)에 의하여 단말(200)을 통해 사용자에게 제공될 수 있다.An interface for managing other reserved word candidates may be provided to the user through the terminal 200 by the control unit 320. [

도 18로 돌아와서, 단계 1850에서 제어부(320)는 예약어를 선택하는 입력에 따라 선택된 예약어 후보를 예약어 집합에 추가할 수 있다. Returning to FIG. 18, in step 1850, the control unit 320 may add the selected reserved word candidate to the reserved word set according to an input for selecting a reserved word.

도 13으로 돌아와서 단계 1330에서 제어부(320)는 객체 항목과 대표 속성 키워드 쌍에 대응하는 객체-키워드 연관도를 저장한다. Returning to FIG. 13, in step 1330, the control unit 320 stores the object-keyword association diagram corresponding to the object item and the representative attribute keyword pair.

도 10은 본 명세서의 일 실시 예에 따르는 저장된 객체-키워드 연관도의 예시이다.10 is an illustration of a stored object-keyword association diagram in accordance with one embodiment of the present disclosure.

도 10의 실시 예에서 객체 항목은 모두 m개(i1 내지 im)가 있고 대표 속성 키워드는 모두 n개(k1 내지 kn)가 있다. In the embodiment of FIG. 10, there are m (i 1 to i m ) object items and n (k 1 to k n ) are all representative attribute keywords.

예를 들어 객체 항목 i5와 대표 속성 키워드 k3의 객체-키워드 연관도는 w5,3이 된다. For example, the object-keyword association of the object item i 5 and the representative attribute keyword k 3 is w 5,3 .

단계 1330의 과정은 예를 들어 도 5 내지 도 8의 실시 예들 중 일부에 따라 수행되거나 이와 유사한 과정, 또는 이에 상응하는 과정으로 수행될 수 있다. 다른 실시 예에 따르면 단계 1330의 과정은 관리자의 입력으로 수행되거나 외부 시스템에서 결정된 객체-키워드 연관도를 네트워크 또는 저장매체를 통해 전달받아 수행될 수 있다.The process of step 1330 may be performed, for example, according to some of the embodiments of FIGS. 5 to 8, or a similar process, or a corresponding process. According to another embodiment, the process of step 1330 may be performed by inputting by an administrator or by receiving an object-keyword association determined by an external system through a network or a storage medium.

도 5 내지 도 8의 실시 예에 대해서는 앞서 설명한 바 있으므로 반복된 설명을 생략한다. 다만 도 5 및 도 8의 단계 510에서 수행되는 과정은 도 13의 단계 1310의 과정과 실질적으로 동일하다. 따라서 단계 1330의 과정을 수행함에 있어서 도 5 내지 도 8의 실시 예들이 활용되더라도 단계 510의 과정은 다시 수행되지 않고 단계 1310의 결과가 재활용될 수 있다.Since the embodiments of Figs. 5 to 8 have been described above, repeated description will be omitted. However, the process performed in step 510 of FIGS. 5 and 8 is substantially the same as the process of step 1310 of FIG. Therefore, even if the embodiments of FIGS. 5 to 8 are utilized in performing the process of step 1330, the process of step 510 is not performed again and the result of step 1310 can be recycled.

단계 1340에서 제어부(320)는 대표 속성 키워드와 하위 키워드 쌍에 대응되는 연관 가중치 및 예약어와 하위 키워드 쌍에 대응되는 기본 예약어-하위 키워드 연관도를 이용하여 예약어와 대표 속성 키워드 쌍에 대응하는 기본 예약어-키워드 연관도를 저장부(330)에 저장한다. 단계 1340의 과정은 예를 들어 관리자의 입력에 따라 수행되거나 도 15 내지 도 17 중 어느 하나 이상의 실시 예에 따라 수행될 수 있다. In step 1340, the control unit 320 generates a basic reserved word corresponding to the reserved word and the representative attribute keyword pair using the associative weight corresponding to the representative attribute keyword and the lower keyword pair, The keyword association is stored in the storage unit 330. The process of step 1340 may be performed, for example, according to an input of an administrator, or may be performed according to any one or more of the embodiments of Figs.

단계 1340의 과정 이전에, 또는 단계 1340의 과정 도중에 하위 키워드가 결정되고, 대표 속성 키워드와 하위 키워드 쌍에 대응되는 연관 가중치가 결정되고, 예약어와 하위 키워드 쌍에 대응되는 기본 예약어-하위 키워드 연관도가 결정되어야 한다. Prior to the process of step 1340 or during the process of step 1340, the lower keywords are determined, the association weights corresponding to the representative attribute keywords and the lower keyword pairs are determined, and the basic reserved word-lower keyword associations Should be determined.

단계 1340의 과정에 사용되는 하위 키워드는 단계 1330의 과정 도중 단계 520이 수행되면서 결정될 수 있다. 이 경우 단계 520의 하위 키워드가 단계 1340에서 사용될 수 있다. 단계 1330에서 하위 키워드가 결정되지 않는 경우 도 5의 단계 520 및 그 이전의 과정과 동일하거나 유사한 과정을 통해 하위 키워드가 결정될 수 있다.The sub keyword used in the process of step 1340 may be determined while step 520 is performed during the process of step 1330. [ In this case, the lower keyword of step 520 may be used in step 1340. If the lower keyword is not determined in step 1330, the lower keyword may be determined through a process similar to or similar to the process of step 520 of FIG.

단계 1340의 과정에 사용되는 연관 가중치는 단계 1330의 과정 도중 단계 530이 수행되면서 결정될 수 있다. 이 경우 단계 530의 연관 가중치가 단계 1340에서 사용될 수 있다. 단계 1330에서 연관가중치가 결정되지 않는 경우 도 5의 단계 530 및 그 이전의 과정과 동일하거나 유사한 과정을 통해 연관 가중치가 결정될 수 있다.The association weights used in the process of step 1340 may be determined while step 530 is performed during the process of step 1330. [ In this case, the association weights of step 530 may be used in step 1340. If the association weights are not determined in step 1330, the association weights can be determined through a process that is the same as or similar to the process of step 530 and preceding steps of FIG.

기본 예약어-하위 키워드 연관도는 예를 들어 예약어와 하위 키워드가 동일 또는 유사한 문맥에 등장하는 빈도를 고려하여 산출될 수 있다.The basic reserved word-lower keyword association can be calculated, for example, in consideration of the frequency in which a reserved word and a lower keyword appear in the same or similar context.

이하 도 15 내지 도 17에 대한 설명에서 예약어 C2과 대표 속성 키워드 k3 사이의 기본 예약어-키워드 연관도 v3,2를 획득하는 예시를 설명한다. 예를 들어 대표 속성 키워드 k3의 하위 키워드들이 B31 내지 B350이라고 가정한다. 예약어, 대표 속성 키워드 및 기본 예약어-키워드 연관도에 대해서는 도 11을 참조하여 상술한 예시를 참조한다. 예약어 Cj 및 하위 키워드 Bgh 쌍에 상응하는 기본 예약어-하위 키워드 연관도는 xj,h라고 표현한다. 하위 키워드 Bgh 및 대표 속성 키워드 kg 쌍에 상응하는 연관 가중치는 yg,h라고 표현한다. 예약어 Cj, 대표 속성 키워드 kg 및 하위 키워드 Bgh 조합에 상응하는 조정 예약어-하위 키워드 연관도는 xj,g,h라고 표현한다.Hereinafter, an example of acquiring the basic reserved word-keyword association v 3,2 between the reserved word C 2 and the representative attribute keyword k 3 will be described with reference to FIGS. 15 to 17. For example, it is assumed that the lower keywords of the representative attribute keyword k 3 are B3 1 to B3 50 . For the reserved word, the representative attribute keyword, and the basic reserved word-keyword association, reference is made to the example described above with reference to FIG. The sub-keyword association degree is expressed as x j, h - reserved word reserved word base corresponding to C j and sub-keyword pair Bg h. The association weights corresponding to the pair of the sub keyword Bg h and the representative attribute keyword k g are expressed as y g, h . The sub-keyword association degree is expressed as x j, g, h - reserved word C j, k g represent attribute keywords and keyword sub Bg h combination adjustment reserved word corresponding to.

도 15는 본 명세서의 제1 실시 예에 따르는 단계 1340의 상세 순서도이다.15 is a detailed flowchart of step 1340 according to the first embodiment of the present invention.

도 15를 참조하면, 단계 1510에서 제어부(320)는 기본 예약어-하위 키워드 연관도에 연관 가중치를 적용하여 조정 예약어-하위 키워드 연관도를 획득한다.Referring to FIG. 15, in step 1510, the control unit 320 obtains the adjusted reserved word-lower keyword association by applying association weights to the basic reserved word-lower keyword association.

단계 1510에서 제어부(320)는 각 예약어 및 하위 키워드 쌍에 대하여 상기 예약어 및 상기 하위 키워드 쌍에 상응하는 기본 예약어-하위 키워드 연관도에 상기 하위 키워드 및 대표 속성 키워드 쌍에 상응하는 연관 가중치를 적용하여 상기 대표 속성 키워드에 대한 각 예약어 및 하위 키워드 쌍에 상응하는 조정 예약어-하위 키워드 연관도를 획득할 수 있다.In step 1510, the control unit 320 applies associative weights corresponding to the lower keyword and the representative attribute keyword pair to the basic reserved word-lower keyword association corresponding to the reserved word and the lower keyword pair for each reserved word and lower keyword pair It is possible to obtain the adjustment reservation word-lower keyword association diagram corresponding to each of the reserved words and the lower keyword pairs for the representative attribute keyword.

예를 들어 제어부(320)는 예약어가 C2일 때 하위 키워드 B34 및 대표 속성 키워드 k3 쌍에 상응하는 C2 - B34 간 조정 예약어-하위 키워드 연관도를 획득하기 위해서 예약어 C2 및 하위 키워드 B34 쌍에 상응하는 기본 예약어-하위 키워드 연관도 x2,4에 하위 키워드 B34 및 대표 속성 키워드 k3 쌍에 상응하는 연관 가중치 y3,4를 적용하여 조정 예약어-하위 키워드 연관도 x2,3,4를 획득할 수 있다. For example, controller 320 is C 2 to reserved words that correspond to the sub-keyword B3 4 and shorthand keyword k 3 pairs when C 2 days The sub-keyword Relevancy sub keyword B3 4 and representing the property keywords x 2,4 k 3 ssang-B3 4 between adjustment reserved - to obtain a lower degree keywords associated reserved words C 2 and sub-keyword B3 4 ssang corresponding default reserved for the We can obtain the adjusted word-lower keyword association x 2,3,4 by applying the corresponding association weight y 3,4 .

특히 연관 가중치의 적용 방식은 기본 예약어-하위 키워드 연관도 x2,4에 하위 키워드 B34 및 대표 속성 키워드 k3 쌍에 상응하는 연관 가중치 y3,4를 곱하는 방식이 될 수 있다. 예를 들어 제어부(320)는 예약어가 C2일 때 하위 키워드 B34 및 대표 속성 키워드 k3 쌍에 상응하는 C2 - B34 간 조정 예약어-하위 키워드 연관도 x2,3,4를 획득하기 위해서 예약어 C2 및 하위 키워드 B34 쌍에 상응하는 기본 예약어-하위 키워드 연관도 x2,4에 하위 키워드 B34 및 대표 속성 키워드 k3 쌍에 상응하는 연관 가중치 y3,4를 곱한 값인 (x2,4Хy3, 4)를 이용하여 조정 예약어-하위 키워드 연관도 x2,3,4를 획득할 수 있다. 다른 실시 예에서 제어부(320)는 곱하기 대신 조정 예약어-하위 키워드 연관도 x2,3,4가 x2,4 및 y3,4과 양의 상관 관계를 가지도록 하는 다른 연산/이용 방식을 적용한 함수 f(x2, 4,y3 , 4)를 활용하여 조정 예약어-하위 키워드 연관도 x2,3,4를 획득할 수도 있다. 또한 (x2,4Хy3, 4)를 조정 예약어-하위 키워드 연관도 x2,3,4로써 활용하는 방법 및 (x2,4Хy3, 4)에 기타 요인에 기반한 보정을 가하여 조정 예약어-하위 키워드 연관도 x2,3,4로써 활용하는 방법 모두 활용될 수 있다.In particular, the method of applying the association weight can be a method of multiplying the basic reserved word-lower keyword association x 2,4 by the association weight y 3,4 corresponding to the lower keyword B3 4 and the representative attribute keyword k 3 pair. For example, controller 320 is C 2 to reserved words that correspond to the sub-keyword B3 4 and shorthand keyword k 3 pairs when C 2 days B3 4 Intermediate reserved words - Basic reserved words corresponding to 4 pairs of reserved words C 2 and B 3 to obtain subordinate keyword associations x 2 , 3 and 4 - Subordinate keyword associations x 2 4 and subordinate keywords B 3 4 and representative value is multiplied by the associated weight 3,4 y corresponding to the attribute keywords ssang k 3 (x 2,4 Хy 3, 4) is adjusted by using the reserved - more sub keywords, it is possible to obtain the x 2,3,4. In another embodiment, the control unit 320 applies a different calculation / utilization scheme such that the adjusted reserved word-lower keyword relevance x 2 , 3 , 4 is x 2, 4, and y 3 , 4 , function f adjusted by using the (x 2, 4, y 3 , 4) reserved words - can be obtained also x 2,3,4 associated sub-keyword. In addition, (x 2,4 Хy 3, 4) for adjusting the reserved word-bottom keywords associated with a method of utilizing as 2,3,4 x, and (x 2,4 Хy 3, 4) applying a correction based on other factors to adjust reserved - All of the methods used as sub-keyword associations x 2, 3, 4 can be utilized.

단계 1520에서 제어부(320)는 조정 예약어-하위 키워드 연관도 x2, 3,f의 누적값을 이용하여 예약어 C2 및 대표 속성 키워드 k3 간의 기본 예약어-키워드 연관도를 설정할 수 있다. 즉 예약어 C2 및 대표 속성 키워드 k3 간의 기본 예약어-키워드 연관도는

Figure pat00004
가 될 수 있다. 즉, 하위 키워드 B31 내지 B350에 대해 예약어 C2와의 기본 예약어-하위키워드 연관도 x2,f를 구한 뒤 각각에 대해 해당 하위 키워드에 대한 연관 가중치 y3,f를 반영하여 x2, 3,f를 구하고 x2, 3,f를 누적하여 예약어 C2 및 대표 속성 키워드 k3 간의 기본 예약어-키워드 연관도를 구할 수 있다. 다른 실시 예에 따르면, 예약어 C2 및 대표 속성 키워드 k3 간의 기본 예약어-키워드 연관도는
Figure pat00005
에 기타 요인에 의한 보정을 가한 값이 될 수 있다. 다른 실시 예에 따르면, 예약어 C2 및 대표 속성 키워드 k3 간의 기본 예약어-키워드 연관도는
Figure pat00006
과 양의 상관 관계를 가지는 값이 될 수 있다. 여기서는 하나의 대표속성 키워드에 연결돼 있는 하위 키워드가 50개인 것으로 가정하였으나, 대표속성 키워드에 연결돼 있는 하위 키워드의 개수가 달라지면 수식에서 f의 누적 범위가 50이 아닌 다른 값이 될 수 있을 것이다.In step 1520, the control unit 320 may set a basic word-keyword association between the reserved word C 2 and the representative attribute keyword k 3 using the cumulative value of the adjusted reserved word-lower keyword association degree x 2, 3, and f . That is, the basic reserved word-keyword association between the reserved word C 2 and the representative attribute keyword k 3 is
Figure pat00004
. That is, the sub-keyword B3 1 to base the reserved word with the reserved word C 2 for B3 50 - lower keyword Relevancy x 2, after obtaining a f for each reflecting the associated weight y 3, f for its sub-keyword x 2, 3 , f , and accumulating x 2, 3, and f to obtain a basic word-keyword association between the reserved word C 2 and the representative keyword k 3 . According to another embodiment, the basic reserved word-keyword association between the reserved word C 2 and the representative attribute keyword k 3 is
Figure pat00005
And a correction based on other factors. According to another embodiment, the basic reserved word-keyword association between the reserved word C 2 and the representative attribute keyword k 3 is
Figure pat00006
And < / RTI > In this case, it is assumed that there are 50 sub-keywords connected to one representative attribute keyword. However, if the number of sub-keywords connected to the representative attribute keyword is different, the cumulative range of f in the formula may be different from 50.

도 16은 본 명세서의 다른 실시 예에 따르는 단계 1340의 상세 순서도이다. 도 16의 단계 1510, 단계 1520의 과정은 도 15를 참조하여 상술한 과정과 동일하므로 반복하지 않는다. 16 is a detailed flowchart of step 1340 according to another embodiment of the present disclosure. The process of steps 1510 and 1520 of FIG. 16 is the same as the process described above with reference to FIG.

도 16을 참조하면 단계 1530에서 제어부(320)는 특정 예약어에 대응하는 대표 키워드들 중 상기 예약어와 상기 대응하는 대표 키워드 쌍의 기본 예약어-키워드 연관도가 기준 기본 예약어-키워드 연관도 이하인 대표 키워드에 대한 기본 예약어-키워드 연관도를 삭제할 수 있다. 특정 예약어에 대응하는 대표 키워드들은 상기 특정 예약어와의 관계에서 기본 예약어-키워드 연관도가 설정돼 있는 키워드들을 가리킨다. 기준 기본 예약어-키워드 연관도는 미리 설정돼 있을 수 있다. 다른 실시 예에 따르면 기준 기본 예약어-키워드 연관도는 특정 예약어에 대응하는 기본 예약어-키워드 연관도의 평균값을 이용하여 설정되거나 특정 예약어에 대응하는 기본 예약어-키워드 연관도를 크기 순서대로 배열했을 때 특정 순위의 기본 예약어-키워드 연관도를 이용하여 설정될 수 있다. 기타 특정 예약어에 대응하는 기본 예약어-키워드 연관도들과 양의 상관관계를 가지는 특정 값이 기준 기본 예약어-키워드 연관도가 될 수 있다. 기준 기본 예약어-키워드 연관도는 예약어에 따라 달리 설정될 수도 있고, 모든 예약어에 대해 동일하게 설정될 수도 있다. 기본 예약어-키워드 연관도가 삭제되는 것은 예약어와 대표키워드 사이의 연관도가 없는 것으로 설정되는 것이다. 제어부는 연관도를 0으로 설정할 수도 있고, 기본 예약어-키워드 연관도를 나타내는 리스트(어레이, 기타 자료구조로 대체될 수 있음)에서 상기 예약어와 상기 대응하는 대표 키워드 쌍의 기본 예약어-키워드 연관도에 관한 정보를 삭제하는 방식으로 기본 예약어-키워드 연관도를 삭제할 수도 있다. 기타 기본 예약어-키워드 연관도가 삭제되었음 (또는 연관관계가 삭제되었음)을 알리는 정보를 부가하는 방식이 사용될 수도 있다.Referring to FIG. 16, in step 1530, the controller 320 determines whether or not a representative keyword having a basic reserved word-keyword association degree of the reserved word and the corresponding representative keyword pair of the representative keywords corresponding to a specific reserved word You can delete the default reserved words - keyword associations for. The representative keywords corresponding to a specific reserved word indicate keywords for which a basic reserved word-keyword association is set in relation to the specific reserved word. The reference basic reserved word-keyword association may be set in advance. According to another embodiment, the reference basic word-keyword association is set by using an average value of the basic word-keyword association corresponding to a specific reserved word or when a basic word-keyword association corresponding to a specific reserved word is arranged in the order of magnitude Can be set using the basic reserved word-keyword association of the ranking. A specific value having a positive correlation with the basic reserved word-keyword associations corresponding to other specific reserved words may be a reference basic reserved word-keyword association. The reference basic reserved word-keyword association may be set differently according to a reserved word or may be set to the same for all reserved words. The deletion of the basic reserved word-keyword association is set to have no association between the reserved word and the representative keyword. The control unit may set the degree of association to 0, or may associate the basic word-keyword association of the reserved word with the corresponding representative keyword pair in a list (which may be replaced with an array or other data structure) Keyword association may be deleted in such a manner as to delete information about the keyword. Other basic reserved words - a method of adding information indicating that a keyword association has been deleted (or an association has been deleted) may be used.

단계 1530의 과정을 거치면 비교적 미세한 연관도를 가지는 기본 예약어-키워드 연관도가 삭제되어(즉, 연관도가 없는 것으로 설정됨) 지나치게 복잡한 연산을 수행하거나 사용자/관리자에게 실질적으로 의미가 없는 연관관계가 표시되지 않도록 할 수 있다.After the process of step 1530, the basic reserved word-keyword association having a relatively fine association is deleted (i.e., the association is set to have no association), or an overly complicated operation is performed or an association with no substantial meaning to the user / It can be prevented from being displayed.

도 17은 본 명세서의 또 다른 실시 예에 따르는 단계 1340의 상세 순서도이다.17 is a detailed flowchart of step 1340 in accordance with another embodiment of the present disclosure.

도 17의 단계 1510, 단계 1520의 과정은 도 15를 참조하여 상술한 과정과 동일하므로 설명을 반복하지 않는다. 도 17의 단계 1530의 과정은 도 16을 참조하여 상술한 과정과 동일하므로 설명을 반복하지 않는다.The process of steps 1510 and 1520 of FIG. 17 is the same as the process described above with reference to FIG. 15, and thus description thereof will not be repeated. The process of step 1530 of FIG. 17 is the same as the process described above with reference to FIG. 16, and thus description thereof will not be repeated.

단계 1540에서 제어부(320)는 삭제되지 않고 남아 있는 기본 예약어-키워드 연관도를 노멀라이즈 할 수 있다. 예를 들어 특정 대표 속성 키워드에 연결되어 저장된 기본 예약어-키워드 연관도의 평균값을 특정 범위에 포함되도록 하기 위하여 특정 대표 속성 키워드에 연결되어 저장된 기본 예약어-키워드 연관도들에 일정한 계수를 곱하여 상승시키거나 감소시킬 수 있다. 다른 예를 들어, 특정 대표 속성 키워드에 연결되어 저장된 기본 예약어-키워드 연관도의 총합이 특정 범위에 포함되도록 하기 위하여 특정 대표 속성 키워드에 연결되어 저장된 기본 예약어-키워드 연관도들에 일정한 계수를 곱하여 상승시키거나 감소시킬 수 있다. 즉, 어떠한 특정 대표 속성 키워드에 높은 값의 기본 예약어-키워드 연관도가 집중되어 어떠한 예약어를 선택하더라도 해당 특정 대표 속성 키워드만이 추천/사용되거나 특정 대표 속성 키워드가 거의 사용되지 않는 경우를 방지하기 위해 적당한 조정이 수행될 수 있다.In step 1540, the control unit 320 may normalize the remaining basic reserved word-keyword association without being deleted. For example, in order to make the average value of the basic reserved word-keyword association stored in association with a specific representative attribute keyword included in a specific range, the basic reserved word-keyword associations connected to and stored in the specific representative attribute keyword are multiplied by a certain coefficient, . For example, in order to ensure that the sum of the basic reserved word-keyword associations stored in association with the specific representative attribute keyword is included in the specific range, the basic reserved word-keyword associations connected to the specific representative attribute keywords are stored, . In other words, in order to prevent a case in which only a specific representative attribute keyword is recommended / used or a specific representative attribute keyword is rarely used even when a certain reserved word is selected because a high-value basic reserved word- Appropriate adjustments can be made.

다른 실시 예에 따르면 단계 1540에서 제어부(320)는 기본 예약어-키워드 연관도에 일정 계수를 곱하는 대신 일정 계수를 더하거나 로그, 제곱 등의 연산을 결합하여 노멀라이즈를 수행할 수도 있다. 또다른 실시 예에 따르면 특정 기준값 이상의 기본 예약어-키워드 연관도들만을 일부 감소시키거나 특정 기준값 이하의 기본 예약어-키워드 연관도들만을 일부 상승시키는 방식으로 노멀라이즈를 수행할 수도 있다. According to another embodiment, in step 1540, the control unit 320 may perform normalization by adding a predetermined coefficient instead of multiplying the basic word-keyword association by a certain coefficient, or by combining operations such as logarithmic and square. According to another embodiment, the normalization may be performed by reducing only a part of the basic reserved word-keyword associations beyond a certain reference value or by partially raising only the basic reserved word-keyword associations below a certain reference value.

또 다른 실시 예에 따르면, 단계 1540에서 제어부(320)는 특정 예약어에 연결되어 저장된 기본 예약어-키워드 연관도의 평균값(또는 총합)을 특정 범위에 포함되도록 노멀라이즈를 수행할 수도 있다.According to another embodiment, in step 1540, the control unit 320 may normalize the average value (or the sum) of the stored basic word-keyword associations stored in a specific reserved word to be included in a specific range.

도 17의 과정 중 단계 1530이 생략되고 기본 예약어-키워드 연관도 노멀라이즈 과정이 수행되는 변형 예도 가능하다.It is also possible that the step 1530 is omitted in the process of FIG. 17 and the basic reserved word-keyword association normalization process is performed.

단계 1350에서 통신부(310)가 단말(200)로부터 수신 예약어를 수신하여 획득하고 수신 예약어를 제어부(320)에게 전달한다.In step 1350, the communication unit 310 receives the reception reservation word from the terminal 200, acquires it, and transmits the reception reservation word to the control unit 320.

수신 예약어는 단말(200)이 검색 사용자로부터 수신한 예약어이다. 단말(200)은 음성 입력을 전기적 신호(음성 신호)로 변환하여 검색 장치(300)에게 전달할 수 있다. 검색 장치(300)의 제어부(320)는 음성 신호를 분석하여 텍스트로 변환하고 변환 텍스트를 예약어에 매칭시킬 수 있다. 제어부(320)는 또한 음성 신호를 분석하여 음성의 억양이나 높낮이, 빠르기, 호흡 상태 등을 분석하여 정황 정보로서 활용할 수도 있다.The reception reservation word is a reserved word received by the terminal 200 from the search user. The terminal 200 may convert the voice input into an electrical signal (voice signal) and transmit it to the search device 300. The control unit 320 of the search apparatus 300 may analyze the voice signal, convert the voice signal into text, and match the converted text with a reserved word. The control unit 320 may also analyze the voice signal and analyze the voice intonation, the height, the speed, the breathing state, and the like to use the information as context information.

다른 실시 예에 따르면 단말(200)은 음성 입력을 텍스트로 변환하여 변환 텍스트를 검색 장치(300)에게 전달할 수 있다. 단말(200)은 수신한 음성 입력의 억양이나 높낮이, 빠르기, 호흡 상태 등을 분석하여 분석 정보를 검색 장치(300)에게 전달할 수 있다. 검색 장치(300)는 분석 정보를 일종의 정황 정보로서 활용할 수도 있다.According to another embodiment, the terminal 200 may convert the voice input into text and transmit the converted text to the search device 300. The terminal 200 can analyze the received voice input, the height, the speed, the breathing state, and the like and transmit the analysis information to the search device 300. The search device 300 may utilize the analysis information as a kind of context information.

단계 1360에서 제어부(320)는 객체-키워드 연관도 및 기본 예약어-키워드 연관도를 이용하여 상기 수신 예약어와 각 객체 항목 쌍에 대응하는 예약어-객체 연관도를 획득한다. 단계 1360의 과정은 도 9의 단계 940의 방식 또는 도 12의 방식에 따라 수행될 수 있다. 동일한 내용의 설명은 생략한다.In step 1360, the control unit 320 obtains a reserved word-object association map corresponding to the reception reservation word and each object item pair using the object-keyword association map and the basic reserved word-keyword association map. The process of step 1360 may be performed according to the method of step 940 of FIG. 9 or the method of FIG. The description of the same contents is omitted.

단계 1370에서 제어부(320)는 수신 예약어에 대응하는 예약어-객체 연관도에 따라 객체 항목을 제공할 수 있다. 단계 1370의 과정은 단계 950의 과정과 동일한 방식으로 수행될 수 있다. 동일한 설명은 생략한다.In step 1370, the control unit 320 may provide the object item according to the reserved word-object association map corresponding to the received reservation word. The process of step 1370 may be performed in the same manner as the process of step 950. The same explanation will be omitted.

도 14는 본 명세서의 또 다른 실시 예에 따르는 정보 제공 과정의 순서도이다.14 is a flowchart of an information providing process according to another embodiment of the present invention.

도 14의 단계 1310, 1320, 1330, 1340, 1350, 1360, 1370은 도 13의 단계 1310, 1320, 1330, 1340, 1350, 1360, 1370과 동일하므로 동일한 설명은 반복하지 않는다.Steps 1310, 1320, 1330, 1340, 1350, 1360, and 1370 in FIG. 14 are the same as steps 1310, 1320, 1330, 1340, 1350, 1360, and 1370 in FIG. 13,

도 14에서 추가된 단계 1333은 대표 속성 키워드와 하위 키워드가 결정된 이후 어느 시점에라도 수행될 수 있다. 예를 들어 단계 1333은 단계 1330과 동시에/병행하여 수행될 수도 있고 단계 1333의 과정이 단계 1330 도중에 수행될 수도 있다. The added step 1333 in FIG. 14 may be performed at any time after the representative attribute keyword and the lower keyword are determined. For example, step 1333 may be performed in parallel / concurrent with step 1330, and the process of step 1333 may be performed during step 1330.

단계 1333에서 제어부(320)는 대표 속성 키워드와 하위 키워드 간의 연관 가중치를 저장한다. 연관 가중치가 설정되는 과정이 단계 1330에서 수행되지 않는 경우 도 5의 단계 530의 과정과 동일 유사한 과정을 통해 대표 속성 키워드와 하위 키워드 간의 연관 가중치가 설정될 수 있다. 다른 실시 예에 따르면 제어부(320)는 단계 1330에서 설정된 연관 가중치를 불러오는 방식으로 대표 속성 키워드와 하위 키워드 간의 연관 가중치를 저장할 수도 있다.In step 1333, the control unit 320 stores association weights between the representative attribute keyword and the lower keyword. If the process of setting the association weights is not performed in step 1330, an association weight between the representative attribute keyword and the lower keyword may be set through a process similar to that of step 530 of FIG. According to another embodiment, the controller 320 may store association weights between the representative attribute keyword and the lower keyword in a manner that the association weights set in step 1330 are retrieved.

단계 1337에서 제어부(320)는 하위 키워드와 예약어 사이의 기본 예약어-하위키워드 연관도를 획득한다. In step 1337, the control unit 320 obtains a basic keyword-lower keyword association between the lower keyword and the reserved word.

제어부(320)는 예를 들어 하위 키워드가 예약어와 동일 또는 유사한 문맥에 등장하는 빈도를 고려하여 예약어와 하위 키워드 사이의 연관도를 판단할 수 있다. 예를 들어 특정 문장에서 키워드 A의 주변에 등장하는 단어들은 다른 문서에서도 키워드 A와 연관된 단어의 주변에 등장할 수 있으리라고 볼 수 있다. The control unit 320 can determine the degree of association between the reserved word and the lower keyword in consideration of, for example, the frequency with which the lower keyword appears in the same or similar context as the reserved word. For example, words appearing in the vicinity of keyword A in a certain sentence may appear in the vicinity of the word associated with keyword A in another document.

"큰 맘 먹고 여행을 갔으나 7월이라 날씨가 너무 더워서 고생했다.""I went on a big trip, but it was July, and the weather was so hot that I suffered."

"큰 맘 먹고 여행을 갔으나 7월이라 날씨가 너무 습해서 고생했다.""I went on a big trip, but it was July, so the weather was too humid."

위 두 문장을 살펴보면 같은 문맥에서 "더워서"라는 단어가 "습해서"라는 단어로 대체되었다. 제어부(320)는 "덥다"와 "습하다"가 서로 연관된 단어라는 것을 유추할 수 있다.Looking at the two sentences above, the word "hot" was replaced by the word "wet" in the same context. The control unit 320 can infer that "hot" and "wet" are related words.

"큰 맘 먹고 여행을 갔으나 7월이라 날씨가 너무 더워서 고생했다.""I went on a big trip, but it was July, and the weather was so hot that I suffered."

"큰 맘 먹고 휴가를 갔으나 7월이라 날씨가 너무 더워서 고생했다.""I had a great vacation and went on vacation, but it was July, so I had a hard time because the weather was so hot."

마찬가지로 제어부(320)는 위 두 문장을 통해 "여행"과 "휴가"가 연관된 단어라는 것을 유추할 수 있다.Similarly, the control unit 320 can infer that the words " travel " and " vacation " are related words through the above two sentences.

"큰 맘 먹고 여행을 갔으나 7월이라 날씨가 너무 더워서 고생했다.""I went on a big trip, but it was July, and the weather was so hot that I suffered."

"큰 맘 먹고 여행을 갔으나 8월이라 날씨가 너무 더워서 고생했다.""I went on a big trip, but it was August and the weather was so hot that I suffered."

마찬가지로 제어부(320)는 위 두 문장을 통해 "7월"과 "8월"이 연관된 단어라는 것을 유추할 수 있다.Similarly, the control unit 320 can infer that the words " July " and " August " are associated with each other through the above two sentences.

제어부(320)는 이전에 수집된 문서들을 통해 "덥다"와 "습하다"가 서로 연관된 단어이고 "7월"과 "8월"이 서로 연관된 단어이며 "여행"과 "휴가"가 서로 연관된 단어임을 저장해 둘 수 있다 이후 아래와 같은 문장을 수집한다고 가정한다.The control unit 320 is a word associated with "hot" and "wet" through previously collected documents, and a word associated with "July" and "August", and a word associated with "travel" and "vacation" It is assumed that the following sentence is collected.

"큰 맘 먹고 휴가를 갔으나 7월이라 날씨가 너무 습해서 고생했다.""I had a great vacation and went on a vacation, but it was July, and the weather was too humid."

"큰 맘 먹고 여행을 갔으나 8월이라 날씨가 너무 더워서 힘들었다.""I went on a big trip, but it was hard because it was too hot in August."

두 문장이 동일한 문맥은 아니지만 덥다"와 "습하다"가 서로 연관된 단어이고 "7월"과 "8월"이 서로 연관된 단어이며 "여행"과 "휴가"가 서로 연관된 단어임을 알고 있다면, 제어부(320)는 위 문장을 통해 "고생했다"와 "힘들었다" 역시 연관된 단어임을 학습할 수 있을 것이다.If the two sentences are not the same context but know that "hot" and "humid" are related words, "July" and "August" are related words, and "travel" ) Will be able to learn that "suffering" and "hardship" are also related words through the above sentence.

동일/유사한 문맥에 등장하는 빈도가 높은 키워드 쌍은 서로 연관도가 높은 것으로 판단할 수 있다. 아울러 두 키워드가 등장하는 문맥의 유사도가 높을수록 두 키워드 사이의 연관도가 높은 것으로 판단할 수 있다. 제어부(320)는 수집되는 문서들을 이용해 학습을 진행하여 키워드들 사이의 연관도를 설정하고, 설정된 키워드 간 연관도와 문장의 문맥을 이용하여 해당 문장에서 등장하는 키워드들의 연관도를 설정하는 식으로 키워드 간 연관도 판단의 정확성을 높일 수 있다.It is possible to determine that a keyword pair having a high frequency of appearing in the same / similar context has a high degree of correlation with each other. In addition, the higher the degree of similarity of the context in which the two keywords appear, the higher the degree of association between the two keywords can be judged. The control unit 320 performs learning using the collected documents to set the degree of association between the keywords and sets the degree of association of the keywords appearing in the corresponding sentence by using the relation between the set keywords and the context of the sentence. It is possible to improve the accuracy of the determination of the inter-linkage.

이와 유사한 학습 방식으로 NNLM(Neural Net Language Model), RNNLM(Recurrent Neural Net Language Model), word2vec, 스킵그램(skipgram) 및 CBOW(Continuous Bag-of-Words)방식이 알려져 있다. 특히 word2vec을 이용할 경우 word2vec은 문서들을 이용해 학습하여 각 키워드들을 벡터에 대응시키고, 두 키워드 사이의 유사도는 두 벡터의 코사인 유사도 계산을 통해 파악할 수 있다.Similar learning methods are known, such as Neural Net Language Model (NNLM), Recurrent Neural Net Language Model (RNNLM), word2vec, skipgram, and Continuous Bag-of-Word (CBOW) schemes. In particular, when word2vec is used, word2vec learns by using documents and maps each keyword to a vector, and the similarity between two keywords can be grasped through calculation of the cosine similarity of two vectors.

도 20은 본 명세서의 일 실시 예에 따르는 용어 계층을 나타낸 도면이다.Figure 20 is a diagram illustrating a hierarchy of terms in accordance with one embodiment of the present disclosure.

도 13 또는 도 14의 과정을 완료하면 예약어들(C1~Cq)과 대표 속성 키워드들(k1~kn), 그리고 하위 키워드들(BX1~BX50) 사이의 계층 관계가 설정된다. 13 or 14, a hierarchical relationship between the reserved words C 1 to C q , the representative attribute keywords k 1 to k n , and the lower keywords BX 1 to BX 50 is established .

예약어와 대표 속성 키워드 사이에는 기본 예약어-키워드 연관도가 설정되고, 대표 속성 키워드와 하위 키워드 사이에는 연관가중치가 설정된다. 이러한 계층관계를 이용해 제어부(320)는 예약어에 따라 알맞은 객체를 추천해 주거나 새로운 예약어 후보를 선정하는 등의 동작을 수행할 수 있다. 또한 도 20의 계층 관계는 새로운 자료가 반영되어 도 13, 도 14와 같은 과정을 반복하면서 학습을 통해 계층 관계가 수정되거나 보완될 수 있다.A basic reserved word-keyword association is set between the reserved word and the representative attribute keyword, and an association weight is set between the representative attribute keyword and the lower keyword. Using this hierarchical relationship, the control unit 320 can perform an operation such as recommending an appropriate object according to a reserved word or selecting a new reserved word candidate. In addition, the hierarchical relationship of FIG. 20 can be corrected or supplemented through learning while repeating the process of FIG. 13 and FIG. 14 by reflecting new data.

이 때, 처리 흐름도 도면들의 각 블록과 흐름도 도면들의 조합들은 컴퓨터 프로그램 인스트럭션들에 의해 수행될 수 있음을 이해할 수 있을 것이다. 이 컴퓨터 프로그램 인스트럭션들은 범용 컴퓨터, 특수용 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서에 탑재될 수 있으므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서를 통해 수행되는 그 인스트럭션들이 흐름도 블록(들)에서 설명된 기능들을 수행하는 수단을 생성하게 된다. 이들 컴퓨터 프로그램 인스트럭션들은 특정 방식으로 기능을 구현하기 위해 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 지향할 수 있는 컴퓨터 이용 가능 또는 컴퓨터 판독 가능 메모리에 저장되는 것도 가능하므로, 그 컴퓨터 이용가능 또는 컴퓨터 판독 가능 메모리에 저장된 인스트럭션들은 흐름도 블록(들)에서 설명된 기능을 수행하는 인스트럭션 수단을 내포하는 제조 품목을 생산하는 것도 가능하다. 컴퓨터 프로그램 인스트럭션들은 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에 탑재되는 것도 가능하므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에서 일련의 동작 단계들이 수행되어 컴퓨터로 실행되는 프로세스를 생성해서 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 수행하는 인스트럭션들은 흐름도 블록(들)에서 설명된 기능들을 실행하기 위한 단계들을 제공하는 것도 가능하다.At this point, it will be appreciated that the combinations of blocks and flowchart illustrations in the process flow diagrams may be performed by computer program instructions. These computer program instructions may be loaded into a processor of a general purpose computer, special purpose computer, or other programmable data processing apparatus, so that the instructions, which may be executed by a processor of a computer or other programmable data processing apparatus, Thereby creating means for performing functions. These computer program instructions may also be stored in a computer usable or computer readable memory capable of directing a computer or other programmable data processing apparatus to implement the functionality in a particular manner so that the computer usable or computer readable memory The instructions stored in the block diagram (s) are also capable of producing manufacturing items containing instruction means for performing the functions described in the flowchart block (s). Computer program instructions may also be stored on a computer or other programmable data processing equipment so that a series of operating steps may be performed on a computer or other programmable data processing equipment to create a computer- It is also possible for the instructions to perform the processing equipment to provide steps for executing the functions described in the flowchart block (s).

또한, 각 블록은 특정된 논리적 기능(들)을 실행하기 위한 하나 이상의 실행 가능한 인스트럭션들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또, 몇 가지 대체 실행 예들에서는 블록들에서 언급된 기능들이 순서를 벗어나서 발생하는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들은 사실 실질적으로 동시에 수행되는 것도 가능하고 또는 그 블록들이 때때로 해당하는 기능에 따라 역순으로 수행되는 것도 가능하다.In addition, each block may represent a module, segment, or portion of code that includes one or more executable instructions for executing the specified logical function (s). It should also be noted that in some alternative implementations, the functions mentioned in the blocks may occur out of order. For example, two blocks shown in succession may actually be executed substantially concurrently, or the blocks may sometimes be performed in reverse order according to the corresponding function.

이 때, 본 실시 예에서 사용되는 '~부'라는 용어는 소프트웨어 또는 FPGA또는 ASIC과 같은 하드웨어 구성요소를 의미하며, '~부'는 어떤 역할들을 수행한다. 그렇지만 '~부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. '~부'는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '~부'는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들, 및 변수들을 포함한다. 구성요소들과 '~부'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '~부'들로 결합되거나 추가적인 구성요소들과 '~부'들로 더 분리될 수 있다. 뿐만 아니라, 구성요소들 및 '~부'들은 디바이스 또는 보안 멀티미디어카드 내의 하나 또는 그 이상의 CPU들을 재생시키도록 구현될 수도 있다.Herein, the term " part " used in the present embodiment means a hardware component such as software or an FPGA or an ASIC, and 'part' performs certain roles. However, 'part' is not meant to be limited to software or hardware. &Quot; to " may be configured to reside on an addressable storage medium and may be configured to play one or more processors. Thus, by way of example, 'parts' may refer to components such as software components, object-oriented software components, class components and task components, and processes, functions, , Subroutines, segments of program code, drivers, firmware, microcode, circuitry, data, databases, data structures, tables, arrays, and variables. The functions provided in the components and components may be further combined with a smaller number of components and components or further components and components. In addition, the components and components may be implemented to play back one or more CPUs in a device or a secure multimedia card.

본 명세서가 속하는 기술분야의 통상의 지식을 가진 자는 본 명세서가 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 본 명세서의 범위는 상기 상세한 설명보다는 후술하는 특허청구의 범위에 의하여 나타내어지며, 특허청구의 범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 명세서의 범위에 포함되는 것으로 해석되어야 한다.It will be understood by those skilled in the art that the present specification may be embodied in other specific forms without departing from the spirit or essential characteristics thereof. It is therefore to be understood that the above-described embodiments are illustrative in all aspects and not restrictive. The scope of the present specification is defined by the appended claims rather than the foregoing detailed description, and all changes or modifications derived from the meaning and scope of the claims and their equivalents are included in the scope of the present specification Should be interpreted.

한편, 본 명세서와 도면에는 본 명세서의 바람직한 실시 예에 대하여 개시하였으며, 비록 특정 용어들이 사용되었으나, 이는 단지 본 명세서의 기술 내용을 쉽게 설명하고 발명의 이해를 돕기 위한 일반적인 의미에서 사용된 것이지, 본 명세서의 범위를 한정하고자 하는 것은 아니다. 여기에 개시된 실시 예 외에도 본 명세서의 기술적 사상에 바탕을 둔 다른 변형 예들이 실시 가능하다는 것은 본 명세서가 속하는 기술 분야에서 통상의 지식을 가진 자에게 자명한 것이다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed embodiments, but, on the contrary, It is not intended to limit the scope of the specification. It will be apparent to those skilled in the art that other modifications based on the technical idea of the present invention are possible in addition to the embodiments disclosed herein.

Claims (18)

대표 속성 키워드를 포함하는 대표 속성 키워드 후보집합을 추출하는 단계;
예약어를 포함하는 예약어 집합을 설정하는 단계;
객체 항목과 대표 속성 키워드 쌍에 대응하는 객체-키워드 연관도를 저장하는 단계;
대표 속성 키워드와 하위 키워드 쌍에 대응되는 연관 가중치 및 예약어와 하위 키워드 쌍에 대응되는 기본 예약어-하위 키워드 연관도를 이용하여 예약어와 대표 속성 키워드 쌍에 대응하는 기본 예약어-키워드 연관도를 저장하는 단계;
수신 예약어를 획득하는 단계;
상기 객체-키워드 연관도 및 상기 기본 예약어-키워드 연관도를 이용하여 상기 수신 예약어와 각 객체 항목 쌍에 대응하는 예약어-객체 연관도를 획득하는 단계; 및
상기 수신 예약어와 각 객체 항목 쌍에 대응하는 상기 예약어-객체 연관도에 따라 객체 항목을 제공하는 단계를 포함하는 정보 제공 방법.
Extracting a representative attribute keyword candidate set including a representative attribute keyword;
Setting a reserved word set including a reserved word;
Storing an object-keyword association corresponding to an object item and a representative attribute keyword pair;
Storing associative weight corresponding to the representative attribute keyword and the lower keyword pair and a basic reserved word-keyword association corresponding to the reserved word and representative attribute keyword pair using the basic reserved word-lower keyword association corresponding to the reserved words and the lower keyword pair ;
Obtaining a receiving reservation word;
Acquiring a reserved word-object association map corresponding to the reception reservation word and each object item pair using the object-keyword association diagram and the basic reserved word-keyword association diagram; And
Providing an object item according to the reserved word and the reserved word-object association diagram corresponding to each object item pair.
제1항에 있어서,
대표 속성 키워드와 하위 키워드 쌍에 대응되는 연관 가중치 및 예약어와 하위 키워드 쌍에 대응되는 기본 예약어-하위 키워드 연관도를 이용하여 예약어와 대표 속성 키워드 쌍에 대응하는 기본 예약어-키워드 연관도를 저장하는 단계 이전에,
대표 속성 키워드와 하위 키워드 쌍에 대응되는 연관 가중치를 저장하는 단계; 및
상기 대표 속성 키워드에 상응하는 각 하위 키워드와 상기 예약어 사이의 기본 예약어-하위 키워드 연관도를 획득하는 단계를 더 포함하는 정보 제공 방법.
The method according to claim 1,
Storing associative weight corresponding to the representative attribute keyword and the lower keyword pair and a basic reserved word-keyword association corresponding to the reserved word and representative attribute keyword pair using the basic reserved word-lower keyword association corresponding to the reserved words and the lower keyword pair Before,
Storing association weight corresponding to the representative attribute keyword and the lower keyword pair; And
Further comprising the step of acquiring the basic reserved word-lower keyword associations between each of the lower keywords corresponding to the representative attribute keywords and the reserved words.
제2항에 있어서,
상기 대표 속성 키워드에 상응하는 각 하위 키워드와 상기 예약어 사이의 기본 예약어-하위 키워드 연관도를 획득하는 단계는,
각 하위 키워드가 상기 예약어와 동일 또는 유사한 문맥에 등장하는 빈도를 고려하여 상기 예약어와 각 하위 키워드 사이의 기본 예약어-하위 키워드 연관도를 판단하는 단계를 포함하는 정보 제공 방법.
3. The method of claim 2,
The step of acquiring the basic reserved word-lower keyword association between each of the lower keywords corresponding to the representative attribute keywords and the reserved words,
Determining a basic word-to-sub keyword association between the reserved word and each of the sub keywords in consideration of the frequency with which each sub keyword appears in the same or similar context as the reserved word.
제1항에 있어서,
대표 속성 키워드와 하위 키워드 쌍에 대응되는 연관 가중치 및 예약어와 하위 키워드 쌍에 대응되는 기본 예약어-하위 키워드 연관도를 이용하여 예약어와 대표 속성 키워드 쌍에 대응하는 기본 예약어-키워드 연관도를 저장하는 단계는,
각 예약어 및 하위 키워드 쌍에 대하여 상기 예약어 및 상기 하위 키워드 쌍에 상응하는 기본 예약어-하위 키워드 연관도에 상기 하위 키워드 및 대표 속성 키워드 쌍에 상응하는 연관 가중치를 적용하여 상기 대표 속성 키워드에 대한 각 예약어 및 하위 키워드 쌍에 상응하는 조정 예약어-하위 키워드 연관도를 획득하는 단계; 및
특정 대표 속성 키워드에 대한 상기 조정 예약어-하위 키워드 연관도의 누적값과 양의 상관관계를 가지도록 상기 예약어와 상기 특정 대표 속성 키워드 쌍에 대응하는 기본 예약어-키워드 연관도를 설정하는 단계를 포함하는 정보 제공 방법.
The method according to claim 1,
Storing associative weight corresponding to the representative attribute keyword and the lower keyword pair and a basic reserved word-keyword association corresponding to the reserved word and representative attribute keyword pair using the basic reserved word-lower keyword association corresponding to the reserved words and the lower keyword pair Quot;
Applying associative weights corresponding to the lower keyword and the representative attribute keyword pair to the basic reserved word and lower keyword association diagram corresponding to the reserved word and the lower keyword pair for each of the reserved word and the lower keyword pair, And obtaining an adjustment reservation word-lower keyword association corresponding to the lower keyword pair; And
Keyword association degree corresponding to the reserved word and the specific representative attribute keyword pair so as to have a positive correlation with the cumulative value of the adjustment reserved word-lower keyword association with respect to the specific representative attribute keyword Information delivery method.
제4항에 있어서,
각 예약어 및 하위 키워드 쌍에 대하여 상기 예약어 및 상기 하위 키워드 쌍에 상응하는 기본 예약어-하위 키워드 연관도에 상기 하위 키워드 및 대표 속성 키워드 쌍에 상응하는 연관 가중치를 적용하여 상기 대표 속성 키워드에 대한 각 예약어 및 하위 키워드 쌍에 상응하는 조정 예약어-하위 키워드 연관도를 획득하는 단계는,
각 예약어 및 하위 키워드 쌍에 대하여 상기 예약어 및 상기 하위 키워드 쌍에 상응하는 기본 예약어-하위 키워드 연관도에 상기 하위 키워드 및 대표 속성 키워드 쌍에 상응하는 연관 가중치를 곱한 값을 이용하여 상기 대표 속성 키워드에 대한 각 예약어 및 하위 키워드 쌍에 상응하는 조정 예약어-하위 키워드 연관도를 획득하는 단계를 포함하는 정보 제공 방법.
5. The method of claim 4,
Applying associative weights corresponding to the lower keyword and the representative attribute keyword pair to the basic reserved word and lower keyword association diagram corresponding to the reserved word and the lower keyword pair for each of the reserved word and the lower keyword pair, And acquiring an adjustment reserved word-lower keyword association corresponding to the lower keyword pair,
For each of the reserved word and the lower keyword pair, a value obtained by multiplying the basic word-lower keyword association corresponding to the reserved word and the lower keyword pair by the association weight corresponding to the lower keyword and the representative attribute keyword pair, And obtaining an adjustment reservation word-lower keyword association corresponding to each of the reserved words and the lower keyword pair for the corresponding keyword.
제4항에 있어서,
대표 속성 키워드와 하위 키워드 쌍에 대응되는 연관 가중치 및 예약어와 하위 키워드 쌍에 대응되는 기본 예약어-하위 키워드 연관도를 이용하여 예약어와 대표 속성 키워드 쌍에 대응하는 기본 예약어-키워드 연관도를 저장하는 단계는,
특정 예약어와 대응되는 기본 예약어-키워드 연관도를 가지는 대표 키워드 중 상기 특정 예약어와 대응하는 대표 키워드 쌍의 기본 예약어-키워드 연관도가 기준 기본 예약어-키워드 연관도 이하인 대표 키워드에 대한 기본 예약어-키워드 연관도를 삭제하는 단계를 더 포함하는 정보 제공 방법.
5. The method of claim 4,
Storing associative weight corresponding to the representative attribute keyword and the lower keyword pair and a basic reserved word-keyword association corresponding to the reserved word and representative attribute keyword pair using the basic reserved word-lower keyword association corresponding to the reserved words and the lower keyword pair Quot;
A basic reserved word corresponding to a specific reserved word and a representative keyword having a keyword association among the representative keywords having a keyword association, a basic reserved word for a representative keyword pair corresponding to the specific reserved word, Further comprising the step of deleting the figure.
제4항에 있어서,
대표 속성 키워드와 하위 키워드 쌍에 대응되는 연관 가중치 및 예약어와 하위 키워드 쌍에 대응되는 기본 예약어-하위 키워드 연관도를 이용하여 예약어와 대표 속성 키워드 쌍에 대응하는 기본 예약어-키워드 연관도를 저장하는 단계는,
특정 예약어에 대응하는 대표 키워드 중 상기 특정 예약어와 상기 대응하는 대표 키워드 쌍의 기본 예약어-키워드 연관도가 높은 순서대로 선정한 일정 개수의 대표 키워드를 제외한 대표 키워드에 대한 기본 예약어-키워드 연관도를 삭제하는 단계를 더 포함하는 정보 제공 방법.
5. The method of claim 4,
Storing associative weight corresponding to the representative attribute keyword and the lower keyword pair and a basic reserved word-keyword association corresponding to the reserved word and representative attribute keyword pair using the basic reserved word-lower keyword association corresponding to the reserved words and the lower keyword pair Quot;
Deletes the basic reserved word-keyword associations for the representative keywords excluding the predetermined number of representative keywords selected from the representative keywords corresponding to the specific reserved words in the descending order of the basic reserved word-keyword associations of the specific reserved words and the corresponding representative keyword pairs Further comprising the steps of:
제6항 또는 제7항에 있어서,
대표 속성 키워드와 하위 키워드 쌍에 대응되는 연관 가중치 및 예약어와 하위 키워드 쌍에 대응되는 기본 예약어-하위 키워드 연관도를 이용하여 예약어와 대표 속성 키워드 쌍에 대응하는 기본 예약어-키워드 연관도를 저장하는 단계는,
상기 특정 예약어에 대응하는 기본 예약어-키워드 연관도 중 삭제되지 않은 기본 예약어-키워드 연관도를 상기 기본 예약어-키워드 연관도를 보완하도록 노멀라이즈 하는 단계를 더 포함하는 정보 제공 방법.
8. The method according to claim 6 or 7,
Storing associative weight corresponding to the representative attribute keyword and the lower keyword pair and a basic reserved word-keyword association corresponding to the reserved word and representative attribute keyword pair using the basic reserved word-lower keyword association corresponding to the reserved words and the lower keyword pair Quot;
And normalizing the basic reserved word-keyword association map of the basic reserved word-keyword association map corresponding to the specific reserved word so as to complement the basic reserved word-keyword association map.
제1항에 있어서,
예약어를 포함하는 예약어 집합을 설정하는 단계는,
하나의 언어단위 또는 둘 이상의 연속된 언어단위들이 문서 집합에 포함된 문서에 등장하는 횟수 및 상기 하나의 언어단위 또는 둘 이상의 연속된 언어단위들로부터 미리 설정된 거리 이내에 감정어 사전에 포함된 감정어가 위치하는 횟수를 고려하여 예약어 후보를 설정하는 단계;
설정된 예약어 후보 정보를 포함하는 예약어 선택 인터페이스를 생성하기 위한 인터페이스 정보를 제공하는 단계; 및
예약어 선택 인터페이스를 통해 예약어 선택 입력을 수신하면, 선택 입력에 따라 선택된 예약어 후보를 예약어 집합에 추가하는 단계를 포함하는 단계를 포함하는 정보 제공 방법.
The method according to claim 1,
The step of setting a reserved word set including a reserved word includes:
The number of times that one language unit or two or more consecutive language units appear in a document included in a document set, and an emotion word included in the evaluation dictionary within a preset distance from the one language unit or two or more consecutive language units Setting a reserved word candidate in consideration of the number of times a word is reserved;
Providing interface information for generating a reserved word selection interface including reserved word candidate information; And
Receiving the reserved word selection input via the reserved word selection interface, and adding the selected reserved word candidate to the reserved word set according to the selected input.
대표 속성 키워드를 포함하는 대표 속성 키워드 후보집합을 추출하고, 예약어를 포함하는 예약어 집합을 설정하고, 객체 항목과 대표 속성 키워드 쌍에 대응하는 객체-키워드 연관도를 저장부에 저장하고, 대표 속성 키워드와 하위 키워드 쌍에 대응되는 연관 가중치 및 예약어와 하위 키워드 쌍에 대응되는 기본 예약어-하위 키워드 연관도를 이용하여 예약어와 대표 속성 키워드 쌍에 대응하는 기본 예약어-키워드 연관도를 상기 저장부에 저장하는 제어부;
상기 객체-키워드 연관도 및 기본 예약어-키워드 연관도를 저장하는 저장부; 및
수신 예약어를 획득하는 통신부를 포함하고,
상기 제어부는 상기 객체-키워드 연관도 및 상기 기본 예약어-키워드 연관도를 이용하여 상기 수신 예약어와 각 객체 항목 쌍에 대응하는 예약어-객체 연관도를 획득하고,
상기 제어부는 상기 수신 예약어와 각 객체 항목 쌍에 대응하는 상기 예약어-객체 연관도에 따라 객체 항목을 제공하는 정보 제공 장치.
Extracting a representative attribute keyword candidate set including a representative attribute keyword, setting a reserved word set including a reserved word, storing an object-keyword association corresponding to the object item and the representative attribute keyword pair in the storage unit, Keyword associations corresponding to the reserved words and the representative attribute keyword pairs are stored in the storage unit by using the association weights corresponding to the pairs of the lower-level keywords and the basic reserved word-lower-keyword associations corresponding to the reserved words and the lower- A control unit;
A storage unit for storing the object-keyword associativity and the basic reserved word-keyword associativity; And
And a communication unit for obtaining a reception reservation word,
Wherein the control unit obtains a reserved word-object association map corresponding to the reception reservation word and each object item pair using the object-keyword association map and the basic reserved word-keyword association map,
Wherein the control unit provides an object item according to the reserved word and the reserved word-object association map corresponding to each object item pair.
제10항에 있어서,
상기 제어부가 대표 속성 키워드와 하위 키워드 쌍에 대응되는 연관 가중치 및 예약어와 하위 키워드 쌍에 대응되는 기본 예약어-하위 키워드 연관도를 이용하여 예약어와 대표 속성 키워드 쌍에 대응하는 기본 예약어-키워드 연관도를 상기 저장부에 저장하기 이전에,
상기 제어부가 대표 속성 키워드와 하위 키워드 쌍에 대응되는 연관 가중치를 상기 저장부에 저장하고, 상기 대표 속성 키워드에 상응하는 각 하위 키워드와 상기 예약어 사이의 기본 예약어-하위 키워드 연관도를 획득하는 정보 제공 장치.
11. The method of claim 10,
The controller associates the basic keyword-keyword associations corresponding to the reserved words and the representative keyword pairs using the association weights corresponding to the representative attribute keywords and the lower keyword pairs and the basic word-lower keyword associations corresponding to the reserved words and the lower keyword pairs Before storing in the storage,
The control unit stores the associative weight corresponding to the representative attribute keyword and the lower keyword pair in the storage unit and obtains the information of acquiring the basic reserved word-lower keyword association between each lower keyword corresponding to the representative attribute keyword and the reserved word Device.
제11항에 있어서,
상기 제어부는,
각 하위 키워드가 상기 예약어와 동일 또는 유사한 문맥에 등장하는 빈도를 고려하여 상기 예약어와 각 하위 키워드 사이의 기본 예약어-하위 키워드 연관도를 판단하는 정보 제공 장치.
12. The method of claim 11,
Wherein,
And determines the basic reserved word-lower keyword association between the reserved word and each of the lower keywords in consideration of the frequency with which each lower keyword appears in the same or similar context as the reserved word.
제10항에 있어서,
상기 제어부는,
각 예약어 및 하위 키워드 쌍에 대하여 상기 예약어 및 상기 하위 키워드 쌍에 상응하는 기본 예약어-하위 키워드 연관도에 상기 하위 키워드 및 대표 속성 키워드 쌍에 상응하는 연관 가중치를 적용하여 상기 대표 속성 키워드에 대한 각 예약어 및 하위 키워드 쌍에 상응하는 조정 예약어-하위 키워드 연관도를 획득하고,
특정 대표 속성 키워드에 대한 상기 조정 예약어-하위 키워드 연관도의 누적값과 양의 상관관계를 가지도록 상기 예약어와 상기 특정 대표 속성 키워드 쌍에 대응하는 기본 예약어-키워드 연관도를 설정하는 정보 제공 장치.
11. The method of claim 10,
Wherein,
Applying associative weights corresponding to the lower keyword and the representative attribute keyword pair to the basic reserved word and lower keyword association diagram corresponding to the reserved word and the lower keyword pair for each of the reserved word and the lower keyword pair, And an adjustment reservation word-lower keyword association corresponding to the lower keyword pair,
Keyword associations corresponding to the reserved word and the specific representative attribute keyword pair so as to have a positive correlation with the accumulated value of the adjusted reserved word-lower keyword association with respect to the specific representative attribute keyword.
제13항에 있어서,
상기 제어부는,
각 예약어 및 하위 키워드 쌍에 대하여 상기 예약어 및 상기 하위 키워드 쌍에 상응하는 기본 예약어-하위 키워드 연관도에 상기 하위 키워드 및 대표 속성 키워드 쌍에 상응하는 연관 가중치를 곱한 값을 이용하여 상기 대표 속성 키워드에 대한 각 예약어 및 하위 키워드 쌍에 상응하는 조정 예약어-하위 키워드 연관도를 획득하는 정보 제공 장치.
14. The method of claim 13,
Wherein,
For each of the reserved word and the lower keyword pair, a value obtained by multiplying the basic word-lower keyword association corresponding to the reserved word and the lower keyword pair by the association weight corresponding to the lower keyword and the representative attribute keyword pair, To obtain an adjusted reservation word-lower keyword association corresponding to each of the reserved words and the lower-level keyword pairs.
제13항에 있어서,
상기 제어부는,
특정 예약어와 대응되는 기본 예약어-키워드 연관도를 가지는 대표 키워드 중 상기 특정 예약어와 대응하는 대표 키워드 쌍의 기본 예약어-키워드 연관도가 기준 기본 예약어-키워드 연관도 이하인 대표 키워드에 대한 기본 예약어-키워드 연관도를 삭제하는 정보 제공 장치.
14. The method of claim 13,
Wherein,
A basic reserved word corresponding to a specific reserved word and a representative keyword having a keyword association among the representative keywords having a keyword association, a basic reserved word for a representative keyword pair corresponding to the specific reserved word, The information providing apparatus comprising:
제13항에 있어서,
상기 제어부는,
특정 예약어에 대응하는 대표 키워드 중 상기 특정 예약어와 상기 대응하는 대표 키워드 쌍의 기본 예약어-키워드 연관도가 높은 순서대로 선정한 일정 개수의 대표 키워드를 제외한 대표 키워드에 대한 기본 예약어-키워드 연관도를 삭제하는 정보 제공 장치.
14. The method of claim 13,
Wherein,
Deletes the basic reserved word-keyword associations for the representative keywords excluding the predetermined number of representative keywords selected from the representative keywords corresponding to the specific reserved words in the descending order of the basic reserved word-keyword associations of the specific reserved words and the corresponding representative keyword pairs Information providing device.
제15항 또는 제16항에 있어서,
상기 제어부는,
상기 특정 예약어에 대응하는 기본 예약어-키워드 연관도 중 삭제되지 않은 기본 예약어-키워드 연관도를 상기 기본 예약어-키워드 연관도를 보완하도록 노멀라이즈 하는 정보 제공 장치.
17. The method according to claim 15 or 16,
Wherein,
And normalizes the basic reserved word-keyword association diagram of the basic reserved word-keyword association diagram corresponding to the specific reserved word so as to complement the basic reserved word-keyword association diagram.
제10항에 있어서,
상기 제어부는,
하나의 언어단위 또는 둘 이상의 연속된 언어단위들이 문서 집합에 포함된 문서에 등장하는 횟수 및 상기 하나의 언어단위 또는 둘 이상의 연속된 언어단위들로부터 미리 설정된 거리 이내에 감정어 사전에 포함된 감정어가 위치하는 횟수를 고려하여 예약어 후보를 설정하고;
상기 통신부는 설정된 예약어 후보 정보를 포함하는 예약어 선택 인터페이스를 생성하기 위한 인터페이스 정보를 제공하고,
상기 통신부가 예약어 선택 인터페이스를 통해 예약어 선택 입력을 수신하면, 상기 제어부는 선택 입력에 따라 선택된 예약어 후보를 예약어 집합에 추가하는 정보 제공 장치.
11. The method of claim 10,
Wherein,
The number of times that one language unit or two or more consecutive language units appear in a document included in a document set, and an emotion word included in the evaluation dictionary within a preset distance from the one language unit or two or more consecutive language units And sets a reserved word candidate in consideration of the number of times that the reserved word is selected;
Wherein the communication unit provides interface information for generating a reserved word selection interface including reserved word candidate information,
Wherein the control unit adds the selected reserved word candidate to the reserved word set according to the selection input when the communication unit receives the reserved word selection input through the reserved word selection interface.
KR1020180033093A 2017-07-24 2018-03-22 Method and apparatus for providing information using degree of association between reserved word and attribute language KR102130145B1 (en)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2018100394A JP6676699B2 (en) 2017-07-24 2018-05-25 Information providing method and apparatus using degree of association between reserved word and attribute language
JP2018100395A JP6676700B2 (en) 2017-07-24 2018-05-25 Information providing method and apparatus using degree of association between reserved word and attribute language
JP2018100393A JP6676698B2 (en) 2017-07-24 2018-05-25 Information retrieval method and apparatus using relevance between reserved words and attribute language
US16/044,247 US20190026282A1 (en) 2017-07-24 2018-07-24 Method and apparatus for providing information by using degree of association between reserved word and attribute language
US16/044,221 US20190026281A1 (en) 2017-07-24 2018-07-24 Method and apparatus for providing information by using degree of association between reserved word and attribute language
US16/044,275 US11397740B2 (en) 2017-07-24 2018-07-24 Method and apparatus for providing information by using degree of association between reserved word and attribute language

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
PCT/KR2017/007964 WO2019022262A1 (en) 2017-07-24 2017-07-24 System for searching and guiding preference for each area of interest
KRPCT/KR2017/007964 2017-07-24
KR20170121289 2017-09-20
KR1020170121289 2017-09-20

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020200079570A Division KR102226742B1 (en) 2017-07-24 2020-06-29 Information providing method and apparatus using reserved word

Publications (2)

Publication Number Publication Date
KR20190011184A true KR20190011184A (en) 2019-02-01
KR102130145B1 KR102130145B1 (en) 2020-07-03

Family

ID=65367710

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020180033093A KR102130145B1 (en) 2017-07-24 2018-03-22 Method and apparatus for providing information using degree of association between reserved word and attribute language
KR1020180035978A KR20190011185A (en) 2017-07-24 2018-03-28 Visualization method of reserved word and apparatus thereof
KR1020200079570A KR102226742B1 (en) 2017-07-24 2020-06-29 Information providing method and apparatus using reserved word

Family Applications After (2)

Application Number Title Priority Date Filing Date
KR1020180035978A KR20190011185A (en) 2017-07-24 2018-03-28 Visualization method of reserved word and apparatus thereof
KR1020200079570A KR102226742B1 (en) 2017-07-24 2020-06-29 Information providing method and apparatus using reserved word

Country Status (2)

Country Link
JP (3) JP6676698B2 (en)
KR (3) KR102130145B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102079289B1 (en) * 2019-04-23 2020-04-07 주식회사 비닛 Wine recommendation system and method

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040063641A (en) * 2003-01-08 2004-07-14 주식회사 옵투스 Apparatus and method for expanding keyword and search system using keyword expansion apparatus
KR20090080822A (en) 2008-01-22 2009-07-27 에스케이커뮤니케이션즈 주식회사 Method and Server for Searching Items and Constructing Database based on Sensitivity

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040063641A (en) * 2003-01-08 2004-07-14 주식회사 옵투스 Apparatus and method for expanding keyword and search system using keyword expansion apparatus
KR20090080822A (en) 2008-01-22 2009-07-27 에스케이커뮤니케이션즈 주식회사 Method and Server for Searching Items and Constructing Database based on Sensitivity

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102079289B1 (en) * 2019-04-23 2020-04-07 주식회사 비닛 Wine recommendation system and method

Also Published As

Publication number Publication date
JP2019023857A (en) 2019-02-14
KR20200085688A (en) 2020-07-15
JP6676700B2 (en) 2020-04-08
JP6676698B2 (en) 2020-04-08
JP6676699B2 (en) 2020-04-08
JP2019023855A (en) 2019-02-14
KR102226742B1 (en) 2021-03-11
KR20190011185A (en) 2019-02-01
KR102130145B1 (en) 2020-07-03
JP2019023856A (en) 2019-02-14

Similar Documents

Publication Publication Date Title
US10528635B2 (en) Blending by query classification on online social networks
US8886589B2 (en) Providing knowledge content to users
US11397740B2 (en) Method and apparatus for providing information by using degree of association between reserved word and attribute language
US11967177B2 (en) Method for managing item recommendation using degree of association between language unit and usage history
JP6932162B2 (en) Area-based item recommendation terminal device and item recommendation information provision method.
KR101955920B1 (en) Search method and apparatus using property language
KR102226742B1 (en) Information providing method and apparatus using reserved word
KR102279125B1 (en) Terminal and apparatus for providing recommendation information based on preference filter
KR102195691B1 (en) Apparatus of recommending restaurants based on types and drinking volumes of alcohols and method thereof
KR102335408B1 (en) Method and apparatus for managing movie tribute language
KR20200006421A (en) Apparatus of recommending hot places based on events and method thereof
KR20200012252A (en) Apparatus of recommending restaurants related items and method thereof
KR20200125507A (en) Method for recommending item using degree of association between unit of language and using breakdown
KR102184962B1 (en) Voice input processing system and method thereof
US20200341977A1 (en) Method and apparatus for managing attribute language
KR102280345B1 (en) Method and apparatus for managing recommended items using language units
KR20200002223A (en) Apparatus for providing distribution of item information based on events and method thereof
Takano et al. User Preference Profiling Based on Speech Recognition for Personalized Recommendation

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant