WO2020242086A1 - 다중 지식의 비교 우위를 추론하는 서버, 방법 및 컴퓨터 프로그램 - Google Patents

다중 지식의 비교 우위를 추론하는 서버, 방법 및 컴퓨터 프로그램 Download PDF

Info

Publication number
WO2020242086A1
WO2020242086A1 PCT/KR2020/006120 KR2020006120W WO2020242086A1 WO 2020242086 A1 WO2020242086 A1 WO 2020242086A1 KR 2020006120 W KR2020006120 W KR 2020006120W WO 2020242086 A1 WO2020242086 A1 WO 2020242086A1
Authority
WO
WIPO (PCT)
Prior art keywords
query
natural language
keyword
subject
target keyword
Prior art date
Application number
PCT/KR2020/006120
Other languages
English (en)
French (fr)
Inventor
조대웅
백규태
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Publication of WO2020242086A1 publication Critical patent/WO2020242086A1/ko
Priority to US17/456,604 priority Critical patent/US20220083879A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • G06F16/24526Internal representations for queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90324Query formulation using system suggestions
    • G06F16/90328Query formulation using system suggestions using search space presentation or visualization, e.g. category or range presentation and selection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation

Definitions

  • the present invention relates to a server, a method, and a computer program for inferring the comparative advantage of multiple knowledge.
  • Existing natural language-based query retrieval systems structure a natural language graph through semantic interpretation of natural language, and a graph with high similarity to the structured natural language graph, for example, a graph that has the same shape and is semantically similar in a knowledge database. Used to.
  • the existing query retrieval system performed query retrieval by calculating the graph similarity value through a comparison operation between the graph stored in the knowledge database and the structured natural language graph.
  • the existing query retrieval system has a problem that the search is delayed because a considerable amount of computation is required because it performs a one-to-one mapping between at least one graph retrieved from a knowledge database and a structured natural language graph or a comparison cycle in a sentence form.
  • the existing query search system is a processing method that is dependent on the graph structure, that is, the graph is matched and processed, the accuracy of the query search decreases when the natural language becomes complex or the structure of the graph stored in the knowledge database becomes complex. There was this.
  • the present invention is to solve the problems of the prior art described above, and an object keyword extracted from a natural language, a target keyword, and a query knowledge graph including a query form for the natural language is to be generated.
  • the present invention searches a plurality of query knowledge graphs including subject keywords extracted from natural language, and the object of natural language from map data based on relational keywords generated based on information mapped to each of the searched plurality of query knowledge graphs. I want to derive information related to keywords.
  • the present invention is to provide a query result for natural language based on the derived information and the query form of the natural language.
  • a server providing a response to a natural language-based query extracts a subject keyword, a target keyword, and a query form for the natural language from natural language, and the A query knowledge graph generation unit that generates a query knowledge graph including a subject keyword, a target keyword, and a query form;
  • a query knowledge graph search unit for searching a plurality of query knowledge graphs including the subject keywords;
  • An information derivation unit for deriving information related to the target keyword from map data based on the subject keyword of each of the searched plurality of query knowledge graphs;
  • a search result providing unit that provides a query result for the natural language based on the derived information and the query type.
  • a method for providing a response to a natural language-based query by a server includes: extracting a subject keyword, a target keyword, and a query form for the natural language from the natural language; Generating a query knowledge graph including the subject keyword, target keyword, and query form; Searching a plurality of query knowledge graphs including the subject keywords; Deriving information related to the target keyword from map data based on the subject keyword of each of the searched plurality of query knowledge graphs, and providing a query result for the natural language based on the derived information and the query form It may include.
  • a computer program stored in a recording medium including a sequence of commands providing a response to a natural language-based query is executed by a computing device, a subject keyword, a target keyword, and a query for the natural language from natural language Extracting a shape, generating a query knowledge graph including the subject keyword, target keyword, and query type, searching a plurality of query knowledge graphs including the subject keyword, and searching each of the plurality of query knowledge graphs
  • a sequence of commands for deriving information related to the target keyword from map data based on the subject keyword and providing a query result for the natural language based on the derived information and the query type may be included.
  • a query knowledge graph including a subject keyword extracted from a natural language, a target keyword, and a query form for the natural language may be generated.
  • the present invention searches a plurality of query knowledge graphs including subject keywords extracted from natural language, and the object of natural language from map data based on relational keywords generated based on information mapped to each of the searched plurality of query knowledge graphs. You can derive information related to keywords.
  • the present invention may provide a query result for a natural language based on the derived information and a query form of the natural language.
  • the present invention searches for a plurality of query knowledge graphs related to subject keywords when a query knowledge graph corresponding to a natural language is generated, unlike a method of searching for a query search result using the similarity of each knowledge graph. Since information related to the target keyword of the natural language is derived from the plurality of query knowledge graphs, the process of calculating all relationships between components of the natural language in the prior art and converting it to a similar graph can be omitted.
  • the present invention since the present invention generates the natural language as a query knowledge graph having the same structure even though the natural language is complexly configured, it is possible to escape from the problem of dependency of changing the existing natural language into a graph as it is.
  • the present invention can predict a target keyword using ranking data based on user preference even if the target keyword is not included in the natural language, and derive a value corresponding to the predicted target keyword and provide it as a query result for the natural language. I can.
  • FIG. 1 is a block diagram of a server providing a response to a natural language-based query according to an embodiment of the present invention.
  • 2A is a diagram illustrating a method of generating a query knowledge graph according to an embodiment of the present invention.
  • 2B is a diagram illustrating a method of generating a query knowledge graph according to an embodiment of the present invention.
  • 2C is a diagram illustrating a method of generating a query knowledge graph according to an embodiment of the present invention.
  • 2D is a diagram for describing a method of generating a query knowledge graph according to an embodiment of the present invention.
  • 3A is a diagram for explaining a comparison between a conventional natural language-based query result search structure and a natural language query result search structure according to an embodiment of the present invention.
  • 3B is a diagram illustrating a comparison between a conventional natural language-based query result search structure and a natural language query result search structure according to an embodiment of the present invention.
  • 4A is a diagram for describing a method of providing a response to a natural language-based query according to an embodiment of the present invention.
  • 4B is a diagram for describing a method of providing a response to a natural language-based query according to an embodiment of the present invention.
  • 4C is a diagram for describing a method of providing a response to a natural language-based query according to an embodiment of the present invention.
  • FIG. 5 is a diagram for describing a method of configuring ranking data based on user preference according to an embodiment of the present invention.
  • FIG. 6 is a diagram showing the importance of a query knowledge graph according to an embodiment of the present invention.
  • FIG. 7 is a diagram illustrating a method of deriving a result of an abstract comparative advantage query using ranking data based on user preference according to an embodiment of the present invention.
  • FIG. 8 is a flowchart illustrating a method of providing a response to a natural language-based query according to an embodiment of the present invention.
  • the term'unit' includes a unit realized by hardware, a unit realized by software, and a unit realized using both. Further, one unit may be realized using two or more hardware, or two or more units may be realized using one hardware.
  • some of the operations or functions described as being performed by the terminal or device may be performed instead by a server connected to the terminal or device.
  • some of the operations or functions described as being performed by the server may also be performed by a terminal or device connected to the server.
  • FIG. 1 is a block diagram of a server 10 providing a query result based on natural language according to an embodiment of the present invention.
  • the natural language-based query result providing server 10 includes a query knowledge graph generation unit 100, a query knowledge graph search unit 110, a map data generation unit 120, an information derivation unit 130, and a search. It may include a result providing unit 140, a first database 150 and a second database 160.
  • the query knowledge graph generation unit 100 may include a query type determination unit 102.
  • the natural language-based query result providing server 10 shown in FIG. 1 is only one example of the present invention, and various modifications are possible based on the components shown in FIG. 1.
  • FIG. 1 will be described with reference to FIGS. 2A to 7.
  • the query knowledge graph generator 100 may extract a subject keyword, a target keyword, and a query form for the natural language from the natural language.
  • the query type for the natural language may be determined by the query type determination unit 102 based on the number of subject keywords included in the natural language and whether or not a target keyword exists.
  • the query type determination unit 102 may determine a query type for the natural language as a single query.
  • the query knowledge graph generation unit 100 extracts'Kim Yu-na' from the first natural language as a subject keyword, and the first 'Age' can be extracted as a target keyword from natural language.
  • the query type determination unit 102 may determine a query type for the first natural language as a single query.
  • the query type determination unit 102 may determine a query type for the natural language as a comparative advantage query.
  • the query knowledge graph generation unit 100 when a user inputs a second natural language such as'Who is older than Kim Yu-na and Park Ji-sung?', the query knowledge graph generation unit 100 generates'Kim Yu-na' and'from the second natural language.
  • Each of'Park Ji-sung' can be extracted as a subject keyword, and'age' can be extracted as a target keyword from the second natural language.
  • the query shape determination unit 102 includes a plurality of subject keywords ('Kim Yu-na' and'Park Ji-sung') in the second natural language, and the target keyword ('Age') is included in the second natural language, the second The form of a query for natural language can be determined as a comparative advantage query.
  • the query shape determination unit 102 may determine a query form for the natural language as an abstract comparative advantage query.
  • the query knowledge graph generation unit 100 when a user inputs a third natural language such as'Who is better among Son Heung-min and Park Ji-sung?', the query knowledge graph generation unit 100 generates'Son Heung-min' and ' Each of'Park Ji-Sung' is extracted as a subject keyword, and since there is no target keyword in the third natural language, the target keyword can be extracted as a'null' value.
  • the query shape determination unit 102 includes only a plurality of subject keywords ('Son Heung-min' and'Park Ji-Sung') in the third natural language, and since no target keyword exists, the query form for the third natural language is abstractly compared. It can be determined by a dominant query.
  • the query knowledge graph generation unit 100 may generate a query knowledge graph having the same structure as the graph comparison reference model 20 shown in FIG. 2A even though the natural language has various forms.
  • the graph comparison reference model 20 may include, for example, a subject keyword 201, a target keyword 203, and a query form 205.
  • the query knowledge graph generated from the natural language has the same form as the graph comparison reference model 20.
  • the comparison group of subject keywords corresponding to the multiple knowledge may increase, but the target keyword corresponding to the direct purpose of the multiple knowledge comparison may be processed as a single graph flow.
  • At least one subject keyword 201 in the graph comparison reference model 20 corresponds to at least one subject word of the input natural language
  • the target keyword 203 in the graph comparison reference model 20 is the object word of the input natural language.
  • the query knowledge graph generator 100 may generate a query knowledge graph including a subject keyword extracted from a natural language, a target keyword, and a query form based on the graph comparison reference model 20.
  • understanding of natural language and additional semantic interpretation i.e., understanding and interpretation of the standardized query grammar SPARQL conversion grammar for querying the knowledge database
  • understanding and interpretation of the standardized query grammar SPARQL conversion grammar for querying the knowledge database was essential to search for the graph pattern structure consistent with the natural language.
  • the subject keyword, the target keyword, and the query form are identified from the natural language without the process of understanding and interpreting the natural language, the subject keyword, the target keyword, and the query form are inserted into each element of the graph comparison reference model 20 to provide query knowledge. You can create a graph.
  • the subject keyword extracted from the first natural language ('Kim Yu-na'), the target keyword ('age ') and a first query knowledge graph (Yeonah Kim-age-single query) including a query type ('single query') for the first natural language may be generated.
  • the first topic keyword extracted from the second natural language (' '), the second subject keyword ('Park Ji-sung'), the target keyword ('age'), and the second query knowledge graph ('Kim Yu-na-age-comparison) including the query type for the second natural language Superiority queries' and'Park Ji-seong-age-comparative superiority queries') can be generated.
  • the query knowledge graph generation unit 100 may generate a second query knowledge graph for each of the first subject keyword ('Kim Yu-na') and the second subject keyword ('Park Ji-sung').
  • the third natural language is'Who is better among Heungmin Son and Jisung Park?'
  • the first topic keyword extracted from the third natural language ('Heungmin Son ')
  • the second topic keyword ('Park Ji-Sung')
  • the target keyword ('null')
  • the third query knowledge graph ('Son Heung-min-null -Abstract comparative advantage query' and'Park Ji-sung-null-abstract comparative advantage query') can be generated.
  • the query knowledge graph generation unit 100 may generate a third query knowledge graph for each of the first subject keyword ('Son Heung-min') and the second subject keyword ('Park Ji-Sung').
  • the query knowledge graph search unit 110 may search a plurality of query knowledge graphs including subject keywords.
  • the conventional natural language-based query result search structure 3a uses a method of searching for a graph pattern structure that matches natural language in the knowledge database 30 using a graph matching technology 32. Therefore, the graph structure in the knowledge database 30 is complex, and it is inefficient when it becomes large.
  • the natural language query result search structure 3b of the present invention searches a plurality of query knowledge graphs 34 including subject keywords from the first database 150 storing the plurality of query knowledge graphs, and Since the information related to the target keyword is searched based on the map data based on the relational keyword within the result of the query knowledge graph 34, the amount of time and computation required for the search is considerably compared to the conventional natural language-based query result search structure (3a). There is a diminishing effect.
  • the map data generation unit 120 generates a plurality of relational keywords and values corresponding to each of the plurality of relational keywords based on information mapped to each of the plurality of query knowledge graphs including the subject keywords searched from the first database 150. Map data based on included subject keywords can be generated.
  • each of the plurality of relational keywords in the map data corresponds to a target keyword included in each of the searched plurality of query knowledge graphs
  • a value corresponding to each of the plurality of relational keywords is a purpose included in each of the searched plurality of query knowledge graphs. It may be a value corresponding to a keyword.
  • the map data generation unit 120 includes a plurality of query knowledge including'Yeonah Kim', a subject keyword of a first natural language, from a first database 150 that stores a plurality of query knowledge graphs.
  • the first map data 401 may be generated based on information mapped to each of a plurality of query knowledge graphs including'Kim Yuna'.
  • the information derivation unit 130 may derive information related to a target keyword from map data based on a relational keyword generated based on information mapped to each of the searched plurality of query knowledge graphs.
  • the information derivation unit 130 displays each of a plurality of query knowledge graphs including'Kim Yu-na' which is the subject keyword of the first natural language.
  • a relational keyword ('birth') related to'age' which is a target keyword of the first natural language, and a value ('1990') of the relational keyword ('birth')
  • a value corresponding to the target keyword'age' can be derived from the value ('1990') of the relevant keyword ('birth').
  • the search result providing unit 140 may provide a query result for natural language based on the derived information and a query form. For example, referring to FIG. 4A, when the query form of the first natural language is a single query, the information derivation unit 130 is a target keyword derived from the value ('1990') of the relationship keyword ('birth'). A value corresponding to'age' (Kim Yu-na's age: 30 years old) can be provided as a query result for the first natural language.
  • the query knowledge graph search unit 110 when the natural language includes a plurality of subject keywords including a first subject keyword and a second subject keyword, the query knowledge graph search unit 110 generates a plurality of first query knowledge graphs including the first subject keyword. After searching, a plurality of second query knowledge graphs including a second subject keyword may be searched.
  • query knowledge graph The search unit 110 searches a plurality of first query knowledge graphs including'Kim Yu-na' as a first subject keyword of the second natural language from the first database 150, and includes a second subject keyword'Park Ji-sung'.
  • a plurality of second query knowledge graphs can be searched.
  • a query knowledge graph search unit 110 searches a plurality of first query knowledge graphs including'Heung-min Son', a first subject keyword of a third natural language, from the first database 150, and a plurality of knowledge graphs including'Park Ji-sung', which is a second subject keyword. You can explore the knowledge graph of the second query.
  • the map data generation unit 120 generates first map data including a plurality of relational keywords and values corresponding to each of the plurality of relational keywords based on information mapped to each of the searched plurality of first query knowledge graphs, Second map data including a plurality of relationship keywords and values corresponding to each of the plurality of relationship keywords may be generated based on information mapped to each of the searched second query knowledge graphs.
  • the map data generator 120
  • the map data generator 120
  • the map data generator 120
  • the map data generator 120
  • the map data generator 120
  • the map data generator 120
  • a map data generator 120 when a plurality of query knowledge graphs are searched for each of'Heungmin Son' and'Jisung Park', which are a plurality of subject keywords of a third natural language, from the first database 150, a map data generator 120 generates the first map data 413 based on information mapped to each of the plurality of query knowledge graphs including'Son Heung-min', and is mapped to each of the plurality of query knowledge graphs including'Park Ji-Sung'.
  • the second map data 415 may be generated based on the information.
  • the information derivation unit 130 derives information related to the target keyword from the generated first map data, and derives information related to the target keyword from the generated second map data. I can.
  • the information derivation unit 130 determines a first value corresponding to the target keyword from the first map data and a second value corresponding to the target keyword from the second map data. Can be derived.
  • the information derivation unit 130 is a first map generated based on information mapped to each of a plurality of query knowledge graphs including'Kim Yuna', which is a first topic keyword of a second natural language.
  • data 409 including a relational keyword ('birth') related to'age', which is a target keyword of a second natural language, and a value ('1990') of the relational keyword ('birth') are detected, and , From the value ('1990') of the corresponding relationship keyword ('birth'), a first value corresponding to the target keyword'age' may be derived.
  • the information derivation unit 130 is a second natural language from the second map data 407 generated based on information mapped to each of a plurality of query knowledge graphs including'Park Ji-Sung', which is a second topic keyword of the second natural language.
  • the data 411 including the value ('1981') of the relationship keyword ('birth') and the relationship keyword ('birth') related to'age', which is the purpose keyword of, is detected, and the corresponding relationship keyword ('birth') is detected.
  • a second value corresponding to the target keyword'age' can be derived from the value of ('1981').
  • the search result providing unit 140 compares the superiority of the first value and the second value corresponding to the target keyword of the natural language derived from each of the first map data and the second map data. Thus, search results for natural language can be provided.
  • the search result providing unit 140 is derived from each of the first map data 405 and the second map data 407.
  • Search results for the second natural language by comparing the values between the first value (Kim Yu-na's age: 30) and the second value (Park Ji-sung's age: 39) corresponding to the target keyword ('age') of the second natural language ( For example,'Park Ji-sung is 9 years older than Kim Yu-na') can be provided.
  • the information derivation unit 130 infers the query result for natural language using ranking data based on user preference. I can.
  • the ranking data based on user preference may be stored and stored in the second database 160.
  • the ranking data based on user preference may be used to determine the comparative advantage (ie, abstract comparative advantage) between two knowledges without a direct reference of the target keyword in the natural language question.
  • the ranking data based on user preference may be data ranked for a plurality of keywords appearing in a plurality of documents collected for each subject.
  • weights are calculated for main keywords mainly mentioned from various structured and unstructured data 503, and correspond to the main keywords and main keywords from the calculated weights. It is used to rank attribute data including values of
  • the weight of a plurality of key keywords that appear more than a preset number of times in various structured and unstructured data collected by topic is related to the topic keywords included in the query language. It can be a high important attribute.
  • various structured and unstructured data 503 collected by subject are normalized, and stop words that may affect the weight are removed from the normalized document through text analysis of the normalized document, and then the user preference model It may be ranked based on the weights for the main keywords calculated through 501 and stored in the second database 160.
  • the information derivation unit 130 derives at least one prediction target keyword based on user preference-based ranking data, and retrieves information related to the prediction target keyword from the first map data. And derived information related to the prediction target keyword from the second map data.
  • the information derivation unit 130 includes subject keywords of a third natural language ('Heung-min Son' and'Ji-Sung Park') among a plurality of user preference-based ranking data stored in the second database 160
  • At least one relational keyword ('club','award','world cup',') included in the map data (413, 415) matched with related user preference-based ranking data (data with a high ranking in relation to the topic keyword) Goal') can be derived as a prediction target keyword for the third natural language.
  • the information derivation unit 130 is a prediction target keyword capable of numerical advantage comparison among at least one prediction target keyword ('club','award','world cup','goal') for the derived third natural language ( 'Award','World Cup','Goal') can be selected.
  • the information derivation unit 130 derives a first value corresponding to the selected prediction target keyword from the first map data 413, and calculates a second value corresponding to the selected prediction target keyword as second map data 415 ) Can be derived from.
  • the search result providing unit 140 may provide a search result for a natural language by comparing the advantages of the derived first value and the second value.
  • the information derivation unit 130 derives from the first map data 413 a first value corresponding to a first prediction target keyword ('award') capable of numerical advantage comparison, A second value corresponding to the first prediction target keyword ('aqueous') may be derived from each of the second map data 415.
  • the search result providing unit 140 includes a first value corresponding to the first prediction target keyword ('award') derived from each of the first map data 413 and the second map data 415 ('Son Heung-min's Award' Number of times: 17') and the second value ('Park Ji-sung's number of awards: 25') and the search result for a third natural language (for example,'Park Ji-sung's number of awards is higher than Son's number of awards'). Can provide.
  • the present invention compares multiple knowledge to derive and infer new knowledge from a factual relationship composed of a knowledge database or query knowledge graph. For example, the present invention uses'Who is better among Son Heung-min and Park Ji-sung?', which is the third key word,'Who is older than Son Heung-min and Park Ji-sung?' Or, it is possible to generate comparative advantage knowledge in the form of'Who has scored more goals among Son Heung-min and Park Ji-sung?' and derive answers to this knowledge. Accordingly, the present invention can infer new knowledge that did not exist in the third natural language and derive an answer to the generated knowledge.
  • nodes and relationships that are determined to be important in a plurality of query knowledge graphs are displayed in different colors to express the importance of different knowledge.
  • Significant nodes and relationships become fundamental factors when comparing the value advantage between different knowledge. If the factors calculated as importance between nodes of each query knowledge graph are the same, it can be presented as a basis for superior comparison of values within the same factor.
  • the user preference-based ranking data ranked by the user preference model 501 may be used to extract the relationship attribute of the query knowledge graph. For example, referring to FIGS. 4C and 7 together, when a keyword that frequently appears in a plurality of documents related to'Son Heung-min' is related to'Goal','Award','Tottenham (Affiliated Team)', etc., If among these keywords, the user preference-based ranking data (data stored in the second database 160) having a high ranking matches the relationship keyword of the map data 413 generated from the first database 150, the corresponding user preference-based ranking data Is mapped to the query knowledge graph, and weights can be applied to the nodes and relationships of the query knowledge graph.
  • the query knowledge graph generation unit 100 the query form determination unit 102, the query knowledge graph search unit 110, the map data generation unit 120, the information derivation unit 130, and the search result providing unit
  • each of the first database 150 and the second database 160 may be implemented separately, or one or more of them may be integrated and implemented.
  • FIG. 8 is a flowchart illustrating a method of providing a query result based on natural language according to an embodiment of the present invention.
  • the natural language-based query result providing server 10 may extract a subject keyword, a target keyword, and a query form for the natural language from the natural language.
  • the natural language-based query result providing server 10 may generate a query knowledge graph including the extracted subject keyword, target keyword, and query type.
  • the natural language-based query result providing server 10 may search for a plurality of query knowledge graphs including subject keywords.
  • the natural language-based query result providing server 10 may derive information related to a target keyword from map data based on a relational keyword generated based on information mapped to each of the searched plurality of query knowledge graphs.
  • the natural language-based query result providing server 10 may provide a query result for the natural language based on the derived information and the query form.
  • the natural language-based query result providing server 10 may determine a query type for the natural language based on the number of subject keywords included in the natural language and whether or not a target keyword exists. For example, the natural language-based query result providing server 10 may determine a query type for natural language as a single query when a single subject keyword and a target keyword are included in the natural language. When a target keyword is included in the natural language and a plurality of subject keywords are included in the natural language-based query result providing server 10, the query type for the natural language may be determined as a comparative advantage query. The natural language-based query result providing server 10 may determine a query form for the query language as an abstract comparative advantage query when a plurality of subject keywords are included in the natural language and the target keyword is not included.
  • the natural language-based query result providing server 10 includes a plurality of subject keywords including a first subject keyword and a second subject keyword in the natural language, including the first subject keyword.
  • the first plurality of query knowledge graphs may be searched, and the second plurality of query knowledge graphs including a second subject keyword may be searched.
  • the natural language-based query result providing server 10 is based on first map data generated based on information mapped to each of the searched first plurality of query knowledge graphs and information mapped to each of the searched second plurality of query knowledge graphs. From the generated second map data, information related to the first topic keyword and the second topic keyword may be derived.
  • the natural language-based query result providing server 10 provides a target keyword from a first value corresponding to a target keyword from the first map data and a target keyword from the second map data when the query type is a comparative advantage query.
  • a second value corresponding to can be derived.
  • the natural language-based query result providing server 10 derives at least one prediction target keyword based on user preference-based ranking data when the query type is an abstract comparative advantage query, and the first A first value corresponding to the prediction target keyword may be derived from the map data and a second value corresponding to the prediction target keyword may be derived from the second map data.
  • the natural language-based query result providing server 10 may provide a search result for the natural language by comparing the advantages of the derived first value and the second value.
  • steps S801 to S809 may be further divided into additional steps or combined into fewer steps, according to an embodiment of the present invention.
  • some steps may be omitted as necessary, and the order between steps may be changed.
  • An embodiment of the present invention may also be implemented in the form of a recording medium including instructions executable by a computer, such as a program module executed by a computer.
  • Computer-readable media can be any available media that can be accessed by a computer, and includes both volatile and nonvolatile media, removable and non-removable media. Further, the computer-readable medium may include all computer storage media. Computer storage media includes both volatile and nonvolatile, removable and non-removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data.

Abstract

자연어 기반 질의에 대한 응답을 제공하는 서버는 자연어로부터 주제 키워드, 목적 키워드 및 자연어에 대한 질의 형태를 추출하고, 주제 키워드, 목적 키워드 및 질의 형태를 포함하는 질의 지식 그래프를 생성하는 질의 지식 그래프 생성부, 주제 키워드를 포함하는 복수의 질의 지식 그래프를 탐색하는 질의 지식 그래프 탐색부, 탐색된 복수의 질의 지식 그래프 각각의 상기 주제 키워드에 기반한 맵 데이터로부터 목적 키워드와 관련된 정보를 도출하는 정보 도출부 및 추출된 정보 및 질의 형태에 기초하여 자연어에 대한 질의 결과를 제공하는 검색 결과 제공부를 포함할 수 있다.

Description

다중 지식의 비교 우위를 추론하는 서버, 방법 및 컴퓨터 프로그램
본 발명은 다중 지식의 비교 우위를 추론하는 서버, 방법 및 컴퓨터 프로그램에 관한 것이다.
기존의 자연어 기반의 질의 검색 시스템은 자연어의 어의적인 해석을 통해 자연어 그래프를 구조화하고, 구조화된 자연어 그래프와 유사도가 높은 그래프 예컨대, 동일한 형태를 가지면서 의미적으로 유사한 그래프를 지식 데이터베이스에서 검색하는 방식을 이용했었다.
즉, 기존의 질의 검색 시스템은 지식 데이터베이스에 저장된 그래프와 구조화된 자연어 그래프 간의 비교 연산을 통해 그래프 유사도 값을 계산하는 방식으로 질의 검색을 수행했었다.
이러한 기존의 질의 검색 시스템은 지식 데이터베이스에서 검색된 적어도 하나의 그래프와 구조화된 자연어 그래프 간의 일대일 매핑 또는 문장 형태로의 비교 순환 과정을 수행하기 때문에 상당히 많은 연산이 필요해 검색이 지연된다는 문제점이 있었다.
또한, 기존의 질의 검색 시스템은 그래프 구조에 의존적인 처리 방식, 즉, 그래프를 매칭해가며 처리하는 방식이기 때문에 자연어가 복잡해지거나 지식 데이터베이스 내에 저장된 그래프의 구조가 복잡해지면 질의 검색에 대한 정확도가 떨어지는 문제점이 있었다.
본 발명은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 자연어로부터 추출된 주제 키워드, 목적 키워드 및 자연어에 대한 질의 형태를 포함하는 질의 지식 그래프를 생성하고자 한다. 또한, 본 발명은 자연어로부터 추출된 주제 키워드를 포함하는 복수의 질의 지식 그래프를 탐색하고, 탐색된 복수의 질의 지식 그래프 각각에 매핑된 정보에 기초하여 생성된 관계 키워드 기반의 맵 데이터로부터 자연어의 목적 키워드와 관련된 정보를 도출하고자 한다. 또한, 본 발명은 도출된 정보 및 자연어의 질의 형태에 기초하여 자연어에 대한 질의 결과를 제공하고자 한다.
다만, 본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.
상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 제 1 측면에 따른 자연어 기반 질의에 대한 응답을 제공하는 서버는 자연어로부터 주제 키워드, 목적 키워드 및 상기 자연어에 대한 질의 형태를 추출하고, 상기 주제 키워드, 목적 키워드 및 질의 형태를 포함하는 질의 지식 그래프를 생성하는 질의 지식 그래프 생성부; 상기 주제 키워드를 포함하는 복수의 질의 지식 그래프를 탐색하는 질의 지식 그래프 탐색부; 상기 탐색된 복수의 질의 지식 그래프 각각의 상기 주제 키워드에 기반한 맵 데이터로부터 상기 목적 키워드와 관련된 정보를 도출하는 정보 도출부; 및 상기 도출된 정보 및 상기 질의 형태에 기초하여 상기 자연어에 대한 질의 결과를 제공하는 검색 결과 제공부를 포함할 수 있다.
본 발명의 제 2 측면에 따른 서버에 의해 자연어 기반 질의에 대한 응답을 제공하는 방법은 자연어로부터 주제 키워드, 목적 키워드 및 상기 자연어에 대한 질의 형태를 추출하는 단계; 상기 주제 키워드, 목적 키워드 및 질의 형태를 포함하는 질의 지식 그래프를 생성하는 단계; 상기 주제 키워드를 포함하는 복수의 질의 지식 그래프를 탐색하는 단계; 상기 탐색된 복수의 질의 지식 그래프 각각의 상기 주제 키워드에 기반한 맵 데이터로부터 상기 목적 키워드와 관련된 정보를 도출하는 단계 및 상기 도출된 정보 및 상기 질의 형태에 기초하여 상기 자연어에 대한 질의 결과를 제공하는 단계를 포함할 수 있다.
본 발명의 제 3 측면에 따른 자연어 기반 질의에 대한 응답을 제공하는 명령어들의 시퀀스를 포함하는 기록 매체에 저장된 컴퓨터 프로그램은 컴퓨팅 장치에 의해 실행될 경우, 자연어로부터 주제 키워드, 목적 키워드 및 상기 자연어에 대한 질의 형태를 추출하고, 상기 주제 키워드, 목적 키워드 및 질의 형태를 포함하는 질의 지식 그래프를 생성하고, 상기 주제 키워드를 포함하는 복수의 질의 지식 그래프를 탐색하고, 상기 탐색된 복수의 질의 지식 그래프 각각의 상기 주제 키워드에 기반한 맵 데이터로부터 상기 목적 키워드와 관련된 정보를 도출하고, 상기 도출된 정보 및 상기 질의 형태에 기초하여 상기 자연어에 대한 질의 결과를 제공하는 명령어들의 시퀀스를 포함할 수 있다.
상술한 과제 해결 수단은 단지 예시적인 것으로서, 본 발명을 제한하려는 의도로 해석되지 않아야 한다. 상술한 예시적인 실시예 외에도, 도면 및 발명의 상세한 설명에 기재된 추가적인 실시예가 존재할 수 있다.
전술한 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 자연어로부터 추출된 주제 키워드, 목적 키워드 및 자연어에 대한 질의 형태를 포함하는 질의 지식 그래프를 생성할 수 있다. 또한, 본 발명은 자연어로부터 추출된 주제 키워드를 포함하는 복수의 질의 지식 그래프를 탐색하고, 탐색된 복수의 질의 지식 그래프 각각에 매핑된 정보에 기초하여 생성된 관계 키워드 기반의 맵 데이터로부터 자연어의 목적 키워드와 관련된 정보를 도출할 수 있다. 또한, 본 발명은 도출된 정보 및 자연어의 질의 형태에 기초하여 자연어에 대한 질의 결과를 제공할 수 있다.
이와 같이, 본 발명은 종래의 각 지식 그래프의 유사도를 이용하여 질의 검색 결과를 탐색하는 방식과 달리, 자연어에 대응하는 질의 지식 그래프가 생성되면 주제 키워드와 관련된 복수의 질의 지식 그래프를 탐색하고, 탐색된 복수의 질의 지식 그래프 내에서 자연어의 목적 키워드와 연관된 정보를 도출하기 때문에 종래 기술에 있어서의 자연어의 구성 요소 간의 모든 관계를 계산하여 이와 유사한 그래프로 변환해야 하는 처리를 생략할 수 있다.
또한, 자연어에 대한 질의 결과의 검색 시간을 대폭 줄일 수 있을 뿐만 아니라, 질의 결과의 정확도를 높일 수 있다.
또한, 본 발명은 자연어가 복잡하게 구성되어 있더라도 자연어를 동일한 구조의 질의 지식 그래프로 생성하기 때문에 기존의 자연어를 그대로 그래프로 변경해야 하는 종속성의 문제로부터 탈피할 수 있다.
또한, 본 발명은 자연어에 목적 키워드가 포함되어 있지 않더라도 사용자 선호도 기반의 랭킹 데이터를 이용하여 목적 키워드를 예측할 수 있고, 예측된 목적 키워드에 해당하는 값을 도출하여 이를 자연어에 대한 질의 결과로서 제공할 수 있다.
도 1은 본 발명의 일 실시예에 따른, 자연어 기반 질의에 대한 응답을 제공하는 서버의 블록도이다.
도 2a는 본 발명의 일 실시예에 따른, 질의 지식 그래프를 생성하는 방법을 설명하기 위한 도면이다.
도 2b는 본 발명의 일 실시예에 따른, 질의 지식 그래프를 생성하는 방법을 설명하기 위한 도면이다.
도 2c는 본 발명의 일 실시예에 따른, 질의 지식 그래프를 생성하는 방법을 설명하기 위한 도면이다.
도 2d는 본 발명의 일 실시예에 따른, 질의 지식 그래프를 생성하는 방법을 설명하기 위한 도면이다.
도 3a는 본 발명의 일 실시예에 따른, 종래의 자연어 기반 질의 결과 탐색 구조와 본 발명의 자연어 질의 결과 탐색 구조를 비교 설명하기 위한 도면이다.
도 3b는 본 발명의 일 실시예에 따른, 종래의 자연어 기반 질의 결과 탐색 구조와 본 발명의 자연어 질의 결과 탐색 구조를 비교 설명하기 위한 도면이다.
도 4a는 본 발명의 일 실시예에 따른, 자연어 기반 질의에 대한 응답을 제공하는 방법을 설명하기 위한 도면이다.
도 4b는 본 발명의 일 실시예에 따른, 자연어 기반 질의에 대한 응답을 제공하는 방법을 설명하기 위한 도면이다.
도 4c는 본 발명의 일 실시예에 따른, 자연어 기반 질의에 대한 응답을 제공하는 방법을 설명하기 위한 도면이다.
도 5는 본 발명의 일 실시예에 따른, 사용자 선호도 기반 랭킹 데이터를 구성하는 방법을 설명하기 위한 도면이다.
도 6은 본 발명의 일 실시예에 따른, 질의 지식 그래프에 대한 중요도를 표현한 도면이다.
도 7은 본 발명의 일 실시예에 따른, 사용자 선호도 기반 랭킹 데이터를 이용하여 추상적 비교 우위 질의에 대한 결과를 도출하는 방법을 설명하기 위한 도면이다.
도 8은 본 발명의 일 실시예에 따른, 자연어 기반 질의에 대한 응답을 제공하는 방법을 나타낸 흐름도이다.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1 개의 유닛이 2 개 이상의 하드웨어를 이용하여 실현되어도 되고, 2 개 이상의 유닛이 1 개의 하드웨어에 의해 실현되어도 된다.
본 명세서에 있어서 단말 또는 디바이스가 수행하는 것으로 기술된 동작이나 기능 중 일부는 해당 단말 또는 디바이스와 연결된 서버에서 대신 수행될 수도 있다. 이와 마찬가지로, 서버가 수행하는 것으로 기술된 동작이나 기능 중 일부도 해당 서버와 연결된 단말 또는 디바이스에서 수행될 수도 있다.
이하, 첨부된 구성도 또는 처리 흐름도를 참고하여, 본 발명의 실시를 위한 구체적인 내용을 설명하도록 한다.
도 1은 본 발명의 일 실시예에 따른, 자연어 기반 질의 결과를 제공하는 서버(10)의 블록도이다.
도 1을 참조하면, 자연어 기반 질의 결과 제공 서버(10)는 질의 지식 그래프 생성부(100), 질의 지식 그래프 탐색부(110), 맵 데이터 생성부(120), 정보 도출부(130), 검색 결과 제공부(140), 제 1 데이터베이스(150) 및 제 2 데이터베이스(160)를 포함할 수 있다.
여기서, 질의 지식 그래프 생성부(100)는 질의 형태 결정부(102)를 포함할 수 있다.
다만, 도 1에 도시된 자연어 기반 질의 결과 제공 서버(10)는 본 발명의 하나의 구현 예에 불과하며, 도 1에 도시된 구성요소들을 기초로 하여 여러 가지 변형이 가능하다.
이하에서는 도 2a 내지 도 7을 참조하여 도 1을 설명하기로 한다.
질의 지식 그래프 생성부(100)는 자연어로부터 주제 키워드, 목적 키워드 및 자연어에 대한 질의 형태를 추출할 수 있다. 이 때, 자연어에 대한 질의 형태는 질의 형태 결정부(102)에 의해 자연어에 포함된 주제 키워드의 개수 및 목적 키워드의 존재 여부에 기초하여 결정될 수 있다.
질의 형태 결정부(102)는 자연어에 단일의 주제 키워드 및 목적 키워드가 포함되는 경우, 자연어에 대한 질의 형태를 단일 질의로 결정할 수 있다.
예를 들어, 도 2b와 같이, 사용자로부터 '김연아 나이는'이라는 제 1 자연어를 입력받은 경우, 질의 지식 그래프 생성부(100)는 제 1 자연어로부터 '김연아'를 주제 키워드로서 추출하고, 제 1 자연어로부터 '나이'를 목적 키워드로서 추출할 수 있다.
이 때, 질의 형태 결정부(102)는 제 1 자연어에 단일의 주제 키워드가 포함되어 있고, 제 1 자연어에 목적 키워드가 포함되어 있으므로, 제 1 자연어에 대한 질의 형태를 단일 질의로 결정할 수 있다.
질의 형태 결정부(102)는 자연어에 복수의 주제 키워드 및 목적 키워드가 포함되어 있는 경우, 자연어에 대한 질의 형태를 비교 우위 질의로 결정할 수 있다.
예를 들어, 도 2c와 같이, 사용자로부터 '김연아와 박지성의 나이는 누가 더 많지?'라는 제 2 자연어를 입력받은 경우, 질의 지식 그래프 생성부(100)는 제 2 자연어로부터 '김연아'와 '박지성' 각각을 주제 키워드로서 추출하고, 제 2 자연어로부터 '나이'를 목적 키워드로서 추출할 수 있다.
이 때, 질의 형태 결정부(102)는 제 2 자연어에 복수의 주제 키워드('김연아'와 '박지성')가 포함되어 있고, 제 2 자연어에 목적 키워드('나이')가 포함되므로, 제 2 자연어에 대한 질의 형태를 비교 우위 질의로 결정할 수 있다.
질의 형태 결정부(102)는 자연어에 복수의 주제 키워드만 포함되어 있고, 목적 키워드가 포함되어 있지 않는 경우, 자연어에 대한 질의 형태를 추상적 비교 우위 질의로 결정할 수 있다.
예를 들어, 도 2d와 같이, 사용자로부터 '손흥민과 박지성 중 누가 더 뛰어나지?'라는 제 3 자연어를 입력받은 경우, 질의 지식 그래프 생성부(100)는 제 3 자연어로부터 '손흥민'과 '박지성' 각각을 주제 키워드로서 추출하고, 제 3 자연어에는 목적 키워드가 존재하지 않으므로, 목적 키워드를 'null'값으로 추출할 수 있다.
이 때, 질의 형태 결정부(102)는 제 3 자연어에 복수의 주제 키워드('손흥민'과 '박지성')만을 포함하고, 목적 키워드가 존재하지 않으므로, 제 3 자연어에 대한 질의 형태를 추상적 비교 우위 질의로 결정할 수 있다.
질의 지식 그래프 생성부(100)는 자연어의 형태가 다양할지라도 도 2a에 도시된 그래프 비교 레퍼런스 모델(20)과 같이 동일한 구조를 갖는 질의 지식 그래프를 생성할 수 있다. 그래프 비교 레퍼런스 모델(20)은 예를 들어, 주제 키워드(201), 목적 키워드(203) 및 질의 형태(205)를 포함할 수 있다.
즉, 자연어의 복잡도에 상관없이 자연어로부터 생성되는 질의 지식 그래프는 그래프 비교 레퍼런스 모델(20)과 같이 동일한 형태를 이루게 된다.
이때, 자연어가 다중 지식 비교 질의에 해당하는 경우, 다중 지식에 해당하는 주제 키워드의 비교군은 늘어날 수 있으나 다중 지식 비교에 직접적인 목적에 해당하는 목적 키워드는 단일 그래프 흐름으로 처리할 수 있다.
그래프 비교 레퍼런스 모델(20)에서의 적어도 하나의 주제 키워드(201)는 입력된 자연어의 적어도 하나의 주제어에 대응되고, 그래프 비교 레퍼런스 모델(20)에서의 목적 키워드(203)는 입력된 자연어의 목적어에 대응될 수 있다.
질의 지식 그래프 생성부(100)는 그래프 비교 레퍼런스 모델(20)에 기반하여 자연어로부터 추출된 주제 키워드, 목적 키워드 및 질의 형태를 포함하는 질의 지식 그래프를 생성할 수 있다.
종래의 질의 검색 시스템은 자연어와 일치하는 그래프 패턴 구조를 탐색하기 위해 자연어에 대한 이해 및 추가적인 어의적 해석(즉, 지식데이터베이스에 질의하기 위한 표준화된 질의 문법 SPARQL 변환 문법의 이해 및 해석)이 필수였으나, 본 발명은 자연어에 대한 이해 및 해석 과정 없이도 자연어로부터 주제 키워드, 목적 키워드 및 질의 형태가 파악되면 주제 키워드, 목적 키워드 및 질의 형태 각각을 그래프 비교 레퍼런스 모델(20)의 각 요소에 삽입함으로써 질의 지식 그래프를 생성할 수 있다.
예를 들어, 도 2b와 같이, 질의 지식 그래프 생성부(100)는 제 1 자연어가 '김연아 나이는?'인 경우, 제 1 자연어로부터 추출된 주제 키워드('김연아'), 목적 키워드('나이') 및 제 1 자연어에 대한 질의 형태('단일 질의')를 포함하는 제 1 질의 지식 그래프(김연아-나이-단일질의)를 생성할 수 있다.
예를 들어, 도 2c와 같이, 질의 지식 그래프 생성부(100)는 제 2 자연어가 '김연아와 박지성의 나이는 누가 더 많지?'인 경우, 제 2 자연어로부터 추출된 제 1 주제 키워드('김연아'), 제 2 주제 키워드('박지성'), 목적 키워드('나이') 및 제 2 자연어에 대한 질의 형태('비교 우위 질의')를 포함하는 제 2 질의 지식 그래프('김연아-나이-비교우위질의' 및 '박지성-나이-비교우위질의')를 생성할 수 있다.
이 때, 질의 지식 그래프 생성부(100)는 제 1 주제 키워드('김연아') 및 제 2 주제 키워드('박지성') 각각에 대하여 제 2 질의 지식 그래프를 생성할 수 있다.
예를 들어, 도 2d와 같이, 질의 지식 그래프 생성부(100)는 제 3 자연어가 '손흥민과 박지성 중 누가 더 뛰어나지?'인 경우, 제 3 자연어로부터 추출된 제 1 주제 키워드('손흥민'), 제 2 주제 키워드('박지성'), 목적 키워드('null') 및 제 3 자연어에 대한 질의 형태('추상적 비교 우위 질의')를 포함하는 제 3 질의 지식 그래프('손흥민-null-추상적비교우위질의' 및 '박지성-null-추상적비교우위질의')를 생성할 수 있다.
이 때, 질의 지식 그래프 생성부(100)는 제 1 주제 키워드('손흥민') 및 제 2 주제 키워드('박지성') 각각에 대하여 제 3 질의 지식 그래프를 생성할 수 있다.
질의 지식 그래프 탐색부(110)는 주제 키워드를 포함하는 복수의 질의 지식 그래프를 탐색할 수 있다.
잠시 도 3a와 도 3b를 참조하면, 종래의 자연어 기반 질의 결과 탐색 구조(3a)는 지식 데이터베이스(30) 내에서 자연어와 일치하는 그래프 패턴 구조를 그래프 매칭 기술(32)로 탐색하는 방식을 이용하기 때문에 지식 데이터베이스(30) 내의 그래프 구조가 복잡하고, 방대해지면 비효율적이다.
또한, 다중 지식 질의 형태(예컨대, 비교 우위 질의, 추상적 비교 우위 질의 등)의 자연어의 경우 비교군이 늘어나게 되어 그래프 매칭 기술(32)로 결과를 찾는데 많은 시간이 소요된다.
한편, 본 발명의 자연어 질의 결과 탐색 구조(3b)는 복수의 질의 지식 그래프를 저장하는 제 1 데이터베이스(150)로부터 주제 키워드를 포함하는 복수의 질의 지식 그래프(34)를 탐색하고, 탐색된 복수의 질의 지식 그래프(34)의 결과 내에서 관계 키워드 기반의 맵 데이터에 기초하여 목적 키워드와 관련된 정보를 탐색하기 때문에 종래의 자연어 기반 질의 결과 탐색 구조(3a)에 비해 탐색에 소요되는 시간 및 연산량이 상당히 줄어드는 효과가 있다.
맵 데이터 생성부(120)는 제 1 데이터베이스(150)로부터 탐색된 주제 키워드를 포함하는 복수의 질의 지식 그래프 각각에 매핑된 정보에 기초하여 복수의 관계 키워드 및 복수의 관계 키워드 각각에 해당하는 값을 포함하는 주제 키워드 기반의 맵 데이터를 생성할 수 있다.
여기서, 맵 데이터의 복수의 관계 키워드 각각은 탐색된 복수의 질의 지식 그래프 각각에 포함된 목적 키워드에 대응되고, 복수의 관계 키워드 각각에 해당하는 값은 탐색된 복수의 질의 지식 그래프 각각에 포함된 목적 키워드에 해당하는 값일 수 있다.
예를 들어, 도 4a를 참조하면, 맵 데이터 생성부(120)는 복수의 질의 지식 그래프를 저장하는 제 1 데이터베이스(150)로부터 제 1 자연어의 주제 키워드인 '김연아'를 포함하는 복수의 질의 지식 그래프가 탐색되면, '김연아'를 포함하는 복수의 질의 지식 그래프 각각에 매핑된 정보에 기초하여 제 1 맵 데이터(401)를 생성할 수 있다.
정보 도출부(130)는 탐색된 복수의 질의 지식 그래프 각각에 매핑된 정보에 기초하여 생성된 관계 키워드 기반의 맵 데이터로부터 목적 키워드와 관련된 정보를 도출할 수 있다.
예를 들어, 도 4a를 참조하면, 정보 도출부(130)는 제 1 자연어에 대한 질의 형태가 단일 질의인 경우, 제 1 자연어의 주제 키워드인 '김연아'를 포함하는 복수의 질의 지식 그래프 각각에 매핑된 정보에 기초하여 생성된 제 1 맵 데이터(401)로부터 제 1 자연어의 목적 키워드인 '나이'와 관련된 관계 키워드('출생') 및 해당 관계 키워드('출생')의 값('1990')을 포함하는 데이터(403)를 검출하고, 해당 관계 키워드('출생')의 값('1990')으로부터 목적 키워드인 '나이'에 해당하는 값을 도출할 수 있다.
검색 결과 제공부(140)는 도출된 정보 및 질의 형태에 기초하여 자연어에 대한 질의 결과를 제공할 수 있다. 예를 들어, 도 4a를 참조하면, 정보 도출부(130)는 제 1 자연어의 질의 형태가 단일 질의인 경우, 관계 키워드('출생')의 값('1990')으로부터 도출된 목적 키워드인 '나이'에 해당하는 값(김연아 나이: 30세)을 제 1 자연어에 대한 질의 결과로서 제공할 수 있다.
한편, 질의 지식 그래프 탐색부(110)는 자연어에 제 1 주제 키워드 및 제 2 주제 키워드를 포함하는 복수의 주제 키워드가 포함되어 있는 경우, 제 1 주제 키워드를 포함하는 복수의 제 1 질의 지식 그래프를 탐색하고, 제 2 주제 키워드를 포함하는 복수의 제 2 질의 지식 그래프를 탐색할 수 있다.
예를 들어, 도 4b를 참조하면, 제 2 자연어('김연아와 박지성의 나이는 누가 더 많지?')에 복수의 주제 키워드('김연아'와 '박지성')가 포함되어 있는 경우, 질의 지식 그래프 탐색부(110)는 제 1 데이터베이스(150)로부터 제 2 자연어의 제 1 주제 키워드인 '김연아'을 포함하는 복수의 제 1 질의 지식 그래프를 탐색하고, 제 2 주제 키워드인 '박지성'을 포함하는 복수의 제 2 질의 지식 그래프를 탐색할 수 있다.
한편, 도 4c를 참조하면, 제 3 자연어('손흥민과 박지성 중 누가 더 뛰어나지?')에 복수의 주제 키워드('손흥민'과 '박지성')가 포함되어 있는 경우, 질의 지식 그래프 탐색부(110)는 제 1 데이터베이스(150)로부터 제 3 자연어의 제 1 주제 키워드인 '손흥민'을 포함하는 복수의 제 1 질의 지식 그래프를 탐색하고, 제 2 주제 키워드인 '박지성'을 포함하는 복수의 제 2질의 지식 그래프를 탐색할 수 있다.
맵 데이터 생성부(120)는 탐색된 복수의 제 1 질의 지식 그래프 각각에 매핑된 정보에 기초하여 복수의 관계 키워드 및 복수의 관계 키워드 각각에 해당하는 값을 포함하는 제 1 맵 데이터를 생성하고, 탐색된 복수의 제 2 질의 지식 그래프 각각에 매핑된 정보에 기초하여 복수의 관계 키워드 및 복수의 관계 키워드 각각에 해당하는 값을 포함하는 제 2 맵 데이터를 생성할 수 있다.
예를 들어, 도 4b를 참조하면, 제 1 데이터베이스(150)로부터 제 2 자연어의 복수의 주제 키워드인 '김연아' 및 '박지성' 각각에 대하여 복수의 질의 지식 그래프가 탐색되면, 맵 데이터 생성부(120)는 '김연아'를 포함하는 복수의 질의 지식 그래프 각각에 매핑된 정보에 기초하여 제 1 맵 데이터(405)를 생성하고, '박지성'을 포함하는 복수의 질의 지식 그래프 각각에 매핑된 정보에 기초하여 제 2 맵 데이터(407)를 생성할 수 있다.
예를 들어, 도 4c를 참조하면, 제 1 데이터베이스(150)로부터 제 3 자연어의 복수의 주제 키워드인 '손흥민' 및 '박지성' 각각에 대하여 복수의 질의 지식 그래프가 탐색되면, 맵 데이터 생성부(120)는 '손흥민'을 포함하는 복수의 질의 지식 그래프 각각에 매핑된 정보에 기초하여 제 1 맵 데이터(413)를 생성하고, '박지성'을 포함하는 복수의 질의 지식 그래프 각각에 매핑된 정보에 기초하여 제 2 맵 데이터(415)를 생성할 수 있다.
정보 도출부(130)는 자연어에 대한 질의 형태가 비교 우위 질의인 경우, 생성된 제 1 맵 데이터로부터 목적 키워드와 관련된 정보를 도출하고, 생성된 제 2 맵 데이터로부터 목적 키워드와 관련된 정보를 도출할 수 있다.
구체적으로, 정보 도출부(130)는 자연어에 대한 질의 형태가 비교 우위 질의인 경우, 제 1 맵 데이터로부터 목적 키워드에 해당하는 제 1 값 및 제 2 맵 데이터로부터 목적 키워드에 해당하는 제 2 값을 도출할 수 있다.
예를 들어, 도 4b를 참조하면, 정보 도출부(130)는 제 2 자연어의 제 1 주제 키워드인 '김연아'를 포함하는 복수의 질의 지식 그래프 각각에 매핑된 정보에 기초하여 생성된 제 1 맵 데이터(405)로부터 제 2 자연어의 목적 키워드인 '나이'와 관련된 관계 키워드('출생') 및 해당 관계 키워드('출생')의 값('1990')을 포함하는 데이터(409)를 검출하고, 해당 관계 키워드('출생')의 값('1990')으로부터 목적 키워드인 '나이'에 해당하는 제 1 값을 도출할 수 있다.
또한, 정보 도출부(130)는 제 2 자연어의 제 2 주제 키워드인 '박지성'을 포함하는 복수의 질의 지식 그래프 각각에 매핑된 정보에 기초하여 생성된 제 2 맵 데이터(407)로부터 제 2 자연어의 목적 키워드인 '나이'와 관련된 관계 키워드('출생') 및 해당 관계 키워드('출생')의 값('1981')을 포함하는 데이터(411)를 검출하고, 해당 관계 키워드('출생')의 값('1981')으로부터 목적 키워드인 '나이'에 해당하는 제 2 값을 도출할 수 있다.
검색 결과 제공부(140)는 자연어의 질의 형태가 비교 우위 질의인 경우, 제 1 맵 데이터 및 제 2 맵 데이터 각각으로부터 도출된 자연어의 목적 키워드에 해당하는 제 1 값 및 제 2 값의 우위를 비교하여 자연어에 대한 검색 결과를 제공할 수 있다.
예를 들어, 도 4b를 참조하면, 검색 결과 제공부(140)는 제 2 자연어의 질의 형태가 비교 우위 질의인 경우, 제 1 맵 데이터(405) 및 제 2 맵 데이터(407) 각각으로부터 도출된 제 2 자연어의 목적 키워드('나이')에 해당하는 제 1 값(김연아의 나이: 30세) 및 제 2 값(박지성의 나이: 39세) 간의 수치를 비교하여 제 2 자연어에 대한 검색 결과(예컨대, '박지성의 나이가 김연아의 나이보다 9살 많습니다.')를 제공할 수 있다.
한편, 정보 도출부(130)는 자연어에 대한 질의 형태가 추상적 비교 우위 질의(자연어에 목적 키워드가 명확하게 드러나지 않은 질의)인 경우, 사용자 선호도 기반 랭킹 데이터를 이용하여 자연어에 대한 질의 결과를 추론할 수 있다.
여기서, 사용자 선호도 기반 랭킹 데이터는 제 2 데이터베이스(160)에 저장되어 보관될 수 있다. 사용자 선호도 기반 랭킹 데이터는 자연어 질문에 직접적인 목적 키워드의 언급이 없는 두 지식 간의 비교 우위(즉, 추상적 비교 우위)를 판단하고자 할 때 이용될 수 있다. 사용자 선호도 기반 랭킹 데이터는 주제별로 수집된 복수의 문서에서 출현하는 복수의 키워드에 대하여 랭킹화된 데이터일 수 있다.
예를 들어, 도 5를 참조하면, 사용자 선호도 모델(501)은, 다양한 정형 및 비정형 데이터(503)로부터 주로 언급되는 주요 키워드에 대하여 가중치가 계산되고, 계산된 가중치로부터 주요 키워드 및 주요 키워드에 해당하는 값을 포함하는 속성 데이터를 랭킹화하는데 사용된다.
에를 들어, 주제별로 수집된 다양한 정형 및 비정형 데이터(예컨대, SNS 데이터, 뉴스 데이터, 웹 문서 등)에서 기설정된 횟수 이상으로 출현하는 복수의 주요 키워드에 대한 가중치는 질의어에 포함된 주제 키워드와 관련성이 높은 중요한 속성일 수 있다.
사용자 선호도 기반 랭킹 데이터는 주제별로 수집된 다양한 정형 및 비정형 데이터(503)가 정규화되고, 정규화된 문서의 텍스트 분석을 통해 가중치에 영향을 줄 수 있는 불용어가 정규화된 문서로부터 제거된 후, 사용자 선호도 모델(501)을 통해 계산된 주요 키워드에 대한 가중치에 기초하여 랭킹화되어 제 2 데이터베이스(160)에 저장될 수 있다.
정보 도출부(130)는 자연어에 대한 질의 형태가 추상적 비교 우위 질의인 경우, 사용자 선호도 기반 랭킹 데이터에 기초하여 적어도 하나의 예측 목적 키워드를 도출하고, 제 1 맵 데이터로부터 예측 목적 키워드와 관련된 정보를 도출하고, 제 2 맵 데이터로부터 예측 목적 키워드와 관련된 정보를 도출할 수 있다.
예를 들어, 도 4c를 참조하면, 정보 도출부(130)는 제 2 데이터베이스(160)에 저장된 복수의 사용자 선호도 기반 랭킹 데이터 중 제 3 자연어의 주제 키워드('손흥민', '박지성')와 관계된 사용자 선호도 기반 랭킹 데이터(주제 키워드와 관련하여 랭킹 순위가 높은 데이터)와 매칭되는 맵 데이터(413, 415)에 포함된 적어도 하나의 관계 키워드('클럽', '수상', '월드컵', '골')를 제 3 자연어에 대한 예측 목적 키워드로서 도출할 수 있다.
이 때, 정보 도출부(130)는 도출된 제 3 자연어에 대한 적어도 하나의 예측 목적 키워드('클럽', '수상', '월드컵', '골') 중 수치 우위 비교가 가능한 예측 목적 키워드('수상', '월드컵', '골')를 선정할 수 있다.
이후, 정보 도출부(130)는 선정된 예측 목적 키워드에 해당하는 제 1 값을 제 1 맵 데이터(413)로부터 도출하고, 선정된 예측 목적 키워드에 해당하는 제 2 값을 제 2 맵 데이터(415)로부터 도출할 수 있다.
검색 결과 제공부(140)는 도출된 제 1 값 및 제 2 값의 우위를 비교하여 자연어에 대한 검색 결과를 제공할 수 있다.
예를 들어, 도 4c를 참조하면, 정보 도출부(130)는 수치 우위 비교가 가능한 제 1 예측 목적 키워드('수상')에 해당하는 제 1 값을 제 1 맵 데이터(413)로부터 도출하고, 제 1 예측 목적 키워드('수상')에 해당하는 제 2 값을 제 2 맵 데이터(415) 각각으로부터 도출할 수 있다.
이후, 검색 결과 제공부(140)는 제 1 맵 데이터(413) 및 제 2 맵 데이터(415) 각각으로부터 도출된 제 1 예측 목적 키워드('수상')에 해당하는 제 1 값('손흥민의 수상 횟수: 17회') 및 제 2 값('박지성의 수상 횟수: 25') 간의 수치를 비교하여 제 3 자연어에 대한 검색 결과(예컨대, '박지성의 수상 횟수가 손흥민의 수상 횟수보다 높습니다.')를 제공할 수 있다.
본 발명은 도 4c를 통해 설명한 바와 같이, 제 3 자연어에 목적 키워드가 포함되어 있지 않더라도 다중 지식을 비교하여 지식 데이터베이스 또는 질의 지식 그래프로 구성된 사실 관계로부터 없던 지식을 새롭게 도출 및 추론할 수 있다. 예를 들면, 본 발명은 제 3 주제어에 해당하는 '손흥민과 박지성 중 누가 더 뛰어나지?'을 이용하여, '손흥민과 박지성 중 누가 더 나이가 많지?' 또는 '손흥민과 박지성 중 누가 더 골을 많이 넣었지?'와 같은 형태로 비교 우위 지식을 생성하고, 이러한 지식에 대한 답변을 도출할 수 있다. 따라서, 본 발명은 제 3 자연어에 존재하지 않았던 새로운 지식을 추론하고, 생성된 지식에 대한 답변을 도출할 수 있다.
한편, 도 5 및 도 6을 함께 참조하면, 복수의 질의 지식 그래프 내에서 중요하다고 판단되는 노드 및 관계는 다른 색상으로 표시함으로써 서로 다른 지식들의 중요도를 표현할 수 있다. 중요한 노드 및 관계는 서로 다른 지식 간의 가치 우위를 비교할 때 기본 요소가 된다. 각 질의 지식 그래프의 노드 간의 중요도로 산정된 요소가 같다면 같은 요소 내의 값을 우위 비교할 수 있는 근거로 제시될 수 있다.
사용자 선호도 모델(501)에 의해 랭킹화된 사용자 선호도 기반 랭킹 데이터는 질의 지식 그래프의 관계 속성을 추출하는데 이용될 수 있다. 예를 들어, 도 4c 및 도 7을 함께 참조하면, '손흥민'과 관련된 복수의 문서에서 자주 등장하는 키워드가 '골', '수상', '토트넘(소속팀)' 등과 관련된다고 할 때, 이러한 키워드 중 랭킹이 높은 사용자 선호도 기반 랭킹 데이터(제 2 데이터베이스(160)에 저장된 데이터)가 제 1 데이터베이스(150)로부터 생성된 맵 데이터(413)의 관계 키워드와 일치하면, 해당 사용자 선호도 기반 랭킹 데이터를 질의 지식 그래프에 사상시키고, 해당 질의 지식 그래프의 노드 및 관계에 가중치를 적용시킬 수 있다.
한편, 당업자라면, 질의 지식 그래프 생성부(100), 질의 형태 결정부(102), 질의 지식 그래프 탐색부(110), 맵 데이터 생성부(120), 정보 도출부(130), 검색 결과 제공부(140), 제 1 데이터베이스(150) 및 제 2 데이터베이스(160) 각각이 분리되어 구현되거나, 이 중 하나 이상이 통합되어 구현될 수 있음을 충분히 이해할 것이다.
도 8은 본 발명의 일 실시예에 따른, 자연어 기반 질의 결과를 제공하는 방법을 나타낸 흐름도이다.
도 8을 참조하면, 단계 S801에서 자연어 기반 질의 결과 제공 서버(10)는 자연어로부터 주제 키워드, 목적 키워드 및 자연어에 대한 질의 형태를 추출할 수 있다.
단계 S803에서 자연어 기반 질의 결과 제공 서버(10)는 추출된 주제 키워드, 목적 키워드 및 질의 형태를 포함하는 질의 지식 그래프를 생성할 수 있다.
단계 S805에서 자연어 기반 질의 결과 제공 서버(10)는 주제 키워드를 포함하는 복수의 질의지식 그래프를 탐색할 수 있다.
단계 S807에서 자연어 기반 질의 결과 제공 서버(10)는 탐색된 복수의 질의 지식 그래프 각각에 매핑된 정보에 기초하여 생성된 관계 키워드 기반의 맵 데이터로부터 목적 키워드와 관련된 정보를 도출할 수 있다.
단계 S809에서 자연어 기반 질의 결과 제공 서버(10)는 도출된 정보 및 질의 형태에 기초하여 자연어에 대한 질의 결과를 제공할 수 있다.
도 8에는 도시되지 않았으나, 단계 S801에서 자연어 기반 질의 결과 제공 서버(10)는 자연어에 포함된 주제 키워드의 개수 및 목적 키워드의 존재 여부에 기초하여 자연어에 대한 질의 형태를 결정할 수 있다. 예를 들면, 자연어 기반 질의 결과 제공 서버(10)는 자연어에 단일의 주제 키워드 및 목적 키워드가 포함되는 경우, 자연어에 대한 질의 형태를 단일 질의로 결정할 수 있다. 자연어 기반 질의 결과 제공 서버(10)는 자연어에 목적 키워드가 포함되고, 복수의 주제 키워드가 포함되는 경우, 자연어에 대한 질의 형태를 비교 우위 질의로 결정할 수 있다. 자연어 기반 질의 결과 제공 서버(10)는 자연어에 복수의 주제 키워드가 포함되고, 목적 키워드가 포함되어 있지 않은 경우, 질의어에 대한 질의 형태를 추상적 비교 우위 질의로 결정할 수 있다.
도 8에는 도시되지 않았으나, 단계 S805에서 자연어 기반 질의 결과 제공 서버(10)는 자연어에 제 1 주제 키워드 및 제 2 주제 키워드를 포함하는 복수의 주제 키워드가 포함된 경우, 제 1 주제 키워드를 포함하는 제 1 복수의 질의 지식 그래프를 탐색하고, 제 2 주제 키워드를 포함하는 제 2 복수의 질의 지식 그래프를 탐색할 수 있다. 자연어 기반 질의 결과 제공 서버(10)는 탐색된 제 1 복수의 질의 지식 그래프 각각에 매핑된 정보에 기초하여 생성된 제 1 맵 데이터 및 탐색된 제 2 복수의 질의 지식 그래프 각각에 매핑된 정보에 기초하여 생성된 제 2 맵 데이터로부터 제 1 주제 키워드 및 제 2 주제 키워드와 관련된 정보를 도출할 수 있다.
도 8에는 도시되지 않았으나, 단계 S807에서 자연어 기반 질의 결과 제공 서버(10)는 질의 형태가 비교 우위 질의인 경우, 제 1 맵 데이터로부터 목적 키워드에 해당하는 제 1 값 및 제 2 맵 데이터로부터 목적 키워드에 해당하는 제 2 값을 도출할 수 있다.
도 8에는 도시되지 않았으나, 단계 S807에서 자연어 기반 질의 결과 제공 서버(10)는 질의 형태가 추상적 비교 우위 질의인 경우, 사용자 선호도 기반 랭킹 데이터에 기초하여 적어도 하나의 예측 목적 키워드를 도출하고, 제 1 맵 데이터로부터 예측 목적 키워드에 해당하는 제 1 값 및 제 2 맵 데이터로부터 예측 목적 키워드에 해당하는 제 2 값을 도출할 수 있다.
도 8에는 도시되지 않았으나, 단계 S809에서 자연어 기반 질의 결과 제공 서버(10)는 도출된 제 1 값 및 제 2 값의 우위를 비교하여 자연어에 대한 검색 결과를 제공할 수 있다.
상술한 설명에서, 단계 S801 내지 S809는 본 발명의 구현예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 변경될 수도 있다.
본 발명의 일 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행 가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims (18)

  1. 자연어 기반 질의에 대한 응답을 제공하는 서버에 있어서,
    자연어로부터 주제 키워드, 목적 키워드 및 상기 자연어에 대한 질의 형태를 추출하고, 상기 주제 키워드, 목적 키워드 및 질의 형태를 포함하는 질의 지식 그래프를 생성하는 질의 지식 그래프 생성부;
    상기 주제 키워드를 포함하는 복수의 질의 지식 그래프를 탐색하는 질의 지식 그래프 탐색부;
    상기 탐색된 복수의 질의 지식 그래프 각각의 상기 주제 키워드에 기반한 맵 데이터로부터 상기 목적 키워드와 관련된 정보를 도출하는 정보 도출부; 및
    상기 도출된 정보 및 상기 질의 형태에 기초하여 상기 자연어에 대한 질의 결과를 제공하는 검색 결과 제공부를 포함하는 것인, 서버.
  2. 제 1 항에 있어서,
    상기 탐색된 복수의 질의 지식 그래프 각각에 매핑된 정보에 기초하여 복수의 관계 키워드 및 상기 복수의 관계 키워드 각각에 해당하는 값을 포함하는 상기 맵 데이터를 생성하는 맵 데이터 생성부를 더 포함하는 것인, 서버.
  3. 제 1 항에 있어서,
    상기 질의 지식 그래프 생성부는 상기 자연어에 포함된 상기 주제 키워드의 개수 및 상기 목적 키워드의 존재 여부에 기초하여 상기 질의 형태를 결정하는 질의 형태 결정부를 포함하는 것인, 서버.
  4. 제 3 항에 있어서,
    상기 질의 형태 결정부는 상기 자연어에 단일의 상기 주제 키워드 및 상기 목적 키워드가 포함되는 경우, 상기 질의 형태를 단일 질의로 결정하는 것인, 서버.
  5. 제 3 항에 있어서,
    상기 질의 형태 결정부는 상기 자연어에 복수의 상기 주제 키워드가 포함되는 경우, 상기 질의 형태를 비교 우위 질의로 결정하는 것인, 서버.
  6. 제 5 항에 있어서,
    상기 복수의 주제 키워드는 제 1 주제 키워드 및 제 2 주제 키워드를 포함하고,
    상기 질의 지식 그래프 탐색부는 상기 제 1 주제 키워드를 포함하는 제 1 복수의 질의 지식 그래프를 탐색하고, 상기 제 2 주제 키워드를 포함하는 제 2 복수의 질의 지식 그래프를 탐색하고,
    상기 정보 도출부는 상기 탐색된 제 1 복수의 질의 지식 그래프 각각에 매핑된 정보에 기초하여 생성된 제 1 맵 데이터 및 상기 탐색된 제 2 복수의 질의 지식 그래프 각각에 매핑된 정보에 기초하여 생성된 제 2 맵 데이터 각각으로부터 상기 목적 키워드와 관련된 정보를 도출하는 것인, 서버.
  7. 제 6 항에 있어서,
    상기 질의 형태가 비교 우위 질의인 경우, 상기 정보 도출부는 상기 제 1 맵 데이터로부터 상기 목적 키워드에 해당하는 제 1 값 및 상기 제 2 맵 데이터로부터 상기 목적 키워드에 해당하는 제 2 값을 도출하는 것인, 서버.
  8. 제 7 항에 있어서,
    상기 검색 결과 제공부는 상기 제 1 값 및 상기 제 2 값의 우위를 비교하여 상기 자연어에 대한 질의 결과를 제공하는 것인, 서버.
  9. 제 6 항에 있어서,
    상기 질의 형태 결정부는 상기 자연어에 상기 목적 키워드가 포함되어 있지 않는 경우, 상기 자연어에 대한 질의 형태를 추상적 비교 우위 질의로 결정하는 것인, 서버.
  10. 제 9 항에 있어서,
    상기 질의 형태가 추상적 비교 우위 질의인 경우, 상기 정보 도출부는 사용자 선호도 기반 랭킹 데이터에 기초하여 적어도 하나의 예측 목적 키워드를 도출하고, 상기 제 1 맵 데이터로부터 상기 예측 목적 키워드에 해당하는 제 1 값 및 상기 제 2 맵 데이터로부터 상기 예측 목적 키워드에 해당하는 제 2 값을 도출하는 것인, 서버.
  11. 제 10 항에 있어서,
    복수의 질의 지식 그래프를 저장하는 제 1 데이터베이스 및
    상기 사용자 선호도 기반 랭킹 데이터를 저장하는 제 2 데이터베이스를 포함하고,
    상기 사용자 선호도 기반 랭킹 데이터는 주제별로 수집된 복수의 문서에서 출현하는 복수의 키워드에 대하여 랭킹화된 데이터인 것인, 서버.
  12. 서버에 의해 자연어 기반 질의에 대한 응답을 제공하는 방법에 있어서,
    자연어로부터 주제 키워드, 목적 키워드 및 상기 자연어에 대한 질의 형태를 추출하는 단계;
    상기 주제 키워드, 목적 키워드 및 질의 형태를 포함하는 질의 지식 그래프를 생성하는 단계;
    상기 주제 키워드를 포함하는 복수의 질의 지식 그래프를 탐색하는 단계;
    상기 탐색된 복수의 질의 지식 그래프 각각의 상기 주제 키워드에 기반한 맵 데이터로부터 상기 목적 키워드와 관련된 정보를 도출하는 단계 및
    상기 도출된 정보 및 상기 질의 형태에 기초하여 상기 자연어에 대한 질의 결과를 제공하는 단계를 포함하는 것인, 자연어 기반 질의에 대한 응답 제공 방법.
  13. 제 12 항에 있어서,
    상기 탐색된 복수의 질의 지식 그래프 각각에 매핑된 정보에 기초하여 복수의 관계 키워드 및 상기 복수의 관계 키워드 각각에 해당하는 값을 포함하는 상기 맵 데이터를 생성하는 단계를 포함하는 것인, 자연어 기반 질의에 대한 응답 제공 방법.
  14. 제 12 항에 있어서,
    상기 자연어에 포함된 상기 주제 키워드의 개수 및 상기 목적 키워드의 존재 여부에 기초하여 상기 질의 형태를 결정하는 단계를 포함하는 것인, 자연어 기반 질의에 대한 응답 제공 방법.
  15. 제 14 항에 있어서,
    상기 질의 형태를 결정하는 단계는 상기 자연어에 단일의 상기 주제 키워드 및 상기 목적 키워드가 포함되는 경우, 상기 질의 형태를 단일 질의로 결정하는 단계를 포함하는 것인, 자연어 기반 질의에 대한 응답 제공 방법.
  16. 제 14 항에 있어서,
    상기 질의 형태를 결정하는 단계는 상기 자연어에 복수의 상기 주제 키워드가 포함되는 경우, 상기 질의 형태를 비교 우위 질의로 결정하는 단계를 포함하는 것인, 자연어 기반 질의에 대한 응답 제공 방법.
  17. 제 16 항에 있어서,
    상기 질의 형태를 결정하는 단계는 상기 자연어에 상기 목적 키워드가 포함되어 있지 않는 경우, 상기 자연어에 대한 질의 형태를 추상적 비교 우위 질의로 결정하는 단계를 포함하는 것인, 자연어 기반 질의에 대한 응답 제공 방법.
  18. 자연어 기반 질의에 대한 응답을 제공하는 명령어들의 시퀀스를 포함하는 기록 매체에 저장된 컴퓨터 프로그램에 있어서,
    상기 컴퓨터 프로그램은 컴퓨팅 장치에 의해 실행될 경우,
    자연어로부터 주제 키워드, 목적 키워드 및 상기 자연어에 대한 질의 형태를 추출하고,
    상기 주제 키워드, 목적 키워드 및 질의 형태를 포함하는 질의 지식 그래프를 생성하고,
    상기 주제 키워드를 포함하는 복수의 질의 지식 그래프를 탐색하고,
    상기 탐색된 복수의 질의 지식 그래프 각각의 상기 주제 키워드에 기반한 맵 데이터로부터 상기 목적 키워드와 관련된 정보를 도출하고,
    상기 도출된 정보 및 상기 질의 형태에 기초하여 상기 자연어에 대한 질의 결과를 제공하는 명령어들의 시퀀스를 포함하는, 기록 매체에 저장된 컴퓨터 프로그램.
PCT/KR2020/006120 2019-05-28 2020-05-08 다중 지식의 비교 우위를 추론하는 서버, 방법 및 컴퓨터 프로그램 WO2020242086A1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US17/456,604 US20220083879A1 (en) 2019-05-28 2021-11-26 Inferring a comparative advantage of multi-knowledge representations

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020190062612A KR102411778B1 (ko) 2019-05-28 2019-05-28 다중 지식의 비교 우위를 추론하는 서버, 방법 및 컴퓨터 프로그램
KR10-2019-0062612 2019-05-28

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US17/456,604 Continuation US20220083879A1 (en) 2019-05-28 2021-11-26 Inferring a comparative advantage of multi-knowledge representations

Publications (1)

Publication Number Publication Date
WO2020242086A1 true WO2020242086A1 (ko) 2020-12-03

Family

ID=73552006

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2020/006120 WO2020242086A1 (ko) 2019-05-28 2020-05-08 다중 지식의 비교 우위를 추론하는 서버, 방법 및 컴퓨터 프로그램

Country Status (3)

Country Link
US (1) US20220083879A1 (ko)
KR (1) KR102411778B1 (ko)
WO (1) WO2020242086A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230024135A1 (en) * 2021-07-20 2023-01-26 Sap Se Intelligent keyword recommender

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060053098A1 (en) * 2004-09-03 2006-03-09 Bio Wisdom Limited System and method for creating customized ontologies
US20090063472A1 (en) * 2007-08-31 2009-03-05 Powerset, Inc., A Delaware Corporation Emphasizing search results according to conceptual meaning
KR20100100231A (ko) * 2009-03-05 2010-09-15 엔에이치엔(주) 온톨로지를 이용한 컨텐츠 검색 시스템 및 방법
KR20160007057A (ko) * 2014-07-10 2016-01-20 네이버 주식회사 의미 태깅된 자연어 질의의 의도에 부합하는 정보 추출 및 제공 방법 및 시스템
KR20160075739A (ko) * 2013-10-25 2016-06-29 시소모스 엘.피. 소셜 데이터 네트워크에 있어서의 인플루언서들을 결정하기 위한 시스템 및 방법

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4698618B2 (ja) 2007-01-24 2011-06-08 日本電信電話株式会社 関係抽出方法、関係抽出システム
WO2018081633A1 (en) * 2016-10-28 2018-05-03 Roam Analytics, Inc. Semantic parsing engine
US10867132B2 (en) * 2019-03-29 2020-12-15 Microsoft Technology Licensing, Llc Ontology entity type detection from tokenized utterance

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060053098A1 (en) * 2004-09-03 2006-03-09 Bio Wisdom Limited System and method for creating customized ontologies
US20090063472A1 (en) * 2007-08-31 2009-03-05 Powerset, Inc., A Delaware Corporation Emphasizing search results according to conceptual meaning
KR20100100231A (ko) * 2009-03-05 2010-09-15 엔에이치엔(주) 온톨로지를 이용한 컨텐츠 검색 시스템 및 방법
KR20160075739A (ko) * 2013-10-25 2016-06-29 시소모스 엘.피. 소셜 데이터 네트워크에 있어서의 인플루언서들을 결정하기 위한 시스템 및 방법
KR20160007057A (ko) * 2014-07-10 2016-01-20 네이버 주식회사 의미 태깅된 자연어 질의의 의도에 부합하는 정보 추출 및 제공 방법 및 시스템

Also Published As

Publication number Publication date
KR20200136707A (ko) 2020-12-08
KR102411778B1 (ko) 2022-06-22
US20220083879A1 (en) 2022-03-17

Similar Documents

Publication Publication Date Title
WO2012070840A2 (ko) 컨센서스 검색 장치 및 방법
WO2021049706A1 (ko) 앙상블 질의 응답을 위한 시스템 및 방법
WO2020111314A1 (ko) 개념 그래프 기반 질의응답 장치 및 방법
WO2011129481A1 (ko) Rdf 탐색기반 질의응답 서비스 시스템 및 방법
WO2011136425A1 (ko) 개체명 사전 및 마이닝 규칙이 결합된 온톨로지 스키마를 이용한 리소스 기술 프레임워크 네트워크 구축 장치 및 방법
WO2011162444A1 (ko) 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 개체명 사전 또는 마이닝 규칙 데이터베이스 갱신 장치 및 방법
WO2019093675A1 (ko) 빅데이터 분석을 위한 데이터 병합 장치 및 방법
WO2021107449A1 (ko) 음역 전환 신조어를 이용한 지식 그래프 기반 마케팅 정보 분석 서비스 제공 방법 및 그 장치
WO2021215620A1 (ko) 시맨틱 온톨로지를 이용한 도메인특화 이미지캡션 자동 생성 장치 및 방법
WO2012046906A1 (ko) 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치 및 방법
KR20200037077A (ko) Vqa 트레이닝 데이터를 생성하는 방법, 장치, 기기 및 컴퓨터 판독 가능 매체
WO2020242086A1 (ko) 다중 지식의 비교 우위를 추론하는 서버, 방법 및 컴퓨터 프로그램
WO2012060490A1 (ko) 추론 검증 및 점증적 추론을 위한 트리플 저장 방법 및 장치 그리고 이에 적합한 추론 의존성 색인 방법 및 장치
WO2017099454A1 (ko) 마인드맵 기반 키워드 검색 방법 및 이를 위한 장치
WO2018147543A1 (ko) 개념 그래프 기반 질의응답 시스템 및 이를 이용한 문맥 검색 방법
WO2012046904A1 (ko) 다중 자원 기반 검색정보 제공 장치 및 방법
WO2021107445A1 (ko) 지식 그래프 및 국가별 음역 전환 기반 신조어 정보 서비스 제공 방법 및 그 장치
WO2021107444A1 (ko) 지식 그래프 기반 마케팅 정보 분석 서비스 제공 방법 및 그 장치
WO2022030670A1 (ko) 쿼리를 이용한 프레임워크 딥러닝 학습 시스템 및 방법
WO2013008978A1 (ko) 개체 식별 결과 검색 시스템 및 방법
WO2014148664A1 (ko) 단어의 의미를 기반으로 하는 다국어 검색 시스템, 다국어 검색 방법 및 이를 이용한 이미지 검색 시스템
WO2022250354A1 (en) Information retrieval system and method of information retrieval
WO2021132760A1 (ko) 신경망 기반 자연어로부터 sql 질의 번역 시 사용되는 컬럼 및 테이블을 예측하는 방법
WO2021107446A1 (ko) 지식 그래프 기반 마케팅 정보 분석 챗봇 서비스 제공 방법 및 그 장치
WO2022108206A1 (ko) 설명 가능한 지식그래프 완성 방법 및 장치

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20814901

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20814901

Country of ref document: EP

Kind code of ref document: A1