KR20190094738A - Electronic apparatus and method for extracting at least one keyword from search terms and computer readable recording medium - Google Patents

Electronic apparatus and method for extracting at least one keyword from search terms and computer readable recording medium Download PDF

Info

Publication number
KR20190094738A
KR20190094738A KR1020180014231A KR20180014231A KR20190094738A KR 20190094738 A KR20190094738 A KR 20190094738A KR 1020180014231 A KR1020180014231 A KR 1020180014231A KR 20180014231 A KR20180014231 A KR 20180014231A KR 20190094738 A KR20190094738 A KR 20190094738A
Authority
KR
South Korea
Prior art keywords
tag
syllable
tagging
search word
real
Prior art date
Application number
KR1020180014231A
Other languages
Korean (ko)
Other versions
KR102069676B1 (en
Inventor
박희근
Original Assignee
현대카드 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 현대카드 주식회사 filed Critical 현대카드 주식회사
Priority to KR1020180014231A priority Critical patent/KR102069676B1/en
Publication of KR20190094738A publication Critical patent/KR20190094738A/en
Application granted granted Critical
Publication of KR102069676B1 publication Critical patent/KR102069676B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F17/2755
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Abstract

Disclosed is an electronic apparatus for extracting at least one keyword from a search word. The electronic apparatus comprises: a memory storing a machine learning-based model outputting tagging information generated by tagging one tag among a plurality of tags set for identifying a full morpheme included in a search word with each syllable of the search word based on previously learned full morpheme determining algorithm; a communication circuit performing communication with an external electronic apparatus; and a processor electrically connected to the memory and communication circuit. The processor may receive a first search word from the external electronic apparatus through the communication circuit, obtain first tagging information generated by tagging one tag of the tags with each syllable of the first search word by applying the first search word to the machine learning-based model, and extract at least one first keyword from the first search word based on the first tagging information.

Description

검색어에서 적어도 하나의 키워드를 추출하는 방법, 전자 장치 및 컴퓨터 판독 가능한 기록 매체{ELECTRONIC APPARATUS AND METHOD FOR EXTRACTING AT LEAST ONE KEYWORD FROM SEARCH TERMS AND COMPUTER READABLE RECORDING MEDIUM}ELECTRONIC APPARATUS AND METHOD FOR EXTRACTING AT LEAST ONE KEYWORD FROM SEARCH TERMS AND COMPUTER READABLE RECORDING MEDIUM}

본 개시는, 검색어에서 적어도 하나의 키워드를 추출하는 방법, 전자 장치 및 컴퓨터 판독 가능한 기록 매체에 관한 것이다.The present disclosure relates to a method for extracting at least one keyword from a search word, an electronic device, and a computer readable recording medium.

검색을 위해 이용되는 키워드는 크게 색인 키워드와 질의 키워드로 구분되며, 입력된 검색어로부터 해당 키워드들을 추출하기 위해서는 형태소 분석과 품사 태깅(part of speech tagging)을 통하여 가장 작은 의미 단위인 형태소로 분리하는 과정이 수행된다. 이렇게 생성된 형태소 나열을 정의된 규칙에 따라 다양한 형태소 묶음을 만들어 검색 키워드로 사용한다.Keywords used for searching are largely divided into index keywords and query keywords. In order to extract the keywords from the input search terms, the process of separating them into morphemes, the smallest semantic units, through morphological analysis and part of speech tagging. This is done. The generated morpheme list is used as a search keyword by creating various morpheme bundles according to defined rules.

한국어 형태소 분석은 복잡한 문법 규칙과 수많은 사전 정보를 사용하여 한 어절을 구성할 수 있는 모든 형태소 원형을 복원하는 과정을 수반하며, 품사 태깅은 한 문장 내의 복수의 어절에 대한 형태소 분석 결과 중에서 문맥에 맞는 형태소 분석 결과를 선택하는 과정을 수반한다.Korean morpheme analysis involves the process of restoring all morpheme prototypes that can compose a word using complex grammar rules and a lot of dictionary information, and the part-of-speech tagging is contextual among the results of morpheme analysis of multiple words in a sentence. It involves the selection of stemming results.

한국어 형태소는 크게 실질 형태소와 문법 형태소로 구분된다. 실질 형태소는 실질적 뜻을 지닌 형태소로 명사, 동사, 형용사, 부사 등이 해당되며, 문법 형태소는 문법적 기능을 나타내는 형태소로 조사, 어미 등이 해당된다.Korean morphemes are largely divided into real and grammatical morphemes. Real morphemes are morphemes with practical meanings, such as nouns, verbs, adjectives, and adverbs, and grammatical morphemes are morphemes that represent grammatical functions.

한국어 검색 키워드는 주로 실질 형태소를 중심으로 추출되며, 서비스 목적에 따라 문법 형태소를 실질 형태소에 결합한 형태로 사용하기도 한다.Korean search keywords are mainly extracted from real morphemes, and grammar morphemes are combined with real morphemes depending on the service purpose.

사용자로부터 입력된 검색어로부터, 검색을 위해 이용되는 키워드를 추출하기 위해서는 복잡한 형태소 분석 과정과 품사 태깅 과정이 수행됨에 따라, 검색어로부터 키워드를 추출하기 위해 많은 시간이 소요되고, 추출된 키워드를 통해 사용자가 원하는 검색 결과가 정확히 도출되지 않는 문제가 있다.In order to extract keywords used for search from a search word input from a user, a complicated morphological analysis and a part-of-speech tagging process are performed. Therefore, it takes a long time to extract a keyword from a search word. There is a problem that a desired search result is not accurately derived.

본 개시의 다양한 실시예는 상술한 문제점 또는 다른 문제점을 해결하기 위한 검색어에서 키워드를 추출하는 방법, 전자 장치 및 컴퓨터 판독 가능한 기록 매체를 제공할 수 있다.Various embodiments of the present disclosure may provide a method, an electronic device, and a computer-readable recording medium for extracting a keyword from a search word for solving the above-described problem or other problem.

본 개시의 일 실시예에 따르면, 검색어에서 적어도 하나의 키워드를 추출하는 전자 장치는, 미리 학습된 실질 형태소 결정 알고리즘에 기초하여, 검색어에 포함된 실질 형태소를 식별하기 위하여 설정된 복수의 태그 중 하나의 태그를 상기 검색어의 각 음절에 태깅함으로써 생성되는 태깅 정보를 출력하는 머신-러닝 기반 모델을 저장하는 메모리, 외부 전자 장치와 통신을 수행하는 통신 회로 및 상기 메모리 및 상기 통신 회로와 전기적으로 연결된 프로세서를 포함하고, 상기 프로세서는, 상기 통신 회로를 통해 상기 외부 전자 장치로부터 제1 검색어를 수신하고, 상기 머신-러닝 기반 모델에 상기 제1 검색어를 적용하여, 상기 복수의 태그 중 하나의 태그를 상기 제1 검색어의 각 음절에 태깅함으로써 생성되는 제1 태깅 정보를 획득하고, 상기 제1 태깅 정보에 기초하여, 상기 제1 검색어로부터 적어도 하나의 제1 키워드로 추출할 수 있다.According to an embodiment of the present disclosure, an electronic device that extracts at least one keyword from a search word may include one of a plurality of tags set to identify the actual morpheme included in the search word based on a pre-learned real morpheme determination algorithm. A memory storing a machine-learning based model that outputs tagging information generated by tagging a tag to each syllable of the search word, a communication circuit performing communication with an external electronic device, and a processor electrically connected to the memory and the communication circuit. The processor may include receiving a first search term from the external electronic device through the communication circuit, applying the first search term to the machine-learning based model, and applying the tag to one of the plurality of tags. Obtaining first tagging information generated by tagging each syllable of a search word, and obtaining the first tagging information. Based on the information, it can be extracted with at least one of the first keyword from the first search term.

일 실시예에서, 상기 복수의 태그는, 상기 검색어에 포함된 실질 형태소의 시작 음절을 나타내는 제1 태그, 상기 실질 형태소의 상기 시작 음절을 제외한 나머지 음절을 나타내는 제2 태그 및 상기 실질 형태소에 포함되지 않는 음절을 나타내는 제3 태그를 포함할 수 있다.In one embodiment, the plurality of tags are not included in the first tag indicating the first syllable of the real morpheme included in the search word, the second tag indicating the remaining syllable except the first syllable of the real morpheme, and the real morpheme. It may include a third tag indicating the syllable does not.

일 실시예에서, 상기 프로세서는, 상기 제1 태깅 정보에 기초하여, 상기 제1 검색어에서 상기 제1 태그로 태깅된 음절로 시작되는 적어도 하나의 어절을 결정하고, 상기 결정된 적어도 하나의 어절에서 상기 제3 태그로 태깅된 적어도 하나의 음절을 제외하고, 상기 제3 태그로 태깅된 적어도 하나의 음절이 제외된 상기 적어도 하나의 어절을 상기 적어도 하나의 제1 키워드로 추출할 수 있다.In one embodiment, the processor determines, based on the first tagging information, at least one word starting with a syllable tagged with the first tag in the first search word, and in the determined at least one word. Except for at least one syllable tagged with the third tag, the at least one word without the at least one syllable tagged with the third tag may be extracted as the at least one first keyword.

일 실시예에서, 상기 프로세서는, 상기 적어도 하나의 제1 키워드를 통해 수행된 검색 결과에 대한 정보를 상기 외부 전자 장치로 송신하도록 상기 통신 회로를 제어할 수 있다.In an embodiment of the present disclosure, the processor may control the communication circuit to transmit information about a search result performed through the at least one first keyword to the external electronic device.

일 실시예에서, 상기 머신 러닝 기반 모델은, 상기 미리 학습된 실질 형태소 결정 알고리즘 및 실질 형태소 품사 결정 알고리즘에 기초하여, 상기 제1 태그가 태깅된 음절 및 상기 제2 태그가 태깅된 음절 중 적어도 하나에 상기 실질 형태소에 대한 품사 정보를 더 태깅하여 상기 태깅 정보를 생성할 수 있다.In an embodiment, the machine learning based model includes at least one of a syllable tagged a first tag and a syllable tagged second tag based on a pre-learned real morpheme determination algorithm and a real morpheme part-of-speech determination algorithm. The tagging information may be generated by further tagging part-of-speech information on the real morphemes.

일 실시예에서, 상기 머신-러닝 기반 모델은, 복수의 어휘 각각에 대한 실질 형태소 분석 결과를 포함하는 제1 정보를 이용하여, 상기 실질 형태소 결정 알고리즘을 학습하고, 상기 실질 형태소 결정 알고리즘에 기초하여, 상기 복수의 어휘에 포함된 각 음절에 상기 복수의 태그 중 하나의 태그를 태깅함으로써 생성되는 제2 정보를 이용하여, 상기 복수의 태그 중 하나의 태그를 상기 검색어의 각 음절에 태깅함으로써 생성되는 상기 태깅 정보를 출력하도록 학습될 수 있다.In one embodiment, the machine-learning based model learns the real morpheme determination algorithm using first information including a result of real morphological analysis of each of a plurality of vocabularies, and based on the real morpheme determination algorithm. And tagging one tag of the plurality of tags to each syllable of the search word by using second information generated by tagging one tag of the plurality of tags to each syllable included in the plurality of words. It can be learned to output the tagging information.

본 개시의 일 실시예에 따르면, 컴퓨터 상에서 수행하기 위한 프로그램을 기록한 비일시적 컴퓨터 판독 가능한 기록 매체에 있어서, 상기 프로그램은, 프로세서에 의한 실행 시, 상기 프로세서가, 외부 전자 장치로부터 제1 검색어를 수신하는 단계, 미리 학습된 실질 형태소 결정 알고리즘에 기초하여, 검색어에 포함된 실질 형태소를 식별하기 위하여 설정된 복수의 태그 중 하나의 태그를 상기 검색어의 각 음절에 태깅함으로써 생성되는 태깅 정보를 출력하는 머신-러닝 기반 모델에 상기 제1 검색어를 적용하는 단계, 상기 머신-러닝 기반 모델로부터, 상기 복수의 태그 중 하나의 태그를 상기 제1 검색어의 각 음절에 태깅함으로써 생성되는 제1 태깅 정보를 획득하는 단계 및 상기 제1 태깅 정보에 기초하여, 상기 제1 검색어로부터 적어도 하나의 제1 키워드를 추출하는 단계를 수행하도록 하는 실행 가능한 명령을 포함할 수 있다.According to an embodiment of the present disclosure, in a non-transitory computer readable recording medium having recorded thereon a program for executing on a computer, the program may be executed by a processor when the processor receives a first search word from an external electronic device. And tagging information generated by tagging one tag of each of the plurality of tags set to identify the actual morpheme included in the search word based on the previously learned real morpheme determination algorithm. Applying the first search term to a learning based model, and obtaining, from the machine-learning based model, first tagging information generated by tagging one tag among the plurality of tags to each syllable of the first search term And at least one first from the first search word based on the first tagging information. It may include executable instructions to perform the step of extracting a word.

일 실시예에서, 상기 복수의 태그는, 상기 검색어에 포함된 상기 실질 형태소의 시작 음절을 나타내는 제1 태그, 상기 실질 형태소의 상기 시작 음절을 제외한 나머지 음절을 나타내는 제2 태그 및 상기 실질 형태소에 포함되지 않는 음절을 나타내는 제3 태그를 포함할 수 있다.In an embodiment, the plurality of tags may include a first tag indicating a syllable of the real morpheme included in the search word, a second tag indicating a syllable other than the starting syllable of the real morpheme, and the real morpheme. It may include a third tag indicating a syllable that is not.

일 실시예에서, 상기 제1 검색어에서 적어도 하나의 제1 키워드를 추출하는 단계는, 상기 제1 태깅 정보에 기초하여, 상기 제1 검색어에서 상기 제1 태그로 태깅된 음절로 시작되는 적어도 하나의 어절을 결정하는 단계, 상기 결정된 적어도 하나의 어절에서 상기 제3 태그로 태깅된 적어도 하나의 음절을 제외하는 단계 및 상기 제3 태그로 태깅된 적어도 하나의 음절이 제외된 상기 적어도 하나의 어절을 상기 적어도 하나의 제1 키워드로 추출하는 단계를 포함할 수 있다.The extracting of the at least one first keyword from the first search word may include at least one beginning with a syllable tagged with the first tag in the first search word based on the first tagging information. Determining a word, excluding at least one syllable tagged with the third tag from the determined at least one word, and identifying the at least one word without the at least one syllable tagged with the third tag. The method may include extracting at least one first keyword.

일 실시예에서, 상기 실행 가능한 명령은, 상기 적어도 하나의 제1 키워드를 통해 수행된 검색 결과에 대한 정보를 상기 외부 전자 장치로 송신하는 단계를 더 수행하도록 할 수 있다.In an embodiment of the present disclosure, the executable command may further include transmitting information on a search result performed through the at least one first keyword to the external electronic device.

일 실시예에서, 상기 머신 러닝 기반 모델은, 상기 미리 학습된 실질 형태소 결정 알고리즘 및 상기 실질 형태소 품사 결정 알고리즘에 기초하여, 상기 제1 태그 또는 상기 제2 태그가 태깅된 음절에 상기 실질 형태소에 대한 품사 정보를 더 태깅하여 상기 태깅 정보를 생성할 수 있다.In an example embodiment, the machine learning based model may be configured to generate the syllable of the first tag or the second tag based on the pre-learned real morpheme determination algorithm and the real morpheme part-of-speech determination algorithm for the real morpheme. The tagging information may be generated by further tagging the part-of-speech information.

일 실시예에서, 상기 머신-러닝 기반 모델은, 복수의 어휘 각각에 대한 실질 형태소 분석 결과를 포함하는 제1 정보를 이용하여, 상기 실질 형태소 결정 알고리즘을 학습하고, 상기 학습된 실질 형태소 결정 알고리즘에 기초하여, 상기 복수의 어휘에 포함된 각 음절에 상기 복수의 태그 중 하나의 태그를 태깅함으로써 생성되는 제2 정보를 이용하여, 상기 복수의 태그 중 하나의 태그를 상기 검색어의 각 음절에 태깅함으로써 생성되는 상기 태깅 정보를 출력하도록 학습될 수 있다.In one embodiment, the machine-learning based model learns the real morpheme determination algorithm by using first information including a result of real morpheme analysis of each of a plurality of vocabularies, and applies the learned morpheme determination algorithm to the learned real morpheme determination algorithm. By tagging one syllable of the plurality of tags to each syllable of the search word by using second information generated by tagging one tag of the plurality of tags to each syllable included in the plurality of words. It can be learned to output the tagging information generated.

본 개시의 일 실시예에 따르면, 검색어에서 키워드를 추출하는 방법은, 외부 전자 장치로부터 제1 검색어를 수신하는 단계, 미리 학습된 실질 형태소 결정 알고리즘에 기초하여, 검색어에 포함된 실질 형태소를 식별하기 위하여 설정된 복수의 태그 중 하나의 태그를 검색어의 각 음절에 태깅함으로써 생성되는 태깅 정보를 출력하는 머신-러닝 기반 모델에 상기 제1 검색어를 적용하는 단계, 상기 머신-러닝 기반 모델로부터, 상기 복수의 태그 중 하나의 태그를 상기 제1 검색어의 각 음절에 태깅함으로써 생성되는 제1 태깅 정보를 획득하는 단계 및 상기 제1 태깅 정보에 기초하여, 상기 제1 검색어로부터 적어도 하나의 제1 키워드로 추출하는 단계를 포함할 수 있다.According to an embodiment of the present disclosure, a method of extracting a keyword from a search word may include receiving a first search word from an external electronic device, and identifying a real morpheme included in the search word based on a pre-learned real morpheme determination algorithm. Applying the first search word to a machine-learning based model that outputs tagging information generated by tagging one tag among a plurality of tags set to each syllable of the search word, from the machine-learning based model, Acquiring first tagging information generated by tagging one tag of each tag to each syllable of the first search word and extracting the first tagging information from the first search word as at least one first keyword based on the first tagging information; It may include a step.

본 개시의 다양한 실시예에 따른 검색어에서 키워드를 추출하는 방법은 검색어에서 키워드를 추출함에 있어 복잡한 형태소 분석과 품사 태깅을 사용하지 않고, 머신-러닝 기반 모델을 이용하여 검색어에서 키워드를 추출에 소요되는 시간을 감소시켜 보다 효율적으로 키워드가 추출될 수 있다. 또한, 머신-러닝 기반 모델을 이용하여 추출된 키워드를 통해 사용자가 원하는 검색 결과가 보다 정확히 도출될 수 있다.According to various embodiments of the present disclosure, a method of extracting a keyword from a search word is a method for extracting a keyword from a search word using a machine-learning-based model, without using complex morphological analysis and part-of-speech tagging. By reducing the time, keywords can be extracted more efficiently. In addition, search results desired by a user may be more accurately derived through keywords extracted using a machine-learning based model.

도 1은 본 개시의 다양한 실시예에 따른 전자 장치의 구성을 나타내는 블록도이다.
도 2는 본 개시의 다양한 실시예예 따른 전자 장치에 의한 키워드 추출 방법의 흐름도이다.
도 3a는 본 개시의 다양한 실시예에 따른 머신-러닝 기반 모델에 의해 생성되는 태깅 정보에 대한 개념도이다.
도 3b는 본 개시의 다양한 실시예에 따른 품사 정보를 도시한다.
도 4는 본 개시의 일 실시예에 따른 전자 장치에 의한 검색어에서 적어도 하나의 키워드를 추출하는 방법의 흐름도이다.
도 5는 본 개시의 다양한 실시예에 따른 전자 장치(100)와 외부 전자 장치(101)에 의한 검색어를 통한 검색 수행 방법의 흐름도이다.
도 6은 본 개시의 다양한 실시예에 따른 머신-러닝 기반 모델의 학습 방법을 설명하기 위한 도면이다.
1 is a block diagram illustrating a configuration of an electronic device according to various embodiments of the present disclosure.
2 is a flowchart illustrating a keyword extraction method by an electronic device according to various embodiments of the present disclosure.
3A is a conceptual diagram of tagging information generated by a machine-learning based model according to various embodiments of the present disclosure.
3B illustrates part-of-speech information according to various embodiments of the present disclosure.
4 is a flowchart illustrating a method of extracting at least one keyword from a search word by an electronic device according to an embodiment of the present disclosure.
5 is a flowchart illustrating a search method using a search word by the electronic device 100 and the external electronic device 101 according to various embodiments of the present disclosure.
6 is a diagram illustrating a learning method of a machine-learning based model according to various embodiments of the present disclosure.

본 개시의 실시예들은 본 개시의 기술적 사상을 설명하기 위한 목적으로 예시된 것이다. 본 개시에 따른 권리범위가 이하에 제시되는 실시예들이나 이들 실시예들에 대한 구체적 설명으로 한정되는 것은 아니다.Embodiments of the present disclosure are illustrated for the purpose of describing the technical spirit of the present disclosure. The scope of the present disclosure is not limited to the embodiments set forth below or the detailed description of these embodiments.

본 개시에 사용되는 모든 기술적 용어들 및 과학적 용어들은, 달리 정의되지 않는 한, 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자에게 일반적으로 이해되는 의미를 갖는다. 본 개시에 사용되는 모든 용어들은 본 개시를 더욱 명확히 설명하기 위한 목적으로 선택된 것이며 본 개시에 따른 권리범위를 제한하기 위해 선택된 것이 아니다.All technical and scientific terms used in the present disclosure, unless defined otherwise, have the meanings that are commonly understood by one of ordinary skill in the art to which this disclosure belongs. All terms used in the present disclosure are selected for the purpose of more clearly describing the present disclosure, and are not selected to limit the scope of the rights according to the present disclosure.

본 개시에서 사용되는 "포함하는", "구비하는", "갖는" 등과 같은 표현은, 해당 표현이 포함되는 어구 또는 문장에서 달리 언급되지 않는 한, 다른 실시예를 포함할 가능성을 내포하는 개방형 용어(open-ended terms)로 이해되어야 한다.As used in this disclosure, expressions such as "comprising", "including", "having", and the like, are open terms that imply the possibility of including other embodiments unless otherwise stated in the phrase or sentence in which the expression is included. It should be understood as (open-ended terms).

본 개시에서 기술된 단수형의 표현은 달리 언급하지 않는 한 복수형의 의미를 포함할 수 있으며, 이는 청구범위에 기재된 단수형의 표현에도 마찬가지로 적용된다.As used herein, the singular forms "a", "an" and "the" are intended to include the plural forms as well, unless the context clearly indicates otherwise.

본 개시에서 사용되는 "제1", "제2" 등의 표현들은 복수의 구성요소들을 상호 구분하기 위해 사용되며, 해당 구성요소들의 순서 또는 중요도를 한정하는 것은 아니다.Expressions such as “first”, “second”, and the like used in the present disclosure are used to distinguish a plurality of components from each other, and do not limit the order or importance of the components.

본 개시에서 사용되는 "~에 기초하여"라는 표현은, 해당 표현이 포함되는 어구 또는 문장에서 기술되는, 결정, 판단의 행위 또는 동작에 영향을 주는 하나 이상의 인자를 기술하는데 사용되며, 이 표현은 결정, 판단의 행위 또는 동작에 영향을 주는 추가적인 인자를 배제하지 않는다.As used in this disclosure, the expression “based on” is used to describe one or more factors that affect the behavior or behavior of a decision, judgment, described in a phrase or sentence that includes the expression, which expression Does not exclude additional factors that affect decisions, actions of behaviour, or actions.

본 개시에서, 어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 경우, 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로 연결될 수 있거나 접속될 수 있는 것으로, 또는 새로운 다른 구성요소를 매개로 하여 연결될 수 있거나 접속될 수 있는 것으로 이해되어야 한다.In the present disclosure, when a component is referred to as being "connected" or "connected" to another component, the component may be directly connected to or connected to the other component, or new It is to be understood that the connection may be made or may be connected via other components.

이하, 첨부한 도면들을 참조하여, 본 개시의 실시예들을 설명한다. 첨부된 도면에서, 동일하거나 대응하는 구성요소에는 동일한 참조부호가 부여되어 있다. 또한, 이하의 실시예들의 설명에 있어서, 동일하거나 대응하는 구성요소를 중복하여 기술하는 것이 생략될 수 있다. 그러나, 구성요소에 관한 기술이 생략되어도, 그러한 구성요소가 어떤 실시예에 포함되지 않는 것으로 의도되지는 않는다.Hereinafter, embodiments of the present disclosure will be described with reference to the accompanying drawings. In the accompanying drawings, the same or corresponding components are given the same reference numerals. In addition, in the following description of the embodiments, it may be omitted to duplicate the same or corresponding components. However, even if the description of the component is omitted, it is not intended that such component is not included in any embodiment.

도 1은 본 개시의 다양한 실시예에 따른 전자 장치의 구성을 나타내는 블록도이다.1 is a block diagram illustrating a configuration of an electronic device according to various embodiments of the present disclosure.

일 실시예에서, 전자 장치(100)는 통신 회로(110), 메모리(120) 및 프로세서(130)를 포함할 수 있다. 통신 회로(110), 메모리(120) 및 프로세서(130)는 버스(미도시)를 통해 전기적으로 연결되어, 정보, 제어 명령, 데이터 등을 송수신할 수 있다.In an embodiment, the electronic device 100 may include a communication circuit 110, a memory 120, and a processor 130. The communication circuit 110, the memory 120, and the processor 130 may be electrically connected through a bus (not shown) to transmit and receive information, control commands, data, and the like.

일 실시예에서, 통신 회로(110)는 외부 전자 장치(101)와 통신을 수행할 수 있다. 예를 들어, 통신 회로(110)는 전자 장치(100)와 외부 전자 장치(101) 간의 통신을 설정할 수 있다. 통신 회로(110)는 무선 통신 또는 유선 통신을 통해서 네트워크와 연결되어 외부 전자 장치(101)와 통신할 수 있다. 또 다른 예로, 통신 회로(110)는 외부 전자 장치(101)와 유선으로 연결되어 통신을 수행할 수도 있다.In an embodiment, the communication circuit 110 may communicate with the external electronic device 101. For example, the communication circuit 110 may establish communication between the electronic device 100 and the external electronic device 101. The communication circuit 110 may be connected to a network through wireless or wired communication to communicate with the external electronic device 101. As another example, the communication circuit 110 may be connected to the external electronic device 101 by wire to perform communication.

무선 통신은, 예를 들면, 셀룰러 통신(예: LTE, LTE-A(LTE Advance), CDMA(code division multiple access), WCDMA(wideband CDMA), UMTS(universal mobile telecommunications system), WiBro(Wireless Broadband) 등)을 포함할 수 있다. 또한, 무선 통신은, 근거리 무선 통신(예: WiFi(wireless fidelity), LiFi(light fidelity), 블루투스, 블루투스 저전력(BLE), 지그비(Zigbee), NFC(near field communication) 등)을 포함할 수 있다.Wireless communication may include, for example, cellular communication (eg, LTE, LTE Advance (LTE-A), code division multiple access (CDMA), wideband CDMA (WCDMA), universal mobile telecommunications system (UMTS), and wireless broadband (WiBro). And the like). In addition, the wireless communication may include short-range wireless communication (eg, wireless fidelity (WiFi), light fidelity (LFi), Bluetooth, Bluetooth low power (BLE), Zigbee, near field communication (NFC), etc.). .

일 실시예에서, 메모리(120)는 전자 장치(100)의 적어도 하나의 다른 구성 요소에 관계된 명령 또는 데이터를 저장할 수 있다. 또한, 메모리(120)는 소프트웨어 및/또는 프로그램을 저장할 수 있다.In an embodiment, the memory 120 may store instructions or data related to at least one other element of the electronic device 100. In addition, the memory 120 may store software and / or a program.

예를 들어, 메모리(120)는 내장 메모리 또는 외장 메모리를 포함할 수 있다. 내장 메모리는, 예를 들면, 휘발성 메모리(예: DRAM, SRAM 또는 SDRAM 등), 비휘발성 메모리(예: 플래시 메모리, 하드 드라이브, 또는 솔리드 스테이트 드라이브 (SSD)) 중 적어도 하나를 포함할 수 있다. 외장 메모리는 다양한 인터페이스를 통하여 전자 장치(201)와 기능적으로 또는 물리적으로 연결될 수 있다.For example, the memory 120 may include an internal memory or an external memory. The internal memory may include, for example, at least one of volatile memory (eg, DRAM, SRAM, or SDRAM), nonvolatile memory (eg, flash memory, hard drive, or solid state drive (SSD)). The external memory may be functionally or physically connected to the electronic device 201 through various interfaces.

일 실시예에서, 메모리(120)는 머신-러닝 기반 모델을 저장할 수 있다. 머신-러닝 기반 모델은 미리 학습된 실질 형태소 결정 알고리즘에 기초하여, 검색어에 포함된 실질 형태소를 식별하기 위하여 설정된 복수의 태그 중 하나의 태그를 검색어의 각 음절에 태깅(tagging)함으로써 생성되는 태깅 정보를 출력할 수 있다. 예를 들어, 머신-러닝 기반 모델로는 딥-러닝 모델 등이 이용될 수 있다.In one embodiment, memory 120 may store a machine-learning based model. The machine-learning-based model is based on a pre-learned real morpheme determination algorithm. The tagging information is generated by tagging one syllable of each tag of the search term to identify real morphemes included in the search term. You can output For example, a deep learning model may be used as the machine-learning based model.

또한, 머신-러닝 기반 모델은 전자 장치(100)와 유선 또는 무선으로 연결된 다른 전자 장치(예: 외부 서버 등)의 메모리에 저장될 수도 있다. 이 경우, 전자 장치(100)는 유선 또는 무선으로 연결된 다른 전자 장치와 검색어에서 적어도 하나의 키워드를 추출하기 위한 정보를 송수신할 수 있다.In addition, the machine-learning based model may be stored in a memory of another electronic device (eg, an external server) connected to the electronic device 100 by wire or wirelessly. In this case, the electronic device 100 may transmit and receive information for extracting at least one keyword from a search word with another electronic device connected by wire or wirelessly.

일 실시예에서, 머신-러닝 기반 모델은, 복수의 어휘 각각에 대한 실질 형태소 분석 결과를 포함하는 제1 정보를 이용하여, 실질 형태소 결정 알고리즘을 학습할 수 있다. 예를 들어, 제1 정보는 복수의 어휘 각각에서 실질 형태소를 결정하고, 실질 형태소 영역과 실질 형태소가 아닌 영역을 구분한 정보를 포함할 수 있다.In one embodiment, the machine-learning based model may learn a real morpheme determination algorithm using first information that includes real morphological analysis results for each of the plurality of vocabularies. For example, the first information may determine real morphemes from each of a plurality of vocabularies, and may include information that distinguishes real morpheme regions from regions that are not real morphemes.

또한, 제1 정보는 실질 형태소 영역과 실질 형태소가 아닌 영역 각각에 대한 품사 정보를 더 포함할 수 있다. 이 경우, 머신-러닝 기반 모델은 제1 정보를 이용하여, 실질 형태소가 어떤 품사인지를 결정하기 위하여 이용되는 실질 형태소 품사 결정 알고리즘을 더 학습할 수 있다.In addition, the first information may further include part-of-speech information about each of the real morpheme region and the non-real morpheme region. In this case, the machine-learning based model may further learn the real morpheme part-of-speech determination algorithm used to determine which part of speech is the real morpheme using the first information.

일 실시예에서, 머신-러닝 기반 모델은, 실질 형태소 결정 알고리즘에 기초하여, 복수의 어휘에 포함된 각 음절에 복수의 태그 중 하나의 태그를 태깅함으로써 생성되는 제2 정보를 이용하여, 복수의 태그 중 하나의 태그를 검색어의 각 음절에 태깅함으로써 생성되는 태깅 정보를 출력하도록 학습될 수 있다.In one embodiment, the machine-learning based model uses a plurality of second information generated by tagging one tag among a plurality of tags to each syllable included in the plurality of words based on an actual morpheme determination algorithm. It can be learned to output tagging information generated by tagging one tag of each tag in each syllable of the search word.

예를 들어, 제2 정보는 제1 정보에 포함된 실질 형태소 영역과 실질 형태소가 아닌 영역을 구분한 정보에 기초하여, 복수의 태그 중 하나의 태그를 복수의 어휘에 포함된 각 음절에 태깅함으로써 생성될 수 있다. 제2 정보는 프로세서(130)에 의해 생성될 수도 있고, 다른 전자 장치에서 생성되어 전자 장치(101)로 전달될 수도 있다.For example, the second information may be configured by tagging one tag among a plurality of tags to each syllable included in the plurality of vocabularies based on information that distinguishes between a real morpheme region included in the first information and a region that is not a real morpheme. Can be generated. The second information may be generated by the processor 130 or may be generated by another electronic device and transferred to the electronic device 101.

예를 들어, 머신-러닝 기반 모델은 제2 정보를 이용하여, 검색어의 각 음절에 복수의 태그 중 어떤 태그를 태깅해야 하는 지를 학습할 수 있다. 또한, 머신-러닝 기반 모델은 검색어의 각 음절에 복수의 태그 중 하나의 태그를 태깅한 결과를 나타내는 태깅 정보를 생성하여 출력하도록 학습될 수 있다. 머신-러닝 기반 모델을 학습시키는 구체적인 방법에 대해서는 후술하도록 한다.For example, the machine-learning based model may use the second information to learn which of a plurality of tags to tag each syllable of the search word. In addition, the machine-learning based model may be trained to generate and output tagging information indicating a result of tagging one tag among a plurality of tags in each syllable of a search word. A detailed method of learning a machine-learning based model will be described later.

이와 같이, 검색어의 각 음절에 복수의 태그 중 어떤 태그가 태깅되었는 지가 머신-러닝 기반 모델에서 출력되는 태깅 정보를 통해 확인될 수 있다. 태깅 정보는 검색어에서 실질 형태소를 결정하기 위하여 이용될 수 있다. In this way, which tag of the plurality of tags is tagged in each syllable of the search word may be confirmed through tagging information output from the machine-learning based model. The tagging information can be used to determine the actual morphemes in the search term.

일 실시예에서, 실질 형태소를 식별하기 위한 복수의 태그는, 검색어에 포함된 실질 형태소의 시작 음절을 나타내는 제1 태그, 실질 형태소의 시작 음절을 제외한 나머지 음절을 나타내는 제2 태그 및 실질 형태소에 포함되지 않는 음절을 나타내는 제3 태그를 포함할 수 있다. 다만, 이는 설명의 목적일 뿐, 이에 제한되는 것은 아니며, 검색어에서 실질 형태소를 식별하기 위하여 다양한 방법으로 복수의 태그가 설정될 수 있다.In one embodiment, the plurality of tags for identifying real morphemes are included in a first tag representing a starting syllable of real morphemes included in a search word, a second tag representing remaining syllables except a starting syllable of real morphemes, and a real morpheme. It may include a third tag indicating a syllable that is not. However, this is only for the purpose of explanation and the present invention is not limited thereto, and a plurality of tags may be set in various ways to identify actual morphemes in the search word.

일 실시예에서, 머신-러닝 기반 모델은, 미리 학습된 실질 형태소 결정 알고리즘 및 실질 형태소 품사 결정 알고리즘에 기초하여, 실질 형태소에 실질 형태소에 대한 품사 정보를 더 태깅하여 태깅 정보를 생성할 수 있다. 예를 들어, 머신-러닝 기반 모델은, 제1 검색어의 음절들 중, 제1 태그가 태깅된 음절 및 제2 태그가 태깅된 음절 중 적어도 하나에 실질 형태소에 대한 품사 정보를 더 태깅할 수 있다. 이에 따라, 검색어의 각 음절에 복수의 태그 중 어떤 태그가 태깅되었는 지와 더불어 각 음절을 포함하는 실질 형태소의 품사가 어떤 것인 지가 머신-러닝 기반 모델에서 출력되는 태깅 정보를 통해 확인될 수 있다.In one embodiment, the machine-learning based model may generate tagging information by further tagging the part-of-speech information for the real morpheme on the real morpheme based on the pre-learned real morpheme determination algorithm and the real morpheme part-of-speech determination algorithm. For example, the machine-learning based model may further tag part-of-speech information about a real morpheme in at least one of syllables tagged with a first tag and syllables tagged with a second tag among syllables of a first search term. . Accordingly, the tagging information output from the machine-learning-based model may be used to determine which tag of the plurality of tags is tagged for each syllable of the search word, and which parts of real morpheme including each syllable are tagged. .

일 실시예에서, 프로세서(130)는 운영 체제 또는 응용 프로그램을 구동하여 전자 장치(100)의 적어도 하나의 다른 구성 요소들을 제어할 수 있고, 각종 데이터 처리 및 연산을 수행할 수 있다. 예를 들어, 프로세서(130)는 중앙처리장치 등을 포함할 수 있고, SoC(system on chip)로 구현될 수 있다.In an embodiment, the processor 130 may control at least one other component of the electronic device 100 by driving an operating system or an application program, and may perform various data processing and operations. For example, the processor 130 may include a central processing unit and the like, and may be implemented as a system on chip (SoC).

일 실시예에서, 프로세서(130)는 통신 회로(110)를 통해 외부 전자 장치(101)로부터 제1 검색어를 수신할 수 있다. 외부 전자 장치(101)는 사용자로부터 제1 검색어를 외부 전자 장치(101)의 입력 인터페이스(예: 터치 스크린, 키 패드 등)를 통해 입력 받을 수 있다. 외부 전자 장치(101)는 사용자에 의해 입력된 제1 검색어를 외부 전자 장치(101)의 통신 회로를 통해 전자 장치(100)로 송신할 수 있다.In an embodiment, the processor 130 may receive the first search word from the external electronic device 101 through the communication circuit 110. The external electronic device 101 may receive a first search word from a user through an input interface (eg, a touch screen or a keypad) of the external electronic device 101. The external electronic device 101 may transmit the first search word input by the user to the electronic device 100 through a communication circuit of the external electronic device 101.

일 실시예에서, 프로세서(130)는 통신 회로(110)를 통해 수신된 제1 검색어를 머신-러닝 기반 모델에 적용할 수 있다. 머신-러닝 기반 모델은 실질 형태소를 식별하기 위하여 설정된 복수의 태그 중 하나의 태그를 제1 검색어의 각 음절에 태깅함으로써, 제1 태깅 정보를 생성할 수 있다. 프로세서(130)는 머신-러닝 기반 모델로부터 제1 태깅 정보를 획득할 수 있다.In one embodiment, the processor 130 may apply the first search term received via the communication circuit 110 to the machine-learning based model. The machine-learning based model may generate first tagging information by tagging one tag among a plurality of tags set to identify actual morphemes to each syllable of the first search word. The processor 130 may obtain first tagging information from the machine-learning based model.

일 실시예에서, 프로세서(130)는 머신-러닝 기반 모델로부터 획득한 제1 태깅 정보에 기초하여, 제1 검색어로부터 적어도 하나의 제1 키워드를 추출할 수 있다. 예를 들어, 프로세서(130)는 제1 태깅 정보에 기초하여, 제1 검색어의 각 음절에 복수의 태그 중 어떤 태그가 태깅 되었는지를 확인할 수 있다. 프로세서(130)는 제1 검색어의 각 음절에 복수의 태그 중 어떤 태그가 태깅 되었는지를 확인함으로써, 제1 검색어에서 적어도 하나의 제1 키워드를 추출할 수 있다.In an embodiment, the processor 130 may extract at least one first keyword from the first search word based on the first tagging information obtained from the machine-learning based model. For example, the processor 130 may determine which tag of the plurality of tags is tagged in each syllable of the first search word based on the first tagging information. The processor 130 may extract at least one first keyword from the first search word by checking which tag of the plurality of tags is tagged in each syllable of the first search word.

예를 들어, 프로세서(130)는 제1 태깅 정보에 기초하여, 제1 검색어에서 제1 태그로 태깅된 음절로 시작되는 적어도 하나의 어절을 결정할 수 있다. 프로세서(130)는 결정된 적어도 하나의 어절에서 제3 태그로 태깅된 적어도 하나의 음절을 제외하고, 제3 태그로 태깅된 적어도 하나의 음절이 제외된 적어도 하나의 어절을 적어도 하나의 제1 키워드로 추출할 수 있다.For example, the processor 130 may determine at least one word starting with a syllable tagged with the first tag in the first search word based on the first tagging information. The processor 130 may include at least one word that excludes at least one syllable tagged with the third tag as the at least one first keyword except for at least one syllable that is tagged with the third tag in the determined at least one word. Can be extracted.

또한, 프로세서(130)는 제1 태깅 정보를 통해, 제1 검색어의 각 음절에 품사 정보가 태깅된 것이 확인되면, 각 음절에 태깅된 품사 정보에 기초하여, 제1 검색어에 포함된 적어도 하나의 어절의 실질 형태소에 대한 품사를 결정할 수 있다.When the part-of-speech information is tagged to each syllable of the first search word through the first tagging information, the processor 130 based on the part-of-speech information tagged to each syllable, the at least one included in the first search word Part of speech can be determined for the actual morpheme of a word.

일 실시예에서, 프로세서(130)는 추출된 적어도 하나의 제1 키워드를 통해 검색을 수행할 수 있다. 프로세서(130)는 적어도 하나의 제1 키워드를 통해 수행된 검색 결과에 대한 정보를 외부 전자 장치(101)로 송신하도록 통신 회로(110)를 제어할 수 있다.In one embodiment, the processor 130 may perform a search through the extracted at least one first keyword. The processor 130 may control the communication circuit 110 to transmit information about the search result performed through the at least one first keyword to the external electronic device 101.

일 실시예에서, 프로세서(130)는 제1 검색어에서 결정된 적어도 하나의 제1 키워드를 이용하여 머신-러닝 기반 모델을 학습시킬 수 있다. 예를 들어, 프로세서(130)는 복수의 외부 전자 장치로부터 수신되는 검색어로부터 키워드를 추출할 때마다, 이를 이용하여 머신-러닝 기반 모델을 지속적으로 학습시킬 수 있다. 이를 통해, 머신-러닝 기반 모델에서 어떤 검색어가 적용되더라도 보다 정확하게 태깅 정보를 생성할 수 있고, 프로세서(130)는 보다 정확하게 검색어에서 키워드를 추출할 수 있다. 이에 따라, 검색어를 입력한 사용자의 의도에 보다 부합한 검색 결과가 사용자에게 제공될 수 있다.In one embodiment, the processor 130 may train the machine-learning based model using at least one first keyword determined in the first search word. For example, whenever the processor 130 extracts a keyword from a search word received from a plurality of external electronic devices, the processor 130 may continuously learn the machine-learning based model. In this way, tagging information may be more accurately generated regardless of which keyword is applied in the machine-learning based model, and the processor 130 may extract keywords from the keyword more accurately. Accordingly, the user may be provided with a search result that more closely matches the intention of the user who inputs the search word.

도 2, 도 4, 도 5 및 도 6에 도시된 흐름도에서 프로세스 단계들, 방법 단계들, 알고리즘들 등이 순차적인 순서로 설명되었지만, 그러한 프로세스들, 방법들 및 알고리즘들은 임의의 적합한 순서로 작동하도록 구성될 수 있다. 다시 말하면, 본 개시의 다양한 실시예들에서 설명되는 프로세스들, 방법들 및 알고리즘들의 단계들이 본 개시에서 기술된 순서로 수행될 필요는 없다. 또한, 일부 단계들이 비동시적으로 수행되는 것으로서 설명되더라도, 다른 실시예에서는 이러한 일부 단계들이 동시에 수행될 수 있다. 또한, 도면에서의 묘사에 의한 프로세스의 예시는 예시된 프로세스가 그에 대한 다른 변화들 및 수정들을 제외하는 것을 의미하지 않으며, 예시된 프로세스 또는 그의 단계들 중 임의의 것이 본 개시의 다양한 실시예들 중 하나 이상에 필수적임을 의미하지 않으며, 예시된 프로세스가 바람직하다는 것을 의미하지 않는다.Although process steps, method steps, algorithms, and the like have been described in a sequential order in the flowcharts shown in FIGS. 2, 4, 5, and 6, such processes, methods, and algorithms operate in any suitable order. It can be configured to. In other words, the steps of the processes, methods, and algorithms described in various embodiments of the present disclosure need not be performed in the order described in this disclosure. In addition, although some steps are described as being performed asynchronously, in some embodiments these some steps may be performed simultaneously. Moreover, illustration of the process by depiction in the figures does not mean that the illustrated process excludes other changes and modifications thereto, and any of the illustrated process or steps thereof is one of the various embodiments of the present disclosure. It is not meant to be essential to more than one, nor does it mean that the illustrated process is preferred.

도 2는 본 개시의 다양한 실시예예 따른 전자 장치에 의한 키워드 추출 방법의 흐름도이다.2 is a flowchart illustrating a keyword extraction method by an electronic device according to various embodiments of the present disclosure.

210 단계에서, 전자 장치(100)는 전자 장치(100)와 외부 전자 장치(101)로부터 제1 검색어를 수신할 수 있다. 예를 들어, 외부 전자 장치(101)는 사용자로부터 제1 검색어를 입력 받고, 제1 검색어를 전자 장치(100)로 송신할 수 있다. 전자 장치(100)의 프로세서(130)는 전자 장치(100)의 통신 회로(110)를 통해 외부 전자 장치(101)로부터 제2 검색어를 수신할 수 있다.In operation 210, the electronic device 100 may receive a first search word from the electronic device 100 and the external electronic device 101. For example, the external electronic device 101 may receive a first search word from a user and transmit the first search word to the electronic device 100. The processor 130 of the electronic device 100 may receive a second search word from the external electronic device 101 through the communication circuit 110 of the electronic device 100.

220 단계에서, 전자 장치(100)는 머신-러닝 기반 모델에 외부 전자 장치(101)로부터 수신된 제1 검색어를 적용할 수 있다. 예를 들어, 프로세서(130)는 전자 장치(100)의 메모리 또는 전자 장치(100)와 유선 또는 무선으로 연결된 다른 전자 장치(예: 외부 서버 등)의 메모리에 저장된 머신-러닝 기반 모델에 제1 검색어를 적용할 수 있다. 예를 들어, 머신-러닝 기반 모델은 미리 학습된 실질 형태소 결정 알고리즘에 기초하여, 검색어에 포함된 실질 형태소를 식별하기 위하여 설정된 복수의 태그 중 하나의 태그를 검색어의 각 음절에 태깅함으로써 생성되는 태깅 정보를 출력할 수 있다.In operation 220, the electronic device 100 may apply the first search word received from the external electronic device 101 to the machine-learning based model. For example, the processor 130 may include a first device in a machine-learning based model stored in a memory of the electronic device 100 or a memory of another electronic device (for example, an external server, etc.) that is wired or wirelessly connected to the electronic device 100. Search terms can be applied. For example, a machine-learning based model is a tagging generated by tagging each syllable of a tag from one of a plurality of tags set to identify a real morpheme included in a search term based on a pre-trained real morpheme determination algorithm. Information can be output.

230 단계에서, 전자 장치(100)는 복수의 태그 중 하나의 태그를 제1 검색어의 각 음절에 태깅함으로써 생성되는 제1 태깅 정보를 획득할 수 있다. 예를 들어, 프로세서(130)는 머신-러닝 기반 모델이 복수의 태그 중 하나의 태그를 제1 검색어의 각 음절에 태깅함으로써, 생성한 제1 태깅 정보를 획득할 수 있다.In operation 230, the electronic device 100 may obtain first tagging information generated by tagging one tag among the plurality of tags to each syllable of the first search word. For example, the processor 130 may obtain the first tagging information generated by the machine-learning based model tagging one tag among the plurality of tags to each syllable of the first search word.

240 단계에서, 전자 장치(100)는 제1 태깅 정보에 기초하여, 제1 검색어로부터 적어도 하나의 제1 키워드를 추출할 수 있다. 예를 들어, 프로세서(130)는 제1 태깅 정보에 기초하여, 제1 검색어의 각 음절에 복수의 태그 중 어떤 태그가 태깅 되었는지를 확인할 수 있다. 프로세서(130)는 확인 결과를 이용하여, 제1 검색어로부터 적어도 하나의 제1 키워드를 추출할 수 있다.In operation 240, the electronic device 100 may extract at least one first keyword from the first search word based on the first tagging information. For example, the processor 130 may determine which tag of the plurality of tags is tagged in each syllable of the first search word based on the first tagging information. The processor 130 may extract at least one first keyword from the first search word using the verification result.

또한, 프로세서(130)는 적어도 하나의 제1 키워드를 통해 검색을 수행하고, 수행된 검색 결과에 대한 정보를 통신 회로(110)를 통해 외부 전자 장치(101)로 송신할 수 있다.In addition, the processor 130 may perform a search through at least one first keyword and transmit information about the search result to the external electronic device 101 through the communication circuit 110.

도 3a는 본 개시의 다양한 실시예에 따른 머신-러닝 기반 모델에 의해 생성되는 태깅 정보에 대한 개념도이다.3A is a conceptual diagram of tagging information generated by a machine-learning based model according to various embodiments of the present disclosure.

일 실시예에서, 머신-러닝 기반 모델은, 미리 학습된 실질 형태소 결정 알고리즘에 기초하여, 검색어에 포함된 실질 형태소를 식별하기 위하여 설정된 복수의 태그 중 하나의 태그를 검색어의 각 음절에 태깅함으로써, 태깅 정보를 생성할 수 있다.In one embodiment, the machine-learning based model is configured to tag each syllable of a search term by tagging one of a plurality of tags set to identify a real morpheme included in the search term based on a pre-learned real morpheme determination algorithm. Tagging information can be generated.

예를 들어, 복수의 태그는, 검색어에 포함된 실질 형태소의 시작 음절을 나타내는 제1 태그, 실질 형태소의 시작 음절을 제외한 나머지 음절을 나타내는 제2 태그 및 실질 형태소에 포함되지 않는 음절을 나타내는 제3 태그를 포함할 수 있다.For example, the plurality of tags may include: a first tag representing a syllable of a real morpheme included in a search word, a second tag representing a syllable except a syllable of a real morpheme, and a third syllable not included in a real morpheme It can contain a tag.

도 3a를 참조하면, "조금 어려운 얘기지만"이라는 검색어가 외부 전자 장치(101)로부터 수신되는 경우, 머신-러닝 기반 모델은 제1 태깅 정보(310), 제2 태깅 정보(320) 및 제3 태깅 정보(330)를 포함하는 태깅 정보를 생성할 수 있다.Referring to FIG. 3A, when the search term “a little difficult” is received from the external electronic device 101, the machine-learning based model may include the first tagging information 310, the second tagging information 320, and the third. Tagging information including the tagging information 330 may be generated.

예를 들어, 프로세서(130)는 "조금 어려운 얘기지만" 이라는 검색어를 머신-러닝 기반 모델에 적용할 수 있다. 머신-러닝 기반 모델은 "조금 어려운 얘기지만" 이라는 검색어를 어절 별로 구분할 수 있다. 다시 말해서, "조금 어려운 얘기지만" 이라는 검색어를, "조금", "어려운" 및 "얘기지만"의 각 어절로 구분할 수 있다. 또한, 머신-러닝 기반 모델은 구분된 "조금"에 대응하는 제1 태깅 정보(310), "어려운"에 대응하는 제2 태깅 정보(320) 및 "얘기지만"에 대응하는 제3 태깅 정보(330)를 생성할 수 있다.For example, the processor 130 may apply the term "although a little difficult" to the machine-learning based model. The machine-learning-based model can break up the term "somewhat difficult" by word. In other words, the term "somewhat difficult" can be divided into words "little", "difficult" and "only talk". In addition, the machine-learning based model may include the first tagging information 310 corresponding to the divided "a little", the second tagging information 320 corresponding to the "difficult", and the third tagging information corresponding to "only". 330 may be generated.

일 실시예에서, 머신-러닝 기반 모델은 미리 학습된 실질 형태소 결정 알고리즘에 따라, "조금"에 포함된 각 음절, 예를 들어 "조"와 "금" 각각에 대해서 복수의 태그 중 하나의 태그를 태깅할 수 있다. 예를 들어, 머신-러닝 기반 모델은 미리 학습된 실질 형태소 결정 알고리즘에 따라, "조"가 실질 형태소의 시작 음절인 것으로 판단하고, "조"에 제1 태그를 태깅하고, "금"이 실질 형태소의 시작 음절을 제외한 나머지 음절인 것으로 판단하고, "금"에 제2 태그를 태깅함으로써, 제1 태깅 정보(310)를 생성할 수 있다. 이와 같이, "조"에 제1 태그가 태깅되고, "금"에 제2 태그가 태깅되었음이 제1 태깅 정보(310)를 통해 확인될 수 있다.In one embodiment, the machine-learning based model includes one tag of one of the plurality of tags for each syllable included in " a bit ", e. Can be tagged. For example, a machine-learning based model may determine that "Joe" is the starting syllable of a real morpheme, tag a first tag in "Joe", and "Gold" in accordance with a pretrained real morpheme determination algorithm. The first tagging information 310 may be generated by determining that the syllable is the remaining syllable except the starting syllable of the morpheme, and by tagging the second tag on “gold”. As described above, it may be confirmed through the first tagging information 310 that the first tag is tagged in the “trough” and the second tag is tagged in the “gold”.

또한, 머신-러닝 기반 모델은 미리 학습된 실질 형태소 결정 알고리즘 및 실질 형태소 품사 결정 알고리즘에 기초하여, 제1 태그가 태깅된 "조"와 제2 태그가 태깅된 "금"에 "조금"에서 결정된 실질 형태소인 "조금"에 대한 품사 정보를 더 태깅할 수 있다. 예를 들어, 머신-러닝 기반 모델은 미리 학습된 실질 형태소 결정 알고리즘 및 실질 형태소 품사 결정 알고리즘에 기초하여, "조금"에서 결정된 실질 형태소인 "조금"의 품사가 일반 부사(MAG)인 것으로 결정하고, "조"와 "금" 각각에 실질 형태소인 "조금"이 일반 부사(MAG)임을 나타내는 품사 정보를 더 태깅할 수 있다. 또한, "조" 또는 "금" 중 어느 하나에만 실질 형태소인 "조금"이 일반 부사(MAG)임을 나타내는 품사 정보를 더 태깅할 수도 있다.In addition, the machine-learning based model is determined based on a pre-trained real morpheme determination algorithm and an actual morpheme part-of-speech determination algorithm, determined in "a little" to "a" tagged with the first tag and "gold" tagged with the second tag. The part-of-speech information for the real morpheme "a little" can be further tagged. For example, a machine-learning based model may determine that the part of speech that is a small morpheme "a bit", which is determined in "a bit", is a general adverb (MAG) based on a pre-learned real morpheme determination algorithm and a real morpheme part-of-speech determination algorithm. Can be further tagged with part-of-speech information indicating that the real morpheme "a bit" is a general adverb (MAG). It is also possible to further tag the part-of-speech information indicating that "a little", which is a real morpheme only in either "jo" or "gold", is a general adverb (MAG).

예를 들어, 태깅 정보에서 제1 태그가 태깅된 음절 및 제2 태그가 태깅된 음절 중 적어도 하나에 더 태깅되는 실질 형태소에 대한 품사 정보는 도 3b와 같이 나타낼 수 있다. 품사 정보는 제1 열(340)과 같이 구분된 품사에 따라, 제1 열(340)의 각 품사에 대응하는 제2 열(341)과 같이 표시되는 품사 정보일 수도 있고, 제3 열(350)과 같이 보다 세분화되어 구분된 품사에 따라 제3 열(350)의 각 품사에 대응하는 제4 열(351)과 같이 표시되는 품사 정보일 수도 있다. 이하에서는 품사 정보가 제4 열(351)과 같이 표시되는 품사 정보인 것을 중심으로 설명하나, 이에 제한되는 것은 아니다.For example, the part-of-speech information about the actual morphemes further tagged to at least one of the syllables tagged with the first tag and the syllables tagged with the second tag in the tagging information may be represented as shown in FIG. 3B. The part-of-speech information may be part-of-speech information displayed as the second column 341 corresponding to each part-of-speech in the first column 340, or the third column 350, depending on the parts of speech separated as in the first column 340. The part-of-speech information displayed as the fourth column 351 corresponding to each part-of-speech in the third column 350 may be further classified according to the parts of speech that are further divided and divided. Hereinafter, the part-of-speech information will be described based on the part-of-speech information displayed as shown in the fourth column 351, but is not limited thereto.

일 실시예에서, 머신-러닝 기반 모델은 미리 학습된 실질 형태소 결정 알고리즘에 따라, "어려운"에 포함된 각 음절, 예를 들어 "어", "려" 및 "운" 각각에 대해서 복수의 태그 중 하나의 태그를 태깅할 수 있다. 예를 들어, 머신-러닝 기반 모델은 미리 학습된 실질 형태소 결정 알고리즘에 따라, "어"가 실질 형태소의 시작 음절인 것으로 판단하고, "어"에 제1 태그를 태깅하고, "려"가 실질 형태소의 시작 음절을 제외한 나머지 음절인 것으로 판단하고, "려"에 제2 태그를 태깅하고, "운"이 실질 형태소에 포함되지 않는 음절인 것으로 판단하고, "운"에 제3 태그를 태깅함으로써, 제2 태깅 정보(320)를 생성할 수 있다. 이와 같이, "어"에 제1 태그가 태깅되고, "려"에 제2 태그가 태깅되고, "운"에 제3 태그가 태깅되었음이 제2 태깅 정보(320)를 통해 확인될 수 있다.In one embodiment, the machine-learning based model includes a plurality of tags for each syllable included in the "difficult", for example, each of the "uh", "sha", and "lucky", according to a pre-trained real morpheme determination algorithm. You can tag either tag. For example, a machine-learning based model may determine that "er" is the starting syllable of a real morpheme, tag a first tag to "er", and "try" according to a pretrained real morpheme determination algorithm. By determining that the syllable is the syllable except for the beginning syllable of the morpheme, tagging the second tag at "Ryeo", determining that "luck" is not a syllable that is not included in the actual morpheme, and tagging the third tag at "Luck" The second tagging information 320 may be generated. As described above, it may be confirmed through the second tagging information 320 that the first tag is tagged at "U", the second tag is tagged at "R", and the third tag is tagged at "Luck".

또한, 머신-러닝 기반 모델은 미리 학습된 실질 형태소 결정 알고리즘 및 실질 형태소 품사 결정 알고리즘에 기초하여, 제1 태그가 태깅된 "어"와 제2 태그가 태깅된 "려"에 "어려운"에서 결정된 실질 형태소인 "어려"에 대한 품사 정보를 더 태깅할 수 있다. 예를 들어, 머신-러닝 기반 모델은 미리 학습된 실질 형태소 결정 알고리즘 및 실질 형태소 품사 결정 알고리즘에 기초하여, "어려운"에서 결정된 실질 형태소인 "어려"의 품사가 형용사(VA)인 것으로 판단하고, "어"와 "려" 각각에 실질 형태소인 "어려"가 형용사(VA)임을 나타내는 품사 정보를 더 태깅할 수 있다. 또한, "어" 또는 "려" 중 어느 하나에만 실질 형태소인 "어려"의 품사가 형용사(VA)임을 나타내는 품사 정보를 더 태깅할 수도 있다.In addition, the machine-learning based model is based on the pre-trained real morpheme determination algorithm and the real morpheme part-of-speech determination algorithm, which are determined in "difficult" to "H" tagged with the first tag and "Ryeo" tagged with the second tag. The part-of-speech information for the real morpheme "young" can be further tagged. For example, the machine-learning-based model determines that the part of the "difficult" part of the real morpheme determined in "difficult" is an adjective (VA), based on the pre-learned real morpheme determination algorithm and the real morpheme part-of-speech determination algorithm, It is possible to further tag the part-of-speech information indicating that "young", which is a real morpheme, is an adjective (VA) in each of "uh" and "yeo". It is also possible to further tag the part-of-speech information indicating that the part-of-speech part "real" is an adjective (VA) only in either "er" or "terrible".

예를 들어, 제1 정보는 제1 정보는 복수의 어휘 각각에 대한 실질 형태소 분석 결과에 기초한 복수의 어휘 각각에서 결정된 실질 형태소에 대한 품사 정보를 더 포함할 수 있다. 머신-러닝 기반 모델은 제1 정보의 실질 형태소 분석 결과에 따른 "어려운"의 실질 형태소인 "어렵"의 품사를 제1 정보를 통해 확인할 수 있고, 이에 따라, 미리 학습된 실질 형태소 결정 알고리즘에 따라 "어려운"에 대해 실질 형태소로 결정된 "어려"의 품사가 품사가 형용사(VA)인 것으로 판단할 수 있다. 이와 같이, 머신-러닝 기반 모델은, 1 정보의 실질 형태소 분석 결과에 따른 특정 어휘의 실질 형태소와, 머신-러닝 기반 모델에 의해 특정 어휘에 대해 결정되는 실질 형태소가 상이한 경우에도, 머신-러닝 기반 모델에 의해 특정 어휘에 대해 결정되는 실질 형태소에 대한 품사를 판단할 수 있다.For example, the first information may further include part-of-speech information about the actual morphemes determined in each of the plurality of words based on the results of the actual morpheme analysis of each of the plurality of words. The machine-learning-based model can identify the parts of speech of "difficult" which are the "difficult" real morphemes according to the real morphological analysis of the first information through the first information, and according to the pre-learned real morphological deterministic algorithm. Part-of-speech parts that are determined to be real morphemes for "difficult" may be determined to be part of speech adjectives (VA). As such, the machine-learning-based model is based on the machine-learning basis even when the real morpheme of the specific vocabulary according to the real morphological analysis of the 1 information and the real morpheme determined for the specific vocabulary by the machine-learning-based model are different. The part-of-speech for real morphemes determined for a particular vocabulary can be determined by the model.

일 실시예에서, 머신-러닝 기반 모델은 미리 학습된 실질 형태소 결정 알고리즘에 따라, "얘기지만"에 포함된 각 음절, 예를 들어 "얘", "기", "지" 및 "만" 각각에 대해서 복수의 태그 중 하나의 태그를 태깅할 수 있다. 예를 들어, 머신-러닝 기반 모델은 미리 학습된 실질 형태소 결정 알고리즘에 따라, "얘"가 실질 형태소의 시작 음절인 것으로 판단하고, "얘"에 제1 태그를 태깅하고, "기"가 실질 형태소의 시작 음절을 제외한 나머지 음절인 것으로 판단하고, "기"에 제2 태그를 태깅하고, "지"와 "만"이 실질 형태소에 포함되지 않는 음절인 것으로 판단하고, "지"와 "만" 각각에 제3 태그를 태깅함으로써, 제3 태깅 정보(330)를 생성할 수 있다. 이와 같이, "얘"에 제1 태그가 태깅되고, "기"에 제2 태그가 태깅되고, "지"와 "만"에 제3 태그가 태깅되었음이 제3 태깅 정보(330)를 통해 확인될 수 있다.In one embodiment, the machine-learning based model is based on a pre-trained real morphological deterministic algorithm, each syllable included in "talk but", for example, "child", "gi", "ji" and "only" respectively. For one tag, one of a plurality of tags may be tagged. For example, a machine-learning based model may determine that "I" is the starting syllable of a real morpheme, tag the first tag on "I", and "Ki" is real according to a pre-trained real morpheme determination algorithm. It is determined that the syllable is the syllable except the beginning syllable of the morpheme, the second tag is tagged to the "gi", "ji" and "man" are judged to be syllables not included in the actual morpheme, and "ji" and "only" By tagging each third tag, third tagging information 330 may be generated. In this manner, the third tagging information 330 confirms that the first tag is tagged with "Y", the second tag is tagged with "Ki", and the third tag is tagged with "G" and "only". Can be.

또한, 머신-러닝 기반 모델은 미리 학습된 실질 형태소 결정 알고리즘 및 실질 형태소 품사 결정 알고리즘에 기초하여, 제1 태그가 태깅된 "얘"와 제2 태그가 태깅된 "기"에 "얘기지만"에서 결정된 실질 형태소인 "얘기"에 대한 품사 정보를 더 태깅할 수 있다. 예를 들어, 머신-러닝 기반 모델은 미리 학습된 실질 형태소 결정 알고리즘 및 실질 형태소 품사 결정 알고리즘에 기초하여, "얘기지만"에서 결정된 실질 형태소인 "얘기"의 품사가 일반명사(NNG)인 것으로 판단하고, "얘"와 "기" 각각에 "얘기지만"에서 결정된 실질 형태소인 "얘기"가 일반명사(NNG)임을 나타내는 품사 정보를 더 태깅할 수 있다. 또한, "얘" 또는 "기" 중 어느 하나에만 실질 형태소인 "애기"의 품사가 일반명사(NNG)임을 나타내는 품사 정보를 더 태깅할 수도 있다.In addition, the machine-learning based model is based on a pre-trained real morpheme determination algorithm and a real morpheme part-of-speech determination algorithm, in which the first tag is tagged "i" and the second tag is tagged "gi". The part-of-speech information for the determined real morpheme "talk" can be further tagged. For example, a machine-learning-based model determines that the part of speech, "talk", which is a real morpheme determined in "talk", is a common noun (NNG), based on a pre-learned real morpheme determinant algorithm and a real morpheme part-of-speech decision algorithm. In addition, it is possible to further tag the part-of-speech information indicating that "talk", which is the real morpheme determined in "talk", is "general noun" (NNG). It is also possible to further tag the part-of-speech information indicating that the part-of-speech of "baby", which is a real morpheme, only in either "child" or "group".

도 4는 본 개시의 일 실시예에 따른 전자 장치에 의한 검색어에서 적어도 하나의 키워드를 추출하는 방법의 흐름도이다.4 is a flowchart illustrating a method of extracting at least one keyword from a search word by an electronic device according to an embodiment of the present disclosure.

410 단계에서, 전자 장치(100)는 머신-러닝 기반 모델에 제1 검색어를 적용하여 획득한 제1 태깅 정보에 기초하여, 제1 검색어에서 제1 태그로 태깅된 음절로 시작되는 적어도 하나의 어절을 결정할 수 있다. 예를 들어, 전자 장치(100)의 프로세서(130)는 "조금 어려운 얘기지만"이라는 제1 검색어를 머신-러닝 기반 모델에 적용하여 획득한 제1 태깅 정보에 기초하여, 제1 태그로 태깅된 "조", "어" 및 "얘"로 시작되는 "조금", "어려운" 및 "얘기지만"이라는 어절을 결정할 수 있다.In operation 410, the electronic device 100 may include at least one word beginning with a syllable tagged with the first tag in the first search word based on the first tagging information obtained by applying the first search word to the machine-learning based model. Can be determined. For example, the processor 130 of the electronic device 100 may be tagged with the first tag based on the first tagging information obtained by applying the first search term “although a little difficult” to the machine-learning based model. You can determine the words "a little", "difficult", and "only talk" beginning with "jo", "er" and "he".

420 단계에서, 전자 장치(100)는 결정된 적어도 하나의 어절에서 제3 태그로 태깅된 적어도 하나의 음절을 제외할 수 있다. 예를 들어, 프로세서(130)는 "어려운"에서 제3 태그로 태깅된 음절인 "운"을 제외하고, "얘기지만"에서 제3 태그로 태깅된 음절인 "지"와 "만"을 제외할 수 있다.In operation 420, the electronic device 100 may exclude at least one syllable tagged with the third tag from the determined at least one word. For example, the processor 130 excludes "Lee" and "Only", which are syllables tagged with the third tag in "Speak," except for the syllables tagged with the third tag in "Difficult". can do.

430 단계에서, 전자 장치(100)는 제3 태그로 태깅된 적어도 하나의 음절이 제외된 적어도 하나의 어절을 적어도 하나의 제1 키워드로 추출할 수 있다. 예를 들어, 프로세서(130)는 제3 태그로 태깅된 음절을 포함하지 않는 어절인 "조금"과 제3 태그로 태깅된 음절인 "운"을 제외한 어절인 "어려"와 제3 태그로 태깅된 음절인 "지"와 "만"을 제외한 어절인 "얘기"를 복수의 제1 키워드로 추출할 수 있다.In operation 430, the electronic device 100 may extract at least one word from which at least one syllable tagged with the third tag is excluded as at least one first keyword. For example, the processor 130 may tag the word “young” and the third tag except the word “little” which does not include the syllable tagged with the third tag and the word “lucky” that is tagged with the third tag. The word "talk" except the syllables "ji" and "only" may be extracted as a plurality of first keywords.

프로세서(130)는 복수의 제1 키워드로 추출된 "조금", "어려" 및 "얘기"를 이용하여 검색을 수행하고, 검색 결과를 외부 전자 장치(101)로 통신 회로(110)를 통해 송신할 수 있다.The processor 130 performs a search using “a little”, “young” and “talk” extracted with the plurality of first keywords, and transmits the search result to the external electronic device 101 through the communication circuit 110. can do.

도 5는 본 개시의 다양한 실시예에 따른 전자 장치(100)와 외부 전자 장치(101)에 의한 검색어를 통한 검색 수행 방법의 흐름도이다.5 is a flowchart illustrating a search method using a search word by the electronic device 100 and the external electronic device 101 according to various embodiments of the present disclosure.

510 단계에서, 외부 전자 장치(100)는 사용자로부터 검색어를 입력받을 수 있다. 예를 들어, 외부 전자 장치(101)는 사용자로부터 제1 검색어를 외부 전자 장치(101)의 입력 인터페이스를 통해 수신할 수 있다.In operation 510, the external electronic device 100 may receive a search word from a user. For example, the external electronic device 101 may receive a first search word from a user through an input interface of the external electronic device 101.

520 단계에서, 외부 전자 장치(101)는 사용자로부터 입력 받은 제1 검색어를 전자 장치(100)로 송신할 수 있다.In operation 520, the external electronic device 101 may transmit the first search word received from the user to the electronic device 100.

530 단계에서, 전자 장치(100)는 외부 전자 장치(101)로부터 수신한 제1 검색어를 머신-러닝 기반 모델에 적용할 수 있다. 전자 장치(100)는 머신-러닝 기반 모델이 전자 장치(100)와 유선 또는 무선으로 연결된 다른 전자 장치의 메모리에 저장되어 있는 경우, 다른 전자 장치로 제1 검색어를 송신하여, 제1 검색어가 머신-러닝 기반 모델에 적용되도록 할 수 있다.In operation 530, the electronic device 100 may apply the first search word received from the external electronic device 101 to the machine-learning based model. When the machine-learning based model is stored in a memory of another electronic device connected to the electronic device 100 by wire or wirelessly, the electronic device 100 transmits the first search word to the other electronic device, so that the first search word is a machine. Can be applied to learning-based models

540 단계에서, 전자 장치(100)는 머신-러닝 기반 모델로부터 제1 검색어에 대한 제1 태깅 정보를 획득할 수 있다. 전자 장치(100)는 머신-러닝 기반 모델이 전자 장치(100)와 유선 또는 무선으로 연결된 다른 전자 장치의 메모리에 저장되어 있는 경우, 다른 전자 장치로부터 제1 태깅 정보를 수신할 수 있다.In operation 540, the electronic device 100 may obtain first tagging information for the first search word from the machine-learning based model. When the machine-learning based model is stored in a memory of another electronic device connected to the electronic device 100 by wire or wirelessly, the electronic device 100 may receive first tagging information from another electronic device.

550 단계에서, 전자 장치(100)는 제1 태깅 정보에 기초하여, 제1 검색어로부터 적어도 하나의 제1 키워드를 추출할 수 있다. 제1 검색어로부터 적어도 하나의 제1 키워드를 추출하는 방법은 위에서 설명한 내용과 동일하므로, 별도의 설명은 생략하도록 한다.In operation 550, the electronic device 100 may extract at least one first keyword from the first search word based on the first tagging information. Since the method of extracting at least one first keyword from the first search word is the same as that described above, a separate description thereof will be omitted.

또한, 전자 장치(100)는 머신-러닝 기반 모델이 전자 장치(100)와 유선 또는 무선으로 연결된 다른 전자 장치의 메모리에 저장되어 있고, 다른 전자 장치에서 적어도 하나의 제1 키워드 추출 과정이 수행되는 경우, 다른 전자 장치로부터 추출된 적어도 하나의 제1 키워드를 수신할 수 있다.In addition, the electronic device 100 may store a machine-learning based model in a memory of another electronic device that is wired or wirelessly connected to the electronic device 100, and at least one first keyword extraction process may be performed by the other electronic device. In this case, at least one first keyword extracted from another electronic device may be received.

560 단계에서, 전자 장치(100)는 추출된 적어도 하나의 제1 키워드를 이용하여 검색을 수행하여 검색 결과를 획득할 수 있다. 570 단계에서, 전자 장치(100)는 획득된 검색 결과를 외부 전자 장치(101)로 송신할 수 있다. 580 단계에서, 외부 전자 장치(101)는 수신된 검색 결과를 외부 전자 장치(101)의 출력 인터페이스(예: 디스플레이 등)를 통해 사용자에게 제공할 수 있다.In operation 560, the electronic device 100 may perform a search using the extracted at least one first keyword to obtain a search result. In operation 570, the electronic device 100 may transmit the obtained search result to the external electronic device 101. In operation 580, the external electronic device 101 may provide the received search result to a user through an output interface (eg, a display) of the external electronic device 101.

도 6은 본 개시의 다양한 실시예에 따른 머신-러닝 기반 모델의 학습 방법을 설명하기 위한 도면이다.6 is a diagram illustrating a learning method of a machine-learning based model according to various embodiments of the present disclosure.

일 실시예에서, 머신-러닝 기반 모델은 복수의 어휘 각각에 대한 실질 형태소 분석 결과를 포함하는 제1 정보에 기반하여, 검색어에서 실질 형태소를 결정하기 위한 실질 형태소 결정 알고리즘을 학습할 수 있다. 또한, 제1 정보는 복수의 어휘 각각에 대한 실질 형태소 분석 결과에 기초하여 결정된 실질 형태소에 대한 품사를 나타내는 품사 정보를 더 포함할 수 있다. 머신-러닝 기반 모델은 제1 정보에 기반하여, 검색어에서 결정된 실질 형태소에 대한 품사를 결정하기 위한 실질 형태소 품사 결정 알고리즘을 더 학습할 수 있다.In an embodiment, the machine-learning based model may learn a real morpheme determination algorithm for determining a real morpheme in a search word based on first information including a result of a real morpheme analysis for each of the plurality of vocabularies. In addition, the first information may further include part-of-speech information indicating a part-of-speech for the real morpheme determined based on the result of the actual morpheme analysis of each of the plurality of vocabularies. The machine-learning based model may further learn an actual morpheme part-of-speech determination algorithm for determining a part-of-speech for the actual morpheme determined in the search word based on the first information.

예를 들어, 제1 정보에 포함된 실질 형태소 분석 결과에 따른 특정 어휘에 대해 결정된 실질 형태소와, 머신-러닝 기반 모델에 의해 학습된 실질 형태소 결정 알고리즘에 따라 특정 어휘에 대해 결정되는 실질 형태소는 동일할 수도 있고, 상이할 수도 있다. 이에 대해서는 아래에서 보다 구체적으로 설명하도록 한다.For example, a real morpheme determined for a specific vocabulary according to a real morpheme analysis result included in the first information and a real morpheme determined for a specific vocabulary according to a real morpheme determination algorithm learned by a machine-learning based model are the same. It may or may be different. This will be described in more detail below.

일 실시예에서, 머신-러닝 기반 모델은 제1 정보에 기반하여, 복수의 어휘 중 품사가 명사, 부사 등과 같이 체언에 해당하는 제1 어휘들(예: "조금", "얘기", "중앙" 등)에 대해서는 제1 어휘들 자체를 실질 형태소로 결정하도록 실질 형태소 결정 알고리즘을 학습할 수 있다. 이와 같이, 제1 어휘들에 대해서는 제1 정보의 실질 형태소 분석 결과에 따른 제1 어휘들에 대한 실질 형태소와, 머신-러닝 기반 모델에 의해 제1 어휘들에 대해 결정되는 실질 형태소가 동일할 수 있다.In one embodiment, the machine-learning based model is based on the first information, wherein the first part of the plurality of vocabulary words, such as nouns, adverbs, etc., correspond to the first vocabulary (eg, "a little", "talk", "central"). Real morpheme determination algorithm can be learned to determine the first vocabularies themselves as real morphemes. As such, for the first vocabulary, the real morpheme for the first vocabulary according to the result of the actual morphological analysis of the first information and the real morpheme determined for the first vocabularies by the machine-learning based model may be the same. have.

일 실시예에서, 머신-러닝 기반 모델은 동사, 형용사 등과 같은 용언, 조사, 어미 등과 같은 문법 형태소, 서술어절, 체언의 축약 어절에 해당하는 제2 어휘들에서 실질 형태소를 결정하기 위해, 형태소 분석의 복원 알고리즘을 역(reverse)으로 적용하여 제2 어휘들에서 실질 형태소를 결정하도록 실질 형태소 결정 알고리즘을 학습할 수 있다.In one embodiment, the machine-learning based model uses morphological analysis to determine real morphemes in second vocabulary corresponding to grammatical morphemes such as verbs, adjectives, etc., grammatical morphemes such as surveys, endings, etc. The real morphological determination algorithm can be learned to determine the real morpheme in the second vocabulary by applying a reconstruction algorithm of the reverse.

일 실시예에서, 머신-러닝 기반 모델은 제2 어휘들에서 실질 형태소를 결정하기 위하여 제1 정보를 통해 확인되는 제2 어휘들에 대한 실질 형태소 분석 결과에 나타난 음절 수를 결정할 수 있다. 머신-러닝 기반 모델은, 제1 정보를 통해 확인되는 제2 어휘들에 대한 실질 형태소 분석 결과에 나타난 음절 수는, 제2 어휘들에 대한 실질 형태소 분석 결과에 과거형 선어말어미 "었" 또는 "았"는 제외하거나, "아", "어", "ㄴ", "ㄹ", "ㅁ" 또는 "ㅂ"로 시작하는 어미가 포함된 경우, "아", "어", "ㄴ", "ㄹ", "ㅁ" 또는 "ㅂ"는 제외하여 결정할 수 있다.In one embodiment, the machine-learning based model may determine the number of syllables that appear in the actual morphological analysis of the second vocabularies identified through the first information to determine the actual morphemes in the second vocabulary. In the machine-learning-based model, the number of syllables in the actual morpheme analysis results for the second vocabularies identified through the first information is the past word ending "or" in the actual morpheme analysis results for the second vocabularies. "A", "uh", "b", "b", "b", "b", "b", "b", or "b" R "," ㅁ "or" ㅂ "may be excluded.

예를 들어, 머신-러닝 기반 모델은, 제1 정보에 기반하여, 제2 어휘들 중 하나인 "기쁜"에 대한 실질 형태소 분석 결과인 "기쁘+ㄴ"을 확인할 수 있다. 머신-러닝 기반 모델은 실질 형태소 분석 결과인 "기쁘+ㄴ"의 음절의 수를 결정하기 위해, "ㄴ"을 제외한 "기쁘"의 음절 수인 2를 실질 형태소 분석 결과인 "기쁘+ㄴ"의 음절의 수로 결정할 수 있다.For example, the machine-learning based model may identify, based on the first information, "joy + n", which is a real morphological analysis of "joy", one of the second vocabularies. The machine-learning-based model determines the number of syllables of "joy" except "b" to determine the number of syllables of "joy" except "b" to determine the number of syllables of "joy + b". Can be determined by the number of.

일 실시예에서, 머신-러닝 기반 모델은 제1 정보에 기초하여 확인되는 제2 어휘들에 대한 실질 형태소 분석 결과에 대한 음절 수가 제2 어휘의 음절 수와 동일한 경우, 제1 정보에 기초하여 확인되는 제2 어휘들에 대한 실질 형태소의 음절 수에 기초하여, 제2 어휘들에서 실질 형태소를 결정하도록 실질 형태소 결정 알고리즘을 학습할 수 있다.In one embodiment, the machine-learning based model checks based on the first information if the number of syllables for the actual morphological analysis results for the second words determined based on the first information is the same as the number of syllables of the second vocabulary. Based on the number of syllables of the real morphemes for the second vocabularies, the real morpheme determination algorithm can be learned to determine the real morphemes in the second vocabularies.

예를 들어, 머신-러닝 기반 모델은 제1 정보에 기반하여, 제2 어휘들에 해당하는 "기쁜", "슬펐다" 및 "따라"의 실질 형태소 분석 결과인 "기쁘+ㄴ", "슬프+었+다" 및 "따르+어"와 "기쁜", "슬펐다" 및 "따라"에 대한 실질 형태소가 "기쁜", "슬프" 및 "따르"로 결정된 것을 확인할 수 있다.For example, a machine-learning-based model is based on the first information, which is the result of a real morphological analysis of "happy", "sad" and "follow" corresponding to the second vocabulary. It can be seen that the real morphemes for "+" and "follow + uh" and "joy", "sad" and "follow" were determined to be "good", "sad" and "follow".

또한, 머신-러닝 기반 모델은 실질 형태소 분석 결과인 "기쁘+ㄴ", "슬프+었+다" 및 "따르+어"에 대한 음절의 수를 각각 2, 3 및 2로 결정할 수 있다. 이 경우, 머신-러닝 기반 모델은 실질 형태소 분석 결과인 "기쁘+ㄴ", "슬프+었+다" 및 "따르+어"에 대한 음절의 수가 "기쁜", "슬펐다" 및 "따라"의 음절의 수와 동일한 것으로 판단하고, 제1 정보에 기반하여 실질 형태소로 결정된 "기쁘", "슬프" 및 "따르"에 대한 음절의 수에 기초하여, "기쁜", "슬펐다" 및 "따라"에서의 실질 형태소를 "기쁜", "슬펐" 및 "따라"로 결정하도록 실질 형태소 결정 알고리즘을 학습할 수 있다.In addition, the machine-learning based model may determine the number of syllables for the results of real morpheme analysis of “joy + b”, “sad + was” and “follow + uh” as 2, 3 and 2, respectively. In this case, the machine-learning-based model shows that the number of syllables for the results of real morpheme analysis of “joy + b”, “sad + was” and “follow + uh” is “joy”, “sad” and “follow”. "Joy", "sad" and "follow" based on the number of syllables for "joy", "sad" and "follow", determined to be equal to the number of syllables and determined in real morphemes based on the first information. Real morphological determination algorithms can be learned to determine the real morphemes in Ess "A", "Sleep", and "Follow."

또 다른 예로, 머신-러닝 기반 모델은 제1 정보에 기반하여, 제2 어휘들에 해당하는 "삽니다", "운다" 및 "먼"의 실질 형태소 분석 결과인 "살+ㅂ니다", "울+ㄴ다" 및 "멀+ㄴ"와 "삽니다", "운다" 및 "먼"에 대한 실질 형태소가 "살", "울" 및 "멀"로 결정된 것을 확인할 수 있다.In another example, the machine-learning based model is based on the first information, "living", "crying" which is the result of the actual morphological analysis of "live", "cry" and "far" corresponding to the second vocabulary. It can be seen that the real morphemes for + and "mul + b" and " live ", " cry, " and " far "

또한, 머신-러닝 기반 모델은 실질 형태소 분석 결과인 "살+ㅂ니다", "울+ㄴ다" 및 "멀+ㄴ"에 대한 음절의 수를 각각 3, 2, 1로 결정할 수 있다. 이 경우, 머신-러닝 기반 모델은 실질 형태소 분석 결과인 "살+ㅂ니다", "울+ㄴ다" 및 "멀+ㄴ"에 대한 음절의 수가 "삽니다", "운다" 및 "먼"의 음절의 수와 동일한 것으로 판단하고, "실질 형태소로 결정된 "살", "울" 및 "멀"에 대한 음절의 수에 기초하여, "삽니다", "운다" 및 "먼"에서 실질 형태소를 "삽", "운" 및 "먼"으로 결정하도록 실질 형태소 결정 알고리즘을 학습할 수 있다.In addition, the machine-learning based model may determine the number of syllables for the results of the actual morpheme analysis of "light", "cry" and "multi + b" as 3, 2, and 1, respectively. In this case, the machine-learning-based model shows the number of syllables for "live", "cry", and "far +" for the actual morpheme analysis of "live", "cry", and "distant" syllables. Judges the same as the number of and based on the number of syllables for "flesh", "wool" and "mull" determined as "real morpheme", "live", "cry" and "distant" to insert a real morpheme Real morphological determination algorithms can be learned to determine "," luck "and" far. "

또 다른 예로, 머신-러닝 기반 모델은 제1 정보에 기반하여, 제2 어휘들에 해당하는 "지어서", "나아", "물어서" 및 "들어"의 실질 형태소 분석 결과인 "짓+어서", "낫+아", "묻+어서" 및 "듣+어"와 "지어서", "나아", "물어서" 및 "들어"의 실질 형태소가 "짓", "낫", "묻" 및 "듣"으로 결정된 것을 확인할 수 있다.In another example, the machine-learning based model is based on the first information, and "single + up", which is the result of a real morphological analysis of "write", "better", "ask" and "listen" corresponding to the second vocabulary. And the real morphemes of "sickle + ah", "buy +" and "listen +" and "build", "good", "bite", and "listen", You can see that it was decided to "listen."

또한, 머신-러닝 기반 모델은 실질 형태소 분석 결과인 "짓+어서", "낫+아", "묻+어서" 및 "듣+어"에 대한 음절의 수를 각각 3, 2, 3, 2로 결정할 수 있다. 여기에서, 실질 형태소 분석 결과에 포함된 "어서" 및 "아"는 "아" 및 "어"로 시작하는 어미가 아니므로, 음절의 수를 결정함에 있어 제외되지 않을 수 있다. 이 경우, 머신-러닝 기반 모델은 실질 형태소 분석 결과인 "짓+어서", "낫+아", "묻+어서" 및 "듣+어"의 음절의 수가 "지어서", "나아", "물어서" 및 "들어"의 음절의 수와 동일한 것으로 판단하고, 제1 정보에 기반하여 실질 형태소로 결정된 "짓", "낫", "묻" 및 "듣"에 대한 음절의 수를 기초하여, "지어서", "나아", "물어서" 및 "들어"에서의 실질 형태소를 "지", "나", "물" 및 "들"로 결정할 수 있다.In addition, the machine-learning-based model can calculate the number of syllables for real morpheme analysis of "ji + h", "sickle + ah", "q + h", and "hear + h", respectively, 3, 2, 3, 2 Can be determined. Here, since "ger" and "a" included in the results of parenchymal morphology are not mothers starting with "a" and "er", they may not be excluded in determining the number of syllables. In this case, the machine-learning-based model is based on the actual morphological analysis of "squeeze", "scythe + ah", "ask + ah", and "listen" to "hear", "better", " Judged to be equal to the number of syllables of "ask" and "listen", and based on the number of syllables for "jit", "sickle", "buy" and "listen" determined in real morphemes based on the first information, The actual morphemes in "build", "better", "ask" and "listen" can be determined to be "ji", "me", "water" and "s".

일 실시예에서, 머신-러닝 기반 모델은 제1 정보에 기초하여 확인되는 제2 어휘들에 대한 실질 형태소 분석 결과에 대한 음절 수가 제2 어휘의 음절 수보다 큰 경우, 제1 정보에 기초하여 확인되는 제2 어휘들에 대한 실질 형태소의 음절 수에서 1을 뺀 수에 기초하여, 제2 어휘들에서 실질 형태소를 결정하도록 실질 형태소 결정 알고리즘을 학습할 수 있다.In one embodiment, the machine-learning based model checks the syllable based on the first information when the number of syllables for the actual morphological analysis result for the second words determined based on the first information is greater than the number of syllables of the second vocabulary. Based on the subtracted one from the number of syllables of the real morphemes for the second vocabularies, the real morpheme determination algorithm may be learned to determine the real morphemes in the second vocabularies.

예를 들어, 머신-러닝 기반 모델은, 제1 정보에 기반하여, 제2 어휘들에 해당하는 "뵈다", "괴어", "띄다" 및 "씌어"의 실질 형태소 분석 결과인 "보이+다", "고이+어", "뜨이+다" 및 "쓰이+어"와 "뵈다", "괴어", "띄다" 및 "씌어"에 대한 실질 형태소가 "보이", "고이", "뜨이" 및 "쓰이"로 결정된 것을 확인할 수 있다.For example, a machine-learning based model is "boy +" which is the result of a real morphological analysis of "break", "fish", "turn" and "write" corresponding to the second vocabulary, based on the first information. The actual morphemes for "," Goey + "," Tey + Day ", and" Ty + uh "and" Turn on "," Bouff "," Off ", and" Write "are" boy "," Koy "," Tey And "three" can be confirmed.

또한, 머신-러닝 기반 모델은 실질 형태소 분석 결과인 "보이+다", "고이+어", "뜨이+다" 및 "쓰이+어"에 대한 음절의 수를 각각 3으로 결정할 수 있다. 이 경우, 머신-러닝 기반 모델은 실질 형태소 분석 결과인 "보이+다", "고이+어", "뜨이+다" 및 "쓰이+어"에 대한 음절의 수가 "뵈다", "괴어", "띄다" 및 "씌어"의 음절의 수보다 큰 것으로 판단하고, 제1 정보에 기반하여 실질 형태소로 결정된 "보이", "고이", "뜨이" 및 "쓰이"의 음절의 수에서 1일 뺀 수에 기초하여, "뵈다", "괴어", "띄다" 및 "씌어"에서의 실질 형태소를 "뵈", "괴", "띄" 및 "씌"로 결정하도록 실질 형태소 결정 알고리즘을 학습할 수 있다.In addition, the machine-learning based model may determine the number of syllables as 3 for “boy + da”, “Goy + a”, “Ty + da”, and “Ty + a”, which are the results of the actual morphological analysis. In this case, the machine-learning-based model shows that the number of syllables for "boy + da", "Goy +", "Ty + da", and "Ty + a", which are the result of the actual morpheme analysis, is "float", "cracker", The number of syllables of "Boy", "Goi", "Tey", and "Tie" determined by the actual morpheme based on the first information subtracted from the number of syllables of "Off" and "Write" based on the first information. Based on the number, we will learn a real morphological deterministic algorithm to determine the real morphemes in "swept", "breath", "off" and "cover" as "뵈", "got", "off" and "cover". Can be.

일 실시예에서, 머신-러닝 기반 모델은, 제1 정보에 기초하여 확인되는 제2 어휘들에 대한 실질 형태소 분석 결과에 대한 음절 수가 제2 어휘의 음절 수보다 작은 경우, 제1 정보에 기초하여 확인되는 제2 어휘들에 대한 실질 형태소의 음절 수에 기초하여, 제2 어휘들에서 실질 형태소를 결정하도록 실질 형태소 결정 알고리즘을 학습할 수 있다.In one embodiment, the machine-learning based model is based on the first information when the number of syllables for the actual morphological analysis result for the second words determined based on the first information is smaller than the number of syllables of the second vocabulary. Based on the number of syllables of the real morphemes for the identified second vocabularies, the real morpheme determination algorithm can be learned to determine the real morphemes in the second vocabularies.

예를 들어, 머신-러닝 기반 모델은, 제1 정보에 기반하여, 제2 어휘들에 해당하는 "지으니" 및 "물으니"의 실질 형태소 분석 결과인 "짓+니" 및 "묻+니"를 획득하고, "지으니" 및 "물으니"에 대한 실질 형태소가 "짓" 및 "묻"으로 결정된 것을 확인할 수 있다.For example, the machine-learning-based model, based on the first information, uses “ji + ni” and “q + ni”, which are the result of the actual morphological analysis of “gini” and “biti” corresponding to the second vocabularies. Acquired, it can be seen that the real morphemes for "gi" and "bit" have been determined to be "jit" and "buy".

또한, 머신-러닝 기반 모델은, 실질 형태소 분석 결과인 "짓+니" 및 "묻+니"에 대한 음절의 수를 각각 2로 결정할 수 있다. 이 경우, 머신-러닝 기반 모델은 실질 형태소 분석 결과인 "짓+니" 및 "묻+니"의 음절의 수가 "지으니" 및 "물으니"의 음절의 수보다 작은 것으로 판단하고, 제1 정보에 기반하여 실질 형태소로 결정된 "짓" 및 "묻"의 음절의 수에 기초하여, "지으니" 및 "물으니"에서 실질 형태소를 "지" 및 "물"로 결정하도록 실질 형태소 결정 알고리즘을 학습할 수 있다.In addition, the machine-learning based model may determine the number of syllables for “jit + ni” and “q + ni” which are the result of the actual morphological analysis as 2, respectively. In this case, the machine-learning-based model judges that the number of syllables of "jit + ni" and "q + ni" of the actual morphological analysis is smaller than the number of syllables of "gi" and "bit". Based on the number of syllables of "jit" and "buy" determined as real morphemes based on the real morpheme determination algorithm, the real morpheme determination algorithms can be learned to determine the real morphemes "ji" and "water" in "gin" and "bit". have.

일 실시예에서, 머신-러닝 기반 모델은 위와 같이 학습된 실질 형태소 결정 알고리즘에 기초하여, 복수의 어휘에 포함된 각 음절에 복수의 태그 중 하나의 태그를 태깅함으로써 생성되는 제2 정보를 이용하여, 복수의 태그 중 하나의 태그를 검색어의 각 음절에 태깅함으로써 태깅 정보를 생성하고, 생성된 태깅 정보를 출력하도록 학습될 수 있다.In one embodiment, the machine-learning based model uses the second information generated by tagging one tag among a plurality of tags in each syllable included in the plurality of vocabularies based on the real morphological determination algorithm learned as above. The tagging information may be learned by generating tagging information by tagging one tag among the plurality of tags to each syllable of the search word and outputting the generated tagging information.

예를 들어, 머신-러닝 기반 모델은 학습된 실질 형태소 결정 알고리즘에 기초하여, 복수의 어휘 각각에 대해서 실질 형태소를 결정할 수 있다. 머신-기반 모델은 결정된 실질 형태소에 기반하여, 복수의 어휘 각각에 포함된 각 음절에 복수의 태그 중 하나의 태그를 태깅할 수 있다. 예를 들어, 머신-러닝 기반 모델은 "어려운"에 대한 실질 형태소를 "어려"로 결정할 수 있고, 이에 따라 "어"는 실질 형태소의 시작 음절이므로 제1 태그를 태깅하고, "려"는 실질 형태소의 시작 음절을 제외한 나머지 음절이므로 제2 태그를 태깅하고, "운"은 실질 형태소에 포함되지 않는 음절을 이므로 제3 태그를 태깅할 수 있다.For example, the machine-learning based model may determine the real morpheme for each of the plurality of vocabularies based on the learned real morpheme determination algorithm. The machine-based model may tag one tag of the plurality of tags in each syllable included in each of the plurality of vocabularies based on the determined real morpheme. For example, a machine-learning based model may determine the real morpheme for "difficult" as "difficult", thus tagging the first tag as "er" is the starting syllable of the real morpheme, and "trial" is real. Since the second syllable is the syllable except the beginning syllable of the morpheme, the second tag is tagged, and since the "luck" is a syllable not included in the real morpheme, the third tag may be tagged.

또 다른 예로, 머신-러닝 기반 모델은 복수의 어휘 각각에 포함된 각 음절에 복수의 태그 중 하나의 태그를 태깅하기 위하여, 제1 정보에 기반하여 도출되는 확률 정보를 이용할 수 있다.As another example, the machine-learning based model may use probability information derived based on the first information to tag one tag among a plurality of tags in each syllable included in each of the plurality of vocabularies.

도 6을 참조하면, 한국어의 각 어절에 대한 평균 음절 수는 5음절 내외인 점에 기초하여, 5 음절 내의 각 음절 위치 별로 어휘에 포함된 특정 음절이 발생할 확률 값이 도출될 수 있다. 예를 들어, 5 음절 내의 각 음절 위치 별로 "어려운"에 포함된 음절인 "어"가 발생할 확률 값이 도출될 수 있다. 또한, 5 음절 내의 각 음절 위치 별로 시작 음절인 "어" 다음으로 "려"가 특정 위치에서 발생할 확률이 도출될 수 있고, 그 후, 5 음절 내의 각 음절 위치 별로 "어려" 다음으로 "운"이 특정 위치에서 발생할 확률이 도출될 수 있다. 머신-러닝 기반 모델은 제1 정보에 기반하여 도출되는 확률 값을 통해, "어려운"에 포함된 각 음절에 대해 복수의 태그 중 하나의 태그를 태깅할 수 있다.Referring to FIG. 6, based on the fact that the average number of syllables for each syllable in Korean is about five syllables, a probability value for generating a specific syllable included in the vocabulary may be derived for each syllable location within the five syllables. For example, a probability value of occurrence of a syllable “er” included in “difficult” may be derived for each syllable position within five syllables. Also, the probability that a "sy" next to a syllable position in each syllable position within five syllables may be derived from a certain position, and then "lucky" next to "young" for each syllable position within five syllables. The probability of occurring at this particular location can be derived. The machine-learning based model may tag one tag among a plurality of tags for each syllable included in the “difficult” through a probability value derived based on the first information.

위와 같이, 머신-러닝 기반 모델은 복수의 어휘들에 포함된 각 음절에 복수의 태그 중 하나의 태그를 태깅함으로써, 복수의 어휘들 각각에 대한 태깅 정보를 포함하는 제2 정보를 생성할 수 있다. 머신-러닝 기반 모델은 생성된 제2 정보를 이용하여 수신되는 검색어의 각 음절에 복수의 태그 중 하나의 태그를 태깅함으로써 검색어에 대한 태깅 정보를 생성하고, 생성된 태깅 정보를 출력하도록 학습될 수 있다.As described above, the machine-learning based model may generate second information including tagging information for each of the plurality of words by tagging one tag among the plurality of tags in each syllable included in the plurality of words. . The machine-learning based model may be trained to generate tagging information for a search term and to output the generated tagging information by tagging one tag among a plurality of tags in each syllable of the received search term using the generated second information. have.

상기 방법은 특정 실시예들을 통하여 설명되었지만, 상기 방법은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장장치 등을 포함할 수 있다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고, 상기 실시예들을 구현하기 위한 기능적인(functional) 프로그램, 코드 및 코드 세그먼트들은 본 개시가 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.Although the method has been described through specific embodiments, the method may also be embodied as computer readable code on a computer readable recording medium. Computer-readable recording media include all kinds of recording devices that store data that can be read by a computer system. Examples of computer-readable recording media may include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage, and the like. The computer readable recording medium can also be distributed over network coupled computer systems so that the computer readable code is stored and executed in a distributed fashion. In addition, functional programs, codes, and code segments for implementing the above embodiments can be easily inferred by programmers in the art to which the present disclosure belongs.

이상 일부 실시예들과 첨부된 도면에 도시된 예에 의해 본 개시의 기술적 사상이 설명되었지만, 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자가 이해할 수 있는 본 개시의 기술적 사상 및 범위를 벗어나지 않는 범위에서 다양한 치환, 변형 및 변경이 이루어질 수 있다는 점을 알아야 할 것이다. 또한, 그러한 치환, 변형 및 변경은 첨부된 청구범위 내에 속하는 것으로 생각되어야 한다.While the technical spirit of the present disclosure has been described with reference to some embodiments and the examples shown in the accompanying drawings, the technical spirit and scope of the present disclosure may be understood by those skilled in the art. It will be appreciated that various substitutions, modifications, and alterations can be made in the scope. Also, such substitutions, modifications and variations are intended to be included within the scope of the appended claims.

Claims (13)

검색어에서 적어도 하나의 키워드를 추출하는 전자 장치에 있어서,
미리 학습된 실질 형태소 결정 알고리즘에 기초하여, 검색어에 포함된 실질 형태소를 식별하기 위하여 설정된 복수의 태그 중 하나의 태그를 상기 검색어의 각 음절에 태깅함으로써 생성되는 태깅 정보를 출력하는 머신-러닝 기반 모델을 저장하는 메모리;
외부 전자 장치와 통신을 수행하는 통신 회로; 및
상기 메모리 및 상기 통신 회로와 전기적으로 연결된 프로세서를 포함하고,
상기 프로세서는,
상기 통신 회로를 통해 상기 외부 전자 장치로부터 제1 검색어를 수신하고,
상기 머신-러닝 기반 모델에 상기 제1 검색어를 적용하여, 상기 복수의 태그 중 하나의 태그를 상기 제1 검색어의 각 음절에 태깅함으로써 생성되는 제1 태깅 정보를 획득하고,
상기 제1 태깅 정보에 기초하여, 상기 제1 검색어로부터 적어도 하나의 제1 키워드로 추출하는, 전자 장치.
An electronic device for extracting at least one keyword from a search word,
A machine-learning based model that outputs tagging information generated by tagging one tag among a plurality of tags set to identify real morphemes included in a search word to each syllable of the search word based on a pre-learned real morpheme determination algorithm. A memory for storing the;
Communication circuitry for communicating with an external electronic device; And
A processor electrically connected with the memory and the communication circuit,
The processor,
Receiving a first search word from the external electronic device through the communication circuit;
Applying the first search word to the machine-learning based model to obtain first tagging information generated by tagging one tag among the plurality of tags to each syllable of the first search word,
And extract the at least one first keyword from the first search word based on the first tagging information.
제1항에 있어서,
상기 복수의 태그는,
상기 검색어에 포함된 실질 형태소의 시작 음절을 나타내는 제1 태그, 상기 실질 형태소의 상기 시작 음절을 제외한 나머지 음절을 나타내는 제2 태그 및 상기 실질 형태소에 포함되지 않는 음절을 나타내는 제3 태그를 포함하는, 전자 장치.
The method of claim 1,
The plurality of tags,
A first tag indicating a syllable of a real morpheme included in the search word, a second tag indicating a syllable except the first syllable of the real morpheme, and a third tag indicating a syllable not included in the real morpheme, Electronic devices.
제2항에 있어서,
상기 프로세서는,
상기 제1 태깅 정보에 기초하여, 상기 제1 검색어에서 상기 제1 태그로 태깅된 음절로 시작되는 적어도 하나의 어절을 결정하고,
상기 결정된 적어도 하나의 어절에서 상기 제3 태그로 태깅된 적어도 하나의 음절을 제외하고,
상기 제3 태그로 태깅된 적어도 하나의 음절이 제외된 상기 적어도 하나의 어절을 상기 적어도 하나의 제1 키워드로 추출하는, 전자 장치.
The method of claim 2,
The processor,
Determine at least one word starting with a syllable tagged with the first tag in the first search word based on the first tagging information,
Except for at least one syllable tagged with the third tag in the determined at least one word,
And extracting the at least one word including the at least one syllable tagged with the third tag as the at least one first keyword.
제1항에 있어서,
상기 프로세서는,
상기 적어도 하나의 제1 키워드를 통해 수행된 검색 결과에 대한 정보를 상기 외부 전자 장치로 송신하도록 상기 통신 회로를 제어하는, 전자 장치.
The method of claim 1,
The processor,
And control the communication circuit to transmit information about a search result performed through the at least one first keyword to the external electronic device.
제2항에 있어서,
상기 머신 러닝 기반 모델은,
상기 미리 학습된 실질 형태소 결정 알고리즘 및 실질 형태소 품사 결정 알고리즘에 기초하여, 상기 제1 태그가 태깅된 음절 및 상기 제2 태그가 태깅된 음절 중 적어도 하나에 상기 실질 형태소에 대한 품사 정보를 더 태깅하여 상기 태깅 정보를 생성하는, 전자 장치.
The method of claim 2,
The machine learning based model,
Based on the pre-learned real morpheme determination algorithm and the real morpheme part-of-speech determination algorithm, tagging part-of-speech information on the real morpheme is further tagged to at least one of the syllables tagged with the first tag and the syllables tagged with the second tag And generate the tagging information.
제1항에 있어서,
상기 머신-러닝 기반 모델은,
복수의 어휘 각각에 대한 실질 형태소 분석 결과를 포함하는 제1 정보를 이용하여, 상기 실질 형태소 결정 알고리즘을 학습하고,
상기 실질 형태소 결정 알고리즘에 기초하여, 상기 복수의 어휘에 포함된 각 음절에 상기 복수의 태그 중 하나의 태그를 태깅함으로써 생성되는 제2 정보를 이용하여, 상기 복수의 태그 중 하나의 태그를 상기 검색어의 각 음절에 태깅함으로써 생성되는 상기 태깅 정보를 출력하도록 학습되는, 전자 장치.
The method of claim 1,
The machine-learning based model,
Learning the real morpheme determination algorithm using first information including a real morphological analysis result for each of a plurality of vocabularies,
Based on the real morpheme determination algorithm, one tag of the plurality of tags is searched using the second information generated by tagging one tag of the plurality of tags in each syllable included in the plurality of words. And output the tagging information generated by tagging each syllable of the electronic device.
컴퓨터 상에서 수행하기 위한 프로그램을 기록한 비일시적 컴퓨터 판독 가능한 기록 매체에 있어서,
상기 프로그램은, 프로세서에 의한 실행 시, 상기 프로세서가,
외부 전자 장치로부터 제1 검색어를 수신하는 단계;
미리 학습된 실질 형태소 결정 알고리즘에 기초하여, 검색어에 포함된 실질 형태소를 식별하기 위하여 설정된 복수의 태그 중 하나의 태그를 상기 검색어의 각 음절에 태깅함으로써 생성되는 태깅 정보를 출력하는 머신-러닝 기반 모델에 상기 제1 검색어를 적용하는 단계;
상기 머신-러닝 기반 모델로부터, 상기 복수의 태그 중 하나의 태그를 상기 제1 검색어의 각 음절에 태깅함으로써 생성되는 제1 태깅 정보를 획득하는 단계; 및
상기 제1 태깅 정보에 기초하여, 상기 제1 검색어로부터 적어도 하나의 제1 키워드를 추출하는 단계
를 수행하도록 하는 실행 가능한 명령을 포함하는, 컴퓨터 판독 가능한 기록 매체.
A non-transitory computer readable recording medium having recorded thereon a program for running on a computer,
When the program is executed by a processor, the processor,
Receiving a first search word from an external electronic device;
A machine-learning based model that outputs tagging information generated by tagging one tag among a plurality of tags set to identify real morphemes included in a search word to each syllable of the search word based on a pre-learned real morpheme determination algorithm. Applying the first search term to;
Obtaining, from the machine-learning based model, first tagging information generated by tagging one of the plurality of tags with each syllable of the first search word; And
Extracting at least one first keyword from the first search word based on the first tagging information;
Computer-readable recording medium comprising executable instructions for causing the computer to perform an operation.
제7항에 있어서,
상기 복수의 태그는,
상기 검색어에 포함된 상기 실질 형태소의 시작 음절을 나타내는 제1 태그, 상기 실질 형태소의 상기 시작 음절을 제외한 나머지 음절을 나타내는 제2 태그 및 상기 실질 형태소에 포함되지 않는 음절을 나타내는 제3 태그를 포함하는, 컴퓨터 판독 가능한 기록 매체.
The method of claim 7, wherein
The plurality of tags,
A first tag indicating a syllable of the real morpheme included in the search word, a second tag indicating a syllable except the first syllable of the real morpheme, and a third tag indicating a syllable not included in the real morpheme , Computer-readable recording medium.
제8항에 있어서,
상기 제1 검색어에서 적어도 하나의 제1 키워드를 추출하는 단계는,
상기 제1 태깅 정보에 기초하여, 상기 제1 검색어에서 상기 제1 태그로 태깅된 음절로 시작되는 적어도 하나의 어절을 결정하는 단계;
상기 결정된 적어도 하나의 어절에서 상기 제3 태그로 태깅된 적어도 하나의 음절을 제외하는 단계; 및
상기 제3 태그로 태깅된 적어도 하나의 음절이 제외된 상기 적어도 하나의 어절을 상기 적어도 하나의 제1 키워드로 추출하는 단계
를 포함하는, 컴퓨터 판독 가능한 기록 매체.
The method of claim 8,
Extracting at least one first keyword from the first search word,
Determining at least one word starting with a syllable tagged with the first tag in the first search word based on the first tagging information;
Excluding at least one syllable tagged with the third tag from the determined at least one word; And
Extracting the at least one word that excludes at least one syllable tagged with the third tag as the at least one first keyword
And a computer readable recording medium.
제7항에 있어서,
상기 실행 가능한 명령은,
상기 적어도 하나의 제1 키워드를 통해 수행된 검색 결과에 대한 정보를 상기 외부 전자 장치로 송신하는 단계
를 더 수행하도록 하는, 컴퓨터 판독 가능한 기록 매체.
The method of claim 7, wherein
The executable command is:
Transmitting information about a search result performed through the at least one first keyword to the external electronic device;
Computer readable recording medium.
제8항에 있어서,
상기 머신 러닝 기반 모델은,
상기 미리 학습된 실질 형태소 결정 알고리즘 및 상기 실질 형태소 품사 결정 알고리즘에 기초하여, 상기 제1 태그 또는 상기 제2 태그가 태깅된 음절에 상기 실질 형태소에 대한 품사 정보를 더 태깅하여 상기 태깅 정보를 생성하는, 컴퓨터 판독 가능한 기록 매체.
The method of claim 8,
The machine learning based model,
Generating the tagging information by further tagging the part-of-speech information for the real morpheme on the syllables in which the first tag or the second tag is tagged based on the pre-learned real morpheme decision algorithm and the real morpheme part-of-speech determination algorithm. , Computer-readable recording medium.
제7항에 있어서,
상기 머신-러닝 기반 모델은,
복수의 어휘 각각에 대한 실질 형태소 분석 결과를 포함하는 제1 정보를 이용하여, 상기 실질 형태소 결정 알고리즘을 학습하고,
상기 학습된 실질 형태소 결정 알고리즘에 기초하여, 상기 복수의 어휘에 포함된 각 음절에 상기 복수의 태그 중 하나의 태그를 태깅함으로써 생성되는 제2 정보를 이용하여, 상기 복수의 태그 중 하나의 태그를 상기 검색어의 각 음절에 태깅함으로써 생성되는 상기 태깅 정보를 출력하도록 학습되는, 컴퓨터 판독 가능한 기록 매체.
The method of claim 7, wherein
The machine-learning based model,
Learning the real morpheme determination algorithm using first information including a real morphological analysis result for each of a plurality of vocabularies,
Based on the learned real morpheme determination algorithm, one tag of the plurality of tags is selected by using second information generated by tagging one tag of the plurality of tags in each syllable included in the plurality of vocabulary words. And outputting the tagging information generated by tagging each syllable of the search term.
검색어에서 키워드를 추출하는 방법에 있어서,
외부 전자 장치로부터 제1 검색어를 수신하는 단계;
미리 학습된 실질 형태소 결정 알고리즘에 기초하여, 검색어에 포함된 실질 형태소를 식별하기 위하여 설정된 복수의 태그 중 하나의 태그를 검색어의 각 음절에 태깅함으로써 생성되는 태깅 정보를 출력하는 머신-러닝 기반 모델에 상기 제1 검색어를 적용하는 단계;
상기 머신-러닝 기반 모델로부터, 상기 복수의 태그 중 하나의 태그를 상기 제1 검색어의 각 음절에 태깅함으로써 생성되는 제1 태깅 정보를 획득하는 단계; 및
상기 제1 태깅 정보에 기초하여, 상기 제1 검색어로부터 적어도 하나의 제1 키워드로 추출하는 단계
를 포함하는 키워드 추출 방법.
In terms of extracting keywords from search terms,
Receiving a first search word from an external electronic device;
Based on a pre-learned real morpheme determination algorithm, a machine-learning based model that outputs tagging information generated by tagging one tag among a plurality of tags set to identify real morphemes included in a search word in each syllable of the search word. Applying the first search word;
Obtaining, from the machine-learning based model, first tagging information generated by tagging one of the plurality of tags with each syllable of the first search word; And
Extracting at least one first keyword from the first search word based on the first tagging information;
Keyword extraction method comprising a.
KR1020180014231A 2018-02-05 2018-02-05 Electronic apparatus and method for extracting at least one keyword from search terms and computer readable recording medium KR102069676B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180014231A KR102069676B1 (en) 2018-02-05 2018-02-05 Electronic apparatus and method for extracting at least one keyword from search terms and computer readable recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180014231A KR102069676B1 (en) 2018-02-05 2018-02-05 Electronic apparatus and method for extracting at least one keyword from search terms and computer readable recording medium

Publications (2)

Publication Number Publication Date
KR20190094738A true KR20190094738A (en) 2019-08-14
KR102069676B1 KR102069676B1 (en) 2020-01-23

Family

ID=67621850

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180014231A KR102069676B1 (en) 2018-02-05 2018-02-05 Electronic apparatus and method for extracting at least one keyword from search terms and computer readable recording medium

Country Status (1)

Country Link
KR (1) KR102069676B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210090535A (en) * 2020-01-10 2021-07-20 김광년 System and method for brokering loan serivce

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100760301B1 (en) * 2006-02-23 2007-09-19 삼성전자주식회사 Method and apparatus for searching media file through extracting partial search word
KR101611388B1 (en) * 2015-02-04 2016-04-11 네이버 주식회사 System and method to providing search service using tags

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100760301B1 (en) * 2006-02-23 2007-09-19 삼성전자주식회사 Method and apparatus for searching media file through extracting partial search word
KR101611388B1 (en) * 2015-02-04 2016-04-11 네이버 주식회사 System and method to providing search service using tags

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210090535A (en) * 2020-01-10 2021-07-20 김광년 System and method for brokering loan serivce

Also Published As

Publication number Publication date
KR102069676B1 (en) 2020-01-23

Similar Documents

Publication Publication Date Title
CN106469552B (en) Speech recognition apparatus and method
US10664744B2 (en) End-to-end memory networks
CN108711420B (en) Multilingual hybrid model establishing method, multilingual hybrid model establishing device, multilingual hybrid model data obtaining device and electronic equipment
Arora et al. Character level embedding with deep convolutional neural network for text normalization of unstructured data for Twitter sentiment analysis
WO2015062482A1 (en) System and method for automatic question answering
US9805718B2 (en) Clarifying natural language input using targeted questions
US10803850B2 (en) Voice generation with predetermined emotion type
JP6583686B2 (en) Semantic information generation method, semantic information generation device, and program
US10387575B1 (en) Semantic graph traversal for recognition of inferred clauses within natural language inputs
KR102223736B1 (en) A speech processing method using an artificial intelligence device
US20210127003A1 (en) Interactive voice-control method and apparatus, device and medium
KR102081495B1 (en) How to add accounts, terminals, servers, and computer storage media
Joty et al. Cross-language learning with adversarial neural networks: Application to community question answering
US20190287142A1 (en) Method, apparatus for evaluating review, device and storage medium
KR102222451B1 (en) An apparatus for predicting the status of user's psychology and a method thereof
EP3550454A1 (en) Electronic device and control method
KR20190096862A (en) User authentication method based on speech recognition using artificial intelligence device and apparatus therefor
US20220148576A1 (en) Electronic device and control method
KR101896973B1 (en) Natural Laguage Generating System Using Machine Learning Moodel, Method and Computer-readable Medium Thereof
Doumbouya et al. Using radio archives for low-resource speech recognition: towards an intelligent virtual assistant for illiterate users
CN112905735A (en) Method and apparatus for natural language processing
KR102069676B1 (en) Electronic apparatus and method for extracting at least one keyword from search terms and computer readable recording medium
US10839017B2 (en) Adaptive, interactive, and cognitive reasoner of an autonomous robotic system utilizing an advanced memory graph structure
US10896222B1 (en) Subject-specific data set for named entity resolution
CN113705196A (en) Chinese open information extraction method and device based on graph neural network

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)