KR20230068092A - A method for extracting food menu nouns using parts of speech such as verbs and adjectives, a method for updating a food dictionary using the same, and a system for the same - Google Patents
A method for extracting food menu nouns using parts of speech such as verbs and adjectives, a method for updating a food dictionary using the same, and a system for the same Download PDFInfo
- Publication number
- KR20230068092A KR20230068092A KR1020210154049A KR20210154049A KR20230068092A KR 20230068092 A KR20230068092 A KR 20230068092A KR 1020210154049 A KR1020210154049 A KR 1020210154049A KR 20210154049 A KR20210154049 A KR 20210154049A KR 20230068092 A KR20230068092 A KR 20230068092A
- Authority
- KR
- South Korea
- Prior art keywords
- nouns
- food
- verbs
- noun
- registered
- Prior art date
Links
- 235000013305 food Nutrition 0.000 title claims abstract description 171
- 238000000034 method Methods 0.000 title claims description 37
- 238000000605 extraction Methods 0.000 claims abstract description 22
- 230000015654 memory Effects 0.000 claims abstract description 19
- 239000000284 extract Substances 0.000 claims description 21
- 230000004044 response Effects 0.000 claims description 13
- 238000001514 detection method Methods 0.000 claims description 9
- 238000012544 monitoring process Methods 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 description 17
- 238000004891 communication Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 10
- 230000014509 gene expression Effects 0.000 description 7
- 238000003860 storage Methods 0.000 description 7
- 230000008451 emotion Effects 0.000 description 5
- 230000002996 emotional effect Effects 0.000 description 5
- 238000003058 natural language processing Methods 0.000 description 5
- 238000012552 review Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 235000009508 confectionery Nutrition 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 206010028916 Neologism Diseases 0.000 description 1
- 241000590419 Polygonia interrogationis Species 0.000 description 1
- 201000007201 aphasia Diseases 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
실시예는, 메모리에 저장된 음식 메뉴 명사 추출 프로그램 코드가 제공하는 제어 명령에 따라 프로세서에 의해 수행되는 수신된 음식명 검색어를 포함하는 웹페이지를 검색하고, 검색된 웹페이지 내에서 음식명 검색어를 포함한 문장을 수집하는 단계; 수집된 음식명 검색어를 포함한 문장들에서 용언을 추출하는 단계; 추출된 용언을 검색어로 하여 웹페이지를 검색하고 검색된 웹페이지 내에서 용언을 포함한 문장을 수집하는 단계; 및 수집된 용언을 포함한 문장들에서 명사를 추출하는 단계;를 포함하는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법을 제공할 수 있다.The embodiment searches a web page including the received food name search word, which is executed by a processor according to a control command provided by a food menu noun extraction program code stored in a memory, and searches for a sentence including the food name search word in the searched web page. Collecting; extracting verbs from sentences including collected food name search words; searching for a web page using the extracted verb as a search term and collecting sentences including the verb in the searched web page; and extracting nouns from sentences including the collected verbs; a food menu noun extraction method using parts of speech such as verbs and adjectives may be provided.
Description
본 발명은 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사를 추출하는 방법과 이를 이용하여 음식 사전을 업데이트하는 방법 및 이를 위한 시스템에 관한 것이다.The present invention relates to a method of extracting food menu nouns using parts of speech such as verbs and adjectives, a method of updating a food dictionary using the same, and a system therefor.
메일, 소셜미디어와 같은 비정형데이터가 많은 비중을 차지함에 따라서 자연어 처리에 대한 관심이 높아지고 있다. 제품이나 서비스 구매 후기의 구전효과가 확장되면서 기업의 평판 분석에 집중하고 있다. 또한, 인공지능의 발달로 AI스피커의 대중화로 소통 패러다임의 변화가 발생하면서 기존 키보드 중심의 텍스트 방식에서 대화형으로 변화되면서 더욱 자연어에 대한 관심이 높아지고 있다. 자연어처리는 사람의 자연어를 컴퓨터가 분석하고 주어진 문제를 해결하는 기능이다(이종화 외, 2019). 하지만 동음이의어나 다의어처럼 한글이 가지는 모호성 분석이 어렵다. 문법적인 구어와 문어의 차이, '아버지 가방에 들어가신다'와 같이 띄어쓰기 문제, 동음이의어나 주어, 서술어, 목적어 등 생략된 문장 분석 등 한글의 특수성에 많은 연구자의 한계점을 제시하고 있다(김미경, 최소영, 2020). 고객의 평점이나 리뷰를 읽고 제품이나 서비스의 구매 결정에 많은 영향을 줌으로써 이를 실시간 모니터링하여 대응하는 실시간 리뷰 모니터링 서비스도 가능하며 자사와 타사의 온라인 데이터 분석을 통해 경쟁우위와 경쟁 열위를 판단하여 문제의 원인 찾아내는 경쟁사 분석도 가능하다. 뉴스에서 자연어처리로 핵심키워드, 요약분석을 통해 분석시간을 대폭 줄일 수 있으며 뉴스레터나 SNS 포스팅 자동화도 가능하며 리뷰, 블로그 등을 자연어 처리 분석하여 충성도 높은 우수 고객을 식별할 수 있는 고객 분석도 가능하다(임용택, 임희석, 2020). 채팅어나 인터넷어는 새로운 이슈가 발생할 때마다 신조어가 등장하며 비표준어지만 표준어로 치환하여 어휘와 매칭할 수 있는 연구도 진행되고 있다(이종화, 2018; 김진수, 2020; 길호현, 2018).As unstructured data such as e-mail and social media accounts for a large proportion, interest in natural language processing is increasing. As the word of mouth effect of product or service purchase reviews expands, companies are focusing on analyzing their reputation. In addition, with the development of artificial intelligence and the popularization of AI speakers, a change in communication paradigm occurred, changing from the existing keyboard-centered text method to conversational, increasing interest in natural language. Natural language processing is the ability of a computer to analyze a person's natural language and solve a given problem (Lee Jong-hwa et al., 2019). However, it is difficult to analyze the ambiguity of Hangeul, such as homonyms and polysemy. The limitations of many researchers are suggested by the uniqueness of Hangeul, such as the difference between grammatical spoken language and written language, spacing problems such as 'Going into your father's bag', and analysis of omitted sentences such as homonyms, subjects, predicates, and objects (Kim Mi-kyung, Choi So-young, 2020). Real-time review monitoring service is also available, which reads customers' ratings or reviews and has a great influence on purchasing decisions for products or services, monitoring and responding to them in real time. A competitor analysis to find the cause is also possible. Analysis time can be drastically reduced through key keyword and summary analysis through natural language processing in news, and automation of newsletters and SNS postings is possible. It is (Yong-taek Lim, Hee-seok Lim, 2020). Whenever a new issue arises in chatting or Internet language, a new coined word appears, and even though it is a non-standard language, research is being conducted to match it with a vocabulary by replacing it with a standard language (Lee Jong-hwa, 2018; Kim Jin-soo, 2020; Gil Ho-hyun, 2018).
한국등록특허공보 제1935109호의 패션 분야의 단어 구 단위 감성분석방법 및 이를 포함하는 저장매체에 관한 것으로 저장매체에 저장된 패션 분야의 단어 구 단위 감성분석용 프로그램이 설치된 관리서버를 통해 수행되는 패션 분야의 단어 구 단위 감성분석방법에 있어서, 온라인 서비스를 대상으로 비정형 텍스트 데이터를 수집하여 상기 관리서버에 저장하는 (a)단계와, 상기 비정형 텍스트 데이터에서, 패션 분야에 포함되는 복수의 감성어휘를 추출하는 (b)단계와, 상기 감성어휘 중 적어도 일부를 조합한 문장을 구성하는 (c)단계와, 상기 (c)단계에서 조합된 문장을 구성하는 감성어휘 각각의 긍정/부정 극성 가중치를 부여하는 (d)단계와, 상기 감성어휘의 긍정/부정 극성 가중치를 통해, 상기 감성어휘 중 적어도 일부를 조합한 문장의 긍정/부정 극성을 분석하는 (e)단계와, 상기 (e)단계의 분석 결과를 통해 패션 분야의 트렌드를 분석하는 (f)단계를 포함하는 것을 특징으로 한다.Korean Registered Patent Publication No. 1935109 relates to a method for analyzing word phrase unit sentiment analysis in the fashion field and a storage medium including the same. In the word phrase unit sentiment analysis method, step (a) of collecting unstructured text data for online services and storing it in the management server, and extracting a plurality of emotional vocabulary included in the fashion field from the unstructured text data Step (b), step (c) of constructing a sentence combining at least some of the emotional words, and assigning positive/negative polarity weights to each of the emotional words constituting the sentence combined in step (c) ( step d), step (e) of analyzing the positive/negative polarity of a sentence combining at least some of the emotional vocabulary through positive/negative polarity weights of the emotional vocabulary, and the analysis result of step (e) It is characterized in that it includes a step (f) of analyzing trends in the fashion field through.
한국공개특허공보 제2014-0078312호의 텍스트 기반 감성 분석 결과를 제공하기 위한 장치, 시스템 및 그 방법은 사용자로부터 감성을 분석하고자 하는 대상에 대한 키워드를 입력 받는 입력부, 입력 받은 상기 키워드에 대한 감성 분석을 서비스 서버에 요청하고 그 요청한 결과로 감성 분석 결과를 제공받는 제어부, 제공받은 상기 감성 분석 결과에 따라 상기 대상에 대한 속성을 디스플레이하고 디스플레이된 각 속성마다 속성값에 상응하는 텍스트를 디스플레이하는 표시부 및 제공받은 상기 감성 분석 결과를 저장하는 저장부를 포함하되, 상기 속성은 상기 감성의 대상에 대해 평가하거나 상기 감성을 표현하려는 구체적인 항목이고, 상기 속성값은 상기 속성을 평가하거나 상기 속성에 대한 감성을 나타내는 표현인 것을 특징으로 한다.Korean Patent Publication No. 2014-0078312 discloses an apparatus, system, and method for providing a text-based sentiment analysis result, which includes an input unit for receiving keywords for an object to be analyzed for sentiment from a user, and sentiment analysis for the received keywords. A control unit that makes a request to the service server and receives a sentiment analysis result as a result of the request; a display unit that displays attributes of the subject according to the received sentiment analysis result and displays text corresponding to the attribute value for each displayed attribute; and A storage unit for storing the received sentiment analysis result, wherein the property is a specific item to be evaluated for the subject of the emotion or to express the emotion, and the property value is an expression that evaluates the property or expresses the emotion for the property. It is characterized by being
한국공개특허공보 제2015-0022583호의 키워드를 추출하는 장치 및 방법은 사용자 단말로부터 상기 검색어를 수신하는 검색어 수신부, 상기 수신된 검색어를 포함하는 복수의 문서들을 외부 장치로부터 수집하는 문서 수집부, 상기 수집된 문서들로부터 상기 수집된 문서들에 포함된 명사들 중 기설정된 개수의 빈출 명사들을 추출하는 빈출 명사 추출부, 상기 빈출 명사들 및 최빈출 명사에 대하여 상기 수집된 문서들을 분석함으로써 상기 빈출 명사들 각각에 대한 가중치를 결정하는 가중치 결정부, 상기 결정된 가중치에 기초하여 상기 빈출 명사들 각각의 유효성을 판단하는 유효성 판단부, 및 상기 유효성 판단 결과 유효한 빈출 명사들을 상기 검색어에 대한 키워드로서 결정하는 키워드 추출부를 포함하는 것을 특징으로 한다.Korean Patent Publication No. 2015-0022583 discloses an apparatus and method for extracting keywords, including a search word reception unit that receives the search word from a user terminal, a document collection unit that collects a plurality of documents including the received search word from an external device, and the collection of documents. A frequent noun extracting unit extracting a predetermined number of frequent nouns from among nouns included in the collected documents from the collected documents, and analyzing the collected documents for the frequent nouns and the most frequent nouns. A weight determination unit that determines a weight for each, a validity determination unit that determines validity of each of the frequent nouns based on the determined weight, and keyword extraction that determines effective frequent nouns as keywords for the search word as a result of the validity determination. It is characterized by including wealth.
한국등록특허공보 제1042515호의 사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법은 검색어에 대한 해석결과를 이용하여 파악한 검색자의 의도에 맞는 편집기를 제공하고, 편집기를 통해 입력된 메타데이터들과 관련된 메타데이터를 가지는 컨텐츠를 검색한다. 이에 의해, 검색자가 입력한 정보로부터 검색자의 의도를 파악하고, 파악된 의도를 기초로 세부적인 메타데이터 입력을 유도하고, 입력된 메타데이터를 이용하여 검색을 수행할 수 있다.Korean Registered Patent Publication No. 1042515 provides an editor suitable for the searcher's intention based on the user's intention based on the user's intention analysis result and provides meta data related to the metadata entered through the editor. Search for content with data. Accordingly, it is possible to determine the searcher's intention from information input by the searcher, induce detailed metadata input based on the identified intention, and perform a search using the input metadata.
한국등록특허공보 제0886687호의 중국어 미등록어 자동 추출 방법 및 장치는 중국어 문장이 포함된 웹문서를 입력받으면, 입력된 웹문서의 html 태그를 제거하고, 웹문서 내의 문장별로 메타 태그와 일반 태그 처리 방식으로 분류하며, 형태소 분석을 진행하여 분석결과를 출력하고, 분석 결과를 이용하여 어근 중심의 미등록어를 추출하는 방식과, 단음절 토큰을 중심으로 미등록어를 추출하는 방식과, 4음절로 된 동사 미등록어를 추출하는 방식과, 단음절 토큰의 단어 가능 여부를 판단하여 단어 가능 미등록어를 추출하는 방식과, 메타 태그 정보에 포함된 단어를 이용하여 미등록어를 추출하는 방식 중 적어도 하나의 방식을 이용하여 미등록어를 추출하는 것을 특징으로 한다. 본 발명에 의하면, 중국어 미등록어 추출방식을 통하여 쉽고 빠르게 중국어 분석용 사전을 구축할 수 있으며, 특히 신조어, 미등록 용언에 대한 사전 보강은 실제 웹문서 번역시스템에 있어서 정확도를 크게 향상시킬 수 있는 것을 특징으로 한다.Korean Registered Patent Publication No. 0886687 automatically extracts Chinese unregistered words. When a web document containing Chinese sentences is input, the html tag of the input web document is removed, and meta tags and general tags are processed for each sentence in the web document. A method of extracting unregistered words centered on the root using the analysis result, a method of extracting unregistered words centered on single syllable tokens, and a method of extracting unregistered words centered on single syllable tokens, and unregistered verbs with four syllables. Using at least one of a method of extracting a word, a method of extracting a non-registered word capable of words by determining whether a word of a monosyllabic token is possible, and a method of extracting an unregistered word by using a word included in meta tag information It is characterized in that unregistered words are extracted. According to the present invention, it is possible to easily and quickly build a dictionary for Chinese analysis through an unregistered Chinese word extraction method, and in particular, dictionary reinforcement for new words and unregistered terms can greatly improve accuracy in an actual web document translation system. to be
종래의 기술은 특정 어휘를 추출하여 추출된 어휘를 분석하여 감성 결과를 도출하거나, 키워드를 설정하거나, 사용자의 의도를 추정하는 기술에 관한 것이다. 여기서의 추출되는 어휘는 표준어로 인정된 어휘이거나 대중들 사이에서 널리 쓰여 인터넷 사전 상에 등록된 어휘 정도에 불과하다. 따라서 현대의 급변하는 사회와 문화가 반영되어 확대 재생산되는 다양한 신조어를 추출하고 이를 분석하는데는 어려움이 있다.Conventional technology relates to a technique of extracting a specific vocabulary and analyzing the extracted vocabulary to derive a sentiment result, set a keyword, or estimate a user's intention. The vocabulary extracted here is only a vocabulary recognized as a standard language or a vocabulary widely used among the public and registered in the Internet dictionary. Therefore, it is difficult to extract and analyze various new words that are expanded and reproduced by reflecting the rapidly changing society and culture of today.
관련하여 한국등록특허공보 제2019756호는 신조어 자동 인식을 위한 언어 분석에 기반한 온라인 문맥 광고 지능화 장치 및 그 방법을 개시하고 있다. 다만, 제2019756호는 랜덤하게 수집된 문서들 사이에서 신조어를 검출하는 기술로 웹 상에 거의 무한한 정보들을 중에서 적절한 수집 대상을 설정하는 것은 현실적으로 매우 어렵다. 특히, 음식 명칭의 경우 사람들 저마다 다양한 표현으로 지칭하는 경우가 많고 음식의 레시피나 음식의 제조 지역, 음식의 조리법, 퓨전 요리 등에 따라서 매우 다양한 표현으로 해당 음식을 지칭하는 경우가 많으며 외래어로된 메뉴가 많아 표준화된 음식명 하나로 그룹핑될 수 있는 다양한 표현들을 수집하고 정리하는 것은 중요한 과제들 중 하나로 인식되고 있다.In this regard, Korean Registered Patent Publication No. 2019756 discloses an online contextual advertising intelligent device and method based on language analysis for automatic recognition of new words. However, No. 2019756 is a technology for detecting new words among randomly collected documents, and it is realistically very difficult to set an appropriate collection target among almost infinite information on the web. In particular, in the case of food names, each person often refers to the food in various expressions, and often refers to the food in a variety of expressions depending on the recipe of the food, the manufacturing region of the food, the recipe of the food, fusion cuisine, etc. It is recognized as one of the important tasks to collect and organize various expressions that can be grouped into one standardized food name.
본 발명은 텍스트 문장 내 명사의 동작이나 작용을 설명하고나 성질의 상태를 표현하는 용언을 이용하는 명사 추출 방법을 제공하고자 한다.An object of the present invention is to provide a noun extraction method using a term that describes the action or action of a noun in a text sentence or expresses a state of nature.
본 발명은 음식명 검색어와 연관된 용언을 활용하여 음식 명사를 검색하고 미등록된 음식 명사를 저장하고 활용할 수 있도록 하는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법과 이를 이용하여 음식 사전을 업데이트하는 방법 및 이를 위한 시스템을 제공하고자 한다.The present invention is a method for extracting food menu nouns using parts of speech such as verbs and adjectives to search for food nouns by using verbs associated with food name search words and to store and utilize unregistered food nouns, and to update a food dictionary using the same It is intended to provide a method and a system therefor.
실시예는, 메모리에 저장된 음식 메뉴 명사 추출 프로그램 코드가 제공하는 제어 명령에 따라 프로세서에 의해 수행되는 수신된 음식명 검색어를 포함하는 웹페이지를 검색하고, 검색된 웹페이지 내에서 음식명 검색어를 포함한 문장을 수집하는 단계; 수집된 음식명 검색어를 포함한 문장들에서 용언을 추출하는 단계; 추출된 용언을 검색어로 하여 웹페이지를 검색하고 검색된 웹페이지 내에서 용언을 포함한 문장을 수집하는 단계; 및 수집된 용언을 포함한 문장들에서 명사를 추출하는 단계;를 포함하는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법을 제공할 수 있다.The embodiment searches a web page including the received food name search word, which is executed by a processor according to a control command provided by a food menu noun extraction program code stored in a memory, and searches for a sentence including the food name search word in the searched web page. Collecting; extracting verbs from sentences including collected food name search words; searching for a web page using the extracted verb as a search term and collecting sentences including the verb in the searched web page; and extracting nouns from sentences including the collected verbs; a food menu noun extraction method using parts of speech such as verbs and adjectives may be provided.
다른 측면에서, 추출된 명사가 사전 데이터베이스 상의 등록 명사인지 여부를 판단하여, 상기 사전 데이터베이스에 등록되지 않은 미등록명사를 추출하여 표시하는 단계;를 더 포함하는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법을 제공할 수 있다.In another aspect, determining whether the extracted noun is a registered noun on the dictionary database, extracting and displaying unregistered nouns not registered in the dictionary database; food menu noun using parts of speech such as verbs and adjectives further comprising extraction methods can be provided.
또 다른 측면에서, 클라이언트 장치는 수신한 음식명 검색어를 서버로 전송하고, 상기 서버는 수신된 음식명 검색어를 포함하는 웹페이지를 검색하고, 검색된 웹페이지 내에서 음식명 검색어를 포함한 문장을 수집하고, 수집된 음식명 검색어를 포함한 문장들에서 용언을 추출하고, 추출된 용언을 검색어로 하여 웹페이지를 검색하고 검색된 웹페이지 내에서 용언을 포함한 문장을 수집하며, 수집된 용언을 포함한 문장들에서 명사를 추출하는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템을 제공할 수 있다.In another aspect, the client device transmits the received food name search term to the server, the server searches for a web page including the received food name search term, collects sentences including the food name search term in the searched web page, and , Extract verbs from sentences including the collected food name search terms, search web pages using the extracted verbs as search terms, collect sentences including the verbs from the searched webpages, and search for nouns from the sentences including the collected verbs. It is possible to provide a system for extracting food menu nouns using parts of speech such as verbs and adjectives.
다른 측면에서, 상기 서버는 기 등록된 관심 모니터링 사이트 목록 정보에 해당하는 사이트 상에서 상기 음식명 검색어를 포함하는 웹페이지를 검색하는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템을 제공할 수 있다.In another aspect, the server may provide a system for extracting food menu nouns using parts of speech such as verbs and adjectives for searching a web page including the food name search term on a site corresponding to pre-registered interest monitoring site list information. there is.
다른 측면에서, 상기 서버는 상기 음식명 검색어에 기초하여 이미 검색된 웹페이지와 동일한 웹페이지와 중복되는 웹페이지를 제외한 다른 웹페이지 내에서 용언을 포함한 문장을 수집하는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템을 제공할 수 있다.In another aspect, the server collects sentences including verbs in other web pages except for web pages that overlap with the same web page as the web page already searched based on the food name search term, and the food using parts of speech such as verbs and adjectives. A system for extracting menu nouns can be provided.
다른 측면에서, 상기 서버는 추출된 명사들 각각을 미리 저장된 사전 데이터베이스 상에서 검색하여, 상기 추출된 명사들 각각을 상기 미리 저장된 사전 데이터베이스에 등록된 등록 명사 및 상기 사전 데이터베이스에 등록되지 않은 미등록 명사로 분류하는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템을 제공할 수 있다.In another aspect, the server searches each of the extracted nouns on a pre-stored dictionary database, and classifies each of the extracted nouns into registered nouns registered in the pre-stored dictionary database and unregistered nouns not registered in the dictionary database. It is possible to provide a system for extracting food menu nouns using parts of speech such as verbs and adjectives.
다른 측면에서, 상기 서버는 상기 사전 데이터베이스 상에서 상기 등록 명사의 의미 정보를 분석하여 상기 등록 명사들 중에서 등록 음식명 명사를 추출하는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템을 제공할 수 있다.In another aspect, the server may provide a system for extracting food menu nouns using parts of speech such as verbs and adjectives for extracting registered food nouns from among the registered nouns by analyzing semantic information of the registered nouns on the dictionary database. there is.
다른 측면에서, 상기 서버는 상기 등록 음식명 명사와 상기 미등록 음식명 명사 상호간의 음절간의 동일성 여부를 판단하여 상기 등록 음식명 명사와 상기 미등록 음식명 명사 상호간의 유사도를 계산하고, 상기 서버는 상기 미등록 명사들 및 상기 등록 음식명 명사 각각의 추출 빈도 정보를 계산하는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템을 제공할 수 있다.In another aspect, the server calculates a degree of similarity between the registered food noun and the unregistered food noun by determining whether syllables between the registered food noun and the unregistered food noun are identical, and the server calculates a degree of similarity between the registered food noun and the unregistered food noun. It is possible to provide a system for extracting food menu nouns using parts of speech such as nouns and verbs and adjectives that calculate extraction frequency information of each of the nouns and the registered food name nouns.
다른 측면에서, 상기 클라이언트 장치는 상기 미등록 명사들을 수신하고, 상기 유사도 또는 상기 추출 빈도 정보에 기초하여 상기 미등록 명사들을 정렬하여 표시하고, 상기 클라이언트 장치는 상기 등록 음식명 명사를 수신하고, 상기 등록 음식명 명사의 검출 빈도수에 기초하여 상기 등록 음식명 명사를 정렬하여 표시하는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템을 제공할 수 있다.In another aspect, the client device receives the unregistered nouns, sorts and displays the unregistered nouns based on the similarity or the extraction frequency information, the client device receives the registered food noun, and the registered food It is possible to provide a system for extracting food menu nouns using parts of speech such as verbs and adjectives in which the registered food nouns are sorted and displayed based on the detection frequency of the nouns.
다른 측면에서, 상기 클라이언트 장치는 표시된 미등록 명사들 중 어느 하나의 선택에 응답하여 상기 서버로부터 선택된 미등록 명사를 포함한 문장 정보를 수신하여 표시하고, 상기 문장 정보에는 상기 선택된 미등록 명사가 하이라이트 되어 표시되는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템을 제공할 수 있다.In another aspect, the client device receives and displays sentence information including the selected unregistered noun from the server in response to selection of any one of the displayed unregistered nouns, and in the sentence information, the selected unregistered noun is highlighted and displayed as a verb. A system for extracting food menu nouns using parts of speech such as and adjectives can be provided.
다른 측면에서, 상기 클라이언트 장치는 표시된 문장에서 드레그된 텍스트 정보인 등록용 텍스트 정보를 상기 선택된 미등록 명사 정보의 의미 정보로서 사용자용 사전 데이터베이스에 등록하는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템을 제공할 수 있다.On the other hand, the client device registers text information for registration, which is text information dragged from a displayed sentence, in a user dictionary database as semantic information of the selected unregistered noun information Extracting food menu nouns using parts of speech such as verbs and adjectives system can be provided.
다른 측면에서, 상기 클라이언트 장치는 표시된 문장에서 드레그된 텍스트 정보인 등록용 텍스트 정보 및 상기 선택된 미등록 명사 정보를 상기 서버로 전송하고, 상기 서버는 상기 선택된 미등록 명사 정보에 매칭된 등록용 텍스트 정보를 복수의 클라이언트 장치들로부터 수집하고, 기 설정치 이상의 유사도를 나타내는 등록용 텍스트 정보들의 개수를 산출하여 기설정치 이상이면 상기 등록용 텍스트 정보 중 어느 하나의 텍스트 정보를 상기 미등록 명사 정보의 의미 정보로서 상기 사전 데이터베이스에 등록하는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템을 제공할 수 있다.In another aspect, the client device transmits text information for registration, which is text information dragged from a displayed sentence, and the selected unregistered noun information to the server, and the server transmits a plurality of text information for registration matched to the selected unregistered noun information. is collected from client devices, calculates the number of pieces of text information for registration showing a degree of similarity equal to or greater than a preset value, and if the number is equal to or greater than the preset value, any one of the text information for registration is used as semantic information of the non-registered noun information in the dictionary database. It is possible to provide a system for extracting food menu nouns using parts of speech such as verbs and adjectives registered in .
본 발명에 따른 실시예는 문장 내 명사의 특성을 표현하는 동사와 형용사를 이용하여 보다 방대한 음식 명사 사전을 구축하는 방법을 제공할 수 있다.Embodiments according to the present invention may provide a method of constructing a more extensive food noun dictionary using verbs and adjectives expressing characteristics of nouns in sentences.
또한, 실시예는 음식 이름은 각기 다르지만 음식을 표현하는 동사와 형용사는 같은 표현을 사용하는 점을 이용하여 음식명 검색어로부터 추출된 용언이 사용된 다양한 음식명 명사를 추출할 수 있는 음식 메뉴 명사 추출 방법 및 이를 위한 시스템을 제공할 수 있다.In addition, the embodiment extracts food menu nouns capable of extracting various food nouns using verbs extracted from food name search words by using the fact that food names are different but verbs and adjectives expressing food use the same expression. A method and a system therefor can be provided.
또한, 실시예는 사전 데이터베이스 등록되지 않은 미등록 명사를 추출하여 최근 트렌드에 따라 다양하게 표현되는 명사를 광고용 태그로 활용할 수 있도록 하는 음식 메뉴 명사 추출 방법 및 이를 위한 시스템을 제공할 수 있다.In addition, the embodiment may provide a food menu noun extraction method and system for extracting unregistered nouns not registered in a dictionary database and utilizing nouns expressed in various ways according to recent trends as advertisement tags.
또한, 실시예는 사전 데이터베이스 등록되지 않은 미등록 명사를 추출하여 최근 트렌드에 따라 다양하게 표현되는 명사에 대한 의미 정보를 사전 데이터베이스에 업데이트할 수 있도록 하는 음식 메뉴 명사 추출 방법 및 이를 위한 시스템을 제공할 수 있다.In addition, the embodiment can provide a food menu noun extraction method and system for extracting unregistered nouns that are not registered in the dictionary database and updating semantic information about nouns expressed in various ways according to recent trends in the dictionary database. there is.
또한, 실시예는 특정 용언에 의해 수식되는 음식명의 명사에 대한 정보를 확인할 수 있도록 하는 음식 메뉴 명사 추출 방법 및 이를 위한 시스템을 제공할 수 있다.In addition, the embodiment may provide a method for extracting food menu nouns and a system therefor, which enables checking information on nouns of food names modified by specific terms.
도 1은 본 개시내용의 실시형태들에 따른, 단독으로 사용될 수 있거나 혹은 네트워크화된 구성으로 사용될 수 있는 다양한 컴퓨팅 장치(computing device)들을 도시하는 컴퓨터 시스템의 개략적 도면을 제시한다.
도 2는 일 실시예에 따른 클라이언트 장치 및 서버의 내부 구성을 설명하기 위한 것이다.
도 3a 내지 도 3c는 본 발명의 다양한 실시예에 따른 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법에 대한 흐름도이다.
도 4 내지 도 7은 음식 메뉴 명사 추출 프로그램의 실행에 따라 클라이언트 장치에서 표시되는 유저 인터페이스를 개략적으로 나타낸 것이다.1 presents a schematic diagram of a computer system showing various computing devices that may be used alone or in a networked configuration, in accordance with embodiments of the present disclosure.
2 is for explaining internal configurations of a client device and a server according to an exemplary embodiment.
3A to 3C are flowcharts of a food menu noun extraction method using parts of speech such as verbs and adjectives according to various embodiments of the present invention.
4 to 7 schematically illustrate a user interface displayed on a client device according to execution of a food menu noun extraction program.
본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 본 발명의 효과 및 특징, 그리고 그것들을 달성하는 방법은 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 다양한 형태로 구현될 수 있다. 이하의 실시예에서, 제1, 제2 등의 용어는 한정적인 의미가 아니라 하나의 구성 요소를 다른 구성 요소와 구별하는 목적으로 사용되었다. 또한, 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 또한, 포함하다 또는 가지다 등의 용어는 명세서상에 기재된 특징, 또는 구성요소가 존재함을 의미하는 것이고, 하나 이상의 다른 특징들 또는 구성요소가 부가될 가능성을 미리 배제하는 것은 아니다. 또한, 도면에서는 설명의 편의를 위하여 구성 요소들이 그 크기가 과장 또는 축소될 수 있다. 예컨대, 도면에서 나타난 각 구성의 크기 및 두께는 설명의 편의를 위해 임의로 나타내었으므로, 본 발명이 반드시 도시된 바에 한정되지 않는다.Since the present invention can apply various transformations and have various embodiments, specific embodiments will be illustrated in the drawings and described in detail in the detailed description. Effects and features of the present invention, and methods for achieving them will become clear with reference to the embodiments described later in detail together with the drawings. However, the present invention is not limited to the embodiments disclosed below and may be implemented in various forms. In the following embodiments, terms such as first and second are used for the purpose of distinguishing one component from another component without limiting meaning. Also, expressions in the singular number include plural expressions unless the context clearly dictates otherwise. In addition, terms such as include or have mean that features or elements described in the specification exist, and do not preclude the possibility that one or more other features or elements may be added. In addition, in the drawings, the size of components may be exaggerated or reduced for convenience of description. For example, since the size and thickness of each component shown in the drawings are arbitrarily shown for convenience of description, the present invention is not necessarily limited to the illustrated bar.
이하, 첨부된 도면을 참조하여 본 발명의 실시예들을 상세히 설명하기로 하며, 도면을 참조하여 설명할 때 동일하거나 대응하는 구성 요소는 동일한 도면부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings, and when describing with reference to the drawings, the same or corresponding components are assigned the same reference numerals, and overlapping descriptions thereof will be omitted. .
도 1은 본 개시내용의 실시형태들에 따른, 단독으로 사용될 수 있거나 혹은 네트워크화된 구성으로 사용될 수 있는 다양한 컴퓨팅 장치(computing device)들을 도시하는 컴퓨터 시스템의 개략적 도면을 제시한다. 예를 들어, 본 도면은 네트워크(300)를 통해 통신하는 클라이언트 장치(100)와 서버(200)를 갖는 컴퓨터 시스템(10)을 예시한다. 1 presents a schematic diagram of a computer system showing various computing devices that may be used alone or in a networked configuration, in accordance with embodiments of the present disclosure. For example, this figure illustrates a computer system 10 having a
클라이언트 장치(100)는 이동형 단말(101) 이거나 고정형 단말(102)일 수 있다. 예를 들어, 클라이언트 장치(100)는 스마트폰(smart phone), 휴대폰, 네비게이션, 컴퓨터, 노트북, 디지털방송용 단말, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 태블릿 PC 등이 있다.The
서버(200)는 적어도 하나의 클라이언트 장치(100)와 네트워크(300)를 통해 통신하여 명령, 코드, 파일, 컨텐츠, 서비스 등을 제공하는 컴퓨팅 장치 또는 복수의 컴퓨팅 장치들로 구현될 수 있다.The
통신 방식은 제한되지 않으며, 네트워크(300)가 포함할 수 있는 통신망(일례로, 이동통신망, 유선 인터넷, 무선 인터넷, 방송망)을 활용하는 통신 방식뿐만 아니라 기기들간의 근거리 무선 통신 역시 포함될 수 있다. 예를 들어, 네트워크(300)는, PAN(personal area network), LAN(local area network), CAN(campus area network), MAN(metropolitan area network), WAN(wide area network), BBN(broadband network), 인터넷 등의 네트워크 중 하나 이상의 임의의 네트워크를 포함할 수 있다. 또한, 네트워크(300)는 버스 네트워크, 스타 네트워크, 링 네트워크, 메쉬 네트워크, 스타-버스 네트워크, 트리 또는 계층적(hierarchical) 네트워크 등을 포함하는 네트워크 토폴로지 중 임의의 하나 이상을 포함할 수 있으나, 이에 제한되지 않는다.The communication method is not limited, and short-distance wireless communication between devices as well as a communication method utilizing a communication network (eg, a mobile communication network, a wired Internet, a wireless Internet, and a broadcasting network) that the
클라이언트 장치(100)는 검색어를 사용하여 검색 동작을 개시시키기 위해 사용자로 하여금 검색어를 제출하도록 할 수 있다. 서버(200)는 검색어를 수신하고, 검색어를 사용하여 검색 동작을 수행한다. 또한, 서버(200)는 검색 결과를 클라이언트 장치(100)로 제공하는 동작을 수행할 수 있다. 또한, 서버(200)는 클라이언트 장치(100)로 제공한 검색 결과 정보에 기반하여 클라이언트 장치(100)로부터 수신한 추가적인 정보의 요청에 응답하여 클라이언트 장치(100)로 요청한 정보를 전송할 수도 있다.The
일례로, 서버(160)는 네트워크(300)를 통해 접속한 클라이언트 장치(100)로 음식 메뉴 명사 추출을 위한 어플리케이션의 설치를 위한 파일을 제공할 수 있다. 이 경우 클라이언트 장치(100)는 서버(200)로부터 제공된 파일을 이용하여 음식 메뉴 명사 추출을 위한 어플리케이션을 설치할 수 있다. 또한, 클라이언트 장치(100)가 포함하는 운영체제(Operating System, OS) 및 적어도 하나의 프로그램(일례로 브라우저나 상기 설치된 어플리케이션)의 제어에 따라 서버(200)에 접속하여 서버(200)가 제공하는 서비스나 컨텐츠를 제공받을 수 있다. 예를 들어, 클라이언트 장치(100)가 어플리케이션의 제어에 따라 네트워크(300)를 통해 서비스 요청 메시지를 서버(200)로 전송하면, 서버(200)는 서비스 요청 메시지에 대응하는 코드를 클라이언트 장치(100)로 전송할 수 있고, 클라이언트 장치(100)는 어플리케이션의 제어에 따라 코드에 따른 화면을 구성하여 표시함으로써 사용자에게 컨텐츠를 제공할 수 있다.For example, the server 160 may provide a file for installing an application for extracting food menu nouns to the
도 2는 일 실시예에 따른 클라이언트 장치 및 서버의 내부 구성을 설명하기 위한 것이다.2 is for explaining internal configurations of a client device and a server according to an exemplary embodiment.
도 2에서는 하나의 클라이언트 장치(100) 및 하나의 서버(200)에 대한 예로서 이들의 내부 구성을 설명한다. 또한, 클라이언트 장치(100) 및 서버(200)는 도 1에서 설명한 네트워크 환경에 포함될 수 있는 또 다른 클라이언트 장치나 또 다른 서버들에도 동일한 또는 유사한 내부 구성요소들이 적용될 수 있다.2 shows an example of one
클라이언트 장치(100)와 서버(200)는 각각 적어도 하나의 메모리(110, 210), 적어도 하나의 프로세서(120, 220) 및 통신 모듈(130, 230) 그리고 입출력 인터페이스(140, 240)를 포함할 수 있다. 메모리(110, 210)는 컴퓨터에서 판독 가능한 기록 매체로서, RAM(random access memory), ROM(read only memory) 및 디스크 드라이브와 같은 비소멸성 대용량 기록장치(permanent mass storage device)를 포함할 수 있다. 또한, 메모리(110, 210)에는 운영체제와 적어도 하나의 프로그램 코드(일례로 클라이언트 장치(100)에 설치되어 구동되는 브라우저나 상술한 어플리케이션 등을 위한 코드)가 저장될 수 있다. 이러한 소프트웨어 구성요소들은 드라이브 메커니즘(drive mechanism)을 이용하여 메모리(110, 210)와는 별도의 컴퓨터에서 판독 가능한 기록 매체로부터 로딩될 수 있다. 이러한 별도의 컴퓨터에서 판독 가능한 기록 매체는 플로피 드라이브, 디스크, 테이프, DVD/CD-ROM 드라이브, 메모리 카드 등의 컴퓨터에서 판독 가능한 기록 매체를 포함할 수 있다. 다른 실시예에서 소프트웨어 구성요소들은 컴퓨터에서 판독 가능한 기록 매체가 아닌 통신 모듈(130, 230)을 통해 메모리(110, 210)에 로딩될 수도 있다. 예를 들어, 적어도 하나의 프로그램은 개발자들 또는 어플리케이션의 설치 파일을 배포하는 파일 배포 시스템(일례로 상술한 서버(200))이 네트워크(300)를 통해 제공하는 파일들에 의해 설치되는 프로그램(일례로 상술한 어플리케이션)에 기반하여 메모리(110, 210)에 로딩될 수 있다. 프로세서(120, 220)는 기본적인 산술, 로직 및 입출력 연산을 수행함으로써, 컴퓨터 프로그램의 명령을 처리하도록 구성될 수 있다. 명령은 메모리(110, 210) 또는 통신 모듈(130, 230)에 의해 프로세서(120, 220)로 제공될수 있다. 예를 들어 프로세서(120, 220)는 메모리(110, 210)와 같은 기록 장치에 저장된 프로그램 코드에 따라 수신되는 명령을 실행하도록 구성될 수 있다. 통신 모듈(130, 230)은 네트워크(300)를 통해 클라이어트 장치(100)와 서버(200)가 서로 통신하기 위한 기능을 제공할 수 있으며, 다른 클라이언트 장치 또는 다른 서버와 통신하기 위한 기능을 제공할 수 있다. 일례로, 클라이언트 장치(100)의 프로세서(120)가 메모리(110)와 같은 기록 장치에 저장된 프로그램 코드에 따라 생성한 요청이 통신 모듈(130)의 제어에 따라 네트워크(300)를 통해 서버(200)로 전달될 수 있다. 역으로, 서버(200)의 프로세서(220)의 제어에 따라 제공되는 제어 신호나 명령, 컨텐츠, 파일 등이 통신 모듈(230)과 네트워크(300)를 거쳐 클라이언트 장치(100)의 통신모듈(130)을 통해 클라이언트 장치(100)로 수신될 수 있다. 예를 들어 통신 모듈(230)을 통해 수신된 서버(200)의 제어 신호나 명령 등은 프로세서(220)나 메모리(210)로 전달될 수 있고, 컨텐츠나 파일 등은 클라이언트 장치(100)가 더 포함할 수 있는 저장 매체로 저장될 수 있다.The
입출력 인터페이스(140, 240)는 입출력 장치(141, 241)와의 인터페이스를 위한 수단일 수 있다. 예를 들어, 입력 장치는 키보드 또는 마우스 등의 장치를, 그리고 출력 장치는 어플리케이션의 통신 세션을 표시하기 위한 디스플레이와 같은 장치를 포함할 수 있다. 다른 예로 입출력 인터페이스(140, 240)는 터치스크린과 같이 입력과 출력을 위한 기능이 하나로 통합된 장치와의 인터페이스를 위한 수단일 수도 있다. 보다 구체적인 예로, 클라이언트 장치(100)의 프로세서(120)는 메모리(110)에 로딩된 컴퓨터 프로그램의 명령을 처리함에 있어서 서버(200)나 클라이언트 장치(100)가 제공하는 데이터를 이용하여 구성되는 서비스 화면이나 컨텐츠가 입출력 인터페이스(140)를 통해 디스플레이에 표시될 수 있다.The input/output interfaces 140 and 240 may be means for interface with the input/output devices 141 and 241 . For example, the input device may include a device such as a keyboard or mouse, and the output device may include a device such as a display for displaying a communication session of an application. As another example, the input/output interfaces 140 and 240 may be means for interface with a device in which functions for input and output are integrated into one, such as a touch screen. As a more specific example, the processor 120 of the
또한, 다른 실시예들에서 클라이언트 장치(100) 및 서버(200)는 도 2의 구성요소들보다 더 많은 구성요소들을 포함할 수도 있다. 그러나, 대부분의 종래기술적 구성요소들을 명확하게 도시할 필요성은 없다. 예를 들어, 클라이언트 장치(100)는 상술한 입출력 장치(141) 중 적어도 일부를 포함하도록 구현되거나 또는 트랜시버(transceiver), GPS(Global Positioning System) 모듈, 카메라, 각종 센서, 데이터베이스 등과 같은 다른 구성요소들을 더 포함할 수도 있다.Also, in other embodiments, the
도 3a 내지 도 3c는 본 발명의 다양한 실시예에 따른 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법에 대한 흐름도이다.3A to 3C are flowcharts of a food menu noun extraction method using parts of speech such as verbs and adjectives according to various embodiments of the present invention.
도 3a를 참조하면, 본 발명의 실시예에 따른 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법(S100)은 음식명을 이용하여 검색을 진행하는 단계(S110), 음식명을 포함한 문장을 수집하는 단계(S120), 음식명이 포함된 문장 내에서 용언을 추출하는 단계(S130), 추출된 용언을 이용하여 검색을 진행하는 단계(S140), 용언을 포함한 문장을 수집하는 단계(S150), 용언이 포함된 문장 내에서 음식명에 해당하는 명사를 추출하는 단계(S160) 및 추출된 음식명을 기 등록된 음식명과 비교하여 저장하는 단계(S170)를 포함할 수 있다.Referring to FIG. 3A , in the food menu noun extraction method (S100) using parts of speech such as verbs and adjectives according to an embodiment of the present invention, a search is performed using the food name (S110), and a sentence including the food name is searched. Collecting (S120), extracting verbs from sentences including food names (S130), performing a search using the extracted verbs (S140), collecting sentences including verbs (S150), It may include extracting a noun corresponding to the food name from the sentence including the verb (S160) and comparing the extracted food name with a pre-registered food name and storing it (S170).
도 3b를 참조하면, 다른 실시에에 따른 품사를 이용한 음식 메뉴 명사 추출 방법(S200)은 음식명을 이용하여 검색을 진행하는 단계(S210), 음식명을 포함한 문장을 수집하는 단계(S220), 음식명이 포함된 문장 내에서 용언을 추출하는 단계(S230), 동일한 용언의 검출 빈도수가 기 설정치 이상의 용언을 이용하여 검색을 진행하는 단계(S240), 용언을 포함한 문장을 수집하는 단계(S250), 용언이 포함된 문장 내에서 음식명에 해당하는 명사를 추출하는 단계(S260) 및 추출된 음식명을 기 등록된 음식명과 비교하여 저장하는 단계(S270)를 포함할 수 있다.Referring to FIG. 3B , a method of extracting food menu nouns using parts of speech according to another embodiment (S200) includes performing a search using food names (S210), collecting sentences including food names (S220), Extracting verbs from sentences including food names (S230), performing a search by using verbs whose frequency of detection of the same verb is higher than a preset value (S240), collecting sentences including verbs (S250), It may include extracting a noun corresponding to the food name from the sentence including the verb (S260) and comparing the extracted food name with a pre-registered food name and storing it (S270).
도 3c를 참조하면, 다른 실시예에 따른 품사를 이용한 음식 메뉴 명사 추출 방법(S300)은 음식명을 이용하여 검색을 진행하는 단계(S310), 음식명을 포함한 문장을 수집하는 단계(S320), 음식명이 포함된 문장 내에서 용언을 추출하는 단계(S330), 추출된 용언을 이용하여 검색을 진행하는 단계(S340), 용언을 포함한 문장을 수집하는 단계(S350), 용언이 포함된 문장 내에서 명사를 추출하는 단계(S360), 추출된 명사가 사전 데이터베이스의 등록 명사인지 판단하는 단계(S370), 추출된 명사가 사전 데이터베이스 상의 등록 명사가 아닌 경우 해당 명사를 미등록명사로 분류하는 단계(S371), 추출된 명사가 사전 데이터베이스의 등록 명사인 경우에는 해당 명사가 음식명에 해당하는지 여부를 판단하는 단계(S380), 등록 명사가 음식명에 해당하지 않는 경우 비음식명 명사로 분류하는 단계(S381) 및 등록 명사가 음식명에 해당하는 경우 등록 명사로 분류하는 단계(S390)를 포함할 수 있다.Referring to FIG. 3C , a method for extracting food menu nouns using parts of speech (S300) according to another embodiment includes performing a search using food names (S310), collecting sentences including food names (S320), Extracting verbs from sentences including food names (S330), performing a search using extracted verbs (S340), collecting sentences including verbs (S350), Extracting the noun (S360), determining whether the extracted noun is a registered noun in the dictionary database (S370), classifying the noun as an unregistered noun if the extracted noun is not a registered noun in the dictionary database (S371) , If the extracted noun is a registered noun in the dictionary database, determining whether the corresponding noun corresponds to a food name (S380), classifying the registered noun as a non-food noun if it does not correspond to a food name (S381). ) and classifying the registered noun as a registered noun (S390) if the registered noun corresponds to the food name.
이하, 본 발명의 실시예에 따른 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법(S100, S200, S300)의 각 단계를 구체적으로 설명한다.Hereinafter, each step of the food menu noun extraction method (S100, S200, S300) using parts of speech such as verbs and adjectives according to an embodiment of the present invention will be described in detail.
클라이언트 장치(100)는 메모리(110)에 저장된 클라이언트측 음식 메뉴 명사 추출 프로그램 코드가 제공하는 제어 명령에 따라 프로세서(120)에 의해 수행되는 다음의 기능을 제공할 수 있다.The
클라이언트 장치(100)는 사용자로부터 입력된 음식명 검색어 정보를 수신할 수 있다.The
클라이언트 장치(100)는 수신한 음식명 검색어 정보를 서버(200)로 전송할 수 있다.The
다양한 실시예에서, 사용자는 서버(200)의 입출력 장치(241)를 통해 서버(200)로 음식명 검색어 정보를 입력할 수도 있다.In various embodiments, a user may input food name search word information to the
서버(200)의 프로세서(220)는 메모리(210) 상에 서버측 음식 메뉴 명사 추출 프로그램 코드를 로딩하고 서버측 음식 메뉴 명사 추출 프로그램을 실행할 수 있다.The processor 220 of the
서버(200)는 서버측 음식 메뉴 명사 추출 프로그램 코드가 제공하는 제어 명령에 따라 프로세서(220)에 의해 수행되는 검색 기능 및 용언 추출 기능 및 명사 추출 기능 및 검출 단어의 비교 기능, 정보의 저장/전송 기능 등을 제공할 수 있다.The
서버(200)의 크롤러는 수신한 음식명 검색어 정보에 기초하여 네트워크(300)에 연결된 웹서버를 순회하면서 음식명 검색어를 포함하는 웹 페이지를 검색하고 검색된 웹 페이지 내에서 적어도 하나의 문장을 수집할 수 있다.The crawler of the
다양한 실시예에 따라, 서버(200)는 기 등록된 관심 모니터링 사이트 목록 정보에 기초하여 웹 페이지를 수집할 수 있다. 상세하게, 관심 모니터링 사이트 목록 정보는 관심 사이트 주소, 관심 언론사 사이트, 관심 URL, 블로그 주소, SNS 주소 등의 정보를 포함할 수 있다.According to various embodiments, the
일부 실시예에서, 서버(200)는 관심 모니터링 사이트 목록 정보를 클라이언트 장치(100)로부터 수신할 수 있다.In some embodiments, the
일부 실시예에서, 관심 모니터링 사이트 목록은 수정, 삭제, 추가될 수 있다.In some embodiments, the list of monitoring sites of interest may be modified, deleted, or added.
서버(200)는 관심 모니터링 사이트 목록 상의 관심 사이트를 통해서 음식명 검색어를 포함하는 웹 페이지를 검색하고 웹 페이지 내에서 음식명 검색어를 포함하는 적어도 하나의 문장을 수집할 수 있다.The
서버(200)는 검색된 웹 페이지를 파싱하여 웹 페이지에 포함된 복수의 문장들을 식별할 수 있다. 일부 실시예에서, 서버(200)는 웹 페이지 상에서 종결어미를 식별하고, 식별된 종결어미를 기준으로 하여 웹 페이지 내에서 복수의 문장들을 식별할 수 있다. 다만, 이에 제한되는 것은 아니고 웹 페이지 내에 포함된 마침표, 물음표, 쉼표 등과 같은 부호를 식별하고 식별된 부호를 기준으로 웹 페이지에 포함된 각 문장들을 식별할 수 있다. The
서버(200)는 식별된 문장들 중에서 음식명 검색어를 포함하는 문장을 추출할 수 있다. 서버(200)는 검색된 복수의 웹페이지 상에서 복수의 문장을 추출하여 수집할 수 있다.The
서버(200)는 수집된 문장들 각각에서 용언을 추출할 수 있다. 용언은 대상의 동작과 상태의 성질을 나타내며 문장에서 서술하는 기능을 수행하는 단어들의 큰 부류로 하위 품사로는 동사와 형용사가 있다. 동사는 사람이나 사물의 움직임이나 과정 등을 나타내는 말이며 형용사는 사람이나 사물의 상태나 성질을 나타내는 단어를 말한다. 다양한 실시예에 따라, 서버(200)는 형태소 분석 기법 및/또는 자연어 처리 기법 등에 기초하여 수집된 문장들 각각에서 용언을 추출할 수 있으나, 용언을 추출하는 방법은 전술한 기법에 한정하는 것은 아니다. 또한, 여기서의 용언은 형용사와 동사를 의미한다.The
서버(200)는 수집된 문장들 각각에서 용언을 추출함으로써 음식 메뉴를 수식할 수 있는 용언을 추출할 수 있다.The
다양한 실시예에서, 서버(200)는 추출된 용언 정보를 클라이언트 장치(100)로 전송할 수 있다. 일부 실시예에서, 서버(200)는 추출된 형용사 정보를 클라이언트 장치(100)로 전송할 수 있다. 또한, 서버(200)는 동일한 용언의 추출 빈도를 계산하거나, 동일한 형용사의 추출 빈도를 계산하고 그 결과인 용언이나 형용사의 추출 빈도 정보를 클라이언트 장치(100)로 전송할 수도 있다.In various embodiments, the
서버(200)는 추출된 용언을 검색어로 하여 네트워크(300)를 통해 웹 상에서 용언 검색어를 포함하는 웹 페이지를 검색하고 검색된 웹 페이지 내에서 적어도 하나의 문장을 수집할 수 있다. 문장을 수집하는 기법은 전술한 기법과 동일할 수 있다.The
다양한 실시예에서, 서버(200)는 동일한 용언의 검출 빈도수를 계산할 수 있다. 서버(200)는 검출 빈도수가 기 설정치 이상인 용언들을 추출할 수 있다. 그리고, 서버(200)는 검출 빈도수가 기 설정치 이상으로 추출된 용언을 검색어로 하여 용언 검색어를 포함하는 웹 페이지를 검색하고 검색된 웹 페이지 내에서 용언을 포함하는 적어도 하나의 문장을 수집할 수도 있다.In various embodiments,
다양한 실시예에서, 서버(200)는 검색된 웹 페이지들 중에서 음식명 검색어에 기초하여 이미 검색된 웹페이지와 동일한 웹페이지를 제외시키는 중복제거 과정을 수행할 수 있다. 따라서, 사용자가 입력한 음식명 검색어가 다시 검색되는 사용자에게 제공되는 정보로 활용되는 문제를 최소화할 수 있다.In various embodiments, the
서버(200)는 수집된 문장에서 명사를 추출할 수 있다.The
서버(200)는 동일한 명사의 추출 빈도수를 계산할 수 있다.The
다양한 실시예에서, 서버(200)는 수집된 문장에서 검색어였던 용언에 의해 수식되는 명사를 추출할 수 있다. 따라서, 서버(200)는 음식명에 해당하는 명사를 추출할 수 있으나 추출된 명사에는 음식명과 관련이 없는 명사가 포함될 수도 있다.In various embodiments, the
서버(200)는 추출된 명사들 각각을 미리 저장된 사전 데이터베이스 상에서 검색할 수 있다. 서버(200)는 추출된 명사들 중에서 사전 데이터베이스 상에서 검색이 가능한 명사인 경우 해당 명사의 의미 정보를 사전 데이터베이스 상에서 파악하여 검색된 명사가 음식 이름에 관한 것인지, 비음식명에 해당하는 것인지를 판단할 수 있다. 비음식명은 대명사, 장소 명칭 등 음식의 이름과는 관련이 없는 명사를 의미할 수 있다. 또한, 서버(200)는 사전 데이터베이스 상에서 검색되지 않는 명사들을 미등록 명사로 분류할 수 있다.The
다양한 실시예에서, 서버(200)는 추출된 명사들 각각이 속한 문장에서의 명사 좌우의 문맥의 의미와 용언을 분석하여 명사가 음식명에 해당하는지 여부에 관한 추정치를 계산할 수 있다. 그리고, 서버(200)는 추정치가 기 설정치 이상인 명사들을 만을 검출하고, 검출된 명사들 각각에 대해서 사전 데이터베이스 상에서 검색이 되는지 여부를 판단하여 검출된 명사들을 등록 명사와 미등록 명사로 분류할 수 있다. 서버(200)는 사전 데이터베이스 상에서의 등록 명사의 의미 정보를 파악하여 등록 명사가 음식명에 해당하는지 여부를 확정할 수 있다.In various embodiments, the
서버(200)는 등록 명사들 중에서 음식명에 해당하는 등록 음식명 명사를 추출할 수 있다.The
서버(200)는 미등록 명사들과 등록 음식명 명사의 음절간의 동일성 여부를 판단하여 등록 음식명 명사와 미등록 명사들 사이의 유사도를 계산할 수 있다.The
서버(200)는 미등록 명사들을 클라이언트 장치(100)로 전송할 수 있다. 또한, 서버(200)는 미등록 명사들의 추출 빈도 정보를 클라이언트 장치(100)로 전송할 수 있다. 또한, 서버(200)는 미등록 명사들과 등록 음식명 명사와의 유사도 정보를 클라이언트 장치(100)로 전송할 수 있다.The
도 4 내지 도 7은 음식 메뉴 명사 추출 프로그램의 실행에 따라 클라이언트 장치에서 표시되는 유저 인터페이스를 개략적으로 나타낸 것이다.4 to 7 schematically illustrate a user interface displayed on a client device according to execution of a food menu noun extraction program.
도 4를 참조하면, 사용자는 클라이언트 장치(100)에서 표시된 유저 인터페이스 상의 검색창(sa)에 음식명 검색어를 입력한 후 검색 버튼을 선택하면, 클라이언트 장치(100)는 입력된 음식명 검색어 정보를 서버(200)로 전송할 수 있다. 서버(200)는 도 3a 내지 도 3b에서 설명한 바와 같이 수신한 음식명 검색어 정보에 기초하여 음식 메뉴 명사 추출을 실행할 수 있다.Referring to FIG. 4 , when the user inputs a food name search word into the search box sa on the user interface displayed on the
검색창(sa)에 입력된 음식명 검색어가 사전 데이터베이스 상의 등록된 검색어인 경우, 클라이언트 장치(100)는 서버(200)로부터 사전 데이터베이스 상에 등록된 음식명 검색어에 대한 정보를 수신하여 음식명 검색어의 사전적 의미 정보를 사전적 의미 표시 영역(11) 상에 표시할 수 있다.When the food name search word input in the search window sa is a registered search word on the dictionary database, the
다양한 실시예에서, 클라이언트 장치(100)는 입력된 음식명 검색어가 서버(200) 상의 사전 데이터베이스 상에 등록된 검색어에는 해당하지 않으나 사용자용 사전 데이터베이스 상에 등록된 검색어에 해당하는 경우 사용자용 사전 데이터베이스 상에서 음식명 검색어에 매칭된 의미 정보를 읽어 드려 사전적 의미 표시 영역(11) 상에 표시할 수도 있다.In various embodiments, the
또한, 클라이언트 장치(100)는 서버(200)로부터 미등록 명사들의 정보를 수신하여 제1 및 제2 미등록 명사 표시 영역(12, 13) 상에 표시할 수 있다. 제1 미등록 명사 표시 영역(12) 상에는 등록 음식명 명사와의 유사도 정보에 기초하여 유사도가 높은 순위로 정렬되어 미등록 명사들이 표시될 수 있다. 제2 미등록 명사 표시 영역(13) 상에는 검출 빈도수가 높은 순위로 정렬되어 미등록 명사들이 표시될 수 있다.In addition, the
또한, 클라이언트 장치(100)는 서버(200)로부터 등록 음식명 명사 정보를 수신하여 등록 음식명 표시 영역(14) 상에 표시할 수 있다. 등록 음식명 표시 영역(14) 상에는 검출 빈도수가 높은 순위로 정렬되어 등록 음식명 명사가 표시될 수 있다. In addition, the
다양한 실시예에서, 클라이언트 장치(100)는 서버(200)로부터 검출된 용언의 정보를 수신하여 표시할 수도 있다. 일부 실시예에서, 클라이언트 장치(100)는 서버(200)로부터 수신한 용언을 검출 빈도수가 높은 순위로 정렬하여 표시할 수도 있다.In various embodiments, the
다양한 실시예에서, 클라이언트 장치(100)는 제1 미등록 명사 표시 영역(12), 제2 미등록 명사 표시 영역(13), 등록 음식명 표시 영역(14) 상의 적어도 하나의 명사 및/또는 검출된 용언이 표시된 영역 상의 적어도 하나의 용언의 선택에 응답하여 태그어 저장 어포던스를 표시할 수 있다. 클라이언트 장치(100)는 태그어 저장 어포던스의 선택에 응답하여 선택된 모든 명사 및/또는 용언의 정보를 태그어로서 저장할 수 있다. 사용자는 검색창(sa)에 입력한 검색어와 관련한 음식을 광고하는데 있어서 이와 밀접한 관련성이 있는 명사, 예를 들어 음식명 검색어와 동일하거나 유사한 의미를 가지나 다르게 표현된 명사나 신조어, 해당 음식과 관련된 형용사를 확인하고, 이들을 태그어로써 저장할 수 있다. 그리고, 사용자는 광고 웹페이지를 제작시 저장된 태그어를 검색 태그어로 활용함으로써, 일반 사용자들이 다양한 검색어를 이용하여 웹페이지를 검색할 때 사용자가 등록한 광고물의 노출 가능성을 높인다.In various embodiments, the
다양한 실시예에서, 클라이언트 장치(100)는 등록된 태그어 정보를 서버(200)로 전송할 수 있다. 서버(200)는 수신한 태그어 정보 내의 복수의 태그어들 중 사전 데이터베이스에 등록된 등록 음식명 명사와 용언을 제외한 나머지 태그어인 명사들을 추출할 수 있다. 서버(200)는 추출된 명사들 각각을 상표 권리 존부를 확인할 수 있는 외부 서버 상에서 조사함으로써 상표 권리 존재 여부를 판단할 수 있다. 서버(200)는 상표 권리가 존재하는 명사에 대한 정보를 클라이언트 장치(100)로 제공할 수 있다. 사용자는 태그어로 설정된 명사들 중에서 상표 권리가 존재하는 명사를 확인함으로써 상표 등록된 태그어를 검색 키워드로 사용함에 따른 법적 문제를 미연에 방지할 수 있다. In various embodiments, the
클라이언트 장치(100)는 제1 및 제2 미등록 명사 표시 영역(12, 13) 상에 표시된 복수의 미등록 명사 중 어느 하나의 선택에 응답하여 선택된 미등록 명사 정보를 서버(200)로 전송할 수 있다. 서버(200)는 선택된 미등록 명사를 추출했던 문장 정보를 클라이언트 장치(100)로 전송할 수 있다. 도 5를 참조하면, 클라이언트 장치(100)는 서버(200)로부터 수신한 문장 정보를 문장 표시 영역(15) 상에 표시할 수 있다. 일부 실시예에서, 문장 표시 영역(15) 상에서 선택된 미등록 명사가 하이라이트되어 표시될 수 있다.The
다양한 실시예에서, 서버(200)는 선택된 미등록 명사를 추출했던 문장이 복수개인 경우 선택된 미등록 명사를 가장 많은 수로 포함하는 문장을 추출하여 클라이언트 장치(100)로 전송할 수 있다.In various embodiments, when there are a plurality of sentences from which the selected unregistered noun is extracted, the
클라이언트 장치(100)는 문장 표시 영역(15) 상의 웹 페이지 이동 어포던스의 선택에 응답하여 문장 표시 영역(15) 상에 표시된 문장을 포함한 웹페이지를 전송할 것을 서버(200)로 요청할 수 있다. 서버(200)는 이에 응답하여 문장이 포함된 웹페이지 정보를 클라이언트 장치(100)로 전송할 수 있다. 도 6을 참조하면, 클라이언트 장치(100)는 서버(200)로부터 수신한 웹페이지 정보(16)을 표시할 수 있다.The
다양한 실시예에서, 클라이언트 장치(100)는 표시된 용언의 정보 내의 어느 하나의 용언의 선택과 미등록 명사들 중 어느 하나의 선택에 응답하여 선택된 용언과 선택된 미등록 명사를 포함하는 문장의 전송을 서버(200)로 요청할 수 있다. 서버(200)는 이에 응답하여 선택된 용언과 선택된 미등록 명사를 포함하는 문장이 존재하는 경우 해당 문장 정보를 클라이언트 장치(100)로 전송할 수 있다. 따라서, 사용자는 특정 용언에 의해 수식되는 미등록 명사와 관련된 정보를 확인할 수 있다. 이는 사용자가 '칼칼하다', '고소하다', '달다', '맵다', '새콤달콤하다' 등과 같은 사용자의 취향이 담긴 용언에 의해 수식되는 음식명의 미등록 명사와 관련된 정보를 포함한 문장을 확인할 수 있도록 한다.In various embodiments, the
도 5 내지 도 7을 참조하면, 클라이언트 장치(100)는 설명 등록 어포던스의 선택에 응답하여 표시된 문장이나 표시된 웹페이지 상의 텍스트를 드레그할 수 있도록 하는 인터페이스를 제공할 수 있다. 사용자는 설명 등록 어포던스를 선택한 후에 표시된 문장이나 표시된 웹페이지 상의 문장들 내의 텍스트의 적어도 일부를 드레그할 수 있다. 클라이언트 장치(100)는 드레그에 응답하여 드레그된 텍스트(td1, td2)를 하이라이트하여 표시할 수 있다. 클라이언트 장치(100)는 텍스트의 드레그가 감지되면 사전 등록 어포던스를 표시할 수 있다. 클라이언트 장치(100)는 사전 등록 어포던스의 선택에 응답하여 드레그된 텍스트를 도 4에서 선택한 미등록 명사에 매칭하여 해당 미등록 명사의 의미 정보로서 사용자용 사전 데이터베이스에 저장할 수 있다. 또한, 클라이언트 장치(100)는 도 4에서 선택한 드레그된 텍스트 정보인 등록용 텍스트 정보와 미등록 명사를 서버(200)로 전송할 수 있다.Referring to FIGS. 5 to 7 , the
서버(200)는 복수의 클라이언트 장치들로부터 미등록 명사 정보와 해당 미등록 명사에 사용자들이 매칭시킨 등록용 텍스트 정보들을 수신할 수 있다. 예를 들어, 서버(200)는 10개의 클라이언트 장치로부터 동일한 미등록 명사에 매칭된 10개의 등록용 텍스트 정보들을 수신할 수 있다. 서버(200)는 10개의 등록용 텍스트 정보들 상호간의 유사도를 검출할 수 있다. 10개의 등록용 텍스트 정보들 상호간에는 서로 텍스트가 완전히 일치할 수도 있고(서로 다른 사용자들이 동일한 문장을 드레그한 경우), 일부 텍스트만 차이날 수도 있고(서로 다른 사용자들이 동일한 문장 내에서 일부 텍스트를 드레그한 경우), 많은 텍스트가 차이(서로 다른 사용자들이 서로 다른 문장 내에서 텍스트를 드레그한 경우)날 수도 있다.The
서버(200)는 기 설정치 이상의 유사도를 나타내는 등록용 텍스트 정보들을 추출하고 추출된 등록용 텍스트 정보들의 정량적인 개수를 산출할 수 있다. 서버(200)는 정량적인 개수의 산출 결과 미리 설정된 개수를 초과하는 등록용 텍스트 정보가 확인되면 해당 등록용 텍스트 정보들 중 어느 하나의 등록용 텍스트 정보를 미등록 명사의 승인된 의미 정보로 설정할 수 있다. 그리고, 서버(200)는 미등록 명사를 등록 명사로 지위를 전환하여 사전 데이터베이스에 등록하고, 지위가 전환된 등록 명사의 의미 정보로서 해당 승인된 등록용 텍스트 정보를 등록하여 사전 데이터베이스를 업데이트할 수 있다.The
이상 설명된 본 발명에 따른 실시예는 다양한 컴퓨터 구성요소를 통하여 실행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수 있다. 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등과 같은, 프로그램 명령어를 저장하고 실행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 컴파일러에 의하여 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용하여 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위하여 하나 이상의 소프트웨어 모듈로 변경될 수 있으며, 그 역도 마찬가지이다.Embodiments according to the present invention described above may be implemented in the form of program instructions that can be executed through various computer components and recorded on a computer-readable recording medium. The computer readable recording medium may include program instructions, data files, data structures, etc. alone or in combination. Program instructions recorded on the computer-readable recording medium may be specially designed and configured for the present invention, or may be known and usable to those skilled in the art of computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks and magnetic tapes, optical recording media such as CD-ROMs and DVDs, and magneto-optical media such as floptical disks. medium), and hardware devices specially configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include high-level language codes that can be executed by a computer using an interpreter or the like as well as machine language codes generated by a compiler. A hardware device may be modified with one or more software modules to perform processing according to the present invention and vice versa.
본 발명에서 설명하는 특정 실행들은 일 실시 예들로서, 어떠한 방법으로도 본 발명의 범위를 한정하는 것은 아니다. 명세서의 간결함을 위하여, 종래 전자적인 구성들, 제어 시스템들, 소프트웨어, 상기 시스템들의 다른 기능적인 측면들의 기재는 생략될 수 있다. 또한, 도면에 도시된 구성 요소들 간의 선들의 연결 또는 연결 부재들은 기능적인 연결 및/또는 물리적 또는 회로적 연결들을 예시적으로 나타낸 것으로서, 실제 장치에서는 대체 가능하거나 추가의 다양한 기능적인 연결, 물리적인 연결, 또는 회로 연결들로서 나타내어질 수 있다. 또한, “필수적인”, “중요하게” 등과 같이 구체적인 언급이 없다면 본 발명의 적용을 위하여 반드시 필요한 구성 요소가 아닐 수 있다.Specific implementations described in the present invention are examples and do not limit the scope of the present invention in any way. For brevity of the specification, description of conventional electronic components, control systems, software, and other functional aspects of the systems may be omitted. In addition, the connection of lines or connecting members between the components shown in the drawings are examples of functional connections and / or physical or circuit connections, which can be replaced in actual devices or additional various functional connections, physical connection, or circuit connections. In addition, if there is no specific reference such as “essential” or “important”, it may not be a component necessarily required for the application of the present invention.
또한 설명한 본 발명의 상세한 설명에서는 본 발명의 바람직한 실시 예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자 또는 해당 기술분야에 통상의 지식을 갖는 자라면 후술할 특허청구범위에 기재된 본 발명의 사상 및 기술 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다. 따라서, 본 발명의 기술적 범위는 명세서의 상세한 설명에 기재된 내용으로 한정되는 것이 아니라 특허청구범위에 의해 정하여져야만 할 것이다.In addition, the detailed description of the present invention described has been described with reference to preferred embodiments of the present invention, but those skilled in the art or those having ordinary knowledge in the art will find the spirit of the present invention described in the claims to be described later. And it will be understood that the present invention can be variously modified and changed without departing from the technical scope. Therefore, the technical scope of the present invention is not limited to the contents described in the detailed description of the specification, but should be defined by the claims.
시스템(10)
클라이언트 장치(100)
서버(200)
네트워크(300)
메모리(110, 210)
프로세서(120, 220)
통신 모듈(130, 230)
입출력 인퍼테이스(140, 240)
입출력 장치(141, 241)system(10)
Client device (100)
server(200)
network(300)
Memory (110, 210)
Processor (120, 220)
Communication module (130, 230)
I/O interfaces (140, 240)
I/O devices (141, 241)
Claims (12)
수신된 음식명 검색어를 포함하는 웹페이지를 검색하고, 검색된 웹페이지 내에서 음식명 검색어를 포함한 문장을 수집하는 단계;
수집된 음식명 검색어를 포함한 문장들에서 용언을 추출하는 단계;
추출된 용언을 검색어로 하여 웹페이지를 검색하고 검색된 웹페이지 내에서 용언을 포함한 문장을 수집하는 단계; 및
수집된 용언을 포함한 문장들에서 명사를 추출하는 단계;를 포함하는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법.Performed by the processor according to the control command provided by the food menu noun extraction program code stored in memory
searching for a web page including the received food name search word, and collecting sentences including the food name search word in the searched web page;
extracting verbs from sentences including collected food name search words;
searching for a web page using the extracted verb as a search term and collecting sentences including the verb in the searched web page; and
Extracting nouns from sentences including the collected verbs;
A method for extracting food menu nouns using parts of speech such as verbs and adjectives.
추출된 명사가 사전 데이터베이스 상의 등록 명사인지 여부를 판단하여, 상기 사전 데이터베이스에 등록되지 않은 미등록명사를 추출하여 표시하는 단계;를 더 포함하는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법.According to claim 1,
Determining whether the extracted noun is a registered noun on the dictionary database, extracting and displaying unregistered nouns not registered in the dictionary database; further comprising
A method for extracting food menu nouns using parts of speech such as verbs and adjectives.
상기 서버는 수신된 음식명 검색어를 포함하는 웹페이지를 검색하고, 검색된 웹페이지 내에서 음식명 검색어를 포함한 문장을 수집하고, 수집된 음식명 검색어를 포함한 문장들에서 용언을 추출하고, 추출된 용언을 검색어로 하여 웹페이지를 검색하고 검색된 웹페이지 내에서 용언을 포함한 문장을 수집하며, 수집된 용언을 포함한 문장들에서 명사를 추출하는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템.The client device transmits the received food name search term to the server,
The server searches a web page including the received food name search word, collects sentences including the food name search word in the searched webpage, extracts verbs from the collected sentences including the food name search word, and extracts the extracted verbs. is a search term for web pages, collects sentences including verbs from the searched web pages, and extracts nouns from sentences including collected verbs.
A system for extracting food menu nouns using parts of speech such as verbs and adjectives.
상기 서버는 기 등록된 관심 모니터링 사이트 목록 정보에 해당하는 사이트 상에서 상기 음식명 검색어를 포함하는 웹페이지를 검색하는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템.According to claim 3,
The server searches for a web page including the food name search term on a site corresponding to pre-registered interest monitoring site list information.
A system for extracting food menu nouns using parts of speech such as verbs and adjectives.
상기 서버는 상기 음식명 검색어에 기초하여 이미 검색된 웹페이지와 동일한 웹페이지와 중복되는 웹페이지를 제외한 다른 웹페이지 내에서 용언을 포함한 문장을 수집하는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템.According to claim 4,
The server collects sentences including verbs in other web pages except for web pages that overlap with the same web page as the web page already searched based on the food name search term.
A system for extracting food menu nouns using parts of speech such as verbs and adjectives.
상기 서버는 추출된 명사들 각각을 미리 저장된 사전 데이터베이스 상에서 검색하여, 상기 추출된 명사들 각각을 상기 미리 저장된 사전 데이터베이스에 등록된 등록 명사 및 상기 사전 데이터베이스에 등록되지 않은 미등록 명사로 분류하는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템.According to claim 3,
The server searches for each of the extracted nouns on a pre-stored dictionary database and classifies each of the extracted nouns into registered nouns registered in the pre-stored dictionary database and unregistered nouns not registered in the dictionary database
A system for extracting food menu nouns using parts of speech such as verbs and adjectives.
상기 서버는 상기 사전 데이터베이스 상에서 상기 등록 명사의 의미 정보를 분석하여 상기 등록 명사들 중에서 등록 음식명 명사를 추출하는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템.According to claim 6,
The server extracts a registered food noun from among the registered nouns by analyzing the semantic information of the registered noun on the dictionary database.
A system for extracting food menu nouns using parts of speech such as verbs and adjectives.
상기 서버는 상기 등록 음식명 명사와 상기 미등록 음식명 명사 상호간의 음절간의 동일성 여부를 판단하여 상기 등록 음식명 명사와 상기 미등록 음식명 명사 상호간의 유사도를 계산하고,
상기 서버는 상기 미등록 명사들 및 상기 등록 음식명 명사 각각의 추출 빈도 정보를 계산하는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템.According to claim 7,
The server determines whether syllables between the registered food noun and the non-registered food noun are identical to each other, and calculates a degree of similarity between the registered food noun and the unregistered food noun,
The server calculates extraction frequency information of each of the unregistered nouns and the registered food name noun.
A system for extracting food menu nouns using parts of speech such as verbs and adjectives.
상기 클라이언트 장치는 상기 미등록 명사들을 수신하고, 상기 유사도 또는 상기 추출 빈도 정보에 기초하여 상기 미등록 명사들을 정렬하여 표시하고,
상기 클라이언트 장치는 상기 등록 음식명 명사를 수신하고, 상기 등록 음식명 명사의 검출 빈도수에 기초하여 상기 등록 음식명 명사를 정렬하여 표시하는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템.According to claim 8,
the client device receives the unregistered nouns, sorts and displays the unregistered nouns based on the degree of similarity or the extraction frequency information;
The client device receives the registered food nouns, sorts and displays the registered food nouns based on the detection frequency of the registered food nouns.
A system for extracting food menu nouns using parts of speech such as verbs and adjectives.
상기 클라이언트 장치는 표시된 미등록 명사들 중 어느 하나의 선택에 응답하여 상기 서버로부터 선택된 미등록 명사를 포함한 문장 정보를 수신하여 표시하고, 상기 문장 정보에는 상기 선택된 미등록 명사가 하이라이트 되어 표시되는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템.According to claim 9,
The client device receives and displays sentence information including the selected unregistered noun from the server in response to selection of any one of the displayed unregistered nouns, and the selected unregistered noun is highlighted and displayed in the sentence information
A system for extracting food menu nouns using parts of speech such as verbs and adjectives.
상기 클라이언트 장치는 표시된 문장에서 드레그된 텍스트 정보인 등록용 텍스트 정보를 상기 선택된 미등록 명사 정보의 의미 정보로서 사용자용 사전 데이터베이스에 등록하는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템.According to claim 10,
The client device registers text information for registration, which is text information dragged from a displayed sentence, in a dictionary database for a user as semantic information of the selected unregistered noun information.
A system for extracting food menu nouns using parts of speech such as verbs and adjectives.
상기 클라이언트 장치는 표시된 문장에서 드레그된 텍스트 정보인 등록용 텍스트 정보 및 상기 선택된 미등록 명사 정보를 상기 서버로 전송하고,
상기 서버는 상기 선택된 미등록 명사 정보에 매칭된 등록용 텍스트 정보를 복수의 클라이언트 장치들로부터 수집하고, 기 설정치 이상의 유사도를 나타내는 등록용 텍스트 정보들의 개수를 산출하여 기설정치 이상이면 상기 등록용 텍스트 정보 중 어느 하나의 텍스트 정보를 상기 미등록 명사 정보의 의미 정보로서 상기 사전 데이터베이스에 등록하는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템.According to claim 10,
The client device transmits registration text information, which is text information dragged from a displayed sentence, and the selected unregistered noun information to the server;
The server collects text information for registration matched with the selected unregistered noun information from a plurality of client devices, calculates the number of pieces of text information for registration showing similarity equal to or greater than a preset value, and if the number is equal to or greater than the preset value, among the text information for registration. Registering any one text information in the dictionary database as semantic information of the unregistered noun information
A system for extracting food menu nouns using parts of speech such as verbs and adjectives.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210154049A KR102625347B1 (en) | 2021-11-10 | 2021-11-10 | A method for extracting food menu nouns using parts of speech such as verbs and adjectives, a method for updating a food dictionary using the same, and a system for the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210154049A KR102625347B1 (en) | 2021-11-10 | 2021-11-10 | A method for extracting food menu nouns using parts of speech such as verbs and adjectives, a method for updating a food dictionary using the same, and a system for the same |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20230068092A true KR20230068092A (en) | 2023-05-17 |
KR102625347B1 KR102625347B1 (en) | 2024-01-15 |
Family
ID=86547198
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210154049A KR102625347B1 (en) | 2021-11-10 | 2021-11-10 | A method for extracting food menu nouns using parts of speech such as verbs and adjectives, a method for updating a food dictionary using the same, and a system for the same |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102625347B1 (en) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20060042296A (en) * | 2004-11-09 | 2006-05-12 | 삼성전자주식회사 | Method and apparatus for updating dictionary |
KR100886687B1 (en) | 2007-12-12 | 2009-03-04 | 한국전자통신연구원 | Method and apparatus for auto-detecting of unregistered word in chinese language |
JP2009295052A (en) * | 2008-06-06 | 2009-12-17 | Yahoo Japan Corp | Compound word break estimating device, method, and program for estimating break position of compound word |
JP2011008373A (en) * | 2009-06-24 | 2011-01-13 | Fuji Xerox Co Ltd | Natural language processor and program |
KR101042515B1 (en) | 2008-12-11 | 2011-06-17 | 주식회사 네오패드 | Method for searching information based on user's intention and method for providing information |
KR20140078312A (en) | 2012-12-17 | 2014-06-25 | 한국전자통신연구원 | Apparatus and system for providing sentimet analysis results based on text and method thereof |
KR20150022583A (en) | 2013-08-23 | 2015-03-04 | 주식회사 케이티 | Apparatus for extracting keyword and method thereof |
KR20150096207A (en) * | 2014-02-14 | 2015-08-24 | 삼성전자주식회사 | Electronic Device And Method For Extracting And Using Semantic Entity In Conversation Message Of The Same |
KR20160056983A (en) * | 2014-11-12 | 2016-05-23 | 한국전자통신연구원 | System and method for generating morpheme dictionary based on automatic extraction of unknown words |
KR101935109B1 (en) | 2016-12-29 | 2019-01-04 | (주) 더아이엠씨 | Sensitivity Analyzing Method of Phrase Unit for Fassion Field and Storage Medium Having the Same |
KR102019756B1 (en) | 2017-03-14 | 2019-09-10 | 한국전자통신연구원 | On-line contextual advertisement intelligence apparatus and method based on language analysis for automatically recognizes about coined word |
-
2021
- 2021-11-10 KR KR1020210154049A patent/KR102625347B1/en active IP Right Grant
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20060042296A (en) * | 2004-11-09 | 2006-05-12 | 삼성전자주식회사 | Method and apparatus for updating dictionary |
KR100886687B1 (en) | 2007-12-12 | 2009-03-04 | 한국전자통신연구원 | Method and apparatus for auto-detecting of unregistered word in chinese language |
JP2009295052A (en) * | 2008-06-06 | 2009-12-17 | Yahoo Japan Corp | Compound word break estimating device, method, and program for estimating break position of compound word |
KR101042515B1 (en) | 2008-12-11 | 2011-06-17 | 주식회사 네오패드 | Method for searching information based on user's intention and method for providing information |
JP2011008373A (en) * | 2009-06-24 | 2011-01-13 | Fuji Xerox Co Ltd | Natural language processor and program |
KR20140078312A (en) | 2012-12-17 | 2014-06-25 | 한국전자통신연구원 | Apparatus and system for providing sentimet analysis results based on text and method thereof |
KR20150022583A (en) | 2013-08-23 | 2015-03-04 | 주식회사 케이티 | Apparatus for extracting keyword and method thereof |
KR20150096207A (en) * | 2014-02-14 | 2015-08-24 | 삼성전자주식회사 | Electronic Device And Method For Extracting And Using Semantic Entity In Conversation Message Of The Same |
KR20160056983A (en) * | 2014-11-12 | 2016-05-23 | 한국전자통신연구원 | System and method for generating morpheme dictionary based on automatic extraction of unknown words |
KR101935109B1 (en) | 2016-12-29 | 2019-01-04 | (주) 더아이엠씨 | Sensitivity Analyzing Method of Phrase Unit for Fassion Field and Storage Medium Having the Same |
KR102019756B1 (en) | 2017-03-14 | 2019-09-10 | 한국전자통신연구원 | On-line contextual advertisement intelligence apparatus and method based on language analysis for automatically recognizes about coined word |
Non-Patent Citations (6)
Title |
---|
길호현. (2018). 텍스트마이닝을 위한 한국어 불용어 목록 연구. 우리말글, 78, 1-25. |
김미경, 최소영. (2020). 명칭실어증 환자의 동음이의어 처리 특성. 특수교육논총, 36(2), 67-80. |
김진수. (2020). 비정형 문서에서 감정과 상황 정보를 이용한 감성 예측. 융합정보논문지 (구 중소기업융합학회논문지), 10(10), 40-46. |
이종화, 이문봉, 김종원. (2019). TF-IDF를 활용한 한글 자연어 처리 연구. 정보시스템연구, 28(3), 105-121. |
이종화. (2018). SNS 해시태그를 이용한 감정 단어 일반화 연구. 인터넷전자상거래연구, 18(4), 53-63. |
임용택, 임희석. (2020). 기업 리뷰 정보를 활용한 주가 방향 예측 모델 비교 분석. 한국융합학회논문지, 11(8), 165-171. |
Also Published As
Publication number | Publication date |
---|---|
KR102625347B1 (en) | 2024-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8452772B1 (en) | Methods, systems, and articles of manufacture for addressing popular topics in a socials sphere | |
CN106663117B (en) | Constructing graphs supporting providing exploratory suggestions | |
US20130060769A1 (en) | System and method for identifying social media interactions | |
US20150095300A1 (en) | System and method for mark-up language document rank analysis | |
US10740406B2 (en) | Matching of an input document to documents in a document collection | |
US10242033B2 (en) | Extrapolative search techniques | |
Rahate et al. | Feature selection for sentiment analysis by using svm | |
Fayaz et al. | Machine learning for fake news classification with optimal feature selection | |
US20160350278A1 (en) | Claim polarity identification | |
Chirgaiya et al. | Analysis of sentiment based movie reviews using machine learning techniques | |
Banjar et al. | Aspect-Based Sentiment Analysis for Polarity Estimation of Customer Reviews on Twitter. | |
Zahid et al. | Roman urdu reviews dataset for aspect based opinion mining | |
Sriharee | An ontology-based approach to auto-tagging articles | |
Mehrbod et al. | Tender calls search using a procurement product named entity recogniser | |
Tito et al. | Icdar 2021 competition on document visual question answering | |
US20220365956A1 (en) | Method and apparatus for generating patent summary information, and electronic device and medium | |
WO2015084757A1 (en) | Systems and methods for processing data stored in a database | |
US11669556B1 (en) | Method and system for document retrieval and exploration augmented by knowledge graphs | |
Saghayan et al. | Exploring the impact of machine translation on fake news detection: A case study on persian tweets about covid-19 | |
Shahade et al. | Multi-lingual opinion mining for social media discourses: an approach using deep learning based hybrid fine-tuned smith algorithm with adam optimizer | |
JP2007193697A (en) | Information collection apparatus, information collection method and program | |
Abudalfa et al. | Survey on target dependent sentiment analysis of micro-blogs in social media | |
AleEbrahim et al. | Summarising customer online reviews using a new text mining approach | |
Kama et al. | A web search enhanced feature extraction method for aspect-based sentiment analysis for Turkish informal texts | |
Gonzalez-Mora et al. | Model-driven development of web apis to access integrated tabular open data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |