KR20230068092A - A method for extracting food menu nouns using parts of speech such as verbs and adjectives, a method for updating a food dictionary using the same, and a system for the same - Google Patents

A method for extracting food menu nouns using parts of speech such as verbs and adjectives, a method for updating a food dictionary using the same, and a system for the same Download PDF

Info

Publication number
KR20230068092A
KR20230068092A KR1020210154049A KR20210154049A KR20230068092A KR 20230068092 A KR20230068092 A KR 20230068092A KR 1020210154049 A KR1020210154049 A KR 1020210154049A KR 20210154049 A KR20210154049 A KR 20210154049A KR 20230068092 A KR20230068092 A KR 20230068092A
Authority
KR
South Korea
Prior art keywords
nouns
food
verbs
noun
registered
Prior art date
Application number
KR1020210154049A
Other languages
Korean (ko)
Other versions
KR102625347B1 (en
Inventor
이종화
이진민
김기환
박병진
왕태수
김가은
Original Assignee
동의대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 동의대학교 산학협력단 filed Critical 동의대학교 산학협력단
Priority to KR1020210154049A priority Critical patent/KR102625347B1/en
Publication of KR20230068092A publication Critical patent/KR20230068092A/en
Application granted granted Critical
Publication of KR102625347B1 publication Critical patent/KR102625347B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

실시예는, 메모리에 저장된 음식 메뉴 명사 추출 프로그램 코드가 제공하는 제어 명령에 따라 프로세서에 의해 수행되는 수신된 음식명 검색어를 포함하는 웹페이지를 검색하고, 검색된 웹페이지 내에서 음식명 검색어를 포함한 문장을 수집하는 단계; 수집된 음식명 검색어를 포함한 문장들에서 용언을 추출하는 단계; 추출된 용언을 검색어로 하여 웹페이지를 검색하고 검색된 웹페이지 내에서 용언을 포함한 문장을 수집하는 단계; 및 수집된 용언을 포함한 문장들에서 명사를 추출하는 단계;를 포함하는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법을 제공할 수 있다.The embodiment searches a web page including the received food name search word, which is executed by a processor according to a control command provided by a food menu noun extraction program code stored in a memory, and searches for a sentence including the food name search word in the searched web page. Collecting; extracting verbs from sentences including collected food name search words; searching for a web page using the extracted verb as a search term and collecting sentences including the verb in the searched web page; and extracting nouns from sentences including the collected verbs; a food menu noun extraction method using parts of speech such as verbs and adjectives may be provided.

Description

동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법과 이를 이용하여 음식 사전을 업데이트하는 방법 및 이를 위한 시스템{A method for extracting food menu nouns using parts of speech such as verbs and adjectives, a method for updating a food dictionary using the same, and a system for the same}A method for extracting food menu nouns using parts of speech such as verbs and adjectives, a method for updating a food dictionary using parts of speech such as verbs and adjectives, and a system therefor food dictionary using the same, and a system for the same}

본 발명은 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사를 추출하는 방법과 이를 이용하여 음식 사전을 업데이트하는 방법 및 이를 위한 시스템에 관한 것이다.The present invention relates to a method of extracting food menu nouns using parts of speech such as verbs and adjectives, a method of updating a food dictionary using the same, and a system therefor.

메일, 소셜미디어와 같은 비정형데이터가 많은 비중을 차지함에 따라서 자연어 처리에 대한 관심이 높아지고 있다. 제품이나 서비스 구매 후기의 구전효과가 확장되면서 기업의 평판 분석에 집중하고 있다. 또한, 인공지능의 발달로 AI스피커의 대중화로 소통 패러다임의 변화가 발생하면서 기존 키보드 중심의 텍스트 방식에서 대화형으로 변화되면서 더욱 자연어에 대한 관심이 높아지고 있다. 자연어처리는 사람의 자연어를 컴퓨터가 분석하고 주어진 문제를 해결하는 기능이다(이종화 외, 2019). 하지만 동음이의어나 다의어처럼 한글이 가지는 모호성 분석이 어렵다. 문법적인 구어와 문어의 차이, '아버지 가방에 들어가신다'와 같이 띄어쓰기 문제, 동음이의어나 주어, 서술어, 목적어 등 생략된 문장 분석 등 한글의 특수성에 많은 연구자의 한계점을 제시하고 있다(김미경, 최소영, 2020). 고객의 평점이나 리뷰를 읽고 제품이나 서비스의 구매 결정에 많은 영향을 줌으로써 이를 실시간 모니터링하여 대응하는 실시간 리뷰 모니터링 서비스도 가능하며 자사와 타사의 온라인 데이터 분석을 통해 경쟁우위와 경쟁 열위를 판단하여 문제의 원인 찾아내는 경쟁사 분석도 가능하다. 뉴스에서 자연어처리로 핵심키워드, 요약분석을 통해 분석시간을 대폭 줄일 수 있으며 뉴스레터나 SNS 포스팅 자동화도 가능하며 리뷰, 블로그 등을 자연어 처리 분석하여 충성도 높은 우수 고객을 식별할 수 있는 고객 분석도 가능하다(임용택, 임희석, 2020). 채팅어나 인터넷어는 새로운 이슈가 발생할 때마다 신조어가 등장하며 비표준어지만 표준어로 치환하여 어휘와 매칭할 수 있는 연구도 진행되고 있다(이종화, 2018; 김진수, 2020; 길호현, 2018).As unstructured data such as e-mail and social media accounts for a large proportion, interest in natural language processing is increasing. As the word of mouth effect of product or service purchase reviews expands, companies are focusing on analyzing their reputation. In addition, with the development of artificial intelligence and the popularization of AI speakers, a change in communication paradigm occurred, changing from the existing keyboard-centered text method to conversational, increasing interest in natural language. Natural language processing is the ability of a computer to analyze a person's natural language and solve a given problem (Lee Jong-hwa et al., 2019). However, it is difficult to analyze the ambiguity of Hangeul, such as homonyms and polysemy. The limitations of many researchers are suggested by the uniqueness of Hangeul, such as the difference between grammatical spoken language and written language, spacing problems such as 'Going into your father's bag', and analysis of omitted sentences such as homonyms, subjects, predicates, and objects (Kim Mi-kyung, Choi So-young, 2020). Real-time review monitoring service is also available, which reads customers' ratings or reviews and has a great influence on purchasing decisions for products or services, monitoring and responding to them in real time. A competitor analysis to find the cause is also possible. Analysis time can be drastically reduced through key keyword and summary analysis through natural language processing in news, and automation of newsletters and SNS postings is possible. It is (Yong-taek Lim, Hee-seok Lim, 2020). Whenever a new issue arises in chatting or Internet language, a new coined word appears, and even though it is a non-standard language, research is being conducted to match it with a vocabulary by replacing it with a standard language (Lee Jong-hwa, 2018; Kim Jin-soo, 2020; Gil Ho-hyun, 2018).

한국등록특허공보 제1935109호의 패션 분야의 단어 구 단위 감성분석방법 및 이를 포함하는 저장매체에 관한 것으로 저장매체에 저장된 패션 분야의 단어 구 단위 감성분석용 프로그램이 설치된 관리서버를 통해 수행되는 패션 분야의 단어 구 단위 감성분석방법에 있어서, 온라인 서비스를 대상으로 비정형 텍스트 데이터를 수집하여 상기 관리서버에 저장하는 (a)단계와, 상기 비정형 텍스트 데이터에서, 패션 분야에 포함되는 복수의 감성어휘를 추출하는 (b)단계와, 상기 감성어휘 중 적어도 일부를 조합한 문장을 구성하는 (c)단계와, 상기 (c)단계에서 조합된 문장을 구성하는 감성어휘 각각의 긍정/부정 극성 가중치를 부여하는 (d)단계와, 상기 감성어휘의 긍정/부정 극성 가중치를 통해, 상기 감성어휘 중 적어도 일부를 조합한 문장의 긍정/부정 극성을 분석하는 (e)단계와, 상기 (e)단계의 분석 결과를 통해 패션 분야의 트렌드를 분석하는 (f)단계를 포함하는 것을 특징으로 한다.Korean Registered Patent Publication No. 1935109 relates to a method for analyzing word phrase unit sentiment analysis in the fashion field and a storage medium including the same. In the word phrase unit sentiment analysis method, step (a) of collecting unstructured text data for online services and storing it in the management server, and extracting a plurality of emotional vocabulary included in the fashion field from the unstructured text data Step (b), step (c) of constructing a sentence combining at least some of the emotional words, and assigning positive/negative polarity weights to each of the emotional words constituting the sentence combined in step (c) ( step d), step (e) of analyzing the positive/negative polarity of a sentence combining at least some of the emotional vocabulary through positive/negative polarity weights of the emotional vocabulary, and the analysis result of step (e) It is characterized in that it includes a step (f) of analyzing trends in the fashion field through.

한국공개특허공보 제2014-0078312호의 텍스트 기반 감성 분석 결과를 제공하기 위한 장치, 시스템 및 그 방법은 사용자로부터 감성을 분석하고자 하는 대상에 대한 키워드를 입력 받는 입력부, 입력 받은 상기 키워드에 대한 감성 분석을 서비스 서버에 요청하고 그 요청한 결과로 감성 분석 결과를 제공받는 제어부, 제공받은 상기 감성 분석 결과에 따라 상기 대상에 대한 속성을 디스플레이하고 디스플레이된 각 속성마다 속성값에 상응하는 텍스트를 디스플레이하는 표시부 및 제공받은 상기 감성 분석 결과를 저장하는 저장부를 포함하되, 상기 속성은 상기 감성의 대상에 대해 평가하거나 상기 감성을 표현하려는 구체적인 항목이고, 상기 속성값은 상기 속성을 평가하거나 상기 속성에 대한 감성을 나타내는 표현인 것을 특징으로 한다.Korean Patent Publication No. 2014-0078312 discloses an apparatus, system, and method for providing a text-based sentiment analysis result, which includes an input unit for receiving keywords for an object to be analyzed for sentiment from a user, and sentiment analysis for the received keywords. A control unit that makes a request to the service server and receives a sentiment analysis result as a result of the request; a display unit that displays attributes of the subject according to the received sentiment analysis result and displays text corresponding to the attribute value for each displayed attribute; and A storage unit for storing the received sentiment analysis result, wherein the property is a specific item to be evaluated for the subject of the emotion or to express the emotion, and the property value is an expression that evaluates the property or expresses the emotion for the property. It is characterized by being

한국공개특허공보 제2015-0022583호의 키워드를 추출하는 장치 및 방법은 사용자 단말로부터 상기 검색어를 수신하는 검색어 수신부, 상기 수신된 검색어를 포함하는 복수의 문서들을 외부 장치로부터 수집하는 문서 수집부, 상기 수집된 문서들로부터 상기 수집된 문서들에 포함된 명사들 중 기설정된 개수의 빈출 명사들을 추출하는 빈출 명사 추출부, 상기 빈출 명사들 및 최빈출 명사에 대하여 상기 수집된 문서들을 분석함으로써 상기 빈출 명사들 각각에 대한 가중치를 결정하는 가중치 결정부, 상기 결정된 가중치에 기초하여 상기 빈출 명사들 각각의 유효성을 판단하는 유효성 판단부, 및 상기 유효성 판단 결과 유효한 빈출 명사들을 상기 검색어에 대한 키워드로서 결정하는 키워드 추출부를 포함하는 것을 특징으로 한다.Korean Patent Publication No. 2015-0022583 discloses an apparatus and method for extracting keywords, including a search word reception unit that receives the search word from a user terminal, a document collection unit that collects a plurality of documents including the received search word from an external device, and the collection of documents. A frequent noun extracting unit extracting a predetermined number of frequent nouns from among nouns included in the collected documents from the collected documents, and analyzing the collected documents for the frequent nouns and the most frequent nouns. A weight determination unit that determines a weight for each, a validity determination unit that determines validity of each of the frequent nouns based on the determined weight, and keyword extraction that determines effective frequent nouns as keywords for the search word as a result of the validity determination. It is characterized by including wealth.

한국등록특허공보 제1042515호의 사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법은 검색어에 대한 해석결과를 이용하여 파악한 검색자의 의도에 맞는 편집기를 제공하고, 편집기를 통해 입력된 메타데이터들과 관련된 메타데이터를 가지는 컨텐츠를 검색한다. 이에 의해, 검색자가 입력한 정보로부터 검색자의 의도를 파악하고, 파악된 의도를 기초로 세부적인 메타데이터 입력을 유도하고, 입력된 메타데이터를 이용하여 검색을 수행할 수 있다.Korean Registered Patent Publication No. 1042515 provides an editor suitable for the searcher's intention based on the user's intention based on the user's intention analysis result and provides meta data related to the metadata entered through the editor. Search for content with data. Accordingly, it is possible to determine the searcher's intention from information input by the searcher, induce detailed metadata input based on the identified intention, and perform a search using the input metadata.

한국등록특허공보 제0886687호의 중국어 미등록어 자동 추출 방법 및 장치는 중국어 문장이 포함된 웹문서를 입력받으면, 입력된 웹문서의 html 태그를 제거하고, 웹문서 내의 문장별로 메타 태그와 일반 태그 처리 방식으로 분류하며, 형태소 분석을 진행하여 분석결과를 출력하고, 분석 결과를 이용하여 어근 중심의 미등록어를 추출하는 방식과, 단음절 토큰을 중심으로 미등록어를 추출하는 방식과, 4음절로 된 동사 미등록어를 추출하는 방식과, 단음절 토큰의 단어 가능 여부를 판단하여 단어 가능 미등록어를 추출하는 방식과, 메타 태그 정보에 포함된 단어를 이용하여 미등록어를 추출하는 방식 중 적어도 하나의 방식을 이용하여 미등록어를 추출하는 것을 특징으로 한다. 본 발명에 의하면, 중국어 미등록어 추출방식을 통하여 쉽고 빠르게 중국어 분석용 사전을 구축할 수 있으며, 특히 신조어, 미등록 용언에 대한 사전 보강은 실제 웹문서 번역시스템에 있어서 정확도를 크게 향상시킬 수 있는 것을 특징으로 한다.Korean Registered Patent Publication No. 0886687 automatically extracts Chinese unregistered words. When a web document containing Chinese sentences is input, the html tag of the input web document is removed, and meta tags and general tags are processed for each sentence in the web document. A method of extracting unregistered words centered on the root using the analysis result, a method of extracting unregistered words centered on single syllable tokens, and a method of extracting unregistered words centered on single syllable tokens, and unregistered verbs with four syllables. Using at least one of a method of extracting a word, a method of extracting a non-registered word capable of words by determining whether a word of a monosyllabic token is possible, and a method of extracting an unregistered word by using a word included in meta tag information It is characterized in that unregistered words are extracted. According to the present invention, it is possible to easily and quickly build a dictionary for Chinese analysis through an unregistered Chinese word extraction method, and in particular, dictionary reinforcement for new words and unregistered terms can greatly improve accuracy in an actual web document translation system. to be

종래의 기술은 특정 어휘를 추출하여 추출된 어휘를 분석하여 감성 결과를 도출하거나, 키워드를 설정하거나, 사용자의 의도를 추정하는 기술에 관한 것이다. 여기서의 추출되는 어휘는 표준어로 인정된 어휘이거나 대중들 사이에서 널리 쓰여 인터넷 사전 상에 등록된 어휘 정도에 불과하다. 따라서 현대의 급변하는 사회와 문화가 반영되어 확대 재생산되는 다양한 신조어를 추출하고 이를 분석하는데는 어려움이 있다.Conventional technology relates to a technique of extracting a specific vocabulary and analyzing the extracted vocabulary to derive a sentiment result, set a keyword, or estimate a user's intention. The vocabulary extracted here is only a vocabulary recognized as a standard language or a vocabulary widely used among the public and registered in the Internet dictionary. Therefore, it is difficult to extract and analyze various new words that are expanded and reproduced by reflecting the rapidly changing society and culture of today.

관련하여 한국등록특허공보 제2019756호는 신조어 자동 인식을 위한 언어 분석에 기반한 온라인 문맥 광고 지능화 장치 및 그 방법을 개시하고 있다. 다만, 제2019756호는 랜덤하게 수집된 문서들 사이에서 신조어를 검출하는 기술로 웹 상에 거의 무한한 정보들을 중에서 적절한 수집 대상을 설정하는 것은 현실적으로 매우 어렵다. 특히, 음식 명칭의 경우 사람들 저마다 다양한 표현으로 지칭하는 경우가 많고 음식의 레시피나 음식의 제조 지역, 음식의 조리법, 퓨전 요리 등에 따라서 매우 다양한 표현으로 해당 음식을 지칭하는 경우가 많으며 외래어로된 메뉴가 많아 표준화된 음식명 하나로 그룹핑될 수 있는 다양한 표현들을 수집하고 정리하는 것은 중요한 과제들 중 하나로 인식되고 있다.In this regard, Korean Registered Patent Publication No. 2019756 discloses an online contextual advertising intelligent device and method based on language analysis for automatic recognition of new words. However, No. 2019756 is a technology for detecting new words among randomly collected documents, and it is realistically very difficult to set an appropriate collection target among almost infinite information on the web. In particular, in the case of food names, each person often refers to the food in various expressions, and often refers to the food in a variety of expressions depending on the recipe of the food, the manufacturing region of the food, the recipe of the food, fusion cuisine, etc. It is recognized as one of the important tasks to collect and organize various expressions that can be grouped into one standardized food name.

한국등록특허공보 제1935109호Korean Registered Patent Publication No. 1935109 한국공개특허공보 제2014-0078312호Korean Patent Publication No. 2014-0078312 한국공개특허공보 제2015-0022583호Korean Patent Publication No. 2015-0022583 한국등록특허공보 제1042515호Korean Registered Patent Publication No. 1042515 한국등록특허공보 제0886687호Korean Registered Patent Publication No. 0886687 한국등록특허공보 제2019756호Korean Registered Patent Publication No. 2019756

이종화, 이문봉, 김종원. (2019). TF-IDF를 활용한 한글 자연어 처리 연구. 정보시스템연구, 28(3), 105-121. Lee Jong-hwa, Lee Moon-bong, and Kim Jong-won. (2019). A study on Korean natural language processing using TF-IDF. Information Systems Research, 28(3), 105-121. 김미경, 최소영. (2020). 명칭실어증 환자의 동음이의어 처리 특성. 특수교육논총, 36(2), 67-80. Kim Mi-kyung, Choi So-young. (2020). Characteristics of homonym processing in patients with aphasia. Journal of Special Education, 36(2), 67-80. 임용택, 임희석. (2020). 기업 리뷰 정보를 활용한 주가 방향 예측 모델 비교 분석. 한국융합학회논문지, 11(8), 165-171. Lim Yong-taek, Lim Hee-seok. (2020). Comparative analysis of stock price direction prediction models using corporate review information. Journal of the Korean Convergence Society, 11(8), 165-171. 이종화. (2018). SNS 해시태그를 이용한 감정 단어 일반화 연구. 인터넷전자상거래연구, 18(4), 53-63. Jonghwa Lee. (2018). A study on generalization of emotion words using SNS hashtags. Internet Electronic Commerce Research, 18(4), 53-63. 김진수. (2020). 비정형 문서에서 감정과 상황 정보를 이용한 감성 예측. 융합정보논문지 (구 중소기업융합학회논문지), 10(10), 40-46. Jinsu Kim. (2020). Sentiment prediction using emotion and context information in unstructured documents. The Journal of Convergence Information (formerly Journal of the Society for Small and Medium Business Convergence), 10(10), 40-46. 길호현. (2018). 텍스트마이닝을 위한 한국어 불용어 목록 연구. 우리말글, 78, 1-25. Gil Ho-hyun. (2018). A Study on Korean Stopword Lists for Text Mining. Korean Language, 78, 1-25.

본 발명은 텍스트 문장 내 명사의 동작이나 작용을 설명하고나 성질의 상태를 표현하는 용언을 이용하는 명사 추출 방법을 제공하고자 한다.An object of the present invention is to provide a noun extraction method using a term that describes the action or action of a noun in a text sentence or expresses a state of nature.

본 발명은 음식명 검색어와 연관된 용언을 활용하여 음식 명사를 검색하고 미등록된 음식 명사를 저장하고 활용할 수 있도록 하는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법과 이를 이용하여 음식 사전을 업데이트하는 방법 및 이를 위한 시스템을 제공하고자 한다.The present invention is a method for extracting food menu nouns using parts of speech such as verbs and adjectives to search for food nouns by using verbs associated with food name search words and to store and utilize unregistered food nouns, and to update a food dictionary using the same It is intended to provide a method and a system therefor.

실시예는, 메모리에 저장된 음식 메뉴 명사 추출 프로그램 코드가 제공하는 제어 명령에 따라 프로세서에 의해 수행되는 수신된 음식명 검색어를 포함하는 웹페이지를 검색하고, 검색된 웹페이지 내에서 음식명 검색어를 포함한 문장을 수집하는 단계; 수집된 음식명 검색어를 포함한 문장들에서 용언을 추출하는 단계; 추출된 용언을 검색어로 하여 웹페이지를 검색하고 검색된 웹페이지 내에서 용언을 포함한 문장을 수집하는 단계; 및 수집된 용언을 포함한 문장들에서 명사를 추출하는 단계;를 포함하는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법을 제공할 수 있다.The embodiment searches a web page including the received food name search word, which is executed by a processor according to a control command provided by a food menu noun extraction program code stored in a memory, and searches for a sentence including the food name search word in the searched web page. Collecting; extracting verbs from sentences including collected food name search words; searching for a web page using the extracted verb as a search term and collecting sentences including the verb in the searched web page; and extracting nouns from sentences including the collected verbs; a food menu noun extraction method using parts of speech such as verbs and adjectives may be provided.

다른 측면에서, 추출된 명사가 사전 데이터베이스 상의 등록 명사인지 여부를 판단하여, 상기 사전 데이터베이스에 등록되지 않은 미등록명사를 추출하여 표시하는 단계;를 더 포함하는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법을 제공할 수 있다.In another aspect, determining whether the extracted noun is a registered noun on the dictionary database, extracting and displaying unregistered nouns not registered in the dictionary database; food menu noun using parts of speech such as verbs and adjectives further comprising extraction methods can be provided.

또 다른 측면에서, 클라이언트 장치는 수신한 음식명 검색어를 서버로 전송하고, 상기 서버는 수신된 음식명 검색어를 포함하는 웹페이지를 검색하고, 검색된 웹페이지 내에서 음식명 검색어를 포함한 문장을 수집하고, 수집된 음식명 검색어를 포함한 문장들에서 용언을 추출하고, 추출된 용언을 검색어로 하여 웹페이지를 검색하고 검색된 웹페이지 내에서 용언을 포함한 문장을 수집하며, 수집된 용언을 포함한 문장들에서 명사를 추출하는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템을 제공할 수 있다.In another aspect, the client device transmits the received food name search term to the server, the server searches for a web page including the received food name search term, collects sentences including the food name search term in the searched web page, and , Extract verbs from sentences including the collected food name search terms, search web pages using the extracted verbs as search terms, collect sentences including the verbs from the searched webpages, and search for nouns from the sentences including the collected verbs. It is possible to provide a system for extracting food menu nouns using parts of speech such as verbs and adjectives.

다른 측면에서, 상기 서버는 기 등록된 관심 모니터링 사이트 목록 정보에 해당하는 사이트 상에서 상기 음식명 검색어를 포함하는 웹페이지를 검색하는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템을 제공할 수 있다.In another aspect, the server may provide a system for extracting food menu nouns using parts of speech such as verbs and adjectives for searching a web page including the food name search term on a site corresponding to pre-registered interest monitoring site list information. there is.

다른 측면에서, 상기 서버는 상기 음식명 검색어에 기초하여 이미 검색된 웹페이지와 동일한 웹페이지와 중복되는 웹페이지를 제외한 다른 웹페이지 내에서 용언을 포함한 문장을 수집하는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템을 제공할 수 있다.In another aspect, the server collects sentences including verbs in other web pages except for web pages that overlap with the same web page as the web page already searched based on the food name search term, and the food using parts of speech such as verbs and adjectives. A system for extracting menu nouns can be provided.

다른 측면에서, 상기 서버는 추출된 명사들 각각을 미리 저장된 사전 데이터베이스 상에서 검색하여, 상기 추출된 명사들 각각을 상기 미리 저장된 사전 데이터베이스에 등록된 등록 명사 및 상기 사전 데이터베이스에 등록되지 않은 미등록 명사로 분류하는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템을 제공할 수 있다.In another aspect, the server searches each of the extracted nouns on a pre-stored dictionary database, and classifies each of the extracted nouns into registered nouns registered in the pre-stored dictionary database and unregistered nouns not registered in the dictionary database. It is possible to provide a system for extracting food menu nouns using parts of speech such as verbs and adjectives.

다른 측면에서, 상기 서버는 상기 사전 데이터베이스 상에서 상기 등록 명사의 의미 정보를 분석하여 상기 등록 명사들 중에서 등록 음식명 명사를 추출하는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템을 제공할 수 있다.In another aspect, the server may provide a system for extracting food menu nouns using parts of speech such as verbs and adjectives for extracting registered food nouns from among the registered nouns by analyzing semantic information of the registered nouns on the dictionary database. there is.

다른 측면에서, 상기 서버는 상기 등록 음식명 명사와 상기 미등록 음식명 명사 상호간의 음절간의 동일성 여부를 판단하여 상기 등록 음식명 명사와 상기 미등록 음식명 명사 상호간의 유사도를 계산하고, 상기 서버는 상기 미등록 명사들 및 상기 등록 음식명 명사 각각의 추출 빈도 정보를 계산하는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템을 제공할 수 있다.In another aspect, the server calculates a degree of similarity between the registered food noun and the unregistered food noun by determining whether syllables between the registered food noun and the unregistered food noun are identical, and the server calculates a degree of similarity between the registered food noun and the unregistered food noun. It is possible to provide a system for extracting food menu nouns using parts of speech such as nouns and verbs and adjectives that calculate extraction frequency information of each of the nouns and the registered food name nouns.

다른 측면에서, 상기 클라이언트 장치는 상기 미등록 명사들을 수신하고, 상기 유사도 또는 상기 추출 빈도 정보에 기초하여 상기 미등록 명사들을 정렬하여 표시하고, 상기 클라이언트 장치는 상기 등록 음식명 명사를 수신하고, 상기 등록 음식명 명사의 검출 빈도수에 기초하여 상기 등록 음식명 명사를 정렬하여 표시하는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템을 제공할 수 있다.In another aspect, the client device receives the unregistered nouns, sorts and displays the unregistered nouns based on the similarity or the extraction frequency information, the client device receives the registered food noun, and the registered food It is possible to provide a system for extracting food menu nouns using parts of speech such as verbs and adjectives in which the registered food nouns are sorted and displayed based on the detection frequency of the nouns.

다른 측면에서, 상기 클라이언트 장치는 표시된 미등록 명사들 중 어느 하나의 선택에 응답하여 상기 서버로부터 선택된 미등록 명사를 포함한 문장 정보를 수신하여 표시하고, 상기 문장 정보에는 상기 선택된 미등록 명사가 하이라이트 되어 표시되는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템을 제공할 수 있다.In another aspect, the client device receives and displays sentence information including the selected unregistered noun from the server in response to selection of any one of the displayed unregistered nouns, and in the sentence information, the selected unregistered noun is highlighted and displayed as a verb. A system for extracting food menu nouns using parts of speech such as and adjectives can be provided.

다른 측면에서, 상기 클라이언트 장치는 표시된 문장에서 드레그된 텍스트 정보인 등록용 텍스트 정보를 상기 선택된 미등록 명사 정보의 의미 정보로서 사용자용 사전 데이터베이스에 등록하는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템을 제공할 수 있다.On the other hand, the client device registers text information for registration, which is text information dragged from a displayed sentence, in a user dictionary database as semantic information of the selected unregistered noun information Extracting food menu nouns using parts of speech such as verbs and adjectives system can be provided.

다른 측면에서, 상기 클라이언트 장치는 표시된 문장에서 드레그된 텍스트 정보인 등록용 텍스트 정보 및 상기 선택된 미등록 명사 정보를 상기 서버로 전송하고, 상기 서버는 상기 선택된 미등록 명사 정보에 매칭된 등록용 텍스트 정보를 복수의 클라이언트 장치들로부터 수집하고, 기 설정치 이상의 유사도를 나타내는 등록용 텍스트 정보들의 개수를 산출하여 기설정치 이상이면 상기 등록용 텍스트 정보 중 어느 하나의 텍스트 정보를 상기 미등록 명사 정보의 의미 정보로서 상기 사전 데이터베이스에 등록하는 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템을 제공할 수 있다.In another aspect, the client device transmits text information for registration, which is text information dragged from a displayed sentence, and the selected unregistered noun information to the server, and the server transmits a plurality of text information for registration matched to the selected unregistered noun information. is collected from client devices, calculates the number of pieces of text information for registration showing a degree of similarity equal to or greater than a preset value, and if the number is equal to or greater than the preset value, any one of the text information for registration is used as semantic information of the non-registered noun information in the dictionary database. It is possible to provide a system for extracting food menu nouns using parts of speech such as verbs and adjectives registered in .

본 발명에 따른 실시예는 문장 내 명사의 특성을 표현하는 동사와 형용사를 이용하여 보다 방대한 음식 명사 사전을 구축하는 방법을 제공할 수 있다.Embodiments according to the present invention may provide a method of constructing a more extensive food noun dictionary using verbs and adjectives expressing characteristics of nouns in sentences.

또한, 실시예는 음식 이름은 각기 다르지만 음식을 표현하는 동사와 형용사는 같은 표현을 사용하는 점을 이용하여 음식명 검색어로부터 추출된 용언이 사용된 다양한 음식명 명사를 추출할 수 있는 음식 메뉴 명사 추출 방법 및 이를 위한 시스템을 제공할 수 있다.In addition, the embodiment extracts food menu nouns capable of extracting various food nouns using verbs extracted from food name search words by using the fact that food names are different but verbs and adjectives expressing food use the same expression. A method and a system therefor can be provided.

또한, 실시예는 사전 데이터베이스 등록되지 않은 미등록 명사를 추출하여 최근 트렌드에 따라 다양하게 표현되는 명사를 광고용 태그로 활용할 수 있도록 하는 음식 메뉴 명사 추출 방법 및 이를 위한 시스템을 제공할 수 있다.In addition, the embodiment may provide a food menu noun extraction method and system for extracting unregistered nouns not registered in a dictionary database and utilizing nouns expressed in various ways according to recent trends as advertisement tags.

또한, 실시예는 사전 데이터베이스 등록되지 않은 미등록 명사를 추출하여 최근 트렌드에 따라 다양하게 표현되는 명사에 대한 의미 정보를 사전 데이터베이스에 업데이트할 수 있도록 하는 음식 메뉴 명사 추출 방법 및 이를 위한 시스템을 제공할 수 있다.In addition, the embodiment can provide a food menu noun extraction method and system for extracting unregistered nouns that are not registered in the dictionary database and updating semantic information about nouns expressed in various ways according to recent trends in the dictionary database. there is.

또한, 실시예는 특정 용언에 의해 수식되는 음식명의 명사에 대한 정보를 확인할 수 있도록 하는 음식 메뉴 명사 추출 방법 및 이를 위한 시스템을 제공할 수 있다.In addition, the embodiment may provide a method for extracting food menu nouns and a system therefor, which enables checking information on nouns of food names modified by specific terms.

도 1은 본 개시내용의 실시형태들에 따른, 단독으로 사용될 수 있거나 혹은 네트워크화된 구성으로 사용될 수 있는 다양한 컴퓨팅 장치(computing device)들을 도시하는 컴퓨터 시스템의 개략적 도면을 제시한다.
도 2는 일 실시예에 따른 클라이언트 장치 및 서버의 내부 구성을 설명하기 위한 것이다.
도 3a 내지 도 3c는 본 발명의 다양한 실시예에 따른 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법에 대한 흐름도이다.
도 4 내지 도 7은 음식 메뉴 명사 추출 프로그램의 실행에 따라 클라이언트 장치에서 표시되는 유저 인터페이스를 개략적으로 나타낸 것이다.
1 presents a schematic diagram of a computer system showing various computing devices that may be used alone or in a networked configuration, in accordance with embodiments of the present disclosure.
2 is for explaining internal configurations of a client device and a server according to an exemplary embodiment.
3A to 3C are flowcharts of a food menu noun extraction method using parts of speech such as verbs and adjectives according to various embodiments of the present invention.
4 to 7 schematically illustrate a user interface displayed on a client device according to execution of a food menu noun extraction program.

본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 본 발명의 효과 및 특징, 그리고 그것들을 달성하는 방법은 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 다양한 형태로 구현될 수 있다. 이하의 실시예에서, 제1, 제2 등의 용어는 한정적인 의미가 아니라 하나의 구성 요소를 다른 구성 요소와 구별하는 목적으로 사용되었다. 또한, 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 또한, 포함하다 또는 가지다 등의 용어는 명세서상에 기재된 특징, 또는 구성요소가 존재함을 의미하는 것이고, 하나 이상의 다른 특징들 또는 구성요소가 부가될 가능성을 미리 배제하는 것은 아니다. 또한, 도면에서는 설명의 편의를 위하여 구성 요소들이 그 크기가 과장 또는 축소될 수 있다. 예컨대, 도면에서 나타난 각 구성의 크기 및 두께는 설명의 편의를 위해 임의로 나타내었으므로, 본 발명이 반드시 도시된 바에 한정되지 않는다.Since the present invention can apply various transformations and have various embodiments, specific embodiments will be illustrated in the drawings and described in detail in the detailed description. Effects and features of the present invention, and methods for achieving them will become clear with reference to the embodiments described later in detail together with the drawings. However, the present invention is not limited to the embodiments disclosed below and may be implemented in various forms. In the following embodiments, terms such as first and second are used for the purpose of distinguishing one component from another component without limiting meaning. Also, expressions in the singular number include plural expressions unless the context clearly dictates otherwise. In addition, terms such as include or have mean that features or elements described in the specification exist, and do not preclude the possibility that one or more other features or elements may be added. In addition, in the drawings, the size of components may be exaggerated or reduced for convenience of description. For example, since the size and thickness of each component shown in the drawings are arbitrarily shown for convenience of description, the present invention is not necessarily limited to the illustrated bar.

이하, 첨부된 도면을 참조하여 본 발명의 실시예들을 상세히 설명하기로 하며, 도면을 참조하여 설명할 때 동일하거나 대응하는 구성 요소는 동일한 도면부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings, and when describing with reference to the drawings, the same or corresponding components are assigned the same reference numerals, and overlapping descriptions thereof will be omitted. .

도 1은 본 개시내용의 실시형태들에 따른, 단독으로 사용될 수 있거나 혹은 네트워크화된 구성으로 사용될 수 있는 다양한 컴퓨팅 장치(computing device)들을 도시하는 컴퓨터 시스템의 개략적 도면을 제시한다. 예를 들어, 본 도면은 네트워크(300)를 통해 통신하는 클라이언트 장치(100)와 서버(200)를 갖는 컴퓨터 시스템(10)을 예시한다. 1 presents a schematic diagram of a computer system showing various computing devices that may be used alone or in a networked configuration, in accordance with embodiments of the present disclosure. For example, this figure illustrates a computer system 10 having a server 200 and a client device 100 communicating over a network 300 .

클라이언트 장치(100)는 이동형 단말(101) 이거나 고정형 단말(102)일 수 있다. 예를 들어, 클라이언트 장치(100)는 스마트폰(smart phone), 휴대폰, 네비게이션, 컴퓨터, 노트북, 디지털방송용 단말, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 태블릿 PC 등이 있다.The client device 100 may be a mobile terminal 101 or a fixed terminal 102 . For example, the client device 100 includes a smart phone, a mobile phone, a navigation device, a computer, a laptop computer, a digital broadcasting terminal, a personal digital assistant (PDA), a portable multimedia player (PMP), a tablet PC, and the like.

서버(200)는 적어도 하나의 클라이언트 장치(100)와 네트워크(300)를 통해 통신하여 명령, 코드, 파일, 컨텐츠, 서비스 등을 제공하는 컴퓨팅 장치 또는 복수의 컴퓨팅 장치들로 구현될 수 있다.The server 200 may be implemented as a computing device or a plurality of computing devices that communicate with at least one client device 100 through the network 300 to provide commands, codes, files, content, services, and the like.

통신 방식은 제한되지 않으며, 네트워크(300)가 포함할 수 있는 통신망(일례로, 이동통신망, 유선 인터넷, 무선 인터넷, 방송망)을 활용하는 통신 방식뿐만 아니라 기기들간의 근거리 무선 통신 역시 포함될 수 있다. 예를 들어, 네트워크(300)는, PAN(personal area network), LAN(local area network), CAN(campus area network), MAN(metropolitan area network), WAN(wide area network), BBN(broadband network), 인터넷 등의 네트워크 중 하나 이상의 임의의 네트워크를 포함할 수 있다. 또한, 네트워크(300)는 버스 네트워크, 스타 네트워크, 링 네트워크, 메쉬 네트워크, 스타-버스 네트워크, 트리 또는 계층적(hierarchical) 네트워크 등을 포함하는 네트워크 토폴로지 중 임의의 하나 이상을 포함할 수 있으나, 이에 제한되지 않는다.The communication method is not limited, and short-distance wireless communication between devices as well as a communication method utilizing a communication network (eg, a mobile communication network, a wired Internet, a wireless Internet, and a broadcasting network) that the network 300 may include may also be included. For example, the network 300 includes a personal area network (PAN), a local area network (LAN), a campus area network (CAN), a metropolitan area network (MAN), a wide area network (WAN), and a broadband network (BBN). , one or more arbitrary networks such as the Internet. In addition, the network 300 may include any one or more of network topologies including a bus network, a star network, a ring network, a mesh network, a star-bus network, a tree or a hierarchical network, and the like. Not limited.

클라이언트 장치(100)는 검색어를 사용하여 검색 동작을 개시시키기 위해 사용자로 하여금 검색어를 제출하도록 할 수 있다. 서버(200)는 검색어를 수신하고, 검색어를 사용하여 검색 동작을 수행한다. 또한, 서버(200)는 검색 결과를 클라이언트 장치(100)로 제공하는 동작을 수행할 수 있다. 또한, 서버(200)는 클라이언트 장치(100)로 제공한 검색 결과 정보에 기반하여 클라이언트 장치(100)로부터 수신한 추가적인 정보의 요청에 응답하여 클라이언트 장치(100)로 요청한 정보를 전송할 수도 있다.The client device 100 may prompt a user to submit a search term to initiate a search operation using the search term. The server 200 receives a search word and performs a search operation using the search word. In addition, the server 200 may perform an operation of providing search results to the client device 100 . In addition, the server 200 may transmit the requested information to the client device 100 in response to a request for additional information received from the client device 100 based on the search result information provided to the client device 100 .

일례로, 서버(160)는 네트워크(300)를 통해 접속한 클라이언트 장치(100)로 음식 메뉴 명사 추출을 위한 어플리케이션의 설치를 위한 파일을 제공할 수 있다. 이 경우 클라이언트 장치(100)는 서버(200)로부터 제공된 파일을 이용하여 음식 메뉴 명사 추출을 위한 어플리케이션을 설치할 수 있다. 또한, 클라이언트 장치(100)가 포함하는 운영체제(Operating System, OS) 및 적어도 하나의 프로그램(일례로 브라우저나 상기 설치된 어플리케이션)의 제어에 따라 서버(200)에 접속하여 서버(200)가 제공하는 서비스나 컨텐츠를 제공받을 수 있다. 예를 들어, 클라이언트 장치(100)가 어플리케이션의 제어에 따라 네트워크(300)를 통해 서비스 요청 메시지를 서버(200)로 전송하면, 서버(200)는 서비스 요청 메시지에 대응하는 코드를 클라이언트 장치(100)로 전송할 수 있고, 클라이언트 장치(100)는 어플리케이션의 제어에 따라 코드에 따른 화면을 구성하여 표시함으로써 사용자에게 컨텐츠를 제공할 수 있다.For example, the server 160 may provide a file for installing an application for extracting food menu nouns to the client device 100 connected through the network 300 . In this case, the client device 100 may install an application for extracting food menu nouns using a file provided from the server 200 . In addition, services provided by the server 200 by accessing the server 200 under the control of an operating system (OS) included in the client device 100 and at least one program (for example, a browser or the installed application). I can provide content. For example, when the client device 100 transmits a service request message to the server 200 through the network 300 under the control of an application, the server 200 transmits a code corresponding to the service request message to the client device 100. ), and the client device 100 can provide content to the user by configuring and displaying a screen according to the code under the control of the application.

도 2는 일 실시예에 따른 클라이언트 장치 및 서버의 내부 구성을 설명하기 위한 것이다.2 is for explaining internal configurations of a client device and a server according to an exemplary embodiment.

도 2에서는 하나의 클라이언트 장치(100) 및 하나의 서버(200)에 대한 예로서 이들의 내부 구성을 설명한다. 또한, 클라이언트 장치(100) 및 서버(200)는 도 1에서 설명한 네트워크 환경에 포함될 수 있는 또 다른 클라이언트 장치나 또 다른 서버들에도 동일한 또는 유사한 내부 구성요소들이 적용될 수 있다.2 shows an example of one client device 100 and one server 200, and their internal configurations are described. In addition, the same or similar internal components of the client device 100 and the server 200 may be applied to another client device or another server that may be included in the network environment described in FIG. 1 .

클라이언트 장치(100)와 서버(200)는 각각 적어도 하나의 메모리(110, 210), 적어도 하나의 프로세서(120, 220) 및 통신 모듈(130, 230) 그리고 입출력 인터페이스(140, 240)를 포함할 수 있다. 메모리(110, 210)는 컴퓨터에서 판독 가능한 기록 매체로서, RAM(random access memory), ROM(read only memory) 및 디스크 드라이브와 같은 비소멸성 대용량 기록장치(permanent mass storage device)를 포함할 수 있다. 또한, 메모리(110, 210)에는 운영체제와 적어도 하나의 프로그램 코드(일례로 클라이언트 장치(100)에 설치되어 구동되는 브라우저나 상술한 어플리케이션 등을 위한 코드)가 저장될 수 있다. 이러한 소프트웨어 구성요소들은 드라이브 메커니즘(drive mechanism)을 이용하여 메모리(110, 210)와는 별도의 컴퓨터에서 판독 가능한 기록 매체로부터 로딩될 수 있다. 이러한 별도의 컴퓨터에서 판독 가능한 기록 매체는 플로피 드라이브, 디스크, 테이프, DVD/CD-ROM 드라이브, 메모리 카드 등의 컴퓨터에서 판독 가능한 기록 매체를 포함할 수 있다. 다른 실시예에서 소프트웨어 구성요소들은 컴퓨터에서 판독 가능한 기록 매체가 아닌 통신 모듈(130, 230)을 통해 메모리(110, 210)에 로딩될 수도 있다. 예를 들어, 적어도 하나의 프로그램은 개발자들 또는 어플리케이션의 설치 파일을 배포하는 파일 배포 시스템(일례로 상술한 서버(200))이 네트워크(300)를 통해 제공하는 파일들에 의해 설치되는 프로그램(일례로 상술한 어플리케이션)에 기반하여 메모리(110, 210)에 로딩될 수 있다. 프로세서(120, 220)는 기본적인 산술, 로직 및 입출력 연산을 수행함으로써, 컴퓨터 프로그램의 명령을 처리하도록 구성될 수 있다. 명령은 메모리(110, 210) 또는 통신 모듈(130, 230)에 의해 프로세서(120, 220)로 제공될수 있다. 예를 들어 프로세서(120, 220)는 메모리(110, 210)와 같은 기록 장치에 저장된 프로그램 코드에 따라 수신되는 명령을 실행하도록 구성될 수 있다. 통신 모듈(130, 230)은 네트워크(300)를 통해 클라이어트 장치(100)와 서버(200)가 서로 통신하기 위한 기능을 제공할 수 있으며, 다른 클라이언트 장치 또는 다른 서버와 통신하기 위한 기능을 제공할 수 있다. 일례로, 클라이언트 장치(100)의 프로세서(120)가 메모리(110)와 같은 기록 장치에 저장된 프로그램 코드에 따라 생성한 요청이 통신 모듈(130)의 제어에 따라 네트워크(300)를 통해 서버(200)로 전달될 수 있다. 역으로, 서버(200)의 프로세서(220)의 제어에 따라 제공되는 제어 신호나 명령, 컨텐츠, 파일 등이 통신 모듈(230)과 네트워크(300)를 거쳐 클라이언트 장치(100)의 통신모듈(130)을 통해 클라이언트 장치(100)로 수신될 수 있다. 예를 들어 통신 모듈(230)을 통해 수신된 서버(200)의 제어 신호나 명령 등은 프로세서(220)나 메모리(210)로 전달될 수 있고, 컨텐츠나 파일 등은 클라이언트 장치(100)가 더 포함할 수 있는 저장 매체로 저장될 수 있다.The client device 100 and the server 200 may include at least one memory 110 and 210, at least one processor 120 and 220, communication modules 130 and 230, and input/output interfaces 140 and 240, respectively. can The memories 110 and 210 are computer-readable recording media and may include a random access memory (RAM), a read only memory (ROM), and a permanent mass storage device such as a disk drive. In addition, the memories 110 and 210 may store an operating system and at least one program code (for example, a code for a browser installed and driven in the client device 100 or the above-described application). These software components may be loaded from a computer-readable recording medium separate from the memories 110 and 210 using a drive mechanism. The separate computer-readable recording medium may include a computer-readable recording medium such as a floppy drive, a disk, a tape, a DVD/CD-ROM drive, and a memory card. In another embodiment, software components may be loaded into the memory 110 or 210 through the communication module 130 or 230 rather than a computer-readable recording medium. For example, at least one program is a program installed by files provided by developers or a file distribution system (eg, the server 200 described above) that distributes installation files of applications through the network 300 (eg, the above-described server 200). It may be loaded into the memory 110 or 210 based on the above-described application). The processors 120 and 220 may be configured to process commands of a computer program by performing basic arithmetic, logic, and input/output operations. Instructions may be provided to the processors 120 and 220 by the memories 110 and 210 or the communication modules 130 and 230. For example, the processors 120 and 220 may be configured to execute received instructions according to program codes stored in a recording device such as the memory 110 and 210 . The communication modules 130 and 230 may provide a function for the client device 100 and the server 200 to communicate with each other through the network 300 and to provide a function for communicating with other client devices or other servers. can For example, a request generated by the processor 120 of the client device 100 according to a program code stored in a recording device such as the memory 110 is transferred to the server 200 through the network 300 under the control of the communication module 130. ) can be transmitted. Conversely, control signals, commands, contents, files, etc. provided under the control of the processor 220 of the server 200 pass through the communication module 230 and the network 300 to the communication module 130 of the client device 100. ) through the client device 100. For example, control signals or commands of the server 200 received through the communication module 230 may be transmitted to the processor 220 or memory 210, and content or files may be transferred to the client device 100 further. It can be stored in a storage medium that can include.

입출력 인터페이스(140, 240)는 입출력 장치(141, 241)와의 인터페이스를 위한 수단일 수 있다. 예를 들어, 입력 장치는 키보드 또는 마우스 등의 장치를, 그리고 출력 장치는 어플리케이션의 통신 세션을 표시하기 위한 디스플레이와 같은 장치를 포함할 수 있다. 다른 예로 입출력 인터페이스(140, 240)는 터치스크린과 같이 입력과 출력을 위한 기능이 하나로 통합된 장치와의 인터페이스를 위한 수단일 수도 있다. 보다 구체적인 예로, 클라이언트 장치(100)의 프로세서(120)는 메모리(110)에 로딩된 컴퓨터 프로그램의 명령을 처리함에 있어서 서버(200)나 클라이언트 장치(100)가 제공하는 데이터를 이용하여 구성되는 서비스 화면이나 컨텐츠가 입출력 인터페이스(140)를 통해 디스플레이에 표시될 수 있다.The input/output interfaces 140 and 240 may be means for interface with the input/output devices 141 and 241 . For example, the input device may include a device such as a keyboard or mouse, and the output device may include a device such as a display for displaying a communication session of an application. As another example, the input/output interfaces 140 and 240 may be means for interface with a device in which functions for input and output are integrated into one, such as a touch screen. As a more specific example, the processor 120 of the client device 100 is a service configured using data provided by the server 200 or the client device 100 in processing a command of a computer program loaded into the memory 110. A screen or content may be displayed on the display through the input/output interface 140 .

또한, 다른 실시예들에서 클라이언트 장치(100) 및 서버(200)는 도 2의 구성요소들보다 더 많은 구성요소들을 포함할 수도 있다. 그러나, 대부분의 종래기술적 구성요소들을 명확하게 도시할 필요성은 없다. 예를 들어, 클라이언트 장치(100)는 상술한 입출력 장치(141) 중 적어도 일부를 포함하도록 구현되거나 또는 트랜시버(transceiver), GPS(Global Positioning System) 모듈, 카메라, 각종 센서, 데이터베이스 등과 같은 다른 구성요소들을 더 포함할 수도 있다.Also, in other embodiments, the client device 100 and the server 200 may include more components than those of FIG. 2 . However, there is no need to clearly show most of the prior art components. For example, the client device 100 is implemented to include at least some of the above-described input/output devices 141 or other components such as a transceiver, a Global Positioning System (GPS) module, a camera, various sensors, and a database. may further include.

도 3a 내지 도 3c는 본 발명의 다양한 실시예에 따른 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법에 대한 흐름도이다.3A to 3C are flowcharts of a food menu noun extraction method using parts of speech such as verbs and adjectives according to various embodiments of the present invention.

도 3a를 참조하면, 본 발명의 실시예에 따른 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법(S100)은 음식명을 이용하여 검색을 진행하는 단계(S110), 음식명을 포함한 문장을 수집하는 단계(S120), 음식명이 포함된 문장 내에서 용언을 추출하는 단계(S130), 추출된 용언을 이용하여 검색을 진행하는 단계(S140), 용언을 포함한 문장을 수집하는 단계(S150), 용언이 포함된 문장 내에서 음식명에 해당하는 명사를 추출하는 단계(S160) 및 추출된 음식명을 기 등록된 음식명과 비교하여 저장하는 단계(S170)를 포함할 수 있다.Referring to FIG. 3A , in the food menu noun extraction method (S100) using parts of speech such as verbs and adjectives according to an embodiment of the present invention, a search is performed using the food name (S110), and a sentence including the food name is searched. Collecting (S120), extracting verbs from sentences including food names (S130), performing a search using the extracted verbs (S140), collecting sentences including verbs (S150), It may include extracting a noun corresponding to the food name from the sentence including the verb (S160) and comparing the extracted food name with a pre-registered food name and storing it (S170).

도 3b를 참조하면, 다른 실시에에 따른 품사를 이용한 음식 메뉴 명사 추출 방법(S200)은 음식명을 이용하여 검색을 진행하는 단계(S210), 음식명을 포함한 문장을 수집하는 단계(S220), 음식명이 포함된 문장 내에서 용언을 추출하는 단계(S230), 동일한 용언의 검출 빈도수가 기 설정치 이상의 용언을 이용하여 검색을 진행하는 단계(S240), 용언을 포함한 문장을 수집하는 단계(S250), 용언이 포함된 문장 내에서 음식명에 해당하는 명사를 추출하는 단계(S260) 및 추출된 음식명을 기 등록된 음식명과 비교하여 저장하는 단계(S270)를 포함할 수 있다.Referring to FIG. 3B , a method of extracting food menu nouns using parts of speech according to another embodiment (S200) includes performing a search using food names (S210), collecting sentences including food names (S220), Extracting verbs from sentences including food names (S230), performing a search by using verbs whose frequency of detection of the same verb is higher than a preset value (S240), collecting sentences including verbs (S250), It may include extracting a noun corresponding to the food name from the sentence including the verb (S260) and comparing the extracted food name with a pre-registered food name and storing it (S270).

도 3c를 참조하면, 다른 실시예에 따른 품사를 이용한 음식 메뉴 명사 추출 방법(S300)은 음식명을 이용하여 검색을 진행하는 단계(S310), 음식명을 포함한 문장을 수집하는 단계(S320), 음식명이 포함된 문장 내에서 용언을 추출하는 단계(S330), 추출된 용언을 이용하여 검색을 진행하는 단계(S340), 용언을 포함한 문장을 수집하는 단계(S350), 용언이 포함된 문장 내에서 명사를 추출하는 단계(S360), 추출된 명사가 사전 데이터베이스의 등록 명사인지 판단하는 단계(S370), 추출된 명사가 사전 데이터베이스 상의 등록 명사가 아닌 경우 해당 명사를 미등록명사로 분류하는 단계(S371), 추출된 명사가 사전 데이터베이스의 등록 명사인 경우에는 해당 명사가 음식명에 해당하는지 여부를 판단하는 단계(S380), 등록 명사가 음식명에 해당하지 않는 경우 비음식명 명사로 분류하는 단계(S381) 및 등록 명사가 음식명에 해당하는 경우 등록 명사로 분류하는 단계(S390)를 포함할 수 있다.Referring to FIG. 3C , a method for extracting food menu nouns using parts of speech (S300) according to another embodiment includes performing a search using food names (S310), collecting sentences including food names (S320), Extracting verbs from sentences including food names (S330), performing a search using extracted verbs (S340), collecting sentences including verbs (S350), Extracting the noun (S360), determining whether the extracted noun is a registered noun in the dictionary database (S370), classifying the noun as an unregistered noun if the extracted noun is not a registered noun in the dictionary database (S371) , If the extracted noun is a registered noun in the dictionary database, determining whether the corresponding noun corresponds to a food name (S380), classifying the registered noun as a non-food noun if it does not correspond to a food name (S381). ) and classifying the registered noun as a registered noun (S390) if the registered noun corresponds to the food name.

이하, 본 발명의 실시예에 따른 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법(S100, S200, S300)의 각 단계를 구체적으로 설명한다.Hereinafter, each step of the food menu noun extraction method (S100, S200, S300) using parts of speech such as verbs and adjectives according to an embodiment of the present invention will be described in detail.

클라이언트 장치(100)는 메모리(110)에 저장된 클라이언트측 음식 메뉴 명사 추출 프로그램 코드가 제공하는 제어 명령에 따라 프로세서(120)에 의해 수행되는 다음의 기능을 제공할 수 있다.The client device 100 may provide the following functions performed by the processor 120 according to a control command provided by a client-side food menu noun extraction program code stored in the memory 110 .

클라이언트 장치(100)는 사용자로부터 입력된 음식명 검색어 정보를 수신할 수 있다.The client device 100 may receive food name search word information input from the user.

클라이언트 장치(100)는 수신한 음식명 검색어 정보를 서버(200)로 전송할 수 있다.The client device 100 may transmit the received food name search word information to the server 200 .

다양한 실시예에서, 사용자는 서버(200)의 입출력 장치(241)를 통해 서버(200)로 음식명 검색어 정보를 입력할 수도 있다.In various embodiments, a user may input food name search word information to the server 200 through the input/output device 241 of the server 200 .

서버(200)의 프로세서(220)는 메모리(210) 상에 서버측 음식 메뉴 명사 추출 프로그램 코드를 로딩하고 서버측 음식 메뉴 명사 추출 프로그램을 실행할 수 있다.The processor 220 of the server 200 may load the server-side food menu noun extraction program code onto the memory 210 and execute the server-side food menu noun extraction program.

서버(200)는 서버측 음식 메뉴 명사 추출 프로그램 코드가 제공하는 제어 명령에 따라 프로세서(220)에 의해 수행되는 검색 기능 및 용언 추출 기능 및 명사 추출 기능 및 검출 단어의 비교 기능, 정보의 저장/전송 기능 등을 제공할 수 있다.The server 200 performs a search function performed by the processor 220 according to a control command provided by the server-side food menu noun extraction program code, a noun extraction function, a noun extraction function, a comparison function of detected words, and storage/transmission of information. functions can be provided.

서버(200)의 크롤러는 수신한 음식명 검색어 정보에 기초하여 네트워크(300)에 연결된 웹서버를 순회하면서 음식명 검색어를 포함하는 웹 페이지를 검색하고 검색된 웹 페이지 내에서 적어도 하나의 문장을 수집할 수 있다.The crawler of the server 200 traverses the web servers connected to the network 300 based on the received food name search word information, searches for a web page including the food name search word, and collects at least one sentence from the searched web page. can

다양한 실시예에 따라, 서버(200)는 기 등록된 관심 모니터링 사이트 목록 정보에 기초하여 웹 페이지를 수집할 수 있다. 상세하게, 관심 모니터링 사이트 목록 정보는 관심 사이트 주소, 관심 언론사 사이트, 관심 URL, 블로그 주소, SNS 주소 등의 정보를 포함할 수 있다.According to various embodiments, the server 200 may collect web pages based on pre-registered interest monitoring site list information. In detail, the interest monitoring site list information may include information such as an interest site address, an interest media company site, an interest URL, a blog address, and an SNS address.

일부 실시예에서, 서버(200)는 관심 모니터링 사이트 목록 정보를 클라이언트 장치(100)로부터 수신할 수 있다.In some embodiments, the server 200 may receive interest monitoring site list information from the client device 100 .

일부 실시예에서, 관심 모니터링 사이트 목록은 수정, 삭제, 추가될 수 있다.In some embodiments, the list of monitoring sites of interest may be modified, deleted, or added.

서버(200)는 관심 모니터링 사이트 목록 상의 관심 사이트를 통해서 음식명 검색어를 포함하는 웹 페이지를 검색하고 웹 페이지 내에서 음식명 검색어를 포함하는 적어도 하나의 문장을 수집할 수 있다.The server 200 may search for a web page including a food name search word through the site of interest on the interest monitoring site list and collect at least one sentence including the food name search word in the web page.

서버(200)는 검색된 웹 페이지를 파싱하여 웹 페이지에 포함된 복수의 문장들을 식별할 수 있다. 일부 실시예에서, 서버(200)는 웹 페이지 상에서 종결어미를 식별하고, 식별된 종결어미를 기준으로 하여 웹 페이지 내에서 복수의 문장들을 식별할 수 있다. 다만, 이에 제한되는 것은 아니고 웹 페이지 내에 포함된 마침표, 물음표, 쉼표 등과 같은 부호를 식별하고 식별된 부호를 기준으로 웹 페이지에 포함된 각 문장들을 식별할 수 있다. The server 200 may parse the searched web page to identify a plurality of sentences included in the web page. In some embodiments, the server 200 may identify a final ending on the web page and identify a plurality of sentences within the web page based on the identified final ending. However, it is not limited thereto, and it is possible to identify symbols such as periods, question marks, commas, etc. included in the web page, and identify each sentence included in the web page based on the identified codes.

서버(200)는 식별된 문장들 중에서 음식명 검색어를 포함하는 문장을 추출할 수 있다. 서버(200)는 검색된 복수의 웹페이지 상에서 복수의 문장을 추출하여 수집할 수 있다.The server 200 may extract a sentence including a food name search word from among the identified sentences. The server 200 may extract and collect a plurality of sentences from a plurality of searched web pages.

서버(200)는 수집된 문장들 각각에서 용언을 추출할 수 있다. 용언은 대상의 동작과 상태의 성질을 나타내며 문장에서 서술하는 기능을 수행하는 단어들의 큰 부류로 하위 품사로는 동사와 형용사가 있다. 동사는 사람이나 사물의 움직임이나 과정 등을 나타내는 말이며 형용사는 사람이나 사물의 상태나 성질을 나타내는 단어를 말한다. 다양한 실시예에 따라, 서버(200)는 형태소 분석 기법 및/또는 자연어 처리 기법 등에 기초하여 수집된 문장들 각각에서 용언을 추출할 수 있으나, 용언을 추출하는 방법은 전술한 기법에 한정하는 것은 아니다. 또한, 여기서의 용언은 형용사와 동사를 의미한다.The server 200 may extract a verb from each of the collected sentences. A verb is a large class of words that represent the action and state of an object and perform a descriptive function in a sentence. Verbs are words that indicate the movement or process of a person or thing, and adjectives are words that indicate the state or quality of a person or thing. According to various embodiments, the server 200 may extract a verb from each of the collected sentences based on a morpheme analysis technique and/or a natural language processing technique, but the method of extracting the verb is not limited to the above technique. . Also, verbs here refer to adjectives and verbs.

서버(200)는 수집된 문장들 각각에서 용언을 추출함으로써 음식 메뉴를 수식할 수 있는 용언을 추출할 수 있다.The server 200 may extract verbs capable of modifying the food menu by extracting verbs from each of the collected sentences.

다양한 실시예에서, 서버(200)는 추출된 용언 정보를 클라이언트 장치(100)로 전송할 수 있다. 일부 실시예에서, 서버(200)는 추출된 형용사 정보를 클라이언트 장치(100)로 전송할 수 있다. 또한, 서버(200)는 동일한 용언의 추출 빈도를 계산하거나, 동일한 형용사의 추출 빈도를 계산하고 그 결과인 용언이나 형용사의 추출 빈도 정보를 클라이언트 장치(100)로 전송할 수도 있다.In various embodiments, the server 200 may transmit the extracted verb information to the client device 100 . In some embodiments, the server 200 may transmit the extracted adjective information to the client device 100 . In addition, the server 200 may calculate the extraction frequency of the same verb or the same adjective and transmit the resultant information about the extraction frequency of the verb or adjective to the client device 100 .

서버(200)는 추출된 용언을 검색어로 하여 네트워크(300)를 통해 웹 상에서 용언 검색어를 포함하는 웹 페이지를 검색하고 검색된 웹 페이지 내에서 적어도 하나의 문장을 수집할 수 있다. 문장을 수집하는 기법은 전술한 기법과 동일할 수 있다.The server 200 may use the extracted verb as a search word to search for a web page including the verb search word on the web through the network 300 and collect at least one sentence from the searched web page. A technique for collecting sentences may be the same as the above technique.

다양한 실시예에서, 서버(200)는 동일한 용언의 검출 빈도수를 계산할 수 있다. 서버(200)는 검출 빈도수가 기 설정치 이상인 용언들을 추출할 수 있다. 그리고, 서버(200)는 검출 빈도수가 기 설정치 이상으로 추출된 용언을 검색어로 하여 용언 검색어를 포함하는 웹 페이지를 검색하고 검색된 웹 페이지 내에서 용언을 포함하는 적어도 하나의 문장을 수집할 수도 있다.In various embodiments, server 200 may calculate the frequency of detection of the same term. The server 200 may extract terms whose detection frequency is greater than or equal to a preset value. In addition, the server 200 may use the extracted term having a detection frequency equal to or greater than a preset value as a search term to search for a web page including the term search term and collect at least one sentence including the term from the searched web page.

다양한 실시예에서, 서버(200)는 검색된 웹 페이지들 중에서 음식명 검색어에 기초하여 이미 검색된 웹페이지와 동일한 웹페이지를 제외시키는 중복제거 과정을 수행할 수 있다. 따라서, 사용자가 입력한 음식명 검색어가 다시 검색되는 사용자에게 제공되는 정보로 활용되는 문제를 최소화할 수 있다.In various embodiments, the server 200 may perform a duplicate removal process of excluding the same webpage as the webpage already searched based on the food name search word from among searched webpages. Accordingly, it is possible to minimize a problem in that the food name search word input by the user is used as information provided to a user who is searched again.

서버(200)는 수집된 문장에서 명사를 추출할 수 있다.The server 200 may extract nouns from the collected sentences.

서버(200)는 동일한 명사의 추출 빈도수를 계산할 수 있다.The server 200 may calculate the frequency of extraction of the same noun.

다양한 실시예에서, 서버(200)는 수집된 문장에서 검색어였던 용언에 의해 수식되는 명사를 추출할 수 있다. 따라서, 서버(200)는 음식명에 해당하는 명사를 추출할 수 있으나 추출된 명사에는 음식명과 관련이 없는 명사가 포함될 수도 있다.In various embodiments, the server 200 may extract nouns modified by terms that were search words from the collected sentences. Accordingly, the server 200 may extract nouns corresponding to food names, but the extracted nouns may include nouns unrelated to food names.

서버(200)는 추출된 명사들 각각을 미리 저장된 사전 데이터베이스 상에서 검색할 수 있다. 서버(200)는 추출된 명사들 중에서 사전 데이터베이스 상에서 검색이 가능한 명사인 경우 해당 명사의 의미 정보를 사전 데이터베이스 상에서 파악하여 검색된 명사가 음식 이름에 관한 것인지, 비음식명에 해당하는 것인지를 판단할 수 있다. 비음식명은 대명사, 장소 명칭 등 음식의 이름과는 관련이 없는 명사를 의미할 수 있다. 또한, 서버(200)는 사전 데이터베이스 상에서 검색되지 않는 명사들을 미등록 명사로 분류할 수 있다.The server 200 may search for each of the extracted nouns on a pre-stored dictionary database. If the noun is a noun searchable on the dictionary database among the extracted nouns, the server 200 can determine whether the searched noun corresponds to a food name or a non-food name by grasping semantic information of the corresponding noun on the dictionary database. there is. Non-food names may refer to nouns unrelated to food names, such as pronouns and place names. Also, the server 200 may classify nouns that are not searched on the dictionary database as unregistered nouns.

다양한 실시예에서, 서버(200)는 추출된 명사들 각각이 속한 문장에서의 명사 좌우의 문맥의 의미와 용언을 분석하여 명사가 음식명에 해당하는지 여부에 관한 추정치를 계산할 수 있다. 그리고, 서버(200)는 추정치가 기 설정치 이상인 명사들을 만을 검출하고, 검출된 명사들 각각에 대해서 사전 데이터베이스 상에서 검색이 되는지 여부를 판단하여 검출된 명사들을 등록 명사와 미등록 명사로 분류할 수 있다. 서버(200)는 사전 데이터베이스 상에서의 등록 명사의 의미 정보를 파악하여 등록 명사가 음식명에 해당하는지 여부를 확정할 수 있다.In various embodiments, the server 200 may calculate an estimate of whether the noun corresponds to a food name by analyzing contextual meanings and verbs on the left and right of the noun in a sentence to which each of the extracted nouns belongs. In addition, the server 200 may detect only nouns having an estimated value equal to or greater than a predetermined value, and classify the detected nouns into registered nouns and non-registered nouns by determining whether a search is performed on the dictionary database for each of the detected nouns. The server 200 may determine whether the registered noun corresponds to a food name by grasping semantic information of the registered noun on the dictionary database.

서버(200)는 등록 명사들 중에서 음식명에 해당하는 등록 음식명 명사를 추출할 수 있다.The server 200 may extract a registered food noun corresponding to a food name from registered nouns.

서버(200)는 미등록 명사들과 등록 음식명 명사의 음절간의 동일성 여부를 판단하여 등록 음식명 명사와 미등록 명사들 사이의 유사도를 계산할 수 있다.The server 200 may calculate the degree of similarity between the registered food nouns and the unregistered nouns by determining whether the syllables of the non-registered nouns and the registered food nouns are identical.

서버(200)는 미등록 명사들을 클라이언트 장치(100)로 전송할 수 있다. 또한, 서버(200)는 미등록 명사들의 추출 빈도 정보를 클라이언트 장치(100)로 전송할 수 있다. 또한, 서버(200)는 미등록 명사들과 등록 음식명 명사와의 유사도 정보를 클라이언트 장치(100)로 전송할 수 있다.The server 200 may transmit unregistered nouns to the client device 100 . In addition, the server 200 may transmit extraction frequency information of unregistered nouns to the client device 100 . In addition, the server 200 may transmit similarity information between unregistered nouns and registered food nouns to the client device 100 .

도 4 내지 도 7은 음식 메뉴 명사 추출 프로그램의 실행에 따라 클라이언트 장치에서 표시되는 유저 인터페이스를 개략적으로 나타낸 것이다.4 to 7 schematically illustrate a user interface displayed on a client device according to execution of a food menu noun extraction program.

도 4를 참조하면, 사용자는 클라이언트 장치(100)에서 표시된 유저 인터페이스 상의 검색창(sa)에 음식명 검색어를 입력한 후 검색 버튼을 선택하면, 클라이언트 장치(100)는 입력된 음식명 검색어 정보를 서버(200)로 전송할 수 있다. 서버(200)는 도 3a 내지 도 3b에서 설명한 바와 같이 수신한 음식명 검색어 정보에 기초하여 음식 메뉴 명사 추출을 실행할 수 있다.Referring to FIG. 4 , when the user inputs a food name search word into the search box sa on the user interface displayed on the client device 100 and selects a search button, the client device 100 returns the input food name search word information. It can be transmitted to the server 200. The server 200 may extract food menu nouns based on the received food name search word information as described with reference to FIGS. 3A to 3B .

검색창(sa)에 입력된 음식명 검색어가 사전 데이터베이스 상의 등록된 검색어인 경우, 클라이언트 장치(100)는 서버(200)로부터 사전 데이터베이스 상에 등록된 음식명 검색어에 대한 정보를 수신하여 음식명 검색어의 사전적 의미 정보를 사전적 의미 표시 영역(11) 상에 표시할 수 있다.When the food name search word input in the search window sa is a registered search word on the dictionary database, the client device 100 receives information on the food name search word registered on the dictionary database from the server 200 and receives the food name search word The dictionary meaning information of may be displayed on the dictionary meaning display area 11 .

다양한 실시예에서, 클라이언트 장치(100)는 입력된 음식명 검색어가 서버(200) 상의 사전 데이터베이스 상에 등록된 검색어에는 해당하지 않으나 사용자용 사전 데이터베이스 상에 등록된 검색어에 해당하는 경우 사용자용 사전 데이터베이스 상에서 음식명 검색어에 매칭된 의미 정보를 읽어 드려 사전적 의미 표시 영역(11) 상에 표시할 수도 있다.In various embodiments, the client device 100, when the input food name search word does not correspond to a search word registered on the dictionary database on the server 200 but corresponds to a search word registered on the user dictionary database, the user dictionary database It is also possible to read semantic information matched to the food name search word on the image and display it on the dictionary meaning display area 11 .

또한, 클라이언트 장치(100)는 서버(200)로부터 미등록 명사들의 정보를 수신하여 제1 및 제2 미등록 명사 표시 영역(12, 13) 상에 표시할 수 있다. 제1 미등록 명사 표시 영역(12) 상에는 등록 음식명 명사와의 유사도 정보에 기초하여 유사도가 높은 순위로 정렬되어 미등록 명사들이 표시될 수 있다. 제2 미등록 명사 표시 영역(13) 상에는 검출 빈도수가 높은 순위로 정렬되어 미등록 명사들이 표시될 수 있다.In addition, the client device 100 may receive information on unregistered nouns from the server 200 and display the information on the first and second unregistered noun display areas 12 and 13 . On the first unregistered noun display area 12 , unregistered nouns may be displayed by sorting them in a high order of similarity based on similarity information with registered food nouns. On the second unregistered noun display area 13, unregistered nouns may be displayed in a manner in which detection frequencies are ranked in a high order.

또한, 클라이언트 장치(100)는 서버(200)로부터 등록 음식명 명사 정보를 수신하여 등록 음식명 표시 영역(14) 상에 표시할 수 있다. 등록 음식명 표시 영역(14) 상에는 검출 빈도수가 높은 순위로 정렬되어 등록 음식명 명사가 표시될 수 있다. In addition, the client device 100 may receive registered food name noun information from the server 200 and display it on the registered food name display area 14 . On the registered food name display area 14, the detection frequency may be arranged in a high order and the registered food name noun may be displayed.

다양한 실시예에서, 클라이언트 장치(100)는 서버(200)로부터 검출된 용언의 정보를 수신하여 표시할 수도 있다. 일부 실시예에서, 클라이언트 장치(100)는 서버(200)로부터 수신한 용언을 검출 빈도수가 높은 순위로 정렬하여 표시할 수도 있다.In various embodiments, the client device 100 may receive and display information on the detected term from the server 200 . In some embodiments, the client device 100 may sort and display the terms received from the server 200 in order of highest frequency of detection.

다양한 실시예에서, 클라이언트 장치(100)는 제1 미등록 명사 표시 영역(12), 제2 미등록 명사 표시 영역(13), 등록 음식명 표시 영역(14) 상의 적어도 하나의 명사 및/또는 검출된 용언이 표시된 영역 상의 적어도 하나의 용언의 선택에 응답하여 태그어 저장 어포던스를 표시할 수 있다. 클라이언트 장치(100)는 태그어 저장 어포던스의 선택에 응답하여 선택된 모든 명사 및/또는 용언의 정보를 태그어로서 저장할 수 있다. 사용자는 검색창(sa)에 입력한 검색어와 관련한 음식을 광고하는데 있어서 이와 밀접한 관련성이 있는 명사, 예를 들어 음식명 검색어와 동일하거나 유사한 의미를 가지나 다르게 표현된 명사나 신조어, 해당 음식과 관련된 형용사를 확인하고, 이들을 태그어로써 저장할 수 있다. 그리고, 사용자는 광고 웹페이지를 제작시 저장된 태그어를 검색 태그어로 활용함으로써, 일반 사용자들이 다양한 검색어를 이용하여 웹페이지를 검색할 때 사용자가 등록한 광고물의 노출 가능성을 높인다.In various embodiments, the client device 100 may display at least one noun and/or a detected term on the first unregistered noun display area 12 , the second unregistered noun display area 13 , and the registered food name display area 14 . A tagged word storage affordance may be displayed in response to selection of at least one term in the displayed area. The client device 100 may store information of all selected nouns and/or verbs as tag words in response to selection of the tag word storage affordance. When a user advertises food related to a search term entered in the search box (sa), a noun closely related to it, for example, a noun or neologism that has the same or similar meaning as the food name search term but is expressed differently, and an adjective related to the food and save them as tag words. In addition, the user uses the stored tag word as a search tag word when creating the advertisement web page, thereby increasing the possibility of exposure of the advertisement registered by the user when general users search for the web page using various search words.

다양한 실시예에서, 클라이언트 장치(100)는 등록된 태그어 정보를 서버(200)로 전송할 수 있다. 서버(200)는 수신한 태그어 정보 내의 복수의 태그어들 중 사전 데이터베이스에 등록된 등록 음식명 명사와 용언을 제외한 나머지 태그어인 명사들을 추출할 수 있다. 서버(200)는 추출된 명사들 각각을 상표 권리 존부를 확인할 수 있는 외부 서버 상에서 조사함으로써 상표 권리 존재 여부를 판단할 수 있다. 서버(200)는 상표 권리가 존재하는 명사에 대한 정보를 클라이언트 장치(100)로 제공할 수 있다. 사용자는 태그어로 설정된 명사들 중에서 상표 권리가 존재하는 명사를 확인함으로써 상표 등록된 태그어를 검색 키워드로 사용함에 따른 법적 문제를 미연에 방지할 수 있다. In various embodiments, the client device 100 may transmit registered tag word information to the server 200 . The server 200 may extract nouns that are remaining tagwords excluding registered food nouns and adjectives registered in the dictionary database from among a plurality of tagwords in the received tagword information. The server 200 may determine whether trademark rights exist by examining each of the extracted nouns on an external server capable of confirming whether trademark rights exist. The server 200 may provide information on nouns for which trademark rights exist to the client device 100 . The user can prevent legal problems caused by using a registered tag word as a search keyword by checking nouns for which trademark rights exist among nouns set as tag words.

클라이언트 장치(100)는 제1 및 제2 미등록 명사 표시 영역(12, 13) 상에 표시된 복수의 미등록 명사 중 어느 하나의 선택에 응답하여 선택된 미등록 명사 정보를 서버(200)로 전송할 수 있다. 서버(200)는 선택된 미등록 명사를 추출했던 문장 정보를 클라이언트 장치(100)로 전송할 수 있다. 도 5를 참조하면, 클라이언트 장치(100)는 서버(200)로부터 수신한 문장 정보를 문장 표시 영역(15) 상에 표시할 수 있다. 일부 실시예에서, 문장 표시 영역(15) 상에서 선택된 미등록 명사가 하이라이트되어 표시될 수 있다.The client device 100 may transmit selected unregistered noun information to the server 200 in response to selection of any one of a plurality of unregistered nouns displayed on the first and second unregistered noun display areas 12 and 13 . The server 200 may transmit sentence information from which the selected unregistered noun was extracted to the client device 100 . Referring to FIG. 5 , the client device 100 may display sentence information received from the server 200 on the sentence display area 15 . In some embodiments, the unregistered noun selected on the sentence display area 15 may be highlighted and displayed.

다양한 실시예에서, 서버(200)는 선택된 미등록 명사를 추출했던 문장이 복수개인 경우 선택된 미등록 명사를 가장 많은 수로 포함하는 문장을 추출하여 클라이언트 장치(100)로 전송할 수 있다.In various embodiments, when there are a plurality of sentences from which the selected unregistered noun is extracted, the server 200 may extract a sentence including the selected unregistered noun in the largest number and transmit the extracted sentence to the client device 100 .

클라이언트 장치(100)는 문장 표시 영역(15) 상의 웹 페이지 이동 어포던스의 선택에 응답하여 문장 표시 영역(15) 상에 표시된 문장을 포함한 웹페이지를 전송할 것을 서버(200)로 요청할 수 있다. 서버(200)는 이에 응답하여 문장이 포함된 웹페이지 정보를 클라이언트 장치(100)로 전송할 수 있다. 도 6을 참조하면, 클라이언트 장치(100)는 서버(200)로부터 수신한 웹페이지 정보(16)을 표시할 수 있다.The client device 100 may request the server 200 to transmit the webpage including the sentence displayed on the sentence display area 15 in response to selection of the web page movement affordance on the sentence display area 15 . The server 200 may transmit webpage information including sentences to the client device 100 in response. Referring to FIG. 6 , the client device 100 may display web page information 16 received from the server 200 .

다양한 실시예에서, 클라이언트 장치(100)는 표시된 용언의 정보 내의 어느 하나의 용언의 선택과 미등록 명사들 중 어느 하나의 선택에 응답하여 선택된 용언과 선택된 미등록 명사를 포함하는 문장의 전송을 서버(200)로 요청할 수 있다. 서버(200)는 이에 응답하여 선택된 용언과 선택된 미등록 명사를 포함하는 문장이 존재하는 경우 해당 문장 정보를 클라이언트 장치(100)로 전송할 수 있다. 따라서, 사용자는 특정 용언에 의해 수식되는 미등록 명사와 관련된 정보를 확인할 수 있다. 이는 사용자가 '칼칼하다', '고소하다', '달다', '맵다', '새콤달콤하다' 등과 같은 사용자의 취향이 담긴 용언에 의해 수식되는 음식명의 미등록 명사와 관련된 정보를 포함한 문장을 확인할 수 있도록 한다.In various embodiments, the client device 100 transmits a sentence including the selected verb and the selected unregistered noun in response to selection of any one verb and non-registered nouns in displayed verb information to the server 200 ) can be requested. In response to this, the server 200 may transmit corresponding sentence information to the client device 100 when there is a sentence including the selected verb and the selected unregistered noun. Accordingly, the user can check information related to an unregistered noun modified by a specific term. This allows the user to check sentences containing information related to unregistered nouns of food names modified by terms containing the user's taste, such as 'spicy', 'sue', 'sweet', 'spicy', and 'sweet and sour'. make it possible

도 5 내지 도 7을 참조하면, 클라이언트 장치(100)는 설명 등록 어포던스의 선택에 응답하여 표시된 문장이나 표시된 웹페이지 상의 텍스트를 드레그할 수 있도록 하는 인터페이스를 제공할 수 있다. 사용자는 설명 등록 어포던스를 선택한 후에 표시된 문장이나 표시된 웹페이지 상의 문장들 내의 텍스트의 적어도 일부를 드레그할 수 있다. 클라이언트 장치(100)는 드레그에 응답하여 드레그된 텍스트(td1, td2)를 하이라이트하여 표시할 수 있다. 클라이언트 장치(100)는 텍스트의 드레그가 감지되면 사전 등록 어포던스를 표시할 수 있다. 클라이언트 장치(100)는 사전 등록 어포던스의 선택에 응답하여 드레그된 텍스트를 도 4에서 선택한 미등록 명사에 매칭하여 해당 미등록 명사의 의미 정보로서 사용자용 사전 데이터베이스에 저장할 수 있다. 또한, 클라이언트 장치(100)는 도 4에서 선택한 드레그된 텍스트 정보인 등록용 텍스트 정보와 미등록 명사를 서버(200)로 전송할 수 있다.Referring to FIGS. 5 to 7 , the client device 100 may provide an interface allowing text to be dragged on a displayed sentence or displayed webpage in response to selection of a description registration affordance. After selecting the description registration affordance, the user may drag at least a part of the text within the displayed sentence or sentences on the displayed web page. The client device 100 may highlight and display the dragged texts td1 and td2 in response to the drag. The client device 100 may display a pre-registration affordance when text dragging is detected. The client device 100 may match the dragged text to the unregistered noun selected in FIG. 4 in response to the selection of the pre-registered affordance and store the semantic information of the unregistered noun in the user dictionary database. In addition, the client device 100 may transmit registration text information and unregistered noun, which are dragged text information selected in FIG. 4 , to the server 200 .

서버(200)는 복수의 클라이언트 장치들로부터 미등록 명사 정보와 해당 미등록 명사에 사용자들이 매칭시킨 등록용 텍스트 정보들을 수신할 수 있다. 예를 들어, 서버(200)는 10개의 클라이언트 장치로부터 동일한 미등록 명사에 매칭된 10개의 등록용 텍스트 정보들을 수신할 수 있다. 서버(200)는 10개의 등록용 텍스트 정보들 상호간의 유사도를 검출할 수 있다. 10개의 등록용 텍스트 정보들 상호간에는 서로 텍스트가 완전히 일치할 수도 있고(서로 다른 사용자들이 동일한 문장을 드레그한 경우), 일부 텍스트만 차이날 수도 있고(서로 다른 사용자들이 동일한 문장 내에서 일부 텍스트를 드레그한 경우), 많은 텍스트가 차이(서로 다른 사용자들이 서로 다른 문장 내에서 텍스트를 드레그한 경우)날 수도 있다.The server 200 may receive unregistered noun information and text information for registration matched by users to the corresponding unregistered noun from a plurality of client devices. For example, the server 200 may receive 10 pieces of text information for registration matched to the same unregistered noun from 10 client devices. The server 200 may detect a similarity between 10 pieces of text information for registration. Among the 10 text information for registration, the texts may completely match each other (when different users drag the same sentence), or only some texts may differ (when different users drag some text within the same sentence). In one case), a lot of text can be different (if different users dragged the text within different sentences).

서버(200)는 기 설정치 이상의 유사도를 나타내는 등록용 텍스트 정보들을 추출하고 추출된 등록용 텍스트 정보들의 정량적인 개수를 산출할 수 있다. 서버(200)는 정량적인 개수의 산출 결과 미리 설정된 개수를 초과하는 등록용 텍스트 정보가 확인되면 해당 등록용 텍스트 정보들 중 어느 하나의 등록용 텍스트 정보를 미등록 명사의 승인된 의미 정보로 설정할 수 있다. 그리고, 서버(200)는 미등록 명사를 등록 명사로 지위를 전환하여 사전 데이터베이스에 등록하고, 지위가 전환된 등록 명사의 의미 정보로서 해당 승인된 등록용 텍스트 정보를 등록하여 사전 데이터베이스를 업데이트할 수 있다.The server 200 may extract pieces of text information for registration showing similarities greater than or equal to a preset value and calculate the quantitative number of the extracted pieces of text information for registration. As a result of calculating the quantitative number, the server 200 may set any one of the text information for registration among the corresponding text information for registration as the approved semantic information of the unregistered noun when text information for registration exceeding the preset number is confirmed as a result of calculating the quantitative number. . In addition, the server 200 may convert the status of an unregistered noun to a registered noun, register it in a dictionary database, and update the dictionary database by registering corresponding approved registration text information as semantic information of the registered noun whose status has been switched. .

이상 설명된 본 발명에 따른 실시예는 다양한 컴퓨터 구성요소를 통하여 실행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수 있다. 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등과 같은, 프로그램 명령어를 저장하고 실행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 컴파일러에 의하여 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용하여 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위하여 하나 이상의 소프트웨어 모듈로 변경될 수 있으며, 그 역도 마찬가지이다.Embodiments according to the present invention described above may be implemented in the form of program instructions that can be executed through various computer components and recorded on a computer-readable recording medium. The computer readable recording medium may include program instructions, data files, data structures, etc. alone or in combination. Program instructions recorded on the computer-readable recording medium may be specially designed and configured for the present invention, or may be known and usable to those skilled in the art of computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks and magnetic tapes, optical recording media such as CD-ROMs and DVDs, and magneto-optical media such as floptical disks. medium), and hardware devices specially configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include high-level language codes that can be executed by a computer using an interpreter or the like as well as machine language codes generated by a compiler. A hardware device may be modified with one or more software modules to perform processing according to the present invention and vice versa.

본 발명에서 설명하는 특정 실행들은 일 실시 예들로서, 어떠한 방법으로도 본 발명의 범위를 한정하는 것은 아니다. 명세서의 간결함을 위하여, 종래 전자적인 구성들, 제어 시스템들, 소프트웨어, 상기 시스템들의 다른 기능적인 측면들의 기재는 생략될 수 있다. 또한, 도면에 도시된 구성 요소들 간의 선들의 연결 또는 연결 부재들은 기능적인 연결 및/또는 물리적 또는 회로적 연결들을 예시적으로 나타낸 것으로서, 실제 장치에서는 대체 가능하거나 추가의 다양한 기능적인 연결, 물리적인 연결, 또는 회로 연결들로서 나타내어질 수 있다. 또한, “필수적인”, “중요하게” 등과 같이 구체적인 언급이 없다면 본 발명의 적용을 위하여 반드시 필요한 구성 요소가 아닐 수 있다.Specific implementations described in the present invention are examples and do not limit the scope of the present invention in any way. For brevity of the specification, description of conventional electronic components, control systems, software, and other functional aspects of the systems may be omitted. In addition, the connection of lines or connecting members between the components shown in the drawings are examples of functional connections and / or physical or circuit connections, which can be replaced in actual devices or additional various functional connections, physical connection, or circuit connections. In addition, if there is no specific reference such as “essential” or “important”, it may not be a component necessarily required for the application of the present invention.

또한 설명한 본 발명의 상세한 설명에서는 본 발명의 바람직한 실시 예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자 또는 해당 기술분야에 통상의 지식을 갖는 자라면 후술할 특허청구범위에 기재된 본 발명의 사상 및 기술 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다. 따라서, 본 발명의 기술적 범위는 명세서의 상세한 설명에 기재된 내용으로 한정되는 것이 아니라 특허청구범위에 의해 정하여져야만 할 것이다.In addition, the detailed description of the present invention described has been described with reference to preferred embodiments of the present invention, but those skilled in the art or those having ordinary knowledge in the art will find the spirit of the present invention described in the claims to be described later. And it will be understood that the present invention can be variously modified and changed without departing from the technical scope. Therefore, the technical scope of the present invention is not limited to the contents described in the detailed description of the specification, but should be defined by the claims.

시스템(10)
클라이언트 장치(100)
서버(200)
네트워크(300)
메모리(110, 210)
프로세서(120, 220)
통신 모듈(130, 230)
입출력 인퍼테이스(140, 240)
입출력 장치(141, 241)
system(10)
Client device (100)
server(200)
network(300)
Memory (110, 210)
Processor (120, 220)
Communication module (130, 230)
I/O interfaces (140, 240)
I/O devices (141, 241)

Claims (12)

메모리에 저장된 음식 메뉴 명사 추출 프로그램 코드가 제공하는 제어 명령에 따라 프로세서에 의해 수행되는
수신된 음식명 검색어를 포함하는 웹페이지를 검색하고, 검색된 웹페이지 내에서 음식명 검색어를 포함한 문장을 수집하는 단계;
수집된 음식명 검색어를 포함한 문장들에서 용언을 추출하는 단계;
추출된 용언을 검색어로 하여 웹페이지를 검색하고 검색된 웹페이지 내에서 용언을 포함한 문장을 수집하는 단계; 및
수집된 용언을 포함한 문장들에서 명사를 추출하는 단계;를 포함하는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법.
Performed by the processor according to the control command provided by the food menu noun extraction program code stored in memory
searching for a web page including the received food name search word, and collecting sentences including the food name search word in the searched web page;
extracting verbs from sentences including collected food name search words;
searching for a web page using the extracted verb as a search term and collecting sentences including the verb in the searched web page; and
Extracting nouns from sentences including the collected verbs;
A method for extracting food menu nouns using parts of speech such as verbs and adjectives.
제1 항에 있어서,
추출된 명사가 사전 데이터베이스 상의 등록 명사인지 여부를 판단하여, 상기 사전 데이터베이스에 등록되지 않은 미등록명사를 추출하여 표시하는 단계;를 더 포함하는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법.
According to claim 1,
Determining whether the extracted noun is a registered noun on the dictionary database, extracting and displaying unregistered nouns not registered in the dictionary database; further comprising
A method for extracting food menu nouns using parts of speech such as verbs and adjectives.
클라이언트 장치는 수신한 음식명 검색어를 서버로 전송하고,
상기 서버는 수신된 음식명 검색어를 포함하는 웹페이지를 검색하고, 검색된 웹페이지 내에서 음식명 검색어를 포함한 문장을 수집하고, 수집된 음식명 검색어를 포함한 문장들에서 용언을 추출하고, 추출된 용언을 검색어로 하여 웹페이지를 검색하고 검색된 웹페이지 내에서 용언을 포함한 문장을 수집하며, 수집된 용언을 포함한 문장들에서 명사를 추출하는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템.
The client device transmits the received food name search term to the server,
The server searches a web page including the received food name search word, collects sentences including the food name search word in the searched webpage, extracts verbs from the collected sentences including the food name search word, and extracts the extracted verbs. is a search term for web pages, collects sentences including verbs from the searched web pages, and extracts nouns from sentences including collected verbs.
A system for extracting food menu nouns using parts of speech such as verbs and adjectives.
제3 항에 있어서,
상기 서버는 기 등록된 관심 모니터링 사이트 목록 정보에 해당하는 사이트 상에서 상기 음식명 검색어를 포함하는 웹페이지를 검색하는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템.
According to claim 3,
The server searches for a web page including the food name search term on a site corresponding to pre-registered interest monitoring site list information.
A system for extracting food menu nouns using parts of speech such as verbs and adjectives.
제4 항에 있어서,
상기 서버는 상기 음식명 검색어에 기초하여 이미 검색된 웹페이지와 동일한 웹페이지와 중복되는 웹페이지를 제외한 다른 웹페이지 내에서 용언을 포함한 문장을 수집하는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템.
According to claim 4,
The server collects sentences including verbs in other web pages except for web pages that overlap with the same web page as the web page already searched based on the food name search term.
A system for extracting food menu nouns using parts of speech such as verbs and adjectives.
제3 항에 있어서,
상기 서버는 추출된 명사들 각각을 미리 저장된 사전 데이터베이스 상에서 검색하여, 상기 추출된 명사들 각각을 상기 미리 저장된 사전 데이터베이스에 등록된 등록 명사 및 상기 사전 데이터베이스에 등록되지 않은 미등록 명사로 분류하는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템.
According to claim 3,
The server searches for each of the extracted nouns on a pre-stored dictionary database and classifies each of the extracted nouns into registered nouns registered in the pre-stored dictionary database and unregistered nouns not registered in the dictionary database
A system for extracting food menu nouns using parts of speech such as verbs and adjectives.
제6 항에 있어서,
상기 서버는 상기 사전 데이터베이스 상에서 상기 등록 명사의 의미 정보를 분석하여 상기 등록 명사들 중에서 등록 음식명 명사를 추출하는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템.
According to claim 6,
The server extracts a registered food noun from among the registered nouns by analyzing the semantic information of the registered noun on the dictionary database.
A system for extracting food menu nouns using parts of speech such as verbs and adjectives.
제7 항에 있어서,
상기 서버는 상기 등록 음식명 명사와 상기 미등록 음식명 명사 상호간의 음절간의 동일성 여부를 판단하여 상기 등록 음식명 명사와 상기 미등록 음식명 명사 상호간의 유사도를 계산하고,
상기 서버는 상기 미등록 명사들 및 상기 등록 음식명 명사 각각의 추출 빈도 정보를 계산하는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템.
According to claim 7,
The server determines whether syllables between the registered food noun and the non-registered food noun are identical to each other, and calculates a degree of similarity between the registered food noun and the unregistered food noun,
The server calculates extraction frequency information of each of the unregistered nouns and the registered food name noun.
A system for extracting food menu nouns using parts of speech such as verbs and adjectives.
제8 항에 있어서,
상기 클라이언트 장치는 상기 미등록 명사들을 수신하고, 상기 유사도 또는 상기 추출 빈도 정보에 기초하여 상기 미등록 명사들을 정렬하여 표시하고,
상기 클라이언트 장치는 상기 등록 음식명 명사를 수신하고, 상기 등록 음식명 명사의 검출 빈도수에 기초하여 상기 등록 음식명 명사를 정렬하여 표시하는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템.
According to claim 8,
the client device receives the unregistered nouns, sorts and displays the unregistered nouns based on the degree of similarity or the extraction frequency information;
The client device receives the registered food nouns, sorts and displays the registered food nouns based on the detection frequency of the registered food nouns.
A system for extracting food menu nouns using parts of speech such as verbs and adjectives.
제9 항에 있어서,
상기 클라이언트 장치는 표시된 미등록 명사들 중 어느 하나의 선택에 응답하여 상기 서버로부터 선택된 미등록 명사를 포함한 문장 정보를 수신하여 표시하고, 상기 문장 정보에는 상기 선택된 미등록 명사가 하이라이트 되어 표시되는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템.
According to claim 9,
The client device receives and displays sentence information including the selected unregistered noun from the server in response to selection of any one of the displayed unregistered nouns, and the selected unregistered noun is highlighted and displayed in the sentence information
A system for extracting food menu nouns using parts of speech such as verbs and adjectives.
제10 항에 있어서,
상기 클라이언트 장치는 표시된 문장에서 드레그된 텍스트 정보인 등록용 텍스트 정보를 상기 선택된 미등록 명사 정보의 의미 정보로서 사용자용 사전 데이터베이스에 등록하는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템.
According to claim 10,
The client device registers text information for registration, which is text information dragged from a displayed sentence, in a dictionary database for a user as semantic information of the selected unregistered noun information.
A system for extracting food menu nouns using parts of speech such as verbs and adjectives.
제10 항에 있어서,
상기 클라이언트 장치는 표시된 문장에서 드레그된 텍스트 정보인 등록용 텍스트 정보 및 상기 선택된 미등록 명사 정보를 상기 서버로 전송하고,
상기 서버는 상기 선택된 미등록 명사 정보에 매칭된 등록용 텍스트 정보를 복수의 클라이언트 장치들로부터 수집하고, 기 설정치 이상의 유사도를 나타내는 등록용 텍스트 정보들의 개수를 산출하여 기설정치 이상이면 상기 등록용 텍스트 정보 중 어느 하나의 텍스트 정보를 상기 미등록 명사 정보의 의미 정보로서 상기 사전 데이터베이스에 등록하는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템.
According to claim 10,
The client device transmits registration text information, which is text information dragged from a displayed sentence, and the selected unregistered noun information to the server;
The server collects text information for registration matched with the selected unregistered noun information from a plurality of client devices, calculates the number of pieces of text information for registration showing similarity equal to or greater than a preset value, and if the number is equal to or greater than the preset value, among the text information for registration. Registering any one text information in the dictionary database as semantic information of the unregistered noun information
A system for extracting food menu nouns using parts of speech such as verbs and adjectives.
KR1020210154049A 2021-11-10 2021-11-10 A method for extracting food menu nouns using parts of speech such as verbs and adjectives, a method for updating a food dictionary using the same, and a system for the same KR102625347B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210154049A KR102625347B1 (en) 2021-11-10 2021-11-10 A method for extracting food menu nouns using parts of speech such as verbs and adjectives, a method for updating a food dictionary using the same, and a system for the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210154049A KR102625347B1 (en) 2021-11-10 2021-11-10 A method for extracting food menu nouns using parts of speech such as verbs and adjectives, a method for updating a food dictionary using the same, and a system for the same

Publications (2)

Publication Number Publication Date
KR20230068092A true KR20230068092A (en) 2023-05-17
KR102625347B1 KR102625347B1 (en) 2024-01-15

Family

ID=86547198

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210154049A KR102625347B1 (en) 2021-11-10 2021-11-10 A method for extracting food menu nouns using parts of speech such as verbs and adjectives, a method for updating a food dictionary using the same, and a system for the same

Country Status (1)

Country Link
KR (1) KR102625347B1 (en)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060042296A (en) * 2004-11-09 2006-05-12 삼성전자주식회사 Method and apparatus for updating dictionary
KR100886687B1 (en) 2007-12-12 2009-03-04 한국전자통신연구원 Method and apparatus for auto-detecting of unregistered word in chinese language
JP2009295052A (en) * 2008-06-06 2009-12-17 Yahoo Japan Corp Compound word break estimating device, method, and program for estimating break position of compound word
JP2011008373A (en) * 2009-06-24 2011-01-13 Fuji Xerox Co Ltd Natural language processor and program
KR101042515B1 (en) 2008-12-11 2011-06-17 주식회사 네오패드 Method for searching information based on user's intention and method for providing information
KR20140078312A (en) 2012-12-17 2014-06-25 한국전자통신연구원 Apparatus and system for providing sentimet analysis results based on text and method thereof
KR20150022583A (en) 2013-08-23 2015-03-04 주식회사 케이티 Apparatus for extracting keyword and method thereof
KR20150096207A (en) * 2014-02-14 2015-08-24 삼성전자주식회사 Electronic Device And Method For Extracting And Using Semantic Entity In Conversation Message Of The Same
KR20160056983A (en) * 2014-11-12 2016-05-23 한국전자통신연구원 System and method for generating morpheme dictionary based on automatic extraction of unknown words
KR101935109B1 (en) 2016-12-29 2019-01-04 (주) 더아이엠씨 Sensitivity Analyzing Method of Phrase Unit for Fassion Field and Storage Medium Having the Same
KR102019756B1 (en) 2017-03-14 2019-09-10 한국전자통신연구원 On-line contextual advertisement intelligence apparatus and method based on language analysis for automatically recognizes about coined word

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060042296A (en) * 2004-11-09 2006-05-12 삼성전자주식회사 Method and apparatus for updating dictionary
KR100886687B1 (en) 2007-12-12 2009-03-04 한국전자통신연구원 Method and apparatus for auto-detecting of unregistered word in chinese language
JP2009295052A (en) * 2008-06-06 2009-12-17 Yahoo Japan Corp Compound word break estimating device, method, and program for estimating break position of compound word
KR101042515B1 (en) 2008-12-11 2011-06-17 주식회사 네오패드 Method for searching information based on user's intention and method for providing information
JP2011008373A (en) * 2009-06-24 2011-01-13 Fuji Xerox Co Ltd Natural language processor and program
KR20140078312A (en) 2012-12-17 2014-06-25 한국전자통신연구원 Apparatus and system for providing sentimet analysis results based on text and method thereof
KR20150022583A (en) 2013-08-23 2015-03-04 주식회사 케이티 Apparatus for extracting keyword and method thereof
KR20150096207A (en) * 2014-02-14 2015-08-24 삼성전자주식회사 Electronic Device And Method For Extracting And Using Semantic Entity In Conversation Message Of The Same
KR20160056983A (en) * 2014-11-12 2016-05-23 한국전자통신연구원 System and method for generating morpheme dictionary based on automatic extraction of unknown words
KR101935109B1 (en) 2016-12-29 2019-01-04 (주) 더아이엠씨 Sensitivity Analyzing Method of Phrase Unit for Fassion Field and Storage Medium Having the Same
KR102019756B1 (en) 2017-03-14 2019-09-10 한국전자통신연구원 On-line contextual advertisement intelligence apparatus and method based on language analysis for automatically recognizes about coined word

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
길호현. (2018). 텍스트마이닝을 위한 한국어 불용어 목록 연구. 우리말글, 78, 1-25.
김미경, 최소영. (2020). 명칭실어증 환자의 동음이의어 처리 특성. 특수교육논총, 36(2), 67-80.
김진수. (2020). 비정형 문서에서 감정과 상황 정보를 이용한 감성 예측. 융합정보논문지 (구 중소기업융합학회논문지), 10(10), 40-46.
이종화, 이문봉, 김종원. (2019). TF-IDF를 활용한 한글 자연어 처리 연구. 정보시스템연구, 28(3), 105-121.
이종화. (2018). SNS 해시태그를 이용한 감정 단어 일반화 연구. 인터넷전자상거래연구, 18(4), 53-63.
임용택, 임희석. (2020). 기업 리뷰 정보를 활용한 주가 방향 예측 모델 비교 분석. 한국융합학회논문지, 11(8), 165-171.

Also Published As

Publication number Publication date
KR102625347B1 (en) 2024-01-15

Similar Documents

Publication Publication Date Title
US8452772B1 (en) Methods, systems, and articles of manufacture for addressing popular topics in a socials sphere
CN106663117B (en) Constructing graphs supporting providing exploratory suggestions
US20130060769A1 (en) System and method for identifying social media interactions
US20150095300A1 (en) System and method for mark-up language document rank analysis
US10740406B2 (en) Matching of an input document to documents in a document collection
US10242033B2 (en) Extrapolative search techniques
Rahate et al. Feature selection for sentiment analysis by using svm
Fayaz et al. Machine learning for fake news classification with optimal feature selection
US20160350278A1 (en) Claim polarity identification
Chirgaiya et al. Analysis of sentiment based movie reviews using machine learning techniques
Banjar et al. Aspect-Based Sentiment Analysis for Polarity Estimation of Customer Reviews on Twitter.
Zahid et al. Roman urdu reviews dataset for aspect based opinion mining
Sriharee An ontology-based approach to auto-tagging articles
Mehrbod et al. Tender calls search using a procurement product named entity recogniser
Tito et al. Icdar 2021 competition on document visual question answering
US20220365956A1 (en) Method and apparatus for generating patent summary information, and electronic device and medium
WO2015084757A1 (en) Systems and methods for processing data stored in a database
US11669556B1 (en) Method and system for document retrieval and exploration augmented by knowledge graphs
Saghayan et al. Exploring the impact of machine translation on fake news detection: A case study on persian tweets about covid-19
Shahade et al. Multi-lingual opinion mining for social media discourses: an approach using deep learning based hybrid fine-tuned smith algorithm with adam optimizer
JP2007193697A (en) Information collection apparatus, information collection method and program
Abudalfa et al. Survey on target dependent sentiment analysis of micro-blogs in social media
AleEbrahim et al. Summarising customer online reviews using a new text mining approach
Kama et al. A web search enhanced feature extraction method for aspect-based sentiment analysis for Turkish informal texts
Gonzalez-Mora et al. Model-driven development of web apis to access integrated tabular open data

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant