KR20230174986A - Apparatus and method for predicting favorite perfume - Google Patents
Apparatus and method for predicting favorite perfume Download PDFInfo
- Publication number
- KR20230174986A KR20230174986A KR1020220076300A KR20220076300A KR20230174986A KR 20230174986 A KR20230174986 A KR 20230174986A KR 1020220076300 A KR1020220076300 A KR 1020220076300A KR 20220076300 A KR20220076300 A KR 20220076300A KR 20230174986 A KR20230174986 A KR 20230174986A
- Authority
- KR
- South Korea
- Prior art keywords
- perfume
- keyword
- information
- attribute vector
- target
- Prior art date
Links
- 239000002304 perfume Substances 0.000 title claims abstract description 466
- 238000000034 method Methods 0.000 title claims abstract description 40
- 239000013598 vector Substances 0.000 claims abstract description 134
- 239000000284 extract Substances 0.000 claims abstract description 8
- 238000004458 analytical method Methods 0.000 claims description 35
- 230000036555 skin type Effects 0.000 claims description 19
- 230000000877 morphologic effect Effects 0.000 claims description 16
- 239000004615 ingredient Substances 0.000 claims description 14
- 206010039792 Seborrhoea Diseases 0.000 claims description 13
- 230000037312 oily skin Effects 0.000 claims description 13
- 239000000126 substance Substances 0.000 claims description 13
- 230000000694 effects Effects 0.000 claims description 10
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 8
- 230000005923 long-lasting effect Effects 0.000 claims description 7
- 230000003020 moisturizing effect Effects 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 24
- 238000000605 extraction Methods 0.000 description 20
- 238000003860 storage Methods 0.000 description 20
- 230000037307 sensitive skin Effects 0.000 description 10
- 238000012552 review Methods 0.000 description 9
- 235000019640 taste Nutrition 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 8
- 206010013786 Dry skin Diseases 0.000 description 6
- 230000037336 dry skin Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000009193 crawling Effects 0.000 description 5
- 230000002354 daily effect Effects 0.000 description 4
- 239000004576 sand Substances 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 239000003205 fragrance Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 240000000560 Citrus x paradisi Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- -1 mixing ratio Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3335—Syntactic pre-processing, e.g. stopword elimination, stemming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- Databases & Information Systems (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
선호 향수 예측 장치 및 방법에 관한 것으로, 선호 향수 예측 장치는 대상자 정보 및 향수 정보를 획득하는 입력부 및 상기 대상자 정보로부터 대상자 키워드를 추출하고, 상기 대상자 키워드를 이용하여 대상자 속성 벡터를 생성하고, 상기 향수 정보로부터 향수 키워드를 추출하고, 상기 향수 키워드를 이용하여 향수 속성 벡터를 생성하고, 상기 대상자 속성 벡터와 상기 향수 속성 벡터 간의 유사도를 이용하여 선호 향수를 결정하는 프로세서를 포함할 수 있다.Pertaining to a preferred perfume prediction device and method, the preferred perfume prediction device includes an input unit for obtaining target information and perfume information, extracting target keywords from the target information, generating target attribute vectors using the target keywords, and generating the perfume. It may include a processor that extracts a perfume keyword from information, generates a perfume attribute vector using the perfume keyword, and determines a preferred perfume using similarity between the subject attribute vector and the perfume attribute vector.
Description
선호 향수 예측 장치 및 방법에 관한 것이다.It relates to a preference perfume prediction device and method.
향수는 향료를 알코올 등에 희석시켜 제조된 화장품으로 대략 5천년 전부터 사용되었던 것으로 알려졌다. 향수는 향을 외부로 방출하여 후각적 쾌감을 줄 수 있는데, 최근에는 이러한 향수를 자기 표현 수단으로 인식하여 사람들은 본인의 취향 및 개성을 들어낼 수 있는 향수에 대한 수요가 증가하고 있다. 그런데, 향수는 향료의 종류, 배합 비율 및 희석량 등에 따라 그 종류가 매우 많을 뿐만 아니라, 근래에는 조향사의 개성을 담은 인디 향수나 소수의 취향을 만족시키기 위해 전문 조향사가 제작한 프리미엄 니치 향수도 제공되고 있어, 자신의 취향 및 개성에 맞는 향수를 찾는 것은 결코 쉬운 것이 아니다. 또한, 인디 향수나 프리미엄 니치 향수들은 대중적인 향수와는 달리 조향사가 그 향수 특유의 향을 시적이거나 추상적인 언어로 표현하여 설명하는 경향이 강한데, 이러한 향수에 대한 설명은 수요자, 향수 판매자 또는 향수 추천인 등과 같은 해석자의 능동적인 해석을 요구하기 때문에 해석자의 주관에 개입할 가능성이 높다. 따라서, 설명을 읽고 구매한 경우에도 해당 향수가 소비자 취향에 맞지 않는 경우도 빈번하다. 따라서, 보다 소비자 취향에 부합하는 향수를 추천하기 위한 여러 서비스가 마련되고 있으나, 이들 서비스는 사용자 성향 파악을 위해 트리 형태의 다량의 질문에 계속 답변해야 하는 번거로움이 존재하였으며, 본인이 아닌 타인을 위한 향수를 추천 받고자 하는 경우에는 타인의 취향을 보다 정확하게 파악하고 있어야 한다는 문제점이 있었다.Perfume is a cosmetic product made by diluting fragrances with alcohol and is known to have been used for approximately 5,000 years. Perfume can give olfactory pleasure by emitting scent to the outside. Recently, people have recognized perfume as a means of self-expression, and the demand for perfume that can reveal one's taste and personality is increasing. However, not only are there many types of perfume depending on the type of fragrance, mixing ratio, and dilution amount, but recently, indie perfumes containing the perfumer's personality and premium niche perfumes produced by professional perfumers to satisfy the tastes of a small number of people are also available. Nowadays, it is not easy to find a perfume that suits your taste and personality. In addition, unlike popular perfumes, indie perfumes and premium niche perfumes have a strong tendency for perfumers to explain the unique scent of the perfume by expressing it in poetic or abstract language. Such descriptions of perfumes are given by consumers, perfume sellers, or perfume recommenders. Because it requires the interpreter's active interpretation, there is a high possibility of interfering with the interpreter's subjectivity. Therefore, even if the perfume is purchased after reading the description, there are frequent cases where the perfume does not suit the consumer's taste. Accordingly, several services are being prepared to recommend perfumes that better suit consumer tastes, but these services have the inconvenience of having to continuously answer a large number of questions in the form of a tree to determine user preferences, and they have the disadvantage of having to continuously answer a large number of questions in the form of a tree to determine user preferences. If you want to get a recommendation for a perfume for yourself, there is a problem that you have to understand other people's tastes more accurately.
향수를 추천 받을 자의 정보 및 향수에 관한 텍스트 정보를 분석하여 향수를 추천 받을 자에 관한 정보와 유사한 향수를 검출함으로써 향수를 추천 받을 자에게 적절한 향수를 예측할 수 있는 선호 향수 예측 장치 및 선호 향수 예측 방법을 제공하는 것을 해결하고자 하는 과제로 한다.A preferred perfume prediction device and a preferred perfume prediction method that can predict a suitable perfume for a person to whom a perfume is recommended by analyzing the information of the person to whom the perfume is recommended and text information about the perfume to detect perfume similar to the information about the person to whom the perfume is recommended. The problem to be solved is to provide .
상술한 과제를 해결하기 위하여 선호 향수 예측 장치 및 선호 향수 예측 방법이 제공된다.In order to solve the above-mentioned problems, a preference perfume prediction device and a preference perfume prediction method are provided.
선호 향수 예측 장치는 대상자 정보 및 향수 정보를 획득하는 입력부 및 상기 대상자 정보로부터 대상자 키워드를 추출하고, 상기 대상자 키워드를 이용하여 대상자 속성 벡터를 생성하고, 상기 향수 정보로부터 향수 키워드를 추출하고, 상기 향수 키워드를 이용하여 향수 속성 벡터를 생성하고, 상기 대상자 속성 벡터와 상기 향수 속성 벡터 간의 유사도를 이용하여 선호 향수를 결정하는 프로세서를 포함할 수 있다.The preferred perfume prediction device includes an input unit for acquiring target information and perfume information, extracting target keywords from the target information, generating target attribute vectors using the target keywords, extracting perfume keywords from the perfume information, and extracting target keywords from the perfume information. It may include a processor that generates a perfume attribute vector using a keyword and determines a preferred perfume using the similarity between the subject attribute vector and the perfume attribute vector.
상기 대상자 정보 및 상기 향수 정보 중 적어도 하나는 적어도 하나의 문장을 포함하고, 상기 프로세서는, 상기 대상자 정보 및 상기 향수 정보 중 적어도 하나에 형태소 분석을 수행하고, 상기 형태소 분석 결과에서 불용어를 제거하여 상기 대상자 키워드 및 상기 향수 키워드 중 적어도 하나를 획득할 수 있다.At least one of the subject information and the perfume information includes at least one sentence, and the processor performs morphological analysis on at least one of the subject information and the perfume information, removes stop words from the morphological analysis result, and At least one of the target keyword and the perfume keyword can be obtained.
상기 프로세서는, 상기 대상자 키워드가 추출되면, 상기 대상자 키워드 중에서 유효 속성에 해당하는 유효 속성 키워드를 검출하고, 상기 유효 속성 키워드에 대응하는 연관 키워드를 획득하고, 상기 대상자 키워드 및 상기 연관 키워드를 기반으로 상기 대상자 속성 벡터를 생성할 수 있다.When the target keyword is extracted, the processor detects a valid attribute keyword corresponding to a valid attribute among the target keywords, obtains a related keyword corresponding to the valid attribute keyword, and based on the target keyword and the related keyword The subject attribute vector can be generated.
상기 프로세서는, 상기 향수 키워드가 추출되면, 상기 향수 정보의 적어도 하나의 문서 내에서 상기 향수 키워드의 등장 빈도 및 상기 향수 키워드가 등장한 문서의 개수를 계수하고, 상기 향수 키워드의 등장 빈도에 상기 문서의 개수를 나누어 문서 내 단어 중요도를 결정할 수 있다.When the perfume keyword is extracted, the processor counts the frequency of appearance of the perfume keyword and the number of documents in which the perfume keyword appears in at least one document of the perfume information, and determines the frequency of appearance of the perfume keyword in the document. You can determine the importance of words in a document by dividing the number.
상기 프로세서는, 상기 문서 내 단어 중요도를 기반으로 적어도 하나의 향수 키워드로부터 적어도 하나의 핵심 키워드를 획득하고, 상기 적어도 하나의 핵심 키워드를 이용하여 상기 향수 속성 벡터를 생성하는 것도 가능하다.The processor may obtain at least one core keyword from at least one perfume keyword based on word importance in the document and generate the perfume attribute vector using the at least one core keyword.
상기 프로세서는, 상기 대상자 속성 벡터와 상기 향수 속성 벡터 간의 자카드 유사도를 연산하여 유사도 값을 획득하고, 상기 유사도 값이 미리 정의된 기준 값보다 크거나 또는 유사도 값이 상대적으로 더 큰 향수 속성 벡터에 대응하는 향수를 선호 향수로 결정할 수도 있다.The processor obtains a similarity value by calculating Jaccard similarity between the subject attribute vector and the perfume attribute vector, and corresponds to a perfume attribute vector in which the similarity value is greater than a predefined reference value or the similarity value is relatively larger. You can also decide which perfume you like as your favorite perfume.
상기 프로세서는, 대상자의 피부 타입을 더 이용하여 대상자에 대한 선호 향수를 결정하되, 상기 대상자의 피부 타입은 민감성 또는 지성을 포함할 수도 있다.The processor may further utilize the subject's skin type to determine a preferred perfume for the subject, wherein the subject's skin type may include sensitive or oily.
상기 프로세서는, 향수에 자극적 화학 성분의 포함 여부, 진한 노트의 사용 여부, 피부 진정 효과의 노트 포함 여부, 지성 피부에 악성인 물질 포함 여부, 진하고 잔향이 오래 가는 노트 포함 여부, 보습 성분 포함 여부 및 알코올 함유량 중 적어도 하나를 더 이용하여 선호 향수를 결정할 수도 있다.The processor determines whether the perfume contains irritating chemical ingredients, whether a dark note is used, whether a note with a skin-soothing effect is included, whether a substance harmful to oily skin is included, whether a strong and long-lasting note is included, whether a moisturizing ingredient is included, and At least one additional alcohol content can also be used to determine the preferred perfume.
선호 향수 예측 방법은, 대상자 정보 및 향수 정보를 획득하는 단계, 상기 대상자 정보로부터 대상자 키워드를 추출하는 단계, 상기 대상자 키워드를 이용하여 대상자 속성 벡터를 생성하는 단계, 상기 향수 정보로부터 향수 키워드를 추출하는 단계, 상기 향수 키워드를 이용하여 향수 속성 벡터를 생성하는 단계 및 상기 대상자 속성 벡터와 상기 향수 속성 벡터 간의 유사도를 이용하여 선호 향수를 결정하는 단계를 포함할 수 있다.The preferred perfume prediction method includes obtaining target information and perfume information, extracting target keywords from the target information, generating target attribute vectors using the target keywords, and extracting perfume keywords from the perfume information. It may include generating a perfume attribute vector using the perfume keyword, and determining a preferred perfume using similarity between the subject attribute vector and the perfume attribute vector.
상기 대상자 정보 및 상기 향수 정보 중 적어도 하나는 적어도 하나의 문장을 포함할 수 있으며, 상기 대상자 정보로부터 대상자 키워드를 추출하는 단계는, 상기 대상자 정보에 형태소 분석을 수행하는 단계 및 상기 형태소 분석 결과에서 불용어를 제거하여 상기 대상자 키워드를 획득하는 단계를 포함할 수 있다.At least one of the target information and the perfume information may include at least one sentence, and the step of extracting target keywords from the target information includes performing morphological analysis on the target information and stopping words in the morphological analysis results. It may include the step of obtaining the target keyword by removing .
상기 대상자 키워드를 이용하여 대상자 속성 벡터를 생성하는 단계는, 상기 대상자 키워드가 추출되면, 상기 대상자 키워드 중에서 유효 속성에 해당하는 유효 속성 키워드를 검출하는 단계, 상기 유효 속성 키워드에 대응하는 연관 키워드를 획득하는 단계 및 상기 대상자 키워드 및 상기 연관 키워드를 기반으로 상기 대상자 속성 벡터를 생성하는 단계를 포함할 수 있다.The step of generating an audience attribute vector using the audience keyword includes, when the audience keyword is extracted, detecting a valid attribute keyword corresponding to a valid attribute among the audience keywords, and obtaining a related keyword corresponding to the valid attribute keyword. and generating the target attribute vector based on the target keyword and the related keyword.
상기 향수 키워드를 이용하여 향수 속성 벡터를 생성하는 단계는, 상기 향수 키워드가 추출되면, 상기 향수 정보의 적어도 하나의 문서 내에서 상기 향수 키워드의 등장 빈도를 계수하는 단계, 상기 향수 키워드가 등장한 문서의 개수를 계수하는 단계 및 상기 향수 키워드의 등장 빈도에 상기 문서의 개수를 나누어 문서 내 단어 중요도를 결정하는 단계를 포함할 수 있다.The step of generating a perfume attribute vector using the perfume keyword includes, when the perfume keyword is extracted, counting the frequency of appearance of the perfume keyword in at least one document of the perfume information, and counting the frequency of appearance of the perfume keyword in the document in which the perfume keyword appears. It may include counting the number and determining the importance of words in the document by dividing the number of documents by the frequency of appearance of the perfume keyword.
상기 향수 키워드를 이용하여 향수 속성 벡터를 생성하는 단계는, 상기 문서 내 단어 중요도를 기반으로 적어도 하나의 향수 키워드로부터 적어도 하나의 핵심 키워드를 획득하는 단계 및 상기 적어도 하나의 핵심 키워드를 이용하여 상기 향수 속성 벡터를 생성하는 단계를 더 포함할 수 있다.The step of generating a perfume attribute vector using the perfume keyword includes obtaining at least one core keyword from at least one perfume keyword based on word importance in the document, and generating the perfume attribute vector using the at least one core keyword. The step of generating an attribute vector may be further included.
상기 대상자 속성 벡터와 상기 향수 속성 벡터 간의 유사도를 이용하여 선호 향수를 결정하는 단계는, 상기 대상자 속성 벡터와 상기 향수 속성 벡터 간의 자카드 유사도를 연산하여 유사도 값을 획득하는 단계 및 상기 유사도 값이 미리 정의된 기준 값보다 크거나 또는 유사도 값이 상대적으로 더 큰 향수 속성 벡터에 대응하는 향수를 선호 향수로 결정하는 단계를 포함할 수도 있다.The step of determining a preferred perfume using the similarity between the subject attribute vector and the perfume attribute vector includes obtaining a similarity value by calculating a Jacquard similarity between the subject attribute vector and the perfume attribute vector, and the similarity value is predefined. It may also include the step of determining a perfume corresponding to a perfume attribute vector that is greater than the reference value or has a similarity value that is relatively greater as the preferred perfume.
상기 대상자 속성 벡터와 상기 향수 속성 벡터 간의 유사도를 이용하여 선호 향수를 결정하는 단계는, 상기 대상자 속성 벡터와 상기 향수 속성 벡터 간의 유사도 및 상기 대상자의 피부 타입을 이용하여 대상자에 대한 선호 향수를 결정하는 단계를 더 포함하되, 상기 대상자의 피부 타입은 민감성 또는 지성을 포함할 수도 있다.The step of determining a preferred perfume using the similarity between the subject attribute vector and the perfume attribute vector includes determining a preferred perfume for the subject using the similarity between the subject attribute vector and the perfume attribute vector and the subject's skin type. The step is further included, but the skin type of the subject may include sensitive or oily.
상술한 선호 향수 예측 장치 및 선호 향수 예측 방법에 의하면, 향수를 추천 받을 자의 정보 및 향수에 관한 텍스트 정보를 분석하여, 다수의 향수 중에서 향수를 추천 받을 자에 대한 정보와 유사한 향수를 검출함으로써 향수를 추천 받을 자에게 적절한 향수를 예측할 수 있게 되는 효과를 얻을 수 있다.According to the above-described preferred perfume prediction device and preferred perfume prediction method, the perfume is selected by analyzing the information of the person to whom the perfume is recommended and text information about the perfume, and detecting perfumes similar to the information about the person to whom the perfume is recommended among a large number of perfumes. You can achieve the effect of being able to predict the appropriate perfume for the person to be recommended.
상술한 선호 향수 예측 장치 및 선호 향수 예측 방법에 의하면, 향수의 설명에 대한 자연어 분석을 통해 향수에 대한 복잡한 설명을 단순화하고, 이를 기반으로 통계 기반 분석을 수행함으로써 객관적인 속성으로 선호 향수를 예측 및 추천할 수 있게 되는 효과도 얻을 수 있다According to the above-described preferred perfume prediction device and preferred perfume prediction method, complex descriptions of perfumes are simplified through natural language analysis of the perfume description, and based on this, statistical-based analysis is performed to predict and recommend preferred perfumes with objective attributes. You can also get the effect of being able to
상술한 선호 향수 예측 장치 및 선호 향수 예측 방법에 의하면, 향수를 추천 받을 자에 대한 정보가 한정된 경우에도, 선호 매칭 사전을 통한 연관 키워드 추출 과정을 통해 향수 추천을 위한 다양한 속성 값을 구축 및 구성할 수 있게 되고, 결과적으로 향수를 추천 받을 자에게 보다 적합한 선호 향수 도출이 가능하게 되는 장점도 얻을 수 있다.According to the above-described preferred perfume prediction device and preferred perfume prediction method, even when information about the person to whom the perfume will be recommended is limited, various attribute values for perfume recommendation can be built and configured through the process of extracting related keywords through a preference matching dictionary. As a result, it is possible to obtain the advantage of being able to derive a preferred perfume that is more suitable for the person to whom the perfume is recommended.
도 1은 선호 향수 예측 장치의 일 실시예에 대한 블록도이다.
도 2는 대상자 정보 및 대상자 정보로부터 키워드를 추출하는 일례를 설명하기 위한 도면이다.
도 3은 향수 데이터베이스의 일 실시예를 설명하기 위한 도면이다.
도 4는 유효 속성 정보의 일례를 설명하기 위한 도면이다.
도 5는 특정 사용자에 대해 유효 속성 매핑 및 연관 키워드 추출의 일례를 설명하기 위한 도면이다.
도 6은 단어 별 빈도수의 일례를 설명하기 위한 도면이다.
도 7은 특정 향수에 대한 설명의 일례를 도시한 도면이다.
도 8은 특정 단어(들)의 개수 및 단어 등장 문서 수(DF: Document Frequency)를 설명하기 위한 도면이다.
도 9는 단어 등장 빈도(TF: Term Frequency)에 단어 등장 문서 수의 역수를 곱한 결과를 도시한 도면이다.
도 10은 특정 대상자에 대한 속성 테이블의 일례를 도시한 도면이다.
도 11은 특정 대상자에 관하여 각각의 향수의 유사도, 건성 적합 여부, 지성 적합 여부 및 민감성 적합 여부를 판단한 결과를 도시한 도면이다.
도 12는 건성 적합 여부, 지성 적합 여부 및 민감성 적합 여부의 판단 과정의 일례를 설명하기 위한 도면이다.
도 13은 선호 향수 예측 방법의 일 실시예에 대한 흐름도이다.1 is a block diagram of an embodiment of a preferred perfume prediction device.
Figure 2 is a diagram for explaining an example of subject information and extracting keywords from subject information.
Figure 3 is a diagram for explaining an embodiment of a perfume database.
Figure 4 is a diagram for explaining an example of effective attribute information.
FIG. 5 is a diagram illustrating an example of valid attribute mapping and related keyword extraction for a specific user.
Figure 6 is a diagram for explaining an example of frequency for each word.
Figure 7 is a diagram showing an example of a description of a specific perfume.
Figure 8 is a diagram for explaining the number of specific word(s) and the number of documents in which the word appears (DF: Document Frequency).
Figure 9 is a diagram showing the result of multiplying the word appearance frequency (TF: Term Frequency) by the reciprocal of the number of documents in which the word appears.
Figure 10 is a diagram showing an example of an attribute table for a specific person.
Figure 11 is a diagram showing the results of determining the similarity, suitability for dry skin, suitability for oily skin, and suitability for sensitive skin of each perfume for a specific subject.
Figure 12 is a diagram for explaining an example of the process of determining whether an application is suitable for dry skin, oily skin, and sensitive skin.
Figure 13 is a flowchart of an embodiment of a preferred perfume prediction method.
이하 명세서 전체에서 동일 참조 부호는 특별한 사정이 없는 한 동일 구성요소를 지칭한다. 이하에서 사용되는 ‘부’가 부가된 용어는, 소프트웨어 및/또는 하드웨어로 구현될 수 있으며, 실시예에 따라 하나의 ‘부’가 하나의 물리적 또는 논리적 부품으로 구현되거나, 복수의 ‘부’가 하나의 물리적 또는 논리적 부품으로 구현되거나, 하나의 ‘부’가 복수의 물리적 또는 논리적 부품들로 구현되는 것도 가능하다. 명세서 전체에서 어떤 부분이 다른 부분과 연결되어 있다고 할 때, 이는 어떤 부분과 다른 부분이 상호 간에 물리적으로 연결되었음을 의미할 수도 있고, 및/또는 전기적으로 연결되었음을 의미할 수도 있다. 또한, 어떤 부분이 다른 부분을 포함한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 부분 이외의 또 다른 부분을 제외하는 것이 아니며, 설계자의 선택에 따라서 또 다른 부분을 더 포함할 수 있음을 의미한다. 제1 내지 제N(N은 1 이상의 자연수) 등의 표현은, 적어도 하나의 부분(들)을 다른 부분(들)으로부터 구분하기 위한 것으로, 특별한 기재가 없는 이상 이들이 순차적임을 반드시 의미하지는 않는다. 또한 단수의 표현은 문맥상 명백하게 예외가 있지 않는 한, 복수의 표현을 포함할 수 있다.Throughout the specification below, the same reference signs refer to the same components unless there are special circumstances. Terms with the addition of 'unit' used below may be implemented as software and/or hardware, and depending on the embodiment, one 'unit' may be implemented as one physical or logical part, or a plurality of 'units' may be implemented. It is also possible to be implemented with one physical or logical part, or one 'part' to be implemented with a plurality of physical or logical parts. When a part is said to be connected to another part throughout the specification, this may mean that the part and the other part are physically connected to each other and/or electrically connected. In addition, when a part includes another part, this does not mean excluding another part other than the other part unless specifically stated to the contrary, and means that another part may be included depending on the designer's choice. do. Expressions such as the first to Nth (N is a natural number greater than or equal to 1) are intended to distinguish at least one part(s) from other part(s), and do not necessarily mean that they are sequential unless otherwise specified. Additionally, singular expressions may include plural expressions, unless the context clearly makes an exception.
이하 도 1 내지 도 12를 참조하여 선호 향수 예측 장치의 일 실시예를 설명하도록 한다.Hereinafter, an embodiment of a preferred perfume prediction device will be described with reference to FIGS. 1 to 12.
도 1은 선호 향수 예측 장치의 일 실시예에 대한 블록도이다.1 is a block diagram of an embodiment of a preferred perfume prediction device.
도 1에 도시된 바를 참조하면, 일 실시예에 있어서 선호 향수 예측 장치(100)는, 입력부(101), 저장부(103), 출력부(109) 및 프로세서(110)를 포함할 수 있다. 입력부(101), 저장부(103), 출력부(109) 및 프로세서(110) 중 적어도 둘은 회로, 케이블 또는 무선 통신 네트워크 등을 통해 일방으로 또는 쌍방으로 전기적 신호를 전달하여 명령이나 데이터 등을 전송할 수 있다. 필요에 따라, 입력부(101), 저장부(103) 및 출력부(109) 중 적어도 하나는 생략 가능하다.Referring to FIG. 1, in one embodiment, the preference perfume prediction device 100 may include an input unit 101, a storage unit 103, an output unit 109, and a processor 110. At least two of the input unit 101, storage unit 103, output unit 109, and processor 110 transmit electrical signals one-way or two-way through a circuit, cable, or wireless communication network to provide commands, data, etc. Can be transmitted. If necessary, at least one of the input unit 101, storage unit 103, and output unit 109 can be omitted.
입력부(101)는, 향수 추천의 대상이 되는 자(이하 대상자)에 관한 정보(104, 이하 대상자 정보)나, 적어도 하나의 향수에 대한 정보(105, 이하 향수 정보)나, 향수 추천에 유효한 속성에 대한 정보(106, 이하 유효 속성 정보)를 획득하고, 이를 저장부(103) 또는 프로세서(110)로 전달할 수 있다. 또한, 입력부(101)는, 프로세서(110)가 예측한 선호 향수를 출력부(109)가 출력한 후, 사용자로부터 해당 선호 향수에 대한 후기를 입력 받을 수도 있다. 해당 선호 향수에 대한 후기는 사용자로부터 즉시 입력 받을 수도 있고 또는 일정한 시간이 경과된 이후에 입력 받을 수도 있다. 입력부(101)는, 예를 들어, 키보드 장치, 마우스 장치, 터치 스크린, 스캐너 장치, 영상 촬영 모듈, 동작 감지 센서, 감압 센서, 근접 센서, 마이크로 폰, 데이터 입출력 단자 또는 유무선 통신 모듈(일례로 랜 카드, 근거리 통신 모듈 또는 이동통신 모듈 등) 등을 이용하여 구현 가능하다.The input unit 101 includes information 104 about a person who is the target of perfume recommendation (hereinafter referred to as target person), information about at least one perfume (105, hereinafter perfume information), or attributes valid for perfume recommendation. Information 106 (hereinafter referred to as valid attribute information) may be obtained and transmitted to the storage unit 103 or the processor 110. Additionally, the input unit 101 may receive a review of the preferred perfume from the user after the output unit 109 outputs the preferred perfume predicted by the processor 110. Reviews for the preferred perfume may be input from the user immediately or after a certain period of time has elapsed. The input unit 101 may include, for example, a keyboard device, a mouse device, a touch screen, a scanner device, an image capture module, a motion detection sensor, a pressure sensor, a proximity sensor, a microphone, a data input/output terminal, or a wired/wireless communication module (for example, a LAN It can be implemented using cards, short-range communication modules, mobile communication modules, etc.).
저장부(103)는 입력부(101)를 통해 입력된 대상자 정보(104), 적어도 하나의 향수에 대한 정보 및 유효 속성 정보(106) 중 적어도 하나를 일시적 또는 비일시적으로 저장할 수 있다. 저장부(103)는, 예를 들어, 주기억장치 및 보조기억장치 중 적어도 하나를 포함할 수 있다. The storage unit 103 may temporarily or non-temporarily store at least one of the subject information 104, information about at least one perfume, and effective attribute information 106 input through the input unit 101. The storage unit 103 may include, for example, at least one of a main memory device and an auxiliary memory device.
도 2는 대상자 정보 및 대상자 정보로부터 키워드를 추출하는 일례를 설명하기 위한 도면이다.Figure 2 is a diagram for explaining an example of subject information and extracting keywords from subject information.
대상자 정보(104)는 대상자의 분석을 위해 이용 가능한 정보로, 예를 들어, 대상자 개인에 대한 정보 및/또는 선호 향수 예측 장치(100)를 조작하는 자(이하 사용자)가 검색하길 원하는 향수에 대한 정보 등을 포함할 수 있다. 여기서, 사용자와 대상자는 서로 동일할 수도 있고 상이할 수도 있다. 다시 말해서, 사용자는 자신에게 적절한 향수에 대한 정보를 입력할 수도 있고, 사용자가 아닌 타인(즉, 대상자)에게 적절한 향수(일례로 선물용 향수)에 대한 정보를 입력할 수도 있다. 대상자 개인에 대한 정보는, 일례로 대상자의 연령, 성별 또는 취향 등을 포함할 수 있다. 향수에 대한 정보는 향수 제조 브랜드, 향수 명칭, 향의 특성, 향의 강도, 노트, 향에 따라 느끼는 기분(성숙, 차분 또는 청순 등), 날씨, 지역 및/또는 계절 등을 포함할 수 있다. 실시예에 따라서, 대상자 정보(104)는 적어도 하나의 단어나 구문만을 포함할 수도 있고, 또는 도 2에 도시된 바와 같이 적어도 하나의 문장(들)을 포함할 수도 있다. 예를 들어, 대상자 정보(104)는, 도 2에 도시된 것처럼, [20대 중반 남자 향수 추천 해주세요. 요즘 날씨에 X넬 X뤼르 옴므 스포츠랑 X올 X바쥬 X디파 X르토 중에 뭐가 좋을까요? 다른 것도 좋은 것 있으면 추천해주세요!], [20 중반 남자 선물할 향수 추천 부탁드려요~ 좋아하는 향수는 X로시코스, X라리 라이트 에센스, X르토, X드세이지 X솔트 처럼 중성스럽고 가벼운 향 좋아해요] 또는 [여름에 사용하기 좋은 여자 향수 추천해주세요~~ X올 X도르만 썼는데 비슷한 느낌 뭐가 있을까요..?!] 등과 같은 답변문을 포함하여 마련된 것일 수도 있다. 실시예에 따라, 대상자 정보(104)는 하나의 사용자로부터 획득될 수도 있고, 또는 둘 이상의 사용자(사용자 A, 사용자 B 및 사용자 C 등)로부터 획득될 수도 있다.The subject information 104 is information available for analysis of the subject, for example, information about the subject's individual and/or information about the perfume that the person operating the preferred perfume prediction device 100 (hereinafter referred to as the user) wants to search for. It may include information, etc. Here, the user and the target may be the same or different. In other words, the user can input information about a perfume that is appropriate for the user, or can input information about a perfume that is appropriate for someone other than the user (i.e., the target person) (for example, perfume for a gift). Information about the individual subject may include, for example, the subject's age, gender, or preferences. Information about perfume may include perfume manufacturing brand, perfume name, scent characteristics, scent intensity, notes, mood depending on the scent (mature, calm, or innocent, etc.), weather, region, and/or season, etc. Depending on the embodiment, the subject information 104 may include only at least one word or phrase, or may include at least one sentence(s) as shown in FIG. 2 . For example, the target information 104 is as shown in Figure 2: [Please recommend a perfume for men in their mid-20s. In this weather, which is better between XNell XLure Homme Sport and XAll XBage If you have any other good ones, please recommend them!], [Please recommend a perfume to give as a gift to a man in his mid-20s~ My favorite perfumes are X-Rosicos, X-Lari Light Essence, [Please recommend a women's perfume that is good to use in the summer~~ I've only used X All Depending on the embodiment, the subject information 104 may be obtained from one user, or may be obtained from two or more users (such as user A, user B, and user C).
일 실시예에 의하면, 대상자 정보(104)는 사용자가 출력부(109)를 통해 시각적 또는 청각적으로 출력되는 요청에 응하여 답변을 입력함으로써 획득될 수 있다. 예를 들어, 출력부(109)는 먼저 요청을 텍스트, 영상 또는 음성 형식으로 외부로 출력한다. 요청은 대상자 개인의 정보 입력이나 검색하고자 하는 향수에 관한 정보 입력을 위한 요청문을 포함할 수 있고, 필요에 따라, 대상자의 피부 타입(지성, 건성 또는 민감성)의 정보 입력에 위한 요청문을 더 포함할 수도 있다. 사용자는 요청에 응하여 키보드, 마우스 또는 마이크로 폰 등을 이용하여, 텍스트, 영상(정지 영상 또는 동영상) 또는 음성의 형태로 대상자 정보(104, 단어, 문장 또는 구문 등)를 입력할 수 있다.According to one embodiment, the subject information 104 may be obtained by the user inputting an answer in response to a request that is output visually or auditorily through the output unit 109. For example, the output unit 109 first outputs the request to the outside in text, video, or audio format. The request may include a request to enter information about the subject's personal information or information about the perfume to be searched, and, if necessary, a request to enter information about the subject's skin type (oily, dry, or sensitive). It may also be included. In response to a request, the user may input subject information (104, words, sentences, or phrases, etc.) in the form of text, image (still image or video), or voice using a keyboard, mouse, or microphone.
도 3은 향수 데이터베이스의 일 실시예를 설명하기 위한 도면이다.Figure 3 is a diagram for explaining an embodiment of a perfume database.
향수 정보(105)는, 대상자의 선호 향수 예측을 위해 이용되는 적어도 하나의 향수(들)에 관한 세부적인 정보이다. 향수 정보(105)는, 예를 들어, 도 3에 도시된 바와 같이, 향수의 명칭, 향수에 대한 설명, 해당 향수의 노트 및 해당 향수에 대한 적어도 하나의 사용 후기(리뷰) 중 적어도 하나를 포함할 수 있다. 필요에 따라, 향수 정보(105)는 해당 향수의 계열 리스트를 포함할 수도 있다. 여기서 향수에 대한 설명은, 조향사, 향수 제작자 또는 향수 판매자가 작성한 것으로, 추상적이고 시적 언어 등을 이용하여 문학적으로 표현된 것일 수 있다. 노트는 향수의 향조를 의미하며, 예를 들어, 각각의 향수는 적어도 하나의 노트를 갖는다. 노트는 탑 노트(top note), 하트 노트(heart note) 및 베이스 노트(base note) 중 적어도 하나를 포함할 수 있다. 사용 후기는 대상자, 사용자 또는 타인이 직접 작성한 것으로 기호, 숫자(점수 등), 단어 또는 문장으로 이뤄질 수 있다.Perfume information 105 is detailed information about at least one perfume(s) used to predict the subject's preferred perfume. For example, as shown in FIG. 3, the perfume information 105 includes at least one of the name of the perfume, a description of the perfume, notes of the perfume, and at least one user review (review) for the perfume. can do. If necessary, the perfume information 105 may include a series list of the corresponding perfume. Here, the description of the perfume is written by a perfumer, perfume maker, or perfume seller, and may be expressed literaryally using abstract or poetic language. A note refers to the scent of a perfume, for example each perfume has at least one note. The note may include at least one of a top note, a heart note, and a base note. Reviews are written directly by the subject, user, or others and may consist of symbols, numbers (scores, etc.), words, or sentences.
향수 정보(105)는 사용자나 관리자 등이 선호 향수 예측 장치(100)에 직접 입력하거나, 또는 선호 향수 예측 장치(100)와 유무선으로 연결된 다른 단말 장치(미도시)에 입력하고 이를 선호 향수 예측 장치(100)로 전달함으로써 획득된 것일 수도 있다. 실시예에 따라서, 향수 정보(105)는 선호 향수 예측 장치(100)가 유무선 네트워크를 통해 접근 가능한 서버 장치(일례로 웹 서버나 데이터베이스 서버 등)로부터 취득된 것일 수도 있다. 이 경우, 향수 정보(105)는 크롤링(crawling) 등을 통해 수집된 것일 수도 있다.Perfume information 105 is entered directly into the preference perfume prediction device 100 by a user or administrator, or is entered into another terminal device (not shown) connected wired or wirelessly to the preference perfume prediction device 100 and is inputted into the preference perfume prediction device 100. It may have been obtained by passing it to (100). Depending on the embodiment, the perfume information 105 may be acquired from a server device (eg, a web server or a database server, etc.) accessible to the preference perfume prediction device 100 through a wired or wireless network. In this case, the perfume information 105 may have been collected through crawling or the like.
일 실시예에 의하면, 향수 정보(105)는 데이터베이스(이하 향수 데이터베이스)의 형태로 저장부(103)에 저장될 수도 있다. 일 실시예에 따르면, 향수 데이터베이스는, 특정한 향수에 적어도 하나의 식별번호를 할당하고, 해당 식별 번호에 대응하여 향수 명칭, 향수 설명, 사용 노트 및 적어도 하나의 리뷰 등을 연결함으로써 구축될 수도 있다. 여기서, 향수 설명, 사용 노트 및 적어도 하나의 리뷰 등은 사용자나 관리자의 입력 또는 웹 사이트 크롤링 등을 통해 획득된 것일 수 있다. 적어도 하나의 리뷰는, 사용자가 선호 향수 예측 장치(100)로부터 추천 받은 선호 향수에 대한 리뷰도 포함하는 것도 가능하다.According to one embodiment, the perfume information 105 may be stored in the storage unit 103 in the form of a database (hereinafter referred to as perfume database). According to one embodiment, a perfume database may be constructed by assigning at least one identification number to a specific perfume and linking the perfume name, perfume description, usage notes, and at least one review, etc., corresponding to the identification number. Here, the perfume description, usage notes, and at least one review may be obtained through user or administrator input or website crawling. At least one review may also include a review of a preferred perfume recommended by the user from the preferred perfume prediction device 100.
도 4는 유효 속성 정보의 일례를 설명하기 위한 도면이다.Figure 4 is a diagram for explaining an example of effective attribute information.
유효 속성 정보(106)는 선호 향수 예측에 주요한 속성으로 이용될 수 있는 적어도 하나의 단어, 구문 또는 문장을 포함할 수 있다. 예를 들어, 도 4에 도시된 바와 같이, 유효 속성 정보는 연령을 나타내는 단어(10, 20, 30, 40, 50, 초반, 중반, 후반, 젊은 또는 어린 등), 성별을 나타내는 단어(남, 여, 남자, 여자, 남성 또는 여성 등), 계절을 나타내는 단어(봄, 여름, 가을 또는 겨울 등), 날씨를 나타내는 단어(맑은, 흐림, 비, 눈 또는 서늘한 등), 향수 제조사 명칭, 향수 브랜드 또는 향수 명칭 등을 포함할 수 있다. 이러한 유효 속성 정보(106)는 사전에 미리 정의된 것일 수 있다. 필요에 따라서, 유효 속성 정보(106)는 사용자 등의 수동 조작이나 프로세서(110)의 제어 등에 의해 갱신될 수도 있다.The valid attribute information 106 may include at least one word, phrase, or sentence that can be used as a key attribute in predicting preference perfume. For example, as shown in Figure 4, valid attribute information includes words indicating age (10, 20, 30, 40, 50, early, mid, late, young or young, etc.), words indicating gender (male, female, male, female, masculine or feminine, etc.), words for seasons (such as spring, summer, fall or winter), words for weather (such as clear, cloudy, rain, snow or cool), name of perfume manufacturer, perfume brand Or it may include the perfume name, etc. This effective attribute information 106 may be predefined in advance. If necessary, the valid attribute information 106 may be updated by manual operation by a user or by control of the processor 110.
또한, 저장부(103)는 프로세서(110)의 동작 수행을 위해 구동되는 적어도 하나의 프로그램(앱, 애플리케이션 또는 소프트웨어로 지칭 가능함)을 저장할 수 있다. 저장부(103)에 저장된 프로그램은, 프로그래머 등의 설계자에 의해 직접 작성 또는 수정된 후 저장부(103)에 저장된 것일 수도 있고, 다른 물리적 기록 매체(외장 메모리 장치나 콤팩트 디스크(CD) 등)으로부터 전달받아 저장된 것일 수도 있으며, 유무선 통신 네트워크를 통해 접속 가능한 전자 소프트웨어 유통망을 통하여 획득 또는 갱신된 것일 수도 있다. Additionally, the storage unit 103 may store at least one program (which may be referred to as an app, application, or software) that is driven to perform the operation of the processor 110. The program stored in the storage unit 103 may be written or modified directly by a designer such as a programmer and then stored in the storage unit 103, or may be stored in the storage unit 103 from another physical recording medium (external memory device, compact disk (CD), etc.). It may be delivered and stored, or it may be acquired or updated through an electronic software distribution network accessible through a wired or wireless communication network.
출력부(109)는 대상자 정보(104) 등의 입력 요청이나 프로세서(110)의 선호 향수 예측 결과(일례로 적어도 하나의 선호 향수 또는 이들을 포함하는 리스트)를 외부로 시각적 또는 청각적으로 출력할 수 있다. 출력부(109)는, 예를 들어, 디스플레이, 프린터 장치, 스피커 장치, 영상 출력 단자, 데이터 입출력 단자 또는 통신 모듈 등을 포함할 수 있으나, 이에 한정되는 것은 아니다. 필요에 따라 출력부(109)는 입력부(101)와 일체형으로 마련되는 것도 가능하다.The output unit 109 may visually or audibly output an input request such as target information 104 or a preferred perfume prediction result of the processor 110 (for example, at least one preferred perfume or a list containing them) to the outside. there is. The output unit 109 may include, for example, a display, a printer device, a speaker device, an image output terminal, a data input/output terminal, or a communication module, but is not limited thereto. If necessary, the output unit 109 may be provided integrally with the input unit 101.
프로세서(110)는 선호 향수 예측을 위해 필요한 일련의 연산 처리를 수행하고, 선호 향수 예측 결과를 획득한 후, 선호 향수 예측 결과를 저장부(103)나 출력부(109)로 전달할 수 있다. 이 경우, 프로세서(110)는 저장부(103)에 저장된 프로그램을 실행시켜 선호 향수 예측 동작을 수행할 수도 있다. 또한, 프로세서(110)는 사용자나 관리자 등의 명령 입력에 따라 또는 미리 정의된 설정에 의해 자동으로 향수 정보(105)를 수집하고 이를 저장부(103)에 저장시킬 수도 있다. 프로세서(110)는, 실시예에 따라, 중앙 처리 장치(CPU: Central Processing Unit), 그래픽 처리 장치(GPU: Graphic Processing Unit), 마이크로 컨트롤러 유닛(MCU: Micro Controller Unit), 애플리케이션 프로세서(AP: Application Processor), 전자 제어 유닛(ECU: Electronic Controlling Unit) 및/또는 이외 각종 연산 및 제어 처리를 수행할 수 있는 적어도 하나의 전자 장치 등을 포함할 수 있다. 이들 처리 또는 제어 장치는, 예를 들어, 하나 또는 둘 이상의 반도체 칩, 회로 또는 관련 부품 등을 단독으로 이용하거나 조합하여 구현된 것일 수도 있다.The processor 110 may perform a series of calculations required to predict a preferred perfume, obtain a preferred perfume prediction result, and then transmit the preferred perfume prediction result to the storage unit 103 or the output unit 109. In this case, the processor 110 may execute a program stored in the storage unit 103 to perform a preference perfume prediction operation. In addition, the processor 110 may automatically collect perfume information 105 according to a command input from a user or administrator or according to predefined settings and store it in the storage unit 103. Depending on the embodiment, the processor 110 may include a central processing unit (CPU), a graphics processing unit (GPU), a microcontroller unit (MCU), and an application processor (AP). It may include a processor, an electronic control unit (ECU), and/or at least one electronic device capable of performing various calculations and control processes. These processing or control devices may be implemented, for example, by using one or more semiconductor chips, circuits, or related components alone or in combination.
일 실시예에 따르면, 프로세서(110)는 도 1에 도시된 것처럼 대상자 분석부(120), 향수 분석부(130) 및 선호 향수 예측부(140)를 포함할 수 있으며, 실시예에 따라 향수 정보 수집부(150)를 더 포함할 수도 있다. 대상자 분석부(120), 향수 분석부(130), 선호 향수 예측부(140) 및 향수 정보 수집부(150)는 상호 논리적으로 구분되거나 물리적으로 구분되는 것일 수 있으며, 실시예에 따라 이들 중 적어도 하나는 하나 또는 둘 이상의 물리적 프로세서(일례로 중앙 처리 장치 및 그래픽 처리 장치)를 이용하여 구현될 수도 있다.According to one embodiment, the processor 110 may include a subject analysis unit 120, a perfume analysis unit 130, and a preferred perfume prediction unit 140 as shown in FIG. 1, and depending on the embodiment, perfume information It may further include a collection unit 150. The subject analysis unit 120, the perfume analysis unit 130, the preferred perfume prediction unit 140, and the perfume information collection unit 150 may be logically or physically separated from each other, and depending on the embodiment, at least one of them may be One may be implemented using one or more physical processors (eg, a central processing unit and a graphics processing unit).
대상자 분석부(120)는 대상자 정보(104)를 기반으로 대상자에 대한 속성을 분석하고, 이에 대응하는 벡터(이하 대상자 속성 벡터)를 획득한 후, 대상자 속성 벡터를 선호 향수 예측부(140)로 전달할 수 있다. 이 경우, 대상자 분석부(120)는, 키워드 추출부(121), 유효속성결정부(123), 연관 키워드 획득부(125) 및 벡터화부(127)를 포함할 수도 있다.The subject analysis unit 120 analyzes the attributes of the subject based on the subject information 104, obtains a corresponding vector (hereinafter referred to as the subject attribute vector), and then sends the subject attribute vector to the preference perfume prediction unit 140. It can be delivered. In this case, the target analysis unit 120 may include a keyword extraction unit 121, an effective attribute determination unit 123, a related keyword acquisition unit 125, and a vectorization unit 127.
키워드 추출부(121)는 도 2에 도시된 것처럼 대상자 정보(104)로부터 적어도 하나의 주요 단어(들)(122, 이하 대상자 키워드)를 추출할 수 있다. 예를 들어, 키워드 추출부(121)는 대상자 정보(104)가 적어도 하나의 문장을 포함하는 경우, 각각의 문장에 대해 형태소 분석을 수행하고, 필요에 따라 형태소 분석 결과에서 불용어(stopword)를 제거한 후, 대상자 정보(104)에 대응하는 적어도 하나의 대상자 키워드(122)를 얻을 수 있다. 보다 구체적으로 예를 들어, 만약 사용자 A가, 도 2에 기재된 것처럼, [20대 중반 남자 향수 추천 해주세요. 요즘 날씨에 X넬 X뤼르 옴므 스포츠랑 X올 X바쥬 X디파 X르토 중에 뭐가 좋을까요? 다른 것도 좋은 거 있으면 추천해주세요!]라는 다수의 문장을 대상자 정보(104)로 입력하였다면, 키워드 추출부(121)는 대상자 정보(104)의 형태소 분석을 수행하여 적어도 하나의 형태소를 추출하고, 적어도 하나의 형태소 중에서 불용어인 향수나 추천 등의 단어 등을 제외한 후, 나머지 단어나 어구 등(일례로 남자, X넬, X뤼르, 옴므, 스포츠 또는 X르토 등)을 대상자 키워드로서 추출할 수도 있다. 여기서, 적어도 하나의 대상자 키워드(122)는 단어, 어간 또는 어구의 형태를 가질 수 있다. 불용어는 어구나 문장 내에서 의미가 없거나 극히 작은 단어 토큰을 의미하며, 입력이 자명하거나 분석에 사용되기 어려운 단어나 문구 등을 포함할 수 있다. 불용어는 향수, 추천, 요즘, 날씨, -만, 좋아하는, 사용하기, 좋은, 원하는, 어울리는, 해주세요, 부탁드려요 또는 부탁드립니다 등의 단어, 어간 또는 어구를 포함할 수 있으나, 이는 예시적인 것으로 사용자나 관리자는 선택에 따라 불용어를 다양하게 정의할 수 있다. 추출된 적어도 하나의 대상자 키워드(들)은 벡터화부(127)로 전달될 수 있으며, 실시예에 따라 유효 속성 결정부(123)로도 전달될 수 있다. 또한, 각각의 문장에 대한 형태소 분석이나 불용어 제거 등의 동작은 적어도 하나의 학습 모델을 이용하여 수행될 수 있다. 학습 모델은, 예를 들어, 심층 신경망(DNN: Deep Neural Network), 콘볼루션 신경망(CNN: Convolutional Neural Network) 및/또는 장단기 메모리(LSTM: Long short term memory) 등을 포함할 수 있으나, 이에 한정되는 것은 아니다.The keyword extraction unit 121 may extract at least one key word(s) 122 (hereinafter referred to as a target keyword) from the target information 104 as shown in FIG. 2 . For example, if the subject information 104 includes at least one sentence, the keyword extraction unit 121 performs morphological analysis on each sentence and, if necessary, removes stopwords from the morphological analysis results. Afterwards, at least one target keyword 122 corresponding to the target information 104 can be obtained. More specifically, for example, if user A, as shown in Figure 2, [Please recommend a perfume for a man in his mid-20s. In this weather, which is better between XNell XLure Homme Sport and XAll XBage If a number of sentences such as 'If there is anything else that is good, please recommend it!' are entered as the target information 104, the keyword extraction unit 121 performs morphological analysis of the target information 104 to extract at least one morpheme, and at least After excluding stop words such as perfume or recommendation from one morpheme, the remaining words or phrases (for example, man, Here, at least one target keyword 122 may have the form of a word, stem, or phrase. Stop words refer to meaningless or extremely small word tokens within a phrase or sentence, and may include words or phrases that are self-explanatory or difficult to use for analysis. Stop words may include words, stems, or phrases such as perfume, recommendation, these days, weather, -only, like, use, good, want, suitable, please, please, or please, but these are illustrative and user-friendly. I, the administrator, can define stop words in various ways depending on my choice. At least one extracted target keyword(s) may be delivered to the vectorization unit 127 and, depending on the embodiment, may also be delivered to the effective attribute determination unit 123. Additionally, operations such as morpheme analysis or stop word removal for each sentence may be performed using at least one learning model. Learning models may include, but are limited to, for example, a deep neural network (DNN), a convolutional neural network (CNN), and/or long short term memory (LSTM), etc. It doesn't work.
유효 속성 결정부(123)는 키워드 추출부(121)로부터 적어도 하나의 대상자 키워드를 수신하고, 도 4에 도시된 바와 같은 유효 속성 정보(106)을 참조하여 해당 대상자 키워드가 유효 속성 정보(106)에 해당하는지 여부를 결정할 수 있다. 예를 들어, 유효 속성 결정부(123)는 대상자 키워드로 [남자]라는 단어가 전달되면, 유효 속성 정보(106)를 참조하여 [남자]가 유효 속성이라고 판별할 수 있다. 또한, 대상자 키워드로 [성숙]이라는 단어가 전달되고, 해당 단어가 유효 속성 정보(160) 내에 부재하면, 유효 속성 결정부(123)는 [성숙]은 유효 속성이 아니라고 판별할 수 있다. 유효 속성 결정부(123)는 상술한 과정에 따라 유효 속성으로 판별된 적어도 하나의 대상자 키워드(이하 유효 속성 키워드)를 검출하여 획득하고, 획득한 유효 속성 키워드를 연관 키워드 획득부(125)로 전달할 수 있다.The valid attribute determination unit 123 receives at least one target keyword from the keyword extracting unit 121, and determines that the target keyword is valid attribute information 106 with reference to the valid attribute information 106 as shown in FIG. 4. You can decide whether it applies or not. For example, when the word [man] is transmitted as a target keyword, the valid attribute determination unit 123 may refer to the valid attribute information 106 and determine that [man] is a valid attribute. Additionally, if the word [maturity] is transmitted as the target keyword and the word is not included in the valid attribute information 160, the valid attribute determination unit 123 may determine that [maturity] is not a valid attribute. The valid attribute determination unit 123 detects and acquires at least one target keyword (hereinafter referred to as a valid attribute keyword) determined as a valid attribute according to the above-described process, and transmits the obtained effective attribute keyword to the related keyword acquisition unit 125. You can.
도 5는 특정 사용자에 대해 유효 속성 매핑 및 연관 키워드 추출의 일례를 설명하기 위한 도면이다.FIG. 5 is a diagram illustrating an example of valid attribute mapping and related keyword extraction for a specific user.
연관 키워드 획득부(125)는 유효 속성 결정부(123)로부터 유효 속성 키워드를 수신하고, 도 5에 도시된 것처럼 유효 속성 키워드에 대응하는 연관 키워드(126)를 획득할 수 있다. 연관 키워드(126)는 유효 속성 키워드와 관련 있는 적어도 하나의 키워드를 포함할 수 있다. 일 실시예에 의하면, 연관 키워드 획득부(125)는 유효 속성 키워드와 미리 정의된 선호 매칭 사전을 상호 매핑하여, 유효 속성 키워드에 대응하는 하나 이상의 연관 키워드를 획득할 수도 있다. 보다 구체적으로 예를 들어, 연관 키워드 획득부(125)는 유효 속성 키워드인 [20대 중반]이라는 단어를 전달 받으면, 선호 매칭 사전을 참조하여 전달 받은 [20대 중반]이라는 단어에 대응하는 적어도 하나의 연관 키워드, 일례로 [밝음], [풍부함], [트렌드], [복학] 또는 [아쿠아] 등을 추출하여 획득할 수 있다. 추출된 연관 키워드(126)는 벡터화부(127)로 전달될 수 있다.The related keyword acquisition unit 125 may receive a valid attribute keyword from the valid attribute determination unit 123 and obtain a related keyword 126 corresponding to the valid attribute keyword, as shown in FIG. 5 . The related keyword 126 may include at least one keyword related to a valid attribute keyword. According to one embodiment, the related keyword acquisition unit 125 may obtain one or more related keywords corresponding to the effective attribute keyword by mapping the effective attribute keyword to a predefined preference matching dictionary. More specifically, for example, when the related keyword acquisition unit 125 receives the word [mid-20s], which is a valid attribute keyword, it refers to the preference matching dictionary and provides at least one word corresponding to the received word [mid-20s]. It can be obtained by extracting related keywords, such as [bright], [abundance], [trend], [return to school], or [aqua]. The extracted related keywords 126 may be transmitted to the vectorization unit 127.
도 6은 단어 별 빈도수의 일례를 설명하기 위한 도면이다.Figure 6 is a diagram for explaining an example of frequency for each word.
일 실시예에 따르면, 벡터화부(127)는 키워드 추출부(121)로부터 적어도 하나의 대상자 키워드를 전달 받고, 이와 동시에 또는 순차적으로 연관 키워드 획득부(125)로부터 적어도 하나의 연관 키워드를 전달 받은 후, 이를 조합하여 대상자 속성 벡터를 생성할 수 있다. 이 경우, 벡터화부(127)는 키워드 추출부(121)가 전달한 대상자 키워드(들)와 유효 속성 키워드에 대응하는 연관 키워드(들)를 조합하여, 적어도 일 집합(이하 키워드 집합)을 생성하고, 도 6에 도시된 바와 같이 키워드 집합에 속하는 각각의 키워드마다 빈도수(일례로, 동일한 키워드가 반복 추출된 회수 등)를 결정한다. 예를 들어, 키워드 집합 내에서 [아쿠아]라는 키워드는 등장 빈도수가 7로 결정되고, [해변]이라는 키워드는 등장 빈도수가 6으로 결정되며, [하얀], [해안] 및 [여름]이라는 키워드는 등장 빈도수가 5로 결정될 수 있다. 각각의 키워드마다 대응하는 빈도수가 결정되면, 벡터화부(127)는, 키워드 별 빈도수를 기반으로, 키워드 집합의 모든 키워드 중에서 대상자 속성 벡터를 키워드를 하나 이상 추출할 수 있다. 실시예에 따라서, 벡터화부(127)는, 빈도수가 큰 순서에 따라 N개의 키워드를 대상자 속성 벡터를 위한 키워드로 추출할 수도 있고(여기서, N은 1 이상의 자연수. 사용자나 관리자 등의 선택에 따라 결정될 수 있음), 또는 대응하는 빈도수가 기준 빈도수(예를 들어, 3이나 5 등. 사용자나 관리자 등의 선택에 따라 결정될 수 있음)보다 큰 적어도 하나의 키워드(예를 들어, 기준 빈도수가 4로 정의된 경우, 도 6의 [아쿠아], [해변], [하얀], [해안] 및 [여름] 등)를 대상자 속성 벡터를 위한 키워드로 추출할 수도 있다. 이어서, 벡터화부(127)는, 추출된 키워드를 소정 순서(예를 들어, 각 키워드의 빈도수)에 따라 배열하여 대상자 속성 벡터를 생성한다. 예를 들어, 도 2의 사용자 A에 대한 대상자 속성 벡터는 [아쿠아, 해변, 하얀, 해안, 여름, 가벼운]과 같이 생성되고, 사용자 B에 대한 대상자 속성 벡터는 [선물, 중성, 바다, 잔향, 가벼운]과 같이 생성될 수 있다. 대상자 속성 벡터는 선호 향수 예측부(140)로 전달될 수 있다.According to one embodiment, the vectorization unit 127 receives at least one target keyword from the keyword extraction unit 121 and simultaneously or sequentially receives at least one related keyword from the related keyword acquisition unit 125. , these can be combined to create a subject attribute vector. In this case, the vectorization unit 127 combines the target keyword(s) delivered by the keyword extraction unit 121 and the related keyword(s) corresponding to the effective attribute keywords to generate at least one set (hereinafter referred to as a keyword set), As shown in Figure 6, the frequency (for example, the number of times the same keyword is repeatedly extracted, etc.) is determined for each keyword belonging to the keyword set. For example, within a set of keywords, the keyword [aqua] has an appearance frequency of 7, the keyword [beach] has an appearance frequency of 6, and the keywords [white], [coast], and [summer] have an appearance frequency of 6. The frequency of appearance may be determined to be 5. Once the frequency corresponding to each keyword is determined, the vectorization unit 127 may extract one or more target attribute vector keywords from all keywords in the keyword set based on the frequency for each keyword. Depending on the embodiment, the vectorization unit 127 may extract N keywords as keywords for the target attribute vector in order of increasing frequency (where N is a natural number of 1 or more. Depending on the selection of the user or administrator, etc. can be determined), or at least one keyword whose corresponding frequency is greater than the standard frequency (for example, 3 or 5, etc. can be determined according to the selection of the user, administrator, etc.) (for example, the standard frequency is 4) If defined, [Aqua], [Beach], [White], [Coast], and [Summer], etc. in Figure 6) may be extracted as keywords for the subject attribute vector. Next, the vectorization unit 127 generates a target attribute vector by arranging the extracted keywords according to a predetermined order (for example, the frequency of each keyword). For example, the audience attribute vector for user A in Figure 2 is created as [aqua, beach, white, coastal, summer, light], and the audience attribute vector for user B is created as [gift, neutral, sea, reverberation, It can be created as [light]. The subject attribute vector may be transmitted to the preferred perfume prediction unit 140.
향수 분석부(130)는 향수 정보(105, 일례로 향수 데이터베이스)를 기반으로 향수에 대한 속성을 분석하고, 이에 대응하는 벡터(이하 향수 속성 벡터)를 획득하고, 획득한 향수 속성 벡터를 선호 향수 예측부(140)로 전달할 수 잇다. 일 실시예에 따르면, 향수 분석부(130)는 키워드 추출부(131) 및 벡터화부(133)를 포함 가능하다.The perfume analysis unit 130 analyzes perfume properties based on perfume information (105, for example, a perfume database), acquires a corresponding vector (hereinafter referred to as a perfume attribute vector), and uses the obtained perfume attribute vector as a preferred perfume. It can be transmitted to the prediction unit 140. According to one embodiment, the perfume analysis unit 130 may include a keyword extraction unit 131 and a vectorization unit 133.
도 7은 특정 향수에 대한 설명의 일례를 도시한 도면이고, 도 8은 각 특정 단어(들)의 개수 및 단어 등장 문서 수(DF: Document Frequency)를 설명하기 위한 도면이다. 도 9는 단어 등장 빈도(TF: Term Frequency)에 단어 등장 문서 수의 역수를 곱한 결과를 도시한 도면이다.FIG. 7 is a diagram illustrating an example of a description of a specific perfume, and FIG. 8 is a diagram illustrating the number of each specific word(s) and the number of documents in which the word appears (DF: Document Frequency). Figure 9 is a diagram showing the result of multiplying the word appearance frequency (TF: Term Frequency) by the reciprocal of the number of documents in which the word appears.
키워드 추출부(131)는 향수 정보(105)로부터 하나 이상의 키워드(이하 향수 키워드)를 추출할 수 있다. 예를 들어, 향수 정보(105)가 적어도 하나의 문장을 포함하는 경우, 키워드 추출부(131)는 적어도 하나의 문장 각각에 대해 형태소 분석을 수행하여 적어도 하나의 단어나 어구 등을 획득하고, 필요에 따라 형태소 분석 결과(즉, 단어나 어구 등)에서 불용어를 제거함으로써, 향수 정보(105)로부터 향수 정보(105)에 대응하는 향수 키워드를 하나 이상 추출할 수 있다. 예를 들어, 도 7에 도시된 바와 같이 특정한 향수(일례로 향수 A)에 관하여 다수의 문서(D0 내지 D3, 각각의 문서는 향수에 관한 적어도 하나의 문장을 포함 가능함)가 존재하는 경우, 키워드 추출부(131)는 각각의 이들 각각의 문서(D0 내지 D3)에 대해 형태소 분석을 수행하여 다수의 단어나 어구를 획득하고, 획득한 단어나 어구 중에서 불용어(일례로, [향수]나 [취향저격] 등)을 제거하여 모든 문서(D0 내지 D3)로부터 [바람], [해안], [하얗게], [모래], [여름]. [우디향], [십대], [여자], [자몽], [좋은] 및 [해변가] 등의 향수 키워드를 획득할 수 있다. 문장에 대한 형태소 분석이나 불용어 제거 등은 적어도 하나의 학습 모델을 이용하여 수행될 수도 있다.The keyword extraction unit 131 may extract one or more keywords (hereinafter referred to as perfume keywords) from the perfume information 105. For example, when the perfume information 105 includes at least one sentence, the keyword extractor 131 performs morphological analysis on each of the at least one sentence to obtain at least one word or phrase, and Accordingly, one or more perfume keywords corresponding to the perfume information 105 can be extracted from the perfume information 105 by removing stop words from the morphological analysis results (i.e., words, phrases, etc.). For example, as shown in Figure 7, if there are multiple documents (D0 to D3, each document may include at least one sentence about perfume) regarding a specific perfume (for example, perfume A), the keyword The extraction unit 131 performs morphological analysis on each of these documents (D0 to D3) to obtain a number of words or phrases, and among the acquired words or phrases, stop words (for example, [perfume] or [taste] [Sniping], etc.) to remove [Wind], [Coast], [White], [Sand], and [Summer] from all documents (D0 to D3). You can obtain perfume keywords such as [Woody], [Teen], [Women], [Grapefruit], [Good], and [Beach]. Morphological analysis or stop word removal for a sentence may be performed using at least one learning model.
향수 키워드가 추출되면, 키워드 추출부(131)는, 도 8에 도시된 바와 같이, 각각의 문서(D0 내지 D3)를 기반으로 단어 등장 빈도(TF)를 결정할 수 있다. 단어 등장 빈도(TF)는 어느 하나의 문서(D0 내지 D3)에서 소정의 단어(term)가 검출된 횟수를 의미한다. 구체적으로 예를 들어, 키워드 추출부(131)는 특정 향수에 대한 특정한 문서(D0 내지 D3) 내에서 적어도 하나의 단어(예를 들어, [바람], [해안] 또는 [일상] 등)가 각각 어느 정도의 빈도로 등장하였는지를 계수하여, 각각의 단어에 대응하는 단어 등장 빈도(TF)를 획득하여 기록할 수 있다. 예를 들어, 도 8에 도시된 바처럼, 문서 0(D0)의 경우에는, [바람]은 1회, [해안]은 2회, [일상]은 2회, [시원한]은 1회, [우디]는 1회, [해변]은 0회, [여름]은 3회, [여자]는 0회, [모래]는 0회 등장하였다고 결정될 수 있다.When the perfume keyword is extracted, the keyword extraction unit 131 may determine the word appearance frequency (TF) based on each document (D0 to D3), as shown in FIG. 8. The word appearance frequency (TF) refers to the number of times a certain word (term) is detected in one document (D0 to D3). Specifically, for example, the keyword extraction unit 131 determines that at least one word (e.g., [wind], [coast], or [daily life]) in a specific document (D0 to D3) for a specific perfume, respectively. By counting the frequency with which each word appears, the word appearance frequency (TF) corresponding to each word can be obtained and recorded. For example, as shown in Figure 8, in the case of document 0 (D0), [Wind] is used once, [Coast] is used twice, [Daily Life] is used twice, [Cool] is used once, [ It can be determined that [Woody] appeared 1 time, [Beach] 0 times, [Summer] 3 times, [Woman] 0 times, and [Sand] 0 times.
또한, 키워드 추출부(131)는, 특정한 키워드에 대해서 단어 등장 문서 수(DF)를 더 계수할 수도 있다. 단어 등장 문서 수(DF)는 모든 문서(D0 내지 D3) 중에서 소정의 단어가 등장한 문서(D0 내지 D3)의 개수를 의미한다. 구체적으로 도 8에 도시된 바를 참조하면, [바람]이라는 키워드는 2개의 문서(D0 및 D2)에서 등장하므로, [바람]이라는 키워드에 대응하는 문서(즉, 단어 등장 문서 수(DF))의 개수는 2가 된다. 마찬가지로 [해안]이라는 키워드는 2개의 문서(D0 및 D2)에서 등장하므로, [해안]이라는 키워드에 대응하는 단어 등장 문서 수(DF) 역시 2가 된다. 동일하게 [일상], [시원한], [우디], [해변], [여름], [여자] 및 [모래] 각각의 키워드에 대한 단어 등장 문서 수(DF)는, 각각 3, 1, 1, 2, 2, 2 및 1로 주어질 수 있다.Additionally, the keyword extraction unit 131 may further count the number of documents (DF) in which a word appears for a specific keyword. The number of documents in which a word appears (DF) means the number of documents (D0 to D3) in which a given word appears among all documents (D0 to D3). Specifically, referring to Figure 8, the keyword [wind] appears in two documents (D0 and D2), so the number of documents (i.e., the number of documents (DF) in which the word appears) corresponding to the keyword [wind] The number becomes 2. Likewise, since the keyword [coast] appears in two documents (D0 and D2), the number of documents (DF) in which the word corresponding to the keyword [coast] appears is also 2. Likewise, the number of word-appearing documents (DF) for each keyword [daily life], [cool], [woody], [beach], [summer], [woman], and [sand] is 3, 1, 1, respectively. Can be given as 2, 2, 2 and 1.
키워드 추출부(131)는 각각의 키워드 및 문서(D0 내지 D3)을 기반으로 단어 등장 빈도(TF) 및 단어 등장 문서수(DF)가 결정되면, 도 9에 도시된 바와 같이 각 키워드에 대한 단어 등장 빈도(TF) 및 단어 등장 문서수(DF)를 기반으로 해당 단어에 대한 문서 내 중요도를 결정할 수 있다. 일 실시예에 의하면, 키워드 추출부(131)는 적어도 일 단어가 주어지면, 해당 단어 등장 빈도(TF)를 해당 단어에 대한 단어 등장 문서수(DF)로 나누고, 나눈 결과 값(TF/DF)을 기반으로 문서 내 단어 중요도를 결정할 수 있다. 예를 들어, 도 8 및 도 9에 도시된 바를 참조하면, [바람]이라는 키워드에 대한 문서 0(D0) 내에서의 중요도는, 문서 0(D0)에 대한 [바람]이라는 키워드의 단어 등장 빈도(TF)가 1이고 단어 등장 문서 수(DF)가 2이므로, 0.5(=1/2)로 주어진다. 동일하게 문서 1(D1) 내에서 [바람]이라는 키워드의 중요도는, 문서 0(D0)에 대한 [바람]이라는 키워드의 단어 등장 빈도(TF)가 0이므로, 0의 값을 가지게 된다. 또한, 문서 0(D0) 내에서의 [해안]이라는 키워드의 중요도는, 문서 0(D0)에 대한 [해안]이라는 키워드의 단어 등장 빈도(TF)가 2이고 단어 등장 문서 수(DF)가 2이므로, 1(=2/2)로 결정되게 된다. 도 9와 같이 획득된 문서 내 단어 중요도는 벡터화부(133)로 전달된다.When the word appearance frequency (TF) and the number of word appearance documents (DF) are determined based on each keyword and document (D0 to D3), the keyword extraction unit 131 determines the word for each keyword as shown in FIG. 9. Based on the frequency of appearance (TF) and the number of documents in which the word appears (DF), the importance of the word in the document can be determined. According to one embodiment, when at least one word is given, the keyword extractor 131 divides the word appearance frequency (TF) by the number of word appearance documents (DF) for the word, and divides the resulting value (TF/DF). Based on this, the importance of words in a document can be determined. For example, referring to Figures 8 and 9, the importance within document 0 (D0) for the keyword [wind] is the word appearance frequency of the keyword [wind] for document 0 (D0). Since (TF) is 1 and the number of documents in which the word appears (DF) is 2, it is given as 0.5 (=1/2). Likewise, the importance of the keyword [wind] in document 1 (D1) has a value of 0 because the word appearance frequency (TF) of the keyword [wind] in document 0 (D0) is 0. In addition, the importance of the keyword [coast] in document 0 (D0) is that the word appearance frequency (TF) of the keyword [coast] for document 0 (D0) is 2 and the number of documents in which the word appears (DF) is 2. Therefore, it is decided as 1 (=2/2). As shown in Figure 9, the obtained word importance within the document is transmitted to the vectorization unit 133.
벡터화부(133)는 추출된 향수 키워드 중에서 핵심 키워드를 선택하고, 선택한 핵심 키워드를 기반으로 향수 속성 벡터를 생성할 수 있다. 예를 들어, 벡터화부(133)는 도 9에 도시된 바와 같이 문서 내 단어 중요도가 전달되면, 미리 정의된 바에 따라서 적어도 하나의 향수 키워드(일례로 [바람], [해안], [일상], [시원한], [우디], [해변], [여름], [여자] 및 [모래] 중 적어도 하나 등)를 선택하고, 선택한 적어도 하나의 향수 키워드를 핵심 키워드로 결정하고, 결정한 적어도 하나의 핵심 키워드를 이용하여 향수 속성 벡터를 생성할 수 있다. 일 실시예에 의하면, 벡터화부(133)는 문서 내 단어 중요도(TF/DF)를 기준으로 적어도 하나의 향수 키워드를 핵심 키워드로 결정하여 선택할 수 있다. 이 경우, 벡터화부(183)는 문서 내 단어 중요도(TF/DF)가 큰 M개(M은 1 이상의 자연수. 사용자나 관리자에 의해 미리 정의된 것일 수 있음)의 키워드를 핵심 키워드로 추출할 수도 있고, 및/또는 미리 정의된 기준 값보다 문서 내 단어 중요도(TF/DF)의 값이 더 큰 키워드를 핵심 키워드로 추출할 수도 있다. 적어도 하나의 핵심 키워드가 획득되면, 벡터화부(133)는 적어도 하나의 핵심 키워드를 미리 정의된 바에 따라 배열하여 적어도 하나의 향수 속성 벡터를 생성할 수 있다. 실시예에 따라서, 벡터화부(133)는 모든 또는 일부의 문서(D0 내지 D3)에 대해 각 핵심 키워드의 빈도수를 계수하고, 계수 결과에 따라 빈도수가 상대적으로 높거나 또는 소정의 기준 값을 초과하는 키워드(이하 추가 추출 키워드)를 핵심 키워드로부터 추출하고, 추가 추출 키워드를 미리 정의된 기준에 따라 배열하여 향수 속성 벡터를 생성할 수도 있다. 여기서, 미리 정의된 기준은, 예를 들어, 추가 추출 키워드의 빈도수를 포함할 수 있다. 이에 따라 각 향수에 대응하는 향수 속성 벡터가 획득될 수 있다. 예를 들어, 향수 1에 대한 향수 속성 벡터는 [해안, 일상, 해변, 여름, 여자…]로 주어지고, 향수 2에 대한 향수 속성 벡터는 [따뜻한, 꽃, 강렬한, 과일, 로맨틱…]으로 결정될 수 있다. 향수 속성 벡터는 선호 향수 예측부(140)로 전달될 수 있다.The vectorization unit 133 may select core keywords from the extracted perfume keywords and generate a perfume attribute vector based on the selected core keywords. For example, when the importance of words in a document is transmitted as shown in FIG. 9, the vectorization unit 133 selects at least one nostalgia keyword (for example, [wind], [coast], [daily life], select at least one of [cool], [woody], [beach], [summer], [feminine], and [sand], etc.), determine at least one perfume keyword selected as a core keyword, and determine at least one core keyword selected You can create a perfume attribute vector using keywords. According to one embodiment, the vectorization unit 133 may determine and select at least one perfume keyword as a core keyword based on word importance (TF/DF) in the document. In this case, the vectorization unit 183 may extract M keywords with high word importance (TF/DF) in the document (M is a natural number of 1 or more. It may be predefined by the user or administrator) as core keywords. And/or keywords with a word importance (TF/DF) value within the document greater than a predefined standard value may be extracted as core keywords. When at least one core keyword is obtained, the vectorization unit 133 may generate at least one perfume attribute vector by arranging the at least one core keyword according to a predefined definition. Depending on the embodiment, the vectorization unit 133 counts the frequency of each key keyword for all or some documents (D0 to D3), and according to the counting result, the frequency is relatively high or exceeds a predetermined standard value. A perfume attribute vector may be generated by extracting keywords (hereinafter referred to as additional extracted keywords) from core keywords and arranging the additional extracted keywords according to predefined criteria. Here, the predefined criteria may include, for example, the frequency of additional extracted keywords. Accordingly, a perfume attribute vector corresponding to each perfume can be obtained. For example, the perfume attribute vector for perfume 1 is [coastal, everyday, beach, summer, woman…] ], and the perfume attribute vector for perfume 2 is [warm, floral, intense, fruity, romantic... ] can be determined. The perfume attribute vector may be transmitted to the preferred perfume prediction unit 140.
선호 향수 예측부(140)는 대상자 속성 벡터 및 향수 속성 벡터를 수신하고, 대상자 속성 벡터 및 향수 속성 벡터를 이용하여 선호 향수를 예측할 수 있다. 일 실시예에 의하면, 선호 향수 예측부(140)는 대상자 속성 벡터 및 향수 속성 벡터 사이의 유사도를 연산하여 결정하고, 연산된 유사도를 기반으로 대상자에 대한 적어도 하나의 선호 향수를 결정할 수 있다.The preferred perfume prediction unit 140 may receive the subject attribute vector and the perfume attribute vector, and predict the preferred perfume using the subject attribute vector and the perfume attribute vector. According to one embodiment, the preferred perfume prediction unit 140 may calculate and determine the similarity between the subject attribute vector and the perfume attribute vector, and determine at least one preferred perfume for the subject based on the calculated similarity.
도 10은 특정 대상자에 대한 속성 테이블의 일례를 도시한 도면이고, 도 11은 특정 대상자에 관하여 각각의 향수의 유사도, 건성 적합 여부, 지성 적합 여부 및 민감성 적합 여부를 판단한 결과를 도시한 도면이다.FIG. 10 is a diagram showing an example of an attribute table for a specific subject, and FIG. 11 is a diagram showing the results of determining whether each perfume is suitable for dry skin, oily skin, and sensitive skin.
일 실시예에 의하면, 선호 향수 예측부(140)는 먼저 대상자 속성 벡터 및 향수 속성 벡터에 원 핫 인코딩(one hot encoding)을 적용하여 임베딩을 수행하고, 이에 응하여 도 10에 도시된 바와 같이 대상자 속성 테이블(151)을 생성할 수 있다. 원 핫 인코딩은 다수의 원소로 이루어진 벡터를 생성하되, 벡터의 생성은 특정한 키워드를 포함하는 원소에는 1을 부가하고, 다른 원소에는 0을 부가함으로써 수행될 수 있다. 예를 들어, 대상자 속성 테이블(151)은, 특정한 향수에 대한 향수 속성 벡터에 특정한 단어(일례로, 해변이나 해안 등)가 존재하면, 해당 단어에 대한 원소 값을 1로 하고, 그렇지 않으면 0으로 하여 모든 단어에 대한 원소에 0 또는 1의 값을 기록하고, 마찬가지로 특정 대상자에 대한 대상자 속성 벡터에 특정한 단어가 존재하면, 특정한 단어에 대한 원소 값을 1로 정의하고 그렇지 않으면 0으로 정의함으로써 생성된 것일 수 있다. 생성된 대상자 속성 테이블(151)은 유사도 연산에 이용될 수 있다.According to one embodiment, the preferred perfume prediction unit 140 first performs embedding by applying one hot encoding to the subject attribute vector and the perfume attribute vector, and in response, as shown in FIG. 10, the subject attribute Table 151 can be created. One-hot encoding creates a vector consisting of multiple elements, and vector creation can be performed by adding 1 to elements containing a specific keyword and adding 0 to other elements. For example, the subject attribute table 151 sets the element value for that word to 1 if a specific word (for example, beach or coastal, etc.) exists in the perfume attribute vector for a specific perfume, and sets it to 0 otherwise. Thus, a value of 0 or 1 is recorded in the element for all words, and similarly, if a specific word exists in the subject attribute vector for a specific subject, the element value for the specific word is defined as 1, otherwise it is defined as 0. It could be. The created subject attribute table 151 can be used for similarity calculation.
일 실시예에 따르면, 선호 향수 예측부(140)는 자카드 유사도(Jaccard similarity)를 이용하여 대상자 속성 벡터 및 향수 속성 벡터 사이의 유사도를 연산할 수 있다. 자카드 유사도는 두 집합(A, B) 사이의 유사도를 계측하기 위한 것으로, 하기의 수학식 1에 기재된 것처럼 적어도 두 집합(A, B)의 교집합의 크기를 적어도 두 집합(A, B)의 합집합의 크기로 나누어 연산될 수 있다. 이 경우, 자카드 유사도의 연산 결과가 1에 근접하면 근접할수록 두 집합은 유사하다는 것을 의미하고, 반대로 자카드 유사도의 연산 결과가 0에 근접하면 근접할수록 두 집합은 유사하지 않음을 의미한다.According to one embodiment, the preferred perfume prediction unit 140 may calculate the similarity between the subject attribute vector and the perfume attribute vector using Jaccard similarity. Jacquard similarity is used to measure the similarity between two sets (A, B). As described in Equation 1 below, the size of the intersection of at least two sets (A, B) is calculated as the union of at least two sets (A, B). It can be calculated by dividing by the size of . In this case, the closer the Jacquard similarity calculation result is to 1, the more similar the two sets are, and conversely, the closer the Jacquard similarity calculation result is to 0, the less similar the two sets are.
[수학식 1][Equation 1]
여기서, 각각의 집합(A, B)은 대상자 속성 벡터 및 향수 속성 벡터를 포함한다.Here, each set (A, B) includes a subject attribute vector and a perfume attribute vector.
각각의 향수에 대한 향수 속성 벡터와, 대상자에 대한 대상자 속성 벡터 사이의 자카드 유사도 연산에 따라, 도 11에 도시된 바와 같이, 각각의 향수에 대응하는 적어도 하나의 유사도 값이 획득될 수 있다. 예를 들어, 향수 1에 대한 향수 속성 벡터와 대상자 속성 벡터 간의 유사도는 0.68로 연산되고, 향수 2에 대한 향수 속성 벡터와 대상자 속성 벡터 간의 유사도는 0.3로 연산되며, 향수 3에 대한 향수 속성 벡터와 대상자 속성 벡터 간의 유사도는 0.4로 연산될 수 있다. 선호 향수 예측부(140)는 적어도 하나의 향수 속성 벡터 각각에 대한 유사도 값을 확인하고, 이들 중에서 유사도 값이 미리 정의된 기준 값보다 크거나 또는 상대적으로 더 큰 유사도 값을 갖는 L개의 향수 속성 벡터(들)를 검출하고, 검출된 향수 속성 벡터에 대응하는 향수를 대상자를 위한 선호 향수로 결정하여 선호 향수에 대한 예측 결과를 획득할 수 있다. 여기서, L은 1 이상의 자연수로, 사용자 또는 관리자에 의해 정의될 수 있다. 선호 향수에 대한 예측 결과는 저장부(103) 또는 출력부(109)로 전달될 수 있다. 필요에 따라 선호 향수에 대한 예측 결과는 다수의 선호 향수(들)를 리스트의 형식으로 조합하여 획득될 수도 있다.According to the Jaccard similarity operation between the perfume attribute vector for each perfume and the subject attribute vector for the subject, at least one similarity value corresponding to each perfume can be obtained, as shown in FIG. 11. For example, the similarity between the perfume attribute vector for perfume 1 and the subject attribute vector is calculated as 0.68, the similarity between the perfume attribute vector for perfume 2 and the subject attribute vector is calculated as 0.3, and the similarity between the perfume attribute vector for perfume 3 and the subject attribute vector is calculated as 0.3. The similarity between subject attribute vectors can be calculated as 0.4. The preferred perfume prediction unit 140 checks the similarity value for each of at least one perfume attribute vector, and among these, L perfume attribute vectors whose similarity value is greater than or has a relatively greater similarity value than a predefined reference value. By detecting (s) and determining the perfume corresponding to the detected perfume attribute vector as the preferred perfume for the subject, a prediction result for the preferred perfume can be obtained. Here, L is a natural number greater than 1 and can be defined by the user or administrator. The prediction result for the preferred perfume may be transmitted to the storage unit 103 or the output unit 109. If necessary, the prediction result for preferred perfume may be obtained by combining multiple preferred perfume(s) in the form of a list.
도 12는 건성 적합 여부, 지성 적합 여부 및 민감성 적합 여부의 판단 과정의 일례를 설명하기 위한 도면으로, 도 12 내에서 실선은 [예]를, 점선은 [아니오]를 의미한다.FIG. 12 is a diagram illustrating an example of a judgment process for suitability for dry skin, oily skin, and sensitive skin. In FIG. 12, the solid line means [yes], and the dotted line means [no].
일 실시예에 있어서, 선호 향수 예측부(140)는 대상자의 피부 타입을 더 이용하여 대상자에 대한 선호 향수를 결정할 수도 있다. 즉, 도 11에 도시된 바와 같이 각각의 향수에 대한 유사도 값이 결정된 이후 또는 이전에, 선호 향수 예측부(140)는 각각의 향수가 건성 피부, 지성 피부 및/또는 민감성 피부에 적합한지 결정하고, 각각의 향수에 대한 피부 타입 별 적합도에 따라서 선호 향수에 대한 예측 결과를 획득할 수도 있다. 예를 들어, 선호 향수 예측부(140)는 특정한 향수가 대상자의 피부 타입에 부적합하거나 및/또는 주의를 요하는 경우에는 해당 향수를 배제하고, 나머지 향수를 이용하여 선호 향수에 대한 예측 결과를 획득할 수 있다.In one embodiment, the preferred perfume prediction unit 140 may determine the preferred perfume for the subject by further using the subject's skin type. That is, as shown in FIG. 11, after or before the similarity value for each perfume is determined, the preferred perfume prediction unit 140 determines whether each perfume is suitable for dry skin, oily skin, and/or sensitive skin, and , prediction results for preferred perfumes can be obtained depending on the suitability of each perfume for each skin type. For example, if a specific perfume is unsuitable for the subject's skin type and/or requires caution, the preferred perfume prediction unit 140 excludes the perfume and obtains a prediction result for the preferred perfume using the remaining perfumes. can do.
일 실시예에 의하면, 선호 향수 예측부(140)는, 도 12에 바와 같이, 대상자의 피부 타입 및 향수의 특성을 기반으로 한 소정 알고리즘을 이용하여 해당 향수의 적합 여부를 판별할 수도 있다.According to one embodiment, the preferred perfume prediction unit 140 may determine whether the perfume is suitable using a predetermined algorithm based on the subject's skin type and the characteristics of the perfume, as shown in FIG. 12.
구체적으로 먼저 선호 향수 예측부(140)는 대상자의 피부 타입이 민감성 피부 타입이면, 해당 향수에 자극적인 화학 성분이 포함되어 있는지 판단하고, 만약 해당 향수에 자극적인 화학 성분이 포함되어 있다면 해당 향수는 부적합한 것으로 판단한다. 반대로 자극적인 화학 성분이 포함되어 있지 않다면, 선호 향수 예측부(140)는 해당 향수의 사용 시 피부 외의 부분에 분사할 것이 권고되는지 판단하고, 그렇다면 해당 향수는 주의가 필요한 것으로 판단하고, 그렇지 않으면, 선호 향수 예측부(140)는 해당 향수는 적합한 것으로 판단할 수도 있다.Specifically, first, the preferred perfume prediction unit 140 determines whether the perfume contains irritating chemical ingredients if the subject's skin type is a sensitive skin type, and if the perfume contains irritating chemical ingredients, the perfume is It is judged to be inappropriate. Conversely, if it does not contain irritating chemical ingredients, the preferred perfume prediction unit 140 determines whether it is recommended to spray on parts other than the skin when using the perfume, and if so, determines that the perfume requires caution. Otherwise, The preferred perfume prediction unit 140 may determine that the corresponding perfume is suitable.
만약 대상자의 피부 타입이 민감성 피부 타입이 아니고 지성 피부 타입이라면, 적어도 일 향수가 진한 노트를 사용하는지 판단하고, 만약 진한 노트를 사용하고 있다면 부적합한 것으로 판단하고, 진한 노트를 사용하고 있지 않다면, 피부 진정 효과의 노트가 포함되었는지 더 판단한다. 만약 피부 진정 효과를 갖는 노트가 해당 향수에 포함되어 있다면, 선호 향수 예측부(140)는 해당 향수는 적합한 것으로 판단한다. 해당 향수가 피부 진정 효과를 갖는 노트를 포함하지 않고 있다면, 해당 향수가 지성 피부에 악성인 화학 물질을 가지고 있는지 여부가 판단된다. 만약 해당 향수가 지성 피부에 악성인 화학 물질을 가지고 있다면, 해당 향수는 주의가 필요한 것으로 판단되고, 그렇지 않다면 적합한 것으로 판단된다.If the subject's skin type is not a sensitive skin type but an oily skin type, at least determine whether the perfume uses dark notes. If it uses dark notes, judge it as unsuitable. If it does not use dark notes, determine whether it is suitable for skin soothing. Further determine whether notes of effect are included. If the perfume contains notes having a skin-soothing effect, the preferred perfume prediction unit 140 determines that the perfume is suitable. If the perfume does not contain notes that have a skin-soothing effect, it is determined whether the perfume contains chemicals that are harmful to oily skin. If the perfume contains chemicals that are harmful to oily skin, the perfume is judged to require caution; otherwise, it is judged suitable.
대상자가 민감성 피부 타입 및 지성 피부 타입이 아니라면, 해당 향수가 진하고 잔향이 오래 가는 노트를 포함하고 있는지 여부가 판단된다. 만약 해당 향수가 진하고 잔향이 오래 가는 노트를 포함한다면, 선호 향수 예측부(140)는 해당 향수는 적합한 것으로 판단할 수 있다. 반대로 해당 향수가 진하고 잔향이 오래 가는 노트를 포함하지 않고 있다면, 해당 향수가 보습 성분을 가지고 있는지가 추가적으로 판단되고, 만약 해당 향수가 보습 성분을 가지고 있다면, 적합한 것으로 판정된다. 해당 향수가 진하고 잔향이 오래 가는 노트도 포함하지 않고, 보습 성분도 포함하지 않는다면, 알코올 함유량이 90% 이상인지 판단된다. 알코올 함유량이 90% 미만이면, 선호 향수 예측부(140)는 해당 향수는 대상자에게 적합한 것으로 판정하고, 알코올 함유량이 90% 이상이라면, 해당 향수는 부적합한 것으로 판단한다.If the subject does not have a sensitive or oily skin type, it is determined whether the perfume contains strong and long-lasting notes. If the perfume includes notes that are strong and have a long-lasting lingering scent, the preferred perfume prediction unit 140 may determine that the perfume is suitable. Conversely, if the perfume is strong and does not contain long-lasting notes, it is additionally determined whether the perfume has moisturizing ingredients, and if the perfume has moisturizing ingredients, it is judged to be suitable. If the perfume in question does not contain strong, long-lasting notes and does not contain moisturizing ingredients, it is judged whether the alcohol content is more than 90%. If the alcohol content is less than 90%, the preferred perfume prediction unit 140 determines that the perfume is suitable for the subject, and if the alcohol content is more than 90%, the perfume is judged to be unsuitable.
향수 정보 수집부(150)는 적어도 하나의 향수 정보(105)를 수집할 수 있다. 이 경우, 향수 정보 수집부(150)는 통신 모듈을 제어하여 유무선 통신 네트워크에 연결된 후, 하나 또는 둘 이상의 향수 관련 웹 사이트(향수 쇼핑몰 사이트, 소셜 네트워크 서비스 사이트 또는 커뮤니티 사이트 등)에 접속하고, 접속한 웹 사이트를 크롤링하고, 크롤링 결과로부터 적어도 하나의 향수와 관련된 정보를 추출 및 수집함으로써 향수 정보(105)를 획득할 수도 있다. 이 경우, 향수 관련 웹 사이트는 관리자나 사용자 등에 의해 미리 지정된 것일 수도 있고, 또는 향수 정보 수집부(150)의 판단에 따라 결정된 것일 수도 있다. 예를 들어, 향수 정보 수집부(150)는 적어도 하나의 키워드(예를 들어, [향수], [perfume], [오드뚜알렛] 또는 [샤워 코롱]과 같은 단어나, 기 알려진 향수 브랜드나 명칭 등)를 기반으로 웹 검색을 수행하여 검색 결과를 획득하고, 획득한 검색 결과를 기반으로 향수 관련 웹 사이트를 검출할 수도 있다.The perfume information collection unit 150 may collect at least one perfume information 105. In this case, the perfume information collection unit 150 controls the communication module to connect to a wired or wireless communication network, access one or more perfume-related websites (perfume shopping mall site, social network service site, or community site, etc.), and access Perfume information 105 may be obtained by crawling a website and extracting and collecting information related to at least one perfume from the crawling results. In this case, the perfume-related website may be pre-designated by an administrator or user, or may be determined based on the judgment of the perfume information collection unit 150. For example, the perfume information collection unit 150 may include at least one keyword (e.g., words such as [perfume], [perfume], [eau de toilette], or [shower cologne], a known perfume brand or name, etc. ), a web search may be performed to obtain search results, and perfume-related websites may be detected based on the obtained search results.
상술한 선호 향수 예측 장치(100)는, 선호 향수 예측을 위한 일련의 처리를 수행하기 위해 특별히 고안된 장치를 이용하여 구현될 수도 있고, 또는 적어도 하나의 정보처리장치를 단독으로 이용하거나 조합 이용함으로써 구현될 수도 있다. 여기서, 정보처리장치는, 데스크톱 컴퓨터, 랩톱 컴퓨터, 서버용 하드웨어 장치, 스마트 폰, 태블릿 피씨, 스마트 시계, 내비게이션 장치, 휴대용 게임기, 디지털 텔레비전, 셋 톱 박스, 디지털 미디어 플레이어 장치, 미디어 스트리밍 장치, 음향 재생 장치(인공 지능 스피커 등), 유인 또는 무인 이동체(승용차, 버스나 이륜차와 같은 차량, 이동성 로봇, 무선 모형 차량, 로봇 청소기 등), 유인 또는 무인 비행체(항공기나, 헬리콥터나, 드론, 모형 비행기, 모형 헬리콥터 등), 가정용/산업용/군사용 로봇 또는 산업용/군사용 기계 등을 포함할 수 있다.The above-described preferred perfume prediction device 100 may be implemented using a device specifically designed to perform a series of processing for predicting preferred perfume, or may be implemented by using at least one information processing device alone or in combination. It could be. Here, information processing devices include desktop computers, laptop computers, server hardware devices, smart phones, tablet PCs, smart watches, navigation devices, portable game consoles, digital televisions, set-top boxes, digital media player devices, media streaming devices, and sound reproduction devices. Devices (artificial intelligence speakers, etc.), manned or unmanned moving vehicles (passenger cars, vehicles such as buses and two-wheelers, mobile robots, wireless model vehicles, robot vacuum cleaners, etc.), manned or unmanned flying vehicles (aircraft, helicopters, drones, model airplanes, etc.) Model helicopters, etc.), household/industrial/military robots, or industrial/military machines, etc.
이하 도 13을 참조하여 선호 향수 예측 방법의 일 실시예를 설명한다.Hereinafter, an embodiment of a preferred perfume prediction method will be described with reference to FIG. 13.
도 13은 선호 향수 예측 방법의 일 실시예에 대한 흐름도이다.Figure 13 is a flowchart of an embodiment of a preferred perfume prediction method.
도 13에 도시된 바에 따르면, 먼저 향수 정보가 수집될 수 있다(200). 수집된 향수 정보는 향수 데이터베이스의 형태로 저장될 수 있다. 향수 정보는 사용자나 관리자가 직접 입력하여 획득된 것일 수도 있고, 크롤링 등의 방법을 통해 유무선 네트워크를 통해 접근 가능한 서버 장치로부터 획득된 것일 수도 있다.As shown in FIG. 13, perfume information may first be collected (200). The collected perfume information can be stored in the form of a perfume database. Perfume information may be obtained through direct input by a user or administrator, or may be obtained from a server device accessible through a wired or wireless network through methods such as crawling.
향수 정보의 수집 전후에 또는 이와 동시에, 사용자로부터 대상자에 대한 정보(즉, 대상자 정보)가 입력될 수 있다(202). 대상자는 사용자와 동일할 수도 있고 상이할 수도 있다. 대상자 정보는, 예를 들어, 대상자 개인에 대한 정보(대상자의 연령, 성별 또는 취향 등)나, 검색하길 원하는 향수에 대한 정보 등을 포함할 수 있으며, 단어, 구문 또는 문장의 형태로 입력될 수 있다.Before, after, or simultaneously with the collection of perfume information, information about the subject (i.e., subject information) may be input from the user (202). The subject may be the same as the user or may be different. Target information may include, for example, information about the target individual (target's age, gender, or taste, etc.) or information about the perfume they wish to search for, and may be entered in the form of words, phrases, or sentences. there is.
대상자 정보가 입력되면, 대상자 정보로부터 적어도 하나의 대상자 키워드가 추출될 수 있다(204). 대상자 키워드의 추출은, 주어진 단어, 구문 또는 문장에 대해 형태소 분석을 수행하고, 필요에 따라 분석 결과로부터 불용어를 제거함으로써 수행될 수 있다. 대상자 키워드의 추출은, 예를 들어, 소정의 학습 모델을 이용하여 수행되는 것도 가능하다.When target information is input, at least one target keyword may be extracted from the target information (204). Extraction of target keywords can be performed by performing morphological analysis on a given word, phrase, or sentence and, if necessary, removing stop words from the analysis results. Extraction of target keywords can also be performed using, for example, a predetermined learning model.
대상자 키워드가 추출되면, 대상자 키워드가 유효 속성 키워드인지 여부가 결정될 수 있다(206). 대상자 키워드의 유효 속성 키워드 여부에 대한 판단은 유효 속성 정보를 이용하여 수행될 수도 있다. 유효 속성 정보는 선호 향수 예측에 주요한 속성으로 이용될 수 있는 적어도 하나의 단어, 구문 또는 문장을 이용하여 기 구축된 것일 수 있다. 대상자 키워드 중에 유효 속성 키워드가 존재한다면, 해당 유효 속성 키워드에 대응하는 연관 키워드가 더 결정된다. 연관 키워드의 결정은 미리 정의된 선호 매칭 사전을 이용하여 수행될 수도 있다.Once the target keyword is extracted, it may be determined whether the target keyword is a valid attribute keyword (206). Determination of whether the target keyword is a valid attribute keyword may be performed using valid attribute information. Effective attribute information may be previously constructed using at least one word, phrase, or sentence that can be used as a key attribute in predicting preferred perfume. If a valid attribute keyword exists among the target keywords, a related keyword corresponding to the valid attribute keyword is further determined. Determination of related keywords may be performed using a predefined preference matching dictionary.
대상자 키워드 및 연관 키워드를 이용하여 대상자 속성 벡터가 생성될 수 있다(208). 구체적으로 먼저 대상자 키워드(들)와, 유효 속성 키워드에 대응하는 연관 키워드(들)는 조합되고, 그 결과 적어도 일 키워드 집합이 생성된다. 순차적으로 키워드 집합에 속하는 각각의 키워드마다 빈도수가 측정되고, 키워드 별 빈도수에 따라서 하나 이상의 키워드(대상자 키워드 및 연관 키워드) 중에서 속성 벡터를 위한 키워드가 추출된다. 이 경우, 실시예에 따라서 하나 이상의 키워드 중에서 빈도수가 큰 순서에 따라 N개의 키워드가 대상자 속성 벡터를 위한 키워드로 추출될 수도 있고, 또는 기준 빈도수보다 더 큰 빈도수를 값으로 갖는 키워드가 대상자 속성 벡터를 위한 키워드로 추출될 수도 있다. 추출된 대상자 속성 벡터를 위한 키워드는 조합되고, 그 결과 대상자 속성 벡터가 생성된다.A target attribute vector may be created using the target keyword and related keywords (208). Specifically, first, the target keyword(s) and the related keyword(s) corresponding to the effective attribute keywords are combined, and as a result, at least one set of keywords is generated. The frequency of each keyword belonging to the keyword set is sequentially measured, and keywords for the attribute vector are extracted from one or more keywords (target keyword and related keyword) according to the frequency of each keyword. In this case, depending on the embodiment, N keywords among one or more keywords may be extracted as keywords for the audience attribute vector according to the order of frequency, or keywords with a frequency greater than the standard frequency may be extracted as keywords for the audience attribute vector. It can also be extracted as a keyword. Keywords for the extracted subject attribute vector are combined, and as a result, a subject attribute vector is generated.
한편, 대상자 정보 획득 내지 대상자 속성벡터 생성 과정(202 내지 208) 중 적어도 하나 이전 또는 이후나, 이들 과정(202 내지 208) 중 적어도 하나와 동시에 향수 정보로부터 적어도 하나의 향수 키워드가 추출될 수 있다(210). 적어도 하나의 향수 키워드의 추출은, 향수 정보에 포함된 적어도 하나의 문장 각각에 대해 형태소 분석을 수행하고, 실시예에 따라 형태소 분석 결과로부터 불용어를 제거함으로써 수행될 수도 있다.Meanwhile, at least one perfume keyword may be extracted from the perfume information before or after at least one of the target information acquisition or target attribute vector generation processes 202 to 208, or simultaneously with at least one of these processes 202 to 208 ( 210). Extraction of at least one perfume keyword may be performed by performing morphological analysis on each of at least one sentence included in the perfume information and, depending on the embodiment, removing stop words from the morphological analysis results.
향수 키워드가 추출되면, 특정한 향수에 관하여 특정한 단어에 대한 문서 내 중요도가 연산될 수 있다(212). 단어에 대한 문서 내 중요도의 연산은, 예를 들어, 해당 향수에 대한 적어도 하나의 문서로부터 적어도 하나의 특정 키워드의 단어 등장 빈도(TF)를 계수하고, 해당 키워드가 등장한 문서의 개수, 즉 단어 등장 문서 수(DF)를 계수한 후, 단어 등장 빈도를 단어 등장 문서 수로 나누어 수행될 수 있다.Once the perfume keyword is extracted, the importance within the document for a specific word regarding a specific perfume can be calculated (212). Calculation of the importance within a document for a word may, for example, count the word appearance frequency (TF) of at least one specific keyword from at least one document for the perfume in question, and calculate the number of documents in which the keyword appears, i.e. the number of occurrences of the word. This can be done by counting the number of documents (DF) and then dividing the frequency of word occurrence by the number of documents in which the word appears.
이어서, 단어에 대한 문서 내 중요도를 이용하여 향수 속성 벡터가 생성될 수 있다(214). 향수 속성 벡터의 생성은, 단어에 대한 문서 내 중요도를 기준으로, 적어도 하나의 향수 키워드 중에서 적어도 하나의 핵심 키워드를 선택하고, 적어도 하나의 핵심 키워드를 미리 정의된 바에 따라 배열함으로써 수행될 수도 있다. 적어도 하나의 핵심 키워드의 선택은, 문서 내 단어 중요도가 큰 M개의 키워드를 추출함으로써 수행될 수도 있고, 미리 정의된 기준 값보다 문서 내 단어 중요도의 값이 더 큰 키워드를 추출함으로써 수행될 수도 있다. 실시예에 따라서, 향수 속성 벡터는 추가 추출 키워드를 조합하여 생성될 수도 있다. 구체적으로 향수 속성 벡터는, 모든 또는 일부의 문서 내의 특정한 핵심 키워드의 빈도수를 계수하고, 빈도수가 다른 특정한 핵심 키워드에 비해 상대적으로 크거나 또는 빈도수가 소정의 기준 값을 초과하는 키워드를 추가 추출 키워드로 하여 핵심 키워드로부터 추출하여 획득하고, 획득한 추가 추출 키워드를 소정 기준에 따라 배열함으로써 생성될 수도 있다.Subsequently, a perfume attribute vector can be created using the importance within the document for the word (214). Generation of the perfume attribute vector may be performed by selecting at least one core keyword from at least one perfume keyword, based on the importance of the word in the document, and arranging the at least one core keyword as predefined. Selection of at least one core keyword may be performed by extracting M keywords with greater word importance within the document, or may be performed by extracting keywords with greater word importance within the document than a predefined reference value. Depending on the embodiment, the perfume attribute vector may be created by combining additional extracted keywords. Specifically, the perfume attribute vector counts the frequency of specific core keywords in all or some documents, and keywords whose frequency is relatively large compared to other specific core keywords or whose frequency exceeds a predetermined standard value are additionally extracted as keywords. It may be generated by extracting and obtaining core keywords and arranging the additional extracted keywords obtained according to predetermined standards.
대상자 속성 벡터 및 향수 속성 벡터가 생성되면, 이를 기반으로 선호 향수에 대한 예측이 수행될 수 있다(216). 선호 향수에 대한 예측은 대상자 속성 벡터 및 향수 속성 벡터에 대한 유사도 분석을 통해 수행되는 것도 가능하다. 여기서, 대상자 속성 벡터 및 향수 속성 벡터 간의 유사도는, 예를 들어, 자카드 유사도를 이용하여 연산될 수도 있다. 대상자 속성 벡터 및 향수 속성 벡터 간의 자카드 유사도의 연산 결과 값이 상대적으로 1에 근접하면, 향수 속성 벡터에 대응하는 향수는 대상자에게 부합하는 향수(즉, 선호 향수)로 결정될 수 있다. 반대로 대상자 속성 벡터 및 향수 속성 벡터 간의 자카드 유사도의 연산 결과 값이 상대적으로 0에 근접하면, 향수 속성 벡터에 대응하는 향수는 대상자에게 부합하지 않는 향수로 결정될 수 있다. 필요에 따라, 대상자 속성 벡터 및 향수 속성 벡터에 원 핫 인코딩이 먼저 적용될 수도 있다.Once the subject attribute vector and the perfume attribute vector are created, prediction of the preferred perfume can be performed based on them (216). Prediction of preferred perfume can also be performed through similarity analysis of the subject attribute vector and perfume attribute vector. Here, the similarity between the subject attribute vector and the perfume attribute vector may be calculated using, for example, Jacquard similarity. If the calculation result value of the Jaccard similarity between the subject attribute vector and the perfume attribute vector is relatively close to 1, the perfume corresponding to the perfume attribute vector may be determined to be a perfume that matches the subject (i.e., preferred perfume). Conversely, if the calculation result value of the Jaccard similarity between the subject attribute vector and the perfume attribute vector is relatively close to 0, the perfume corresponding to the perfume attribute vector may be determined to be a perfume that does not match the subject. If necessary, one-hot encoding may first be applied to the subject attribute vector and the perfume attribute vector.
실시예에 따라서, 선호 향수의 결정에 대상자의 피부 타입이 더 이용될 수도 있다. 유사도 값의 결정 이전 또는 이후에 각각의 향수는 건성 피부, 지성 피부 및/또는 민감성 피부에 적합한지 결정되고, 각각의 향수에 대한 피부 타입 별 적합도에 따라서 특정한 향수는 배제되어 선호 향수로 결정되지 않는다.Depending on the embodiment, the subject's skin type may be further used to determine the preferred perfume. Before or after determining the similarity value, it is determined whether each perfume is suitable for dry skin, oily skin, and/or sensitive skin, and depending on the suitability for each skin type, specific perfumes are excluded and not determined as a preferred perfume. .
상세하게는 대상자의 피부 타입이 민감성 피부 타입이면, 해당 향수에 자극적인 화학 성분이 포함되어 있는지 판단되고, 만약 해당 향수에 자극적인 화학 성분이 포함되어 있다면 해당 향수는 부적합한 것으로 판단된다. 반대로 자극적인 화학 성분이 포함되어 있지 않고, 해당 향수의 사용 시 피부 외의 부분에 분사해야 한다면, 해당 향수는 주의가 필요한 것으로 판단된다. 만약 대상자의 피부 타입이 지성 피부 타입이고, 진한 노트를 사용하고 있다면 해당 향수는 부적합한 것으로 판단된다. 진한 노트를 사용하고 있지 않다면, 피부 진정 효과의 노트가 포함되었는지 더 판단될 수 있으며, 해당 향수에 피부 진정 효과를 갖는 노트가 포함된다면, 해당 향수는 적합하게 판단되고, 해당 향수가 진정 효과를 갖는 노트를 포함하지 않으면서 지성 피부에 악성인 화학 물질을 가지고 있다면 주의가 필요한 것으로 판단된다. 그렇지 않다면 적합한 것으로 판단된다. 또한, 필요에 따라 해당 향수가 진하고 잔향이 오래 가는 노트를 포함하고 있거나, 해당 향수가 보습 성분을 가지고 있거나 및/또는 알코올 함유량이 90% 이하라면 해당 향수는 적합한 것으로 판단될 수 있다. 알코올 함유량이 90%를 초과한다면, 해당 향수는 부적합한 것으로 판단될 수 있다.Specifically, if the subject's skin type is a sensitive skin type, it is determined whether the perfume contains irritating chemical ingredients, and if the perfume contains irritating chemical ingredients, the perfume is judged to be unsuitable. Conversely, if it does not contain irritating chemical ingredients and requires spraying on areas other than the skin when using the perfume, the perfume is considered to require caution. If the subject's skin type is oily and uses dark notes, the perfume is judged to be unsuitable. If no strong notes are being used, it can be further determined whether the perfume contains notes with a skin-soothing effect, and if the perfume contains notes with a skin-soothing effect, the perfume is judged suitable, and whether the perfume has a soothing effect. If it contains chemicals that are harmful to oily skin without including notes, caution is considered necessary. Otherwise, it is considered suitable. Additionally, if necessary, the perfume may be deemed suitable if it contains strong and long-lasting notes, has moisturizing ingredients, and/or has an alcohol content of 90% or less. If the alcohol content exceeds 90%, the perfume may be deemed unsuitable.
예측된 선호 향수는 저장부에 저장되거나, 출력부를 통해서 시각적 또는 청각적으로 출력되거나 또는 외부의 다른 단말 장치로 전달될 수 있다(218).The predicted preferred perfume may be stored in the storage unit, output visually or auditorily through the output unit, or transmitted to another external terminal device (218).
상술한 실시예에 따른 선호 향수 예측 방법은, 컴퓨터 장치에 의해 구동될 수 있는 프로그램의 형태로 구현될 수 있다. 프로그램은, 명령어, 라이브러리, 데이터 파일 및/또는 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있으며, 기계어 코드나 고급 언어 코드를 이용하여 설계 및 제작된 것일 수 있다. 프로그램은 상술한 방법을 구현하기 위하여 특별히 설계된 것일 수도 있고, 컴퓨터 소프트웨어 분야에서 통상의 기술자에게 기 공지되어 사용 가능한 각종 함수나 정의를 이용하여 구현된 것일 수도 있다. 여기서, 컴퓨터 장치는 프로그램의 기능을 실현 가능하게 하는 프로세서나 메모리 등을 포함하여 구현된 것일 수 있으며, 필요에 따라 통신 장치를 더 포함할 수도 있다. 상술한 선호 향수 예측 방법을 구현하기 위한 프로그램은, 컴퓨터 등의 장치에 의해 판독 가능한 기록 매체에 기록될 수 있다. 컴퓨터에 의해 판독 가능한 기록 매체는, 예를 들어, 롬, 램, SD카드 또는 플래시 메모리(일례로 솔리드 스테이트 드라이브(SSD) 등)와 같은 반도체 저장 매체나, 하드 디스크 또는 플로피 디스크 등과 같은 자기 디스크 저장 매체나, 콤팩트 디스크 또는 디브이디 등과 같은 광 기록 매체나, 또는 플롭티컬 디스크 등과 같은 자기-광 기록 매체 등과 같이 컴퓨터 등의 장치의 호출에 따라 실행되는 하나 이상의 프로그램을 일시적 또는 비일시적으로 저장 가능한 적어도 한 종류의 물리적 저장 매체를 포함할 수 있다.The preferred perfume prediction method according to the above-described embodiment may be implemented in the form of a program that can be driven by a computer device. A program may include instructions, libraries, data files, and/or data structures, etc., singly or in combination, and may be designed and produced using machine code or high-level language code. The program may be specially designed to implement the above-described method, or may be implemented using various functions or definitions that are known and available to those skilled in the art in the computer software field. Here, the computer device may be implemented by including a processor or memory that enables the function of the program, and may further include a communication device as needed. A program for implementing the above-described preference perfume prediction method may be recorded on a recording medium readable by a device such as a computer. Recording media that can be read by a computer include, for example, semiconductor storage media such as ROM, RAM, SD cards, or flash memory (eg, solid state drives (SSD), etc.), or magnetic disk storage such as hard disks or floppy disks. At least one medium capable of temporarily or non-temporarily storing one or more programs that are executed upon call from a device such as a computer, such as an optical recording medium such as a compact disk or DVD, or a magneto-optical recording medium such as a floptical disk. It may include any type of physical storage medium.
상술한 선호 향수 예측 장치 및 선호 향수 예측 방법은 향수의 예측뿐만 아니라, 시적 또는 추상적인 단어로 이루어진 텍스트를 분석하여 사용자의 취향에 부합하는 특정 제품(예를 들어, 꽃이나 문학 작품 등)을 추천하는 장치나 방법에도 동일하거나 일부 변형된 형태로 적용될 수 있다.The above-described preferred perfume prediction device and preferred perfume prediction method not only predict perfume, but also recommend specific products (e.g., flowers, literary works, etc.) that match the user's taste by analyzing text consisting of poetic or abstract words. It may be applied in the same or slightly modified form to a device or method.
이상 선호 향수 예측 장치 및 선호 향수 예측 방법의 여러 실시예에 대해 설명하였으나, 선호 향수 예측 장치 또는 선호 향수 예측 방법은 오직 상술한 실시예에 한정되는 것은 아니다. 해당 기술 분야에서 통상의 지식을 가진 자가 상술한 실시예를 기초로 수정 및 변형하여 구현할 수 있는 다른 다양한 장치나 방법 역시 상술한 선호 향수 예측 장치 또는 선호 향수 예측 방법의 일 실시예가 될 수 있다. 예를 들어, 설명된 방법(들)이 설명된 바와 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성 요소(들)가 설명된 바와 다른 형태로 결합, 연결 또는 조합되거나 다른 구성 요소 또는 균등물 등에 의하여 대치 또는 치환되더라도, 상술한 선호 향수 예측 장치 및/또는 선호 향수 예측 방법의 일 실시예가 될 수 있다.Although several embodiments of the preferred perfume prediction device and the preferred perfume prediction method have been described above, the preferred perfume prediction device or the preferred perfume prediction method is not limited to the above-described embodiments. Various other devices or methods that can be implemented by those skilled in the art by modifying and modifying the above-described embodiments based on the above-described embodiments may also be an embodiment of the above-described preference perfume prediction device or preference perfume prediction method. For example, the described method(s) may be performed in an order other than as described, and/or component(s) of the described system, structure, device, circuit, etc. may be combined, connected, or otherwise in a form other than as described. Even if combined or replaced or substituted by other components or equivalents, it can be an embodiment of the preference perfume prediction device and/or preference perfume prediction method described above.
100: 선호 향수 예측 장치
101: 입력부
103: 저장부
104: 대상자 정보
105: 향수 정보
106: 유효 속성 정보
110: 프로세서
120: 대상자 분석부
121: 키워드 추출부
123: 유효 속성 결정부
125: 연관 키워드 획득부
127: 벡터화부
130: 향수 분석부
131: 키워드 추출부
133: 벡터화부
140: 선호 향수 예측부
150: 향수 정보 수집부 100: Preferred perfume prediction device 101: Input unit
103: Storage unit 104: Subject information
105: Perfume information 106: Effective attribute information
110: Processor 120: Subject analysis unit
121: Keyword extraction unit 123: Effective attribute determination unit
125: Related keyword acquisition unit 127: Vectorization unit
130: Perfume analysis unit 131: Keyword extraction unit
133: Vectorization unit 140: Preference perfume prediction unit
150: Perfume information collection department
Claims (15)
상기 대상자 정보로부터 대상자 키워드를 추출하고, 상기 대상자 키워드를 이용하여 대상자 속성 벡터를 생성하고, 상기 향수 정보로부터 향수 키워드를 추출하고, 상기 향수 키워드를 이용하여 향수 속성 벡터를 생성하고, 상기 대상자 속성 벡터와 상기 향수 속성 벡터 간의 유사도를 이용하여 선호 향수를 결정하는 프로세서;를 포함하는 선호 향수 예측 장치.An input unit that obtains target information and perfume information; and
Extract an audience keyword from the audience information, generate an audience attribute vector using the audience keyword, extract a perfume keyword from the perfume information, generate a perfume attribute vector using the perfume keyword, and generate a perfume attribute vector using the perfume keyword. A preferred perfume prediction device comprising a processor that determines a preferred perfume using similarity between the perfume attribute vectors.
상기 대상자 정보 및 상기 향수 정보 중 적어도 하나는 적어도 하나의 문장을 포함하고,
상기 프로세서는, 상기 대상자 정보 및 상기 향수 정보 중 적어도 하나에 형태소 분석을 수행하고, 상기 형태소 분석 결과에서 불용어를 제거하여 상기 대상자 키워드 및 상기 향수 키워드 중 적어도 하나를 획득하는 선호 향수 예측 장치.According to paragraph 1,
At least one of the subject information and the perfume information includes at least one sentence,
The processor performs morphological analysis on at least one of the target information and the perfume information, and removes stop words from the morpheme analysis result to obtain at least one of the target keyword and the perfume keyword.
상기 프로세서는, 상기 대상자 키워드가 추출되면, 상기 대상자 키워드 중에서 유효 속성에 해당하는 유효 속성 키워드를 검출하고, 상기 유효 속성 키워드에 대응하는 연관 키워드를 획득하고, 상기 대상자 키워드 및 상기 연관 키워드를 기반으로 상기 대상자 속성 벡터를 생성하는 선호 향수 예측 장치.According to paragraph 1,
When the target keyword is extracted, the processor detects a valid attribute keyword corresponding to a valid attribute among the target keywords, obtains a related keyword corresponding to the valid attribute keyword, and based on the target keyword and the related keyword A preference perfume prediction device that generates the target attribute vector.
상기 프로세서는, 상기 향수 키워드가 추출되면, 상기 향수 정보의 적어도 하나의 문서 내에서 상기 향수 키워드의 등장 빈도 및 상기 향수 키워드가 등장한 문서의 개수를 계수하고, 상기 향수 키워드의 등장 빈도에 상기 문서의 개수를 나누어 문서 내 단어 중요도를 결정하는 선호 향수 예측 장치.According to paragraph 1,
When the perfume keyword is extracted, the processor counts the frequency of appearance of the perfume keyword and the number of documents in which the perfume keyword appears in at least one document of the perfume information, and determines the frequency of appearance of the perfume keyword in the document. A preference prediction device that determines the importance of words in a document by dividing their count.
상기 프로세서는, 상기 문서 내 단어 중요도를 기반으로 적어도 하나의 향수 키워드로부터 적어도 하나의 핵심 키워드를 획득하고, 상기 적어도 하나의 핵심 키워드를 이용하여 상기 향수 속성 벡터를 생성하는 선호 향수 예측 장치.According to clause 4,
The processor is configured to obtain at least one core keyword from at least one perfume keyword based on word importance in the document, and generate the perfume attribute vector using the at least one core keyword.
상기 프로세서는, 상기 대상자 속성 벡터와 상기 향수 속성 벡터 간의 자카드 유사도를 연산하여 유사도 값을 획득하고, 상기 유사도 값이 미리 정의된 기준 값보다 크거나 또는 유사도 값이 상대적으로 더 큰 향수 속성 벡터에 대응하는 향수를 선호 향수로 결정하는 선호 향수 예측 장치.According to paragraph 1,
The processor obtains a similarity value by calculating Jaccard similarity between the subject attribute vector and the perfume attribute vector, and corresponds to a perfume attribute vector in which the similarity value is greater than a predefined reference value or the similarity value is relatively larger. A preference perfume prediction device that determines a perfume as a preferred perfume.
상기 프로세서는, 대상자의 피부 타입을 더 이용하여 대상자에 대한 선호 향수를 결정하되, 상기 대상자의 피부 타입은 민감성 또는 지성을 포함하는 선호 향수 예측 장치.According to paragraph 1,
The processor further determines a preferred perfume for the subject using the subject's skin type, wherein the subject's skin type includes sensitive or oily.
상기 프로세서는, 향수에 자극적 화학 성분의 포함 여부, 진한 노트의 사용 여부, 피부 진정 효과의 노트 포함 여부, 지성 피부에 악성인 물질 포함 여부, 진하고 잔향이 오래 가는 노트 포함 여부, 보습 성분 포함 여부 및 알코올 함유량 중 적어도 하나를 더 이용하여 선호 향수를 결정하는 선호 향수 예측 장치.In clause 7,
The processor determines whether the perfume contains irritating chemical ingredients, whether a dark note is used, whether a note with a skin-soothing effect is included, whether a substance harmful to oily skin is included, whether a strong and long-lasting note is included, whether a moisturizing ingredient is included, and A preferred perfume prediction device that determines a preferred perfume using at least one of the alcohol contents.
상기 대상자 정보로부터 대상자 키워드를 추출하는 단계;
상기 대상자 키워드를 이용하여 대상자 속성 벡터를 생성하는 단계;
상기 향수 정보로부터 향수 키워드를 추출하는 단계;
상기 향수 키워드를 이용하여 향수 속성 벡터를 생성하는 단계; 및
상기 대상자 속성 벡터와 상기 향수 속성 벡터 간의 유사도를 이용하여 선호 향수를 결정하는 단계;를 포함하는 선호 향수 예측 방법.Obtaining target information and perfume information;
extracting target keywords from the target information;
generating a target attribute vector using the target keyword;
extracting perfume keywords from the perfume information;
generating a perfume attribute vector using the perfume keyword; and
A preferred perfume prediction method comprising: determining a preferred perfume using similarity between the subject attribute vector and the perfume attribute vector.
상기 대상자 정보 및 상기 향수 정보 중 적어도 하나는 적어도 하나의 문장을 포함하고,
상기 대상자 정보로부터 대상자 키워드를 추출하는 단계는,
상기 대상자 정보에 형태소 분석을 수행하는 단계; 및
상기 형태소 분석 결과에서 불용어를 제거하여 상기 대상자 키워드를 획득하는 단계;를 포함하는 선호 향수 예측 방법.According to clause 9,
At least one of the subject information and the perfume information includes at least one sentence,
The step of extracting target keywords from the target information is,
performing morphological analysis on the subject information; and
Preferred perfume prediction method comprising: removing stop words from the morpheme analysis result to obtain the target keyword.
상기 대상자 키워드를 이용하여 대상자 속성 벡터를 생성하는 단계는,
상기 대상자 키워드가 추출되면, 상기 대상자 키워드 중에서 유효 속성에 해당하는 유효 속성 키워드를 검출하는 단계;
상기 유효 속성 키워드에 대응하는 연관 키워드를 획득하는 단계; 및
상기 대상자 키워드 및 상기 연관 키워드를 기반으로 상기 대상자 속성 벡터를 생성하는 단계;를 포함하는 선호 향수 예측 방법.According to clause 9,
The step of generating a target attribute vector using the target keyword is,
When the target keyword is extracted, detecting a valid attribute keyword corresponding to a valid attribute among the target keywords;
Obtaining a related keyword corresponding to the valid attribute keyword; and
A preferred perfume prediction method comprising: generating the target attribute vector based on the target keyword and the related keyword.
상기 향수 키워드를 이용하여 향수 속성 벡터를 생성하는 단계는,
상기 향수 키워드가 추출되면, 상기 향수 정보의 적어도 하나의 문서 내에서 상기 향수 키워드의 등장 빈도를 계수하는 단계;
상기 향수 키워드가 등장한 문서의 개수를 계수하는 단계; 및
상기 향수 키워드의 등장 빈도에 상기 문서의 개수를 나누어 문서 내 단어 중요도를 결정하는 단계;를 포함하는 선호 향수 예측 방법.According to clause 9,
The step of generating a perfume attribute vector using the perfume keyword is,
When the perfume keyword is extracted, counting the frequency of appearance of the perfume keyword within at least one document of the perfume information;
Counting the number of documents in which the perfume keyword appears; and
A preference perfume prediction method comprising: determining word importance within a document by dividing the number of documents by the frequency of appearance of the perfume keyword.
상기 향수 키워드를 이용하여 향수 속성 벡터를 생성하는 단계는,
상기 문서 내 단어 중요도를 기반으로 적어도 하나의 향수 키워드로부터 적어도 하나의 핵심 키워드를 획득하는 단계; 및
상기 적어도 하나의 핵심 키워드를 이용하여 상기 향수 속성 벡터를 생성하는 단계;를 더 포함하는 선호 향수 예측 방법.According to clause 12,
The step of generating a perfume attribute vector using the perfume keyword is,
Obtaining at least one key keyword from at least one perfume keyword based on word importance in the document; and
A preferred perfume prediction method further comprising: generating the perfume attribute vector using the at least one key keyword.
상기 대상자 속성 벡터와 상기 향수 속성 벡터 간의 유사도를 이용하여 선호 향수를 결정하는 단계는,
상기 대상자 속성 벡터와 상기 향수 속성 벡터 간의 자카드 유사도를 연산하여 유사도 값을 획득하는 단계; 및
상기 유사도 값이 미리 정의된 기준 값보다 크거나 또는 유사도 값이 상대적으로 더 큰 향수 속성 벡터에 대응하는 향수를 선호 향수로 결정하는 단계;를 포함하는 선호 향수 예측 방법.According to clause 8,
The step of determining a preferred perfume using the similarity between the subject attribute vector and the perfume attribute vector,
Obtaining a similarity value by calculating Jacquard similarity between the subject attribute vector and the perfume attribute vector; and
A preferred perfume prediction method comprising: determining a perfume corresponding to a perfume attribute vector whose similarity value is greater than a predefined reference value or whose similarity value is relatively greater as a preferred perfume.
상기 대상자 속성 벡터와 상기 향수 속성 벡터 간의 유사도를 이용하여 선호 향수를 결정하는 단계는,
상기 대상자 속성 벡터와 상기 향수 속성 벡터 간의 유사도 및 상기 대상자의 피부 타입을 이용하여 대상자에 대한 선호 향수를 결정하는 단계;를 더 포함하되, 상기 대상자의 피부 타입은 민감성 또는 지성을 포함하는 선호 향수 예측 방법.According to clause 8,
The step of determining a preferred perfume using the similarity between the subject attribute vector and the perfume attribute vector,
Predicting a preferred perfume for the subject using similarity between the subject attribute vector and the perfume attribute vector and the subject's skin type, wherein the subject's skin type includes sensitive or oily. method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220076300A KR20230174986A (en) | 2022-06-22 | 2022-06-22 | Apparatus and method for predicting favorite perfume |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220076300A KR20230174986A (en) | 2022-06-22 | 2022-06-22 | Apparatus and method for predicting favorite perfume |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230174986A true KR20230174986A (en) | 2023-12-29 |
Family
ID=89334350
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220076300A KR20230174986A (en) | 2022-06-22 | 2022-06-22 | Apparatus and method for predicting favorite perfume |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20230174986A (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210117037A (en) | 2020-03-18 | 2021-09-28 | 충북대학교 산학협력단 | Method for recommending similar user in social internet of things, and recording medium thereof |
KR20220014131A (en) | 2020-07-28 | 2022-02-04 | 건국대학교 글로컬산학협력단 | Apparatus and method for recommending perfume |
-
2022
- 2022-06-22 KR KR1020220076300A patent/KR20230174986A/en not_active Application Discontinuation
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210117037A (en) | 2020-03-18 | 2021-09-28 | 충북대학교 산학협력단 | Method for recommending similar user in social internet of things, and recording medium thereof |
KR20220014131A (en) | 2020-07-28 | 2022-02-04 | 건국대학교 글로컬산학협력단 | Apparatus and method for recommending perfume |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhao et al. | Continuous probability distribution prediction of image emotions via multitask shared sparse regression | |
US20220165272A1 (en) | Recommendation engine for upselling in restaurant orders | |
CN105574067B (en) | Item recommendation device and item recommendation method | |
CN104281699B (en) | Method and device is recommended in search | |
US8577962B2 (en) | Server apparatus, client apparatus, content recommendation method, and program | |
KR102119868B1 (en) | System and method for producting promotional media contents | |
JP6381775B2 (en) | Information processing system and information processing method | |
CN109410927A (en) | Offline order word parses the audio recognition method combined, device and system with cloud | |
CN109657054A (en) | Abstraction generating method, device, server and storage medium | |
CN106663095A (en) | Facet recommendations from sentiment-bearing content | |
WO2007043679A1 (en) | Information processing device, and program | |
CN113569088A (en) | Music recommendation method and device and readable storage medium | |
JP2006201870A (en) | Interactive processor | |
WO2013134871A1 (en) | System and method for conversation-based information search | |
US9940307B2 (en) | Augmenting text with multimedia assets | |
EP1959358A1 (en) | Information processing apparatus, method and program | |
CN114820063A (en) | Bidding based on buyer defined function | |
CN110490686A (en) | A kind of building of commodity Rating Model, recommended method and system based on Time Perception | |
CN113806588A (en) | Method and device for searching video | |
CN106951433A (en) | A kind of search method and device | |
JP6932162B2 (en) | Area-based item recommendation terminal device and item recommendation information provision method. | |
CN117972040A (en) | Interactive information processing method, device and storage medium | |
KR20230174986A (en) | Apparatus and method for predicting favorite perfume | |
CN116029768A (en) | Information delivery method, computer device and readable storage medium | |
KR20210035494A (en) | The user interface method of recommending cosmetic using two criteria in cosmetic information providing mobile application |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal |