KR101614642B1 - 반구조화 데이터의 분석 및 분류 방법 - Google Patents
반구조화 데이터의 분석 및 분류 방법 Download PDFInfo
- Publication number
- KR101614642B1 KR101614642B1 KR1020147026567A KR20147026567A KR101614642B1 KR 101614642 B1 KR101614642 B1 KR 101614642B1 KR 1020147026567 A KR1020147026567 A KR 1020147026567A KR 20147026567 A KR20147026567 A KR 20147026567A KR 101614642 B1 KR101614642 B1 KR 101614642B1
- Authority
- KR
- South Korea
- Prior art keywords
- data
- subject
- semi
- structured
- recipe
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 30
- 239000000463 material Substances 0.000 claims description 34
- 238000012549 training Methods 0.000 claims description 18
- 238000004458 analytical method Methods 0.000 claims description 11
- 238000013479 data entry Methods 0.000 claims description 2
- 238000004891 communication Methods 0.000 abstract description 6
- 235000013305 food Nutrition 0.000 abstract description 3
- 238000010845 search algorithm Methods 0.000 abstract 1
- 239000013598 vector Substances 0.000 description 21
- 230000008901 benefit Effects 0.000 description 7
- 235000014347 soups Nutrition 0.000 description 7
- 244000061456 Solanum tuberosum Species 0.000 description 6
- 235000002595 Solanum tuberosum Nutrition 0.000 description 6
- 239000004615 ingredient Substances 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 235000015067 sauces Nutrition 0.000 description 4
- 244000061458 Solanum melongena Species 0.000 description 3
- 235000002597 Solanum melongena Nutrition 0.000 description 3
- 235000013601 eggs Nutrition 0.000 description 3
- 240000002234 Allium sativum Species 0.000 description 2
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 2
- 244000294411 Mirabilis expansa Species 0.000 description 2
- 235000015429 Mirabilis expansa Nutrition 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 240000003768 Solanum lycopersicum Species 0.000 description 2
- 235000014121 butter Nutrition 0.000 description 2
- 238000010411 cooking Methods 0.000 description 2
- 239000011162 core material Substances 0.000 description 2
- 235000013312 flour Nutrition 0.000 description 2
- 235000004611 garlic Nutrition 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 235000012054 meals Nutrition 0.000 description 2
- 235000013372 meat Nutrition 0.000 description 2
- 235000013536 miso Nutrition 0.000 description 2
- 239000003607 modifier Substances 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 1
- 235000017647 Brassica oleracea var italica Nutrition 0.000 description 1
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 1
- 235000010149 Brassica rapa subsp chinensis Nutrition 0.000 description 1
- 244000221633 Brassica rapa subsp chinensis Species 0.000 description 1
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 1
- 240000008415 Lactuca sativa Species 0.000 description 1
- 244000223014 Syzygium aromaticum Species 0.000 description 1
- 235000016639 Syzygium aromaticum Nutrition 0.000 description 1
- 238000013477 bayesian statistics method Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 235000015895 biscuits Nutrition 0.000 description 1
- 235000021152 breakfast Nutrition 0.000 description 1
- 239000006071 cream Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 235000021186 dishes Nutrition 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 235000012149 noodles Nutrition 0.000 description 1
- 235000021116 parmesan Nutrition 0.000 description 1
- 235000015927 pasta Nutrition 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 235000012045 salad Nutrition 0.000 description 1
- 235000014102 seafood Nutrition 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 235000013522 vodka Nutrition 0.000 description 1
- 239000008256 whipped cream Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
- G06F16/84—Mapping; Conversion
- G06F16/86—Mapping to a database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Creation or modification of classes or clusters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
도 1은 본 발명을 구현하기 위한 네트워크의 예에 대한 다이어그램이다.
도 2a는 웹사이트 및 반구조화 데이터 필드들을 보여주는 다이어그램이다.
도 2b는 반구조화 데이터 항목의 예를 보여준다.
도 3a는 시스템에 의해 분석되는 반구조화 데이터에 대한 다이어그램이다.
도 3b는 시스템에 의해 분석되는 반구조화 데이터의 또 다른 예에 대한 다이어그램이다.
도 4는 트레이닝 데이터를 이용하여 요리법을 결정하는 방법의 예에 대한 순서도이다.
도 5는 레시피 유사도를 결정하는 방법의 예에 대한 순서도이다.
도 6은 레시피 유사도를 결정하는 방법의 또 다른 예에 대한 순서도이다.
Claims (17)
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 미리 정해진 네트워크를 통해 복수의 사용자들에게, 많은 제약 없이 사용자에 의해 입력될 수 있는 반구조화 주제, 반구조화 또는 구조화 특징들 및 상기 주제의 속성을 제시하는 컴퓨터 시스템으로서,
복수의 반구조화 데이터 항목(semi-structured data entry)들을 저장하도록 구성된 메모리 - 각각의 반구조화 데이터 항목은 미리 정해진 주제 및 상기 주제의 데이터 필드인 주제 데이터 필드를 제공함 -; 및
상기 반구조화 데이터 항목들의 주제에 기초하여 상기 반구조화 데이터 항목들의 서브세트를 선택하고, 상기 서브세트 중 상기 주제의 특징에 관련된 반구조화 데이터 필드와 상기 주제 데이터 필드 중 적어도 하나를 선택하고, 선택에 따라 상기 주제의 특징 및 상기 주제에, 데이터의 유사도를 판단하기 위한 데이터 해석 알고리즘을 적용하여 상기 주제의 속성을 결정하도록 구성된 프로세서
를 포함하는 컴퓨터 시스템. - 제10항에 있어서,
상기 주제, 상기 특징들 및 상기 주제의 속성은 레시피 제목, 재료들 및 국가 요리법에 각각 대응하는 컴퓨터 시스템. - 제10항에 있어서,
상기 데이터 해석 알고리즘은 하이브리드 최대 엔트로피 및 LDA 모델과 용어 빈도-역 문헌 빈도(term frequency-inverse document frequency) 및 코사인 유사도(cosine similarity) 분석 중 적어도 하나를 포함하는 컴퓨터 시스템. - 제10항에 있어서,
상기 선택된 반구조화 데이터 항목의 서브세트는 트레이닝 데이터이고,
상기 프로세서는 업데이트된 트레이닝 데이터와 이전의 트레이닝 데이터를 조합하고, 상기 주제 및 상기 특징들의 결정과 상기 데이터 해석 알고리즘의 적용을 반복하는 컴퓨터 시스템. - 미리 정해진 네트워크를 통해 복수의 사용자에게, 많은 제약 없이 사용자에 의해 입력될 수 있는 반구조화 주제, 반구조화 또는 구조화 특징들 및 상기 주제의 속성을 제시하는 방법으로서,
복수의 반구조화 데이터 항목들을 메모리에 저장하는 단계 - 각각의 반구조화 데이터 항목은 미리 정해진 주제 및 상기 주제의 데이터 필드인 주제 데이터 필드를 제공함 -;
프로세서를 이용하여, 상기 반구조화 데이터 항목들의 주제에 기초하여 상기 반구조화 데이터 항목들의 서브세트를 선택하는 단계;
상기 프로세서를 이용하여, 상기 서브세트 중 상기 주제의 특징에 관련된 반구조화 데이터 필드와 상기 주제 데이터 필드 중 적어도 하나를 선택하는 단계; 및
상기 프로세서를 이용하여, 선택에 따라 상기 주제의 특징 및 상기 주제에, 데이터의 유사도를 판단하기 위한 데이터 해석 알고리즘을 적용하여 상기 주제의 속성을 결정하는 단계
를 포함하는 방법. - 제14항에 있어서,
상기 주제, 상기 특징들 및 상기 주제의 속성은 레시피 제목, 재료들 및 국가 요리법에 각각 대응하는 방법. - 제14항에 있어서,
상기 데이터 해석 알고리즘은 하이브리드 최대 엔트로피 및 LDA 모델과 용어 빈도-역 문헌 빈도 및 코사인 유사도 분석 중 적어도 하나를 포함하는 방법. - 제14항에 있어서,
상기 선택된 반구조화 데이터 항목의 서브세트는 트레이닝 데이터이고,
상기 방법은,
업데이트된 트레이닝 데이터와 이전의 트레이닝 데이터를 조합하고, 상기 주제 및 상기 특징들의 결정과 상기 데이터 해석 알고리즘의 적용을 반복하는 단계를 더 포함하는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/837,764 | 2013-03-15 | ||
US13/837,764 US9477777B2 (en) | 2013-03-15 | 2013-03-15 | Method for analyzing and categorizing semi-structured data |
PCT/JP2013/084169 WO2014141560A1 (en) | 2013-03-15 | 2013-12-13 | Method for analyzing and categorizing semi-structured data |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20140132378A KR20140132378A (ko) | 2014-11-17 |
KR101614642B1 true KR101614642B1 (ko) | 2016-04-21 |
Family
ID=49998631
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147026567A Active KR101614642B1 (ko) | 2013-03-15 | 2013-12-13 | 반구조화 데이터의 분석 및 분류 방법 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9477777B2 (ko) |
JP (1) | JP5946916B2 (ko) |
KR (1) | KR101614642B1 (ko) |
SG (1) | SG11201405967QA (ko) |
TW (1) | TWI590086B (ko) |
WO (1) | WO2014141560A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102418298B1 (ko) * | 2022-01-06 | 2022-07-07 | (주) 바우디움 | 구조화 문서에 기반하여 사용자의 계획을 관리하는 방법 및 이를 이용한 장치 |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9201864B2 (en) * | 2013-03-15 | 2015-12-01 | Luminoso Technologies, Inc. | Method and system for converting document sets to term-association vector spaces on demand |
US9495360B2 (en) * | 2014-01-31 | 2016-11-15 | International Business Machines Corporation | Recipe creation using text analytics |
US9489377B1 (en) | 2014-02-21 | 2016-11-08 | Yummly, Inc. | Inferring recipe difficulty |
US20150339394A1 (en) * | 2014-05-20 | 2015-11-26 | Tasty Time, Inc. | Extracting Online Recipes, and Arranging and Generating a Cookbook |
US9311568B1 (en) * | 2014-05-21 | 2016-04-12 | Yummly, Inc. | Recipe text and image extraction |
US9824152B1 (en) | 2014-05-30 | 2017-11-21 | Yummly, Inc. | Recipe recommendation |
US9483547B1 (en) | 2014-05-30 | 2016-11-01 | Yummly, Inc. | Clustering and display of recipes |
US9797873B1 (en) | 2014-06-26 | 2017-10-24 | Yummly, Inc. | Prediction of recipe preparation time |
JP6539962B2 (ja) * | 2014-09-04 | 2019-07-10 | 富士ゼロックス株式会社 | 情報提示プログラム及び情報処理装置 |
US20160103834A1 (en) * | 2014-10-14 | 2016-04-14 | International Business Machines Corporation | Food recipe scoring and ranking system |
US10157178B2 (en) * | 2015-02-06 | 2018-12-18 | International Business Machines Corporation | Identifying categories within textual data |
US10825044B2 (en) * | 2017-08-10 | 2020-11-03 | Louis Iannone | System and method for recipe identification and classification |
US11410638B1 (en) * | 2017-08-30 | 2022-08-09 | Amazon Technologies, Inc. | Voice user interface for nested content |
US10872236B1 (en) | 2018-09-28 | 2020-12-22 | Amazon Technologies, Inc. | Layout-agnostic clustering-based classification of document keys and values |
US11257006B1 (en) | 2018-11-20 | 2022-02-22 | Amazon Technologies, Inc. | Auto-annotation techniques for text localization |
US10949661B2 (en) * | 2018-11-21 | 2021-03-16 | Amazon Technologies, Inc. | Layout-agnostic complex document processing system |
WO2021242073A1 (ko) * | 2020-05-29 | 2021-12-02 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
US10984064B1 (en) | 2020-08-17 | 2021-04-20 | Louis Iannone | Methods, devices, and systems for dish data generation and tracking |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020178394A1 (en) * | 2000-11-06 | 2002-11-28 | Naama Bamberger | System for processing at least partially structured data |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5832446A (en) * | 1993-03-31 | 1998-11-03 | Cornell Research Foundation, Inc. | Interactive database method and system for food and beverage preparation |
US5960440A (en) | 1996-01-16 | 1999-09-28 | Brother International Corporation | Kitchen information and database management method and apparatus |
US6389436B1 (en) * | 1997-12-15 | 2002-05-14 | International Business Machines Corporation | Enhanced hypertext categorization using hyperlinks |
US6970881B1 (en) | 2001-05-07 | 2005-11-29 | Intelligenxia, Inc. | Concept-based method and system for dynamically analyzing unstructured information |
US6778995B1 (en) * | 2001-08-31 | 2004-08-17 | Attenex Corporation | System and method for efficiently generating cluster groupings in a multi-dimensional concept space |
JP2005284406A (ja) | 2004-03-26 | 2005-10-13 | Matsushita Electric Works Ltd | 料理レシピ提示システム |
JP4937709B2 (ja) | 2006-11-22 | 2012-05-23 | 日本電信電話株式会社 | 構造化文書生成方法及び装置及びプログラム |
US20090009815A1 (en) | 2007-07-05 | 2009-01-08 | Gregory Karasik | Apparatus for electronic storage of recipes |
US7996390B2 (en) * | 2008-02-15 | 2011-08-09 | The University Of Utah Research Foundation | Method and system for clustering identified forms |
JP5310196B2 (ja) * | 2009-03-31 | 2013-10-09 | 富士通株式会社 | 分類体系改正支援プログラム、分類体系改正支援装置、および分類体系改正支援方法 |
US20110099133A1 (en) * | 2009-10-28 | 2011-04-28 | Industrial Technology Research Institute | Systems and methods for capturing and managing collective social intelligence information |
US8886623B2 (en) * | 2010-04-07 | 2014-11-11 | Yahoo! Inc. | Large scale concept discovery for webpage augmentation using search engine indexers |
US9536237B2 (en) * | 2012-11-28 | 2017-01-03 | Wal-Mart Stores, Inc. | Recipe suggestion apparatus and method |
-
2013
- 2013-03-15 US US13/837,764 patent/US9477777B2/en active Active
- 2013-12-13 SG SG11201405967QA patent/SG11201405967QA/en unknown
- 2013-12-13 JP JP2014530448A patent/JP5946916B2/ja active Active
- 2013-12-13 KR KR1020147026567A patent/KR101614642B1/ko active Active
- 2013-12-13 WO PCT/JP2013/084169 patent/WO2014141560A1/en active Application Filing
- 2013-12-23 TW TW102147813A patent/TWI590086B/zh active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020178394A1 (en) * | 2000-11-06 | 2002-11-28 | Naama Bamberger | System for processing at least partially structured data |
Non-Patent Citations (2)
Title |
---|
"Multi-class text categorization based on LDA and SVM", Kunlun Li 외4, Procedia Engineering Volume 15, Pages 1963-1967 CEIS 2011, (2011.12.31.)* |
네이버 블로그 게시물. 2012.07.02. http://blog.naver.com/cg_lab/80163506515 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102418298B1 (ko) * | 2022-01-06 | 2022-07-07 | (주) 바우디움 | 구조화 문서에 기반하여 사용자의 계획을 관리하는 방법 및 이를 이용한 장치 |
WO2023132422A1 (ko) * | 2022-01-06 | 2023-07-13 | (주) 바우디움 | 구조화 문서에 기반하여 사용자의 계획을 관리하는 방법 및 이를 이용한 장치 |
Also Published As
Publication number | Publication date |
---|---|
WO2014141560A1 (en) | 2014-09-18 |
US9477777B2 (en) | 2016-10-25 |
US20140280148A1 (en) | 2014-09-18 |
SG11201405967QA (en) | 2015-11-27 |
TWI590086B (zh) | 2017-07-01 |
JP2015518585A (ja) | 2015-07-02 |
JP5946916B2 (ja) | 2016-07-06 |
KR20140132378A (ko) | 2014-11-17 |
TW201439797A (zh) | 2014-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101614642B1 (ko) | 반구조화 데이터의 분석 및 분류 방법 | |
US20220084096A1 (en) | System and method for providing food taxonomy based food search and recommendation | |
WO2022022002A1 (zh) | 一种信息展示方法、信息搜索方法及装置 | |
US8843497B2 (en) | System and method for association extraction for surf-shopping | |
US9971737B2 (en) | Identifying substitute ingredients using a natural language processing system | |
US9870550B2 (en) | Modifying existing recipes to incorporate additional or replace existing ingredients | |
WO2014002512A1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
US9797873B1 (en) | Prediction of recipe preparation time | |
CN115129994A (zh) | 商品推荐方法、装置、电子设备及可读存储介质 | |
Amano et al. | Food category representatives: Extracting categories from meal names in food recordings and recipe data | |
KR20230116355A (ko) | 개인맞춤형 레시피 추천 방법 및 이를 위한 연산장치 | |
KR102110766B1 (ko) | 음식 적합도에 기초한 요리 정보 제공 방법 및 장치 | |
Kicherer et al. | What you use, not what you do: Automatic classification and similarity detection of recipes | |
Guria et al. | Classification of Foods based on Ingredients | |
CN115062605B (zh) | 一种服务问题归因方法及装置 | |
CN116340383A (zh) | 基于查询与结果相关性的搜索方法、装置、介质及设备 | |
Tachibana et al. | Extraction of naming concepts based on modifiers in recipe titles | |
Hakguder et al. | Smart Diet Management through Food Image and Cooking Recipe Analysis | |
Kusu et al. | Searching cooking recipes by focusing on common ingredients | |
US11977566B2 (en) | Information processing apparatus, information processing method, and information processing program | |
Shah et al. | Revolutionizing Culinary Experiences: AI-Driven Ingredient Recognition and Personalized Recipe Recommendation System. | |
JP5292525B1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
Vitas | Food as Text | |
Wen et al. | Ranking recipes according to classicality towards understanding evolution of food preference | |
Sedano Moreno | Development of a cooking recipes application with Python |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0105 | International application |
Patent event date: 20140923 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20140923 Comment text: Request for Examination of Application |
|
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20150916 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20160325 |
|
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20160415 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20160415 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20190405 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20200403 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20210402 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20220408 Start annual number: 7 End annual number: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20240401 Start annual number: 9 End annual number: 9 |
|
PR1001 | Payment of annual fee |
Payment date: 20250324 Start annual number: 10 End annual number: 10 |