JP2015518585A - 半構造化されたデータを解析しカテゴリ分けするための方法 - Google Patents
半構造化されたデータを解析しカテゴリ分けするための方法 Download PDFInfo
- Publication number
- JP2015518585A JP2015518585A JP2014530448A JP2014530448A JP2015518585A JP 2015518585 A JP2015518585 A JP 2015518585A JP 2014530448 A JP2014530448 A JP 2014530448A JP 2014530448 A JP2014530448 A JP 2014530448A JP 2015518585 A JP2015518585 A JP 2015518585A
- Authority
- JP
- Japan
- Prior art keywords
- data
- semi
- structured
- recipe
- subset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 31
- 238000010411 cooking Methods 0.000 claims abstract description 10
- 238000004891 communication Methods 0.000 claims abstract description 6
- 238000010845 search algorithm Methods 0.000 claims abstract 2
- 238000013479 data entry Methods 0.000 claims description 38
- 239000004615 ingredient Substances 0.000 claims description 15
- 239000002994 raw material Substances 0.000 description 24
- 239000013598 vector Substances 0.000 description 21
- 238000012549 training Methods 0.000 description 12
- 230000008901 benefit Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 235000014347 soups Nutrition 0.000 description 7
- 244000061456 Solanum tuberosum Species 0.000 description 6
- 235000002595 Solanum tuberosum Nutrition 0.000 description 6
- 244000061458 Solanum melongena Species 0.000 description 5
- 235000002597 Solanum melongena Nutrition 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 235000021186 dishes Nutrition 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 3
- 235000013305 food Nutrition 0.000 description 3
- 230000005484 gravity Effects 0.000 description 3
- 235000015067 sauces Nutrition 0.000 description 3
- 240000002234 Allium sativum Species 0.000 description 2
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 2
- 244000294411 Mirabilis expansa Species 0.000 description 2
- 235000015429 Mirabilis expansa Nutrition 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 240000003768 Solanum lycopersicum Species 0.000 description 2
- 235000014121 butter Nutrition 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 235000013312 flour Nutrition 0.000 description 2
- 235000004611 garlic Nutrition 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 235000012054 meals Nutrition 0.000 description 2
- 235000013372 meat Nutrition 0.000 description 2
- 235000013536 miso Nutrition 0.000 description 2
- 239000003607 modifier Substances 0.000 description 2
- 235000021188 national dish Nutrition 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 235000014102 seafood Nutrition 0.000 description 2
- 235000001674 Agaricus brunnescens Nutrition 0.000 description 1
- 241000953921 Brassica rapa Broccoletto Group Species 0.000 description 1
- 235000011960 Brassica ruvo Nutrition 0.000 description 1
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 1
- 240000008415 Lactuca sativa Species 0.000 description 1
- 241000206607 Porphyra umbilicalis Species 0.000 description 1
- 238000013477 bayesian statistics method Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 235000021152 breakfast Nutrition 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000006071 cream Substances 0.000 description 1
- 230000010339 dilation Effects 0.000 description 1
- 235000013601 eggs Nutrition 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 235000012149 noodles Nutrition 0.000 description 1
- 235000015927 pasta Nutrition 0.000 description 1
- 235000021178 picnic Nutrition 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 235000012045 salad Nutrition 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 235000013522 vodka Nutrition 0.000 description 1
- 239000008256 whipped cream Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
- G06F16/84—Mapping; Conversion
- G06F16/86—Mapping to a database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Creation or modification of classes or clusters
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
であり得、ここでは、「zスコア」は標準スコアであり、関数fはレシピの生のスコアを計算するために使用され、pは確率である。
であり、ここでは、「P」は精度であり、「R」は再現度又は相関性である。スコアがすべての一般的でない料理について検査されたときの結果は
である。
Claims (9)
- ユーザのコミュニティに相互接続されたコンピュータシステムであって、
料理レシピに関する一又は複数の入力を含む前記ユーザからの通信を受信し、アクセス可能なメモリに前記入力を記憶するようにプログラムされたデータプロセッサ入力モジュールと、
記憶したデータにアクセスし、レシピに関する統合的なデータベースへと異種のデータ入力を統合し体系化するために前記データにデータ解釈用アルゴリズムを適用するようにプログラムされたデータプロセッサ決定モジュールと、
前記データベースに適用された検索アルゴリズムをサポートするために前記データベースへのアクセスを許可するために前記レシピデータベースに接続された検索エントリモジュールと
を備えるコンピュータシステム。 - 複数のユーザにネットワークで接続されたコンピュータシステムであって、
複数の半構造化されたユーザ入力データを記憶するメモリと、
前記半構造化されたユーザ入力データのサブセットにデータ解釈用アルゴリズムを適用するプロセッサと、
前記半構造化されたユーザ入力データの前記サブセットを使用して前記複数の半構造化されたユーザ入力データの残りをカテゴリ分けする第2のプロセッサと、
ユーザが前記カテゴリ分けされた複数の半構造化されたユーザ入力データを検索することを可能にするインターフェースと
を備えるコンピュータシステム。 - 前記複数の半構造化されたユーザ入力データが複数のデータフィールドを備える、請求項2に記載のシステム。
- 前記複数の半構造化されたユーザ入力データがレシピであり、
前記複数のデータフィールドが、レシピ名称、原材料、命令、タグ、及び画像のうちの少なくとも一つを備える、請求項3に記載のシステム。 - 前記データ解釈用アルゴリズムが、混成最大エントロピー及びLDAモデルと、語出現頻度−文献出現頻度の逆数と、コサイン類似度解析とのうちの少なくとも一つを備える、請求項2に記載のシステム。
- 半構造化されたデータを解析するための方法であって、
複数の半構造化されたデータエントリをメモリに記憶するステップであり、それぞれの半構造化されたデータエントリが複数のデータフィールドを含む、記憶するステップと、
プロセッサを用いて、それぞれの半構造化されたデータエントリ内の前記半構造化されたデータフィールドをソートするステップと、
プロセッサを用いて、データ解釈用アルゴリズムを使用して半構造化されたデータエントリのサブセットを選択するステップと、
前記半構造化されたデータエントリの前記サブセットの前記半構造化されたデータフィールドからトピックのデータフィールドを選択するステップと、
プロセッサを用いて、前記トピックのデータフィールドを用いて残りの複数の半構造化されたデータエントリを解析するステップと、
プロセッサを用いて、前記解析した残りの複数の半構造化されたデータエントリにデータ解釈用アルゴリズムを使用して、半構造化されたデータエントリの新たなサブセットを選択するステップと、
前記半構造化されたデータエントリの新たなサブセットを前記半構造化されたデータエントリの前記サブセットと統合するステップと
を含む方法。 - 前記複数の半構造化されたデータエントリがレシピであり、
前記複数のデータフィールドが、レシピ名称、原材料、命令、タグ、及び画像のうちの少なくとも一つを備える、請求項6に記載の方法。 - 前記データ解釈用アルゴリズムが、混成最大エントロピー及びLDAモデルを備える、請求項6に記載の方法。
- 前記データ解釈用アルゴリズムが、語出現頻度−文献出現頻度の逆数とコサイン類似度解析とを備える、請求項6に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/837,764 US9477777B2 (en) | 2013-03-15 | 2013-03-15 | Method for analyzing and categorizing semi-structured data |
US13/837,764 | 2013-03-15 | ||
PCT/JP2013/084169 WO2014141560A1 (en) | 2013-03-15 | 2013-12-13 | Method for analyzing and categorizing semi-structured data |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015518585A true JP2015518585A (ja) | 2015-07-02 |
JP5946916B2 JP5946916B2 (ja) | 2016-07-06 |
Family
ID=49998631
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014530448A Active JP5946916B2 (ja) | 2013-03-15 | 2013-12-13 | 半構造化されたデータを解析しカテゴリ分けするための方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9477777B2 (ja) |
JP (1) | JP5946916B2 (ja) |
KR (1) | KR101614642B1 (ja) |
SG (1) | SG11201405967QA (ja) |
TW (1) | TWI590086B (ja) |
WO (1) | WO2014141560A1 (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9201864B2 (en) * | 2013-03-15 | 2015-12-01 | Luminoso Technologies, Inc. | Method and system for converting document sets to term-association vector spaces on demand |
US9495360B2 (en) * | 2014-01-31 | 2016-11-15 | International Business Machines Corporation | Recipe creation using text analytics |
US9489377B1 (en) * | 2014-02-21 | 2016-11-08 | Yummly, Inc. | Inferring recipe difficulty |
US20150339394A1 (en) * | 2014-05-20 | 2015-11-26 | Tasty Time, Inc. | Extracting Online Recipes, and Arranging and Generating a Cookbook |
US9311568B1 (en) * | 2014-05-21 | 2016-04-12 | Yummly, Inc. | Recipe text and image extraction |
US9483547B1 (en) | 2014-05-30 | 2016-11-01 | Yummly, Inc. | Clustering and display of recipes |
US9824152B1 (en) | 2014-05-30 | 2017-11-21 | Yummly, Inc. | Recipe recommendation |
US9797873B1 (en) | 2014-06-26 | 2017-10-24 | Yummly, Inc. | Prediction of recipe preparation time |
JP6539962B2 (ja) * | 2014-09-04 | 2019-07-10 | 富士ゼロックス株式会社 | 情報提示プログラム及び情報処理装置 |
US20160103834A1 (en) * | 2014-10-14 | 2016-04-14 | International Business Machines Corporation | Food recipe scoring and ranking system |
US10157178B2 (en) * | 2015-02-06 | 2018-12-18 | International Business Machines Corporation | Identifying categories within textual data |
US10825044B2 (en) * | 2017-08-10 | 2020-11-03 | Louis Iannone | System and method for recipe identification and classification |
US11410638B1 (en) * | 2017-08-30 | 2022-08-09 | Amazon Technologies, Inc. | Voice user interface for nested content |
US10872236B1 (en) | 2018-09-28 | 2020-12-22 | Amazon Technologies, Inc. | Layout-agnostic clustering-based classification of document keys and values |
US11257006B1 (en) | 2018-11-20 | 2022-02-22 | Amazon Technologies, Inc. | Auto-annotation techniques for text localization |
US10949661B2 (en) * | 2018-11-21 | 2021-03-16 | Amazon Technologies, Inc. | Layout-agnostic complex document processing system |
US20230259703A1 (en) * | 2020-05-29 | 2023-08-17 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling the electronic device |
US10984064B1 (en) | 2020-08-17 | 2021-04-20 | Louis Iannone | Methods, devices, and systems for dish data generation and tracking |
KR102418298B1 (ko) * | 2022-01-06 | 2022-07-07 | (주) 바우디움 | 구조화 문서에 기반하여 사용자의 계획을 관리하는 방법 및 이를 이용한 장치 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5960440A (en) * | 1996-01-16 | 1999-09-28 | Brother International Corporation | Kitchen information and database management method and apparatus |
JP2005284406A (ja) * | 2004-03-26 | 2005-10-13 | Matsushita Electric Works Ltd | 料理レシピ提示システム |
JP2008129943A (ja) * | 2006-11-22 | 2008-06-05 | Nippon Telegr & Teleph Corp <Ntt> | 構造化文書生成方法及び装置及びプログラム |
US20090009815A1 (en) * | 2007-07-05 | 2009-01-08 | Gregory Karasik | Apparatus for electronic storage of recipes |
JP2010238041A (ja) * | 2009-03-31 | 2010-10-21 | Fujitsu Ltd | 分類体系改正支援プログラム、分類体系改正支援装置、および分類体系改正支援方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5832446A (en) * | 1993-03-31 | 1998-11-03 | Cornell Research Foundation, Inc. | Interactive database method and system for food and beverage preparation |
US6389436B1 (en) * | 1997-12-15 | 2002-05-14 | International Business Machines Corporation | Enhanced hypertext categorization using hyperlinks |
US7233940B2 (en) * | 2000-11-06 | 2007-06-19 | Answers Corporation | System for processing at least partially structured data |
US6970881B1 (en) | 2001-05-07 | 2005-11-29 | Intelligenxia, Inc. | Concept-based method and system for dynamically analyzing unstructured information |
US6778995B1 (en) * | 2001-08-31 | 2004-08-17 | Attenex Corporation | System and method for efficiently generating cluster groupings in a multi-dimensional concept space |
US7996390B2 (en) * | 2008-02-15 | 2011-08-09 | The University Of Utah Research Foundation | Method and system for clustering identified forms |
US20110099133A1 (en) * | 2009-10-28 | 2011-04-28 | Industrial Technology Research Institute | Systems and methods for capturing and managing collective social intelligence information |
US8886623B2 (en) * | 2010-04-07 | 2014-11-11 | Yahoo! Inc. | Large scale concept discovery for webpage augmentation using search engine indexers |
US9536237B2 (en) * | 2012-11-28 | 2017-01-03 | Wal-Mart Stores, Inc. | Recipe suggestion apparatus and method |
-
2013
- 2013-03-15 US US13/837,764 patent/US9477777B2/en active Active
- 2013-12-13 KR KR1020147026567A patent/KR101614642B1/ko active Active
- 2013-12-13 WO PCT/JP2013/084169 patent/WO2014141560A1/en active Application Filing
- 2013-12-13 SG SG11201405967QA patent/SG11201405967QA/en unknown
- 2013-12-13 JP JP2014530448A patent/JP5946916B2/ja active Active
- 2013-12-23 TW TW102147813A patent/TWI590086B/zh active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5960440A (en) * | 1996-01-16 | 1999-09-28 | Brother International Corporation | Kitchen information and database management method and apparatus |
JP2005284406A (ja) * | 2004-03-26 | 2005-10-13 | Matsushita Electric Works Ltd | 料理レシピ提示システム |
JP2008129943A (ja) * | 2006-11-22 | 2008-06-05 | Nippon Telegr & Teleph Corp <Ntt> | 構造化文書生成方法及び装置及びプログラム |
US20090009815A1 (en) * | 2007-07-05 | 2009-01-08 | Gregory Karasik | Apparatus for electronic storage of recipes |
JP2010238041A (ja) * | 2009-03-31 | 2010-10-21 | Fujitsu Ltd | 分類体系改正支援プログラム、分類体系改正支援装置、および分類体系改正支援方法 |
Also Published As
Publication number | Publication date |
---|---|
KR101614642B1 (ko) | 2016-04-21 |
JP5946916B2 (ja) | 2016-07-06 |
US20140280148A1 (en) | 2014-09-18 |
WO2014141560A1 (en) | 2014-09-18 |
US9477777B2 (en) | 2016-10-25 |
SG11201405967QA (en) | 2015-11-27 |
TW201439797A (zh) | 2014-10-16 |
TWI590086B (zh) | 2017-07-01 |
KR20140132378A (ko) | 2014-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5946916B2 (ja) | 半構造化されたデータを解析しカテゴリ分けするための方法 | |
WO2022022002A1 (zh) | 一种信息展示方法、信息搜索方法及装置 | |
US20220084096A1 (en) | System and method for providing food taxonomy based food search and recommendation | |
US11263240B2 (en) | Organizing survey text responses | |
US20190171707A1 (en) | Systems and methods for automatic analysis of text-based food-recipes | |
JP5997350B2 (ja) | ソーシャルグラフ情報に基づく構造化検索クエリ | |
RU2670494C2 (ru) | Способ обработки поискового запроса, сервер и машиночитаемый носитель для его осуществления | |
US9098588B2 (en) | Information processing apparatus, information processing method, and information processing program | |
US10592540B2 (en) | Generating elements of answer-seeking queries and elements of answers | |
TWI480829B (zh) | 料理食譜資訊提供裝置、料理食譜資訊提供方法、電腦程式產品、及資訊記錄媒體 | |
CN107092608A (zh) | 一种目标对象的搜索、推荐方法和设备 | |
CN103942264B (zh) | 推送包含新闻信息的网页的方法和装置 | |
JP2018504686A (ja) | 検索データを処理するための方法及び装置 | |
JP5827449B2 (ja) | オンラインソーシャルネットワークのためのパーソナライズされた構造化検索クエリ | |
CN113761084B (zh) | 一种poi搜索排序模型训练方法、排序装置与方法及介质 | |
KR20220153044A (ko) | 메뉴 생성 시스템 | |
JP6325132B2 (ja) | データ収集装置、及びデータ収集方法 | |
CN105404695A (zh) | 试题查询方法和装置 | |
CN116340383A (zh) | 基于查询与结果相关性的搜索方法、装置、介质及设备 | |
KR101667918B1 (ko) | 질의 반응형 스마트 검색 서비스 제공 방법 및 이를 구현하기 위한 검색 서비스 장치 | |
US12354344B2 (en) | Apparatus and method for performing image-based dish recognition | |
JP2004259083A (ja) | 情報検索方法、情報検索サーバ、及び情報検索プログラム | |
JP5292525B1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
JP2020071538A (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
WO2015121309A1 (en) | Translating search engine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151006 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160531 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160601 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5946916 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D02 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |