JP2015518585A - 半構造化されたデータを解析しカテゴリ分けするための方法 - Google Patents
半構造化されたデータを解析しカテゴリ分けするための方法 Download PDFInfo
- Publication number
- JP2015518585A JP2015518585A JP2014530448A JP2014530448A JP2015518585A JP 2015518585 A JP2015518585 A JP 2015518585A JP 2014530448 A JP2014530448 A JP 2014530448A JP 2014530448 A JP2014530448 A JP 2014530448A JP 2015518585 A JP2015518585 A JP 2015518585A
- Authority
- JP
- Japan
- Prior art keywords
- data
- semi
- structured
- recipe
- subset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
- G06F16/84—Mapping; Conversion
- G06F16/86—Mapping to a database
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Creation or modification of classes or clusters
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
であり得、ここでは、「zスコア」は標準スコアであり、関数fはレシピの生のスコアを計算するために使用され、pは確率である。
であり、ここでは、「P」は精度であり、「R」は再現度又は相関性である。スコアがすべての一般的でない料理について検査されたときの結果は
である。
Claims (9)
- ユーザのコミュニティに相互接続されたコンピュータシステムであって、
料理レシピに関する一又は複数の入力を含む前記ユーザからの通信を受信し、アクセス可能なメモリに前記入力を記憶するようにプログラムされたデータプロセッサ入力モジュールと、
記憶したデータにアクセスし、レシピに関する統合的なデータベースへと異種のデータ入力を統合し体系化するために前記データにデータ解釈用アルゴリズムを適用するようにプログラムされたデータプロセッサ決定モジュールと、
前記データベースに適用された検索アルゴリズムをサポートするために前記データベースへのアクセスを許可するために前記レシピデータベースに接続された検索エントリモジュールと
を備えるコンピュータシステム。 - 複数のユーザにネットワークで接続されたコンピュータシステムであって、
複数の半構造化されたユーザ入力データを記憶するメモリと、
前記半構造化されたユーザ入力データのサブセットにデータ解釈用アルゴリズムを適用するプロセッサと、
前記半構造化されたユーザ入力データの前記サブセットを使用して前記複数の半構造化されたユーザ入力データの残りをカテゴリ分けする第2のプロセッサと、
ユーザが前記カテゴリ分けされた複数の半構造化されたユーザ入力データを検索することを可能にするインターフェースと
を備えるコンピュータシステム。 - 前記複数の半構造化されたユーザ入力データが複数のデータフィールドを備える、請求項2に記載のシステム。
- 前記複数の半構造化されたユーザ入力データがレシピであり、
前記複数のデータフィールドが、レシピ名称、原材料、命令、タグ、及び画像のうちの少なくとも一つを備える、請求項3に記載のシステム。 - 前記データ解釈用アルゴリズムが、混成最大エントロピー及びLDAモデルと、語出現頻度−文献出現頻度の逆数と、コサイン類似度解析とのうちの少なくとも一つを備える、請求項2に記載のシステム。
- 半構造化されたデータを解析するための方法であって、
複数の半構造化されたデータエントリをメモリに記憶するステップであり、それぞれの半構造化されたデータエントリが複数のデータフィールドを含む、記憶するステップと、
プロセッサを用いて、それぞれの半構造化されたデータエントリ内の前記半構造化されたデータフィールドをソートするステップと、
プロセッサを用いて、データ解釈用アルゴリズムを使用して半構造化されたデータエントリのサブセットを選択するステップと、
前記半構造化されたデータエントリの前記サブセットの前記半構造化されたデータフィールドからトピックのデータフィールドを選択するステップと、
プロセッサを用いて、前記トピックのデータフィールドを用いて残りの複数の半構造化されたデータエントリを解析するステップと、
プロセッサを用いて、前記解析した残りの複数の半構造化されたデータエントリにデータ解釈用アルゴリズムを使用して、半構造化されたデータエントリの新たなサブセットを選択するステップと、
前記半構造化されたデータエントリの新たなサブセットを前記半構造化されたデータエントリの前記サブセットと統合するステップと
を含む方法。 - 前記複数の半構造化されたデータエントリがレシピであり、
前記複数のデータフィールドが、レシピ名称、原材料、命令、タグ、及び画像のうちの少なくとも一つを備える、請求項6に記載の方法。 - 前記データ解釈用アルゴリズムが、混成最大エントロピー及びLDAモデルを備える、請求項6に記載の方法。
- 前記データ解釈用アルゴリズムが、語出現頻度−文献出現頻度の逆数とコサイン類似度解析とを備える、請求項6に記載の方法。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US13/837,764 | 2013-03-15 | ||
| US13/837,764 US9477777B2 (en) | 2013-03-15 | 2013-03-15 | Method for analyzing and categorizing semi-structured data |
| PCT/JP2013/084169 WO2014141560A1 (en) | 2013-03-15 | 2013-12-13 | Method for analyzing and categorizing semi-structured data |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2015518585A true JP2015518585A (ja) | 2015-07-02 |
| JP5946916B2 JP5946916B2 (ja) | 2016-07-06 |
Family
ID=49998631
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2014530448A Active JP5946916B2 (ja) | 2013-03-15 | 2013-12-13 | 半構造化されたデータを解析しカテゴリ分けするための方法 |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US9477777B2 (ja) |
| JP (1) | JP5946916B2 (ja) |
| KR (1) | KR101614642B1 (ja) |
| SG (1) | SG11201405967QA (ja) |
| TW (1) | TWI590086B (ja) |
| WO (1) | WO2014141560A1 (ja) |
Families Citing this family (19)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9201864B2 (en) * | 2013-03-15 | 2015-12-01 | Luminoso Technologies, Inc. | Method and system for converting document sets to term-association vector spaces on demand |
| US9495360B2 (en) * | 2014-01-31 | 2016-11-15 | International Business Machines Corporation | Recipe creation using text analytics |
| US9489377B1 (en) * | 2014-02-21 | 2016-11-08 | Yummly, Inc. | Inferring recipe difficulty |
| US20150339394A1 (en) * | 2014-05-20 | 2015-11-26 | Tasty Time, Inc. | Extracting Online Recipes, and Arranging and Generating a Cookbook |
| US9311568B1 (en) * | 2014-05-21 | 2016-04-12 | Yummly, Inc. | Recipe text and image extraction |
| US9483547B1 (en) | 2014-05-30 | 2016-11-01 | Yummly, Inc. | Clustering and display of recipes |
| US9824152B1 (en) | 2014-05-30 | 2017-11-21 | Yummly, Inc. | Recipe recommendation |
| US9797873B1 (en) | 2014-06-26 | 2017-10-24 | Yummly, Inc. | Prediction of recipe preparation time |
| JP6539962B2 (ja) * | 2014-09-04 | 2019-07-10 | 富士ゼロックス株式会社 | 情報提示プログラム及び情報処理装置 |
| US20160103834A1 (en) * | 2014-10-14 | 2016-04-14 | International Business Machines Corporation | Food recipe scoring and ranking system |
| US10157178B2 (en) * | 2015-02-06 | 2018-12-18 | International Business Machines Corporation | Identifying categories within textual data |
| US10825044B2 (en) * | 2017-08-10 | 2020-11-03 | Louis Iannone | System and method for recipe identification and classification |
| US11410638B1 (en) * | 2017-08-30 | 2022-08-09 | Amazon Technologies, Inc. | Voice user interface for nested content |
| US10872236B1 (en) | 2018-09-28 | 2020-12-22 | Amazon Technologies, Inc. | Layout-agnostic clustering-based classification of document keys and values |
| US11257006B1 (en) | 2018-11-20 | 2022-02-22 | Amazon Technologies, Inc. | Auto-annotation techniques for text localization |
| US10949661B2 (en) * | 2018-11-21 | 2021-03-16 | Amazon Technologies, Inc. | Layout-agnostic complex document processing system |
| US12417344B2 (en) * | 2020-05-29 | 2025-09-16 | Samsung Electronics Co., Ltd. | Training recommendation model based on topic model and word importance |
| US10984064B1 (en) | 2020-08-17 | 2021-04-20 | Louis Iannone | Methods, devices, and systems for dish data generation and tracking |
| KR102418298B1 (ko) * | 2022-01-06 | 2022-07-07 | (주) 바우디움 | 구조화 문서에 기반하여 사용자의 계획을 관리하는 방법 및 이를 이용한 장치 |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5960440A (en) * | 1996-01-16 | 1999-09-28 | Brother International Corporation | Kitchen information and database management method and apparatus |
| JP2005284406A (ja) * | 2004-03-26 | 2005-10-13 | Matsushita Electric Works Ltd | 料理レシピ提示システム |
| JP2008129943A (ja) * | 2006-11-22 | 2008-06-05 | Nippon Telegr & Teleph Corp <Ntt> | 構造化文書生成方法及び装置及びプログラム |
| US20090009815A1 (en) * | 2007-07-05 | 2009-01-08 | Gregory Karasik | Apparatus for electronic storage of recipes |
| JP2010238041A (ja) * | 2009-03-31 | 2010-10-21 | Fujitsu Ltd | 分類体系改正支援プログラム、分類体系改正支援装置、および分類体系改正支援方法 |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5832446A (en) * | 1993-03-31 | 1998-11-03 | Cornell Research Foundation, Inc. | Interactive database method and system for food and beverage preparation |
| US6389436B1 (en) * | 1997-12-15 | 2002-05-14 | International Business Machines Corporation | Enhanced hypertext categorization using hyperlinks |
| US7233940B2 (en) * | 2000-11-06 | 2007-06-19 | Answers Corporation | System for processing at least partially structured data |
| US6970881B1 (en) | 2001-05-07 | 2005-11-29 | Intelligenxia, Inc. | Concept-based method and system for dynamically analyzing unstructured information |
| US6778995B1 (en) * | 2001-08-31 | 2004-08-17 | Attenex Corporation | System and method for efficiently generating cluster groupings in a multi-dimensional concept space |
| US7996390B2 (en) * | 2008-02-15 | 2011-08-09 | The University Of Utah Research Foundation | Method and system for clustering identified forms |
| US20110099133A1 (en) * | 2009-10-28 | 2011-04-28 | Industrial Technology Research Institute | Systems and methods for capturing and managing collective social intelligence information |
| US8886623B2 (en) * | 2010-04-07 | 2014-11-11 | Yahoo! Inc. | Large scale concept discovery for webpage augmentation using search engine indexers |
| US9536237B2 (en) * | 2012-11-28 | 2017-01-03 | Wal-Mart Stores, Inc. | Recipe suggestion apparatus and method |
-
2013
- 2013-03-15 US US13/837,764 patent/US9477777B2/en active Active
- 2013-12-13 WO PCT/JP2013/084169 patent/WO2014141560A1/en not_active Ceased
- 2013-12-13 SG SG11201405967QA patent/SG11201405967QA/en unknown
- 2013-12-13 KR KR1020147026567A patent/KR101614642B1/ko active Active
- 2013-12-13 JP JP2014530448A patent/JP5946916B2/ja active Active
- 2013-12-23 TW TW102147813A patent/TWI590086B/zh active
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5960440A (en) * | 1996-01-16 | 1999-09-28 | Brother International Corporation | Kitchen information and database management method and apparatus |
| JP2005284406A (ja) * | 2004-03-26 | 2005-10-13 | Matsushita Electric Works Ltd | 料理レシピ提示システム |
| JP2008129943A (ja) * | 2006-11-22 | 2008-06-05 | Nippon Telegr & Teleph Corp <Ntt> | 構造化文書生成方法及び装置及びプログラム |
| US20090009815A1 (en) * | 2007-07-05 | 2009-01-08 | Gregory Karasik | Apparatus for electronic storage of recipes |
| JP2010238041A (ja) * | 2009-03-31 | 2010-10-21 | Fujitsu Ltd | 分類体系改正支援プログラム、分類体系改正支援装置、および分類体系改正支援方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| WO2014141560A1 (en) | 2014-09-18 |
| TWI590086B (zh) | 2017-07-01 |
| TW201439797A (zh) | 2014-10-16 |
| US9477777B2 (en) | 2016-10-25 |
| KR101614642B1 (ko) | 2016-04-21 |
| US20140280148A1 (en) | 2014-09-18 |
| SG11201405967QA (en) | 2015-11-27 |
| JP5946916B2 (ja) | 2016-07-06 |
| KR20140132378A (ko) | 2014-11-17 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5946916B2 (ja) | 半構造化されたデータを解析しカテゴリ分けするための方法 | |
| US10991025B1 (en) | System and method for providing food taxonomy based food search and recommendation | |
| US10839151B2 (en) | Systems and methods for automatic analysis of text-based food-recipes | |
| WO2022022002A1 (zh) | 一种信息展示方法、信息搜索方法及装置 | |
| RU2670494C2 (ru) | Способ обработки поискового запроса, сервер и машиночитаемый носитель для его осуществления | |
| JP5997350B2 (ja) | ソーシャルグラフ情報に基づく構造化検索クエリ | |
| US9098588B2 (en) | Information processing apparatus, information processing method, and information processing program | |
| CN103970857B (zh) | 推荐内容确定系统和方法 | |
| US10339160B2 (en) | Organizing survey text responses | |
| TWI480829B (zh) | 料理食譜資訊提供裝置、料理食譜資訊提供方法、電腦程式產品、及資訊記錄媒體 | |
| WO2021017306A1 (zh) | 根据用户画像的个性化搜索方法、系统、设备及存储介质 | |
| CN107092608A (zh) | 一种目标对象的搜索、推荐方法和设备 | |
| KR20170023936A (ko) | 개인화된 트렌딩 이미지 검색 제시 기법 | |
| CN103942264B (zh) | 推送包含新闻信息的网页的方法和装置 | |
| CN105843817A (zh) | 在终端设备上进行搜索的方法、装置和设备 | |
| JP2018504686A (ja) | 検索データを処理するための方法及び装置 | |
| CN111723296B (zh) | 搜索处理方法、装置及计算机设备 | |
| US9824117B1 (en) | Providing user-influenced search results based on product attributes | |
| JP5827449B2 (ja) | オンラインソーシャルネットワークのためのパーソナライズされた構造化検索クエリ | |
| CN116340383A (zh) | 基于查询与结果相关性的搜索方法、装置、介质及设备 | |
| WO2016088212A1 (ja) | データ収集装置、及びデータ収集方法 | |
| CN105404695A (zh) | 试题查询方法和装置 | |
| KR101667918B1 (ko) | 질의 반응형 스마트 검색 서비스 제공 방법 및 이를 구현하기 위한 검색 서비스 장치 | |
| JP2004259083A (ja) | 情報検索方法、情報検索サーバ、及び情報検索プログラム | |
| JP5292525B1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151006 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151113 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160531 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160601 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5946916 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D02 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
