JP5946916B2 - 半構造化されたデータを解析しカテゴリ分けするための方法 - Google Patents
半構造化されたデータを解析しカテゴリ分けするための方法 Download PDFInfo
- Publication number
- JP5946916B2 JP5946916B2 JP2014530448A JP2014530448A JP5946916B2 JP 5946916 B2 JP5946916 B2 JP 5946916B2 JP 2014530448 A JP2014530448 A JP 2014530448A JP 2014530448 A JP2014530448 A JP 2014530448A JP 5946916 B2 JP5946916 B2 JP 5946916B2
- Authority
- JP
- Japan
- Prior art keywords
- semi
- topic
- data
- structured
- structured data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
- G06F16/84—Mapping; Conversion
- G06F16/86—Mapping to a database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
であり得、ここでは、「zスコア」は標準スコアであり、関数fはレシピの生のスコアを計算するために使用され、pは確率である。
であり、ここでは、「P」は精度であり、「R」は再現度又は相関性である。スコアがすべての一般的でない料理について検査されたときの結果は
である。
Claims (10)
- 所定のネットワークを介して複数のユーザに、多くの制約なしにユーザによって入力されることが可能な半構造化されたトピック、半構造化されたまたは構造化された特徴、および前記トピックの属性を提供するコンピュータシステムであって、
複数の半構造化されたデータエントリを記憶するメモリであって、それぞれの半構造化されたデータエントリが所定のトピックおよびトピックデータフィールドを提供する、該メモリと、
前記半構造化されたデータエントリのサブセットを前記半構造化されたデータエントリのトピックに基づいて選択し、前記トピックに関連する半構造化されたデータフィールドと前記トピックデータフィールドとのうちの少なくとも一つを該サブセットから選択し、選択された前記半構造化されたデータフィールドの前記トピックおよび前記特徴に、データの類似度を判断するためのデータ解釈用アルゴリズムを適用することで前記トピックの属性を決定するプロセッサと
を備えるコンピュータシステム。 - 前記トピック、前記特徴、および前記トピックの属性がそれぞれ、レシピ名称、原材料、および国料理に対応する、
請求項1に記載のコンピュータシステム。 - 前記データ解釈用アルゴリズムが、混成最大エントロピー及びLDAモデルと、語出現頻度−文献出現頻度の逆数と、コサイン類似度解析とのうちの少なくとも一つを備える、請求項1または2に記載のシステム。
- 前記半構造化されたデータエントリのサブセットが訓練データであり、
前記プロセッサが、更新された訓練データを以前の訓練データと統合し、前記トピックおよび前記特徴の決定と前記データ解釈用アルゴリズムの適用とを繰り返す、
請求項1〜3のいずれか一項に記載のシステム。 - 前記プロセッサが、前記半構造化されたデータエントリの前記サブセットを、前記半構造化されたデータエントリの前記トピックのLDA重心に対するコサイン類似度に基づいて選択する、
請求項1〜4のいずれか一項に記載のシステム。 - 所定のネットワークを介して複数のユーザに、多くの制約なしにユーザによって入力されることが可能な半構造化されたトピック、半構造化されたまたは構造化された特徴、および前記トピックの属性を提供するための方法であって、
複数の半構造化されたデータエントリをメモリに記憶する第1ステップであって、それぞれの半構造化されたデータエントリが所定のトピックおよびトピックデータフィールドを提供する、該第1ステップと、
プロセッサが、前記半構造化されたデータエントリのサブセットを前記半構造化されたデータエントリのトピックに基づいて選択する第2ステップと、
前記プロセッサが、前記トピックに関連する半構造化されたデータフィールドと前記トピックデータフィールドとのうちの少なくとも一つを該サブセットから選択する第3ステップと、
前記プロセッサが、前記トピックの属性を決定するために、選択された前記半構造化されたデータフィールドの前記トピックおよび前記特徴に、データの類似度を判断するためのデータ解釈用アルゴリズムを適用する第4ステップと、
を含む方法。 - 前記トピック、前記特徴、および前記トピックの属性がそれぞれ、レシピ名称、原材料、および国料理に対応する、
請求項6に記載の方法。 - 前記データ解釈用アルゴリズムが、混成最大エントロピー及びLDAモデルと、語出現頻度−文献出現頻度の逆数と、コサイン類似度解析とのうちの少なくとも一つを備える、請求項6または7に記載の方法。
- 前記半構造化されたデータエントリのサブセットが訓練データであり、
前記方法が、
前記プロセッサが、更新された訓練データを以前の訓練データと統合し、前記トピックおよび前記特徴の決定と前記データ解釈用アルゴリズムの適用とを繰り返すステップを更に含む、
請求項6〜8のいずれか一項に記載の方法。 - 前記第2ステップでは、前記プロセッサが、前記半構造化されたデータエントリの前記サブセットを、前記半構造化されたデータエントリの前記トピックに関するLDA重心に対するコサイン類似度に基づいて選択する、
請求項6〜9のいずれか一項に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/837,764 | 2013-03-15 | ||
US13/837,764 US9477777B2 (en) | 2013-03-15 | 2013-03-15 | Method for analyzing and categorizing semi-structured data |
PCT/JP2013/084169 WO2014141560A1 (en) | 2013-03-15 | 2013-12-13 | Method for analyzing and categorizing semi-structured data |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015518585A JP2015518585A (ja) | 2015-07-02 |
JP5946916B2 true JP5946916B2 (ja) | 2016-07-06 |
Family
ID=49998631
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014530448A Active JP5946916B2 (ja) | 2013-03-15 | 2013-12-13 | 半構造化されたデータを解析しカテゴリ分けするための方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9477777B2 (ja) |
JP (1) | JP5946916B2 (ja) |
KR (1) | KR101614642B1 (ja) |
SG (1) | SG11201405967QA (ja) |
TW (1) | TWI590086B (ja) |
WO (1) | WO2014141560A1 (ja) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9201864B2 (en) * | 2013-03-15 | 2015-12-01 | Luminoso Technologies, Inc. | Method and system for converting document sets to term-association vector spaces on demand |
US9495360B2 (en) * | 2014-01-31 | 2016-11-15 | International Business Machines Corporation | Recipe creation using text analytics |
US9489377B1 (en) * | 2014-02-21 | 2016-11-08 | Yummly, Inc. | Inferring recipe difficulty |
US20150339394A1 (en) * | 2014-05-20 | 2015-11-26 | Tasty Time, Inc. | Extracting Online Recipes, and Arranging and Generating a Cookbook |
US9311568B1 (en) * | 2014-05-21 | 2016-04-12 | Yummly, Inc. | Recipe text and image extraction |
US9483547B1 (en) | 2014-05-30 | 2016-11-01 | Yummly, Inc. | Clustering and display of recipes |
US9824152B1 (en) | 2014-05-30 | 2017-11-21 | Yummly, Inc. | Recipe recommendation |
US9797873B1 (en) | 2014-06-26 | 2017-10-24 | Yummly, Inc. | Prediction of recipe preparation time |
JP6539962B2 (ja) * | 2014-09-04 | 2019-07-10 | 富士ゼロックス株式会社 | 情報提示プログラム及び情報処理装置 |
US20160103834A1 (en) * | 2014-10-14 | 2016-04-14 | International Business Machines Corporation | Food recipe scoring and ranking system |
US10157178B2 (en) * | 2015-02-06 | 2018-12-18 | International Business Machines Corporation | Identifying categories within textual data |
US10825044B2 (en) * | 2017-08-10 | 2020-11-03 | Louis Iannone | System and method for recipe identification and classification |
US11410638B1 (en) * | 2017-08-30 | 2022-08-09 | Amazon Technologies, Inc. | Voice user interface for nested content |
US10872236B1 (en) | 2018-09-28 | 2020-12-22 | Amazon Technologies, Inc. | Layout-agnostic clustering-based classification of document keys and values |
US11257006B1 (en) | 2018-11-20 | 2022-02-22 | Amazon Technologies, Inc. | Auto-annotation techniques for text localization |
US10949661B2 (en) * | 2018-11-21 | 2021-03-16 | Amazon Technologies, Inc. | Layout-agnostic complex document processing system |
US10984064B1 (en) | 2020-08-17 | 2021-04-20 | Louis Iannone | Methods, devices, and systems for dish data generation and tracking |
KR102418298B1 (ko) * | 2022-01-06 | 2022-07-07 | (주) 바우디움 | 구조화 문서에 기반하여 사용자의 계획을 관리하는 방법 및 이를 이용한 장치 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5832446A (en) * | 1993-03-31 | 1998-11-03 | Cornell Research Foundation, Inc. | Interactive database method and system for food and beverage preparation |
US5960440A (en) | 1996-01-16 | 1999-09-28 | Brother International Corporation | Kitchen information and database management method and apparatus |
US6389436B1 (en) * | 1997-12-15 | 2002-05-14 | International Business Machines Corporation | Enhanced hypertext categorization using hyperlinks |
US7233940B2 (en) * | 2000-11-06 | 2007-06-19 | Answers Corporation | System for processing at least partially structured data |
US6970881B1 (en) | 2001-05-07 | 2005-11-29 | Intelligenxia, Inc. | Concept-based method and system for dynamically analyzing unstructured information |
US6778995B1 (en) * | 2001-08-31 | 2004-08-17 | Attenex Corporation | System and method for efficiently generating cluster groupings in a multi-dimensional concept space |
JP2005284406A (ja) | 2004-03-26 | 2005-10-13 | Matsushita Electric Works Ltd | 料理レシピ提示システム |
JP4937709B2 (ja) | 2006-11-22 | 2012-05-23 | 日本電信電話株式会社 | 構造化文書生成方法及び装置及びプログラム |
US20090009815A1 (en) | 2007-07-05 | 2009-01-08 | Gregory Karasik | Apparatus for electronic storage of recipes |
US7996390B2 (en) * | 2008-02-15 | 2011-08-09 | The University Of Utah Research Foundation | Method and system for clustering identified forms |
JP5310196B2 (ja) * | 2009-03-31 | 2013-10-09 | 富士通株式会社 | 分類体系改正支援プログラム、分類体系改正支援装置、および分類体系改正支援方法 |
US20110112995A1 (en) * | 2009-10-28 | 2011-05-12 | Industrial Technology Research Institute | Systems and methods for organizing collective social intelligence information using an organic object data model |
US8886623B2 (en) * | 2010-04-07 | 2014-11-11 | Yahoo! Inc. | Large scale concept discovery for webpage augmentation using search engine indexers |
US9536237B2 (en) * | 2012-11-28 | 2017-01-03 | Wal-Mart Stores, Inc. | Recipe suggestion apparatus and method |
-
2013
- 2013-03-15 US US13/837,764 patent/US9477777B2/en active Active
- 2013-12-13 KR KR1020147026567A patent/KR101614642B1/ko active IP Right Grant
- 2013-12-13 WO PCT/JP2013/084169 patent/WO2014141560A1/en active Application Filing
- 2013-12-13 SG SG11201405967QA patent/SG11201405967QA/en unknown
- 2013-12-13 JP JP2014530448A patent/JP5946916B2/ja active Active
- 2013-12-23 TW TW102147813A patent/TWI590086B/zh active
Also Published As
Publication number | Publication date |
---|---|
SG11201405967QA (en) | 2015-11-27 |
TW201439797A (zh) | 2014-10-16 |
KR20140132378A (ko) | 2014-11-17 |
JP2015518585A (ja) | 2015-07-02 |
TWI590086B (zh) | 2017-07-01 |
US20140280148A1 (en) | 2014-09-18 |
US9477777B2 (en) | 2016-10-25 |
WO2014141560A1 (en) | 2014-09-18 |
KR101614642B1 (ko) | 2016-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5946916B2 (ja) | 半構造化されたデータを解析しカテゴリ分けするための方法 | |
US10839151B2 (en) | Systems and methods for automatic analysis of text-based food-recipes | |
US10991025B1 (en) | System and method for providing food taxonomy based food search and recommendation | |
US11714835B2 (en) | Organizing survey text responses | |
WO2022022002A1 (zh) | 一种信息展示方法、信息搜索方法及装置 | |
JP5997350B2 (ja) | ソーシャルグラフ情報に基づく構造化検索クエリ | |
WO2014002512A1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
US10592540B2 (en) | Generating elements of answer-seeking queries and elements of answers | |
US8843497B2 (en) | System and method for association extraction for surf-shopping | |
RU2670494C2 (ru) | Способ обработки поискового запроса, сервер и машиночитаемый носитель для его осуществления | |
TWI480829B (zh) | 料理食譜資訊提供裝置、料理食譜資訊提供方法、電腦程式產品、及資訊記錄媒體 | |
WO2021017306A1 (zh) | 根据用户画像的个性化搜索方法、系统、设备及存储介质 | |
CN107092608A (zh) | 一种目标对象的搜索、推荐方法和设备 | |
KR20170023936A (ko) | 개인화된 트렌딩 이미지 검색 제시 기법 | |
CN105893564A (zh) | 一种基于搜索引擎客户端的搜索方法和装置 | |
Kicherer et al. | What you use, not what you do: Automatic classification and similarity detection of recipes | |
JP6325132B2 (ja) | データ収集装置、及びデータ収集方法 | |
CN116340383A (zh) | 基于查询与结果相关性的搜索方法、装置、介质及设备 | |
CN115618109A (zh) | 内容推荐方法、装置、电子设备及计算机可读存储介质 | |
KR101667918B1 (ko) | 질의 반응형 스마트 검색 서비스 제공 방법 및 이를 구현하기 위한 검색 서비스 장치 | |
JP2004259083A (ja) | 情報検索方法、情報検索サーバ、及び情報検索プログラム | |
Kicherer et al. | What you use, not what you do: automatic classification of recipes | |
JP5292525B1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
CN113892110A (zh) | 基于图像的菜肴识别装置和方法 | |
JP5827449B2 (ja) | オンラインソーシャルネットワークのためのパーソナライズされた構造化検索クエリ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151006 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160531 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160601 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5946916 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D02 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |