JP2016538676A - オンラインサービスのサポートのためのリソース生成 - Google Patents
オンラインサービスのサポートのためのリソース生成 Download PDFInfo
- Publication number
- JP2016538676A JP2016538676A JP2016556247A JP2016556247A JP2016538676A JP 2016538676 A JP2016538676 A JP 2016538676A JP 2016556247 A JP2016556247 A JP 2016556247A JP 2016556247 A JP2016556247 A JP 2016556247A JP 2016538676 A JP2016538676 A JP 2016538676A
- Authority
- JP
- Japan
- Prior art keywords
- concept
- concepts
- category
- categories
- level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 39
- 238000004364 calculation method Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 3
- 230000003993 interaction Effects 0.000 description 14
- 125000002015 acyclic group Chemical group 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000002146 bilateral effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/954—Navigation, e.g. using categorised browsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
[0001]本出願は、2013年11月27日出願の米国仮特許出願第61/910000号の利益を主張するものであり、上記出願の内容はその全体が本明細書に援用される。
Claims (20)
- カテゴリへと編成されるオンラインテキスト概念のデータベースのためのマシン実装方法であって、
各カテゴリについて、
前記概念のうちの第1の概念の数であって、前記第1の概念のカテゴリは、前記第1の概念を直接的に含む第1のレベルのカテゴリである、第1の概念の数と、
前記概念のうちの第2の概念の数であって、前記第2の概念のカテゴリは、前記第2の概念が今度は前記第2の概念を含むカテゴリのうちの他のカテゴリのメンバーであることを介してのみ、前記第2の概念を含む、第2の概念の数と、
同様に続いて、前記概念のうちの第nの概念の数であって、前記第nの概念のカテゴリは、第nのレベルのカテゴリである、第nの概念の数、まで、
を計数するステップであって、ここでnは2以上の正の整数である、当該計数するステップと、
各カテゴリについて、最も多い計数を有するレベルとなるように前記カテゴリを分類するステップと、
各レベルに分類された各カテゴリについて、前記カテゴリの概念のページランクに少なくとも基づいて、最も有意な概念を有する分類されたカテゴリを決定して、前記最も有意な概念を有する各レベルに分類されたカテゴリの集合を決定するステップと、
を含む、マシン実装方法。 - 前記カテゴリの部分集合が循環機構を有し、
前記マシン実装方法が、
前記カテゴリを分類する前に、前記カテゴリの前記部分集合について、前記循環機構を解消するステップ、
を更に含む、請求項1に記載のマシン実装方法。 - 各概念について、前記概念がハイパーリンクする全ての他の概念を識別して、各概念について参照される概念のマップを生成するステップ、
を更に含む、請求項1に記載のマシン実装方法。 - ユーザからの入力を受信するステップと、
前記入力を分析して、前記入力により示唆される概念の第1の集合を識別するステップと、
参照される概念の前記マップを介して前記概念の第1の集合を参照して、前記概念の第1の集合に関連する追加の概念を識別するステップと、
を更に含む、請求項3に記載のマシン実装方法。 - 前記オンラインテキスト概念のデータベースは、ウィキペディアからなる、請求項1に記載のマシン実装方法。
- ページランクアルゴリズムを各概念に対して適用して、各概念についてページランクを決定するステップ、
を更に含む、請求項5に記載のマシン実装方法。 - ユーザからの入力を受信するステップと、
前記入力を分析して、前記入力により示唆される概念の第1の集合を識別するステップと、
前記第1の集合内の各概念が閾値となるページランク概念を超えるかどうかに従って、前記概念の第1の集合を低減して、有意なページランクを有する低減された概念の集合を形成するステップと、
を更に含む、請求項6に記載のマシン実装方法。 - 前記マシン実装方法が、
前記データベースに関する使用統計を分析して、各概念について利用人気を識別するステップ、
を更に含み、
前記概念の集合を形成するステップは、
前記概念の第1の集合に対して利用人気閾値を適用することにより、前記利用人気閾値を超える利用人気を有する前記第1の集合内の概念のみが前記低減された概念の集合に属することができるようにすること、を更に含む、請求項7に記載のマシン実装方法。 - 全て大文字でない文字を用いて各カテゴリから文字列を形成するステップと、
全ての前記カテゴリから得た前記文字列を比較して、同一の文字列を有するカテゴリを識別するステップと、
前記同一の文字列を有するいずれのカテゴリも、単一の対応するマージ済みカテゴリへとマージするステップと、
を更に含む、請求項2に記載のマシン実装方法。 - 各概念から逆索引を形成するステップ、
を更に含む、請求項5に記載のマシン実装方法。 - ユーザからテキスト入力を受信するステップと、
前記テキスト入力内の言葉と前記逆索引とを比較して、前記テキスト入力に関連する概念の集合を識別するステップと、
を更に含む、請求項10に記載のマシン実装方法。 - 前記関連する概念と前記分類されたカテゴリの集合とを、前記最も有意な概念を有する各レベルについて比較して、前記関連する概念を含む、分類されたカテゴリの低減された集合を識別するステップ、
を更に含む、請求項11に記載のマシン実装方法。 - 前記関連する概念の集合と前記分類されたカテゴリの低減された集合とを使用して、前記ユーザに対して前記ユーザのテキスト入力に関連する内容を提示するステップ、
を更に含む、請求項12に記載のマシン実装方法。 - 前記参照される概念のマップを分析して、各概念から前記参照される概念と、全ての残りの概念に対して参照される概念との間のいずれの共通部分も識別することにより、全ての前記概念の間の類似性重み付け概念関係を決定するステップ、
を更に含む、請求項3に記載のマシン実装方法。 - 記憶されたプログラム命令を含有する有形コンピュータ可読媒体であって、
1つ又は複数のプロセッサによる前記プログラム命令の実行は、前記1つ又は複数のプロセッサに、
カテゴリへと編成されるオンラインテキスト概念のデータベースに対して、各カテゴリについて、
前記概念のうちの第1の概念の数であって、前記第1の概念のカテゴリは、前記第1の概念を直接的に含む第1のレベルのカテゴリである、第1の概念の数と、
前記概念のうちの第2の概念の数であって、前記第2の概念のカテゴリは、前記第2の概念が今度は前記第2の概念を含むカテゴリのうちの他のカテゴリのメンバーであることを介してのみ、前記第2の概念を含む、第2の概念の数と、
同様に続いて、前記概念のうちの第nの概念の数であって、前記第nの概念のカテゴリは、第nのレベルのカテゴリである、第nの概念の数、まで
を計数するステップであって、ここでnは2以上の正の整数である、当該計数するステップと、
各カテゴリについて、最も多い計数を有するレベルとなるように前記カテゴリを分類するステップと、
各レベルに分類された各カテゴリについて、前記カテゴリの概念のページランクに少なくとも基づいて、最も有意な概念を有する分類されたカテゴリを決定して、前記最も有意な概念を有する各レベルに分類されたカテゴリの集合を決定するステップと、
を実行させる、有形コンピュータ可読媒体。 - 前記1つ又は複数のプロセッサによる前記プログラム命令の実行が、
前記1つ又は複数のプロセッサに、
各概念について、前記概念がリンクする全ての他の概念を識別して、各概念について参照される概念のマップを生成するステップ、
を更に実行させる、請求項15に記載の有形コンピュータ可読媒体。 - 前記1つ又は複数のプロセッサによる前記プログラム命令の実行が、
前記1つ又は複数のプロセッサに、
ユーザからの入力を受信するステップと、
前記入力を分析して、前記入力により示唆される概念の第1の集合を識別するステップと、
参照される概念の前記マップを介して前記概念の第1の集合を参照して、前記概念の第1の集合に関連する追加の概念を識別するステップと、
を更に実行させる、請求項16に記載の有形コンピュータ可読媒体。 - 各ページが単独の概念を対象とし、前記ページはカテゴリへと分けられているオンラインテキストページのデータベースについて、各概念について、前記概念がハイパーリンクする全ての他の概念を識別して、各概念について全ての参照される概念を列挙した概念参照マップを生成するよう構成された、解析モジュールと、
前記データベース内の、同じ言葉で表現されるが異なるテキストページに対応する概念を列挙する全ての曖昧さ回避ページを識別するよう構成された、曖昧さ回避ページエクストラクタモジュールと、
前記参照される概念のマップをフィルタリングして、曖昧さ回避ページを除去することにより、フィルタリング済み概念参照マップを形成するよう構成された、曖昧さ回避モジュールと、
前記フィルタリング済み概念参照マップを処理して、各概念について、各概念について参照される概念と類似性重み付け概念について参照される概念との間の共通部分に少なくとも基づいて、前記類似性重み付け概念のリストを識別するよう構成された、類似性演算モジュールと、
を含む、システム。 - 前記システムが、
ユーザからの入力を処理して前記入力に関連する概念の集合を識別し、前記類似性重み付け概念のリストに関して前記概念の集合を更に処理して前記概念の集合に関連する概念の集合を識別するよう、更に構成される、請求項18に記載のシステム。 - 各カテゴリについて、
前記概念のうちの第1の概念の数であって、前記第1の概念のカテゴリは、前記第1の概念を直接的に含む第1のレベルのカテゴリである、第1の概念の数と、
前記概念のうちの第2の概念の数であって、前記第2の概念のカテゴリは、前記第2の概念が今度は前記第2の概念を含むカテゴリのうちの他のカテゴリのメンバーであることを介してのみ、前記第2の概念を含む、第2の概念の数と、
同様に続いて、前記概念のうちの第nの概念の数であって、前記第nの概念のカテゴリは、第nのレベルのカテゴリである、第nの概念の数、まで
を計数し、
ここでnは2以上の正の整数であり、
各カテゴリについて、最も多い計数を有するレベルとなるように前記カテゴリを分類し、
各レベルに分類された各カテゴリについて、少なくとも前記カテゴリの概念のページランクに基づいて、最も有意な概念を有する分類されたカテゴリを決定して、前記最も有意な概念を有する各レベルに分類されたカテゴリの集合を決定する、
よう構成された、カテゴリランク演算モジュール、
を更に含む、請求項18に記載のシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361910000P | 2013-11-27 | 2013-11-27 | |
US61/910,000 | 2013-11-27 | ||
PCT/US2014/067479 WO2015081131A1 (en) | 2013-11-27 | 2014-11-25 | Generating resources for support of online services |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016538676A true JP2016538676A (ja) | 2016-12-08 |
JP6440733B2 JP6440733B2 (ja) | 2018-12-19 |
Family
ID=53199616
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016556247A Active JP6440733B2 (ja) | 2013-11-27 | 2014-11-25 | オンラインサービスのサポートのためのリソース生成 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9646099B2 (ja) |
EP (1) | EP3074890A4 (ja) |
JP (1) | JP6440733B2 (ja) |
KR (1) | KR101778901B1 (ja) |
CN (1) | CN105378729A (ja) |
WO (1) | WO2015081131A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11610248B1 (en) * | 2019-06-19 | 2023-03-21 | Amazon Technologies, Inc. | Type ambiguity detection system |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013520868A (ja) * | 2010-02-19 | 2013-06-06 | トムソン ライセンシング | 強化されたコンテンツ検索 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6415283B1 (en) * | 1998-10-13 | 2002-07-02 | Orack Corporation | Methods and apparatus for determining focal points of clusters in a tree structure |
US8229957B2 (en) * | 2005-04-22 | 2012-07-24 | Google, Inc. | Categorizing objects, such as documents and/or clusters, with respect to a taxonomy and data structures derived from such categorization |
US20070027772A1 (en) * | 2005-07-28 | 2007-02-01 | Bridge Well Incorporated | Method and system for web page advertising, and method of running a web page advertising agency |
CN1794240A (zh) * | 2006-01-09 | 2006-06-28 | 北京大学深圳研究生院 | 基于自然语言理解的计算机信息检索系统及其检索方法 |
US8468244B2 (en) * | 2007-01-05 | 2013-06-18 | Digital Doors, Inc. | Digital information infrastructure and method for security designated data and with granular data stores |
US7860855B2 (en) * | 2007-02-13 | 2010-12-28 | Sap Ag | Method and system for analyzing similarity of concept sets |
US8595234B2 (en) * | 2010-05-17 | 2013-11-26 | Wal-Mart Stores, Inc. | Processing data feeds |
US8725739B2 (en) * | 2010-11-01 | 2014-05-13 | Evri, Inc. | Category-based content recommendation |
CN102129479B (zh) * | 2011-04-29 | 2013-01-02 | 南京邮电大学 | 一种基于概率潜在语义分析模型的万维网服务发现方法 |
-
2014
- 2014-11-25 JP JP2016556247A patent/JP6440733B2/ja active Active
- 2014-11-25 KR KR1020167001062A patent/KR101778901B1/ko active IP Right Grant
- 2014-11-25 CN CN201480039648.8A patent/CN105378729A/zh active Pending
- 2014-11-25 WO PCT/US2014/067479 patent/WO2015081131A1/en active Application Filing
- 2014-11-25 EP EP14865510.3A patent/EP3074890A4/en not_active Withdrawn
-
2015
- 2015-09-30 US US14/871,656 patent/US9646099B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013520868A (ja) * | 2010-02-19 | 2013-06-06 | トムソン ライセンシング | 強化されたコンテンツ検索 |
Non-Patent Citations (1)
Title |
---|
瀬戸口 司、浅野 泰仁、吉川 正俊: "Wikipediaのリンク構造を利用した関係性ラベルの抽出手法", 第5回データ工学と情報マネジメントに関するフォーラム (第11回日本データベース学会年次大会) [O, JPN6018027270, 31 May 2013 (2013-05-31), JP * |
Also Published As
Publication number | Publication date |
---|---|
CN105378729A (zh) | 2016-03-02 |
US20160026723A1 (en) | 2016-01-28 |
EP3074890A1 (en) | 2016-10-05 |
EP3074890A4 (en) | 2017-09-06 |
KR101778901B1 (ko) | 2017-09-26 |
KR20160127707A (ko) | 2016-11-04 |
US9646099B2 (en) | 2017-05-09 |
WO2015081131A1 (en) | 2015-06-04 |
JP6440733B2 (ja) | 2018-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10108720B2 (en) | Automatically providing relevant search results based on user behavior | |
Zhao et al. | Ontology integration for linked data | |
US20160034512A1 (en) | Context-based metadata generation and automatic annotation of electronic media in a computer network | |
WO2010125463A1 (en) | Method and apparatus for identifying synonyms and using synonyms to search | |
Al-Subaihin et al. | Empirical comparison of text-based mobile apps similarity measurement techniques | |
CN107506472B (zh) | 一种学生浏览网页分类方法 | |
US10339191B2 (en) | Method of and a system for processing a search query | |
US7949646B1 (en) | Method and apparatus for building sales tools by mining data from websites | |
CN112231598A (zh) | 网页路径导航方法、装置、电子设备及存储介质 | |
Rosaci | Finding semantic associations in hierarchically structured groups of Web data | |
CN111259220A (zh) | 一种基于大数据的数据采集方法和系统 | |
US20190370402A1 (en) | Profile spam removal in search results from social network | |
Bizer et al. | Using the semantic web as a source of training data | |
WO2012091541A1 (en) | A semantic web constructor system and a method thereof | |
JP6440733B2 (ja) | オンラインサービスのサポートのためのリソース生成 | |
US9547701B2 (en) | Method of discovering and exploring feature knowledge | |
Tourné et al. | Evaluating tag filtering techniques for web resource classification in folksonomies | |
Kotenko et al. | The intelligent system for detection and counteraction of malicious and inappropriate information on the Internet | |
Moumtzidou et al. | Discovery of environmental nodes in the web | |
Das et al. | Adaptive web personalization system using splay tree | |
US11507593B2 (en) | System and method for generating queryeable structured document from an unstructured document using machine learning | |
Lalitha et al. | Potential Web Content Identification and Classification System using NLP and Machine Learning Techniques | |
KR20140135100A (ko) | 시맨틱 매쉬업 기술을 이용한 프로그램 제공 방법 | |
Singhal et al. | Leveraging web resources for keyword assignment to short text documents | |
Bhatia et al. | Context sensitive entity linking of search queries in enterprise knowledge graphs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151105 |
|
A529 | Written submission of copy of amendment under article 34 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A529 Effective date: 20151201 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170523 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180724 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180809 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181113 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181120 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6440733 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |