JP6440733B2 - オンラインサービスのサポートのためのリソース生成 - Google Patents
オンラインサービスのサポートのためのリソース生成 Download PDFInfo
- Publication number
- JP6440733B2 JP6440733B2 JP2016556247A JP2016556247A JP6440733B2 JP 6440733 B2 JP6440733 B2 JP 6440733B2 JP 2016556247 A JP2016556247 A JP 2016556247A JP 2016556247 A JP2016556247 A JP 2016556247A JP 6440733 B2 JP6440733 B2 JP 6440733B2
- Authority
- JP
- Japan
- Prior art keywords
- concept
- wikipedia
- wikipedi
- category
- concepts
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 34
- 238000004364 calculation method Methods 0.000 claims description 24
- 230000008569 process Effects 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 2
- 241000257465 Echinoidea Species 0.000 claims 1
- 238000013507 mapping Methods 0.000 claims 1
- 230000003993 interaction Effects 0.000 description 14
- 238000004458 analytical method Methods 0.000 description 7
- 125000002015 acyclic group Chemical group 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000002146 bilateral effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/954—Navigation, e.g. using categorised browsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
[0001]本出願は、2013年11月27日出願の米国仮特許出願第61/910000号の利益を主張するものであり、上記出願の内容はその全体が本明細書に援用される。
Claims (12)
- ウィキペディア概念およびウィキペディアカテゴリを解析するためのマシン実装方法であって、
エクストラクタモジュールが、複数の文書に関連付けられたオンライン百科事典を備えるウェブサイトにアクセスするステップであって、ここで前記複数の文書が各々が1つ以上のウィキペディア概念を前記ウェブサイト用のデータベース内に有するウィキペディアカテゴリを備える、アクセスするステップと、
カテゴリランク演算モジュールが、前記複数の文書に関連付けられた各カテゴリについて、
前記ウィキペディア概念のうちの第1のウィキペディア概念の数であって、前記第1のウィキペディア概念に関するウィキペディアカテゴリは、前記第1のウィキペディア概念を直接的に含む第1レベルのウィキペディアカテゴリである、第1のウィキペディア概念の数と、
前記ウィキペディア概念のうちの第2のウィキペディア概念の数であって、前記第2のウィキペディア概念に関するウィキペディアカテゴリは、前記第2のウィキペディア概念が、今度は前記第2のウィキペディア概念を含むカテゴリのうちの他のカテゴリのメンバーであることを通してのみ前記第2のウィキペディア概念を含む第2レベルのウィキペディアカテゴリである、第2のウィキペディア概念の数と、
同様に続いて、前記ウィキペディア概念のうちの第nのウィキペディア概念の数であって、前記第nのウィキペディア概念に関するウィキペディアカテゴリは、第nのレベルのウィキペディアカテゴリである、第nのウィキペディア概念の数まで、
を計数するステップであって、ここでnは2以上の正の整数であり前記ウィキペディアカテゴリの階層の設定最大数に制限される、計数するステップと、
パーサモジュールが、各ウィキペディア概念について、前記ウィキペディア概念がハイパーリンクする全ての他のウィキペディア概念を識別し、各ウィキペディア概念について参照されるウィキペディア概念のマップを生成し、類似性演算モジュールが、前記全ての他のウィキペディア概念及び前記ウィキペディア概念内のすべての前記参照されるウィキペディア概念の和集合ごとに、前記全ての他のウィキペディア概念と前記ウィキペディア概念との間の類似性スコアを、前記全ての他のウィキペディア概念と前記ウィキペディア概念との間の前記参照されるウィキペディア概念の共通部分の比として決定するステップと、
前記カテゴリランク演算モジュールが、各ウィキペディアカテゴリについて、n個のレベルのうち最も多い計数を有するレベルを決定し、前記最も多い計数を有するレベルとなるように前記ウィキペディアカテゴリを分類するステップと、
前記カテゴリランク演算モジュールが、各レベルについて、前記ウィキペディアカテゴリの概念の平均ページランクに対する閾値を超える前記ウィキペディアカテゴリの概念の前記平均ページランクに少なくとも基づいて、前記レベルに分類された複数のウィキペディアカテゴリのうち最も有意な概念を有するウィキペディアカテゴリを決定して、前記最も有意な概念を有する各レベルに分類されたウィキペディアのカテゴリの集合を決定するステップと、
前記類似性演算モジュールが、前記ウェブサイトの前記複数の文書内の前記ウィキペディア概念を用いて前記ウェブサイトの前記データベースに関連付けられた逆索引を生成するステップであって、ここで前記逆索引は前記ウィキペディア概念を前記ウィキペディアカテゴリにマップする、生成するステップと、
前記類似性演算モジュールが、参照されるウィキペディア概念の前記マップ、前記類似性スコア、及び、各レベルについて前記レベルに分類されたウィキペディア概念のいずれが前記概念のうちの前記最も有意な概念を有するのかという前記決定を用いて、前記逆索引を更新するステップと、
前記類似性演算モジュールが、前記ウェブサイト上でユーザによって実行される入力に関連付けられた前記複数の文書のうちの少なくとも一つの示唆される文書を前記ウェブサイトにアクセスしているユーザに対して出力するステップであって、ここで前記少なくとも一つの示唆される文書は、前記更新された逆索引に基づく1つ以上の前記ウィキペディアカテゴリ又は前記ウィキペディア概念へ案内する、出力するステップと、
を含む、マシン実装方法。 - 前記ウィキペディアカテゴリの部分集合が循環機構を有し、
前記マシン実装方法が、
階層エクストラクタフィルタモジュールが、前記カテゴリランク演算モジュールが前記ウィキペディアカテゴリを分類する前に、前記ウィキペディアカテゴリの前記部分集合について、前記循環機構を解消するステップ、
を更に含む、請求項1に記載のマシン実装方法。 - 概念重要性演算モジュールが、ユーザからの前記入力を受信するステップと、
前記概念重要性演算モジュールが、前記入力を分析して、前記入力により示唆されるウィキペディア概念の第1の集合を識別するステップと、
階層エクストラクタフィルタモジュールが、参照されるウィキペディア概念の前記マップを介して前記ウィキペディア概念の第1の集合を参照して、前記ウィキペディア概念の第1の集合に関連する追加のウィキペディア概念を識別するステップと、
を更に含む、請求項1に記載のマシン実装方法。 - 概念重要性演算モジュールが、ユーザからの前記入力を受信するステップと、
前記概念重要性演算モジュールが、前記入力を分析して、前記入力により示唆されるウィキペディア概念の第1の集合を識別するステップと、
前記概念重要性演算モジュールが、前記第1の集合内の各ウィキペディア概念が閾値となるページランク概念を超えるかどうかに従って、前記ウィキペディア概念の第1の集合を低減して、有意なページランクを有する低減されたウィキペディア概念の集合を形成するステップと、
を更に含む、請求項1に記載のマシン実装方法。 - 前記マシン実装方法が、
人気抽出モジュールが、統計を分析して、各ウィキペディア概念について利用人気を識別するステップ、
を更に含み、
前記ウィキペディア概念の集合を形成するステップは、
前記ウィキペディア概念の第1の集合に対して利用人気閾値を適用することにより、前記利用人気閾値を超える利用人気を有する前記第1の集合内のウィキペディア概念のみが前記低減されたウィキペディア概念の集合に属することができるようにすること、を更に含む、請求項4に記載のマシン実装方法。 - 前記階層エクストラクタフィルタモジュールが、全て大文字でない文字を用いて各ウィキペディアのカテゴリから文字列を形成するステップと、
前記階層エクストラクタフィルタモジュールが、全ての前記ウィキペディアのカテゴリから得た前記文字列を比較して、同一の文字列を有するウィキペディアのカテゴリを識別するステップと、
前記階層エクストラクタフィルタモジュールが、前記同一の文字列を有するいずれのウィキペディアのカテゴリも、対応するマージ済みの単一のウィキペディアのカテゴリへとマージするステップと、
を更に含む、請求項2に記載のマシン実装方法。 - 概念重要性演算モジュールが、ユーザからテキスト入力を受信するステップと、
前記概念重要性演算モジュールが、前記テキスト入力内の言葉と前記更新された逆索引とを比較して、前記テキスト入力に関連するウィキペディアの概念の集合を識別するステップと、
を更に含む、請求項1に記載のマシン実装方法。 - 前記概念重要性演算モジュールが、前記関連するウィキペディアの概念と前記分類されたウィキペディアのカテゴリの集合とを、前記最も有意なウィキペディアの概念を有する各レベルについて比較して、前記関連するウィキペディアの概念を含む分類されたウィキペディアのカテゴリの低減された集合を識別するステップ、
を更に含む、請求項7に記載のマシン実装方法。 - 前記類似性演算モジュールが、前記関連するウィキペディアの概念の集合と前記分類されたウィキペディアのカテゴリの低減された集合とを使用して、前記ユーザに対して前記ユーザのテキスト入力に関連する内容を提示するステップ、
を更に含む、請求項8に記載のマシン実装方法。 - 前記類似性演算モジュールが、前記参照されるウィキペディア概念のマップを分析して、各ウィキペディア概念から前記参照されるウィキペディア概念と、全ての残りのウィキペディア概念に対して参照されるウィキペディア概念との間のいずれの共通部分も識別するステップ、
を更に含む、請求項1に記載のマシン実装方法。 - ウィキペディア概念を解析して、各ウィキペディア概念について前記ウィキペディア概念がハイパーリンクする全ての他のウィキペディア概念を識別し、各ウィキペディア概念について全ての参照されるウィキペディア概念を列挙した概念参照マップを生成するよう構成された、パーサモジュールであって、ここで前記ウィキペディア概念が、ウェブサイトのデータベース内の前記ウィキペディア概念用の複数の文書に関連付けられたオンライン百科事典を備えるウェブサイトに含まれている、パーサモジュールと、
ウィキペディア内の、同じ言葉で表現されるが異なるテキストページに対応するウィキペディア概念を列挙する全ての曖昧さ回避ページを識別するよう構成された、曖昧さ回避ページエクストラクタモジュールと、
前記参照されるウィキペディア概念の前記マップをフィルタリングして、曖昧さ回避ページを除去することにより、フィルタリング済みウィキペディア概念参照マップを形成するよう構成された、曖昧さ回避モジュールと、
前記フィルタリング済みウィキペディア概念参照マップを処理して、前記ウィキペディア概念を前記ウィキペディア概念の類似物にマップし、前記全ての他のウィキペディア概念及び前記ウィキペディア概念内のすべての前記参照されるウィキペディア概念の和集合ごとに、前記全ての他のウィキペディア概念と前記ウィキペディア概念との間の類似性スコアを、前記全ての他のウィキペディア概念と前記ウィキペディア概念との間の前記される参照ウィキペディア概念の共通部分の比として決定するよう構成された、類似性演算モジュールと、
を含み、
前記類似性演算モジュールは、更に、前記ウェブサイトの前記複数の文書内の前記ウィキペディア概念を用いて前記ウェブサイトの前記データベースに関連付けられた逆索引を生成し、ここで前記逆索引は前記ウィキペディア概念を前記ウィキペディアの概念の類似物にマップし、前記フィルタリング済みウィキペディア概念参照マップ及び前記類似性スコアを用いて前記逆索引を更新し、前記ウェブ上でユーザによって実行される入力に関連付けられた前記複数の文書のうちの少なくとも一つの示唆される文書を前記ウェブサイトにアクセスしているユーザに対して出力し、ここで前記少なくとも一つの示唆された文書は、前記更新された逆索引に基づく1つ以上の前記ウィキペディアの概念へ案内する、システム。 - ユーザからの前記入力を処理して前記入力に関連するウィキペディア概念の集合を識別し、類似性重み付けウィキペディア概念のリストに関して前記ウィキペディア概念の集合を更に処理して前記ウィキペディア概念の集合に関連するウィキペディア概念の集合を識別するように構成される概念重要性演算モジュールを更に備える、請求項11に記載のシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361910000P | 2013-11-27 | 2013-11-27 | |
US61/910,000 | 2013-11-27 | ||
PCT/US2014/067479 WO2015081131A1 (en) | 2013-11-27 | 2014-11-25 | Generating resources for support of online services |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016538676A JP2016538676A (ja) | 2016-12-08 |
JP6440733B2 true JP6440733B2 (ja) | 2018-12-19 |
Family
ID=53199616
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016556247A Active JP6440733B2 (ja) | 2013-11-27 | 2014-11-25 | オンラインサービスのサポートのためのリソース生成 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9646099B2 (ja) |
EP (1) | EP3074890A4 (ja) |
JP (1) | JP6440733B2 (ja) |
KR (1) | KR101778901B1 (ja) |
CN (1) | CN105378729A (ja) |
WO (1) | WO2015081131A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11610248B1 (en) * | 2019-06-19 | 2023-03-21 | Amazon Technologies, Inc. | Type ambiguity detection system |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6415283B1 (en) * | 1998-10-13 | 2002-07-02 | Orack Corporation | Methods and apparatus for determining focal points of clusters in a tree structure |
US8229957B2 (en) * | 2005-04-22 | 2012-07-24 | Google, Inc. | Categorizing objects, such as documents and/or clusters, with respect to a taxonomy and data structures derived from such categorization |
US20070027772A1 (en) * | 2005-07-28 | 2007-02-01 | Bridge Well Incorporated | Method and system for web page advertising, and method of running a web page advertising agency |
CN1794240A (zh) * | 2006-01-09 | 2006-06-28 | 北京大学深圳研究生院 | 基于自然语言理解的计算机信息检索系统及其检索方法 |
US8468244B2 (en) * | 2007-01-05 | 2013-06-18 | Digital Doors, Inc. | Digital information infrastructure and method for security designated data and with granular data stores |
US7860855B2 (en) * | 2007-02-13 | 2010-12-28 | Sap Ag | Method and system for analyzing similarity of concept sets |
EP2537348A2 (en) * | 2010-02-19 | 2012-12-26 | Thomson Licensing | Enhanced content search |
US8595234B2 (en) * | 2010-05-17 | 2013-11-26 | Wal-Mart Stores, Inc. | Processing data feeds |
US8725739B2 (en) * | 2010-11-01 | 2014-05-13 | Evri, Inc. | Category-based content recommendation |
CN102129479B (zh) * | 2011-04-29 | 2013-01-02 | 南京邮电大学 | 一种基于概率潜在语义分析模型的万维网服务发现方法 |
-
2014
- 2014-11-25 JP JP2016556247A patent/JP6440733B2/ja active Active
- 2014-11-25 KR KR1020167001062A patent/KR101778901B1/ko active IP Right Grant
- 2014-11-25 CN CN201480039648.8A patent/CN105378729A/zh active Pending
- 2014-11-25 WO PCT/US2014/067479 patent/WO2015081131A1/en active Application Filing
- 2014-11-25 EP EP14865510.3A patent/EP3074890A4/en not_active Withdrawn
-
2015
- 2015-09-30 US US14/871,656 patent/US9646099B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016538676A (ja) | 2016-12-08 |
CN105378729A (zh) | 2016-03-02 |
US20160026723A1 (en) | 2016-01-28 |
EP3074890A1 (en) | 2016-10-05 |
EP3074890A4 (en) | 2017-09-06 |
KR101778901B1 (ko) | 2017-09-26 |
KR20160127707A (ko) | 2016-11-04 |
US9646099B2 (en) | 2017-05-09 |
WO2015081131A1 (en) | 2015-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Martinez-Rodriguez et al. | Information extraction meets the semantic web: a survey | |
US10146862B2 (en) | Context-based metadata generation and automatic annotation of electronic media in a computer network | |
US10108720B2 (en) | Automatically providing relevant search results based on user behavior | |
Zhao et al. | Ontology integration for linked data | |
US20100121790A1 (en) | Method, apparatus and computer program product for categorizing web content | |
NO325864B1 (no) | Fremgangsmåte ved beregning av sammendragsinformasjon og en søkemotor for å støtte og implementere fremgangsmåten | |
CN107506472B (zh) | 一种学生浏览网页分类方法 | |
WO2010125463A1 (en) | Method and apparatus for identifying synonyms and using synonyms to search | |
Al-Subaihin et al. | Empirical comparison of text-based mobile apps similarity measurement techniques | |
US20180025012A1 (en) | Web page classification based on noise removal | |
CN111259220B (zh) | 一种基于大数据的数据采集方法和系统 | |
US20170199939A1 (en) | Method of and a system for website ranking using an appeal factor | |
CN112231598A (zh) | 网页路径导航方法、装置、电子设备及存储介质 | |
Bizer et al. | Using the semantic web as a source of training data | |
WO2012091541A1 (en) | A semantic web constructor system and a method thereof | |
JP6440733B2 (ja) | オンラインサービスのサポートのためのリソース生成 | |
Moumtzidou et al. | Discovery of environmental nodes in the web | |
Tourné et al. | Evaluating tag filtering techniques for web resource classification in folksonomies | |
US11507593B2 (en) | System and method for generating queryeable structured document from an unstructured document using machine learning | |
Das et al. | Adaptive web personalization system using splay tree | |
KR20140135100A (ko) | 시맨틱 매쉬업 기술을 이용한 프로그램 제공 방법 | |
US10430852B2 (en) | Social result abstraction based on network analysis | |
Lalitha et al. | Potential Web Content Identification and Classification System using NLP and Machine Learning Techniques | |
US20220147574A9 (en) | Expert stance classification using computerized text analytics | |
Campos et al. | Extracting Context Data from User Reviews for Recommendation: A Linked Data Approach. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151105 |
|
A529 | Written submission of copy of amendment under article 34 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A529 Effective date: 20151201 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170523 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180724 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180809 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181113 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181120 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6440733 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |