JP5540079B2 - 知識ベース構築の方法および装置 - Google Patents
知識ベース構築の方法および装置 Download PDFInfo
- Publication number
- JP5540079B2 JP5540079B2 JP2012508592A JP2012508592A JP5540079B2 JP 5540079 B2 JP5540079 B2 JP 5540079B2 JP 2012508592 A JP2012508592 A JP 2012508592A JP 2012508592 A JP2012508592 A JP 2012508592A JP 5540079 B2 JP5540079 B2 JP 5540079B2
- Authority
- JP
- Japan
- Prior art keywords
- category
- entry
- sentence
- word
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 38
- 238000009411 base construction Methods 0.000 title claims description 3
- 238000007418 data mining Methods 0.000 claims description 45
- 238000012545 processing Methods 0.000 claims description 23
- 230000010354 integration Effects 0.000 claims description 14
- 238000001914 filtration Methods 0.000 claims description 4
- 239000010410 layer Substances 0.000 description 63
- 230000000875 corresponding effect Effects 0.000 description 37
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 4
- 238000005065 mining Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000008570 general process Effects 0.000 description 1
- 239000002346 layers by function Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3338—Query expansion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
本出願は、2009年4月29日に出願された、発明の名称が「METHOD AND APPARATUS OF KNOWLEDGE BASE BUILDING」である、中国特許出願第200910136206.6号の優先権の利益を主張し、参照によってその全体が本明細書に組み込まれる。
Claims (16)
- コンピューティング装置を使用する、知識ベース構築の方法であって、
前記コンピューティング装置の基本データ処理層を使用して、ウェブページから文を取得することと、
前記コンピューティング装置のデータマイニング層を使用して、前記取得された文を単語に解析することと、
知識ベースの第1のカテゴリ内の1つまたは複数の代表的な単語を、前記取得された文から解析された前記単語と照合することと、
前記代表的な単語のうちの1つと、前記取得された文から解析された前記単語のうちの1つとの間に一致が存在する場合、前記取得された文中の前記一致された単語に隣接する単語の列を、第1のエントリとして前記第1のカテゴリに追加することと、
前記取得された文から解析された前記単語を、前記知識ベースの第2のカテゴリの第2のエントリと一致するときに、前記第1のカテゴリと前記第2のカテゴリとの間に確立された相関関係が存在するか否かを判定することと、
前記第1のカテゴリと前記第2のカテゴリとの間に確立された相関関係が存在すると判定された場合、前記第1のカテゴリの前記第1のエントリと、前記第2のカテゴリの前記第2のエントリとの間の相関関係を確立することと、を含む、方法。 - ウェブページから文を取得することは、前記取得された文を、前記取得された文中の句読点に基づいて、複数のより短い文に分割することを含み、かつ前記取得された文を解析することが、前記取得された文を解析すること、または前記複数のより短い文を解析することを含む、請求項1に記載の方法。
- 前記基本データ処理層が、個々の文の出現の回数を計数することと、
前記データマイニング層が、前記第1のエントリおよび前記第1のエントリに隣接する1つまたは複数の前記代表的な単語を有する、任意の文の出現の回数に基づいて、前記第1のカテゴリの前記第1のエントリの重み付けされた値を確立することと、をさらに含む、請求項1に記載の方法。 - 前記データマイニング層は、前記取得された文を分割するように、前記1つまたは複数の代表的な単語を含む、解析システムを採用する、請求項1に記載の方法。
- 前記知識ベースは、共通単語システムおよび実単語システムを含み、前記共通単語システムおよび前記実単語システムは、それぞれ異なるカテゴリを含み、前記代表的な単語は、前記実単語システムのカテゴリ対応インデックスワードと、前記共通単語システムのカテゴリ対応シードワードとを含み、前記取得された文中の前記一致した単語に隣接する前記単語の列が、前記第1のエントリとして前記第1のカテゴリに追加されると、前記単語の列が、前記第1のカテゴリを含む前記共通単語システムまたは前記実単語システムに追加される、請求項1に記載の方法。
- 前記第1のカテゴリが、前記共通単語システム内に含まれる前記カテゴリのうちの1つである場合、
前記第1のエントリを、前記第1のカテゴリに対応する前記シードワードとして設定することをさらに含む、請求項5に記載の方法。 - 前記第1のカテゴリの前記第1のエントリと、前記第2のカテゴリの前記第2のエントリとの間の相関関係を確立することは、
前記第1のエントリおよび前記第2のエントリの文の出現の頻度を得ることと、
前記第1のエントリおよび前記第2のエントリの文の出現の前記頻度が、所定の閾値を超える場合、前記第1のエントリと第2のエントリとの間の相関関係を確立することと、
を含む、請求項1に記載の方法。 - 各カテゴリおよび各カテゴリの下の各エントリに応じて、それぞれの結果ファイルを作成する、前記データマイニング層と、
複数の結果ファイルを単一の結果ファイルに統合する、前記コンピューティング装置の統合層と、をさらに含む、請求項1に記載の方法。 - 個々の文の出現の回数を計数することと、
1つまたは複数の代表的な単語および前記第1のエントリを有する、任意の文の出現の回数に基づいて、前記第1のカテゴリの前記第1のエントリの重み付けされた値を確立することと、
異なるカテゴリの下の個々のエントリの重み付けされた値を比較することと、
エントリ対応カテゴリを、フィルタにかけることと、をさらに含む、請求項8に記載の方法。 - 前記ウェブページからテーブルを取得することと、
前記第1のエントリのプロパティとして、前記第1のエントリと対になってテーブル内に複数回出現する単語を属性化することと、をさらに含む、請求項1に記載の方法。 - ウェブページから文を取得することは、前記ウェブページから、特殊記号を含む文を取得することを含む、請求項1に記載の方法。
- コンピュータにより実行される情報検索の方法であって、
該コンピュータが、
知識ベースにおいて、1つまたは複数のキーワードに関連するウェブページおよびエントリ内の前記1つまたは複数のキーワードに基づいて、ユーザによって入力された検索語句と関連する、ラベルを識別することと、
前記ラベルに対応する前記ウェブページを検索することと、
前記ユーザに、前記ウェブページまたは前記ウェブページへのリンクを提供することと、を含む各ステップを実行するように構成され、
前記知識ベースは、
コンピューティング装置の基本データ処理層を使用して、複数のウェブページのうちの1つから文を取得することと、
前記コンピューティング装置のデータマイニング層を使用して、前記取得された文を単語に解析することと、
前記知識ベースの第1のカテゴリ内の1つまたは複数の代表的な単語を、前記取得された文から解析された前記単語と、照合することと、
前記代表的な単語のうちの1つと、前記取得された文から解析された前記単語のうちの1つとの間に一致が存在する場合、前記取得された文中の前記一致した単語に隣接する単語の列を、第1のエントリとして前記第1のカテゴリに追加することと、
前記取得された文から解析された前記単語を、前記知識ベースの第2のカテゴリの第2のエントリと一致するときに、前記第1のカテゴリと前記第2のカテゴリとの間に、確立された相関関係が存在するか否かを判定することと、
前記第1のカテゴリと前記第2のカテゴリとの間に、確立された相関関係が存在すると判定された場合、前記第1のカテゴリの前記第1のエントリと、前記第2のカテゴリの前記第2のエントリとの間の相関関係を確立することと、によって構築されることを特徴とする方法。 - コンピュータにより実行される情報検索の方法であって、
該コンピュータが、
知識ベースのエントリを使用して、ユーザによって入力された検索語句を解析することと、
前記検索語句から解析された単語を、前記知識ベースの前記エントリと照合することと、
前記検索語句から解析された単語との一致を有するエントリに関連する、前記知識ベースのエントリを識別することと、
前記検索語句を、前記検索語句から解析された単語との一致を有する前記エントリに関連する、前記知識ベースのエントリで更新することと、
前記更新された検索語句に基づいて、検索を実施することと、を含む各ステップを実行するように構成され、
前記知識ベースは、
コンピューティング装置の基本データ処理層を使用して、ウェブページから文を取得することと、
前記コンピューティング装置のデータマイニング層を使用して、前記取得された文を単語に解析することと、
前記知識ベースの第1のカテゴリ内の1つまたは複数の代表的な単語を、前記取得された文から解析された前記単語と、照合することと、
前記代表的な単語のうちの1つと、前記取得された文から解析された前記単語のうちの1つとの間に一致が存在する場合、前記取得された文中の一致した単語に隣接する単語の列を、第1のエントリとして前記第1のカテゴリに追加することと、
前記取得された文から解析された前記単語を、前記知識ベースの第2のカテゴリの第2のエントリと一致するときに、前記第1のカテゴリと前記第2のカテゴリとの間に、確立された相関関係が存在するか否かを判定することと、
前記第1のカテゴリと前記第2のカテゴリとの間に、確立された相関関係が存在すると判定された場合、前記第1のカテゴリの前記第1のエントリと、前記第2のカテゴリの前記第2のエントリとの間の相関関係を確立することと、によって構築されることを特徴とする方法。 - 知識ベースを構築する、コンピューティング装置であって、当該コンピューティング装置は、
ウェブページから、1つまたは複数の文を取得する、基本データ処理モジュールと、
前記ウェブページから取得された前記1つまたは複数の文を解析する、データマイニングモジュールと、を備え、
前記データマイニングモジュールは、さらに、
前記知識ベースの第1のカテゴリ内の、1つまたは複数の代表的な単語を、前記取得された文から解析された前記単語と照合し、
前記代表的な単語のうちの1つと、前記取得された文から解析された前記単語のうちの1つとの間に一致が存在する場合、前記取得された文中の一致した単語に隣接する単語の列を、第1のエントリとして前記第1のカテゴリに追加し、
前記取得された文から解析された前記単語を、前記知識ベースの第2のカテゴリの第2のエントリと一致するときに、前記第1のカテゴリと、前記第2のカテゴリとの間に、確立された相関関係が存在するか否かを判定し、
前記第1のカテゴリと前記第2のカテゴリとの間に、確立された相関関係が存在すると判定された場合、前記第1のカテゴリの前記第1のエントリと、前記第2のカテゴリの前記第2のエントリとの間の相関関係を確立する、コンピューティング装置。 - 検索プログラムであって、
該検索プログラムはコンピュータを、
ユーザによって入力された検索語句に対応するラベルを識別する、第1のクエリーモジュールと、
前記ラベルに対応するウェブページを識別する、第2のクエリーモジュールと、
前記ユーザに、前記ウェブページまたは前記ウェブページへのリンクを提供する、インターフェースモジュールと、
1つまたは複数のキーワードに関連する、知識ベースの前記ウェブページおよびエントリの、前記1つまたは複数のキーワードに基づいて、前記ウェブページに対応するラベルを作成する、ラベル作成モジュールと、
して機能させるように構成され、
前記知識ベースは、
コンピューティング装置の基本データ処理層を使用して、複数のウェブページのうちの1つから文を取得することと、
前記コンピューティング装置のデータマイニング層を使用して、前記取得された文を単語に解析することと、
前記知識ベースの第1のカテゴリ内の1つまたは複数の代表的な単語を、前記取得された文から解析された前記単語と、照合することと、
前記代表的な単語のうちの1つと、前記取得された文から解析された前記単語のうちの1つとの間に一致が存在する場合、前記取得された文中の前記一致した単語に隣接する単語の列を、第1のエントリとして前記第1のカテゴリに追加することと、
前記取得された文から解析された前記単語を、前記知識ベースの第2のカテゴリの第2のエントリと一致するときに、前記第1のカテゴリと前記第2のカテゴリとの間に、確立された相関関係が存在するか否かを判定することと、
前記第1のカテゴリと前記第2のカテゴリとの間に、確立された相関関係が存在すると判定された場合、前記第1のカテゴリの前記第1のエントリと、前記第2のカテゴリの前記第2のエントリとの間の相関関係を確立することと、によって構築されることを特徴とする検索プログラム。 - 検索プログラムであって、
該検索プログラムはコンピュータを、
ユーザ入力検索語句を、知識ベースのエントリに基づいて、単語に解析する、解析モジュールと、
前記検索語句から解析された単語を、前記知識ベースの前記エントリと照合する、照合モジュールと、
前記検索語句から解析された単語との一致を有するエントリに関連する、前記知識ベースのエントリを識別する、クエリーモジュールと、
前記検索語句から解析された単語との一致を有する前記エントリに関連する、前記知識ベースのエントリで、前記検索語句を更新する、更新モジュールと、
前記更新された検索語句に基づいて、検索を実施する、検索モジュールと、
して機能させるように構成され、
前記知識ベースは、
コンピューティング装置の基本データ処理層を使用して、ウェブページから文を取得することと、
前記コンピューティング装置のデータマイニング層を使用して、前記取得された文を単語に解析することと、
前記知識ベースの第1のカテゴリ内の1つまたは複数の代表的な単語を、前記取得された文から解析された前記単語と、照合することと、
前記代表的な単語のうちの1つと、前記取得された文から解析された前記単語のうちの1つとの間に一致が存在する場合、前記取得された文中の一致した単語に隣接する単語の列を、第1のエントリとして前記第1のカテゴリに追加することと、
前記取得された文から解析された前記単語を、前記知識ベースの第2のカテゴリの第2のエントリと一致するときに、前記第1のカテゴリと前記第2のカテゴリとの間に、確立された相関関係が存在するか否かを判定することと、
前記第1のカテゴリと前記第2のカテゴリとの間に、確立された相関関係が存在すると判定された場合、前記第1のカテゴリの前記第1のエントリと、前記第2のカテゴリの前記第2のエントリとの間の相関関係を確立することと、によって構築されることを特徴とする検索プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200910136206.6 | 2009-04-29 | ||
CN200910136206.6A CN101876981B (zh) | 2009-04-29 | 2009-04-29 | 一种构建知识库的方法及装置 |
PCT/US2010/032581 WO2010126892A1 (en) | 2009-04-29 | 2010-04-27 | Method and apparatus of knowledge base building |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012525645A JP2012525645A (ja) | 2012-10-22 |
JP5540079B2 true JP5540079B2 (ja) | 2014-07-02 |
Family
ID=43019539
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012508592A Active JP5540079B2 (ja) | 2009-04-29 | 2010-04-27 | 知識ベース構築の方法および装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20110060734A1 (ja) |
EP (1) | EP2425355A4 (ja) |
JP (1) | JP5540079B2 (ja) |
CN (1) | CN101876981B (ja) |
HK (1) | HK1148090A1 (ja) |
WO (1) | WO2010126892A1 (ja) |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102780724B (zh) * | 2011-05-12 | 2016-02-10 | 阿里巴巴集团控股有限公司 | 一种类目信息的发送方法、系统及设备 |
US9633109B2 (en) | 2011-05-17 | 2017-04-25 | Etsy, Inc. | Systems and methods for guided construction of a search query in an electronic commerce environment |
CN102722515B (zh) * | 2011-12-30 | 2017-12-29 | 新奥特(北京)视频技术有限公司 | 一种比赛现场信息数据挖掘的方法 |
CN103793440B (zh) * | 2012-11-02 | 2018-03-27 | 阿里巴巴集团控股有限公司 | 信息显示方法和装置 |
US9754046B2 (en) | 2012-11-09 | 2017-09-05 | Microsoft Technology Licensing, Llc | Taxonomy driven commerce site |
US9146994B2 (en) | 2013-03-15 | 2015-09-29 | International Business Machines Corporation | Pivot facets for text mining and search |
CN104077295A (zh) * | 2013-03-27 | 2014-10-01 | 百度在线网络技术(北京)有限公司 | 一种数据标签的挖掘方法及系统 |
CN103353894A (zh) * | 2013-07-19 | 2013-10-16 | 武汉睿数信息技术有限公司 | 一种基于语义分析的数据搜索方法和系统 |
CN103440343B (zh) * | 2013-09-11 | 2014-11-05 | 武汉大学 | 一种面向领域服务目标的知识库构建方法 |
CN103646025B (zh) * | 2013-10-24 | 2016-08-17 | 三星电子(中国)研发中心 | 一种基于推理的层级知识库构建系统和方法 |
CN103593690B (zh) * | 2013-11-25 | 2017-08-08 | 北京光年无限科技有限公司 | 用户智能标签系统 |
CN104679783B (zh) * | 2013-11-29 | 2019-08-02 | 北京搜狗信息服务有限公司 | 一种网络搜索方法和装置 |
CN104008186B (zh) * | 2014-06-11 | 2018-10-16 | 北京京东尚科信息技术有限公司 | 从目标文本中确定关键词的方法和装置 |
CN104102739B (zh) * | 2014-07-28 | 2018-03-06 | 百度在线网络技术(北京)有限公司 | 一种扩充实体库的方法及装置 |
US20160078038A1 (en) * | 2014-09-11 | 2016-03-17 | Sameep Navin Solanki | Extraction of snippet descriptions using classification taxonomies |
WO2016089110A1 (ko) * | 2014-12-02 | 2016-06-09 | 주식회사 솔트룩스 | 엔트리 기반 지식자원 생성 장치 및 방법 |
CN106202105A (zh) * | 2015-05-06 | 2016-12-07 | 阿里巴巴集团控股有限公司 | 一种电子商务网站导航方法及装置 |
CN104991920A (zh) * | 2015-06-25 | 2015-10-21 | 走遍世界(北京)信息技术有限公司 | 标签的生成方法及装置 |
CN105468780B (zh) * | 2015-12-18 | 2019-01-29 | 北京理工大学 | 一种微博文本中产品名实体的规范化方法及装置 |
US10394956B2 (en) | 2015-12-31 | 2019-08-27 | Shanghai Xiaoi Robot Technology Co., Ltd. | Methods, devices, and systems for constructing intelligent knowledge base |
US10754914B2 (en) * | 2016-08-24 | 2020-08-25 | Robert Bosch Gmbh | Method and device for unsupervised information extraction |
CN106294186A (zh) * | 2016-08-30 | 2017-01-04 | 深圳市悲画软件自动化技术有限公司 | 智能软件自动化测试方法 |
CN108121722A (zh) * | 2016-11-28 | 2018-06-05 | 渡鸦科技(北京)有限责任公司 | 知识库的构建方法及装置 |
CN106649661A (zh) * | 2016-12-13 | 2017-05-10 | 税云网络科技服务有限公司 | 知识库构建方法和装置 |
CN106649813B (zh) * | 2016-12-29 | 2020-02-21 | 中南大学 | 一种基于环境感知与用户反馈的垂直领域知识库构建方法 |
WO2020010931A1 (zh) * | 2018-07-09 | 2020-01-16 | 深圳追一科技有限公司 | 生成相似问句的方法、装置、计算机设备和存储介质 |
CN110727786A (zh) * | 2019-09-12 | 2020-01-24 | 武汉儒松科技有限公司 | 自学习的知识库管理方法、装置、终端设备及存储介质 |
CN112783889A (zh) * | 2019-11-07 | 2021-05-11 | 中国石油化工股份有限公司 | 用于建立变更风险控制措施库的方法和装置 |
CN111061884B (zh) * | 2019-11-14 | 2023-11-21 | 临沂市拓普网络股份有限公司 | 一种基于DeepDive技术构建K12教育知识图谱的方法 |
CN111159350B (zh) * | 2019-12-30 | 2022-12-06 | 科大讯飞股份有限公司 | 用户说法挖掘扩增方法、装置、终端及存储介质 |
CN112860866B (zh) * | 2021-02-09 | 2023-09-19 | 北京百度网讯科技有限公司 | 语义检索方法、装置、设备以及存储介质 |
CN113158688B (zh) * | 2021-05-11 | 2023-12-01 | 科大讯飞股份有限公司 | 一种领域知识库构建方法、装置、设备及存储介质 |
CN113255610B (zh) * | 2021-07-02 | 2022-02-18 | 浙江大华技术股份有限公司 | 特征底库构建、特征检索方法以及相关装置 |
CN117891851B (zh) * | 2024-03-18 | 2024-06-11 | 青岛创新奇智科技集团股份有限公司 | 一种基于人工智能的知识库分析方法及系统 |
Family Cites Families (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3266246B2 (ja) * | 1990-06-15 | 2002-03-18 | インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン | 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法 |
US5371807A (en) * | 1992-03-20 | 1994-12-06 | Digital Equipment Corporation | Method and apparatus for text classification |
JP3350556B2 (ja) * | 1992-04-20 | 2002-11-25 | 株式会社リコー | 検索システム |
US5717913A (en) * | 1995-01-03 | 1998-02-10 | University Of Central Florida | Method for detecting and extracting text data using database schemas |
US6006221A (en) * | 1995-08-16 | 1999-12-21 | Syracuse University | Multilingual document retrieval system and method using semantic vector matching |
US6038560A (en) * | 1997-05-21 | 2000-03-14 | Oracle Corporation | Concept knowledge base search and retrieval system |
US5940821A (en) * | 1997-05-21 | 1999-08-17 | Oracle Corporation | Information presentation in a knowledge base search and retrieval system |
US6269368B1 (en) * | 1997-10-17 | 2001-07-31 | Textwise Llc | Information retrieval using dynamic evidence combination |
US5953718A (en) * | 1997-11-12 | 1999-09-14 | Oracle Corporation | Research mode for a knowledge base search and retrieval system |
US20010037328A1 (en) * | 2000-03-23 | 2001-11-01 | Pustejovsky James D. | Method and system for interfacing to a knowledge acquisition system |
US20020123994A1 (en) * | 2000-04-26 | 2002-09-05 | Yves Schabes | System for fulfilling an information need using extended matching techniques |
US7007008B2 (en) * | 2000-08-08 | 2006-02-28 | America Online, Inc. | Category searching |
US20020065671A1 (en) * | 2000-09-12 | 2002-05-30 | Goerz David J. | Method and system for project customized business to business development with indexed knowledge base |
US7185001B1 (en) * | 2000-10-04 | 2007-02-27 | Torch Concepts | Systems and methods for document searching and organizing |
EP1346559A4 (en) * | 2000-11-16 | 2006-02-01 | Mydtv Inc | SYSTEM AND METHOD FOR DETERMINING THE POPULARITY OF VIDEO PROGRAM EVENTS |
US20070016563A1 (en) * | 2005-05-16 | 2007-01-18 | Nosa Omoigui | Information nervous system |
US6965900B2 (en) * | 2001-12-19 | 2005-11-15 | X-Labs Holdings, Llc | Method and apparatus for electronically extracting application specific multidimensional information from documents selected from a set of documents electronically extracted from a library of electronically searchable documents |
US20030115188A1 (en) * | 2001-12-19 | 2003-06-19 | Narayan Srinivasa | Method and apparatus for electronically extracting application specific multidimensional information from a library of searchable documents and for providing the application specific information to a user application |
US6834274B2 (en) * | 2002-01-07 | 2004-12-21 | Dennis W. Tafoya | Building a learning organization using knowledge management |
CN1389811A (zh) * | 2002-02-06 | 2003-01-08 | 北京造极人工智能技术有限公司 | 搜索引擎的智能化搜索方法 |
US8015143B2 (en) * | 2002-05-22 | 2011-09-06 | Estes Timothy W | Knowledge discovery agent system and method |
CA2487739A1 (en) * | 2002-05-28 | 2003-12-04 | Vladimir Vladimirovich Nasypny | Method for synthesising a self-learning system for knowledge acquisition for text-retrieval systems |
US7131117B2 (en) * | 2002-09-04 | 2006-10-31 | Sbc Properties, L.P. | Method and system for automating the analysis of word frequencies |
US20040093331A1 (en) * | 2002-09-20 | 2004-05-13 | Board Of Regents, University Of Texas System | Computer program products, systems and methods for information discovery and relational analyses |
US7412453B2 (en) * | 2002-12-30 | 2008-08-12 | International Business Machines Corporation | Document analysis and retrieval |
GB0303018D0 (en) * | 2003-02-10 | 2003-03-12 | British Telecomm | Information retreival |
US7146361B2 (en) * | 2003-05-30 | 2006-12-05 | International Business Machines Corporation | System, method and computer program product for performing unstructured information management and automatic text analysis, including a search operator functioning as a Weighted AND (WAND) |
US7409336B2 (en) * | 2003-06-19 | 2008-08-05 | Siebel Systems, Inc. | Method and system for searching data based on identified subset of categories and relevance-scored text representation-category combinations |
TWI290687B (en) * | 2003-09-19 | 2007-12-01 | Hon Hai Prec Ind Co Ltd | System and method for search information based on classifications of synonymous words |
KR100533810B1 (ko) * | 2003-10-16 | 2005-12-07 | 한국전자통신연구원 | 백과사전 질의응답 시스템의 지식베이스 반자동 구축 방법 |
US7558792B2 (en) * | 2004-06-29 | 2009-07-07 | Palo Alto Research Center Incorporated | Automatic extraction of human-readable lists from structured documents |
US7620628B2 (en) * | 2004-12-06 | 2009-11-17 | Yahoo! Inc. | Search processing with automatic categorization of queries |
JP2006178671A (ja) * | 2004-12-21 | 2006-07-06 | Nippon Telegr & Teleph Corp <Ntt> | 同義語対抽出方法、同義語対抽出装置、同義語対抽出プログラム、及び同義語対抽出プログラム記録媒体 |
US20060161520A1 (en) * | 2005-01-14 | 2006-07-20 | Microsoft Corporation | System and method for generating alternative search terms |
US8438499B2 (en) * | 2005-05-03 | 2013-05-07 | Mcafee, Inc. | Indicating website reputations during user interactions |
US7562304B2 (en) * | 2005-05-03 | 2009-07-14 | Mcafee, Inc. | Indicating website reputations during website manipulation of user information |
US7548929B2 (en) * | 2005-07-29 | 2009-06-16 | Yahoo! Inc. | System and method for determining semantically related terms |
WO2007047464A2 (en) * | 2005-10-14 | 2007-04-26 | Uptodate Inc. | Method and apparatus for identifying documents relevant to a search query |
JP4172801B2 (ja) * | 2005-12-02 | 2008-10-29 | インターナショナル・ビジネス・マシーンズ・コーポレーション | テキストからキーワードを検索する効率的なシステム、および、その方法 |
US7644052B1 (en) * | 2006-03-03 | 2010-01-05 | Adobe Systems Incorporated | System and method of building and using hierarchical knowledge structures |
CN101046809A (zh) * | 2006-03-28 | 2007-10-03 | 吴风勇 | 基于关联规则模式的新词识别方法 |
CN1983255A (zh) * | 2006-05-17 | 2007-06-20 | 唐红春 | 一种互联网搜索方法 |
US7752243B2 (en) * | 2006-06-06 | 2010-07-06 | University Of Regina | Method and apparatus for construction and use of concept knowledge base |
US7792967B2 (en) * | 2006-07-14 | 2010-09-07 | Chacha Search, Inc. | Method and system for sharing and accessing resources |
US20080040653A1 (en) * | 2006-08-14 | 2008-02-14 | Christopher Levine | System and methods for managing presentation and behavioral use of web display content |
CN100530187C (zh) * | 2007-01-12 | 2009-08-19 | 宋晓伟 | 搜索请求转换为查询语句的方法 |
CN100498790C (zh) * | 2007-02-06 | 2009-06-10 | 腾讯科技(深圳)有限公司 | 一种搜索方法和系统 |
JP4793931B2 (ja) * | 2007-03-08 | 2011-10-12 | 日本電信電話株式会社 | 相互に関係する固有表現の組抽出装置及びその方法 |
US8122360B2 (en) * | 2007-06-27 | 2012-02-21 | Kosmix Corporation | Automatic selection of user-oriented web content |
WO2009005648A1 (en) * | 2007-07-02 | 2009-01-08 | Qin Zhang | A system and method for information processing and motor control |
CN101339551B (zh) * | 2007-07-05 | 2013-01-30 | 日电(中国)有限公司 | 自然语言查询需求扩展设备及其方法 |
US8452725B2 (en) * | 2008-09-03 | 2013-05-28 | Hamid Hatami-Hanza | System and method of ontological subject mapping for knowledge processing applications |
US8838659B2 (en) * | 2007-10-04 | 2014-09-16 | Amazon Technologies, Inc. | Enhanced knowledge repository |
-
2009
- 2009-04-29 CN CN200910136206.6A patent/CN101876981B/zh active Active
-
2010
- 2010-04-27 JP JP2012508592A patent/JP5540079B2/ja active Active
- 2010-04-27 WO PCT/US2010/032581 patent/WO2010126892A1/en active Application Filing
- 2010-04-27 EP EP10770204.5A patent/EP2425355A4/en not_active Withdrawn
- 2010-04-27 US US12/863,683 patent/US20110060734A1/en not_active Abandoned
-
2011
- 2011-03-03 HK HK11102176.9A patent/HK1148090A1/xx unknown
Also Published As
Publication number | Publication date |
---|---|
EP2425355A4 (en) | 2016-06-01 |
EP2425355A1 (en) | 2012-03-07 |
WO2010126892A1 (en) | 2010-11-04 |
JP2012525645A (ja) | 2012-10-22 |
CN101876981B (zh) | 2015-09-23 |
HK1148090A1 (en) | 2011-08-26 |
CN101876981A (zh) | 2010-11-03 |
US20110060734A1 (en) | 2011-03-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5540079B2 (ja) | 知識ベース構築の方法および装置 | |
TWI512506B (zh) | Sorting method and device for search results | |
JP5575902B2 (ja) | クエリのセマンティックパターンに基づく情報検索 | |
CN107180093B (zh) | 信息搜索方法及装置和时效性查询词识别方法及装置 | |
CN110795627B (zh) | 信息推荐方法及装置、电子设备 | |
US20160357860A1 (en) | Natural language search results for intent queries | |
US10169449B2 (en) | Method, apparatus, and server for acquiring recommended topic | |
US9619571B2 (en) | Method for searching related entities through entity co-occurrence | |
CN111061750A (zh) | 一种查询处理方法、装置及计算机可读存储介质 | |
JP6355840B2 (ja) | ストップワード識別方法および装置 | |
US9984166B2 (en) | Systems and methods of de-duplicating similar news feed items | |
US8793120B1 (en) | Behavior-driven multilingual stemming | |
EP2480995A1 (en) | Searching for information based on generic attributes of the query | |
CN105389328B (zh) | 一种大规模开源软件搜索排序优化方法 | |
CN111930949B (zh) | 搜索串处理方法、装置、计算机可读介质及电子设备 | |
CN116501733A (zh) | 数据产品的生成方法、装置、设备及存储介质 | |
CN108255885B (zh) | 一种歌曲的推荐方法及系统 | |
JP5346991B2 (ja) | コンテンツ出力方法、コンテンツ出力装置およびコンテンツ出力プログラム | |
US11507593B2 (en) | System and method for generating queryeable structured document from an unstructured document using machine learning | |
KR102710905B1 (ko) | 문서를 요약하는 장치, 방법 및 컴퓨터 프로그램 | |
CN110909128B (zh) | 一种利用词根表进行数据查询的方法、设备、及存储介质 | |
TWI517058B (zh) | Method and Device for Constructing Knowledge Base | |
CN108268552B (zh) | 网站信息的处理方法及装置 | |
CN114692614A (zh) | 标题生成方法、装置、电子设备及可读存储介质 | |
TW201502814A (zh) | 資訊檢索系統及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130329 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140401 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5540079 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140501 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |