JP6284643B2 - 非構造化テキストにおける特徴の曖昧性除去方法 - Google Patents
非構造化テキストにおける特徴の曖昧性除去方法 Download PDFInfo
- Publication number
- JP6284643B2 JP6284643B2 JP2016536850A JP2016536850A JP6284643B2 JP 6284643 B2 JP6284643 B2 JP 6284643B2 JP 2016536850 A JP2016536850 A JP 2016536850A JP 2016536850 A JP2016536850 A JP 2016536850A JP 6284643 B2 JP6284643 B2 JP 6284643B2
- Authority
- JP
- Japan
- Prior art keywords
- feature
- node
- features
- primary
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 107
- 238000000605 extraction Methods 0.000 claims description 22
- 230000006870 function Effects 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 3
- 230000008569 process Effects 0.000 description 34
- 238000012549 training Methods 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 4
- 208000001490 Dengue Diseases 0.000 description 3
- 206010012310 Dengue fever Diseases 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 208000025729 dengue disease Diseases 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000013523 data management Methods 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 208000035473 Communicable disease Diseases 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Evolutionary Biology (AREA)
- Public Health (AREA)
- Biotechnology (AREA)
- Epidemiology (AREA)
- Bioethics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biophysics (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Computing Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
ここで使用する次の用語は、次のような定義を有する。
添付図面に各々示された好ましい実施形態を以下に詳細に説明する。上述した実施形態は、例示に過ぎない。当業者であれば、ここに述べる特定の実施例について、本発明の範囲内で、多数の別のコンポーネント及び実施形態に置き換えできることが認識されよう。
図2は、一実施形態により、方法100(図1)の特徴曖昧性除去ステップ108の非構造化テキストに使用される曖昧性除去サブモジュールにより遂行されるプロセス200のフローチャートである。曖昧性除去プロセス200は、図1のステップ106においてMemDBに特徴を含ませた後に始まる。ステップ202において与えられる抽出された特徴は、ステップ204において候補サーチを遂行するのに使用され、抽出された特徴についてのサーチは、共起特徴を含めて全ての候補レコードを通して遂行される。
図3は、一実施形態により、特徴を曖昧性除去する方法100に使用されるリンクオンザフライ(リンクOTF)サブモジュールにより遂行されるプロセス300のフローチャートである。リンクOTFプロセス300は、情報のフィードを定常的に評価し、スコア付けし、リンクし、そしてクラスター化することができる。リンクOTFサブモジュールは、複数のアルゴリズムを使用してレコードリンケージ206を遂行する。ステップ204の候補サーチ結果は、リンクOTFモジュール300へ定常的にフィードされる。データの入力に続いて、一致スコア付けアルゴリズムが適用され(ステップ302)、ここでは、1つ以上の一致スコア付けアルゴリズムがMemDBの複数のサーチノードに同時に適用される一方、とりわけ、ストリンク編集距離、表音及び意味のような複数の特徴属性を考慮して、関連する結果を評価及びスコア付けするために曖昧キーサーチを遂行する。
401、402:ドキュメント入力モジュール
404:ネットワーク接続
406:ユーザワークステーション
408:MemDBコンピュータ
410:抽出された新たな特徴
411:抽出ノード
412:リンクOTFサブモジュール
Claims (20)
- サーチ質問をエンドユーザ装置から受信することに応答して、
システムのノードにより、1つ以上の抽出された特徴に一致する1つ以上の候補レコードを識別するために共起特徴を含む候補レコードのセットをサーチし、候補レコードに一致する抽出された特徴は、一次特徴であり、前記ノードはインメモリデータベースをホストするメインメモリを含み、前記インメモリデータベースはクラスターの知識ベースを格納し、各クラスターは独特の識別子(独特のID)を伴う曖昧性除去された一次特徴及び関連付けられた二次特徴を含み、
ノードにより、抽出された特徴の各々を1つ以上のマシン発生トピック識別子(トピックID)と関連付け、
ノードにより、トピックIDの関連度に基づき一次特徴の各々を互いに曖昧性除去し、 ノードにより、トピックIDの関連度に基づき各一次特徴に関連した二次特徴のセットを識別し、
ノードにより、トピックIDの関連度に基づき二次特徴の関連セットにおける二次特徴の各々から一次特徴の各々を曖昧性除去し、
前記インメモリデータベースから前記知識ベースからデータが検索されるときに、リアルタイムで、ノードにより、各一次特徴を二次特徴の関連セットにリンクして、新たなクラスターを形成し、
ノードのインメモリデータベースの曖昧性除去モジュールにより、曖昧性除去された一次特徴を伴う既存の知識クラスターへの比較的一致するスコアの指定により前記新たなクラスターの各々が既存の知識ベースクラスターに一致するかどうか決定し、
一致があるときには、既存の知識ベースクラスターにおける各一致する一次特徴に対応する既存の独特のIDを決定しそして前記新たなクラスターを含むように既存の知識ベースクラスターを更新し、及び
一致がないときには、新たな知識ベースクラスターを生成し、そしてその新たな知識ベースクラスターの一次特徴に新たな独特のIDを指定し、及び
既存の独特のID及び新たな独特のIDの一方を一次特徴として前記エンドユーザ装置へ送出する、
ことを含む方法。 - ノードにより、抽出された特徴に一致する候補レコードの各々を比較し、及びノードにより、その比較に基づいて前記抽出された特徴の各々に重み付けされた一致スコア結果を指定する、ことを更に含む、請求項1に記載の方法。
- ノードにより、抽出された特徴の各々を、重み付けされた特徴属性のセットに関連付けることを更に含む、請求項2に記載の方法。
- ノードにより、1つ以上の重み付けされた特徴属性に基づいて抽出された特徴の各々の関連度を決定することを更に含む、請求項3に記載の方法。
- 1つ以上の抽出された特徴をノードの抽出モジュールにより確認及び抽出し、1つ以上の抽出された特徴において1つ以上の一次特徴を識別し、及び
ノードの抽出モジュールにより、抽出された特徴の各々をデータベースに記憶する、
ことを更に含む、請求項1に記載の方法。 - ノードの抽出モジュールにより、各特徴に抽出確度スコアを指定することを更に含む、請求項5に記載の方法。
- 各々の一次特徴は、1つ以上の特徴属性のセットに関連付けられる、請求項1に記載の方法。
- 特徴属性は、トピックID、ドキュメント識別子(ドキュメントID)、特徴タイプ、特徴名、信頼性スコア、及び特徴位置より成るグループから選択される、請求項7に記載の方法。
- 各関連特徴は、予め定義されたクラスターハイアラーキーに従って下位順序特徴のセットに関連付けられる、請求項1に記載の方法。
- ノードにより、候補レコードのセットの曖昧キーサーチを遂行することを更に含む、請求項1に記載の方法。
- ノードのリンクオンザフライモジュールにより、関連トピックIDの共起及び1つ以上の特徴属性に基づいて2つ以上のデータソースをリンクすることを更に含む、請求項7に記載の方法。
- ノードにより、データソースにおける抽出された特徴が第2データソースにおいて共起するかどうかを、その抽出された特徴を第2データソースにおける特徴と比較することで決定し、及び
ノードにより、前期比較に基づいてデータソースの各々をリンクする、
ことを更に含む、請求項1に記載の方法。 - ノードにより、異なるデータソースからの抽出された特徴の共起を分析して、抽出された特徴の曖昧性除去の精度を改善することを更に含む、請求項1に記載の方法。
- ノードにより、1つ以上の新たなデータソースを連続的に受け取り、
ノードにより、1つ以上の抽出される特徴を連続的に抽出し、
ノードにより、1つ以上の抽出された特徴において候補サーチを連続的に遂行し、
ノードにより、抽出された特徴を連続的に曖昧性除去し、及び
ノードにより、抽出された特徴を1つ以上の新たなクラスターへ連続的にリンクする、ことを更に含む、請求項1に記載の方法。 - コンピュータ実行可能なインストラクションが記憶された非一時的コンピュータ読み取り可能な媒体であって、プロセッサによって実行されると、
サーチ質問をエンドユーザ装置から受信することに応答して、
システムのノードにより、1つ以上の抽出された特徴に一致する1つ以上の候補レコードを識別するために共起特徴を含む候補レコードのセットをサーチし、前記ノードはインメモリデータベースをホストするメインメモリを含み、前記インメモリデータベースはクラスターの知識ベースを格納し、各クラスターは独特の識別子(独特のID)を伴う曖昧性除去された一次特徴及び関連付けられた二次特徴を含み、
ノードにより、抽出された特徴の各々を1つ以上のマシン発生トピック識別子(トピックID)と関連付け、
ノードにより、トピックIDの関連度に基づき一次特徴の各々を互いに曖昧性除去し、 ノードにより、トピックIDの関連度に基づき各一次特徴に関連した二次特徴のセットを識別し、
ノードにより、トピックIDの関連度に基づき二次特徴の関連セットにおける二次特徴の各々から一次特徴の各々を曖昧性除去し、
前記インメモリデータベースから前記知識ベースからデータが検索されるときに、リアルタイムで、ノードにより、各一次特徴を二次特徴の関連セットにリンクして、新たなクラスターを形成し、
ノードのインメモリデータベースの曖昧性除去モジュールにより、曖昧性除去された一次特徴を伴う既存の知識クラスターへの比較的一致するスコアの指定により前記新たなクラスターの各々が既存の知識ベースクラスターに一致するかどうか決定し、
一致があるときには、既存の知識ベースクラスターにおける各一致する一次特徴に対応する既存の独特のIDを決定しそして前記新たなクラスターを含むように既存の知識ベースクラスターを更新し、及び
一致がないときには、新たな知識ベースクラスターを生成し、そしてその新たな知識ベースクラスターの一次特徴に新たな独特のIDを指定し、及び
既存の独特のID及び新たな独特のIDの一方を一次特徴として前記エンドユーザ装置へ送出する、
ことを含む機能が実行される、コンピュータ実行可能なインストラクションが記憶された非一時的コンピュータ読み取り可能な媒体。 - 前記インストラクションは、更に、ノードにより、抽出された特徴に一致する候補レコードの各々を比較し、及びノードにより、その比較に基づいて前記抽出された特徴の各々に重み付けされた一致スコア結果を指定する、ことを含む、請求項15に記載の非一時的コンピュータ読み取り可能な媒体。
- 前記インストラクションは、更に、ノードにより、抽出された特徴の各々を、重み付けされた特徴属性のセットに関連付けることを含む、請求項16に記載の非一時的コンピュータ読み取り可能な媒体。
- 前記インストラクションは、更に、ノードにより、1つ以上の重み付けされた特徴属性に基づいて抽出された特徴の各々の関連度を決定することを含む、請求項17に記載の非一時的コンピュータ読み取り可能な媒体。
- 前記インストラクションは、更に、
ノードの抽出モジュールにより、1つ以上の抽出された特徴を確認し及び抽出し、その1つ以上の抽出された特徴において1つ以上の一次特徴を識別し、及び
ノードの抽出モジュールにより、抽出された特徴の各々をデータベースに記憶する、
ことを含む、請求項15に記載の非一時的コンピュータ読み取り可能な媒体。 - 前記インストラクションは、更に、ノードの抽出モジュールにより、各特徴に抽出確度スコアを指定することを含む、請求項19に記載の非一時的コンピュータ読み取り可能な媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361910739P | 2013-12-02 | 2013-12-02 | |
US61/910,739 | 2013-12-02 | ||
PCT/US2014/067918 WO2015084724A1 (en) | 2013-12-02 | 2014-12-01 | Method for disambiguating features in unstructured text |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2016541069A JP2016541069A (ja) | 2016-12-28 |
JP2016541069A5 JP2016541069A5 (ja) | 2018-01-11 |
JP6284643B2 true JP6284643B2 (ja) | 2018-02-28 |
Family
ID=53265533
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016536850A Active JP6284643B2 (ja) | 2013-12-02 | 2014-12-01 | 非構造化テキストにおける特徴の曖昧性除去方法 |
Country Status (7)
Country | Link |
---|---|
US (2) | US9239875B2 (ja) |
EP (1) | EP3077919A4 (ja) |
JP (1) | JP6284643B2 (ja) |
KR (1) | KR20160124742A (ja) |
CN (1) | CN106164890A (ja) |
CA (1) | CA2932399A1 (ja) |
WO (1) | WO2015084724A1 (ja) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9424524B2 (en) | 2013-12-02 | 2016-08-23 | Qbase, LLC | Extracting facts from unstructured text |
CN106462575A (zh) | 2013-12-02 | 2017-02-22 | 丘贝斯有限责任公司 | 群集内存数据库的设计及实现 |
US9201744B2 (en) | 2013-12-02 | 2015-12-01 | Qbase, LLC | Fault tolerant architecture for distributed computing systems |
US9355152B2 (en) | 2013-12-02 | 2016-05-31 | Qbase, LLC | Non-exclusionary search within in-memory databases |
US9547701B2 (en) | 2013-12-02 | 2017-01-17 | Qbase, LLC | Method of discovering and exploring feature knowledge |
US9025892B1 (en) | 2013-12-02 | 2015-05-05 | Qbase, LLC | Data record compression with progressive and/or selective decomposition |
US9424294B2 (en) | 2013-12-02 | 2016-08-23 | Qbase, LLC | Method for facet searching and search suggestions |
US9348573B2 (en) * | 2013-12-02 | 2016-05-24 | Qbase, LLC | Installation and fault handling in a distributed system utilizing supervisor and dependency manager nodes |
US9659108B2 (en) | 2013-12-02 | 2017-05-23 | Qbase, LLC | Pluggable architecture for embedding analytics in clustered in-memory databases |
US10572935B1 (en) * | 2014-07-16 | 2020-02-25 | Intuit, Inc. | Disambiguation of entities based on financial interactions |
US10176457B2 (en) * | 2015-02-05 | 2019-01-08 | Sap Se | System and method automatically learning and optimizing sequence order |
US11157920B2 (en) * | 2015-11-10 | 2021-10-26 | International Business Machines Corporation | Techniques for instance-specific feature-based cross-document sentiment aggregation |
US10200397B2 (en) | 2016-06-28 | 2019-02-05 | Microsoft Technology Licensing, Llc | Robust matching for identity screening |
US10311092B2 (en) | 2016-06-28 | 2019-06-04 | Microsoft Technology Licensing, Llc | Leveraging corporal data for data parsing and predicting |
CN106991171A (zh) * | 2017-03-25 | 2017-07-28 | 贺州学院 | 基于智慧校园信息服务平台的话题发现方法 |
US11656174B2 (en) | 2018-01-26 | 2023-05-23 | Viavi Solutions Inc. | Outlier detection for spectroscopic classification |
US10810408B2 (en) * | 2018-01-26 | 2020-10-20 | Viavi Solutions Inc. | Reduced false positive identification for spectroscopic classification |
US11009452B2 (en) | 2018-01-26 | 2021-05-18 | Viavi Solutions Inc. | Reduced false positive identification for spectroscopic quantification |
CN109344256A (zh) * | 2018-10-12 | 2019-02-15 | 中国科学院重庆绿色智能技术研究院 | 一种新闻稿件主题分类及审核方法 |
KR102037453B1 (ko) | 2018-11-29 | 2019-10-29 | 부산대학교 산학협력단 | 부분단어 정보에 기반을 둔 워드임베딩을 이용한 수분류사 중의성 해소 장치 및 방법 |
CN110110046B (zh) * | 2019-04-30 | 2021-10-01 | 北京搜狗科技发展有限公司 | 同名实体推荐方法及装置 |
US11636355B2 (en) * | 2019-05-30 | 2023-04-25 | Baidu Usa Llc | Integration of knowledge graph embedding into topic modeling with hierarchical Dirichlet process |
CN110942765B (zh) * | 2019-11-11 | 2022-05-27 | 珠海格力电器股份有限公司 | 一种构建语料库的方法、设备、服务器和存储介质 |
Family Cites Families (98)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5828843A (en) | 1996-03-21 | 1998-10-27 | Mpath Interactive, Inc. | Object-oriented method for matching clients together with servers according to attributes included in join request |
US6178529B1 (en) | 1997-11-03 | 2001-01-23 | Microsoft Corporation | Method and system for resource monitoring of disparate resources in a server cluster |
US6353926B1 (en) | 1998-07-15 | 2002-03-05 | Microsoft Corporation | Software update notification |
US6266781B1 (en) | 1998-07-20 | 2001-07-24 | Academia Sinica | Method and apparatus for providing failure detection and recovery with predetermined replication style for distributed applications in a network |
US6338092B1 (en) | 1998-09-24 | 2002-01-08 | International Business Machines Corporation | Method, system and computer program for replicating data in a distributed computed environment |
US6959300B1 (en) | 1998-12-10 | 2005-10-25 | At&T Corp. | Data compression method and apparatus |
US7099898B1 (en) | 1999-08-12 | 2006-08-29 | International Business Machines Corporation | Data access system |
US6738759B1 (en) | 2000-07-07 | 2004-05-18 | Infoglide Corporation, Inc. | System and method for performing similarity searching using pointer optimization |
US8692695B2 (en) | 2000-10-03 | 2014-04-08 | Realtime Data, Llc | Methods for encoding and decoding data |
US6832373B2 (en) | 2000-11-17 | 2004-12-14 | Bitfone Corporation | System and method for updating and distributing information |
US6691109B2 (en) | 2001-03-22 | 2004-02-10 | Turbo Worx, Inc. | Method and apparatus for high-performance sequence comparison |
GB2374687A (en) | 2001-04-19 | 2002-10-23 | Ibm | Managing configuration changes in a data processing system |
US7082478B2 (en) * | 2001-05-02 | 2006-07-25 | Microsoft Corporation | Logical semantic compression |
US6961723B2 (en) | 2001-05-04 | 2005-11-01 | Sun Microsystems, Inc. | System and method for determining relevancy of query responses in a distributed network search mechanism |
US20030028869A1 (en) | 2001-08-02 | 2003-02-06 | Drake Daniel R. | Method and computer program product for integrating non-redistributable software applications in a customer driven installable package |
JP2003150442A (ja) * | 2001-11-19 | 2003-05-23 | Fujitsu Ltd | メモリ展開プログラムおよびデータ処理装置 |
US6954456B2 (en) | 2001-12-14 | 2005-10-11 | At & T Corp. | Method for content-aware redirection and content renaming |
US6829606B2 (en) | 2002-02-14 | 2004-12-07 | Infoglide Software Corporation | Similarity search engine for use with relational databases |
US7421478B1 (en) | 2002-03-07 | 2008-09-02 | Cisco Technology, Inc. | Method and apparatus for exchanging heartbeat messages and configuration information between nodes operating in a master-slave configuration |
US8015143B2 (en) | 2002-05-22 | 2011-09-06 | Estes Timothy W | Knowledge discovery agent system and method |
US7570262B2 (en) | 2002-08-08 | 2009-08-04 | Reuters Limited | Method and system for displaying time-series data and correlated events derived from text mining |
US7249312B2 (en) * | 2002-09-11 | 2007-07-24 | Intelligent Results | Attribute scoring for unstructured content |
US7058846B1 (en) | 2002-10-17 | 2006-06-06 | Veritas Operating Corporation | Cluster failover for storage management services |
US20040205064A1 (en) | 2003-04-11 | 2004-10-14 | Nianjun Zhou | Adaptive search employing entropy based quantitative information measurement |
US7543174B1 (en) | 2003-09-24 | 2009-06-02 | Symantec Operating Corporation | Providing high availability for an application by rapidly provisioning a node and failing over to the node |
US9009153B2 (en) | 2004-03-31 | 2015-04-14 | Google Inc. | Systems and methods for identifying a named entity |
US7818615B2 (en) | 2004-09-16 | 2010-10-19 | Invensys Systems, Inc. | Runtime failure management of redundantly deployed hosts of a supervisory process control data acquisition facility |
US7403945B2 (en) | 2004-11-01 | 2008-07-22 | Sybase, Inc. | Distributed database system providing data and space management methodology |
US20060179026A1 (en) | 2005-02-04 | 2006-08-10 | Bechtel Michael E | Knowledge discovery tool extraction and integration |
US20060294071A1 (en) | 2005-06-28 | 2006-12-28 | Microsoft Corporation | Facet extraction and user feedback for ranking improvement and personalization |
US7630977B2 (en) | 2005-06-29 | 2009-12-08 | Xerox Corporation | Categorization including dependencies between different category systems |
US8386463B2 (en) | 2005-07-14 | 2013-02-26 | International Business Machines Corporation | Method and apparatus for dynamically associating different query execution strategies with selective portions of a database table |
US7681075B2 (en) | 2006-05-02 | 2010-03-16 | Open Invention Network Llc | Method and system for providing high availability to distributed computer applications |
US7447940B2 (en) | 2005-11-15 | 2008-11-04 | Bea Systems, Inc. | System and method for providing singleton services in a cluster |
US8341622B1 (en) | 2005-12-15 | 2012-12-25 | Crimson Corporation | Systems and methods for efficiently using network bandwidth to deploy dependencies of a software package |
US7899871B1 (en) | 2006-01-23 | 2011-03-01 | Clearwell Systems, Inc. | Methods and systems for e-mail topic classification |
US7519613B2 (en) | 2006-02-28 | 2009-04-14 | International Business Machines Corporation | Method and system for generating threads of documents |
US8726267B2 (en) | 2006-03-24 | 2014-05-13 | Red Hat, Inc. | Sharing software certification and process metadata |
US8190742B2 (en) | 2006-04-25 | 2012-05-29 | Hewlett-Packard Development Company, L.P. | Distributed differential store with non-distributed objects and compression-enhancing data-object routing |
US20070282959A1 (en) | 2006-06-02 | 2007-12-06 | Stern Donald S | Message push with pull of information to a communications computing device |
US8615800B2 (en) | 2006-07-10 | 2013-12-24 | Websense, Inc. | System and method for analyzing web content |
US7624118B2 (en) | 2006-07-26 | 2009-11-24 | Microsoft Corporation | Data processing over very large databases |
US8122026B1 (en) | 2006-10-20 | 2012-02-21 | Google Inc. | Finding and disambiguating references to entities on web pages |
US7853611B2 (en) * | 2007-02-26 | 2010-12-14 | International Business Machines Corporation | System and method for deriving a hierarchical event based database having action triggers based on inferred probabilities |
US8352455B2 (en) | 2007-06-29 | 2013-01-08 | Allvoices, Inc. | Processing a content item with regard to an event and a location |
US20090043792A1 (en) | 2007-08-07 | 2009-02-12 | Eric Lawrence Barsness | Partial Compression of a Database Table Based on Historical Information |
US10698886B2 (en) | 2007-08-14 | 2020-06-30 | John Nicholas And Kristin Gross Trust U/A/D | Temporal based online search and advertising |
GB2453174B (en) | 2007-09-28 | 2011-12-07 | Advanced Risc Mach Ltd | Techniques for generating a trace stream for a data processing apparatus |
KR100898339B1 (ko) | 2007-10-05 | 2009-05-20 | 한국전자통신연구원 | 홈 네트워크 환경을 위한 자율적인 오류 처리 시스템 및 그방법 |
US8396838B2 (en) | 2007-10-17 | 2013-03-12 | Commvault Systems, Inc. | Legal compliance, electronic discovery and electronic document handling of online and offline copies of data |
US8375073B1 (en) | 2007-11-12 | 2013-02-12 | Google Inc. | Identification and ranking of news stories of interest |
US8294763B2 (en) | 2007-12-14 | 2012-10-23 | Sri International | Method for building and extracting entity networks from video |
US8326847B2 (en) * | 2008-03-22 | 2012-12-04 | International Business Machines Corporation | Graph search system and method for querying loosely integrated data |
US20100077001A1 (en) | 2008-03-27 | 2010-03-25 | Claude Vogel | Search system and method for serendipitous discoveries with faceted full-text classification |
US8712926B2 (en) | 2008-05-23 | 2014-04-29 | International Business Machines Corporation | Using rule induction to identify emerging trends in unstructured text streams |
US8358308B2 (en) | 2008-06-27 | 2013-01-22 | Microsoft Corporation | Using visual techniques to manipulate data |
US8171547B2 (en) | 2008-12-03 | 2012-05-01 | Trend Micro Incorporated | Method and system for real time classification of events in computer integrity system |
US8874576B2 (en) | 2009-02-27 | 2014-10-28 | Microsoft Corporation | Reporting including filling data gaps and handling uncategorized data |
GB0904113D0 (en) * | 2009-03-10 | 2009-04-22 | Intrasonics Ltd | Video and audio bookmarking |
US20100235311A1 (en) * | 2009-03-13 | 2010-09-16 | Microsoft Corporation | Question and answer search |
US8213725B2 (en) | 2009-03-20 | 2012-07-03 | Eastman Kodak Company | Semantic event detection using cross-domain knowledge |
US8161048B2 (en) * | 2009-04-24 | 2012-04-17 | At&T Intellectual Property I, L.P. | Database analysis using clusters |
US8055933B2 (en) | 2009-07-21 | 2011-11-08 | International Business Machines Corporation | Dynamic updating of failover policies for increased application availability |
US9165034B2 (en) * | 2009-10-15 | 2015-10-20 | Hewlett-Packard Development Company, L.P. | Heterogeneous data source management |
US8645372B2 (en) | 2009-10-30 | 2014-02-04 | Evri, Inc. | Keyword-based search engine results using enhanced query strategies |
US20110125764A1 (en) | 2009-11-26 | 2011-05-26 | International Business Machines Corporation | Method and system for improved query expansion in faceted search |
JP5576384B2 (ja) | 2010-01-29 | 2014-08-20 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | データ処理装置 |
US9710556B2 (en) * | 2010-03-01 | 2017-07-18 | Vcvc Iii Llc | Content recommendation based on collections of entities |
US8595234B2 (en) | 2010-05-17 | 2013-11-26 | Wal-Mart Stores, Inc. | Processing data feeds |
US8429256B2 (en) | 2010-05-28 | 2013-04-23 | Red Hat, Inc. | Systems and methods for generating cached representations of host package inventories in remote package repositories |
US8345998B2 (en) | 2010-08-10 | 2013-01-01 | Xerox Corporation | Compression scheme selection based on image data type and user selections |
US8321443B2 (en) | 2010-09-07 | 2012-11-27 | International Business Machines Corporation | Proxying open database connectivity (ODBC) calls |
US20120102121A1 (en) * | 2010-10-25 | 2012-04-26 | Yahoo! Inc. | System and method for providing topic cluster based updates |
US8423522B2 (en) | 2011-01-04 | 2013-04-16 | International Business Machines Corporation | Query-aware compression of join results |
US20120246154A1 (en) | 2011-03-23 | 2012-09-27 | International Business Machines Corporation | Aggregating search results based on associating data instances with knowledge base entities |
US20120310934A1 (en) | 2011-06-03 | 2012-12-06 | Thomas Peh | Historic View on Column Tables Using a History Table |
KR20120134916A (ko) | 2011-06-03 | 2012-12-12 | 삼성전자주식회사 | 저장 장치 및 저장 장치를 위한 데이터 처리 장치 |
US9104979B2 (en) | 2011-06-16 | 2015-08-11 | Microsoft Technology Licensing, Llc | Entity recognition using probabilities for out-of-collection data |
EP2727247B1 (en) | 2011-06-30 | 2017-04-05 | Openwave Mobility, Inc. | Database compression system and method |
US9032387B1 (en) | 2011-10-04 | 2015-05-12 | Amazon Technologies, Inc. | Software distribution framework |
US9026480B2 (en) | 2011-12-21 | 2015-05-05 | Telenav, Inc. | Navigation system with point of interest classification mechanism and method of operation thereof |
US9037579B2 (en) | 2011-12-27 | 2015-05-19 | Business Objects Software Ltd. | Generating dynamic hierarchical facets from business intelligence artifacts |
US9251250B2 (en) * | 2012-03-28 | 2016-02-02 | Mitsubishi Electric Research Laboratories, Inc. | Method and apparatus for processing text with variations in vocabulary usage |
US10908792B2 (en) | 2012-04-04 | 2021-02-02 | Recorded Future, Inc. | Interactive event-based information system |
US20130290232A1 (en) * | 2012-04-30 | 2013-10-31 | Mikalai Tsytsarau | Identifying news events that cause a shift in sentiment |
US9483513B2 (en) * | 2012-04-30 | 2016-11-01 | Sap Se | Storing large objects on disk and not in main memory of an in-memory database system |
US10162766B2 (en) * | 2012-04-30 | 2018-12-25 | Sap Se | Deleting records in a multi-level storage architecture without record locks |
US8948789B2 (en) | 2012-05-08 | 2015-02-03 | Qualcomm Incorporated | Inferring a context from crowd-sourced activity data |
US9703833B2 (en) | 2012-11-30 | 2017-07-11 | Sap Se | Unification of search and analytics |
US9542652B2 (en) | 2013-02-28 | 2017-01-10 | Microsoft Technology Licensing, Llc | Posterior probability pursuit for entity disambiguation |
US9104710B2 (en) * | 2013-03-15 | 2015-08-11 | Src, Inc. | Method for cross-domain feature correlation |
US8977600B2 (en) | 2013-05-24 | 2015-03-10 | Software AG USA Inc. | System and method for continuous analytics run against a combination of static and real-time data |
CN103365974A (zh) * | 2013-06-28 | 2013-10-23 | 百度在线网络技术(北京)有限公司 | 一种基于相关词主题的语义消歧方法和系统 |
US9734221B2 (en) | 2013-09-12 | 2017-08-15 | Sap Se | In memory database warehouse |
US9201744B2 (en) | 2013-12-02 | 2015-12-01 | Qbase, LLC | Fault tolerant architecture for distributed computing systems |
US9025892B1 (en) | 2013-12-02 | 2015-05-05 | Qbase, LLC | Data record compression with progressive and/or selective decomposition |
US9424294B2 (en) | 2013-12-02 | 2016-08-23 | Qbase, LLC | Method for facet searching and search suggestions |
US9223875B2 (en) | 2013-12-02 | 2015-12-29 | Qbase, LLC | Real-time distributed in memory search architecture |
-
2014
- 2014-12-01 JP JP2016536850A patent/JP6284643B2/ja active Active
- 2014-12-01 KR KR1020167017515A patent/KR20160124742A/ko not_active Application Discontinuation
- 2014-12-01 CA CA2932399A patent/CA2932399A1/en not_active Abandoned
- 2014-12-01 EP EP14868541.5A patent/EP3077919A4/en not_active Withdrawn
- 2014-12-01 CN CN201480072968.3A patent/CN106164890A/zh active Pending
- 2014-12-01 WO PCT/US2014/067918 patent/WO2015084724A1/en active Application Filing
- 2014-12-02 US US14/557,794 patent/US9239875B2/en active Active
-
2015
- 2015-12-28 US US14/979,703 patent/US20160110446A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US9239875B2 (en) | 2016-01-19 |
WO2015084724A1 (en) | 2015-06-11 |
KR20160124742A (ko) | 2016-10-28 |
US20150154286A1 (en) | 2015-06-04 |
CA2932399A1 (en) | 2015-06-11 |
US20160110446A1 (en) | 2016-04-21 |
CN106164890A (zh) | 2016-11-23 |
EP3077919A1 (en) | 2016-10-12 |
JP2016541069A (ja) | 2016-12-28 |
EP3077919A4 (en) | 2017-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6284643B2 (ja) | 非構造化テキストにおける特徴の曖昧性除去方法 | |
US10642938B2 (en) | Artificial intelligence based method and apparatus for constructing comment graph | |
US9201931B2 (en) | Method for obtaining search suggestions from fuzzy score matching and population frequencies | |
Bagheri et al. | Care more about customers: Unsupervised domain-independent aspect detection for sentiment analysis of customer reviews | |
JP7232831B2 (ja) | 複雑な回答の補強証拠取り出し | |
US9720944B2 (en) | Method for facet searching and search suggestions | |
US9613166B2 (en) | Search suggestions of related entities based on co-occurrence and/or fuzzy-score matching | |
RU2720074C2 (ru) | Способ и система создания векторов аннотации для документа | |
US20190317986A1 (en) | Annotated text data expanding method, annotated text data expanding computer-readable storage medium, annotated text data expanding device, and text classification model training method | |
JP2017504105A (ja) | インメモリデータベースサーチのためのシステム及び方法 | |
US10198497B2 (en) | Search term clustering | |
US20120317125A1 (en) | Method and apparatus for identifier retrieval | |
WO2015084757A1 (en) | Systems and methods for processing data stored in a database | |
US20170124090A1 (en) | Method of discovering and exploring feature knowledge | |
US9507834B2 (en) | Search suggestions using fuzzy-score matching and entity co-occurrence | |
JP6145562B2 (ja) | 情報構造化システム及び情報構造化方法 | |
Zou et al. | Assessing software quality through web comment search and analysis | |
US20160085760A1 (en) | Method for in-loop human validation of disambiguated features | |
Lu et al. | Improving web search relevance with semantic features | |
CN113656574B (zh) | 用于搜索结果排序的方法、计算设备和存储介质 | |
Li | Connecting Text with Knowledge | |
JP2018055622A (ja) | 情報処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171122 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171122 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20171122 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20171213 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180109 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180130 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6284643 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |