JP6901816B2 - エンティティ関係データ生成方法、装置、機器、及び記憶媒体 - Google Patents
エンティティ関係データ生成方法、装置、機器、及び記憶媒体 Download PDFInfo
- Publication number
- JP6901816B2 JP6901816B2 JP2019143724A JP2019143724A JP6901816B2 JP 6901816 B2 JP6901816 B2 JP 6901816B2 JP 2019143724 A JP2019143724 A JP 2019143724A JP 2019143724 A JP2019143724 A JP 2019143724A JP 6901816 B2 JP6901816 B2 JP 6901816B2
- Authority
- JP
- Japan
- Prior art keywords
- key value
- web page
- target
- key
- block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
- G06F16/972—Access to data in other repository systems, e.g. legacy data or dynamic Web page generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/288—Entity relationship models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1aは、本発明の実施例1により提供されるエンティティ関係データ生成方法の流れを示す概略図である。本実施例は、ウェブページ中からエンティティ関係データを取得する場合に適用される。当該方法は、本発明の実施例によって提供されるエンティティ関係データ生成装置によって実行され、当該装置は、ハードウェア及び/又はソフトウェアから構成され、一般的にコンピュータ機器中に統合ずることができる。図1に示すように、本実施例の方法は、具体的には、S110〜S140を含む。
ウェブページベースのデータを取得した後、ウェブページが位置しているサイト、ウェブページの質量、ウェブページの言語、ポルノウェブページであるか否か、ウェブページのタイプなどの情報に基づいて、フィルタリングを実行する、ウェブページフィルタリングステップと、URLの検索queryを取得し、URLのqueryに基づいてポルノquery識別を行い、ポルノウェブページをさらにフィルタリングし、ポルノqueryをフィルタリングした後queryとウェブページデータとを併合する、ポルノqueryウェブページフィルタリング及びquery併合ステップと、を含む。
図2aは、本発明の実施例2により提供されるエンティティ関係データ生成方法の流れを示す概略図であり、本実施例は上記実施例を基礎として具体化にしたものである。本実施例において、ウェブページソースコードデータにおいて、少なくとも一つのキー値ブロックを識別するステップをさらに最適化したステップは、基礎解析ツールを使用して、ウェブページソースコードデータをデータ解析し、少なくとも一つの基礎キー値ペアを取得して、キー値ペアセットに追加するステップと、基礎キー値ペアをキー値ペア拡張し、少なくとも一つの拡張キー値ペアを取得して、キー値ペアセットに追加するステップと、キー値ペアセットに含まれたキー値ペアを併合処理して、少なくとも一つのキー値ブロックを取得するステップと、を含む。
図3は、本発明の実施例3によって提供されるエンティティ関係データ生成装置の構成を示す概略図である。図3を参考すると、エンティティ関係データ生成装置は、ソースコード取得モジュール310と、キー値ブロックの識別モジュール320と、サブジェクト値の識別モジュール330と、データ生成モジュール340と、を備え、以下、各モジュールを具体的に説明する。
図4は、本発明の実施例4によって提供されるコンピュータ機器の構成を示す概略図である。図4は、本発明の実施形態を実現するための例示的なコンピュータ機器のブロック図を示す。図4に示すコンピュータ機器12は、一例に過ぎず、本発明の実施例の機能及び使用範囲を限定するものではない。
本発明の実施例5は、コンピュータ読み取り可能な記憶媒体を提供する。当該コンピュータ読み取り可能な記憶媒体上には、コンピュータプログラムが格納されており、当該プログラムがプロセッサによって実行されると、本願のすべての発明の実施例によって提供されるエンティティ関係データ生成方法が実現される。当該方法は、目標ウェブページに対応するウェブページソースコードデータを取得するステップと、前記ウェブページソースコードデータにおいて、少なくとも一つのキー値ペアを含む少なくとも一つキー値ブロックを識別するステップと、前記ウェブページソースコードデータにおいて、前記少なくとも一つのキー値ブロックに対応するサブジェクト値を識別するステップと、前記キー値ブロックと前記キー値ブロックに対応するサブジェクト値とに基づいて、前記目標ウェブページに対応するエンティティ関係データを生成するステップと、を含む。
Claims (15)
- 目標ウェブページに対応するウェブページソースコードデータを取得するステップと、
前記ウェブページソースコードデータにおいて、少なくとも一つのキー値ペアを含む少なくとも一つのキー値ブロックを識別するステップと、
前記ウェブページソースコードデータにおいて、前記少なくとも一つのキー値ブロックに対応するサブジェクト値を識別するステップと、
前記キー値ブロックと前記キー値ブロックに対応するサブジェクト値とに基づいて、前記目標ウェブページに対応するエンティティ関係データを生成するステップと、を含み、
前記ウェブページソースコードデータにおいて、前記少なくとも一つのキー値ブロックに対応するサブジェクト値を識別するステップが、
現在処理中の目標キー値ブロックが主キー値ブロックであり、前記ウェブページソースコードデータに第1のタグ条件を満たすエンティティページノードが含まれていることが決定された場合、エンティティページのスコアリング規則に従って、前記目標ウェブページがエンティティページであるか否かを判断するステップと、
前記目標ウェブページがエンティティページである場合、前記エンティティページノードに対応するテキストデータを前記目標キー値ブロックのサブジェクト値とするステップと、を含み、
前記主キー値ブロックは、前記ウェブページソースコードデータに対応する少なくとも一つのキー値ブロックのうち、含まれたキー値ペアの数が一番多い一つのキー値ブロックであるエンティティ関係データ生成方法。 - 目標ウェブページに対応するウェブページソースコードデータを取得するステップと、
前記ウェブページソースコードデータにおいて、少なくとも一つのキー値ペアを含む少なくとも一つのキー値ブロックを識別するステップと、
前記ウェブページソースコードデータにおいて、前記少なくとも一つのキー値ブロックに対応するサブジェクト値を識別するステップと、
前記キー値ブロックと前記キー値ブロックに対応するサブジェクト値とに基づいて、前記目標ウェブページに対応するエンティティ関係データを生成するステップと、を含み、
前記ウェブページソースコードデータにおいて、前記少なくとも一つのキー値ブロックに対応するサブジェクト値を識別するステップが、
現在処理中の目標キー値ブロックに含まれたキー値ペアのキー名を、設定されたホワイトリストとマッチングするステップと、
前記目標キー値ブロックに含まれた目標キー名が前記ホワイトリストにマッチングされると決定された場合、前記目標キー名に対応する目標キー値を、前記目標キー値ブロックのサブジェクト値として取得するステップと、を含むエンティティ関係データ生成方法。 - 目標ウェブページに対応するウェブページソースコードデータを取得するステップと、
前記ウェブページソースコードデータにおいて、少なくとも一つのキー値ペアを含む少なくとも一つのキー値ブロックを識別するステップと、
前記ウェブページソースコードデータにおいて、前記少なくとも一つのキー値ブロックに対応するサブジェクト値を識別するステップと、
前記キー値ブロックと前記キー値ブロックに対応するサブジェクト値とに基づいて、前記目標ウェブページに対応するエンティティ関係データを生成するステップと、を含み、
前記ウェブページソースコードデータにおいて、前記少なくとも一つのキー値ブロックに対応するサブジェクト値を識別するステップが、
前記目標ウェブページのユニフォームリソースロケータに基づいて、前記目標ウェブページに対応する目標サイトを決定するステップと、
予め記憶されている前記目標サイトに対応する少なくとも一つの候補テンプレートを取得し、前記候補テンプレートに基づいて現在処理中のキー値ブロックに対応するサブジェクト値を識別するステップと、を含み、
前記目標サイト内の候補テンプレートは、前記目標サイトの複数のウェブページをキー値ペア識別した後、識別結果によって生成されたものであるエンティティ関係データ生成方法。 - 前記ウェブページソースコードデータにおいて、少なくとも一つのキー値ブロックを識別するステップが、
基礎解析ツールを使用して、前記ウェブページソースコードデータをデータ解析し、少なくとも一つの基礎キー値ペアを取得して、キー値ペアセットに追加するステップと、
前記基礎キー値ペアをキー値ペア拡張し、少なくとも一つの拡張キー値ペアを取得して、前記キー値ペアセットに追加するステップと、
前記キー値ペアセットに含まれたキー値ペアを併合処理して、前記少なくとも一つのキー値ブロックを取得するステップと、を含む請求項1から3のいずれか一項に記載のエンティティ関係データ生成方法。 - 前記基礎キー値ペアをキー値ペア拡張し、少なくとも一つの拡張キー値ペアを取得して、前記キー値ペアセットに追加するステップが、
前記ウェブページソースコードデータにおいて、前記基礎キー値ペアとマッチングされる基礎ノードの基礎xpathを取得し、xpathが前記基礎xpathと同一である拡張ノードを検索し、前記拡張ノードに対応するテキストデータを前記拡張キー値ペアとして取得するステップ、及び/又は、
前記ウェブページソースコードデータにおいて、前記基礎キー値ペアとマッチングされる基礎ノードの基礎htmlタグを取得し、前記基礎htmlタグに基づいて、少なくとも一つの拡張htmlタグを決定し、前記ウェブページソースコードデータにおいて、前記拡張htmlタグとマッチングされる拡張ノードを検索し、前記拡張ノードに対応するテキストデータを前記拡張キー値ペアとして取得するステップ、
を含む請求項4に記載のエンティティ関係データ生成方法。 - 前記キー値ペアセットに含まれたキー値ペアを併合処理して、前記少なくとも一つのキー値ブロックを取得するステップが、
前記キー値ペアセットにおけるキー値ペアの前記目標ウェブページにおけるページ位置を位置決めするステップと、
ページ位置が連続される少なくとも二つのキー値ペアを一つのキー値ブロックに併合し入れるステップと、を含む請求項4に記載のエンティティ関係データ生成方法。 - 前記キー値ペアセットに含まれたキー値ペアを併合処理して、前記少なくとも一つのキー値ブロックを取得するステップの後に、
キー値ペアのフィルタリング規則に従って、前記少なくとも一つのキー値ブロックに含まれたキー値ペアをフィルタリング処理するステップと、
キー値ブロックのフィルタリング規則に従って、前記少なくとも一つのキー値ブロックをフィルタリング処理するするステップと、
を含む請求項4に記載のエンティティ関係データ生成方法。 - 前記ウェブページソースコードデータにおいて、前記少なくとも一つのキー値ブロックに対応するサブジェクト値を識別するステップの後に、
少なくとも一つの統計チェックテンプレート及び少なくとも一つの規則チェックテンプレートを使用して、前記少なくとも一つのキー値ブロックに対応するサブジェクト値に基づいて、前記少なくとも一つのキー値ブロックをフィルタリングするステップを含む請求項1から7のいずれか一項に記載のエンティティ関係データ生成方法。 - 前記目標ウェブページのユニフォームリソースロケータに対応する目標サイト内の各ウェブページにおいて、識別されたキー値ブロックに対応するサブジェクト値を処理サブジェクト値としてそれぞれ取得するステップと、
xpathが同一である目標処理サブジェクト値の数が第1の数閾値を超える場合、前記目標サブジェクト値のxpathと、前記目標サブジェクト値にそれぞれ対応するキー値ブロックとに基づいて、少なくとも一つの予備統計チェックテンプレートを構築するステップと、
予備統計チェックテンプレートにそれぞれ対応するキー値ブロックを取得するステップと、
一つの目標予備統計チェックテンプレートに対応する複数のキー値ブロックのうち同一のキー値ブロックの数が第2の数閾値を超える場合、前記予備統計チェックテンプレートにおいて当該目標予備統計チェックテンプレートを削除して、前記統計チェックテンプレートを取得するステップと、
を含む請求項8に記載のエンティティ関係データ生成方法。 - 前記キー値ブロックと前記キー値ブロックに対応するサブジェクト値とに基づいて、前記目標ウェブページに対応するエンティティ関係データを生成するステップが、
前記キー値ブロックに含まれた各キー値ペアと、前記キー値ブロックに対応するサブジェクト値と、をそれぞれ組み合わせて、トリプルデータを構築するステップと、
前記トリプルデータに含まれたキー名をサブジェクトオブジェクト関係値とし、キー名に対応するキー値をオブジェクト値として、前記エンティティ関係データを生成するステップと、
を含む請求項1から3のいずれか一項に記載のエンティティ関係データ生成方法。 - 目標ウェブページに対応するウェブページソースコードデータを取得するためのソースコード取得モジュールと、
前記ウェブページソースコードデータにおいて、少なくとも一つのキー値ペアを含む少なくとも一つのキー値ブロックを識別するためのキー値ブロック識別モジュールと、
前記ウェブページソースコードデータにおいて、前記少なくとも一つのキー値ブロックに対応するサブジェクト値を識別するためのサブジェクト値識別モジュールと、
前記キー値ブロックと前記キー値ブロックに対応するサブジェクト値とに基づいて、前記目標ウェブページに対応するエンティティ関係データを生成するためのデータ生成モジュールと、
を備え、
前記サブジェクト値識別モジュールが、
現在処理中の目標キー値ブロックが主キー値ブロックであり、前記ウェブページソースコードデータに第1のタグ条件を満たすエンティティページノードが含まれていることが決定された場合、エンティティページのスコアリング規則に従って、前記目標ウェブページがエンティティページであるか否かを判断し、
前記目標ウェブページがエンティティページである場合、前記エンティティページノードに対応するテキストデータを前記目標キー値ブロックのサブジェクト値とし、
前記主キー値ブロックは、前記ウェブページソースコードデータに対応する少なくとも一つのキー値ブロックのうち、含まれたキー値ペアの数が一番多い一つのキー値ブロックであるエンティティ関係データ生成装置。 - 目標ウェブページに対応するウェブページソースコードデータを取得するためのソースコード取得モジュールと、
前記ウェブページソースコードデータにおいて、少なくとも一つのキー値ペアを含む少なくとも一つのキー値ブロックを識別するためのキー値ブロック識別モジュールと、
前記ウェブページソースコードデータにおいて、前記少なくとも一つのキー値ブロックに対応するサブジェクト値を識別するためのサブジェクト値識別モジュールと、
前記キー値ブロックと前記キー値ブロックに対応するサブジェクト値とに基づいて、前記目標ウェブページに対応するエンティティ関係データを生成するためのデータ生成モジュールと、
を備え、
前記サブジェクト値識別モジュールが、
現在処理中の目標キー値ブロックに含まれたキー値ペアのキー名を、設定されたホワイトリストとマッチングし、
前記目標キー値ブロックに含まれた目標キー名が前記ホワイトリストにマッチングされると決定された場合、前記目標キー名に対応する目標キー値を、前記目標キー値ブロックのサブジェクト値として取得するエンティティ関係データ生成装置。 - 目標ウェブページに対応するウェブページソースコードデータを取得するためのソースコード取得モジュールと、
前記ウェブページソースコードデータにおいて、少なくとも一つのキー値ペアを含む少なくとも一つのキー値ブロックを識別するためのキー値ブロック識別モジュールと、
前記ウェブページソースコードデータにおいて、前記少なくとも一つのキー値ブロックに対応するサブジェクト値を識別するためのサブジェクト値識別モジュールと、
前記キー値ブロックと前記キー値ブロックに対応するサブジェクト値とに基づいて、前記目標ウェブページに対応するエンティティ関係データを生成するためのデータ生成モジュールと、
を備え、
前記サブジェクト値識別モジュールが、
前記目標ウェブページのユニフォームリソースロケータに基づいて、前記目標ウェブページに対応する目標サイトを決定し、
予め記憶されている前記目標サイトに対応する少なくとも一つの候補テンプレートを取得し、前記候補テンプレートに基づいて現在処理中のキー値ブロックに対応するサブジェクト値を識別し、
前記目標サイト内の候補テンプレートは、前記目標サイトの複数のウェブページをキー値ペア識別した後、識別結果によって生成されたものであるエンティティ関係データ生成装置。 - 一つ又は複数のプロセッサと、
一つ又は複数のプログラムを記憶するための記憶装置と、
を備え、
前記一つ又は複数のプログラムが前記一つ又は複数のプロセッサによって実行されると、前記一つ又は複数のプロセッサが、請求項1から10のいずれか一項に記載のエンティティ関係データ生成方法を実現するコンピュータ機器。 - コンピュータプログラムが記憶されているコンピュータ読み取り可能な記憶媒体であって、
当該プログラムがプロセッサによって実行される場合、請求項1から10のいずれか一項に記載のエンティティ関係データ生成方法が実現されることを特徴とする、コンピュータ読み取り可能な記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810928930.1A CN109325201A (zh) | 2018-08-15 | 2018-08-15 | 实体关系数据的生成方法、装置、设备及存储介质 |
CN201810928930.1 | 2018-08-15 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020027649A JP2020027649A (ja) | 2020-02-20 |
JP6901816B2 true JP6901816B2 (ja) | 2021-07-14 |
Family
ID=65263682
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019143724A Active JP6901816B2 (ja) | 2018-08-15 | 2019-08-05 | エンティティ関係データ生成方法、装置、機器、及び記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11321421B2 (ja) |
EP (1) | EP3611631A1 (ja) |
JP (1) | JP6901816B2 (ja) |
KR (1) | KR102237702B1 (ja) |
CN (1) | CN109325201A (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109325201A (zh) * | 2018-08-15 | 2019-02-12 | 北京百度网讯科技有限公司 | 实体关系数据的生成方法、装置、设备及存储介质 |
CN110263342A (zh) * | 2019-06-20 | 2019-09-20 | 北京百度网讯科技有限公司 | 实体的上下位关系的挖掘方法和装置、电子设备 |
CN112925856B (zh) * | 2019-12-06 | 2023-09-19 | 中国移动通信集团重庆有限公司 | 实体关系分析方法、装置、分析设备及计算机存储介质 |
CN111241209B (zh) * | 2020-01-03 | 2023-07-11 | 北京百度网讯科技有限公司 | 用于生成信息的方法和装置 |
CN111309200B (zh) | 2020-01-17 | 2021-11-12 | 百度在线网络技术(北京)有限公司 | 一种扩展阅读内容的确定方法、装置、设备及存储介质 |
CN111339125B (zh) * | 2020-02-24 | 2023-07-25 | 浪潮软件科技有限公司 | 数据查询方法及装置 |
CN111309972B (zh) * | 2020-02-25 | 2023-06-30 | 深圳市元征科技股份有限公司 | 一种数据处理方法、装置、终端设备及存储介质 |
CN113538450B (zh) * | 2020-04-21 | 2023-07-21 | 百度在线网络技术(北京)有限公司 | 用于生成图像的方法及装置 |
CN111967387B (zh) * | 2020-08-17 | 2023-05-26 | 北京市商汤科技开发有限公司 | 表单识别方法、装置、设备及计算机可读存储介质 |
CN112732196B (zh) * | 2021-01-13 | 2023-04-28 | 同盾科技有限公司 | 规则数据存储方法、装置及存储介质 |
CN113312489B (zh) * | 2021-04-13 | 2023-05-05 | 武汉烽火众智数字技术有限责任公司 | 一种基于nlp和图数据库的全景检索系统及方法 |
US20230004579A1 (en) * | 2021-07-02 | 2023-01-05 | Viettel Group | Method of controlling and handling a set of conditions in an event handling system with many complex internal conditions |
CN114065765A (zh) * | 2021-10-29 | 2022-02-18 | 北京来也网络科技有限公司 | 结合ai和rpa的武器装备文本处理方法、装置及电子设备 |
CN116975067B (zh) * | 2023-09-21 | 2023-12-26 | 北京四维纵横数据技术有限公司 | 无模式数据存储方法、装置、计算机设备及介质 |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030221162A1 (en) * | 2000-03-20 | 2003-11-27 | Sridhar Mandayam Andampillai | Meta-templates in website development and methods therefor |
US6993534B2 (en) * | 2002-05-08 | 2006-01-31 | International Business Machines Corporation | Data store for knowledge-based data mining system |
US8117203B2 (en) * | 2005-07-15 | 2012-02-14 | Fetch Technologies, Inc. | Method and system for automatically extracting data from web sites |
JP4427500B2 (ja) * | 2005-09-29 | 2010-03-10 | 株式会社東芝 | 意味解析装置、意味解析方法および意味解析プログラム |
WO2007137145A2 (en) * | 2006-05-17 | 2007-11-29 | Newsilike Media Group, Inc | Certificate-based search |
WO2008146807A1 (ja) * | 2007-05-31 | 2008-12-04 | Nec Corporation | オントロジ処理装置、オントロジ処理方法、及びオントロジ処理プログラム |
US20100057586A1 (en) * | 2008-09-04 | 2010-03-04 | China Software Venture | Offer Reporting Apparatus and Method |
US8826443B1 (en) * | 2008-09-18 | 2014-09-02 | Symantec Corporation | Selective removal of protected content from web requests sent to an interactive website |
US20100169311A1 (en) * | 2008-12-30 | 2010-07-01 | Ashwin Tengli | Approaches for the unsupervised creation of structural templates for electronic documents |
JP2010198058A (ja) * | 2009-02-23 | 2010-09-09 | Newswatch Inc | 文書処理システム及び方法 |
JP5325635B2 (ja) * | 2009-03-30 | 2013-10-23 | 株式会社野村総合研究所 | メタデータ自動付与システム及び方法 |
US8700682B2 (en) * | 2009-12-24 | 2014-04-15 | Vertafore, Inc. | Systems, methods and articles for template based generation of markup documents to access back office systems |
US8555157B1 (en) * | 2010-01-21 | 2013-10-08 | Google Inc. | Document update generation |
US8560610B2 (en) * | 2010-06-16 | 2013-10-15 | Brighttag Inc. | Unified collection and distribution of data |
GB2486002A (en) * | 2010-11-30 | 2012-06-06 | Youview Tv Ltd | Media Content Provision |
GB201108709D0 (en) * | 2011-05-24 | 2011-07-06 | Corethree Ltd | Core engine |
US8793273B1 (en) * | 2011-06-29 | 2014-07-29 | Google Inc. | Parsing framework method and device |
US20130031457A1 (en) * | 2011-07-28 | 2013-01-31 | Peter Griffiths | System for Creating and Editing Temporal Annotations of Documents |
US10129211B2 (en) * | 2011-09-15 | 2018-11-13 | Stephan HEATH | Methods and/or systems for an online and/or mobile privacy and/or security encryption technologies used in cloud computing with the combination of data mining and/or encryption of user's personal data and/or location data for marketing of internet posted promotions, social messaging or offers using multiple devices, browsers, operating systems, networks, fiber optic communications, multichannel platforms |
JP5756386B2 (ja) * | 2011-09-30 | 2015-07-29 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 動的なウェブ・アプリケーションの問題を修正するメタデータの生成・管理の支援方法、装置、およびプログラム |
KR101510647B1 (ko) * | 2011-10-07 | 2015-04-10 | 한국전자통신연구원 | 이슈 템플릿 추출 기반의 웹 동향 분석 방법 및 장치 |
US10289658B1 (en) * | 2013-03-13 | 2019-05-14 | Ca, Inc. | Web page design scanner |
US10061687B2 (en) * | 2014-06-17 | 2018-08-28 | Paypal, Inc. | Self-learning and self-validating declarative testing |
US11080295B2 (en) * | 2014-11-11 | 2021-08-03 | Adobe Inc. | Collecting, organizing, and searching knowledge about a dataset |
CN104516949B (zh) * | 2014-12-10 | 2018-12-25 | 北京百度网讯科技有限公司 | 网页数据处理方法和装置、查询处理方法及问答系统 |
US9596265B2 (en) * | 2015-05-13 | 2017-03-14 | Google Inc. | Identifying phishing communications using templates |
CN104933168B (zh) * | 2015-06-30 | 2018-08-14 | 南京烽火星空通信发展有限公司 | 一种网页内容自动采集方法 |
US10769426B2 (en) * | 2015-09-30 | 2020-09-08 | Microsoft Technology Licensing, Llc | Inferring attributes of organizations using member graph |
CN107169079B (zh) * | 2017-05-10 | 2019-09-20 | 浙江大学 | 一种基于Deepdive的领域文本知识抽取方法 |
CN107590219A (zh) * | 2017-09-04 | 2018-01-16 | 电子科技大学 | 网页人物主题相关信息提取方法 |
US10810110B1 (en) * | 2018-01-25 | 2020-10-20 | Intuit Inc. | Methods, systems, and articles of manufacture for testing web services using a behavior-driven development domain specific language framework |
CN108363816A (zh) * | 2018-03-21 | 2018-08-03 | 北京理工大学 | 基于句义结构模型的开放式实体关系抽取方法 |
US10885018B2 (en) * | 2018-05-07 | 2021-01-05 | Microsoft Technology Licensing, Llc | Containerization for elastic and scalable databases |
CN109325201A (zh) * | 2018-08-15 | 2019-02-12 | 北京百度网讯科技有限公司 | 实体关系数据的生成方法、装置、设备及存储介质 |
-
2018
- 2018-08-15 CN CN201810928930.1A patent/CN109325201A/zh active Pending
-
2019
- 2019-07-16 KR KR1020190085858A patent/KR102237702B1/ko active IP Right Grant
- 2019-08-05 EP EP19189957.4A patent/EP3611631A1/en active Pending
- 2019-08-05 JP JP2019143724A patent/JP6901816B2/ja active Active
- 2019-08-13 US US16/539,796 patent/US11321421B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2020027649A (ja) | 2020-02-20 |
US20200057788A1 (en) | 2020-02-20 |
KR20200019824A (ko) | 2020-02-25 |
US11321421B2 (en) | 2022-05-03 |
KR102237702B1 (ko) | 2021-04-08 |
EP3611631A1 (en) | 2020-02-19 |
CN109325201A (zh) | 2019-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6901816B2 (ja) | エンティティ関係データ生成方法、装置、機器、及び記憶媒体 | |
CN106919655B (zh) | 一种答案提供方法和装置 | |
US10755048B2 (en) | Artificial intelligence based method and apparatus for segmenting sentence | |
CN107992585B (zh) | 通用标签挖掘方法、装置、服务器及介质 | |
JP2020520485A (ja) | 視覚的分析との相互作用のため語用論の原理を適用するシステムおよび方法 | |
US8577882B2 (en) | Method and system for searching multilingual documents | |
US20220318275A1 (en) | Search method, electronic device and storage medium | |
JP7301922B2 (ja) | 意味検索方法、装置、電子機器、記憶媒体およびコンピュータプログラム | |
EP3343400A1 (en) | System and method for dynamically creating a domain ontology | |
US10437894B2 (en) | Method and system for app search engine leveraging user reviews | |
CN112287069B (zh) | 基于语音语义的信息检索方法、装置及计算机设备 | |
WO2021134524A1 (zh) | 数据处理方法、装置、电子设备和存储介质 | |
CN112131881B (zh) | 信息抽取方法及装置、电子设备、存储介质 | |
US9940355B2 (en) | Providing answers to questions having both rankable and probabilistic components | |
CN107861948B (zh) | 一种标签提取方法、装置、设备和介质 | |
CN110825941A (zh) | 一种内容管理系统识别方法、装置和存储介质 | |
CN113986864A (zh) | 日志数据处理方法、装置、电子设备及存储介质 | |
US20230114673A1 (en) | Method for recognizing token, electronic device and storage medium | |
CN112579729A (zh) | 文档质量评价模型的训练方法、装置、电子设备和介质 | |
JP2023544925A (ja) | データ評価方法、トレーニング方法および装置、電子機器、記憶媒体、コンピュータプログラム | |
CN114141384A (zh) | 用于检索医学数据的方法、设备和介质 | |
CN116383412B (zh) | 基于知识图谱的功能点扩增方法和系统 | |
KR102483004B1 (ko) | 유해 url 탐지 방법 | |
CN115858776A (zh) | 一种变体文本分类识别方法、系统、存储介质和电子设备 | |
US20140164432A1 (en) | Ontology enhancement method and system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190805 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200929 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201218 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210608 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210616 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6901816 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |