JP7300475B2 - エンティティ関係マイニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム - Google Patents

エンティティ関係マイニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム Download PDF

Info

Publication number
JP7300475B2
JP7300475B2 JP2021053538A JP2021053538A JP7300475B2 JP 7300475 B2 JP7300475 B2 JP 7300475B2 JP 2021053538 A JP2021053538 A JP 2021053538A JP 2021053538 A JP2021053538 A JP 2021053538A JP 7300475 B2 JP7300475 B2 JP 7300475B2
Authority
JP
Japan
Prior art keywords
entity word
target entity
search
sentence
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021053538A
Other languages
English (en)
Other versions
JP2022003509A (ja
Inventor
レイ、キアン
ション、ヂュアン
ヤオ、ホウチン
シ、ペン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2022003509A publication Critical patent/JP2022003509A/ja
Application granted granted Critical
Publication of JP7300475B2 publication Critical patent/JP7300475B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Fuzzy Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本出願は、コンピュータ技術分野に関し、さらに人工知能及び深層学習の分野、特にエンティティ関係マイニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラムに関する。
一般に、ユーザの検索ニーズの大部分は客観的な知識型ニーズである。ユーザをよりよく満たすために、検索エンジンはユーザに検索サービスを提供する時、異なるニーズシナリオに対して異なるユーザのニーズを満たすように、ユーザのニーズを深く理解する必要がある。客観的な知識型ニーズの検索シナリオでは、需要者群、需要形態などの深い理解に加えて、知識の分類階層、知識のコア、拡張、及びユーザの知識に対する需要点を含む知識点自体の深い理解が必要である。知識点を深く理解することは、検索と推薦のユーザーエクスペリエンスを向上させるのに大きく役立つ。
知識点の深い理解というと、一般には、知識を分類して階層化することを意味し、例えば、動植物の学術分類体系では、「蘭花」の分類階層は、植物界->被子植物門->単子葉植物綱->微子目->蘭科->蘭亜科->樹蘭族->蘭属であり、また、例えば、学科分類体系では、「確率変数」の分類階層は、数学->確率論->基本概念である。ユーザは、上位階層に従ってトレースバックしたり、同一階層で展開したりすることで、より多くの知識を得ることができる。しかし、既存の分類体系では、多くの場合、粒度が粗すぎるという問題があり、一般に、分類体系はエンティティワードを葉ノードとして、そこにとどまっている。しかし、実際の検索シナリオでは、ユーザにはエンティティワードに対する更なる階層化のニーズがあり、例えば、ゲーム「乱世王者」では、ユーザのニーズは「乱世王者」そのものにとどまるのではなく、「白虎」、「長平の戦い」、「兵種」など、ゲームエンティティ「乱世王者」に関する下位コンテンツに集中する可能性がある。
従来技術では、通常、以下の2種類のエンティティ関係マイニング方法を採用している。1)人工方式を採用している。大量の運営人力が必要とされ、コストが高すぎて、しかも、ユーザの需要の変動が頻繁ではないロングテールエンティティに対しては、この方式は運営人力コストの浪費をもたらしている。また、時効性の高いエンティティでは、人件費が高くなる。2)高周波数タグ方式を採用している。最終的なマイニング結果はタグに大きく依存している。タグの正確性が保証されていない場合は、関連するタグが後で生成されたときに、誤差が最終的なマイニング結果に反映される。
本出願は、異なるエンティティワードの間の関係をより正確にマイニングすることができ、それにより、ユーザーの検索ニーズを満たし、人件費の節約及びマイニング効率向上という目的を達成するエンティティ関係マイニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラムを提供する。
第1の態様では、本出願は、
ターゲットエンティティワードに対応する所定条件を満たす検索文を検索文集合において検索するステップと、
前記ターゲットエンティティワードに対応する所定条件を満たす検索文が前記検索文集合において少なくとも1つ検索されると、前記ターゲットエンティティワードに対応する所定条件を満たす検索文に基づいて前記ターゲットエンティティワードに対応する関連エンティティワードをマイニングするステップとを含むエンティティ関係マイニング方法を提供する。
第2の態様では、本出願は、検索モジュールとマイニングモジュールを含み、
前記検索モジュールは、ターゲットエンティティワードに対応する所定条件を満たす検索文を検索文集合において検索することに用いられ、
前記マイニングモジュールは、前記ターゲットエンティティワードに対応する所定条件を満たす検索文が前記検索文集合において少なくとも1つ検索されると、前記ターゲットエンティティワードに対応する所定条件を満たす検索文に基づいて前記ターゲットエンティティワードに対応する関連エンティティワードをマイニングすることに用いられる、エンティティ関係マイニング装置を提供する。
第3の態様では、本出願の実施例は、
1つ又は複数のプロセッサと、
1つ又は複数のプログラムを記憶するためのメモリとを含み、
前記1つ又は複数のプログラムは前記1つ又は複数のプロセッサにより実行されると、本出願の任意の実施例に記載のエンティティ関係マイニング方法を前記1つ又は複数のプロセッサに実現させる電子デバイスを提供する。
第4の態様では、本出願の実施例は、プロセッサにより実行されると、本出願の任意の実施例に記載のエンティティ関係マイニング方法を実現するコンピュータプログラムが記憶されている記憶媒体を提供する。
第5の態様では、本出願の実施例は、プロセッサにより実行されると、本出願の任意の実施例に記載のエンティティ関係マイニング方法を実現するコンピュータプログラムを提供する。
本出願の技術によれば、人工方式を採用すると大量の運営人力が必要とされ、コストが高すぎ、高周波数タグの方式を採用するとタグに大きく依存するという従来技術の技術的課題を解决し、本出願による技術案は、異なるエンティティワードの間の関係をより正確にマイニングすることができ、それにより、ユーザーの検索ニーズを満たし、人件費の節約及びマイニング効率向上という目的を達成する。
なお、本部分で記載されるコンテンツは、本開示の実施例のキーとなる又は重要な特徴を表すことを意図しておらず、また本開示の範囲を制限するものでもない。本開示の他の特徴は、以下の明細書により理解されやすくなる。
図面は、本解決手段をより理解しやすくするために過ぎず、本出願の限定を構成していない。
本出願の実施例1によるエンティティ関係マイニング方法の模式的フローチャートである。 本出願の実施例2によるエンティティ関係マイニング方法の模式的フローチャートである。 本出願の実施例3によるエンティティ関係マイニング方法の模式的フローチャートである。 本出願の実施例3によるエンティティ層構造の模式図である。 本出願の実施例4によるエンティティ関係マイニング方法の模式的フローチャートである。 本出願の実施例5によるエンティティ関係マイニング装置の構造模式図である。 本出願の実施例5による検索モジュールの構造模式図である。 本出願の実施例5によるマイニングモジュールの構造模式図である。 本出願の実施例のエンティティ関係マイニング方法を実現するための電子デバイスのブロック図である。
以下、図面を参照して本出願の例示的な実施例を説明し、理解しやすくするためにこの説明には本出願の実施例のさまざまな詳細が含まれており、このような詳細は例示的なものとして理解すべきである。したがって、当業者が理解できるように、本出願の範囲及び主旨を逸脱することなく、ここで記載された実施例についてさまざまな変化及び修正を行うことができる。同様に、明瞭さ及び簡素化から、以下の記載には、公知の機能及び構造の記載が省略される。
実施例1
図1は本出願の実施例1によるエンティティ関係マイニング方法の模式的フローチャートであり、該方法は、エンティティ関係マイニング装置又は電子デバイスにより実行されてもよく、該装置又は電子デバイスはソフトウェア及び/又はハードウェアの形態で実現されてもよく、該装置又は電子デバイスは、ネットワーク通信機能を有する任意のスマート機器に集成されてもよい。図1に示すように、エンティティ関係マイニング方法は、ステップS101とステップS102を含むことができる。
S101で、ターゲットエンティティワードに対応する所定条件を満たす検索文を検索文集合において検索する。
本出願の特定実施例では、電子デバイスは、ターゲットエンティティワードに対応する所定条件を満たす検索文を検索文集合において検索する。具体的には、電子デバイスは、所定周期に従ってターゲットエンティティワードに対応する所定条件を満たす検索文を検索文集合において検索する。一実施例では、電子デバイスは、まず検索文集合においてターゲットエンティティワードを検索し、ターゲットエンティティを含む検索文が検索文集合において少なくとも1つ検索されると、さらに、ターゲットエンティティワードを含む検索文のうちターゲットエンティティワードに対応する文構造条件を満たす検索文が少なくとも1つ存在するか否かを検出し、ターゲットエンティティワードを含む検索文のうちターゲットエンティティワードに対応する文構造条件を満たす検索文が少なくとも1つ存在すると、電子デバイス可以ターゲットエンティティワードに対応する所定条件を満たす検索文が検索文集合において検索されたと判定し、ターゲットエンティティを含む検索文が検索文集合において検索されていないか、又は、ターゲットエンティティワードを含む検索のうちターゲットエンティティワードに対応する文構造条件を満たす検索文が存在しないと、ターゲットエンティティワードに対応する所定条件を満たす検索文が検索文集合において検索されていないと判定する。
S102で、ターゲットエンティティワードに対応する所定条件を満たす検索文が検索文集合において少なくとも1つ検索されると、ターゲットエンティティワードに対応する所定条件を満たす検索文に基づいてターゲットエンティティワードに対応する関連エンティティワードをマイニングする。
本出願の特定実施例では、ターゲットエンティティワードに対応する所定条件を満たす検索文が検索文集合において少なくとも1つ検索されると、電子デバイスは、ターゲットエンティティワードに対応する所定条件を満たす検索文ターゲットに基づいてエンティティワードに対応する関連エンティティワードをマイニングする。一実施例では、電子デバイスは、まず、ターゲットエンティティワードに対応する所定条件を満たす検索文に基づいてターゲットエンティティワードに対応する少なくとも1つの第2レベルのエンティティワードをマイニングし、次に、ターゲットエンティティワードをターゲットエンティティワードに対応する第2レベルのエンティティワードのそれぞれとマージして1つの新しいターゲットエンティティワードとし、新しいターゲットエンティティワードに対応する所定条件を満たす検索文を検索文集合において検索し、新しいターゲットエンティティワードに対応する所定条件を満たす検索文が検索文集合において少なくとも1つ検索されると、新しいターゲットエンティティワードに対応する所定条件を満たす検索文に基づいて、ターゲットエンティティワードに対応する第3レベルのエンティティワードをマイニングする。
本出願の実施例によるエンティティ関係マイニング方法では、まず、ターゲットエンティティワードに対応する所定条件を満たす検索文を検索文集合において検索し、ターゲットエンティティワードに対応する所定条件を満たす検索文が検索文集合において少なくとも1つ検索されると、ターゲットエンティティワードに対応する所定条件を満たす検索文に基づいてターゲットエンティティワードに対応する関連エンティティワードをマイニングする。つまり、本出願では、ターゲットエンティティワードに対応する関連エンティティワードを検索文集合においてマイニングすることができる。ただし、従来のエンティティ関係マイニング方法では、人工方式を採用すると大量の運営人力が必要とされ、コストが高すぎ、高周波数タグ方式を採用するとタグに大きく依存する。本出願では、検索文集合に基づいてターゲットエンティティワードをマイニングする技術手段が使用されているので、人工方式を採用すると大量の運営人力が必要とされ、コストが高すぎ、及び高周波数タグ方式を採用するとタグに大きく依存するという従来技術の技術的課題を解決し、本出願による技術案は、異なるエンティティワードの間の関係をより正確にマイニングすることができ、それにより、ユーザーの検索ニーズを満たし、人件費の節約及びマイニング効率向上という目的を達成し、さらに、本出願の実施例の技術案は、簡便に実施でき、普及させるのが容易であり、適用範囲が広がる。
実施例2
図2は本出願の実施例2によるエンティティ関係マイニング方法の模式的フローチャートである。図2に示すように、エンティティ関係マイニング方法は、ステップS201~ステップS204を含むことができる。
S201で、ターゲットエンティティワードを検索文集合において検索する。
本出願の特定実施例では、電子デバイスは、ターゲットエンティティワードを検索文集合において検索する。具体的には、電子デバイスは、所定周期に従ってターゲットエンティティワードを検索文集合において検索する。検索文集合は、予め構築されたフルquery集合であり、この集合にはN個のqueryが含まれ、ここで、Nは1以上の自然数である。
S202で、ターゲットエンティティを含む検索文が検索文集合において少なくとも1つ検索されると、ターゲットエンティティワードを含む検索文のうちターゲットエンティティワードに対応する文構造条件を満たす検索文が少なくとも1つ存在するか否かを検出する。
本出願の特定実施例では、ターゲットエンティティを含む検索文が検索文集合において少なくとも1つ検索されると、電子デバイスは、ターゲットエンティティワードを含む検索文のうちターゲットエンティティワードに対応する文構造条件を満たす検索文が少なくとも1つ存在するか否かを検出する。一実施例では、電子デバイスは、ターゲットエンティティワードを含む検索文の中から1つの検索文を抽出して、ターゲットエンティティワードを含む現在検索文とし、ターゲットエンティティワードを含む現在検索文中の一番目の名詞がターゲットエンティティワードであり、且つターゲットエンティティワードの後に1つだけの名詞があると、ターゲットエンティティワードを含む現在検索文がターゲットエンティティワードに対応する文構造条件を満たす検索文であると判定し、それ以外の場合、ターゲットエンティティワードを含む現在検索文がターゲットエンティティワードに対応する文構造条件を満たす検索文ではないと判定し、ターゲットエンティティワードを含む各検索文についてターゲットエンティティワードに対応する文構造条件を満たすか否かが検出されるまで、上記操作を繰り返して実行する。
S203で、ターゲットエンティティワードを含む検索文のうちターゲットエンティティワードに対応する文構造条件を満たす検索文が少なくとも1つ存在すると、ターゲットエンティティワードに対応する所定条件を満たす検索文が検索文集合において検索されたと判定する。
本出願の特定実施例では、ターゲットエンティティワードを含む検索文のうちターゲットエンティティワードに対応する文構造条件を満たす検索文が少なくとも1つ存在すると、電子デバイスは、ターゲットエンティティワードに対応する所定条件を満たす検索文が検索文集合において検索されたと判定し、ターゲットエンティティワードを含む検索のうちターゲットエンティティワードに対応する文構造条件を満たす検索文が存在しないと、ターゲットエンティティワードに対応する所定条件を満たす検索文が検索文集合において検索されていないと判定する。
S204で、ターゲットエンティティワードを含む検索文のうち所定条件を満たす検索文が少なくとも1つ存在すると、ターゲットエンティティワードに対応する所定条件を満たす検索文に基づいてターゲットエンティティワードに対応する関連エンティティワードをマイニングする。
本出願の実施例によるエンティティ関係マイニング方法では、まず、ターゲットエンティティワードに対応する所定条件を満たす検索文を検索文集合において検索し、ターゲットエンティティワードに対応する所定条件を満たす検索文が検索文集合において少なくとも1つ検索されると、ターゲットエンティティワードに対応する所定条件を満たす検索文に基づいてターゲットエンティティワードに対応する関連エンティティワードをマイニングする。つまり、本出願では、ターゲットエンティティワードに対応する関連エンティティワードを検索文集合においてマイニングすることができる。一方、従来のエンティティ関係マイニング方法では、人工方式を採用すると大量の運営人力が必要とされ、コストが高すぎ、高周波数タグ方式を採用するとタグに大きく依存する。本出願では、検索文集合に基づいてターゲットエンティティワードをマイニングする技術手段が使用されているので、人工方式を採用すると大量の運営人力が必要とされ、コストが高すぎ、高周波数タグ方式を採用するとタグに大きく依存するという従来技術の技術的課題を解決し、本出願による技術案は、異なるエンティティワードの間の関係をより正確にマイニングすることができ、それにより、ユーザーの検索ニーズを満たし、人件費の節約及びマイニング効率向上という目的を達成し、さらに、本出願の実施例の技術案は簡便に実施でき、普及させるのが容易であり、適用範囲が広がる。
実施例3
図3は本出願の実施例3によるエンティティ関係マイニング方法の模式的フローチャートである。図3に示すように、エンティティ関係マイニング方法は、ステップS301~S305を含むことができる。
S301で、ターゲットエンティティワードを検索文集合において検索する。
S302で、ターゲットエンティティを含む検索文が検索文集合において少なくとも1つ検索されると、ターゲットエンティティワードを含む検索文の中から1つの検索文を抽出して、ターゲットエンティティワードを含む現在検索文とする。
本出願の特定実施例では、ターゲットエンティティを含む検索文が検索文集合において少なくとも1つ検索されると、電子デバイスは、ターゲットエンティティワードを含む検索文の中から1つの検索文を抽出して、ターゲットエンティティワードを含む現在検索文とする。たとえば、3つのターゲットエンティティを含む検索文が検索文集合において検索されたとすれば、まず、一番目のターゲットエンティティを含む検索文を現在検索文とし、現在検索文(即ち一番目のターゲットエンティティを含む検索文)がターゲットエンティティワードに対応する文構造条件を満たすか否かを検出し、次に、二番目のターゲットエンティティを含む検索文を現在検索文とし、現在検索文(即ち二番目のターゲットエンティティを含む検索文)がターゲットエンティティワードに対応する文構造条件を満たすか否かを検出し、さらに、三番目のターゲットエンティティを含む検索文を現在検索文とし、現在検索文(即ち三番目のターゲットエンティティを含む検索文)がターゲットエンティティワードに対応する文構造条件を満たすか否かを検出する。
S303で、ターゲットエンティティワードを含む現在検索文中の一番目の名詞がターゲットエンティティワードであり、且つターゲットエンティティワードの後に1つだけの名詞があると、ターゲットエンティティワードを含む現在検索文がターゲットエンティティワードに対応する文構造条件を満たす検索文であると判定し、ターゲットエンティティワードを含む各検索文についてターゲットエンティティワードに対応する文構造条件を満たすか否かが検出されるまで、上記操作を繰り返して実行する。
本出願の特定実施例では、ターゲットエンティティワードを含む現在検索文中の一番目の名詞がターゲットエンティティワードであり、且つターゲットエンティティワードの後に1つだけの名詞があると、電子デバイスは、ターゲットエンティティワードを含む現在検索文がターゲットエンティティワードに対応する文構造条件を満たす検索文であると判定し、ターゲットエンティティワードを含む各検索文についてターゲットエンティティワードに対応する文構造条件を満たすか否かが検出されるまで、上記操作を繰り返して実行する。たとえば、ターゲットエンティティワードが「乱世王者」であり、現在検索文が「乱世王者の白虎」であるとすれば、現在検索文中の一番目の名詞が「乱世王者」であり、且つ「乱世王者」の後に「白虎」だけがあるため、電子デバイスは、この現在検索文がターゲットエンティティワードに対応する文構造条件を満たすと判定する。
S304で、ターゲットエンティティワードを含む検索文のうちターゲットエンティティワードに対応する文構造条件を満たす検索文が少なくとも1つ存在すると、ターゲットエンティティワードに対応する所定条件を満たす検索文が検索文集合において検索されたと判定する。
本出願の特定実施例では、電子デバイスは、ターゲットエンティティワードを含む検索文のうちターゲットエンティティワードに対応する文構造条件を満たす検索文が少なくとも1つ存在すると、ターゲットエンティティワードに対応する所定条件を満たす検索文が検索文集合において検索されたと判定し、ターゲットエンティティワードを含む検索のうちターゲットエンティティワードに対応する文構造条件を満たす検索文が存在しないと、ターゲットエンティティワードに対応する所定条件を満たす検索文が検索文集合において検索されていないと判定する。
S305で、ターゲットエンティティワードに対応する所定条件を満たす検索文が検索文集合において少なくとも1つ検索されると、ターゲットエンティティワードに対応する所定条件を満たす検索文に基づいてターゲットエンティティワードに対応する関連エンティティワードをマイニングする。
図4は、本出願の実施例3によるエンティティ層構造の模式図である。図4に示すように、ターゲットエンティティワードが「乱世王者」であるとすれば、電子デバイスは、検索文集合において検索したところ、「乱世王者」を含む検索文が「乱世王者の白虎」、「乱世王者の長平の戦い」及び「乱世王者の兵種」であり、この場合、電子デバイスは、上記の「乱世王者」を含む検索文から「乱世王者」に対応する第2レベルのエンティティワードとして、それぞれ「白虎」、「長平の戦い」及び「兵種」をマイニングする。次に、電子デバイスは、「乱世王者」を「白虎」とマージして1つの新しいターゲットエンティティワードとし、この新しいターゲットエンティティワードを検索文集合において検索し、この新しいターゲットエンティティワードが検索文集合において検索されていないとすれば、「白虎」の次のレベルのエンティティワードが存在せず、同様に、電子デバイスは、「乱世王者」を「長平の戦い」とマージして1つの新しいターゲットエンティティワードとし、この新しいターゲットエンティティワードを検索文集合において検索し、検索文集合において検索したところ、この新しいターゲットエンティティワードを含む検索文は「乱世王者の長平の戦いからの撤退」及び「乱世王者の長平の戦いのスコアリング」であり、この場合、この2つの検索文からマイニングしたところ、「長平の戦い」の次のレベルのエンティティワードが「撤退」及び「スコアリング」であり、同様に、電子デバイスは、「兵種」の次のレベルのエンティティワードとして「攻略」及び「克制表」をマイニングすることもできる。
本出願の実施例によるエンティティ関係マイニング方法では、まず、ターゲットエンティティワードに対応する所定条件を満たす検索文を検索文集合において検索し、ターゲットエンティティワードに対応する所定条件を満たす検索文が検索文集合において少なくとも1つ検索されると、ターゲットエンティティワードに対応する所定条件を満たす検索文に基づいてターゲットエンティティワードに対応する関連エンティティワードをマイニングする。つまり、本出願では、検索文集合に基づいてターゲットエンティティワードに対応する関連エンティティワードをマイニングすることができる。一方、従来のエンティティ関係マイニング方法では、人工方式を採用すると大量の運営人力が必要とされ、コストが高すぎ、高周波数タグ方式を採用するとタグに大きく依存する。本出願では、検索文集合に基づいてターゲットエンティティワードをマイニングする技術手段が使用されているので、人工方式を採用すると大量の運営人力が必要とされ、コストが高すぎ、高周波数タグ方式を採用するとタグに大きく依存するという従来技術の技術的課題を解決し、本出願による技術案は、異なるエンティティワードの間の関係をより正確にマイニングすることができ、それにより、ユーザーの検索ニーズを満たし、人件費の節約及びマイニング効率向上という目的を達成し、さらに、本出願の実施例の技術案は簡便に実施でき、普及させるのが容易であり、適用範囲が広がる。
実施例4
図5は、本出願の実施例4によるエンティティ関係マイニング方法の模式的フローチャートである。図5に示すように、エンティティ関係マイニング方法は、ステップS501~S507を含むことができる。
S501で、ターゲットエンティティワードを検索文集合において検索する。
S502で、ターゲットエンティティを含む検索文が検索文集合において少なくとも1つ検索されると、ターゲットエンティティワードを含む検索文の中から1つの検索文を抽出して、ターゲットエンティティワードを含む現在検索文とする。
S503で、ターゲットエンティティワードを含む現在検索文中の一番目の名詞がターゲットエンティティワードであり、且つターゲットエンティティワードの後に1つだけの名詞があると、ターゲットエンティティワードを含む現在検索文がターゲットエンティティワードに対応する文構造条件を満たす検索文であると判定し、ターゲットエンティティワードを含む各検索文についてターゲットエンティティワードに対応する文構造条件を満たすか否かが検出されるまで、上記操作を繰り返して実行する。
S504で、ターゲットエンティティワードを含む検索文のうちターゲットエンティティワードに対応する文構造条件を満たす検索文が少なくとも1つ存在すると、ターゲットエンティティワードに対応する所定条件を満たす検索文が検索文集合において検索されたと判定する。
S505で、ターゲットエンティティワードに対応する所定条件を満たす検索文が検索文集合において少なくとも1つ検索されると、ターゲットエンティティワードに対応する所定条件を満たす検索文に基づいてターゲットエンティティワードに対応する少なくとも1つの第2レベルのエンティティワードをマイニングする。
本出願の特定実施例では、電子デバイスは、ターゲットエンティティワードに対応する所定条件を満たす検索文が検索文集合において少なくとも1つ検索されると、ターゲットエンティティワードに対応する所定条件を満たす検索文に基づいてターゲットエンティティワードに対応する少なくとも1つの第2レベルのエンティティワードをマイニングする。一実施例では、電子デバイスは、まず、ターゲットエンティティワードに対応する所定条件を満たす検索文の中から1つの検索文を抽出して、ターゲットエンティティワードに対応する所定条件を満たす現在検索文とし、次に、ターゲットエンティティワードに対応する所定条件を満たす現在検索文に基づいて、ターゲットエンティティワードに対応する第2レベルのエンティティワードをマイニングし、ターゲットエンティティワードに対応する所定条件を満たす検索文のそれぞれにおいてターゲットエンティティワードに対応する少なくとも1つの第2レベルのエンティティワードをマイニングするまで、上記操作を繰り返して実行する。
S506で、ターゲットエンティティワードをターゲットエンティティワードに対応する第2レベルのエンティティワードのそれぞれとマージして1つの新しいターゲットエンティティワードとし、新しいターゲットエンティティワードに対応する所定条件を満たす検索文を検索文集合において検索する。
本出願の特定実施例では、電子デバイスは、ターゲットエンティティワードをターゲットエンティティワードに対応する第2レベルのエンティティワードのそれぞれとマージして1つの新しいターゲットエンティティワードとし、新しいターゲットエンティティワードに対応する所定条件を満たす検索文を検索文集合において検索する。具体的には、電子デバイスは、ターゲットエンティティワードをターゲットエンティティワードに対応する第2レベルのエンティティワードのそれぞれと直接組み合わせてもよく、ターゲットエンティティワードとターゲットエンティティワードに対応する第2レベルのエンティティワードのそれぞれとの間に、たとえば副詞、接置詞、接続詞、助詞など、予め設定された機能語を追加してもよい。一実施例では、電子デバイスは、新しいターゲットエンティティワードを検索文集合において検索し、新しいターゲットエンティティワードを含む検索文が検索文集合において少なくとも1つ検索されると、新しいターゲットエンティティワードを含む検索文のうち新しいターゲットエンティティワードに対応する文構造条件を満たす検索文が少なくとも1つ存在するか否かを検出し、新しいターゲットエンティティワードを含む検索文のうち新しいターゲットエンティティワードに対応する文構造条件を満たす検索文が少なくとも1つ存在すると、新しいターゲットエンティティワードに対応する所定条件を満たす検索文が検索文集合において検索されたと判定する。さらに、電子デバイスは、新しいターゲットエンティティワードを含む検索文の中から1つの検索文を抽出して、新しいターゲットエンティティワードを含む現在検索文とし、新しいターゲットエンティティワードを含む現在検索文中の一番目の名詞が新しいターゲットエンティティワードであり、且つ新しいターゲットエンティティワードの後に1つだけの名詞又は1つだけの動詞があると、新しいターゲットエンティティワードを含む現在検索文が新しいターゲットエンティティワードに対応する文構造を満たす検索文であると判定し、新しいターゲットエンティティワードを含む検索文のうち新しいターゲットエンティティワードに対応する文構造を満たすすべての検索文が抽出されるまで、上記操作を繰り返して実行する。
S507で、新しいターゲットエンティティワードに対応する所定条件を満たす検索文が検索文集合において少なくとも1つ検索されると、新しいターゲットエンティティワードに対応する所定条件を満たす検索文に基づいて、ターゲットエンティティワードに対応する第3レベルのエンティティワードをマイニングする。
本出願の特定実施例では、電子デバイスは、新しいターゲットエンティティワードに対応する所定条件を満たす検索文が検索文集合において少なくとも1つ検索されると、可以新しいターゲットエンティティワードに対応する所定条件を満たす検索文に基づいて、ターゲットエンティティワードに対応する第3レベルのエンティティワードをマイニングする。たとえば、ターゲットエンティティワードが「乱世王者」であるとすれば、電子デバイスは、検索文集合において検索したところ、「乱世王者」を含む検索文が「乱世王者の長平の戦い」であり、この場合、電子デバイスは、「乱世王者の長平の戦い」から「乱世王者」に対応する第2レベルのエンティティワード:「長平の戦い」をマイニングする。次に、電子デバイスは、「乱世王者」を「長平の戦い」とマージして1つの新しいターゲットエンティティワードとし、この新しいターゲットエンティティワードを検索文集合において検索し、検索文集合において検索したところ、この新しいターゲットエンティティワードを含む検索文が「乱世王者の長平の戦いからの撤退」及び「乱世王者の長平の戦いのスコアリング」であり、この場合、この2つの検索文に基づいて「長平の戦い」の次のレベルのエンティティワードとして「撤退」及び「スコアリング」をマイニングする。
好ましくは、本出願の特定実施例では、電子デバイスは、ターゲットエンティティワードに対応する関連エンティティワードをマイニングした後、マイニングしたターゲットエンティティワードに対応する関連エンティティワードをチェックする。一実施例では、電子デバイスは、ターゲットエンティティワードに対応する関連エンティティワードの中から1つのエンティティワードを抽出してターゲットエンティティワードに対応する現在関連エンティティワードとし、次に、ターゲットエンティティワード及びターゲットエンティティワードに対応する現在関連エンティティワードへの所定期間内のアクセス頻度又はアクセス回数を統計し、ターゲットエンティティワード及びターゲットエンティティワードに対応する現在関連エンティティワードへの所定期間内のアクセス頻度が所定頻度しきい値よりも大きいか、又は、ターゲットエンティティワード及びターゲットエンティティワードに対応する現在関連エンティティワードへの所定期間内のアクセス回数が所定回数しきい値よりも大きいと、電子デバイスは、ターゲットエンティティワードに対応する現在関連エンティティワードが成立すると判定し、ターゲットエンティティワードに対応する各関連エンティティワードが成立するか否かがチェックされるまで、上記操作を繰り返して実行する。
本出願の実施例によるエンティティ関係マイニング方法では、まず、ターゲットエンティティワードに対応する所定条件を満たす検索文を検索文集合において検索し、ターゲットエンティティワードに対応する所定条件を満たす検索文が検索文集合において少なくとも1つ検索されると、ターゲットエンティティワードに対応する所定条件を満たす検索文に基づいてターゲットエンティティワードに対応する関連エンティティワードをマイニングする。つまり、本出願では、ターゲットエンティティワードに対応する関連エンティティワードを検索文集合においてマイニングすることができる。一方、従来のエンティティ関係マイニング方法では、人工方式を採用すると大量の運営人力が必要とされ、コストが高すぎ、高周波数タグ方式を採用するとタグに大きく依存する。本出願では、検索文集合に基づいてターゲットエンティティワードをマイニングする技術手段が使用されているので、人工方式を採用すると大量の運営人力が必要とされ、コストが高すぎ、高周波数タグ方式を採用するとタグに大きく依存するという従来技術の技術的課題を解決し、本出願による技術案は、異なるエンティティワードの間の関係をより正確にマイニングすることができ、それにより、ユーザーの検索ニーズを満たし、人件費の節約及びマイニング効率向上という目的を達成し、さらに、本出願の実施例の技術案は簡便に実施でき、普及させるのが容易であり、適用範囲が広がる。
実施例5
図6は、本出願の実施例5によるエンティティ関係マイニング装置の構造模式図である。図6に示すように、前記装置600は、検索モジュール601とマイニングモジュール602を含み、前記検索モジュール601は、ターゲットエンティティワードに対応する所定条件を満たす検索文を検索文集合において検索することに用いられ、前記マイニングモジュール602は、前記ターゲットエンティティワードに対応する所定条件を満たす検索文が前記検索文集合において少なくとも1つ検索されると、前記ターゲットエンティティワードに対応する所定条件を満たす検索文に基づいて前記ターゲットエンティティワードに対応する関連エンティティワードをマイニングすることに用いられる。
図7は、本出願の実施例5による検索モジュールの構造模式図である。図7に示すように、前記検索モジュール601は、検索サブモジュール6011と検出サブモジュール6012を含み、前記検索サブモジュール6011は、前記ターゲットエンティティワードを前記検索文集合において検索することに用いられ、前記検出サブモジュール6012は、前記ターゲットエンティティを含む検索文が前記検索文集合において少なくとも1つ検索されると、前記ターゲットエンティティワードを含む検索文のうち前記ターゲットエンティティワードに対応する文構造条件を満たす検索文が少なくとも1つ存在するか否かを検出することと、前記ターゲットエンティティワードを含む検索文のうち前記ターゲットエンティティワードに対応する文構造条件を満たす検索文が少なくとも1つ存在すると、前記ターゲットエンティティワードに対応する所定条件を満たす検索文が前記検索文集合において検索されたと判定することとに用いられる。
さらに、前記検出サブモジュール6012は、具体的には、前記ターゲットエンティティワードを含む前記検索文の中から1つの検索文を抽出して前記ターゲットエンティティワードを含む現在検索文とすることと、前記ターゲットエンティティワードを含む現在検索文中の一番目の名詞が前記ターゲットエンティティワードであり、且つ前記ターゲットエンティティワードの後に1つだけの名詞があると、前記ターゲットエンティティワードを含む現在検索文が前記ターゲットエンティティワードに対応する文構造条件を満たす検索文であると判定し、前記ターゲットエンティティワードを含む各検索文について前記ターゲットエンティティワードに対応する文構造条件を満たすか否かが検出されるまで、上記操作を繰り返して実行することとに用いられる。
図8は、本出願の実施例5によるマイニングモジュールの構造模式図である。図8に示すように、前記マイニングモジュール602は、第1のマイニングサブモジュール6021、マージ検索サブモジュール6022、及び第2のマイニングサブモジュール6023を含み、前記第1のマイニングサブモジュール6021は、前記ターゲットエンティティワードに対応する所定条件を満たす検索文に基づいて前記ターゲットエンティティワードに対応する少なくとも1つの第2レベルのエンティティワードをマイニングすることに用いられ、前記マージ検索サブモジュール6022は、前記ターゲットエンティティワードを前記ターゲットエンティティワードに対応する各第2レベルのエンティティワードのそれぞれとマージして1つの新しいターゲットエンティティワードとし、前記新しいターゲットエンティティワードに対応する所定条件を満たす検索文を前記検索文集合において検索することに用いられ、前記第2のマイニングサブモジュール6023は、前記新しいターゲットエンティティワードに対応する所定条件を満たす検索文が前記検索文集合において少なくとも1つ検索されると、前記新しいターゲットエンティティワードに対応する所定条件を満たす検索文に基づいて前記ターゲットエンティティワードに対応する第3レベルのエンティティワードをマイニングすることに用いられる。
さらに、前記マージ検索サブモジュール6022は、具体的には、前記新しいターゲットエンティティワードを前記検索文集合において検索することと、前記新しいターゲットエンティティワードを含む検索文が前記検索文集合において少なくとも1つ検索されると、前記新しいターゲットエンティティワードを含む検索文のうち少なくとも1つの前記新しいターゲットエンティティワードに対応する文構造条件を満たす検索文が存在するか否かを検出することと、前記新しいターゲットエンティティワードを含む検索文のうち少なくとも1つの前記新しいターゲットエンティティワードに対応する文構造条件を満たす検索文が存在すると、前記新しいターゲットエンティティワードに対応する所定条件を満たす検索文が前記検索文集合において検索されたと判定することとに用いられる。
さらに、前記第1のマイニングサブモジュール6021は、具体的には、前記ターゲットエンティティワードに対応する所定条件を満たす検索文の中から1つの検索文を抽出して前記ターゲットエンティティワードに対応する所定条件を満たす現在検索文とすることと、前記ターゲットエンティティワードに対応する所定条件を満たす現在検索文に基づいて前記ターゲットエンティティワードに対応する第2レベルのエンティティワードをマイニングし、前記ターゲットエンティティワードに対応する所定条件を満たす検索文のそれぞれから前記ターゲットエンティティワードに対応する少なくとも1つの第2レベルのエンティティワードをマイニングするまで、上記操作を繰り返して実行することとに用いられる。
さらに、前記マージ検索サブモジュール6022は、具体的には、前記新しいターゲットエンティティワードを含む検索文の中から1つの検索文を抽出して前記新しいターゲットエンティティワードを含む現在検索文とすることと、前記新しいターゲットエンティティワードを含む現在検索文中の一番目の名詞が前記新しいターゲットエンティティワードであり、且つ前記新しいターゲットエンティティワードの後に1つだけの名詞又は1つだけの動詞があると、前記新しいターゲットエンティティワードを含む現在検索文が前記新しいターゲットエンティティワードに対応する文構造を満たす検索文であると判定し、前記新しいターゲットエンティティワードを含む検索文の中から前記新しいターゲットエンティティワードに対応する文構造を満たすすべての検索文が抽出されるまで、上記操作を繰り返して実行することとに用いられる。
さらに、前記装置は、チェックモジュール603(未図示)をさらに含み、前記チェックモジュール603は、前記ターゲットエンティティワードに対応する関連エンティティワードの中から1つのエンティティワードを抽出して、前記ターゲットエンティティワードに対応する現在関連エンティティワードとすることと、前記ターゲットエンティティワード及び前記ターゲットエンティティワードに対応する現在関連エンティティワードへの所定期間内のアクセス頻度又はアクセス回数を統計することと、前記ターゲットエンティティワード及び前記ターゲットエンティティワードに対応する現在関連エンティティワードへの前記所定期間内のアクセス頻度が所定頻度しきい値よりも大きいか、又は、前記ターゲットエンティティワード及び前記ターゲットエンティティワードに対応する現在関連エンティティワードへの前記所定期間内のアクセス回数が所定回数しきい値よりも大きいと、前記ターゲットエンティティワードに対応する現在関連エンティティワードが成立すると判定し、前記ターゲットエンティティワードに対応する各関連エンティティワードが成立するか否かがチェックされるまで、上記操作を繰り返して実行することとに用いられる。
上記エンティティ関係マイニング装置は、本出願の任意の実施例による方法を実行することができ、実行方法に対応する機能モジュール及び有益な効果を有する。本実施例において詳しく説明されていない技術の詳細については、本出願の任意の実施例によるエンティティ関係マイニング方法を参照することができる。
実施例6
本出願の実施例によれば、本出願は、電子デバイス、及び読み取り可能な記憶媒体をさらに提供する。
図9には、本出願の実施例に係るエンティティ関係マイニング方法の電子デバイスのブロック図が示されている。電子デバイスは、たとえば、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及びその他の適切なコンピュータなど、様々な形式のデジタルコンピュータを指すことを意図している。電子デバイスは、たとえば、パーソナルデジタルアシスタント、携帯電話、スマートフォン、ウェアラブル機器、及びその他の類似のコンピューティング装置など、様々な形式の移動装置を示してもよい。本明細書に示されているコンポーネント、それらの接続と関係、及びそれらの機能は単なる例であるが、本明細書の説明及び/又は要求される本出願の実現を制限する意図はしない。
図9に示すように、この電子デバイスは、1つ又は複数のプロセッサ901、メモリ902、及び高速インターフェースと低速インターフェースを含む、様々なコンポーネントを接続するためのインターフェースを含む。各コンポーネントは、異なるバスを介して互いに接続され、共通のマザーボードに取り付けられ、又は必要に応じて他の方式で取り付けられ得る。プロセッサは電子デバイス内で実行される命令を処理でき、この命令には、メモリ内に格納される又はメモリ上に格納されて外部入力/出力装置(たとえば、インターフェースに結合された表示機器など)にGUMのグラフィック情報を表示する命令が含まれる。他の実施形態では、複数のプロセッサ及び/又は複数のバスを、必要に応じて、複数のメモリ及び複数のメモリとともに使用することができる。同様に、複数の電子デバイスを接続することができ、各機器は必要な操作の一部(たとえば、サーバアレイ、ブレードサーバのグループ、又はマルチプロセッサシステムとして)を提供する。図9では、1つのプロセッサ901の場合が例示されている。
メモリ902は、本出願による非一時的なコンピュータ可読記憶媒体である。前記メモリは、本出願に係るエンティティ関係マイニング方法を前記少なくとも1つの前記プロセッサに実行させるように、少なくとも1つのプロセッサによって実行可能な命令を格納している。本出願の非一時的なコンピュータ可読記憶媒体は、本出願に係るエンティティ関係マイニング方法をコンピュータに実行させるためのコンピュータ命令を格納している。
非一時的なコンピュータ可読記憶媒体としてのメモリ902は、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能なプログラム及びモジュール、たとえば、本出願の実施例におけるエンティティ関係マイニング方法に対応するプログラム命令/モジュール(たとえば、図6に示す検索モジュール601とマイニングモジュール602)を格納することができる。プロセッサ901は、メモリ902に格納された非一時的なソフトウェアプログラム、命令、及びモジュールを実行することによって、サーバの様々な機能アプリケーション及びデータ処理を実行し、すなわち、上記方法実施例におけるエンティティ関係マイニング方法を実現する。
メモリ902は、プログラム記憶領域及びデータ記憶領域を含むことができ、プログラム記憶領域は、オペレーティングシステム、及び少なくとも1つの機能に必要なアプリケーションプログラムを格納し、データ記憶領域は、エンティティ関係マイニング方法の電子デバイスの使用に従って作成されたデータなどを格納する。さらに、メモリ902は、高速ランダムアクセスメモリを含み、さらに、たとえば、少なくとも1つの磁気ディスクストレージデバイス、フラッシュメモリデバイス、又は他の非一時的なソリッドステートストレージデバイスなどの非一時的なメモリを含んでもよい。いくつかの実施例では、メモリ902は、プロセッサ901に対して遠隔的に設置されるメモリを選択的に含んでもよく、これらの遠隔メモリは、ネットワークを介してエンティティ関係マイニング方法の電子デバイスに接続され得る。上記ネットワークの例には、インターネット、企業イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びそれらの組み合わせが含まれるが、これらに限定されない。
エンティティ関係マイニング方法の電子デバイスは、入力装置903及び出力装置904をさらに含んでもよい。プロセッサ901、メモリ902、入力装置903及び出力装置904はバス又はその他の方式で接続してもよく、図9には、バスによる接続が例示されている。
入力装置903は、入力される数字又はキャラクター情報を受信すること、エンティティ関係マイニング方法の電子デバイス、たとえば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインタ、1つ又は複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置のユーザ設定及び機能制御に関連するキー信号入力を生成することができる。出力装置904は、表示機器、補助照明装置(たとえば、LED)、触覚フィードバック装置(たとえば、振動モータ)などを含む。この表示機器は、液晶ディスプレイ(LDC)、発光ダイオード(LED)ディスプレイ、及びプラズマディスプレイを含むが、これらに限定されない。いくつかの実施形態では、表示機器はタッチスクリーンであり得る。
ここで説明するシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、専用ASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせにおいて実現することができる。これらの様々な実施形態は、1つ又は複数のコンピュータプログラムにおいて実施され、この1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラム可能なプロセッサを含むプログラム可能なシステムで実行及び/又は解釈され得、このプログラム可能なプロセッサは専用又は汎用のプログラム可能なプロセッサであってもよく、ストレージシステム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及び命令を受信したり、データ及び命令をこのストレージシステム、少なくとも1つの入力装置、及び少なくとも1つの出力装置に送信したりすることができる。
これらのコンピューティングプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも呼ばれる)には、プログラム可能なプロセッサの機械命令が含まれ、高度なプロセス及び/又はオブジェクト指向のプログラミング言語、及び/又はアセンブリ/機械語を用いてこれらのコンピューティングプログラムを実施できる。たとえば、本明細書で使用される「機械読み取り可能な媒体」及び「コンピュータ可読媒体」という用語は、機械命令及び/又はデータをプログラム可能なプロセッサの任意のコンピュータプログラム製品、機器、及び/又は装置(たとえば、磁気ディスク、光ディスク、メモリ、プログラマブルロジック機器(PLD))に提供するものを指し、機械読み取り可能な信号としての機械命令を受信するための機械読み取り可能な媒体を含む。「機械読み取り可能な信号」という用語は、プログラム可能なプロセッサに機械命令及び/又はデータを提供するために使用される任意の信号を指す。
ユーザと対話できるように、ここで説明するシステム及び技術をコンピュータに実施することができ、このコンピュータは、ユーザに情報を表示するための表示装置(たとえば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニター)、ユーザがコンピュータに入力することを可能とするキーボード及びポインティング装置(たとえば、マウスやトラックボール)を有する。他の種類の装置も、ユーザとの対話を提供することができ、たとえば、ユーザに提供するフィードバックは、任意の形式の感覚フィードバック(たとえば、視覚的フィードバック、聴覚的フィードバック、又は触覚的フィードバック)であってもよく、そして、ユーザからの入力は、任意の形式(音響入力、音声入力、又は触覚入力を含む)で受信できる。
ここで説明するシステム及び技術は、バックエンドコンポーネントを含むコンピューティングシステム(たとえば、データサーバとして)、又はミドルウェアコンポーネントを含むコンピューティングシステム(たとえば、アプリケーションサーバ)、又はフロントエンドコンポーネントを含むコンピューティングシステム(たとえば、グラフィカルユーザインターフェース又はWEBブラウザーを備えたユーザコンピュータが挙げられ、ユーザはこのグラフィカルユーザインターフェース又はこのWEBブラウザーを介してここで説明するシステム及び技術の実施形態と対話できる)、又はこのようなバックエンドコンポーネント、ミドルウェアコンポーネント、又はフロントエンドコンポーネントを含む任意の組み合わせコンピューティングシステムにおいて実施できる。システムのコンポーネントは、任意の形式又は媒体のデジタルデータ通信(たとえば、通信ネットワーク)を介して相互に接続できる。通信ネットワークの例には、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、インターネット及びブロックチェーンネットワークが含まれる。
コンピュータシステムには、クライアントとサーバを含むことができる。クライアントとサーバは通常、互いに遠く離れており、通信ネットワークを介して互いに会話するのが一般的である。クライアントとサーバの関係は、対応するコンピュータで実行され、互いにクライアント-サーバの関係を持つコンピュータプログラムによって生成される。
本出願の実施例の技術案によれば、まず、ターゲットエンティティワードに対応する所定条件を満たす検索文を検索文集合において検索し、ターゲットエンティティワードに対応する所定条件を満たす検索文が検索文集合において少なくとも1つ検索されると、ターゲットエンティティワードに対応する所定条件を満たす検索文に基づいてターゲットエンティティワードに対応する関連エンティティワードをマイニングする。つまり、本出願では、ターゲットエンティティワードに対応する関連エンティティワードを検索文集合においてマイニングすることができる。一方、従来のエンティティ関係マイニング方法では、人工方式を採用すると大量の運営人力が必要とされ、コストが高すぎ、高周波数タグ方式を採用するとタグに大きく依存する。本出願では、検索文集合に基づいてターゲットエンティティワードをマイニングする技術手段が使用されているので、人工方式を採用すると大量の運営人力が必要とされ、コストが高すぎ、高周波数タグ方式を採用するとタグに大きく依存するという従来技術の技術的課題を解決し、本出願による技術案は、異なるエンティティワードの間の関係をより正確にマイニングすることができ、それにより、ユーザーの検索ニーズを満たし、人件費の節約及びマイニング効率向上という目的を達成し、さらに、本出願の実施例の技術案は簡便に実施でき、普及させるのが容易であり、適用範囲が広がる。
なお、上記の様々な形式のプロセスを用いて、ステップを改めて並べ替えたり、追加したり、削除したりすることができる。たとえば、本出願に記載の各ステップは、本出願開示の技術案の所望の結果が達成できる限り、並行して実施しても、順次実施しても、異なる順序で実施してもよく、本明細書では、それについて限定しない。
上記特定実施形態は、本出願の特許範囲に対する制限を構成するものではない。当業者にとって明らかなように、設計要件及び他の要因に応じて、様々な修正、組み合わせ、サブ組み合わせ、及び置換を行うことができる。本出願の精神及び原則の範囲内で行われた修正、同等の置換、及び改良であれば、本出願の特許範囲に含まれるものとする。

Claims (19)

  1. エンティティ関係マイニング方法であって、
    ターゲットエンティティワードに対応する所定条件を満たす検索文を検索文集合において検索するステップであって、前記ターゲットエンティティワードに対応する所定条件は、前記ターゲットエンティティワードを含み、且つ、前記ターゲットエンティティワードに対応する文構造条件を満たすことであり、前記ターゲットエンティティワードに対応する文構造条件は、当該検索文中の一番目の名詞が前記ターゲットエンティティワードであり、且つ前記ターゲットエンティティワードの後に1つだけの名詞があることであり、当該後の名詞は、前記ターゲットエンティティワードに対応する第2レベルのエンティティワードである、ステップと、
    前記ターゲットエンティティワードに対応する所定条件を満たす検索文が前記検索文集合において少なくとも1つ検索されると、前記ターゲットエンティティワードに対応する所定条件を満たす検索文から、前記第2レベルのエンティティワードを、前記ターゲットエンティティワードに対応する関連エンティティワードとして、マイニングするステップとを含む、ことを特徴とするエンティティ関係マイニング方法。
  2. ターゲットエンティティワードに対応する所定条件を満たす検索文を検索文集合において検索する前記ステップは、
    前記ターゲットエンティティワードを前記検索文集合において検索するステップと、
    前記ターゲットエンティティを含む検索文が前記検索文集合において少なくとも1つ検索されると、前記ターゲットエンティティワードを含む検索文のうち前記ターゲットエンティティワードに対応する文構造条件を満たす検索文が少なくとも1つ存在するか否かを検出するステップと、
    前記ターゲットエンティティワードを含む検索文のうち前記ターゲットエンティティワードに対応する文構造条件を満たす検索文が少なくとも1つ存在すると、前記ターゲットエンティティワードに対応する所定条件を満たす検索文が前記検索文集合において検索されたと判定するステップとを含む、ことを特徴とする請求項1に記載の方法。
  3. 前記ターゲットエンティティワードを含む検索文のうち前記ターゲットエンティティワードに対応する文構造条件を満たす検索文が少なくとも1つ存在するか否かを検出する前記ステップは、
    前記ターゲットエンティティワードを含む前記検索文の中から1つの検索文を抽出して前記ターゲットエンティティワードを含む現在検索文とするステップと、
    前記ターゲットエンティティワードを含む現在検索文中の一番目の名詞が前記ターゲットエンティティワードであり、且つ前記ターゲットエンティティワードの後に1つだけの名詞があると、前記ターゲットエンティティワードを含む現在検索文が前記ターゲットエンティティワードに対応する文構造条件を満たす検索文であると判定し、前記ターゲットエンティティワードを含む各検索文について前記ターゲットエンティティワードに対応する文構造条件を満たすか否かが検出されるまで、上記操作を繰り返して実行するステップとを含む、ことを特徴とする請求項2に記載の方法。
  4. 記ターゲットエンティティワードを前記ターゲットエンティティワードに対応する各第2レベルのエンティティワードのそれぞれとマージして1つの新しいターゲットエンティティワードとし、前記新しいターゲットエンティティワードに対応する所定条件を満たす検索文を前記検索文集合において検索するステップと、
    前記新しいターゲットエンティティワードに対応する所定条件を満たす検索文が前記検索文集合において少なくとも1つ検索されると、前記新しいターゲットエンティティワードに対応する所定条件を満たす検索文から前記ターゲットエンティティワードに対応する第3レベルのエンティティワードを、前記ターゲットエンティティワードに対応する関連エンティティワードとしてマイニングするステップとを更に含み
    前記新しいターゲットエンティティワードに対応する所定条件は、前記新しいターゲットエンティティワードを含み、且つ、前記新しいターゲットエンティティワードに対応する文構造条件を満たすことであり、前記新しいターゲットエンティティワードに対応する文構造条件は、当該検索文中の一番目の名詞が前記新しいターゲットエンティティワードであり、且つ前記新しいターゲットエンティティワードの後に1つだけの名詞又は1つだけの動詞があることであり、当該後の名詞又は動詞は、前記ターゲットエンティティワードに対応する第3レベルのエンティティワードである、
    ことを特徴とする請求項1に記載の方法。
  5. 前記新しいターゲットエンティティワードに対応する所定条件を満たす検索文を前記検索文集合において検索する前記ステップは、
    前記新しいターゲットエンティティワードを前記検索文集合において検索するステップと、
    前記新しいターゲットエンティティワードを含む検索文が前記検索文集合において少なくとも1つ検索されると、前記新しいターゲットエンティティワードを含む検索文のうち少なくとも1つの前記新しいターゲットエンティティワードに対応する文構造条件を満たす検索文が存在するか否かを検出するステップと、
    前記新しいターゲットエンティティワードを含む検索文のうち少なくとも1つの前記新しいターゲットエンティティワードに対応する文構造条件を満たす検索文が存在すると、前記新しいターゲットエンティティワードに対応する所定条件を満たす検索文が前記検索文集合において検索されたと判定するステップとを含む、ことを特徴とする請求項4に記載の方法。
  6. 前記ターゲットエンティティワードに対応する所定条件を満たす検索文から前記ターゲットエンティティワードに対応する少なくとも1つの第2レベルのエンティティワードをマイニングする前記ステップは、
    前記ターゲットエンティティワードに対応する所定条件を満たす検索文の中から1つの検索文を抽出して前記ターゲットエンティティワードに対応する所定条件を満たす現在検索文とするステップと、
    前記ターゲットエンティティワードに対応する所定条件を満たす現在検索文から前記ターゲットエンティティワードに対応する第2レベルのエンティティワードをマイニングし、前記ターゲットエンティティワードに対応する所定条件を満たす検索文のそれぞれから前記ターゲットエンティティワードに対応する少なくとも1つの第2レベルのエンティティワードをマイニングするまで、上記操作を繰り返して実行するステップとを含む、ことを特徴とする請求項4に記載の方法。
  7. 前記新しいターゲットエンティティワードを含む検索文のうち少なくとも1つの前記新しいターゲットエンティティワードに対応する文構造条件を満たす検索文が存在するか否かを検出する前記ステップは、
    前記新しいターゲットエンティティワードを含む検索文の中から1つの検索文を抽出して前記新しいターゲットエンティティワードを含む現在検索文とするステップと、
    前記新しいターゲットエンティティワードを含む現在検索文中の一番目の名詞が前記新しいターゲットエンティティワードであり、且つ前記新しいターゲットエンティティワードの後に1つだけの名詞又は1つだけの動詞があると、前記新しいターゲットエンティティワードを含む現在検索文が前記新しいターゲットエンティティワードに対応する文構造を満たす検索文であると判定し、前記新しいターゲットエンティティワードを含む検索文の中から前記新しいターゲットエンティティワードに対応する文構造を満たすすべての検索文が抽出されるまで、上記操作を繰り返して実行するステップとを含む、ことを特徴とする請求項5に記載の方法。
  8. 前記ターゲットエンティティワードに対応する関連エンティティワードの中から1つのエンティティワードを抽出して、前記ターゲットエンティティワードに対応する現在関連エンティティワードとするステップと、
    前記ターゲットエンティティワード及び前記ターゲットエンティティワードに対応する現在関連エンティティワードへの所定期間内のアクセス頻度又はアクセス回数を統計するステップと、
    前記ターゲットエンティティワード及び前記ターゲットエンティティワードに対応する現在関連エンティティワードへの前記所定期間内のアクセス頻度が所定頻度しきい値よりも大きい、又は、前記ターゲットエンティティワード及び前記ターゲットエンティティワードに対応する現在関連エンティティワードへの前記所定期間内のアクセス回数が所定回数しきい値よりも大きいと、前記ターゲットエンティティワードに対応する現在関連エンティティワードが成立すると判定し、前記ターゲットエンティティワードに対応する各関連エンティティワードが成立するか否かがチェックされるまで、上記操作を繰り返して実行するステップとをさらに含む、ことを特徴とする請求項1に記載の方法。
  9. 検索モジュールとマイニングモジュールを含み、
    前記検索モジュールは、ターゲットエンティティワードに対応する所定条件を満たす検索文を検索文集合において検索することに用いられ、前記ターゲットエンティティワードに対応する所定条件は、前記ターゲットエンティティワードを含み、且つ、前記ターゲットエンティティワードに対応する文構造条件を満たすことであり、前記ターゲットエンティティワードに対応する文構造条件は、当該検索文中の一番目の名詞が前記ターゲットエンティティワードであり、且つ前記ターゲットエンティティワードの後に1つだけの名詞があることであり、当該後の名詞は、前記ターゲットエンティティワードに対応する第2レベルのエンティティワードであり、
    前記マイニングモジュールは、前記ターゲットエンティティワードに対応する所定条件を満たす検索文が前記検索文集合において少なくとも1つ検索されると、前記ターゲットエンティティワードに対応する所定条件を満たす検索文から、前記第2レベルのエンティティワードを、前記ターゲットエンティティワードに対応する関連エンティティワードとして、マイニングすることに用いられる、ことを特徴とするエンティティ関係マイニング装置。
  10. 前記検索モジュールは、検索サブモジュールと検出サブモジュールを含み、
    前記検索サブモジュールは、前記ターゲットエンティティワードを前記検索文集合において検索することに用いられ、
    前記検出サブモジュールは、前記ターゲットエンティティを含む検索文が前記検索文集合において少なくとも1つ検索されると、前記ターゲットエンティティワードを含む検索文のうち前記ターゲットエンティティワードに対応する文構造条件を満たす検索文が少なくとも1つ存在するか否かを検出し、前記ターゲットエンティティワードを含む検索文のうち前記ターゲットエンティティワードに対応する文構造条件を満たす検索文が少なくとも1つ存在すると、前記ターゲットエンティティワードに対応する所定条件を満たす検索文が前記検索文集合において検索されたと判定することに用いられる、ことを特徴とする請求項9に記載の装置。
  11. 前記検出サブモジュールは、具体的には、
    前記ターゲットエンティティワードを含む前記検索文の中から1つの検索文を抽出して前記ターゲットエンティティワードを含む現在検索文とすることと、
    前記ターゲットエンティティワードを含む現在検索文中の一番目の名詞が前記ターゲットエンティティワードであり、且つ前記ターゲットエンティティワードの後に1つだけの名詞があると、前記ターゲットエンティティワードを含む現在検索文が前記ターゲットエンティティワードに対応する文構造条件を満たす検索文であると判定し、前記ターゲットエンティティワードを含む各検索文について前記ターゲットエンティティワードに対応する文構造条件を満たすか否かが検出されるまで、上記操作を繰り返して実行することとに用いられる、ことを特徴とする請求項10に記載の装置。
  12. 前記マイニングモジュールは、第1のマイニングサブモジュール、マージ検索サブモジュール、及び第2のマイニングサブモジュールを含み、
    前記第1のマイニングサブモジュールは、前記ターゲットエンティティワードに対応する所定条件を満たす検索文から前記ターゲットエンティティワードに対応する少なくとも1つの第2レベルのエンティティワードをマイニングすることに用いられ、
    前記マージ検索サブモジュールは、前記ターゲットエンティティワードを前記ターゲットエンティティワードに対応する各第2レベルのエンティティワードのそれぞれとマージして1つの新しいターゲットエンティティワードとし、前記新しいターゲットエンティティワードに対応する所定条件を満たす検索文を前記検索文集合において検索することに用いられ、
    前記第2のマイニングサブモジュールは、前記新しいターゲットエンティティワードに対応する所定条件を満たす検索文が前記検索文集合において少なくとも1つ検索されると、前記新しいターゲットエンティティワードに対応する所定条件を満たす検索文から前記ターゲットエンティティワードに対応する第3レベルのエンティティワードを、前記ターゲットエンティティワードに対応する関連エンティティワードとしてマイニングすることに用いられ、
    前記新しいターゲットエンティティワードに対応する所定条件は、前記新しいターゲットエンティティワードを含み、且つ、前記新しいターゲットエンティティワードに対応する文構造条件を満たすことであり、前記新しいターゲットエンティティワードに対応する文構造条件は、当該検索文中の一番目の名詞が前記新しいターゲットエンティティワードであり、且つ前記新しいターゲットエンティティワードの後に1つだけの名詞又は1つだけの動詞があることであり、当該後の名詞又は動詞は、前記ターゲットエンティティワードに対応する第3レベルのエンティティワードである、
    ことを特徴とする請求項9に記載の装置。
  13. 前記マージ検索サブモジュールは、具体的には、
    前記新しいターゲットエンティティワードを前記検索文集合において検索すること、
    前記新しいターゲットエンティティワードを含む検索文が前記検索文集合において少なくとも1つ検索されると、前記新しいターゲットエンティティワードを含む検索文のうち少なくとも1つの前記新しいターゲットエンティティワードに対応する文構造条件を満たす検索文が存在するか否かを検出することと、
    前記新しいターゲットエンティティワードを含む検索文のうち少なくとも1つの前記新しいターゲットエンティティワードに対応する文構造条件を満たす検索文が存在すると、前記新しいターゲットエンティティワードに対応する所定条件を満たす検索文が前記検索文集合において検索されたと判定することとに用いられる、ことを特徴とする請求項12に記載の装置。
  14. 前記第1のマイニングサブモジュールは、具体的には、
    前記ターゲットエンティティワードに対応する所定条件を満たす検索文の中から1つの検索文を抽出して前記ターゲットエンティティワードに対応する所定条件を満たす現在検索文とすることと、
    前記ターゲットエンティティワードに対応する所定条件を満たす現在検索文から前記ターゲットエンティティワードに対応する第2レベルのエンティティワードをマイニングし、前記ターゲットエンティティワードに対応する所定条件を満たす検索文のそれぞれから前記ターゲットエンティティワードに対応する少なくとも1つの第2レベルのエンティティワードをマイニングするまで、上記操作を繰り返して実行することとに用いられる、ことを特徴とする請求項12に記載の装置。
  15. 前記マージ検索サブモジュール、具体的には、
    前記新しいターゲットエンティティワードを含む検索文の中から1つの検索文を抽出して前記新しいターゲットエンティティワードを含む現在検索文とすること、
    前記新しいターゲットエンティティワードを含む現在検索文中の一番目の名詞が前記新しいターゲットエンティティワードであり、且つ前記新しいターゲットエンティティワードの後に1つだけの名詞又は1つだけの動詞があると、前記新しいターゲットエンティティワードを含む現在検索文が前記新しいターゲットエンティティワードに対応する文構造を満たす検索文であると判定し、前記新しいターゲットエンティティワードを含む検索文の中から前記新しいターゲットエンティティワードに対応する文構造を満たすすべての検索文が抽出されるまで、上記操作を繰り返して実行することとに用いられる、ことを特徴とする請求項13に記載の装置。
  16. チェックモジュールをさらに含み、
    前記チェックモジュールは、
    前記ターゲットエンティティワードに対応する関連エンティティワードの中から1つのエンティティワードを抽出して、前記ターゲットエンティティワードに対応する現在関連エンティティワードとすることと、
    前記ターゲットエンティティワード及び前記ターゲットエンティティワードに対応する現在関連エンティティワードへの所定期間内のアクセス頻度又はアクセス回数を統計することと、
    前記ターゲットエンティティワード及び前記ターゲットエンティティワードに対応する現在関連エンティティワードへの前記所定期間内のアクセス頻度が所定頻度しきい値よりも大きいか、又は、若前記ターゲットエンティティワード及び前記ターゲットエンティティワードに対応する現在関連エンティティワードへの前記所定期間内のアクセス回数が所定回数しきい値よりも大きいと、前記ターゲットエンティティワードに対応する現在関連エンティティワードが成立すると判定し、前記ターゲットエンティティワードに対応する各関連エンティティワードが成立するか否かがチェックされるまで、上記操作を繰り返して実行することとに用いられる、ことを特徴とする請求項9に記載の装置。
  17. 少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサに通信可能に接続されたメモリとを含み、
    前記メモリは、前記少なくとも1つのプロセッサにより実行されると、請求項1~8のいずれか1項に記載の方法を前記少なくとも1つのプロセッサに実行させる、前記少なくとも1つのプロセッサにより実行可能な命令を記憶している、ことを特徴とする電子デバイス。
  18. コンピュータ命令が記憶されている非一時的なコンピュータ可読記憶媒体であって、
    前記コンピュータ命令は、コンピュータに、請求項1~8のいずれか1項に記載の方法を実行させることを特徴とする非一時的なコンピュータ可読記憶媒体。
  19. コンピュータプログラムであって、
    前記コンピュータプログラムは、プロセッサにより実行されると、請求項1~8のいずれか1項に記載の方法を実行させるコンピュータプログラム。
JP2021053538A 2020-06-30 2021-03-26 エンティティ関係マイニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム Active JP7300475B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010620947.8A CN111813828B (zh) 2020-06-30 2020-06-30 一种实体关系挖掘方法、装置、电子设备及存储介质
CN202010620947.8 2020-06-30

Publications (2)

Publication Number Publication Date
JP2022003509A JP2022003509A (ja) 2022-01-11
JP7300475B2 true JP7300475B2 (ja) 2023-06-29

Family

ID=72856687

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021053538A Active JP7300475B2 (ja) 2020-06-30 2021-03-26 エンティティ関係マイニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム

Country Status (5)

Country Link
US (1) US20210406299A1 (ja)
EP (1) EP3822815A1 (ja)
JP (1) JP7300475B2 (ja)
KR (1) KR102600018B1 (ja)
CN (1) CN111813828B (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102608953B1 (ko) * 2018-09-06 2023-12-04 삼성전자주식회사 전자 장치 및 그의 제어방법
CN111611364B (zh) * 2020-05-15 2023-08-15 北京百度网讯科技有限公司 一种智能应答方法、装置、设备及存储介质
CN113515598B (zh) * 2021-06-22 2021-12-07 国网电子商务有限公司 一种网络威胁情报文档实体关系提取方法及装置
CN113641696A (zh) * 2021-08-12 2021-11-12 北京百度网讯科技有限公司 一种虚假流量检测方法、装置、电子设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006127325A (ja) 2004-10-29 2006-05-18 Ntt Docomo Inc コンテンツ発見装置、及び、コンテンツ発見方法

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02153474A (ja) * 1988-12-06 1990-06-13 Ricoh Co Ltd 不要語辞書作成装置
US20130104251A1 (en) * 2005-02-01 2013-04-25 Newsilike Media Group, Inc. Security systems and methods for use with structured and unstructured data
TWI270789B (en) * 2005-03-03 2007-01-11 Via Tech Inc Method for automatically installing software program
US8221242B2 (en) * 2005-10-14 2012-07-17 Leviathan Entertainment, Llc Products and processes for providing a video game incorporating venture capital funding
US20120004038A1 (en) * 2006-02-14 2012-01-05 Andrew Van Luchene Favor tracking in a social game environment
US11336926B2 (en) * 2007-12-05 2022-05-17 Sony Interactive Entertainment LLC System and method for remote-hosted video game streaming and feedback from client on received frames
US10276170B2 (en) * 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
WO2011094734A2 (en) * 2010-02-01 2011-08-04 Jumptap, Inc. Integrated advertising system
US20110230258A1 (en) * 2010-03-16 2011-09-22 Andrew Van Luchene Computer Controlled Video Game Incorporating Constraints
US11386096B2 (en) * 2011-02-22 2022-07-12 Refinitiv Us Organization Llc Entity fingerprints
US11222052B2 (en) * 2011-02-22 2022-01-11 Refinitiv Us Organization Llc Machine learning-based relationship association and related discovery and
US9320968B1 (en) * 2011-05-24 2016-04-26 Zynga Inc. Online game with matching of different data types
US20120317088A1 (en) * 2011-06-07 2012-12-13 Microsoft Corporation Associating Search Queries and Entities
US8311973B1 (en) * 2011-09-24 2012-11-13 Zadeh Lotfi A Methods and systems for applications for Z-numbers
US11195057B2 (en) * 2014-03-18 2021-12-07 Z Advanced Computing, Inc. System and method for extremely efficient image and pattern recognition and artificial intelligence platform
WO2013108073A2 (en) * 2011-12-06 2013-07-25 Perception Partners, Inc. Text mining analysis and output system
US20140172564A1 (en) * 2012-12-17 2014-06-19 Facebook, Inc. Targeting objects to users based on queries in an online system
US20140236570A1 (en) * 2013-02-18 2014-08-21 Microsoft Corporation Exploiting the semantic web for unsupervised spoken language understanding
US9177553B1 (en) * 2013-06-25 2015-11-03 Google Inc. Identifying underserved command inputs
US9892208B2 (en) * 2014-04-02 2018-02-13 Microsoft Technology Licensing, Llc Entity and attribute resolution in conversational applications
CN104102713B (zh) * 2014-07-16 2018-01-19 百度在线网络技术(北京)有限公司 推荐结果的展现方法和装置
US10353543B2 (en) * 2014-09-08 2019-07-16 Mako Capital, Llc Method and system for presenting and operating a skill-based activity
CN104484339B (zh) * 2014-11-21 2018-01-26 百度在线网络技术(北京)有限公司 一种相关实体推荐方法和系统
CN104503978B (zh) * 2014-11-26 2018-02-13 百度在线网络技术(北京)有限公司 一种相关实体推荐方法和系统
US20160317933A1 (en) * 2015-05-01 2016-11-03 Lucidlogix Technologies Ltd. Automatic game support content generation and retrieval
US20160328443A1 (en) * 2015-05-06 2016-11-10 Vero Analytics, Inc. Knowledge Graph Based Query Generation
US10404740B2 (en) * 2016-10-03 2019-09-03 Telepathy Labs, Inc. System and method for deprovisioning
US10311050B2 (en) * 2017-01-23 2019-06-04 International Business Machines Corporation Crowdsourced discovery of paths in a knowledge graph
US10839154B2 (en) * 2017-05-10 2020-11-17 Oracle International Corporation Enabling chatbots by detecting and supporting affective argumentation
US10896222B1 (en) * 2017-06-28 2021-01-19 Amazon Technologies, Inc. Subject-specific data set for named entity resolution
US10322330B2 (en) * 2017-10-03 2019-06-18 Fanmountain Llc Systems, devices, and methods employing the same for enhancing audience engagement in a competition or performance
CN108388650B (zh) * 2018-02-28 2022-11-04 百度在线网络技术(北京)有限公司 基于需求的搜索处理方法、装置和智能设备
EP3791292A1 (en) * 2018-05-09 2021-03-17 Oracle International Corporation Constructing imaginary discourse trees to improve answering convergent questions
KR101935585B1 (ko) * 2018-10-02 2019-04-05 넷마블 주식회사 게임 커맨드 인식 방법 및 장치
US11321536B2 (en) * 2019-02-13 2022-05-03 Oracle International Corporation Chatbot conducting a virtual social dialogue
US11526808B2 (en) * 2019-05-29 2022-12-13 The Board Of Trustees Of The Leland Stanford Junior University Machine learning based generation of ontology for structural and functional mapping
US20210173874A1 (en) * 2019-12-04 2021-06-10 Microsoft Technology Licensing, Llc Feature and context based search result generation
CN111091006B (zh) * 2019-12-20 2023-08-29 北京百度网讯科技有限公司 一种实体意图体系的建立方法、装置、设备和介质
CN111274815B (zh) * 2020-01-15 2024-04-12 北京百度网讯科技有限公司 用于挖掘文本中的实体关注点的方法和装置
US11450306B2 (en) * 2020-04-09 2022-09-20 ROVl GUIDES, INC. Systems and methods for generating synthesized speech responses to voice inputs by training a neural network model based on the voice input prosodic metrics and training voice inputs

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006127325A (ja) 2004-10-29 2006-05-18 Ntt Docomo Inc コンテンツ発見装置、及び、コンテンツ発見方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
山本岳洋 他2名,Q&Aコンテンツからの観点抽出に基づくウェブ検索支援,情報処理学会論文誌 論文誌トランザクション 2011 October[CD-ROM],日本,一般社団法人情報処理学会,2011年10月15日,74-87頁,ISSN 1882-7772

Also Published As

Publication number Publication date
US20210406299A1 (en) 2021-12-30
KR102600018B1 (ko) 2023-11-08
CN111813828B (zh) 2024-02-27
JP2022003509A (ja) 2022-01-11
CN111813828A (zh) 2020-10-23
KR20210046600A (ko) 2021-04-28
EP3822815A1 (en) 2021-05-19

Similar Documents

Publication Publication Date Title
JP7300475B2 (ja) エンティティ関係マイニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム
JP7269913B2 (ja) ナレッジグラフ構築方法、装置、電子機器、記憶媒体およびコンピュータプログラム
KR20210152924A (ko) 엔티티 연결 방법, 장치, 기기 및 저장 매체
JP2021184237A (ja) データセット処理方法、装置、電子機器及び記憶媒体
KR102521765B1 (ko) 인과 관계의 판별 방법, 장치, 전자 기기 및 저장 매체
JP2022018095A (ja) マルチモーダル事前訓練モデル取得方法、装置、電子デバイス及び記憶媒体
JP7264866B2 (ja) イベント関係の生成方法、装置、電子機器及び記憶媒体
JP7234483B2 (ja) エンティティリンキング方法、装置、電子デバイス、記憶媒体及びプログラム
US20220092252A1 (en) Method for generating summary, electronic device and storage medium thereof
US11537792B2 (en) Pre-training method for sentiment analysis model, and electronic device
US20210200813A1 (en) Human-machine interaction method, electronic device, and storage medium
US20220129448A1 (en) Intelligent dialogue method and apparatus, and storage medium
US11182648B2 (en) End-to-end model training method and apparatus, and non-transitory computer-readable medium
CN111737399A (zh) 扩展问答集的方法、装置、电子设备和可读存储介质
CN112380847B (zh) 兴趣点处理方法、装置、电子设备及存储介质
CN112015468B (zh) 一种接口文档处理方法、装置、电子设备以及存储介质
CN111984774B (zh) 搜索方法、装置、设备以及存储介质
CN111274407A (zh) 知识图谱中三元组置信度计算方法和装置
JP2021111405A (ja) 行列型テキストの記憶方法、装置及び電子機器
CN111428489B (zh) 一种评论生成方法、装置、电子设备及存储介质
CN111414487B (zh) 事件主题的关联扩展方法、装置、设备及介质
CN113220710A (zh) 数据查询方法、装置、电子设备以及存储介质
US20210216598A1 (en) Method and apparatus for mining tag, device, and storage medium
CN111090673B (zh) 缓存单元的查找方法及相关设备
CN111488430B (zh) 事件的数据处理的方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211020

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230523

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230619

R150 Certificate of patent or registration of utility model

Ref document number: 7300475

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150