JP2022002075A - 情報推奨方法及び装置、並びに、電子機器、プログラム及びコンピュータ読み取り可能な記憶媒体 - Google Patents

情報推奨方法及び装置、並びに、電子機器、プログラム及びコンピュータ読み取り可能な記憶媒体 Download PDF

Info

Publication number
JP2022002075A
JP2022002075A JP2020205875A JP2020205875A JP2022002075A JP 2022002075 A JP2022002075 A JP 2022002075A JP 2020205875 A JP2020205875 A JP 2020205875A JP 2020205875 A JP2020205875 A JP 2020205875A JP 2022002075 A JP2022002075 A JP 2022002075A
Authority
JP
Japan
Prior art keywords
information
word
node
text
entity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020205875A
Other languages
English (en)
Inventor
海 威 王
hai wei Wang
杰 王
Ketsu O
准 劉
Zhun Liu
勇 朱
Yong Zhu
浩 田
Hao Tian
為 和
Wei He
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2022002075A publication Critical patent/JP2022002075A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】知識マップの分野においてユーザの要求をより深く発掘して理解し、豊富な情報をユーザに推奨することができる情報推奨方法及び装置、並びに、電子機器、プログラム及びコンピュータ読み取り可能な記憶媒体を提供する。【解決手段】情報推奨方法は、要求情報を取得することS210と、要求情報から実体を表す要求実体単語を抽出することS220と、要求実体単語及び予め構築された知識マップに基づいて推奨情報を確定することS230と、推奨情報をプッシュすることS240とを含む。知識マップは、テキストに基づいて構築され、且つ、テキストのソースを表す第1の単語を示す。【選択図】図2

Description

本開示は、知識マップの分野に関し、より具体的には、情報推奨方法及び装置、並びに、電子機器、プログラム及びコンピュータ読み取り可能な記憶媒体に関する。
インターネット技術の発展に伴い、業務の効率化や企業管理の便利のために、様々な管理補助人工知能プラットフォームが登場している。
本発明者らは、本開示の概念を実現する過程で、関連技術について、少なくとも関連技術の人工知能プラットフォームは、情報体系構築、情報分類及び情報共有を中心とすることが多いという技術的問題が存在することに気づいた。しかし、検索語に応答して情報推奨を行う場合、検索語に基づいてユーザに検索語におけるキーワードを含む情報しか推奨することができない場合が多い。このため、関連技術の人工知能プラットフォームは、検索語に基づいてユーザの意図を深く発掘して理解することができず、より豊富な情報をユーザに推奨することができないという技術的問題があった。
本開示は、このような状況に鑑みてなされたものであり、ユーザの要求をより深く発掘して理解し、豊富な情報をユーザに推奨することができる情報推奨方法及び装置、並びに、電子機器、プログラム及びコンピュータ読み取り可能な記憶媒体を提供している。
本開示の一面によると、要求情報を取得することと、要求情報から実体を表す要求実体単語を抽出することと、要求実体単語及び予め構築された知識マップに基づいて推奨情報を確定することと、推奨情報をプッシュすることと、を含み、知識マップはテキストに基づいて構築され、且つ、テキストのソースを表す第1の単語を示す、情報推奨方法を提供する。
選択的には、上記の情報推奨方法は、テキストから、第1の単語を含む、実体を表す複数の実体単語、及び複数の実体単語間の関連関係を抽出することと、抽出された複数の実体単語と複数の実体単語間の関連関係に基づいて知識マップを構築することと、を含む、テキストに基づいて知識マップを構築することをさらに含む。
選択的には、上記知識マップを構築することは、複数の実体単語の各実体単語に対して、各実体単語に対してノードを構築することと、複数の実体単語間の関連関係に基づいて、複数の実体単語のうち各実体単語と関連関係がある関連単語を確定することと、各実体単語に対応するノードと関連単語に対応するノードとを接続して、各実体単語に対応するノードに関連するエッジを形成することと、を含む。
選択的には、上記知識マップを構築することは、各実体単語と関連単語との関連関係に基づいて、各実体単語と関連単語との関連度を確定することと、関連度に基づいて、各実体単語に対応するノードと関連単語に対応するノードとを接続するエッジに重みを付けることと、をさらに含み、関連度の大きさは、重みの大きさに比例する。
選択的には、上記推奨情報を確定することは、知識マップにおける要求実体単語に対応するノードを目標ノードとして確定することと、目標ノードに関連するエッジに基づいて、目標ノードに接続される少なくとも1つのノードを確定することと、少なくとも1つのノードに対応する実体単語に基づいて、推奨情報を確定することと、を含む。
選択的には、上記情報推奨方法は、新しいテキストが取得されたことに応答して、新しいテキストから、実体を表す複数の新しい実体単語、及び複数の新しい実体単語間の関連関係を抽出することと、知識マップが複数の新しい実体単語のうち少なくとも1つの新しい実体単語を示すことができない場合、複数の新しい実体単語及び複数の新しい実体単語間の関連関係に基づいて、知識マップを更新することと、をさらに含む。
選択的には、上記情報推奨方法は、要求情報からキー情報を抽出することと、予め設定されたキー情報構造のうち、抽出されたキー情報に関連する情報ノードを目標情報ノードとして確定されることと、さらにを含み、キー情報構造は、複数の情報ノードを含み、複数の情報ノードのそれぞれは1つのキー情報を示し、推奨情報を確定することは、要求実体単語、予め構築された知識マップ、及び目標知識ノードに基づいて推奨情報を確定することを含む。
選択的には、複数の実体単語は、テキストのキー情報を表す第2の単語を更に含み、上記情報推奨方法は、テキストを、キー情報構造に含まれる情報ノードに分類することをさらに含み、テキストを分類することは、第2の単語に基づいて、テキストとキー情報構造における各情報ノードとのマッチング関係を確定することと、テキストをテキストにマッチする情報ノードに分類することと、を含む。
選択的には、第2の単語の数は複数であり、テキストとキー情報構造における各情報ノードとのマッチング関係を確定することは、第2の単語が、各情報ノードが示すキー情報と同じである目標単語を含むか否かを確定することと、第2の単語に目標単語が含まれている場合、テキストと各知識ノードとのマッチング関係がマッチすると確定することと、を含む。
選択的には、テキストとキー情報構造における各情報ノードとのマッチング関係を確定することは、第2の単語に目標単語が含まれていない場合、知識マップから第2の単語の関連単語を取得することと、第2の単語の関連単語に目標単語が含まれている場合、テキストと各情報ノードとのマッチング関係がマッチすると確定することと、をさらに含む。
選択的には、テキストとキー情報構造における各情報ノードとのマッチング関係を確定することは、第2の単語と、各情報ノードが示すキー情報との類似度を確定することと、類似度が類似度閾値より大きい場合に、テキストと各情報ノードとのマッチング関係がマッチすると確定することと、を含む。
選択的には、上記情報推奨方法は、新しいテキストが取得されたことに応答して、新しいテキストから新しいテキストの新しいキー情報を抽出することと、キー情報構造に新しいキー情報を示す情報ノードが含まれていない場合、新しいキー情報に基づいて、キー情報構造を更新することと、をさらに含む。
選択的には、推奨情報を確定することは、目標情報ノードに分類されるテキストを推奨情報として取得することを含む。
本開示の他の一面によると、要求情報を取得する取得モジュールと、要求情報から実体を表す要求実体単語を抽出する情報抽出モジュールと、要求実体単語及び予め構築された知識マップに基づいて推奨情報を確定する情報確定モジュールと、推奨情報をプッシュする情報プッシュモジュールと、を含み、知識マップは、テキストに基づいて構築され、且つ、テキストのソースを表す第1の単語を示す、情報推奨装置を提供する。
本開示の別の一面によると、1つ又は複数のプロセッサと、1つ又は複数のプログラムを記憶する記憶装置と、を含む電子機器を提供する。ここで、1つ又は複数のプログラムが1つ又は複数のプロセッサによって実行されるとき、1つ又は複数のプロセッサに、上記のような情報推奨方法を実行させる。
本開示のさらに別の一面によると、プロセッサによって実行されたときに、プロセッサに上記のような情報推奨方法を実行させる実行可能な命令が記憶されている、コンピュータ読み取り可能な記憶媒体を提供する。
本開示のさらに別の一面によると、実行されたときに、上記情報推奨方法を実現させるコンピュータ実行可能な命令を含む、プログラムを提供する。
本開示の実施例によれば、関連情報推奨方法に存在する推奨情報が単一で、企業チームとプロジェクトの管理に深く関与できないという不都合を少なくとも部分的に回避することができる。また、テキストのソースを示すことができる知識マップによって情報推奨を行うことにより、推奨結果を企業チームやプロジェクトの管理に深く関与させることができる。これにより、企業知識適用の効率を効果的に向上させ、社員の業務効率を向上させ、人工知能プラットフォームの知識に対する知能化管理を向上させる。
以下、図面を参照しながら本開示の実施例を説明することにより、本開示の上記及び他の目的、特徴、及び利点はより明らかになるであろう。
図1は、本開示の実施例による情報推奨方法及び装置、並びに、電子機器、プログラム及びコンピュータ読み取り可能な記憶媒体の適用場面を模式的に示している。 図2は、本開示の実施例による情報推奨方法のフローチャートを模式的に示している。 図3Aは、本開示の実施例による、テキストに基づいて知識マップを構築するフローチャートを模式的に示している。 図3Bは、本開示の実施例による、知識マップを構築するためのテキストの取得フローの模式図を模式的に示している。 図3Cは、本開示の別の実施例によるテキストに基づいて知識マップを構築するフローチャートを模式的に示している。 図4Aは、本開示の実施例による推奨情報を確定するフローチャートを模式的に示している。 図4Bは、本開示の実施例による、知識マップに基づいて推奨情報を確定する原理模式図を模式的に示している。 図5は、本開示の実施例による、知識マップを更新するフローチャートを模式的に示している。 図6Aは、本開示の別の実施例による情報推奨方法のフローチャートを模式的に示している。 図6Bは、本開示の実施例による、予め設定されたキー情報構造の模式図を模式的に示している。 図7は、本開示の実施例による、テキストをキー情報構造に含まれる情報ノードに分類するフローチャートを模式的に示している。 図8は、本開示の実施例による、テキストとキー情報構造における各情報ノードとのマッチング関係を確定するフローチャートを模式的に示している。 図9は、本開示の別の実施例による、テキストとキー情報構造における各情報ノードとのマッチング関係を確定するフローチャートを模式的に示している。 図10は、本開示の実施例による、情報推奨方法を実現するためのシステム構造図を模式的に示している。 図11は、本開示の実施例による情報推奨装置の構成ブロック図を模式的に示している。 図12は、本開示の実施例による情報推奨方法を実行するのに適した電子機器の一例であるコンピュータシステムのブロック図を模式的に示している。
以下、本開示の実施例について図面を参照しながら説明する。しかしながら、これらの説明は例示的なものであり、本開示の範囲を制限するものではないことを理解すべきである。以下の詳細な説明では、説明の便宜上、本開示の実施例に対する全面的な理解を提供するために、多数の具体的な詳細が記載されている。しかしながら、1つ又は複数の実施例は、これらの具体的な詳細なしでも、実施できることは明らかである。また、以下の説明では、本開示の概念を不要に不明瞭にしないように、周知の構造及び技術に対する説明は省略する。
本明細書で使用される用語は、具体的な実施例を説明するためのものに過ぎず、本開示を限定することを意図しない。本明細書で使用される「備える」、「含む」等の用語は、前記特徴、ステップ、操作、及び/又は部品の存在を意味するが、1つ又は複数の他の特徴、ステップ、操作、又は部品の存在又は追加を除外しない。
本明細書で使用される全ての用語(技術的及び科学的用語を含む)は、別途定義されない限り、当業者によって一般的に理解される意味を有する。本明細書で使用される用語は、本明細書の前後文脈に一致する意味を有すると解釈されるべきであり、理想的又は過度に文字的に解釈されるべきではないことを指摘しておく。
「A、B及びC等の少なくとも1つ」のような表現を使用する場合、一般的には、当業者によって通常に理解される意味に解釈されるべきである(例えば、「A、B及びCの少なくとも1つを有するシステム」は、Aを単独で有するシステム、Bを単独で有するシステム、Cを単独で有するシステム、A及びBを有するシステム、A及びCを有するシステム、B及びCを有するシステム、及び/又はA、B、Cを有するシステム等を含むが、これらに限定されない)。
本開示の実施例は、推奨する情報の豊富さを改善し、ユーザ体験を改善する情報推奨方法及び装置を提供する。この情報推奨方法は、クライアントが受信した要求情報を先に取得してもよい。そして、要求情報を取得したことに応答して、要求情報から、実体を表す要求実体単語を抽出する。その後、要求実体単語及び予め構築された知識マップから、推奨情報を確定する。最後に、推奨情報をクライアントにプッシュして、ユーザに提示する。ここで、知識マップは、テキストに基づいて構築され、テキストのソースを表す第1の単語を示している。この方法によると、テキストのソースを示す知識マップに基づいて、ユーザに、所望の知識のソースを推奨することができる。ユーザは、関連知識を研究するチーム、専門家等の情報を素早く知ることができ、知識開発及び応用の効率を向上させることができる。
図1は、本開示の実施例による情報推奨方法及び装置、並びに、電子機器、プログラム及びコンピュータ読み取り可能な記憶媒体の適用場面を模式的に示している。図1は、本開示の実施例を適用できるシステム構造の例示に過ぎなく、当業者が本開示の技術内容を理解するようにするためのものであり、本開示の実施例が他の装置、システム、又は場面に適用できないことを意味しないことを指摘しておく。
図1に示すように、本実施例の適用場面100は、サーバ101、ネットワーク102、及び端末装置103、104、105を含んでもよい。ネットワーク102は、サーバ101と端末装置103、104、105との間に通信リンクの媒体を提供する。ネットワーク102は、例えば、有線又は無線通信リンク等の様々な接続タイプを含んでもよい。
端末装置103、104、105は、例えば、ディスプレイを有し、且つ、ウェブページの閲覧をサポートする様々な電子装置であってもよく、スマートフォン、タブレット、ラップトップ、及びデスクトップコンピュータ等を含んでもよいが、これらに限定されない。端末装置103、104、105は、ユーザの操作に応答して要求情報を生成し、サーバ101とのインタラクションによって、当該要求情報に応答する推奨情報を取得し、ユーザに提示することができる。
例示的に、端末装置103、104、105には、例えば、テキスト編集型アプリケーション、オーディオ編集型アプリケーション、ビデオ編集型アプリケーション、インスタント通信型アプリケーション、スマート・オフィス・ステーション等の様々なクライアントアプリケーションがインストールされていてもよい。
サーバ101は、例えば、取得された情報に基づいて知識管理システムをメンテナンスしてもよい。ここで、取得された情報は、例えば、端末装置103、104、105にインストールされた複数のクライアントアプリケーションから取得されたテキスト情報、ビデオ情報及び/又はオーディオ情報等を含んでもよい。この知識管理システムは、例えば、取得された情報に基づいて、知識マップを構築し、メンテナンスを行い、複数の情報の関連関係について可視化構成を形成して、情報の発掘及び推奨を容易にすることができる。
例示的には、当該サーバ101は、端末装置103、104、105によって生成された要求情報を取得したことに応答して、構築し、且つ、メンテナンスを行なっている知識マップに基づいて、ユーザに推奨する推奨情報を確定し、当該推奨情報を端末装置103、104、105にプッシュし、ユーザの閲覧に供してもよい。
例示的には、当該サーバ101は、企業に設けられた知識管理サーバであってもよく、企業内部の社員によりアップロードされた情報や、オンライン業務実行により生成された情報の管理、メンテナンスを行なうことができ、知識マップは、取得された情報だけでなく、同時に、取得された情報のソースに基づいて構築することもできる。ここで、取得された情報のソースは、情報をアップロードしたユーザ情報、情報を生成した作者及び/又はチーム等の情報を含むことができる。知識マップに基づいて推奨情報を確定する際に、企業内部の社員要素と知識との関連関係を発掘して、企業の知識生産及び適用の効率を向上させることができる。ここで、サーバにより管理、メンテナンスが行なわれる情報は、例えば、WiKiシステムから取得した情報、オンライン会議を行う際に生成するオーディオ及び/又はテキスト情報、オンライン・オフィス・プラットフォームにより伝送されるファイル、オンライン・オフィス・プラットフォームによって生成されるチャット情報等を含む情報106を含むことができる。
本開示の実施例による情報推奨方法は、一般的に、サーバ101により実行されてもよいことを指摘しておく。対応的に、本開示の実施例による情報推奨装置は、一般的に、サーバ101に搭載されてもよい。
なお、図1における端末装置、ネットワーク、サーバの数及び種類は、例示的なものに過ぎない。実現の必要に応じて、任意の数及び種類の端末装置、ネットワーク及びサーバを有し得る。
以下、図1の適用場面に基づいて、図2〜図9を参照しながら、本開示の実施例による情報推奨方法を詳細に説明する。
図2は、本開示の実施例による情報推奨方法のフローチャートを模式的に示している。
図2に示すように、本実施例による情報推奨方法200は、操作S210〜S240を含む。
操作S210においては、要請情報を取得する。
本開示の実施例によれば、要求情報は、例えば、ユーザ操作に応答して端末装置により生成されるものであってもよい。端末装置は、要求情報を生成した後、当該要求情報をサーバに送信してサーバに情報を推奨することを要求する。
例示的には、ユーザ操作は、例えば、ユーザが入力装置によって検索語を入力する操作であってもよい。あるいは、ユーザ操作は、ユーザが端末装置に対してオーディオ指令を発する操作等であってもよい。端末装置が生成した要求情報は、検索語やオーディオ指令を指示することができ、且つ、サーバが認識できる情報である。例えば、要求情報は、query語句であってもよい。
操作S220においては、要求情報から実体を示す要求実体単語を抽出する。
本開示の実施例によれば、当該操作S220は、例えば、まず、要求情報に対して単語分割処理を行い、要求情報を示す単語列を取得してもよい。次に、単語列における単語に対して実体認識を行い、実体を示す単語を抽出して、要求実体単語を取得する。例示的には、要求実体単語は、例えば、要求情報における情報要素であってもよく、例えば、名前、組織/機関名、物体名、プロジェクト名等であってもよい。
例示的には、当該操作S220においては、予めラーニングしたマシン・ラーニング・モデルによって要求実体単語を抽出することができる。マシン・ラーニング・モデルは、例えば、LSTM(Long Short-Term Memory)等を含むことができる。
例示的には、当該操作S220においては、例えば、単語列における各単語と実体単語シソーラスにおける単語とを比較し、単語列に含まれる複数の単語から、実体単語に属する単語を選択してもよい。選択された単語は、実体の要求実体単語である。
操作S230においては、要求実体単語と予め構築された知識マップとに基づいて推奨情報を確定する。
本開示の実施例によれば、知識マップは、大量のテキストに基づいて構築されるものである。例えば、知識マップは、テキストから抽出された実体単語と、実体単語が表す実体との関連関係に基づいて構成されてもよい。知識マップには、複数のノードと、ノードを接続する複数のエッジとが含まれる。各ノードは、1つの実体単語に対応する。すなわち、各ノードは1つの実体を表すことができる。各エッジは、接続された2つのノードのそれぞれが表す2つの実体の間に関連関係があることを示す。
例示的には、取得要求に応答してより豊富な情報をユーザに提供するために、知識マップに含まれる複数のノードには、例えば、テキストのソースを表す第1の単語が含まれ得る。第1の単語は、例えば、テキストの作者の名前、テキストを生成したチーム名、組織名等を含むことができる。要求実体単語に「Java」(登録商標)が含まれる場合、知識マップに基づいて確定される推奨情報は、例えば、企業内でJavaに精通している専門家やチーム等を含むことができる。
本開示の実施例によれば、当該操作S230においては、例えば、まず、知識マップにおける要求実体単語を表すノードを確定することができる。次に、知識マップにおける、確定されたノードの位置に応じて、要求実体単語が表す実体と関連関係がある実体を確定する。最後に、関連関係のある実体に基づいて推奨情報を生成する。
本開示の実施例によれば、サーバは、例えば、テキストライブラリを有してもよく、当該テキストライブラリには、端末装置によってアップロードされた複数のテキストが含まれている。当該操作S230においては、例えば、まず、要求実体単語に基づいて、テキストライブラリから要求実体単語にマッチするテキストを取得してもよい。次に、知識マップにいて要求実体単語と関連関係がある実体を確定する。最後に、テキストライブラリから取得したテキストと、関連関係のある実体単語とに基づいて、推奨情報を生成する。
例示的には、知識マップは、例えば、図3A示すフローによって構築することができ、操作S230は、図4Aに示すフローによって実現することができ、ここでは、説明を省略する。
操作S240においては、推奨情報をプッシュする。当該操作においては、生成された推奨情報を端末装置にプッシュし、端末装置により推奨情報をユーザ提示してもよい。
以上のように、本開示の実施例は、情報を推奨する際に、テキストのソースを示す知識マップに基づいて推奨情報を確定することにより、ユーザに、要求情報に関するソース情報、例えば、専門家又はチーム等を推奨することができる。したがって、当該情報推奨は、企業チームやプロジェクト管理に深く関与することができ、より全面で、より正確な情報をユーザに推奨することができる。
知識マップに基づいてより便利に情報推奨が行なわれるように、本実施例による情報推奨方法は、操作S210の前に実行される、テキストに基づいて知識マップを構築する操作をさらに含んでもよい。
図3Aは、本開示の実施例による、テキストに基づいて知識マップを構築するフローチャートを模式的に示している。図3Bは、本開示の実施例による、知識マップを構築するためのテキストの取得フローの模式図を模式的に示している。
図3Aに示すように、テキストに基づいて知識マップを構築する操作S350は、例えば、操作S351〜操作S352を含むことができる。
操作S351においては、テキストから、実体を表す複数の実体単語、及び複数の実体単語間の関連関係を抽出する。
本開示の実施例によれば、構築された知識マップがより多くの知識を含むように、実体単語及び実体単語間の関連関係を抽出するためのテキストは、例えば、分散された複数のルートから取得された複数のテキストを含んでもよい。当該操作S351においては、複数のテキストのそれぞれについて、実体単語及び関連関係の抽出を行う。複数のテキストのそれぞれから実体単語及び関連関係を抽出した後、複数のテキストから抽出した実体単語及び関連関係を統計して、知識マップを構築するための複数の実体単語及び複数の実体単語間の関連関係を取得することができる。
例示的には、図3Bに示すように、複数のテキストは、例えば、オンライン情報301、オフライン情報302、不可視情報303、及び欠落情報304から生成されたオンラインテキスト305であってもよい。
例示的には、知識マップが企業向けの知識マップである場合、オンライン情報301は、例えば、企業内部の知識ソースを整理、選択して、企業内部のオンライン情報を収集することによって取得することができる。知識ソースには、例えば、オンラインの新聞通知、オンラインのドキュメント、オンラインの会議記録、オンラインのVCR、オンラインのプロジェクト紹介、オンラインのチャット内容等がある。
例示的には、オフライン情報302は、社員のオフィス機器に記憶されているアップロードされていない情報を含んでもよい。このオフライン情報302は、社員にアップロードを督促することで情報のオンライン化処理を行い(操作S311)、オフライン情報をオンライン情報に変換することができる。
例示的には、不可視情報303は、例えば、社員により文書化されていない作業経験等を含んでもよい。この不可視情報は、例えば、社員を督励することで、文書化処理を行うことができる(操作S312)。即ち、社員に従業経験を記録して電子化することを督励する。当該文書化された不可視情報は、オンライン化処理(操作S311)によって、オンライン情報に変換してもよい。
例示的には、欠落情報304は、例えば、企業内にはなく、外部から導入する必要がある情報を含んでもよい。この欠落情報304は、例えば、外部取得や指向性導入等により、企業外から企業内に導入することができる。例えば、公開された知識プラットフォーム(フォーラム、論文サイト、特許サイト等)が提供するインターフェースによって、欠落した情報を企業内部のサーバに導入することができる。あるいは、当該欠落情報は、運営生産(操作S313)によって社員に創作を督励することで取得してもよい。創作して取得した情報は、まず、文書化処理(ステップS312)を行なう必要があり、その後、オンライン化処理(操作S311)によってオンライン情報に変換される。
オフライン情報302、不可視情報303、欠落情報304を全てオンライン情報に変換した後、知識ソースを整理・選択して得られたオンライン情報301と、変換して得られたオンライン情報をともに文書化して、複数のオンラインテキスト305を得ることができる。
本開示の実施例によれば、構築された知識マップがより多くの知識を含むようにした上で、知識マップの構築効率を向上させるために、本実施例は、複数のオンラインテキスト305を取得した後、複数のオンラインテキスト305を選別して、価値の高いオンラインテキストを得ることもできる。
例示的には、図3Bに示すように、オンラインテキスト305を取得した後、複数のオンラインテキストに対して、知識性選別(操作S314)及び内容品質選別(操作S315)を行うことができる。知識性選別は、例えば、知識性の強いテキストを選別することであってもよい。内容品質選別は、例えば、内容の品質が高いテキストを選別することであってもよい。内容品質選別は、知識性選別により得られたテキストに対するさらなる選別であってもよい。あるいは、知識性選別は、内容品質選別により得られたテキストに対するさらなる選別であってもよい。
知識性選別は、例えば、オンラインテキストを認識して理解した後に行われることができる。例えば、まず、複数のオンラインテキストに対してテキスト認識及びテキスト理解を行い、複数のオンラインテキストのうち各オンラインテキストの内容のカテゴリを確定してもよい。テキストが社員の能力の向上に役立つことができるテキストカテゴリ(例えば、専門知識カテゴリ等)である場合、テキストの知識性は強い。テキストが社員の能力の向上に寄与しないテキストカテゴリ(例えば、スキャンダルカテゴリ等)である場合、テキストの知識性は弱い。
内容品質選別は、テキストに含まれている単語を分類した後に行ってもよい。例えば、テキストに敏感語、禁止語等の単語が多く含まれていると、テキストの内容の品質は、比較的低い。テキストに敏感語、禁止語が含まれていない場合、テキストの内容の品質は、比較的高い。
本開示の実施例によれば、操作S351においては、例えば、まず、操作S220に類似する方法によって、各テキストから実体を表す実体単語を抽出することができる。そして、テキストから2つの実体単語がそれぞれ表す2つの実体間の意味関係を抽出し、当該意味関係を2つの実体単語間の関連関係とする。
本開示の実施例によれば、構築された知識マップがテキストのソースを表す第1の単語を示す場合、テキストから抽出された実体単語は、テキストのソースを表す第1の単語を含むべきである。テキストにテキストのソースの情報が含まれていない場合には、テキストから実体単語を抽出する以外にも、例えば、テキストの属性情報から実体単語を抽出してもよい。テキストの属性情報には、例えば、作者情報や作成日時情報等が含まれてもよい。
例示的には、操作S351においては、ディープラーニングの方法により各テキストに含まれた複数の実体単語及び複数の実体単語間の関連関係を抽出することができる。ディープラーニングの方法は、例えば、畳み込みニューラルネットワークモデルによって実現することができる。
例示的には、操作S351は、予め定義されたテンプレートによってテキストにおける実体単語を抽出することができる。予め定義されたテンプレートは、実体単語を抽出するルール等を規定している。
操作S352において、抽出された前記複数の実体単語及び複数の実体単語間の関連関係に基づいて知識マップを構築する。
本開示の実施例によれば、この操作S352においては、例えば、まず、操作S351で抽出された複数の実体単語のそれぞれについて、ノードを構築することができる。そして、複数の実体単語間の関連関係に基づいて、複数の実体単語のうち各実体単語と関連関係のある関連単語を確定する。最後に、各実体単語に対応するノードと関連単語に対応するノードとを接続し、各実体単語に対応するノードに関連するエッジを形成する。
例示的には、実体単語「Java」について、複数の実体単語のうち「Java」との関連関係がある関連単語に「JavaWeb」、「Android」、「王**」が含まれている場合、この操作S352は、「Java」の実体単語に対応するノードと「JavaWeb」の実体単語に対応するノードとを接続し、「Java」の実体単語に対応するノードと「Android」の実体単語に対応するノードとを接続し、「Java」の実体単語に対応するノードと「王**」の実体単語に対応するノードとを接続して、実体単語「Java」に対応するノードに関連付けられた3つのエッジを形成することを含むことができる。ここで、「王**」は、Javaに精通している専門家の名前、又は、Android開発に精通している専門家の名前等であってよい。
本開示の実施例によれば、情報推奨を行う際の情報推奨の正確性を向上させるために、知識マップを構築する際に、2つのノードを接続する各エッジに重みを付けてもよい。
図3Cは、本開示の別の実施例による、テキストに基づいて知識マップを構築するフローチャートを模式的に示している。
図3Cに示すように、本実施例によるテキストに基づいて知識マップを構築する操作S350は、操作S351〜操作S352に加えて、操作S353〜操作S354をさらに含んでもよい。この操作S353〜操作S354は、操作S352の後に実行される。
操作S353では、各実体単語と関連単語との関連関係に応じて、各実体単語と関連単語との関連度を確定する。
操作S354では、関連度に応じて、各実体単語に対応するノードと関連単語に対応するノードを接続するエッジに重みを付ける。
本開示の実施例によれば、操作S353においては、例えば、各実体単語が示す実体と関連単語が示す実体との間の複数の次元での関連関係に基づいて、各単語とキーワードとの関連度を確定することができる。各実体単語が表す実体と関連単語が表す実体とが多い次元で関連関係があれば、実体単語と関連単語との関連度は大きい。各実体単語が表す実体と関連単語が表す実体とが少ない次元で関連関係があれば、実体単語と関連単語との関連度は小さい。ここで、複数の次元は、例えば、地域次元、時間次元、種類次元、色次元、ユーザ体験次元等を含むことができる。
例示的には、「林檎」という実体単語について、複数の実体単語のうち「林檎」と関連関係がある関連単語に「梨」、「蜜柑」が含まれているとする。林檎も梨も果物であり、いずれも、北の地域で生長しており、両者は、2つの次元で関連関係がある。林檎も蜜柑も果物であるが、林檎は、北の地域で生長しており、蜜柑は南の地域で生長している。林檎と蜜柑は、1つの次元で関連関係がある。したがって、「林檎」という実体単語と「梨」という実体単語との関連度は、「林檎」という実体単語と「蜜柑」という実体単語との関連度よりも大きい。
本開示の実施例によれば、この操作S354においては、関連度が大きい2つの実体単語に対応する2つのノード間のエッジに大きい重みを付け、関連度が小さい2つの実体単語に対応する2つのノード間のエッジに小さい重みを付けることができる。例えば、「林檎」という実体単語に対応するノードと「梨」という実体単語に対応するノードとの間のエッジに付けられる重みを第1の重みとし、「林檎」という実体単語に対応するノードと「蜜柑」という実体単語に対応するノードとの間のエッジに付けられる重みを第2の重みとすると、第1の重みは、第2の重みよりも大きい。
例示的には、2つのノード間のエッジに付けられる重みの大きさは、当該2つのノードに対応する2つの実体単語間の関連度の大きさに比例してもよい。
本開示の実施例においては、2つのノードを接続するエッジに重みを付けることによって、要求実体単語と予め構築された知識マップとに基づいて推奨情報を確定する際に、一端が要求実体単語に対応するノードに接続されたエッジの重みに基づいて、優先的に、重みが大きいエッジの他端に接続されたノードに対応する関連単語に基づいて推奨情報を確定することができる。これにより、確定された推奨情報と要求情報とのマッチングを高めて、ユーザ体験を向上させることができる。
図4Aは、本開示の実施例による推奨情報を確定するフローチャートを模式的に示している。図4Bは、本開示の実施例による知識マップに基づいて推奨情報を確定する原理模式図を模式的に示している。
本開示の実施例によれば、図4Aに示すように、知識マップが構築された後、推奨情報を確定する操作S230は、操作S431 〜操作S433を含んでもよい。
操作S431において、知識マップにおける要求実体単語に対応するノードを目標ノードとして確定する。
本開示の実施例によれば、要求実体単語と知識マップにおける各ノードに対応する実体単語とを比較することによって、対応する実体単語と要求実体単語とがマッチするノードを目標ノードとして確定することができる。
本開示の実施例によれば、同一の実体を表す実体単語が複数存在する場合を考慮して、要求実体単語と知識マップの各ノードに対応する実体単語との間の第1の類似度を計算し、要求実体単語との第1の類似度が第1の類似度閾値より大きい実体単語に対応するノードを目標ノードとして確定してもよい。ここで、第1の類似度は、例えば、コサイン類似度、ジェカルト(Jaccard)類似係数等の任意のパラメータ形式により表現されてもよい。第1の類似度閾値は実際の必要に応じて設定されてもよく、例えば、一実施例において、該第1の類似度閾値は0.8であってもよい。
操作S432においては、目標ノードに関連するエッジによって、目標ノードに接続されている少なくとも1つのノードを確定する。
例示的には、図4Bに示すように、操作S431によって確定された目標ノードは、例えば、ノード401及び402を含んでもよい。ノード401及び402に関連するエッジによって、目標ノードに接続されている少なくとも1つのノード(図4Bの右上の影によって覆われているノード)を確定でき、ここでは、ノード403、ノード404、ノード405、及びノード406を含む。図4Bに示す知識マップのエッジは、指向性を有していることを指摘しておく。従って、目標ノードに接続されている少なくとも1つのノードを確定する際には、具体的には、目標ノードに接続されているエッジが指しているノードが少なくとも1つのノードとなる。実際の適用場面によっては、本開示の実施例の知識マップにおけるエッジは、指向性を有していなくてもよい。
操作S433においては、少なくとも1つのノードに対応する実体単語に基づいて、推奨情報を確定する。
本開示の実施例によれば、操作S432で確定された少なくとも1つのノードに対応する実体単語から、推奨情報を直接に生成することができる。例えば、少なくとも1つのノードに対応する実体単語及び実体単語が示す実体のカテゴリに基づいて、推奨情報を生成することができる。例示的には、「Java」という要求実体単語に対して、操作S432で確定された少なくとも1つのノードに対応する実体単語に「Android」及び「王**」を含まれていると、「Android」はOSカテゴリであり、「王**」は人物カテゴリであり、確定される推奨情報は、例えば、「AndroidOSの開発に適している」という推奨文と、「当該分野の専門化である王**」という推奨語を含む。
本開示の実施例によれば、推奨情報をさらに豊富にするために、少なくとも1つのノードに対応する実体単語に基づいて推奨情報を確定する場合、まず、少なくとも1つのノードに基づいて実体単語を拡張した後、拡張して得られた実体単語及び少なくとも1つのノードに対応する実体単語に基づいて推奨情報を生成してもよい。
例示的には、図4Bに示すように、少なくとも1つのノードにノード403、ノード404、ノード405及びノード406が含まれている場合、まず、少なくとも1つのノードに関連するエッジに基づいて、少なくとも1つのノードに接続されるノードを確定して、実体単語を1回拡張してもよい。例えば、少なくとも1つのノードに接続されたノード(図4Bにおける右下の影に覆われているノード)に、ノード407、ノード408及びノード409が含まれているとする。そして、少なくとも1つのノードに接続されたノードに対応する実体単語と、少なくとも1つのノードに対応する実体単語とに基づいて、推奨情報を生成する。
例示的には、図4Bに示すように、本開示の実施例は、少なくとも1つのノードに基づいて、実体単語を2回又は複数回にわたって拡張した後、拡張された実体単語に基づいて推奨情報を生成してもよい。例えば、拡張された実体単語には、ノード407〜ノード409と、ノード410〜ノード411に対応する実体単語が含まれている。最後に、拡張して得られた実体単語と、少なくとも1つのノードに対応する実体単語とに基づいて、推奨情報を生成する。
本開示の実施例によれば、知識マップがより豊富な情報を示すようにするために、本開示の実施例は、増量データによって知識マップにおけるノード及びエッジを補足してもよい。
図5は、本開示の実施例による知識マップを更新するフローチャートを模式的に示している。
図5に示すように、本実施例の情報推奨方法500は、前述した操作S210〜操作S240、及び操作S350に加えて、操作S560〜操作S580をさらに含んで知識マップを更新してもよい。
操作S560においては、新しいテキストが取得されたことに応答して、新しいテキストから、実体を表す複数の新しい実体単語、及び、複数の新しい実体単語間の関連関係を抽出する。
本開示の実施例によれば、新しいテキストは、例えば、サーバに知識マップを予め構築した後に、端末装置によってリアルタイムでアップロードされたテキストであってもよい。この操作S560は、前記図3Aの操作S351の実現方法と同様又は類似するので、ここでは、説明を省略する。
操作S570においては、知識マップが複数の新しい実体単語のそれぞれを示すことができるか否かを判断する。
本開示の実施例によれば、新しいテキストから抽出された複数の新しい実体単語をそれぞれ知識マップにおける各ノードに対応する実体単語と比較し、知識マップにおける複数のノードに対応する複数の実体単語の中に、複数の新しい実体単語のそれぞれが含まれているかないかを判断してもよい。複数のノードに対応する複数の実体単語に複数の新しい実体単語のある新しい実体単語が含まれていないと判断した場合、知識マップが当該新しい実体単語を示すことができないと判断する。
知識マップが複数の新しい実体単語のそれぞれを示すことができない場合、即ち、知識マップが複数の新しい実体単語の少なくとも1つを示すことができない場合、操作S580を実行し、複数の新しい実体単語及び複数の新しい実体単語間の関連関係に基づいて、知識マップを更新する。知識マップが複数の新しい実体単語のそれぞれを示すことができる場合、知識マップを更新せずに操作を終了する。
例示的には、まず、少なくとも1つの新しい実体単語に対応するノードを構築し、次に、複数の実体単語のうち、少なくとも1つの新しい実体単語のそれぞれと関連関係がある新しい関連単語を確定する。最後に、各新しい実体単語に対応するノードと、新しい関連単語に対応するノードとを接続し、各新しい実体単語に対応するノードに関連するエッジを形成する。こうして、知識マップの更新が完了する。
例示的には、知識マップが複数の新しい実体単語のそれぞれを示すことができる場合、本開示の実施例は、知識マップのエッジにより、知識マップが複数の新しい実体単語間の関連関係のそれぞれを示すことができるかないかを判断することもできる。知識マップが複数の新しい実体単語間の関連関係の一部を示すことができない場合、その一部の関連関係に応じて、知識マップにおいて新しい実体単語に対応するノードに関連するエッジを追加する。例えば、知識マップが、新しい実体単語「Python」と「スクリプト」との関連関係を示すことはできないが、この2つの新しい実体単語を示すことができる場合、知識マップにおいて「Python」という新しい実体単語に対応するノードと「スクリプト」という新しい実体単語に対応するノードとを接続するエッジを追加することによって、知識マップを更新することができる。
ユーザに推奨する情報をさらに豊富にし、企業内部の知識に対する知能的な管理を可能にするために、本開示の実施例は、知識マップを構築するためのテキストについて分類化管理を行なうことができる。例示的には、本開示の実施例は、複数の情報ノードを含むキー情報構造を予め構築してもよい。端末装置によってアップロードされたテキストを受信した後、テキストに含まれているキー情報により、テキストをキー情報構造における対応する情報ノードに分類する。これにより、ユーザが情報を要求する際に、要求情報におけるキー情報に基づいて、キー情報構造の情報ノードを分類して得られたテキストを推奨情報として端末装置にフィードバックすることができる。
図6Aは、本開示の別の実施例による情報推奨方法のフローチャートを模式的に示している。図6Bは、本開示の実施例による、予め設定されたキー情報構造の模式図を模式的に示している。
図6Aに示すように、本実施例による情報推奨方法600は、例えば、操作S210〜操作S240、及び操作S350に加えて、操作S660〜操作S670を更に含んでもよい。例示的には、操作S660〜670は、例えば操作S220と同期して実行されてもよく、あるいは、操作S220の前又は後に実行されてもよく、本開示においては特に限定されていない。
操作S660においては、要請情報からキー情報を抽出する。
本開示の実施例によれば、例えば、query文に対してキーワードを抽出することによりキー情報を取得することができる。キーワードの抽出には、TF−IDF(Term Frequency−Inverse Document Frequency)アルゴリズム、TextRankアルゴリズム、LSA(Latent Semantic Analysis)アルゴリズム、LSI(Latent Semantic Index)アルゴリズム等を利用することができる。
例示的には、本開示の実施例においては、TextRankアルゴリズムを用いてキー情報を抽出することができる。まず、例えばステップS220と同様に、要求情報に対して単語分割処理を行い、要求情報を表す単語列を取得する。そして、単語列における各単語に対して品詞ラベリング処理を行い、名詞、動詞、形容詞等の指定された品詞の単語のみを保留し、ストップワードを除去する。保留した単語を候補キー情報とする。その後、候補キー情報マップG=(V,E)を構築し、ここで、Vはノードセットであり、候補キー情報からなる。そして、二つの候補キー情報間の共起関係(Co−Occurrence)を用いて、ノードセットにおける任意の二つのノード間のエッジを構築する。そして、TextRankの公式に基づき、収束するまでノードセットにおける各ノードの重みを反復的に伝搬する。そして、ノードセットにおける各ノードを重みに基づいて逆順に並べ替え、最も重要な幾つかの単語を取得してテキストから抽出したキー情報とする。
操作S670においては、予め設定されたキー情報構造において、抽出されたキー情報と関連する情報ノードを目標情報ノードとして確定し、キー情報構造は、複数の情報ノードを含み、複数の情報ノードのそれぞれは、1つのキー情報を示す。
本開示の実施例によれば、図6Bに示すように、キー情報構造は、例えば、多層構造であってもよく、各層は、少なくとも1つの情報ノードを含み、異なる層に位置する情報ノードが示すキー情報は、異なる粒度に属する情報である。例えば、各層の情報ノードが示すキー情報の粒度は、粗いものから細かいものへと配列される。例示的には、キー情報構造は、3層構造であって、トップ層が、「人工知能」というキー情報を示す情報ノード601を含んでもよい。第2層は、「ニューラルネットワーク」というキー情報と「ディープラーニング」というキー情報をそれぞれ示す情報ノード602と情報ノード603とを含む。第3層は、「CNN(畳み込みニューラルネットワーク)」、「RNN(循環ニューラルネットワーク)」、「BM(Boltzmann Machines)」及び「RBF(Radial Basis Function)」というキー情報をそれぞれ示す情報ノード604、情報ノード605、情報ノード606、及び情報ノード607を含む。ここで、情報ノード604と情報ノード605とは、情報ノード602の細粒度のブランチノードに属し、情報ノード606と情報ノード607とは、情報ノード603の細粒度のブランチノードに属する。当該キー情報構造における各情報ノードには、例えば、該当情報ノードに分類されたテキストを記憶するための記憶空間が対応付けられてもよい。
本開示の実施例によれば、例えば、まず、抽出されたキー情報と、キー情報構造における各情報ノードが示すキー情報との類似度を確定して、類似度が高いキー情報を示す情報ノードを目標情報ノードとして確定してもよい。
例示的には、操作S670は、例えば、後述する図7又は図8に示すフローによって実現されてもよく、ここでは、説明を省略する。
この目的情報ノードの確定に基づいて、前述した推奨情報を確定する操作S240は、例えば、図6Aに示す操作S640により実現することができる。操作S640においては、要求実体単語、予め構築された知識マップ及び目標知識ノードに基づいて、推奨情報を確定する。
本開示の実施例によれば、操作S640は、例えば、要求実体単語及び予め構築された知識マップに基づいて、図6Aに示すフローによって、推奨情報を確定するしてもよく、目標知識ノードに基づいて推奨テキストを確定し、推奨テキストを推奨情報として用いてもよい。
例示的には、目標知識ノードに基づいて推奨テキストを確定することは、目標知識ノードに分類されたテキストを取得し、取得されたテキストを推奨情報とすることを含んでもよい。
本開示の実施例によれば、ユーザへのテキストの推奨を便利にするために、本開示の実施例による情報推奨方法は、例えば、テキストに基づいて知識マップを構築する際に、テキストをキー情報構造に含まれる情報ノードに分類してもよい。これにより、情報ノードに基づいてユーザにテキストを推奨しやすくなるとともに、テキストの分類管理を実現することができる。前述した操作S351により抽出された複数の実体単語には、例えば、ユーザがテキストのキー情報を示す第2の単語が含まれてもよく、当該第2の単語は、例えば、操作S660と同様の方法によりテキストから抽出されたキーワードであってもよい。
図7は、本開示の実施例による、テキストをキー情報構造に含まれる情報ノードに分類するフローチャートを模式的に示している。
図7に示すように、テキストをキー情報構造に含まれる情報ノードに分類する操作S780は、例えば、操作S781〜操作S782を含んでもよい。
操作S781においては、第2の単語に基づいて、テキストと、キー情報構造における各情報ノードとのマッチング関係を確定する。操作S782においては、テキストを、当該テキストにマッチする情報ノードに分類する。
本開示の実施例によれば、複数の実体単語のうち第2の単語と、各情報ノードが示すキー情報との類似関係を基づいて、テキストと各情報ノードとのマッチング関係を確定してもよい。マッチング関係に基づいて、テキストとマッチする情報ノードを確定し、テキストをマッチする情報ノードに対応する記憶空間に記憶する。
例示的には、操作S781は、例えば、後の図8に示すフロー又は図9に示すフローによって実現されてもよく、ここでは、説明を省略する。
本開示の実施例によれば、前述した知識マップと同様に、予め設定されたキー情報構造は、例えば増量データに基づいて補足されてもよい。例えば、本実施例による情報推奨方法は、新しいテキストが取得されたことに応答して、当該新しいテキストから新しいテキストのキー情報を抽出し、抽出したキーワードを新しいキー情報とする。この操作の実現方式は、前述した操作S660の実現方式と類似しており、ここでは、説明を省略する。新しいキー情報を抽出した後に、キー情報の構造に、新しいキー情報を示す情報ノードが含まれているか否かを判断する。含まれていない場合に、新しいキー情報に基づいてキー情報構造を更新する。
例示的には、新しいキー情報とキー情報構造における複数の情報ノードが示すキー情報との関連関係に基づいて、新しいキー情報に対応する情報ノードを追加してもよい。例えば、新しいキー情報が「LSTM」である場合、新しいキー情報「LSTM」と図6Bの情報ノード605が示すキー情報「RNN」との従属関係に基づいて、情報ノード605の下位構造において情報ノード605に属するブランチノードを追加し、「LSTM」に対応する情報ノードとする。
図8は、本開示の実施例による、テキストとキー情報構造における各情報ノードとのマッチング関係を確定するフローチャートを模式的に示している。
図8に示すように、一実施例において、テキストとキー情報構造における各情報ノードとのマッチング関係を確定する操作S781は、操作S8811から始まる操作S8811〜操作S8812を含んでもよい。
操作S8811において、第2の単語に、各情報ノードが示すキー情報と同じである目標単語が含まているか否かを判断する。
本開示の実施例によれば、第2の単語とキー情報構造における各情報ノードが示すキー情報とを比較し、第2の単語がキー情報と一致すれば、第2の単語を目標単語として確定してもよい。
例示的には、テキストから抽出された実体単語は、例えば、複数の第2の単語を含んでもよく、本実施例は、複数の第2の単語の各第2の単語とキー情報構造における各情報ノードが示すキー情報とを比較し、第2の単語に目標単語が含まれているか否かを確定してもよい。
第2の単語に目標単語が含まれている場合に、操作S8812を実行し、テキストと各情報ノードとのマッチング関係をマッチすると確定する。
場面によって同じ単語の表現が異なる場合があることを考慮し、キー情報構造に含まれている情報ノードが示す単語の表現と第2の単語の表現とが異なることに起因して、テキストと情報ノードとのマッチング関係を正確に判断できなくなることを回避するためである。本実施例において、テキストとキー情報構造における各情報ノードとのマッチング関係を確定する操作は、操作S8811〜操作S8812以外に、操作S8813〜操作S8815をさらに含んでもよい。これに対応して、知識マップには、同じ語に対する異なる表現を有するノードを有してもよい。例示的には、知識マップにおけるノードは、「CNN」という実体に対応するノードだけでなく、「畳み込みニューラルネットワーク」という実体に対応するノードも含む。
第2の単語に目標単語が含まれていない場合、操作S8813を実行し、知識マップから第2の単語の関連単語を取得する。例示的には、まず、知識マップにおいて第2の単語を示すノードを確定してもよい。そして、第2の単語を示すノードに関連するエッジに基づいて、第2の単語の関連単語を確定する。例えば、関連するエッジに接続されるノードが示す実体単語を関連単語とする。
操作S8814においては、第2の単語の関連単語に目標単語が含まれているか否かを判断する。この操作S8814の実現方法は、操作S8811の実現方法と類似しており、ここでは、説明を省略する。
第2の単語の関連単語に目標単語が含まれている場合には、操作S8812を実行し、テキストと各情報ノードとのマッチング関係をマッチすると確定する。
第2の単語の関連単語に目標単語が含まれていない場合には、操作S8815を実行し、テキストと各情報ノードとのマッチング関係をマッチしないと確定する。
本開示の実施例によれば、テキストと情報ノードとのマッチング関係を確定する際に、知識マップに基づいてテキストにおける第2の単語の関連単語を取得することによって、マッチングを行なう際に用いられる単語がテキストの内容をより完全に表すことができるようにして、確定されたテキストと情報ノードとのマッチング関係の正確性を高めることができる。
図9は、本開示の別の実施例による、テキストとキー情報構造における各情報ノードとのマッチング関係を確定するフローチャートを模式的に示している。
図9に示すように、別の実施例において、テキストとキー情報構造における各情報ノードとのマッチング関係を確定する操作S781は、操作S9811〜操作S9814を含んでもよい。
操作S9811において、第2の単語と各情報ノードが示すキー情報との類似度を確定する。
本開示の実施例によれば、この操作においては、例えば、第2の単語と各情報ノードが示すキー情報とのコサイン類似度、ジェカルト類似係数を計算することにより、両者の類似度を取得することができる。例示的には、第2の単語の数が複数である場合、操作S9811においては、各第2の単語と各情報ノードが示すキー情報との類似度を確定して、複数の類似度を取得する。
操作S9812においては、類似度が類似度閾値より大きいか否かを判断する。ここで、類似度閾値は、例えば、実際の必要に応じて設定されてもよく、本開示においては特に限定されていない。例示的には、この類似度閾値は、0.9であってもよい。
類似度が類似度閾値よりも大きい場合には、操作S9813を実行し、テキストと各情報ノードとのマッチング関係をマッチすると確定する。類似度が類似度閾値以下である場合には、操作S9814を実行し、テキストと各情報ノードとのマッチング関係をマッチしないと確定する。
例示的には、第2の単語の数が複数である場合、操作S9812においては、複数の類似度に類似度閾値より大きい類似度が含まれているか否かを判断してもよい。含まれている場合、操作S9813を実行し、含まれていない場合、操作S9814を実行する。
以上のフローにより、本開示の実施例は、まず、テキストからキーワードを抽出し、次に、キーワードに基づいて、キー情報構造におけるマッチする情報ノードを確定することができる。最後に、テキストをマッチする情報ノードに対応する記憶空間に記憶する。テキストから複数のキーワードが抽出された場合、キー情報構造から複数のマッチする情報ノードが得られる。この場合、テキストを複数個にコピーし、複数のマッチする情報ノードに対応する記憶空間に記憶する。
例示的には、過度に記憶空間を占有することを避けるために、各情報ノードに対して1つのテキストリストを維持することができる。テキストリストには、該当情報ノードに分類され得るテキストのタイトル等が含まれてもよい。推奨情報を確定した後、端末装置にテキストをプッシュする場合には、情報ノードのテキストリストに応じてテキストを取得してもよい。
本開示の実施例による情報推奨方法は、様々な適用場面に適用可能であることを理解すべきである。例えば、この情報推奨方法は、知識検索の適用場面、知識質問・回答の適用場面、情報主動推奨の適用場面の少なくとも1つに適用できる。
図10は、本開示の実施例による、情報推奨方法を実現するためのシステム構造図を模式的に示している。
図10に示すように、本実施例の情報推奨方法を実現するためのシステム構造1000は、例えば、知識前処理モジュール1010、知識マップ構築モジュール1020、知識サービスモジュール1030、及び知識適用モジュール1040を含んでもよい。
知識前処理モジュールは、例えば、様々な情報がオンライン知識を形成するように、図3Bに示すフローによって知識としての情報を収集するために用いられる。そして、形成されたオンライン知識に対して知識選別を行い、知識性が高く、内容品質が高いオンライン知識のみを残す。
知識マップ構築モジュール1020は、例えば、図3Aに示すフローを実行することによって知識マップを構築するために用いられる。例えば、まず、知識前処理モジュール1010により得られた知識を発掘する。知識発掘により、例えば、オンライン知識の様々な変形が得られる。例示的には、オンライン知識が中国語表記の知識であれば、知識発掘により、例えば英語表記の知識を得ることができる。知識を発掘した後に、オンライン知識と発掘した知識に対して実体発掘を行う。即ち、知識から複数の実体単語及び複数の実体単語間の関連関係を抽出する。最後に、実体発掘により得られた情報をマップ化して知識マップを得る。マップ化する過程は、例えば、前述した操作S352により実現することができる。
例示的には、知識マップ構築モジュール1020は、例えば、知識の分類を可能にするように、知識分類体系を構築するためにも用いられる。例えば、知識マップ構築モジュール1020は、図7に示すフローによって知識としてのテキストを分類し、知識分類体系の構築を実現するために用いてもよい。
知識サービスモジュール1030は、例えば、まず、知識マップに基づいて、ユーザに推奨する知識の知識要素を生成することができる。生成された知識要素は、前述した図4Aに示すフローによって得られた実体単語を含んでもよい。そして、生成された知識要素を集約する。例えば、前述した操作S433によって知識集約を行うことができる。これとともに、知識サービスモジュール1030は、知識分類体系から知識を検索することもでき、知識の検索は、例えば、図6Aに示すフローによって行うことができ、検索によって、目標情報ノードに分類されるテキストを得ることができる。知識検索の過程において、知識分類体系からテキストを得ることができない場合には、知識推理を行った後に再度知識検索を行うようにしてもよいことを指摘しておく。知識推理は、例えば、図8に示す操作S8813によって行うことができる。
知識サービスモジュール1030の機能に基づいて、知識適用モジュール1040は、端末装置によってユーザに「知識ポータル」機能モジュール、「知識検索」機能モジュール、「知識質問・回答」機能モジュール、及び「場面化推奨」機能モジュールを提供することができる。ここで、「知識ポータル」機能モジュールにより、ユーザは、例えば知識のアップロードやダウンロード等を行うことができる。「知識検索」機能モジュールにより、ユーザは、例えば検索語句を入力して、知識マップや知識分類体系から知りたい知識を検索することができる。「知識質問・回答」機能モジュールにより、ユーザは、例えば質問語句を入力して、知識マップや知識分類体系から質問に回答する知識を取得することができる。「場面化推奨」機能モジュールにより、端末装置は、例えば、ユーザの好みに応じて、ユーザに適した知識を推奨することができる。
以上のように、本開示の実施例は、情報推奨方法を実行するのに適したシステム構造を構築することにより、企業の知識の知能管理及び適用に完全なソリューションを提供することができる。企業内部の分散化又は断片化された文書を効率的に選別して集約し、知識の体系化管理及び企業知識マップの構築を実現することができる。これにより、企業知識マップと作業場面をより十分に融合して、作業場面知識の知能化応用を実現し、企業の知識生産及び応用の効率を向上させることができる。
図11は、本開示の実施例による情報推奨装置の構成ブロック図を模式的に示している。
図11に示すように、本実施例による情報推奨装置1100は、例えば、取得モジュール1110、情報抽出モジュール1120、情報確定モジュール1130及び情報プッシュモジュール1140を含んでもよい。
取得モジュール1110は、要求情報を取得するためのモジュールである。一実施例において、取得モジュール1110は、図2に示す操作S210を実行することができ、ここでは、説明を省略する。
情報抽出モジュール1120は、要求情報から実体を表す要求実体単語を抽出するためのモジュールである。一実施例において、情報抽出モジュール1120は、図2に示す操作S220を実行することができ、ここでは、説明を省略する。
情報確定モジュール1130は、要求実体単語と予め構築された知識マップに基づいて、推奨情報を確定するためのモジュールである。ここで、知識マップは、テキストに基づいて構築され、且つ、テキストのソースを表す第1の単語を示す。一実施例において、情報確定モジュール1130は、図2に示す操作S230を実行することができ、ここでは、説明を省略する。
情報プッシュモジュール1140は、推奨情報をプッシュするためのモジュールである。一実施例において、情報プッシュモジュール1140は、図2に示す操作S240を実行することができ、ここでは、説明を省略する。
本開示の実施例によれば、情報推奨装置1100は、例えば、テキストに基づいて知識マップを構築するマップ構築モジュールをさらに含んでもよい。例えば、このマップ構築モジュールは、例えば、図3A及び図3Cに示すフローを実行することができ、ここでは、説明を省略する。
本開示の実施例によれば、上記情報確定モジュール1130は、例えば、図4Aに示すフロー及び/又は図6Aに示す操作S640を実行することができ、ここでは、説明を省略する。
本開示の実施例によれば、上記情報抽出モジュール1120は、例えば、図5に示す操作S560を行うことができる。情報推奨装置1100は、例えば、判断モジュールと、更新モジュールとをさらに含んでもよい。判断モジュールは、例えば、図5に示す操作S570を実行することができ、更新モジュールは、例えば、図5に示す操作S580を実行することができ、ここでは、説明を省略する。
本開示の実施例によれば、上記情報抽出モジュール1120は、例えば、図6Aに示す操作S660を実行してもよい。情報推奨装置1100は、例えば、図6Aに示す操作S670を実行するためのノード確定モジュールをさらに含んでもよく、ここでは、説明を省略する。
本開示の実施例によれば、情報推奨装置1100は、例えば、テキストをキー情報構造に含まれる情報ノードに分類するテキスト分類モジュールをさらに含んでもよい。このテキスト分類モジュールは、例えば、図7に示す操作S781〜操作S782を実行することができ、ここでは、説明を省略する。
本開示の実施例によれば、テキスト分類モジュールは、例えば、前述した図8に示すフロー又は図9に示すフローにより、テキストとキー情報構造における各情報ノードとのマッチング関係を確定することができ、ここでは、説明を省略する。
本開示の実施例によるモジュール、サブモジュール、ユニット、サブユニットのうちのいずれか1つ以上、又はこれらのうちのいずれか1つ以上の少なくとも一部の機能は、1つのモジュールにより実現されることができる。本開示の実施例によるモジュール、サブモジュール、ユニット、サブユニットのうちのいずれか1つ又は複数は、複数のモジュールに分割されて実現してもよい。本開示の実施例によるモジュール、サブモジュール、ユニット、サブユニットのうちのいずれか1つ又は複数は、少なくとも部分的に、例えばFPGA(Filed Programmable Gate Array)、PLA(Programmable Logic Array)、SOC(System On Chip)、SOS(System On Substrate)、SOP(System On Package)、ASIC(Application Specific Integrated Circuit)等のハードウェア回路として実現されてもよく、又は、回路を集積又はパッケージ化する他の合理的な任意の方式のハードウェアもしくはファームウェアによって実現されてもよく、又は、ソフトウェア、ハードウェア、及びファームウェアの3つの実現方式のうちの任意の1つもしくは複数の組み合わせによって実現されてもよい。あるいは、本開示の実施例によるモジュール、サブモジュール、ユニット、サブユニットのうちの1つ以上は、少なくとも部分的に、実行されたときに対応する機能を実行可能なプログラムモジュールとして実現されてもよい。
図12は、本開示の実施例による情報推奨方法を実行するのに適した電子機器の一例であるコンピュータシステムのブロック図を模式的に示している。
図12に示すように、本開示の実施例によるコンピュータシステム1200は、プロセッサ1201を含み、ROM(Read Only Memory)1202に記憶されているプログラム、又は、記憶部1208からRAM(Random Access Memory)1203にロードされたプログラムに従って、様々な適切な動作及び処理を実行することができる。プロセッサ1201は、例えば、汎用マイクロプロセッサ(例えば、CPU)、命令セットプロセッサ、及び/又は関連チップセット、及び/又は特定用途向けマイクロプロセッサ(例えば、ASIC)等を含んでもよい。プロセッサ1201は、キャッシュ用途のためのオンボードメモリも含んでもよい。プロセッサ1201は、本開示の実施例による方法のフローの異なる動作を実行するための単一の処理ユニット又は複数の処理ユニットを含んでもよい。
RAM1203には、システム1200の操作に必要な各種のプログラムやデータが記憶されている。プロセッサ1201、ROM1202、RAM1203は、バス1204により相互に接続されている。プロセッサ1201は、ROM1202及び/又はRAM1203内のプログラムを実行することにより、本開示の実施例による方法のフローの様々な操作を実行する。前記プログラムは、ROM1202及びRAM1203以外のメモリに記憶されていてもよいことを指摘しておく。プロセッサ1201は、前記1つ又は複数のメモリに記憶されたプログラムを実行することによって、本開示の実施例による方法のフローの様々な操作を実行してもよい。
本開示の実施例によれば、システム1200は、入力/出力(I/O)インターフェース1205を更に含んでもよい。入力/出力(I/O)インターフェース1205もバス1204に接続されている。システム1200は、I/Oインターフェース1205に接続された、キーボード、マウス等を含む入力部1206、CRT、LCD等とスピーカ等を含む出力部1207、ハードディスク等を含む記憶部1208、LANカード、モデム等のネットワークインターフェースカードを含む通信部1209、のうちの1つ又は複数をさらに含んでもよい。通信部1209は、インターネット等のネットワークによって通信処理を行う。ドライバ1210も、必要に応じて、I/Oインターフェース1205に接続される。取り外し可能な媒体1211は、例えば、磁気ディスク、光ディスク、光磁気ディスク、半導体メモリ等であり、必要に応じてドライバ1210に装着されて、それから読み出されたプログラムが必要に応じて記憶部1208にインストールされるようにする。
本開示の実施例によれば、本開示の実施例による方法のフローは、コンピュータソフトウェアプログラムとして実現されてもよい。例えば、本開示の実施例は、コンピュータ読み取り可能な記憶媒体にインストールされたプログラムを含むプログラム製品を含み、このプログラムは、フローチャートに示す方法を実行するためのプログラムコードを含む。このような実施例で、このプログラムは、通信部1209によってネットワークからダウンロードしてインストールされてもよいし、取り外し可能な媒体1211からインストールされてもよい。このプログラムがプロセッサ1201によって実行されると、本開示の実施例のシステムにおいて限定した上記機能が実行される。本開示の実施例によれば、前述したシステム、デバイス、装置、モジュール、ユニット等は、プログラムモジュールにより実現することができる。
本開示は、さらに、コンピュータ読み取り可能な記憶媒体を提供しており、当該コンピュータ読み取り可能な記憶媒体は、上記実施例に記載のデバイス/装置/システムに含まれてもよく、デバイス/装置/システムに組み込まれずに単独で存在してもよい。上記コンピュータ読み取り可能な記憶媒体には、一つ又は複数のプログラムが記録されており、上記一つ又は複数のプログラムが実行されると、本開示の実施例による方法を実現する。
本開示の実施例によれば、コンピュータ読み取り可能な記憶媒体は、不揮発性のコンピュータ読み取り可能な記憶媒体であってもよく、例えば、携帯型コンピュータディスク、ハードディスク、RAM、ROM、消去可能プログラマブルリードオンリメモリ(EPROM又はフラッシュメモリ)、携帯型コンパクトディスクROM(CD−ROM )、光記憶デバイス、磁気記憶デバイス、又は上記の任意の適切な組み合わせを含み得るが、これらに限定されない。本開示において、コンピュータ読み取り可能な記憶媒体は、プログラムを含む又は記憶する、任意の有形媒体であってもよく、このプログラムは、命令実行システム、装置又はデバイスによって又はそれらと関連して使用される。例えば、本開示の実施例によれば、コンピュータ読み取り可能な記憶媒体は、前述したROM1202及び/又はRAM1203、並びに/或いはROM1202及びRAM1203以外の1つ又は複数のメモリを含んでもよい。
図面におけるフローチャート及びブロック図は、本開示の様々な実施例によるシステム、方法、及びプログラム製品の実現可能な構造、機能及び操作を示している。この点に関して、フローチャート又はブロック図における各ブロックは、モジュール、セグメント、又はコードの一部を表すことができ、モジュール、セグメント、又はコードの一部は、特定な論理機能を実現するための1つ又は複数の実行可能命令を含む。これに代えて、別の実現では、ブロックに表記された機能は、図面に示す順序とは異なる順序で生じ得ることにも留意すべきである。例えば、連続して示される2つのブロックは、実際には、機能に応じて、実質的に並列に実行されてもよく、逆順に実行されてもよい。ブロック図又はフローチャートの各ブロック、及びブロック図又はフローチャートのブロックの組合せは、特定な機能又は操作を実行する専用ハードウェアベースのシステムで実現されてもよく、又は専用ハードウェアとコンピュータ命令との組合せにより実現されてもよいことにも留意すべきである。
当業者は、本開示に明示的に記載されていなくても、本開示の様々な実施例及び/又は特許請求の範囲に記載された特徴について様々な組合せ又は結合で実施してもよいことを理解するだろう。特に、本開示の様々な実施例及び/又は特許請求の範囲に記載された特徴は、本開示の精神及び教示から逸脱することなく、様々な組合せ及び/又は結合を行うことができる。これらの組合せ及び/又は結合はいずれも本開示の範囲に含まれる。
以上、本開示の実施例を説明した。しかしながら、これらの実施例は、説明のためのものであり、本開示の範囲を限定するものではない。以上、各実施例を個別に説明したが、各実施例における各手段を適宜組み合わせて用いることができないことを意味するわけではない。本開示の範囲は、添付の特許請求の範囲及びその均等物によって限定される。当業者は、本開示の範囲から逸脱することなく、様々な変更及び修正を行うことができ、これらの変更及び修正も本開示の範囲に属する。

Claims (17)

  1. 要求情報を取得することと、
    前記要求情報から実体を表す要求実体単語を抽出することと、
    前記要求実体単語及び予め構築された知識マップに基づいて推奨情報を確定することと、
    前記推奨情報をプッシュすることと、を含み、
    前記知識マップは、テキストに基づいて構築され、且つ、前記テキストのソースを表す第1の単語を示す
    情報推奨方法。
  2. 前記テキストから、前記第1の単語を含む、実体を表す複数の実体単語、及び前記複数の実体単語間の関連関係を抽出することと、
    抽出された前記複数の実体単語と前記複数の実体単語間の関連関係に基づいて知識マップを構築することと、を含む、
    テキストに基づいて知識マップを構築することをさらに含む
    請求項1に記載の情報推奨方法。
  3. 知識マップを構築することは、
    前記複数の実体単語の各実体単語に対して、前記各実体単語に対してノードを構築することと、
    前記複数の実体単語間の関連関係に基づいて、前記複数の実体単語のうち前記各実体単語と関連関係がある関連単語を確定することと、
    前記各実体単語に対応するノードと前記関連単語に対応するノードとを接続して、前記各実体単語に対応するノードに関連するエッジを形成することと、を含む
    請求項2に記載の情報推奨方法。
  4. 知識マップを構築することは、
    前記各実体単語と前記関連単語との関連関係に基づいて、前記各実体単語と前記関連単語との関連度を確定することと、
    前記関連度に基づいて、前記各実体単語に対応するノードと前記関連単語に対応するノードとを接続するエッジに重みを付けることと、をさらに含み、
    前記関連度の大きさは、前記重みの大きさに比例する
    請求項3に記載の情報推奨方法。
  5. 前記推奨情報を確定することは、
    前記知識マップにおける前記要求実体単語に対応するノードを目標ノードとして確定することと、
    前記目標ノードに関連するエッジに基づいて、前記目標ノードに接続される少なくとも1つのノードを確定することと、
    前記少なくとも1つのノードに対応する実体単語に基づいて、前記推奨情報を確定することと、を含む
    請求項3に記載の情報推奨方法。
  6. 新しいテキストが取得されたことに応答して、前記新しいテキストから、実体を表す複数の新しい実体単語、及び前記複数の新しい実体単語間の関連関係を抽出することと、
    前記知識マップが前記複数の新しい実体単語のうち少なくとも1つの新しい実体単語を示すことができない場合、前記複数の新しい実体単語及び前記複数の新しい実体単語間の関連関係に基づいて、前記知識マップを更新することと、をさらに含む
    請求項2に記載の情報推奨方法。
  7. 前記要求情報からキー情報を抽出することと、
    予め設定されたキー情報構造のうち、抽出されたキー情報に関連する情報ノードを目標情報ノードとして確定されることと、さらにを含み、
    前記キー情報構造は、複数の情報ノードを含み、前記複数の情報ノードのそれぞれは1つのキー情報を示し、
    前記推奨情報を確定することは、前記要求実体単語、予め構築された知識マップ、及び前記目標知識ノードに基づいて推奨情報を確定することを含む
    請求項2〜6のいずれか一項に記載の情報推奨方法。
  8. 前記複数の実体単語は、前記テキストのキー情報を表す第2の単語を更に含み、
    前記情報推奨方法は、前記テキストを、前記キー情報構造に含まれる情報ノードに分類することをさらに含み、
    前記テキストを分類することは、
    前記第2の単語に基づいて、前記テキストと前記キー情報構造における各情報ノードとのマッチング関係を確定することと、
    前記テキストを前記テキストにマッチする情報ノードに分類することと、を含む
    請求項7に記載の情報推奨方法。
  9. 前記第2の単語の数は複数であり、
    前記テキストと前記キー情報構造における各情報ノードとのマッチング関係を確定することは、
    前記第2の単語が、前記各情報ノードが示すキー情報と同じである目標単語を含むか否かを確定することと、
    前記第2の単語に前記目標単語が含まれている場合、前記テキストと前記各知識ノードとのマッチング関係がマッチすると確定することと、を含む
    請求項8に記載の情報推奨方法。
  10. 前記テキストと前記キー情報構造における各情報ノードとのマッチング関係を確定することは、
    前記第2の単語に目標単語が含まれていない場合、前記知識マップから前記第2の単語の関連単語を取得することと、
    前記第2の単語の関連単語に前記目標単語が含まれている場合、前記テキストと前記各情報ノードとのマッチング関係がマッチすると確定することと、をさらに含む
    請求項9に記載の情報推奨方法。
  11. 前記テキストと前記キー情報構造における各情報ノードとのマッチング関係を確定することは、
    前記第2の単語と、前記各情報ノードが示すキー情報との類似度を確定することと、
    前記類似度が類似度閾値より大きい場合に、前記テキストと前記各情報ノードとのマッチング関係がマッチすると確定することと、を含む
    請求項8に記載の情報推奨方法。
  12. 新しいテキストが取得されたことに応答して、前記新しいテキストから前記新しいテキストの新しいキー情報を抽出することと、
    前記キー情報構造に前記新しいキー情報を示す情報ノードが含まれていない場合、前記新しいキー情報に基づいて、前記キー情報構造を更新することと、をさらに含む
    請求項8に記載の情報推奨方法。
  13. 推奨情報を確定することは、
    前記目標情報ノードに分類されるテキストを前記推奨情報として取得することを含む
    請求項8に記載の情報推奨方法。
  14. 要求情報を取得する取得モジュールと、
    前記要求情報から実体を表す要求実体単語を抽出する情報抽出モジュールと、
    前記要求実体単語及び予め構築された知識マップに基づいて推奨情報を確定する情報確定モジュールと、
    前記推奨情報をプッシュする情報プッシュモジュールと、を含み、
    前記知識マップは、テキストに基づいて構築され、且つ、前記テキストのソースを表す第1の単語を示す
    情報推奨装置。
  15. 1つ又は複数のプロセッサと、
    1つ又は複数のプログラムを記憶する記憶装置と、を含み、
    前記1つ又は複数のプログラムが前記1つ又は複数のプロセッサによって実行されるとき、前記1つ又は複数のプロセッサに、請求項1〜13のいずれか一項に記載の方法を実行させる
    電子機器。
  16. プロセッサによって実行されたときに、プロセッサに請求項1〜13のいずれか一項に記載の方法を実行させる実行可能な命令が記憶されている
    コンピュータ読み取り可能な記憶媒体。
  17. 実行されたときに、請求項1〜13のいずれか一項に記載の方法を実現させるコンピュータ実行可能な命令を含む
    プログラム。
JP2020205875A 2020-06-22 2020-12-11 情報推奨方法及び装置、並びに、電子機器、プログラム及びコンピュータ読み取り可能な記憶媒体 Pending JP2022002075A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010577208.5A CN111753198B (zh) 2020-06-22 2020-06-22 信息推荐方法和装置、以及电子设备和可读存储介质
CN202010577208.5 2020-06-22

Publications (1)

Publication Number Publication Date
JP2022002075A true JP2022002075A (ja) 2022-01-06

Family

ID=72674903

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020205875A Pending JP2022002075A (ja) 2020-06-22 2020-12-11 情報推奨方法及び装置、並びに、電子機器、プログラム及びコンピュータ読み取り可能な記憶媒体

Country Status (5)

Country Link
US (1) US20210397980A1 (ja)
EP (1) EP3929769A1 (ja)
JP (1) JP2022002075A (ja)
KR (1) KR20210040891A (ja)
CN (1) CN111753198B (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112732935A (zh) * 2021-01-11 2021-04-30 中国互联网络信息中心 域名推荐方法、系统、电子设备及存储介质
CN112884542A (zh) * 2021-01-21 2021-06-01 北京电解智科技有限公司 商品推荐方法和装置
CN112954025B (zh) * 2021-01-29 2023-07-18 北京百度网讯科技有限公司 基于分层知识图谱推送信息方法、装置、设备、介质
CN112749344B (zh) * 2021-02-04 2023-08-01 北京百度网讯科技有限公司 信息推荐方法、装置、电子设备、存储介质及程序产品
CN112836126A (zh) * 2021-02-08 2021-05-25 珠海格力电器股份有限公司 基于知识图谱的推荐方法、装置、电子设备及存储介质
CN112948590A (zh) * 2021-02-21 2021-06-11 深圳数研锦瀚智慧科技有限公司 一种基于预案的森林火灾响应方法及系统
CN113079417B (zh) * 2021-03-25 2023-01-17 北京百度网讯科技有限公司 生成弹幕的方法、装置、设备和存储介质
CN113515700B (zh) * 2021-07-01 2024-02-20 深圳追一科技有限公司 信息推送方法、装置、电子设备及存储介质
CN113722434B (zh) * 2021-08-30 2024-05-03 平安科技(深圳)有限公司 一种文本数据处理的方法、装置、计算机设备及存储介质
CN113779116B (zh) * 2021-09-10 2023-07-11 平安科技(深圳)有限公司 对象排序方法、相关设备及介质
CN113961811B (zh) * 2021-10-28 2024-04-05 平安科技(深圳)有限公司 基于事件图谱的话术推荐方法、装置、设备及介质
CN114417007A (zh) * 2021-12-21 2022-04-29 建信金融科技有限责任公司 金融产品的推荐方法和相关设备
CN114579875B (zh) * 2022-03-03 2022-09-27 中国科学院大学 基于知识图谱的设备故障诊断与维修知识推荐系统
CN114817737B (zh) * 2022-05-13 2024-01-02 北京世纪超星信息技术发展有限责任公司 一种基于知识图谱的文物热点推送方法及系统
CN115422369B (zh) * 2022-08-30 2023-11-03 中国人民解放军国防科技大学 基于改进TextRank的知识图谱补全方法和装置
CN116089624B (zh) * 2022-11-17 2024-02-27 昆仑数智科技有限责任公司 基于知识图谱的数据推荐方法、装置和系统
CN115878904B (zh) * 2023-02-22 2023-06-02 深圳昊通技术有限公司 基于深度学习的知识产权个性化推荐方法、系统及介质
CN117648449B (zh) * 2024-01-30 2024-05-14 青岛培诺教育科技股份有限公司 基于知识图谱的自适应推送方法、系统、设备和介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016517599A (ja) * 2013-03-15 2016-06-16 ロバート ハドック, 知識への1段階アクセスを提供する適応ユーザインターフェースを有する知的インターネットシステム
JP2019053520A (ja) * 2017-09-15 2019-04-04 ヤフー株式会社 提供装置、提供方法及び提供プログラム
JP2019074843A (ja) * 2017-10-13 2019-05-16 ヤフー株式会社 情報提供装置、情報提供方法、およびプログラム
JP2020009140A (ja) * 2018-07-06 2020-01-16 株式会社東芝 情報検索システム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2959405A4 (en) * 2013-02-19 2016-10-12 Google Inc RESEARCH BASED ON TREATMENT OF NATURAL LANGUAGE
CN107609152B (zh) * 2017-09-22 2021-03-09 百度在线网络技术(北京)有限公司 用于扩展查询式的方法和装置
AU2018241092B2 (en) * 2017-10-04 2019-11-21 Accenture Global Solutions Limited Knowledge enabled data management system
US10776337B2 (en) * 2018-07-06 2020-09-15 International Business Machines Corporation Multi-dimensional knowledge index and application thereof
CN110188168B (zh) * 2019-05-24 2021-09-03 北京邮电大学 语义关系识别方法和装置
CN110457452B (zh) * 2019-07-08 2022-06-14 汉海信息技术(上海)有限公司 推荐理由生成方法、装置、电子设备及可读存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016517599A (ja) * 2013-03-15 2016-06-16 ロバート ハドック, 知識への1段階アクセスを提供する適応ユーザインターフェースを有する知的インターネットシステム
JP2019053520A (ja) * 2017-09-15 2019-04-04 ヤフー株式会社 提供装置、提供方法及び提供プログラム
JP2019074843A (ja) * 2017-10-13 2019-05-16 ヤフー株式会社 情報提供装置、情報提供方法、およびプログラム
JP2020009140A (ja) * 2018-07-06 2020-01-16 株式会社東芝 情報検索システム

Also Published As

Publication number Publication date
EP3929769A1 (en) 2021-12-29
KR20210040891A (ko) 2021-04-14
CN111753198A (zh) 2020-10-09
CN111753198B (zh) 2024-01-12
US20210397980A1 (en) 2021-12-23

Similar Documents

Publication Publication Date Title
JP2022002075A (ja) 情報推奨方法及び装置、並びに、電子機器、プログラム及びコンピュータ読み取り可能な記憶媒体
US9355171B2 (en) Clustering of near-duplicate documents
US7860817B2 (en) System, method and computer program for facet analysis
US11182433B1 (en) Neural network-based semantic information retrieval
US11687795B2 (en) Machine learning engineering through hybrid knowledge representation
Rodrigo et al. ScienceSearch: Enabling search through automatic metadata generation
El Abdouli et al. Sentiment analysis of moroccan tweets using naive bayes algorithm
US11841851B1 (en) Systems, methods, and graphical user interfaces for taxonomy-based classification of unlabeled structured datasets
Suri et al. Leveraging organizational resources to adapt models to new data modalities
Zeng et al. Mobile visual search model for Dunhuang murals in the smart library
Tsapatsoulis Image retrieval via topic modelling of Instagram hashtags
Drakopoulos et al. A semantically annotated JSON metadata structure for open linked cultural data in Neo4j
KR20210129465A (ko) 연구노트 관리 장치 및 이를 이용한 연구노트 검색 방법
JP2021531540A (ja) マルチソース型の相互運用性および/または情報検索の最適化
US20240028917A1 (en) Generating a knowledge base from mathematical formulae in technical documents
Yu et al. Reasoning on crowd-sourced semantic annotations to facilitate cataloguing of 3D artefacts in the cultural heritage domain
Shao Research on fuzzy ontology e-learning based on user profile
CN115269862A (zh) 一种基于知识图谱的电力问答与可视化系统
Yan et al. Improving document clustering for short texts by long documents via a dirichlet multinomial allocation model
TW578067B (en) Knowledge graphic system and method based on ontology
Lamba et al. Predictive Modeling
Lang et al. The next-generation search engine: Challenges and key technologies
US20230409870A1 (en) Systems and Methods for Artificial Intelligence Assistant Publishing
Noman WHO Data: A Modified Approach for Retrieval
US20240111794A1 (en) Searching a data source using embeddings of a vector space

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201211

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220215

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220516

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220518

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220927

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230322

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20231017