JP2020035427A - 情報を更新するための方法と装置 - Google Patents

情報を更新するための方法と装置 Download PDF

Info

Publication number
JP2020035427A
JP2020035427A JP2019128638A JP2019128638A JP2020035427A JP 2020035427 A JP2020035427 A JP 2020035427A JP 2019128638 A JP2019128638 A JP 2019128638A JP 2019128638 A JP2019128638 A JP 2019128638A JP 2020035427 A JP2020035427 A JP 2020035427A
Authority
JP
Japan
Prior art keywords
subject name
headword
information
initial
pending
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019128638A
Other languages
English (en)
Other versions
JP6868062B2 (ja
Inventor
伍志▲鵬▼
zhi peng Wu
王志▲華▼
Zhi Hua Wang
▲楊▼天行
Tian Xing Yang
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2020035427A publication Critical patent/JP2020035427A/ja
Application granted granted Critical
Publication of JP6868062B2 publication Critical patent/JP6868062B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】情報を更新するための方法と装置を提供する。【解決手段】方法は、処理待ち情報から少なくとも1つの主体名見出し語を取得するステップ201と、少なくとも1つの主体名見出し語のうちの主体名見出し語に対し、当該主体名見出し語を、予め取得された少なくとも1つの初期情報源主体名見出し語とマッチングし、マッチング結果に基づいて当該主体名見出し語に重み値を設定するステップ202と、重み値に従い、少なくとも1つの主体名見出し語のうちの主体名見出し語と、少なくとも1つの初期情報源主体名見出し語のうちの初期情報源主体名見出し語とを並べ替えて、更新後の少なくとも1つの初期情報源主体名見出し語を得るステップ203と、を含む。当該実施形態は、ユーザが情報を取得することの正確性と効率を向上させる。【選択図】図2

Description

本発明の実施例は、データ処理技術の分野に関し、具体的には情報を更新するための方法と装置に関する。
情報化の度合いが高くなるにつれて、多くの分野で膨大なデータが蓄積され、オンライン小説はその中の1つの分野に属している。通常、オンライン小説は、異なる時間に、小説の内容の順でインターネットに掲載される。ユーザは、ネットワークを介してオンライン小説の最新掲載された小説の内容を入手することができる。
本発明の実施例は、情報を更新するための方法と装置を提供する。
第1側面において、本発明の実施例は、処理待ち情報から少なくとも1つの主体名見出し語を取得することと、前記少なくとも1つの主体名見出し語のうちの主体名見出し語に対し、当該主体名見出し語を予め取得された少なくとも1つの初期情報源主体名見出し語とマッチングし、マッチング結果に基づいて当該主体名見出し語に重み値を設定することと、前記重み値に従い、前記少なくとも1つの主体名見出し語のうちの前記主体名見出し語と、前記少なくとも1つの初期情報源主体名見出し語のうちの初期情報源主体名見出し語とを並べ替えて、更新後の前記少なくとも1つの初期情報源主体名見出し語を得ることと、を含み、前記初期情報源主体名見出し語と前記処理待ち情報は、同一の情報源に対応し、前記重み値は、前記主体名見出し語に対応する主体が前記情報源の情報源主体である確率を表す、情報を更新するための方法に関する。
いくつかの実施例において、前記処理待ち情報から前記少なくとも1つの主体名見出し語を取得することは、前記処理待ち情報のうちの語句の文法関係を判定することと、前記文法関係に基づいて前記処理待ち情報に含まれる語句を修正して、更新処理待ち情報を得ることと、前記更新処理待ち情報を情報抽出して、前記少なくとも1つの主体名見出し語を得ることと、を含む。
いくつかの実施例において、前記文法関係に基づいて前記処理待ち情報に含まれる語句を修正して、前記更新処理待ち情報を得ることは、前記処理待ち情報のうちの、前記主体名見出し語を欠いている少なくとも1つの処理待ち語句を検索することと、前記少なくとも1つの処理待ち語句のうちの処理待ち語句に対し、当該処理待ち語句に対応する前記文法関係に基づいて、当該処理待ち語句に前記主体名見出し語を追加して、修正後の前記更新処理待ち情報を得ることと、を含む。
いくつかの実施例において、前記処理待ち語句に対応する前記文法関係に基づいて、前記処理待ち語句に主体名見出し語を追加することは、前記文法関係に基づいて、前記処理待ち語句に対応する主体名見出し語を追加すること、を含む。
いくつかの実施例において、前記処理待ち語句には、主体名代名詞が含まれ、前記処理待ち語句に対応する前記文法関係に基づいて、前記処理待ち語句に前記主体名見出し語を追加することは、前記文法関係に基づいて、前記処理待ち語句のうちの前記主体名代名詞を対応する前記主体名見出し語に置換すること、を含む。
いくつかの実施例において、前記初期情報源主体名見出し語は、取得された処理待ち要約情報から、少なくとも1つの初期主体名見出し語を取得するステップと、前記少なくとも1つの初期主体名見出し語のうちの初期主体名見出し語に対し、当該初期主体名見出し語が前記処理待ち要約情報内で出現した回数を確定し、当該回数に基づいて当該初期主体名見出し語に初期重み値を設定するステップと、前記初期重み値に基づいて、前記少なくとも1つの初期主体名見出し語から少なくとも1つの前記初期情報源主体名見出し語を確定するステップと、によって取得される。
第2側面において、本発明の実施例は、処理待ち情報から少なくとも1つの主体名見出し語を取得するように構成された主体名見出し語抽出ユニットと、前記少なくとも1つの主体名見出し語のうちの主体名見出し語に対し、当該主体名見出し語を、予め取得された少なくとも1つの初期情報源主体名見出し語とマッチングし、マッチング結果に基づいて当該主体名見出し語に重み値を設定するように構成された重み値設定ユニットと、前記重み値に従い、前記少なくとも1つの主体名見出し語のうちの前記主体名見出し語と、前記少なくとも1つの初期情報源主体名見出し語のうちの前記初期情報源主体名見出し語とを並べ替えて、更新後の前記少なくとも1つの初期情報源主体名見出し語を得るように構成された情報更新ユニットと、を含み、前記初期情報源主体名見出し語と前記処理待ち情報は、同一の情報源に対応し、前記重み値は、主体名見出し語に対応する主体が前記情報源の情報源主体である確率を表す、情報を更新するための装置に関する。
いくつかの実施例において、更新処理待ち情報取得サブユニットは、前記処理待ち情報のうちの、前記主体名見出し語を欠いている少なくとも1つの処理待ち語句を検索するように構成された処理待ち語句検索モジュールと、前記少なくとも1つの処理待ち語句のうちの処理待ち語句に対し、当該処理待ち語句に対応する前記文法関係に基づいて、当該処理待ち語句に前記主体名見出し語を追加して、修正後の前記更新処理待ち情報を得るように構成された更新処理待ち情報取得モジュールと、を含む。
いくつかの実施例において、前記主体名見出し語抽出ユニットは、前記処理待ち情報のうちの語句の文法関係を判定するように構成された文法関係判定サブユニットと、前記文法関係に基づいて前記処理待ち情報に含まれる語句を修正して、更新処理待ち情報を得るように構成された更新処理待ち情報取得サブユニットと、前記更新処理待ち情報を情報抽出して、前記少なくとも1つの主体名見出し語を得るように構成された主体名見出し語抽出サブユニットと、を含む。
いくつかの実施例において、前記更新処理待ち情報取得モジュールは、前記文法関係に基づいて、前記処理待ち語句に対応する前記主体名見出し語を追加するように構成された情報追加サブモジュール、を含む。
いくつかの実施例において、前記処理待ち語句には、主体名代名詞が含まれ、前記更新処理待ち情報取得モジュールは、前記文法関係に基づいて、前記処理待ち語句のうちの前記主体名代名詞を対応する前記主体名見出し語に置換するように構成された情報置換サブモジュール、を含む。
いくつかの実施例において、前記初期情報源主体名見出し語を取得するように構成された初期情報源主体名見出し語取得ユニットを含み、前記初期情報源主体名見出し語取得ユニットは、取得された処理待ち要約情報から、少なくとも1つの初期主体名見出し語を取得するように構成された初期主体名見出し語取得サブユニットと、前記少なくとも1つの初期主体名見出し語のうちの初期主体名見出し語に対し、当該初期主体名見出し語が前記処理待ち要約情報内で出現した回数を確定し、当該回数に基づいて当該初期主体名見出し語に初期重み値を設定するように構成された初期重み値設定サブユニットと、前記初期重み値に基づいて、前記少なくとも1つの初期主体名見出し語から少なくとも1つの前記初期情報源主体名見出し語を確定するように構成された初期情報源主体名見出し語確定サブユニットと、を含む。
第3側面において、本発明の実施例は、1つ以上のプロセッサと、1つ以上のプログラムが記憶された記憶装置と、を含み、前記1つ以上のプログラムが前記1つ以上のプロセッサによって実行されるとき、上記第1側面に記載の情報を更新するための方法を前記1つ以上のプロセッサに実行させる、サーバーに関する。
第4側面において、本発明の実施例は、コンピュータプログラムが記憶されたコンピュータ可読媒体であって、前記コンピュータプログラムがプロセッサによって実行されると、上記第1側面に記載の情報を更新するための方法が実現されることを特徴とするコンピュータ可読媒体に関する。
本発明の実施例に係る情報を更新するための方法と装置は、まず処理待ち情報から少なくとも1つの主体名見出し語を取得し、次に主体名見出し語を予め取得された少なくとも1つの初期情報源主体名見出し語とマッチングし、マッチング結果に基づいて主体名見出し語に重み値を設定し、最後に重み値に従い、人物を並べ替えて、更新後の少なくとも1つの初期情報源主体名見出し語を得て、ユーザが情報を取得することの正確性と効率を向上させる。
本発明のその他の特徴、目的および利点をより明確にするために、以下の図面を参照して非限定的な実施例を詳細に説明する。
本発明の一実施例が適用され得る例示的なシステムアーキテクチャ図である。 本発明に係る情報を更新するための方法の一実施例のフローチャートである。 本発明に係る情報を更新するための方法の適用状況の概略図である。 本発明に係る初期情報源主体名見出し語を取得する一実施例のフローチャートである。 本発明に係る情報を更新するための装置の一実施例の概略構造図である。 本発明の実施例を実現するためのサーバーのコンピュータシステムの概略構造図である。
以下、図面および実施例を参照して本発明についてより詳細に説明する。ここで説明された具体的な実施例は、関連する発明を説明するためだけのものであり、この発明を制限するものではないことを理解できる。なお、説明を容易にするために、図面には関連する発明の関連する部分のみを示している。
なお、矛盾しない場合には、本発明の実施例および実施例における特徴を互いに組み合わせることができる。以下、図面を参照して、実施例に合わせて本発明を詳細に説明する。
図1には、本発明の実施例が適用され得る、情報を更新するための方法または情報を更新するための装置の例示的なシステムアーキテクチャ100が示されている。
図1に示すように、システムアーキテクチャ100は、データ処理サーバー101、ネットワーク102および情報サーバー103、104、105、106を含むことができる。ネットワーク102は、データ処理サーバー101と情報サーバー103、104、105、106との間に通信リンクの媒体を提供するために使用される。ネットワーク102は、例えば有線、無線通信リンク、または光ファイバケーブルなどの様々な接続タイプを含むことができる。
データ処理サーバー101は、ネットワーク102を介して情報サーバー103、104、105、106とインタラクティブすることにより、メッセージなどを送受信する。データ処理サーバー101には、例えばウェブブラウザアプリケーション、ショッピングアプリケーション、情報表示アプリケーション、意味認識アプリケーション、情報抽出アプリケーションなどの様々なデータ処理アプリケーションがインストールされることができる。
データ処理サーバー101は、ハードウェアでもソフトウェアでもよい。データ処理サーバー101がハードウェアである場合、ディスプレイを有し、データ処理が可能な様々な電子機器であってもよく、タブレット、ラップトップパソコン、デスクトップコンピュータなどを含むがこれらに限定されない。データ処理サーバー101がソフトウェアである場合、上記に挙げられた電子機器にインストールされることができる。それは、(例えば分散型サービスを提供する)複数のソフトウェアまたはソフトウェアモジュールとして実現されてもよく、単一のソフトウェアまたはソフトウェアモジュールとして実現されてもよい。ここで、具体的に限定しない。
情報サーバー103、104、105、106は、様々なサービスを提供するサーバーであってもよく、例えば、他の端末装置から送信された情報源(例えば、オンライン小説、ブログなど)を受信し、受信した情報源を処理するサーバーであってもよい。サーバーは、データ処理サーバー101に情報源を提供し、データ処理サーバー101から返信された対応情報源のフィードバック情報(例えば、情報源主体名情報など)を受信することができる。
なお、本発明の実施例に係る情報を更新するための方法は、一般的に、データ処理サーバー101によって実行される。それに対応して、情報を更新するための装置は、一般的に、データ処理サーバー101に配置される。
なお、サーバーは、ハードウェアでもソフトウェアでもよい。サーバーがハードウェアである場合、複数のサーバーからなる分散型サーバークラスターとして実現されてもよく、単一のサーバーとして実現されてもよい。サーバーがソフトウェアである場合、(例えば分散型サービスを提供する)複数のソフトウェアまたはソフトウェアモジュールとして実現されてもよく、単一のソフトウェアまたはソフトウェアモジュールとして実現されてもよい。ここで、具体的に限定しない。
図1のデータ処理サーバー、ネットワーク、および情報サーバーの数は単なる例示であることを理解すべきである。必要に応じて、任意の数のデータ処理サーバー、ネットワーク、および情報サーバーを備えることができる。
続けて図2を参照すると、本発明による情報を更新するための方法の一実施例のプロセス200が示されている。当該情報を更新するための方法は、以下のステップを含む。
ステップ201において、処理待ち情報から少なくとも1つの主体名見出し語を取得する。
本実施例において、情報を更新するための方法の実行主体(例えば、図1に示すデータ処理サーバー101)は、有線接続または無線接続により、情報サーバー103、104、105、106から処理待ち情報を取得する。ここで、処理待ち情報は、上記の情報源(例えば、オンライン小説、ブログなど)の一部の情報(例えば、最近更新されたオンライン小説のいくつかの章など)を含むことができる。上記無線接続方式は、3G / 4G接続、WiFi接続、Bluetooth(登録商標)接続、WiMAX接続、Zigbee接続、UWB(ultra wideband)接続、および現在知られているまたは将来開発されるであろう他の無線接続を含むが、これらに限定されない。
通常、オンライン小説やブログなどの情報源は比較的固定された情報源主体を持ち、情報源主体は情報源の情報内容に重要な役割を果たすことができる。例えば、情報源主体は、人物、動物、キャラクター、ロボットなどであってもよく、情報源主体は、異なる情報源によって異なっている。通常、情報源主体は、情報源の任意の情報内容で出現することができる。また、上記の情報源は、通常、ネットワーク上に一括して完全に公開されていないため、ユーザが情報源の情報源主体を確定しにくく、ユーザが情報を取得することの効率を低下させる。
本発明の情報源には、通常、複数の比較的固定された情報源主体が含まれる。情報源の内容(例えば、上述の処理待ち情報)は、通常、時間の変化につれて更新される。ここで、本発明における情報源主体は、上記情報源に含まれる各種情報の内容を示すための人物、動物、キャラクター等であってもよい。本発明の実行主体は、処理待ち情報を取得した後、まず処理待ち情報から少なくとも1つの主体名見出し語を取得することができる。主体名見出し語は、「張XX」、「李XX」、「カンフーX猫」、「熊」などであってもよく、ここでは説明しない。
本実施例のいくつかの選択可能な実施形態において、処理待ち情報から少なくとも1つの主体名見出し語を取得することは、以下のステップを含む。
第一ステップにおいて、上記処理待ち情報のうちの語句の文法関係を判定する。
情報源の情報源主体を決定するために、まず情報源に関する処理待ち情報に対しデータ処理を行う必要がある。実行主体は、処理待ち情報に対し意味解析などの処理を行うことにより、処理待ち情報に含まれる語句の文法関係を確定することができる。文法関係は語句の構文を確定するだけでなく、構文に基づいて可能性のある主体名見出し語を確認することができる。情報源の情報源主体名見出し語を正確に取得するために、実行主体はまず処理待ち情報のうちの各語句の文法関係を判定することができる。
第二ステップにおいて、文法関係に基づいて上記処理待ち情報に含まれる語句を修正して、更新処理待ち情報を得る。
通常、情報の記述の過程をスムーズにするために、語句はいくつかの文の構成要素(例えば、主語、述語、目的語、動詞、属性、副詞、補語、修飾語など)を省略または置換することがよくある。情報源のユーザ(または読者)にとって、文脈情報を通じて語句の省略された構成要素を明確かつ正確に知ることができる。しかし、本発明の実行主体によって情報源の情報源主体名見出し語を確定すると、欠いている文の構成要素は、この後の情報源主体名見出し語を確定することの正確性に影響する。このために、本出願の実行主体は、取得した構文関係によって、対応する語句を修正することができ、各文が含むべき各文の成分を含むことができる。本発明の実行主体は、取得された文法関係によって、対応する語句を修正して、各文が含むべき各文の構成要素を含むようにすることができる。ちなみに、文の構成要素を補充した語句からなる情報を更新処理待ち情報とする。すなわち、更新処理待ち情報は、処理待ち情報に含まれる語句に対して文の構成要素を補充して得られたものである。
第三ステップにおいて、上記更新処理待ち情報を情報抽出して、少なくとも1つの主体名見出し語を得る。
上記の解析から分かるように、更新処理待ち情報に含まれる語句は全て文の構成要素が完全な語句である。このとき、実行主体は、更新処理待ち情報を情報抽出して、少なくとも1つの主体名見出し語を得ることができる。
本実施例のいくつかの選択可能な実施形態において、上記文法関係に基づいて上記処理待ち情報に含まれる語句を修正して、更新処理待ち情報を得ることは、以下のステップを含む。
第一ステップにおいて、上記処理待ち情報のうちの少なくとも1つの処理待ち語句を検索する。
通常、処理待ち情報は、複数の語句を含むことができる。ここで、一部の語句の各文の構成要素が全部揃って、一部の語句は対応する構成要素を欠いているかもしれない。実行主体は、処理待ち情報に含まれる語句を意味認識して、語句の意味を確定することができる。次に、意味によって当該語句の文の構成要素を合致させる。当該語句に関し主体名見出し語に対応する文の構成要素が省略されていることが判明した場合、またはある主体名見出し語に対応する文の構成要素が代名詞によって表されている場合、当該語句を処理待ち語句と見なすことができる。例えば、処理待ち情報に含まれたある語句は、「彼はどのように処理すればいいのか分かりません」であってもよい。文脈分析によって、実行主体は、当該語句の意味は「XX(人名)はどのように処理すればいいのか分かりません」であってもよいと確定した。このとき、実行主体が意味を当該語句とマッチングすると、当該語句中の本当の構成要素「XX」が「彼」に置き換えられていることが分かって、実行主体は当該語句を処理待ち語句とすることができる。別の例として、処理待ち情報に含まれたある語句は、「戻っていけば道がない」であってもよい。この場合、文脈分析によって、実行主体は、当該語句の意味は「XX(人名)は戻っていけば道がない」であると確定する。このとき、実行主体が意味を当該語句とマッチングすると、当該語句中の本当の構成要素「XX」が省略されていることが分かって、実行主体は当該語句を処理待ち語句とすることができる。すなわち、本発明の処理待ち語句は、主体名見出し語を欠いている語句であってもよい。本発明の技術案は、情報源の情報源主体名見出し語を確定するために使用されるので、主体名見出し語を欠いている語句を処理待ち語句としてもよい。他の技術的問題を解決する際に、実行主体は、実際の必要に応じて、他のタイプの見出し語(例えば、住所見出し語、植物見出し語など)を欠いている語句を処理待ち語句としてもよいが、ここでは説明しない。
第二ステップにおいて、前記少なくとも1つの処理待ち語句のうちの処理待ち語句に対し、当該処理待ち語句に対応する文法関係に基づいて、当該処理待ち語句に主体名見出し語を追加して、修正後の更新処理待ち情報を得る。
処理待ち語句を得た後、実行主体は、各処理待ち語句に対応する文法関係と文脈分析に基づいて、当該処理待ち語句に欠いている主体名見出し語を確定することができる。この後、実行主体は、当該処理待ち語句が完全な文の構成要素を含む語句になるように、欠けている主体名見出し語を当該処理待ち語句の対応する位置に追加することができる。実行主体は、全ての処理待ち語句に主体名見出し語を追加したときに得られた情報を、更新処理待ち情報としてもよい。
本実施例のいくつかの選択可能な実施形態において、上記処理待ち語句に対応する文法関係に基づいて、当該処理待ち語句に主体名見出し語を追加することは、当該文法関係に基づいて、当該処理待ち語句に対応する主体名見出し語を追加することを含む。
上記の説明から分かるように、処理待ち語句には主体名見出し語が欠けている可能性がある。このとき、実行主体は、当該処理待ち語句の文脈を解析して、当該処理待ち語句に欠けている主体名見出し語を確定することができる。そして、当該欠けている主体名見出し語を当該処理待ち語句の対応する位置に追加する。例えば、処理待ち語句は、「戻っていけば道がない」であってもよい。この場合、文脈分析によって、実行主体は、当該語句の意味は「XX(人名)は戻っていけば道がない」であると確定する。実行主体は、「XX」を処理待ち語句の主語位置に追加し、主体名見出し語を追加した後の処理待ち語句は、「XXは戻っていけば道がない」である。
本実施例のいくつかの選択可能な実施形態において、上記処理待ち語句は、主体名の代名詞(例えば、「彼」、「彼ら」、「彼女」、「彼女たち」、「それ」、「それら」など)を含んでいてもよい。この場合、上記処理待ち語句に対応する文法関係に基づいて、当該処理待ち語句に主体名見出し語を追加することは、当該文法関係に基づいて、当該処理待ち語句のうちの主体名の代名詞を対応する主体名見出し語に置換することを含むことができる。
処理待ち語句は、主体名見出し語の代わりに主体名の代名詞を使う場合もある。このとき、実行主体は、当該処理待ち語句の文脈を解析して、当該処理待ち語句に含まれた主体名の代名詞に対応する実際の主体名見出し語を確定することができる。この後、実行主体は、当該処理待ち語句の中の主体名の代名詞を当該主体名見出し語で置き換えることができる。
ステップ202において、上記少なくとも1つの主体名見出し語のうちの主体名見出し語に対し、当該主体名見出し語を、予め取得された少なくとも1つの初期情報源主体名見出し語とマッチングし、マッチング結果に基づいて当該主体名見出し語に重み値を設定する。
通常、実行主体は、処理待ち情報に対しデータ処理を行う際に、処理待ち情報に対応する情報源の初期情報源主体名見出し語を予め取得する。ここで、上記初期情報源主体名見出し語と処理待ち情報は、同一の情報源に対応する。例えば、情報源は、オンライン小説であり、実行主体は、当該オンライン小説の要約などのファイル情報を予め解析して、当該オンライン小説の初期情報源主体名見出し語を得る。処理待ち情報は、当該オンライン小説の後続の継続的に公開される更新内容であってもよい。すなわち、処理待ち情報と初期情報源主体名見出し語はいずれも当該オンライン小説に対応する。
実行主体は、上記取得された主体名見出し語を初期情報源主体名見出し語とマッチングすることができる。主体名見出し語がある初期情報源主体名見出し語と同じである場合、実行主体は、初期情報源主体名見出し語の元の重み値をもとに、当該主体名見出し語(すなわち、当該初期情報源主体名見出し語)により大きな重み値を設定することができる。主体名見出し語が各初期情報源主体名見出し語と異なる場合、実行主体は当該主体名見出し語に小さい重み値を設定することができる。ここで、上記重み値は、主体名見出し語に対応する人物が上記情報源の情報源主体である確率を表すことができる。
ステップ203において、重み値に従い、上記少なくとも1つの主体名見出し語のうちの主体名見出し語と、上記少なくとも1つの初期情報源主体名見出し語のうちの初期情報源主体名見出し語とを並べ替えて、更新後の少なくとも1つの初期情報源主体名見出し語を得る。
主体名見出し語の重み値と初期情報源主体名見出し語の重み値を得た後、実行主体は、主体名見出し語と初期情報源主体名見出し語を、重み値の大きい方から小さい方へ順に並べ替えることができる。この後、実行主体は、前の順位にある主体名見出し語および/または初期情報源主体名見出し語を更新後の初期情報源主体名見出し語として確定することができる。また、新たな処理待ち情報が発生すると、実行主体は、更新後の初期情報源主体名見出し語を初期情報源主体名見出し語として、上記のステップを実行することにより、情報源の情報源主体に対する再判断を実現することができる。このようにして、情報源主体の継続的な更新を実現し、ユーザが情報源の情報を取得することの正確性と有効性をより向上させる。
続いて図3を参照する。図3は本実施例に係る情報を更新するための方法の適用状況の概略図である。図3の適用状況には、データ処理サーバー101、ネットワーク102、情報サーバー103および端末装置107、108が含まれている。データ処理サーバー101は、まずネットワーク102を介して、情報サーバー103からオンライン小説(情報源)の処理待ち要約情報を取得して、初期情報源主体名見出し語を取得することができる。情報サーバー103におけるオンライン小説には更新された内容(すなわち処理待ち情報)がある場合、データ処理サーバー101は、更新された内容から少なくとも1つの主体名見出し語を取得することができる。次に、データ処理サーバー101は、取得された主体名見出し語を初期情報源主体名見出し語とマッチングし、主体名見出し語に重み値を設定する。最後、データ処理サーバー101は、重み値により、主体名見出し語と初期情報源主体名見出し語とを並べ替えて、更新後の初期情報源主体名見出し語を確定する。
本発明の上記実施例に係る方法は、まず処理待ち情報から少なくとも1つの主体名見出し語を取得し、次に主体名見出し語を予め取得された少なくとも1つの初期情報源主体名見出し語とマッチングし、マッチング結果に基づいて主体名見出し語に重み値を設定し、最後に重み値に従い、人物を並べ替えて、更新後の少なくとも1つの初期情報源主体名見出し語を得て、ユーザが情報を取得することの正確性と効率を向上させる。
さらに図4には、初期情報源主体名見出し語を取得する一実施例のプロセス400が示されている。当該初期情報源主体名見出し語を取得する一実施例のプロセス400は、以下のステップを含む。
ステップ401において、取得された処理待ち要約情報から、少なくとも1つの初期主体名見出し語を取得する。
本実施例において、初期情報源主体名見出し語を取得する方法を実行するための実行主体(例えば、図1に示されるデータ処理サーバー101)は、有線接続または無線接続により、情報サーバー103、104、105、106から処理待ち情報を取得することができる。
実行主体は、処理待ち情報のうちの主体名見出し語を処理する前に、まず初期情報源主体名見出し語を取得し、初期情報源主体名見出し語をもとに、処理待ち情報のうちの主体名見出し語を処理する。通常、情報源は、要約情報を有してもよく、要約情報は、通常、情報の概要としてもよい。ある情報源にとって、実行主体が最初に取得したのは要約情報である。要約情報は、情報源の情報源主体を手がかりとして、情報源の内容を概略的に説明することができる。このために、実行主体は、処理待ち要約情報に対し情報処理を行い、処理待ち要約情報から少なくとも1つの初期情報源主体名見出し語を取得することができる。取得方法は、上記図2に対応する実施例の方法と同様であり、ここでは繰り返して説明しない。
ステップ402において、上記少なくとも1つの初期主体名見出し語のうちの初期主体名見出し語に対し、当該初期主体名見出し語が上記処理待ち要約情報内で出現した回数を確定し、当該回数に基づいて当該初期主体名見出し語に初期重み値を設定する。
実行主体は、各初期主体名見出し語が処理待ち要約情報内で出現した回数を確定し、これによって各初期主体名見出し語に初期重み値を設定することができる。
ステップ403において、初期重み値に基づいて、上記少なくとも1つの初期主体名見出し語から少なくとも1つの初期情報源主体名見出し語を確定する。
情報源の情報源主体は、他の主体よりも出現する回数が多く、初期値もより大きい。したがって、実行主体は、初期重み値を条件として、処理待ち要約情報の少なくとも1つの初期主体名見出し語を選別して、初期重み値が設定要求に達する初期主体名見出し語に対応する主体を初期情報源主体とすることができる。この後、初期情報源主体に基づいて、初期情報源主体名見出し語を確定する。
図5をさらに参照し、上記の各図面に示された方法の実施として、本発明は情報を更新するための装置の一実施例を提供し、この装置は図2に示された方法の実施例に対応し、この装置が具体的に様々な電子機器に適用されることができる。
図5に示すように、本実施例の情報を更新するための装置500は、主体名見出し語抽出ユニット501と、重み値設定ユニット502と、情報更新ユニット503とを含む。ここで、主体名見出し語抽出ユニット501は、処理待ち情報から少なくとも1つの主体名見出し語を取得するように構成される。重み値設定ユニット502は、上記少なくとも1つの主体名見出し語のうちの主体名見出し語に対し、当該主体名見出し語を、予め取得された少なくとも1つの初期情報源主体名見出し語とマッチングし、マッチング結果に基づいて当該主体名見出し語に重み値を設定するように構成され、ここで、上記初期情報源主体名見出し語と処理待ち情報は、同一の情報源に対応し、上記重み値は、主体名見出し語に対応する人物が上記情報源の情報源主体である確率を表し、情報更新ユニット503は、重み値に従い、上記少なくとも1つの主体名見出し語のうちの主体名見出し語と、上記少なくとも1つの初期情報源主体名見出し語のうちの初期情報源主体名見出し語とを並べ替えて、更新後の少なくとも1つの初期情報源主体名見出し語を得る。
本実施例のいくつかの選択可能な実施形態において、上記主体名見出し語抽出ユニット501は、文法関係判定サブユニット(図示せず)と、更新処理待ち情報取得サブユニット(図示せず)と、主体名見出し語抽出サブユニット(図示せず)とを含んでもよい。ここで、文法関係判定サブユニットは、上記処理待ち情報のうちの語句の文法関係を判定するように構成され、更新処理待ち情報取得サブユニットは、文法関係に基づいて上記処理待ち情報に含まれる語句を修正して、更新処理待ち情報を得るように構成され、主体名見出し語抽出サブユニットは、上記更新処理待ち情報を情報抽出して、少なくとも1つの主体名見出し語を得るように構成される。
本実施例のいくつかの選択可能な実施形態において、上記更新処理待ち情報取得サブユニットは、処理待ち語句検索モジュール(図示せず)と、更新処理待ち情報取得モジュール(図示せず)とを含んでもよい。ここで、処理待ち語句検索モジュールは、上記処理待ち情報のうちの少なくとも1つの処理待ち語句を検索するように構成され、上記処理待ち語句は、主体名見出し語を欠いている語句であり、更新処理待ち情報取得モジュールは、上記少なくとも1つの処理待ち語句のうちの処理待ち語句に対し、当該処理待ち語句に対応する文法関係に基づいて、当該処理待ち語句に主体名見出し語を追加して、修正後の更新処理待ち情報を得るように構成される。
本実施例のいくつかの選択可能な実施形態において、上記更新処理待ち情報取得モジュールは、当該文法関係に基づいて、当該処理待ち語句に対応する主体名見出し語を追加するように構成された情報追加サブモジュール(図示せず)を含んでもよい。
本実施例のいくつかの選択可能な実施形態において、上記処理待ち語句には、主体名代名詞が含まれ、上記更新処理待ち情報取得モジュールは、当該文法関係に基づいて、当該処理待ち語句のうちの主体名代名詞を対応する主体名見出し語に置換するように構成された情報置換サブモジュール(図示せず)を含んでもよい。
本実施例のいくつかの選択可能な実施形態において、上記情報を更新するための装置500は、初期情報源主体名見出し語を取得するように構成された初期情報源主体名見出し語取得ユニット(図示せず)を含んでもよく、上記初期情報源主体名見出し語取得ユニットは、初期主体名見出し語取得サブユニット(図示せず)と、初期重み値設定サブユニット(図示せず)と、初期情報源主体名見出し語確定サブユニット(図示せず)とを含んでもよい。ここで、初期主体名見出し語取得サブユニットは、取得された処理待ち要約情報から、少なくとも1つの初期主体名見出し語を取得するように構成され、初期重み値設定サブユニットは、上記少なくとも1つの初期主体名見出し語のうちの初期主体名見出し語に対し、当該初期主体名見出し語が前記処理待ち要約情報内で出現した回数を確定し、当該回数に基づいて当該初期主体名見出し語に初期重み値を設定するように構成され、初期情報源主体名見出し語確定サブユニットは、初期重み値に基づいて、上記少なくとも1つの初期主体名見出し語から少なくとも1つの初期情報源主体名見出し語を確定するように構成された。
本実施例はさらに、1つ以上のプロセッサと、1つ以上のプログラムが記憶された記憶装置とを含み、上記1つ以上のプログラムが上記1つ以上のプロセッサによって実行されるとき、上記の情報を更新するための方法を上記1つ以上のプロセッサに実行させるサーバーを提供する。
本実施例はさらに、コンピュータプログラムが記憶されたコンピュータ可読媒体であって、このコンピュータプログラムがプロセッサによって実行されるとき、上記の情報を更新するための方法が実現されるコンピュータ可読媒体を提供する。
以下、図6を参照し、本発明の実施例を実現するためのサーバー(例えば図1に示したデータ処理サーバー101)のコンピュータシステム600の概略構造図が示されている。図6に示したサーバーは一例であり、本発明の実施例の機能と使用範囲を限定するものではない。
図6に示すように、コンピュータシステム600は、読み出し専用メモリ(ROM)602に記憶されているプログラムまたは記憶部608からランダムアクセスメモリ(RAM)603にロードされたプログラムに従って各種の適切な動作と処理を行うことができる中央処理装置(CPU)601を含む。RAM603には、システム600の操作に必要な様々なプログラムとデータが記憶されている。CPU601、ROM602、およびRAM603は、バス604によって相互に接続されている。入力/出力(I/O)インターフェース605もバス604に接続されている。
I/Oインターフェース605には、キーボード、マウスなどを含む入力部606と、陰極線管(CRT)、液晶ディスプレイ(LCD)、スピーカーなどを含む出力部607と、ハードディスクなどを含む記憶部608と、LANカード、モデムなどのネットワークインターフェースカードを含む通信部609とが接続されている。通信部609は、インターネットのようなネットワークを介して通信処理を行う。ドライバ610も必要に応じてI/Oインターフェース605に接続されている。ディスク、光ディスク、磁気ディスク、半導体メモリなどの着脱可能な媒体611は、必要に応じてドライバ610に取り付けられることにより、そこから読み出されるコンピュータプログラムが必要に応じて記憶部608にインストールされる。
特に、本発明の実施例によると、上記のフローチャートを参照して説明されたプロセスは、コンピュータソフトウェアのプログラムとして実現されることができる。例えば、本発明の実施例は、コンピュータ可読媒体に担持されたコンピュータプログラムを含むコンピュータプログラム製品を含み、当該コンピュータプログラムは、フローチャートに示された方法を実行するためのプログラムコードを含む。このような実施例では、このコンピュータプログラムは、通信部609を介してネットワークからダウンロードされてインストールされ、および/または着脱可能な媒体611からインストールされることができる。このコンピュータプログラムが中央処理装置(CPU)601によって実行されるときに、本発明のシステムで限定された上記の機能を実行する。
なお、本発明に示したコンピュータ可読媒体は、コンピュータ可読信号媒体、あるいはコンピュータ可読記憶媒体、または上記の両方の任意の組合せであってもよい。コンピュータ可読記憶媒体は、例えば、電気、磁気、光、電磁気、赤外線、あるいは半導体のシステム、装置またはデバイス、あるいは上記の任意の組合せであってもよいが、これらに限らない。コンピュータ可読記憶媒体のより具体的な例には、1本以上のワイヤによる電気的接続、携帯型コンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、消去可能プログラマブル読み取り専用メモリ(EPROMまたはフラッシュメモリ)、光ファイバ、コンパクトディスク読み取り専用メモリ(CD−ROM)、光記憶装置、磁気記憶装置、または上記の任意の組み合わせが含まれるが、これらに限らない。本発明では、コンピュータ可読記憶媒体は、プログラムを含むかまたは記憶する任意の有形の媒体であることができ、このプログラムは、指令実行システム、装置またはデバイスによって使用され、またはそれらと組み合わせて使用されることができる。本発明では、コンピュータ可読信号媒体は、コンピュータが読み取り可能なプログラムコードを担持した、ベースバンド内でまたは搬送波の一部として伝播されるデータ信号を含んでもよい。このような伝播されたデータ信号は、多種の形式を採用でき、電磁気信号、光信号、または上記の任意の適切な組み合わせを含むが、これらに限らない。コンピュータが読み取り可能な信号媒体は、コンピュータ可読記憶媒体以外のいかなるコンピュータ可読媒体であってもよく、このコンピュータ可読媒体は、指令実行システム、装置またはデバイスによって使用され、またはそれらと組み合わせて使用されるためのプログラムを送信、伝播または伝送することができる。コンピュータ可読媒体に含まれるプログラムコードは、任意の適切な媒体で伝送されることができ、当該媒体は、無線、ワイヤ、光ファイバケーブル、RFなど、または上記の任意の適切な組み合わせを含むが、これらに限らない。
図の中のフローチャートおよびブロック図には、本発明の様々な実施例によるシステム、方法とコンピュータプログラム製品の実現可能なアーキテクチャ、機能、および操作が示されている。この点で、フローチャートまたはブロック図の各ブロックは、1つのモジュール、プログラミングのセグメント、またはコードの一部を代表でき、このモジュール、プログラミングのセグメント、またはコードの一部は、所定のロジック機能を実現するための1つ以上の実行可能指令を含む。また、いくつかの代替の実施例では、ブロックに示されている機能は、図面に示された順序と異なる順序で発生してもよいことに留意されたい。例えば、連続して示す2つのブロックは実際に並行して実行されてもよく、それらは係る機能に応じて時に逆の順序で実行されてもよい。ブロック図および/またはフローチャートの各ブロック、およびブロック図および/またはフローチャートのブロックの組み合わせは、特定の機能または操作を実行する専用のハードウェアによるシステムによって実現されてもよく、または専用ハードウェアとコンピュータ指令の組み合わせによって実現されてもよいことにも留意されたい。
本発明の実施例に係るユニットは、ソフトウェアによって実現されてもよく、ハードウェアによって実現されてもよい。説明されたユニットは、プロセッサに設置されてもよく、例えば、「主体名見出し語抽出ユニットと、重み値設定ユニットと情報更新ユニットとを含むプロセッサである」と記載してもよい。ここで、これらのユニットの名は、ある場合にはそのユニット自体を限定しておらず、例えば、情報更新ユニットを「情報源の情報源主体名見出し語を更新するためのユニット」と記載してもよい。
別の側面において、本発明は、コンピュータ可読媒体をさらに提供し、このコンピュータ可読媒体は、上記の実施例で説明された装置に含まれてもよく、個別に存在しこの装置に組み込まれなくてもよい。上記のコンピュータ可読媒体は、1つ以上のプログラムを担持し、上記の1つ以上のプログラムが1つの装置によって実行されたとき、当該装置は、処理待ち情報から少なくとも1つの主体名見出し語を取得し、上記少なくとも1つの主体名見出し語のうちの主体名見出し語に対し、当該主体名見出し語を予め取得された少なくとも1つの初期情報源主体名見出し語とマッチングし、マッチング結果に基づいて当該主体名見出し語に重み値を設定し、ここで、上記初期情報源主体名見出し語と処理待ち情報は、同一の情報源に対応し、上記重み値は、主体名見出し語に対応する主体が上記情報源の情報源主体である確率を表し、重み値に従い、上記少なくとも1つの主体名見出し語のうちの主体名見出し語と、上記少なくとも1つの初期情報源主体名見出し語のうちの初期情報源主体名見出し語とを並べ替えて、更新後の少なくとも1つの初期情報源主体名見出し語を得る。
上記の説明は、本発明の好ましい実施例および応用された技術の原理の説明にすぎない。本発明に係る発明の範囲が、上記の技術的特徴を組み合わせて得られた技術案に限定されず、同時に上記の発明の概念から逸脱しない場合に、上記の技術的特徴またはこれと同等の技術的特徴を任意に組み合わせて得られた他の技術案を含むべきであることを当業者は理解すべきである。例えば、上記特徴が本発明において開示されているもの(しかしこれに限らず)と類似した機能を有する技術的特徴と相互に入れ替わって形成された技術案が挙げられる。

Claims (14)

  1. 処理待ち情報から少なくとも1つの主体名見出し語を取得することと、
    前記少なくとも1つの主体名見出し語のうちの主体名見出し語に対し、当該主体名見出し語を予め取得された少なくとも1つの初期情報源主体名見出し語とマッチングし、マッチング結果に基づいて当該主体名見出し語に重み値を設定することと、
    前記重み値に従い、前記少なくとも1つの主体名見出し語のうちの前記主体名見出し語と、前記少なくとも1つの初期情報源主体名見出し語のうちの初期情報源主体名見出し語とを並べ替えて、更新後の前記少なくとも1つの初期情報源主体名見出し語を得ることと、
    を含み、
    前記初期情報源主体名見出し語と前記処理待ち情報は、同一の情報源に対応し、前記重み値は、前記主体名見出し語に対応する主体が前記情報源の情報源主体である確率を表す、
    情報を更新するための方法。
  2. 前記処理待ち情報から前記少なくとも1つの主体名見出し語を取得することは、
    前記処理待ち情報のうちの語句の文法関係を判定することと、
    前記文法関係に基づいて前記処理待ち情報に含まれる語句を修正して、更新処理待ち情報を得ることと、
    前記更新処理待ち情報を情報抽出して、前記少なくとも1つの主体名見出し語を得ることと、
    を含む請求項1に記載の方法。
  3. 前記文法関係に基づいて前記処理待ち情報に含まれる語句を修正して、前記更新処理待ち情報を得ることは、
    前記処理待ち情報のうちの、前記主体名見出し語を欠いている少なくとも1つの処理待ち語句を検索することと、
    前記少なくとも1つの処理待ち語句のうちの処理待ち語句に対し、当該処理待ち語句に対応する前記文法関係に基づいて、当該処理待ち語句に前記主体名見出し語を追加して、修正後の前記更新処理待ち情報を得ることと、
    を含む請求項2に記載の方法。
  4. 前記処理待ち語句に対応する前記文法関係に基づいて、前記処理待ち語句に主体名見出し語を追加することは、
    前記文法関係に基づいて、前記処理待ち語句に対応する主体名見出し語を追加すること、
    を含む請求項3に記載の方法。
  5. 前記処理待ち語句には、主体名代名詞が含まれ、
    前記処理待ち語句に対応する前記文法関係に基づいて、前記処理待ち語句に前記主体名見出し語を追加することは、
    前記文法関係に基づいて、前記処理待ち語句のうちの前記主体名代名詞を対応する前記主体名見出し語に置換すること、
    を含む請求項3に記載の方法。
  6. 前記初期情報源主体名見出し語は、
    取得された処理待ち要約情報から、少なくとも1つの初期主体名見出し語を取得するステップと、
    前記少なくとも1つの初期主体名見出し語のうちの初期主体名見出し語に対し、当該初期主体名見出し語が前記処理待ち要約情報内で出現した回数を確定し、当該回数に基づいて当該初期主体名見出し語に初期重み値を設定するステップと、
    前記初期重み値に基づいて、前記少なくとも1つの初期主体名見出し語から少なくとも1つの前記初期情報源主体名見出し語を確定するステップと、
    によって取得される、
    請求項1から5のいずれか1項に記載の方法。
  7. 処理待ち情報から少なくとも1つの主体名見出し語を取得するように構成された主体名見出し語抽出ユニットと、
    前記少なくとも1つの主体名見出し語のうちの主体名見出し語に対し、当該主体名見出し語を、予め取得された少なくとも1つの初期情報源主体名見出し語とマッチングし、マッチング結果に基づいて当該主体名見出し語に重み値を設定するように構成された重み値設定ユニットと、
    前記重み値に従い、前記少なくとも1つの主体名見出し語のうちの前記主体名見出し語と、前記少なくとも1つの初期情報源主体名見出し語のうちの前記初期情報源主体名見出し語とを並べ替えて、更新後の前記少なくとも1つの初期情報源主体名見出し語を得るように構成された情報更新ユニットと、
    を含み、
    前記初期情報源主体名見出し語と前記処理待ち情報は、同一の情報源に対応し、前記重み値は、前記主体名見出し語に対応する主体が前記情報源の情報源主体である確率を表す、
    情報を更新するための装置。
  8. 前記主体名見出し語抽出ユニットは、
    前記処理待ち情報のうちの語句の文法関係を判定するように構成された文法関係判定サブユニットと、
    前記文法関係に基づいて前記処理待ち情報に含まれる語句を修正して、更新処理待ち情報を得るように構成された更新処理待ち情報取得サブユニットと、
    前記更新処理待ち情報を情報抽出して、前記少なくとも1つの主体名見出し語を得るように構成された主体名見出し語抽出サブユニットと、
    を含む請求項7に記載の装置。
  9. 前記更新処理待ち情報取得サブユニットは、
    前記処理待ち情報のうちの、前記主体名見出し語を欠いている少なくとも1つの処理待ち語句を検索するように構成された処理待ち語句検索モジュールと、
    前記少なくとも1つの処理待ち語句のうちの処理待ち語句に対し、当該処理待ち語句に対応する前記文法関係に基づいて、当該処理待ち語句に前記主体名見出し語を追加して、修正後の前記更新処理待ち情報を得るように構成された更新処理待ち情報取得モジュールと、
    を含む請求項8に記載の装置。
  10. 前記更新処理待ち情報取得モジュールは、
    前記文法関係に基づいて、前記処理待ち語句に対応する前記主体名見出し語を追加するように構成された情報追加サブモジュール、
    を含む請求項9に記載の装置。
  11. 前記処理待ち語句には、主体名代名詞が含まれ、
    前記更新処理待ち情報取得モジュールは、
    前記文法関係に基づいて、前記処理待ち語句のうちの前記主体名代名詞を対応する前記主体名見出し語に置換するように構成された情報置換サブモジュール、
    を含む請求項9に記載の装置。
  12. 前記初期情報源主体名見出し語を取得するように構成された初期情報源主体名見出し語取得ユニットを含み、
    前記初期情報源主体名見出し語取得ユニットは、
    取得された処理待ち要約情報から、少なくとも1つの初期主体名見出し語を取得するように構成された初期主体名見出し語取得サブユニットと、
    前記少なくとも1つの初期主体名見出し語のうちの初期主体名見出し語に対し、当該初期主体名見出し語が前記処理待ち要約情報内で出現した回数を確定し、当該回数に基づいて当該初期主体名見出し語に初期重み値を設定するように構成された初期重み値設定サブユニットと、
    前記初期重み値に基づいて、前記少なくとも1つの初期主体名見出し語から少なくとも1つの前記初期情報源主体名見出し語を確定するように構成された初期情報源主体名見出し語確定サブユニットと、
    を含む、請求項7から11のいずれか1項に記載の装置。
  13. 1つ以上のプロセッサと、
    1つ以上のプログラムが記憶された記憶装置と、
    を含み、
    前記1つ以上のプログラムが前記1つ以上のプロセッサによって実行されるとき、請求項1から6のいずれか1項に記載の方法を前記1つ以上のプロセッサに実行させる、
    サーバー。
  14. コンピュータプログラムが記憶されたコンピュータ可読媒体であって、
    前記コンピュータプログラムがプロセッサによって実行されると、請求項1から6のいずれか1項に記載の方法が実現されることを特徴とするコンピュータ可読媒体。
JP2019128638A 2018-08-29 2019-07-10 情報を更新するための方法と装置 Active JP6868062B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810998037.6 2018-08-29
CN201810998037.6A CN109254973A (zh) 2018-08-29 2018-08-29 用于更新信息的方法及装置

Publications (2)

Publication Number Publication Date
JP2020035427A true JP2020035427A (ja) 2020-03-05
JP6868062B2 JP6868062B2 (ja) 2021-05-12

Family

ID=65049799

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019128638A Active JP6868062B2 (ja) 2018-08-29 2019-07-10 情報を更新するための方法と装置

Country Status (5)

Country Link
US (1) US11436409B2 (ja)
EP (1) EP3617906A1 (ja)
JP (1) JP6868062B2 (ja)
KR (1) KR102308521B1 (ja)
CN (1) CN109254973A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113792182B (zh) * 2021-09-17 2023-08-08 广州博冠信息科技有限公司 图像进度的提示方法及装置、存储介质及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08305710A (ja) * 1995-04-28 1996-11-22 Toshiba Corp 文書のキーワード抽出方法及び文書検索装置
JP2008112432A (ja) * 2006-10-06 2008-05-15 Nippon Hoso Kyokai <Nhk> 人間関係グラフ生成装置及びコンテンツ検索装置、並びに、人間関係グラフ生成プログラム及びコンテンツ検索プログラム
JP2011248409A (ja) * 2010-05-21 2011-12-08 Nippon Telegr & Teleph Corp <Ntt> 重要語抽出装置とその方法とプログラム
JP2012252541A (ja) * 2011-06-03 2012-12-20 Konica Minolta Business Technologies Inc 文書表示装置、文書表示方法及び文書表示プログラム
US20140142922A1 (en) * 2007-10-17 2014-05-22 Evri, Inc. Nlp-based entity recognition and disambiguation
US20160117311A1 (en) * 2014-10-22 2016-04-28 Thomson Licensing Method and Device for Performing Story Analysis

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7360151B1 (en) * 2003-05-27 2008-04-15 Walt Froloff System and method for creating custom specific text and emotive content message response templates for textual communications
US7813916B2 (en) * 2003-11-18 2010-10-12 University Of Utah Acquisition and application of contextual role knowledge for coreference resolution
US7555475B2 (en) * 2005-03-31 2009-06-30 Jiles, Inc. Natural language based search engine for handling pronouns and methods of use therefor
MY151173A (en) * 2008-09-12 2014-04-30 Mimos Bhd Method and system for retrieving data and displaying content density of a data storage
US8380489B1 (en) * 2009-02-11 2013-02-19 Guangsheng Zhang System, methods, and data structure for quantitative assessment of symbolic associations in natural language
WO2010107327A1 (en) * 2009-03-20 2010-09-23 Syl Research Limited Natural language processing method and system
US8533203B2 (en) * 2009-06-04 2013-09-10 Microsoft Corporation Identifying synonyms of entities using a document collection
US9047283B1 (en) * 2010-01-29 2015-06-02 Guangsheng Zhang Automated topic discovery in documents and content categorization
US9171048B2 (en) * 2012-12-03 2015-10-27 Wellclub, Llc Goal-based content selection and delivery
US9659005B2 (en) 2014-05-16 2017-05-23 Semantix Technologies Corporation System for semantic interpretation
CN104182535B (zh) * 2014-08-29 2017-05-24 苏州大学 一种人物关系抽取方法和装置
CN106407236B (zh) * 2015-08-03 2019-07-23 北京众荟信息技术股份有限公司 一种面向点评数据的情感倾向性检测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08305710A (ja) * 1995-04-28 1996-11-22 Toshiba Corp 文書のキーワード抽出方法及び文書検索装置
JP2008112432A (ja) * 2006-10-06 2008-05-15 Nippon Hoso Kyokai <Nhk> 人間関係グラフ生成装置及びコンテンツ検索装置、並びに、人間関係グラフ生成プログラム及びコンテンツ検索プログラム
US20140142922A1 (en) * 2007-10-17 2014-05-22 Evri, Inc. Nlp-based entity recognition and disambiguation
JP2011248409A (ja) * 2010-05-21 2011-12-08 Nippon Telegr & Teleph Corp <Ntt> 重要語抽出装置とその方法とプログラム
JP2012252541A (ja) * 2011-06-03 2012-12-20 Konica Minolta Business Technologies Inc 文書表示装置、文書表示方法及び文書表示プログラム
US20160117311A1 (en) * 2014-10-22 2016-04-28 Thomson Licensing Method and Device for Performing Story Analysis

Also Published As

Publication number Publication date
US11436409B2 (en) 2022-09-06
KR20200026028A (ko) 2020-03-10
EP3617906A1 (en) 2020-03-04
US20200073928A1 (en) 2020-03-05
JP6868062B2 (ja) 2021-05-12
KR102308521B1 (ko) 2021-10-01
CN109254973A (zh) 2019-01-22

Similar Documents

Publication Publication Date Title
US10496748B2 (en) Method and apparatus for outputting information
US11151177B2 (en) Search method and apparatus based on artificial intelligence
CN107491534B (zh) 信息处理方法和装置
US11042542B2 (en) Method and apparatus for providing aggregate result of question-and-answer information
CN108256070B (zh) 用于生成信息的方法和装置
CN109635094B (zh) 用于生成答案的方法和装置
JP6849723B2 (ja) 情報を生成するための方法及び装置
CN109871311B (zh) 一种推荐测试用例的方法和装置
US11651015B2 (en) Method and apparatus for presenting information
CN113836314B (zh) 知识图谱构建方法、装置、设备以及存储介质
CN108121814B (zh) 搜索结果排序模型生成方法和装置
WO2020023156A1 (en) Language agnostic data insight handling for user application data
CN110807311B (zh) 用于生成信息的方法和装置
CN110738056B (zh) 用于生成信息的方法和装置
CN113268560A (zh) 用于文本匹配的方法和装置
US8862609B2 (en) Expanding high level queries
CN109376220B (zh) 用于获取信息的方法和装置
JP2020035427A (ja) 情報を更新するための方法と装置
CN109710634B (zh) 用于生成信息的方法及装置
EP4246365A1 (en) Webpage identification method and apparatus, electronic device, and medium
CN112148751B (zh) 用于查询数据的方法和装置
CN109857838B (zh) 用于生成信息的方法和装置
CN114048315A (zh) 确定文档标签的方法、装置、电子设备和存储介质
CN110647623B (zh) 用于更新信息的方法及装置
CN107657035B (zh) 用于生成有向无环图的方法和装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190711

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200821

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201006

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210406

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210409

R150 Certificate of patent or registration of utility model

Ref document number: 6868062

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250