JP2021082306A - 目標内容の確定方法、装置、機器及びコンピュータ可読記憶媒体 - Google Patents

目標内容の確定方法、装置、機器及びコンピュータ可読記憶媒体 Download PDF

Info

Publication number
JP2021082306A
JP2021082306A JP2021002847A JP2021002847A JP2021082306A JP 2021082306 A JP2021082306 A JP 2021082306A JP 2021002847 A JP2021002847 A JP 2021002847A JP 2021002847 A JP2021002847 A JP 2021002847A JP 2021082306 A JP2021082306 A JP 2021082306A
Authority
JP
Japan
Prior art keywords
sentence
sentences
relationship
determining
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021002847A
Other languages
English (en)
Other versions
JP7139028B2 (ja
Inventor
シンウェイ フォン
Xinwei Feng
シンウェイ フォン
チーシン ティエン
Zhixing Tian
チーシン ティエン
ソンタイ タイ
Songtai Dai
ソンタイ タイ
ミャオ ユイ
Miao Yu
ミャオ ユイ
ホアンユイ チョウ
Huanyu Zhou
ホアンユイ チョウ
モン ティエン
Meng Tian
モン ティエン
シュエチエン ウー
Xueqian Wu
シュエチエン ウー
シュンチャオ ソン
Xunchao Song
シュンチャオ ソン
ポンチョン ユアン
Pengcheng Yuan
ポンチョン ユアン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2021082306A publication Critical patent/JP2021082306A/ja
Application granted granted Critical
Publication of JP7139028B2 publication Critical patent/JP7139028B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

【課題】文章から有用な情報だけを確定する目標内容の確定方法、装置、機器及びコンピュータ可読記憶媒体を提供する。【解決手段】目標内容の確定方法は、検索情報に基づいて確定される文章の段落を複数の文に分割し、そして、文の属性に基づいて文間の関係を確定するステップ201と、文間の関係に基づいて文ごとに対応する文表現を確定するステップ202と、文の文表現や検索情報に基づいて目標文を確定し、そして、目標文に基づいて目標内容を確定するステップ203と、を含む。【選択図】図2

Description

本開示は、データ処理技術に関し、特に、文字内容の分析技術に関する。
情報検索(Information Retrieval)は、ユーザが情報を調査する及び取得する主な方式であり、情報を探す方法と手段であると同時に、情報検索は、サーチエンジンのコアタスクでもあり、サーチエンジンは、ユーザによって入力される内容に基づいて情報を提供する必要がある。
ペースが速まっていく現代の社会生活に従って、情報の内容が増々多くなり、情報を読む時間が増々短くなっている。一般的に、文章が大量の内容で充満されており、例えば、ユーザがある映画の主役を演じる役者を知りたいが、その文章の大半は、映画の紹介、そして、出演陣の紹介や、出演陣の紹介に係る段落に記載可能な役者の紹介でいっぱいになっている反面、ユーザからの質問を真に回答する内容は、ただ数文で済む。質問でも、一文で回答できる質問もあれば、数文の内容を組み合わせてから回答できる質問もある。
よって、いかにして文章で有用な情報だけを確定し、ユーザへ有用な情報をフィードバックするかは、当業者が早急に解決しなければならない課題になっている。
本開示は、文章から有用な情報だけを確定する目標内容の確定方法、装置、機器及びコンピュータ可読記憶媒体を提供する。
第1の態様では、本開示は、目標内容の確定方法を提供し、前記方法は、
検索情報に基づいて確定される文章の段落を複数の文に分割し、前記文の属性に基づいて文間の関係を確定することと、
前記文間の関係に基づいて前記文ごとに対応する文表現を確定することと、
前記文の文表現及び前記検索情報に基づいて目標文を確定し、そして、前記目標文に基づいて目標内容を確定することと、を含む。
選択的に、前記文の属性に基づいて文間の関係を確定することは、
文に含まれているエンティティを取得することと、
前記文間の対応するエンティティの重畳度に基づき、前記文間の第1の関係を確定することと、を含む。
本実施例で提供される方法により、文に含まれているエンティティの次元により、文間の関係を確定することができる。
選択的に、前記文の属性に基づいて文間の関係を確定することは、
前記文章の段落における前記文の位置番号を確定し、そして、前記位置番号に基づいて前記文間の第2の関係を確定することを含む。
本実施例で提供される方法により、段落における文の位置の次元により、文間の関係を確定することができる。
選択的に、前記文の属性に基づいて文間の関係を確定することは、
前記文ごとに対応する文ベクトルを確定し、そして、前記文ベクトルに基づいて文間の第3の関係を確定することを含む。
本実施例で提供される方法により、文のセマンティクスの次元により、文間の関係を確定することができる。
選択的に、前記文の属性に基づいて文間の関係を確定することは、
プリセットのルールに基づいて前記文間の影響重みを確定し、そして、前記文に対応する前記影響重みに基づいて前記文に対する他の文の注意力を確定することを含む。
本実施例で提供される方法により、文間の影響の次元により、文間の関係を確定することができる。
選択的に、前記文間の関係に基づいて前記文ごとに対応する文表現を確定することは、
前記文間の関係に基づいて前記関係に対応する関係図を確定することと、
プリセットのニューラルネットワークによって前記関係図において前記文ごとの文表現を確定することと、を含む。
本実施例で提供される方法により、文間の関係の文表現を含む文表現を確定することができる。
選択的に、前記関係図の数が1よりも大きい場合、
プリセットのニューラルネットワークによって前記関係図において前記文ごとの文表現を確定した後に、前記方法は、
前記文に対応する文表現を接ぎ合わせ、前記文に対応する完全な表現を得ることをさらに含む。
本実施例で提供される方法により、複数の次元から確定される文関係を含む文表現を得ることができ、これにより、文表現に含まれる文間の関係がより豊富であるようになる。
選択的に、前記文の文表現や前記検索情報に基づいて目標文を確定することは、
前記文表現や前記検索情報に基づいてマッチング度を確定することと、
マッチング度合いが上位である、プリセットの数の文を目標文として確定することと、を含む。
本実施例で提供される方法により、文間の関係と合わせて、段落において検索情報にマッチングする目標文を確定することができる。
第2の態様では、本開示は、目標内容の確定装置を提供し、前記装置は、
検索情報に基づいて確定される文章の段落を複数の文に分割し、そして、前記文の属性に基づいて文間の関係を確定するための分割モジュールと、
前記文間の関係に基づいて前記文ごとに対応する文表現を確定するための表現確定モジュールと、
前記文の文表現や前記検索情報に基づいて目標文を確定し、そして、前記目標文に基づいて目標内容を確定するための目標確定モジュールと、を含む。
第3の態様では、本開示は、電子機器を提供し、前記電子機器は、
少なくとも1つのプロセッサ、および
前記少なくとも1つのプロセッサと通信的に接続されるメモリを含み、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶されており、前記命令が前記少なくとも1つのプロセッサによって実行されることにより、前記少なくとも1つのプロセッサに、上記のいずれか1つの目標内容の確定方法を実行させることができる。
第4の態様では、本開示は、コンピュータ命令を記憶している非一時的なコンピュータ可読記憶媒体を提供し、前記コンピュータ命令は、前記コンピュータに上記のいずれか1つの目標内容の確定方法を実行させるためのものである。
第5の態様では、本開示は、コンピュータプログラムを提供し、前記コンピュータプログラムは、可読記憶媒体に記憶され、電子機器の少なくとも1つのプロセッサは、前記可読記憶媒体から前記コンピュータプログラムを読み取ることができ、前記少なくとも1つのプロセッサは、前記コンピュータプログラムを実行することによって、前記電子機器に上記のいずれか1つの目標内容の確定方法を実行させる。
本開示は目標内容の確定方法、装置、機器及びコンピュータ可読記憶媒体を提供し、前記方法は、検索情報に基づいて確定される文章の段落を複数の文に分割し、そして、文の属性に基づいて文間の関係を確定することと、文間の関係に基づいて文ごとに対応する文表現を確定することと、文の文表現や検索情報に基づいて目標文を確定し、そして、目標文に基づいて目標内容を確定することと、を含む。本開示によって提供される方法、装置、機器及びコンピュータ可読記憶媒体では、文間の関係を確定し、そして、文間の関係に基づいて文の文表現を再確定し、さらに、文表現に基づいて文の中から目標文を確定することで、本開示によって提供される方法、装置、機器及びコンピュータ可読記憶媒体により、文間の関係と合わせて句ごとに分析することにより、検索情報に一層マッチングする目標内容を確定することができる。
図面は、本解決手段をよりよく理解するためのものであり、本願に対する限定を構成しない。
本願の一例示的な実施例によって示されるシステム構造図である。 本願の一例示的な実施例によって示されるインターフェース図である。 本願の一例示的な実施例によって示される目標内容の確定方法のフローチャートである。 本願の他の例示的な実施例によって示される目標内容の確定方法のフローチャートである。 本願の一例示的な実施例によって示される目標内容の確定装置の構造図である。 本願の他の例示的な実施例によって示される目標内容の確定装置の構造図である。 本願の一例示的な実施例によって示される電子機器を実現するためのブロック図である。
以下、本願の模範的な実施例を図面と合わせて説明し、本願の実施例の様々な、理解のための詳細が含まれるが、これらは模範的なものにすぎないと考えるべきである。よって、当業者は、ここに記載の実施例に対して行われる様々な変化や修正が可能であり、本願の範囲や趣旨から逸脱しないと認識すべきである。同様に、明確や簡潔のため、以下の説明では、周知の機能や構造に関する記載を省略している。
現在、ユーザは、サーチエンジンで検索情報を入力することができ、サーチエンジンは、検索情報に対応する検索内容をフィードバックすることができる一方、一般的に、ネットワークで検索される内容は多いため、ユーザは大量の内容を読まなければ必要な内容を得ることができない。
例えば、ユーザが入力する検索情報は、「NBA2018−2019シーズンのmvpは誰ですか」である場合、一段落で
「NBA2018−2019シーズンの個人賞結果は発表されました」、
「今シーズンで大活躍したハーデンは、チームを率いてリーグ一位を勝ち取りました」、
「圧倒的な大活躍を見せた彼は、今シーズンのMVPに輝きました」、という3文をともに組み合わせて回答する必要がある。
上記3文でのいずれか1文でも該質問を単独で回答することができないため、段落内容での文を分析しなければ、有用な情報を得ることができない。
本願の実施例で提供される解決手段により、段落中の個々の文間の関係に基づいて文の内容を分析し、即ち、一文自体および他の文の内容をともに組み合わせて、検索情報にマッチングする内容を共同で確定する。
図1Aは、本願の一例示的な実施例によって示されるシステム構造図である。
図1Aに示すように、該システムでは、ユーザ端末11を含んでもよく、ユーザ端末11は、コンピュータであってもよく、スマートフォーンなどの電子機器であってもよい。該システムでは、サーバ12をさらに含んでもよい。サーバ12とユーザ端末11とは、ネットワークによって接続されることができる。
ユーザは、ユーザ端末11に検索情報を入力することができ、ユーザ端末11は、ネットワークによって検索情報をサーバ12に送信し、サーバ12は、検索情報に基づいて検索結果を確定し、そして、検索結果をユーザ端末11へフィードバックすることができる。
具体的に、サーバ12は、さらに検索結果に基づいて検索情報にマッチングする目標内容を確定し、そして、ユーザ端末11へ目標内容をフィードバックすることができ、これにより、ユーザは、大量の内容を読まなくても、有用な情報を得ることができる。
図1Bは、本願の一例示的な実施例によって示されるインターフェース図である。
図1Bに示すように、ユーザ端末11のインターフェースで1つの入力ボックスをディスプレイすることができ、ユーザは、入力ボックスで検索情報を入力してサーチボターンをクリックすることで、ユーザ端末11が検索情報をサーバ12へ送信するようにトリガーすることができる。
例えば、ユーザ端末11に配置されたサーチエンジンを始動することで、ユーザ端末11が図1Bに示すような入力ボックスをディスプレイすることができる。
図2は、本願の一例示的な実施例によって示される目標内容の確定方法のフローチャートである。
図2に示すように、本実施例で提供される目標内容の確定方法は、以下のステップを含む。
ステップ201において、検索情報に基づいて確定される文章の段落を複数の文に分割し、そして、文の属性に基づいて文間の関係を確定する。
本実施例で提供される方法により、コンピューティング能力を備えた電子機器によって実行されることができ、該機器は、例えば、図1Aに示すようなサーバであってもよい。
具体的に、電子機器は、検索情報に基づいて対応する検索結果を確定することができる。例えば、1つのニュースレポートであってもよく、1つの文章などであってもよい。電子機器は、本実施例で提供される方法に基づいて検索結果を分析し、検索情報に対応する目標内容、つまり、有用な情報を得ることができる。
さらに、本実施例で提供される方法をソフトウェアにパッケージングしてから、該ソフトウェアを電子機器にインストールすることにより、電子機器に、本実施例で提供される方法を実行させることができる。
実際に応用する際、検索結果中の段落に対し、段落を分割して複数の文を得ることができる。例えば、検索結果中の文章は、一段落を含む場合、該一段落を処理することができ、検索結果の文章に含まれる段落数が1つよりも大きい場合、段落ごとに処理することができる。
段落の中の句読点に基づいて文章の段落を分割することができる。段落の開始位置から1つ目の句読点までは1文であり、段落で2つずつの句読点の間は1文であると考えられることができる。
具体的に、さらに文の属性に基づいて文間の関係を確定してもよい。本実施例で提供される方法において、文間の関係と合わせて文章の段落を分析することにより、文間の関係と合わせて文ごとに含まれる情報をより正確的に識別する。
さらに、文の属性は、文に含まれている内容、段落における文の位置などの情報であってもよい。これらの情報に基づいて文間の関係を確定することができる。
実際に応用する際、例えば、文に含まれているエンティティ語彙に基づいて文間の関係を確定することができる。2つの文に含まれているエンティティ語彙の重畳度が高い場合、この2つの文の関連性が比較的に強いと考えることができ、関連性を文間の一関係とすることができる。さらに、例えば、2つの文の位置が比較的に近い場合、例えば、連続する2文である場合、この2つの文の相関性が比較的に強いと考えることができる。文章の段落に対して、近寄っている文の相関性がより強いため、文の位置に基づいて文間の関係を確定することができる。
ステップ202において、文間の関係に基づいて文ごとに対応する文表現を確定する。
本実施例で提供される方法は、文ごとの表現を再確定することもできる。オリジナルな文章では、一文の表現は文の内容であると考えることができる。例えば、一文の内容は、「圧倒的な大活躍を見せた彼は、今シーズンのMVPに輝きました」である場合、該句の内容はこの文の文表現であり、この文のみで検索情報に対するフィードバック内容を得ることができない。よって、本実施例で提供される方法により、文間の関係と合わせて文表現を再確定することで、新たな文表現に文間の関係が含まれるようになる。
具体的に、文間の関係に基づいて関係図を構築することができ、各文関係に対して、種類別に対応する関係図が確定され得る。例えば、4種類の文関係を確定する場合、4つの関係図を構築することができ、関係図には各文間の関係が含まれている。
関係図には複数のノードが含まれることができ、ノードごとに一文を代表することができる。文間の関係は、例えば、辺で表すことができ、辺には、該辺によって連結される2つのノード間の関係を表すための関係値があってもよい。
さらに、GCN(Graph convolutional networks、グラフ畳み込みニューラルネットワーク)を用いて関係図を処理することができる。例えば、関係図をGCNに入力し、図でのノードごとの表現、即ち、文表現をGCNによって出力することができる。
実際に応用する際、文間の関係に基づいて複数の関係図を確定した場合、関係図ごとに基づいて個々の文の文表現をすべて出力することができる。このような場合では、同一文の文表現を接ぎ合わせることにより、該文の完全な表現を得ることもできる。
得られる文表現には文間の関係が含まれることにより、文間の関係を帯びている文表現に基づいて文の中から目標内容を確定することができる。
ステップ203において、文の文表現や検索情報に基づいて目標文を確定し、そして、目標文に基づいて目標内容を確定する。
具体的に、文ごとの文表現や検索情報のマッチング度合いを確定することができる。マッチング度合いが高い場合、対応する文は目標文であると考えることができる。
さらに、文表現をベクトル式に転換して、検索情報をもベクトル式で表すことにより、2つのベクトルの距離を計算し、そして、該距離に基づいて両者のマッチング度合いを確定することができる。
実際に応用する際、マッチング度合いが上位である、前からnの文を目標文として確定することができる。マッチング度合いの閾値を確定し、マッチング度合いが該閾値よりも大きい文を目標文として確定することもできる。
目標文に含まれている内容を目標内容とすることができ、目標内容をユーザ端末にフィードバックすることにより、ユーザが大量の内容を読まないままで検索情報に対応する有用な情報を取得できる。
本実施例で提供される方法は、目標内容を確定するためのものであり、該方法は、本実施例で提供される方法が配置されている機器によって実行され、該機器は、通常ハードウェア及び/又はソフトウェアの形で実現される。
本実施例で提供される目標内容の確定方法は、検索情報に基づいて確定される文章の段落を複数の文に分割し、そして、文の属性に基づいて文間の関係を確定することと、文間の関係に基づいて文ごとに対応する文表現を確定することと、文の文表現や検索情報に基づいて目標文を確定し、そして、目標文に基づいて目標内容を確定することと、を含む。本実施例で提供される方法において、文間の関係を確定し、そして、文間の関係に基づいて文の文表現を再確定し、さらに、文表現に基づいて文の中から目標文を確定することで、本実施例で提供される方法により、文間の関係と合わせて文ごとに分析し、これにより、検索情報に一層マッチングする目標内容を確定することができる。
図3は、本願の他の例示的な実施例によって示される目標内容の確定方法のフローチャートである。
図3に示すように、本実施例で提供される目標内容の確定方法は、以下のステップを含む。
ステップ301において、検索情報に基づいて確定される文章の段落を複数の文に分割する。
ステップ301やステップ201において段落分割の具体的な原理や実現形態は類似し、ここでは繰り返して説明しないようにする。
ステップ302において、文に含まれているエンティティを取得し、文間の対応するエンティティの重畳度に基づき、文間の第1の関係を確定する。
ある場合では、文の属性は、文に含まれているエンティティであってもよい。文ごとに処理し、個々の文に含まれているエンティティを取得することができる。
エンティティ語彙のコーパスを設置することができる。文を分割することにより、複数の文に含まれている語彙を得てから、エンティティ語彙のコーパスに含まれるエンティティ語彙に基づいて文の語彙を識別し、文の語彙からエンティティを確定することができる。例えば、エンティティ語彙のコーパスで文の語彙を調べることができ、対応する単語を調べることができると、該文の語彙はエンティティであると証明される。
具体的に、含まれているエンティティを文の中から識別するための識別アルゴリズムを設置することもできる。
さらに、文間の対応するエンティティの重畳度に基づき、文間の第1の関係を確定することができる。具体的に、2つずつの文間の第1の関係を確定することができる。
実際に応用する際、2つの文に含まれているエンティティの重畳度が比較的に高い場合、2つの文の関連性が比較的に高いと考えることができるため、文の重畳度を第1の関係の指標とすることができる。
文間の重畳されるエンティティの数d、即ち、2つの文での重複されるエンティティの数を確定してから、dと、文に含まれているエンティティの数dと、の比の値を文の重畳度とすることができる。例えば、文S1と文S2との重畳度を確定するとき、2つの重畳度を得ることができる。1つ目の重畳度は、重畳されるエンティティの数dと、文S1に含まれているエンティティの数dと、の比の値であり、2つ目の重畳度は、重畳されるエンティティの数dと、文S2に含まれているエンティティの数dと、の比の値であり、重畳度がより高いほうを2つの文間の重畳度とすることができる。
ステップ303において、文章の段落における文の位置番号を確定し、そして、位置番号に基づいて文間の第2の関係を確定する。
ある場合では、文の属性は、位置番号であってもよい。文章の段落における文の位置に基づいて文の位置番号を確定することができる。例えば、1つ目の文の番号は1で、2つ目の文の番号は2であってもよいなどが挙げられる。
具体的に、段落における文は、上文を承けて下文にうまくつなげる作用があるため、位置が近寄るほど、文間の関連性が高まる。例えば、一般的に、連続する2文は、関連性が比較的に強い可能性がある。本実施例で提供される方法により、位置番号によって文の位置属性を表すことができ、ひいては、個々の文の位置番号に基づいて第2の関係を確定することができる。
さらに、2つずつの文間の第2の関係を確定することができる。
実際に応用する際、対応する文の番号の差の絶対値の逆数で第2の関係を表すことができる。例えば、1つ目の文S1と2つ目の文S2との第2の関係は1/|1−2|=1であり、2つ目の文S2と4つ目の文S4との関係値は、1/|2−4|=0.5である。
ステップ304において、文ごとに対応する文ベクトルを確定し、そして、文ベクトルに基づいて文間の第3の関係を確定する。
ある場合では、文の属性は、文ベクトルであってもよい。
文に含まれている語彙に基づいて文ベクトルを確定することができる。文ベクトルを確定するためのモデルをプリセットすることもできる。
例えば、Doc2vecやBERTによって文ベクトルを確定することができる。
具体的に、文ベクトルは、文に含まれている内容、例えば、含まれている語彙、語彙の順序などを具現化することができるため、文ベクトルに基づいて文間の語義的関連、即ち、第3の関係を確定することができる。
さらに、2つの文間の第3の関係を確定することができる。具体的に、2つの文に対応する文ベクトルの余弦値を計算して第3の関係とすることができる。例えば、文S1、文S2に対し、S1に対応するベクトルH1とS1に対応するベクトルH2とを確定し、そして、この2つのベクトルの余弦値を計算して文S1とS2との語義的関係の強弱を表すことができる。
ステップ305において、プリセットのルールに基づいて文間の影響重みを確定し、そして、文に対応する影響重みに基づいて文に対する他の文の注意力を確定する。
実際に応用する際、文の属性は、該文に対する他の文の影響を含むこともできる。そのうち、文に対する文の影響重みを確定するためのルールをプリセットすることができる。例えば、文S2に対する文S1の影響を確定する。
文の間の相関性を確定して他の文に対する一文の影響を表すことができる。例えば、Sに対するSの影響重みを表すためのsimilarity(S、S)を確定することができる。
具体的に、相関性は、文間の余弦値で表すことができ、例えば、similarity(S、S)=cos(S、S)である。対応する文表現で余弦値を確定することができる。
さらに、このような方式で一文に対する文ごとの影響重みを確定することができ、例えば、S1に対する文S2、文S3、文S4の影響重みをそれぞれ確定する。また、一文に対応する影響重みに基づいて該文に対する他の文の注意力を確定し、即ち、一文に対する他の文の影響に基づいて該文に対する他の文の注意力を確定することができる。
より明確に説明するために、影響される文を目標文として確定し、他の文を影響文として確定することができる。目標文を確定する影響重み値と対応する影響文との相乗積の和を目標文の注意力、即ち、影響文が目標文に影響を与える注意力の値とすることができる。
例えば、S1、S2、S3、S4の4文が含まれる場合、S1の注意力は、
similarity(S、S)*S+similarity(S、S)*S+similarity(S、S)*Sである。
実際に応用する際、文を計算するとき、文表現に基づいて計算することができる。例えば、similarity(S、S)では、文Sの文表現や文Sの文表現に基づいて計算することができる。文表現は、例えば、文ベクトルであってもよい。
モデルによって文の注意力を確定することができる。該モデルを訓練することができ、毎回の反復プロセスでは、モデルの更新につれて、確定される注意力の結果も変わり、これにより、最終に出力される結果は変わる。
ステップ302〜ステップ305は、文間の関係を確定する4種類の方式であり、この4種類の方式を同時に設置することもできれば、そのうちのいずれか1種又は数種類を設置することもでき、これに対し、本実施例は、何の制限もしないと同時に、ステップ302〜ステップ305の実行手順に対しても何の制限もしない。
ステップ306において、文間の関係に基づいて関係に対応する関係図を確定する。
具体的に、文間の関係を確定した後に、文間の関係に基づいて対応する関係図を確定することができる。
さらに、複数種類の文間の関係を確定した場合、各関係の種類別に対応する関係図を確定することができる。図には、複数のノードが含まれることができ、1つのノードが一文を代表する。ノードの間には、辺があってもよく、辺の値は、即ち、ノード間の関係であってもよい。例えば、第1の関係に対応する関係図において、個々のノードの辺は、文間の重畳度であってもよい。
ステップ307において、プリセットのニューラルネットワークによって関係図において文ごとの文表現を確定する。
実際に応用する際、関係図において個々のノードの情報を抽出するための、プリセットのニューラルネットワークを予め訓練することができる。例えば、グラフ畳み込みニューラルネットワークを設置することができる。
グラフ畳み込みニューラルネットワーク(Graph Convolutional Network、GCN)は、グラフデータを深く学習する方法である。グラフデータをGCNに入力し、GCNは、図の中の各ノード間の関係に基づいてノード情報、つまり文ごとの文表現を抽出することができる。
具体的に、GCNによって出力される文表現には、文間の関係の情報が含まれている。
ステップ308において、文に対応する文表現を接ぎ合わせ、文に対応する完全な表現を得る。
さらに、確定される関係図の数が1よりも大きい場合、文ごとに対しては、いずれも1よりも大きい数の文表現を得ることができる。例えば、第1の関係、第2の関係、第3の関係、注意力に基づいて第1の関係図、第2の関係図、第3の関係図、注意力図をそれぞれ確定することができ、同一文に対しては、これらの関係図に基づいて第1の表現、第2の表現、第3の表現、注意力表現をそれぞれ確定することができる。
実際に応用する際、異なる関係図は、異なる次元から文間の関係を説明しているため、異なる関係図に基づいて得られる文表現を接ぎ合わせ、完全な文表現を得ることができ、これにより、文間の関係がより豊富に含まれる文表現を得ることができる。
個々の文の文表現を接ぎ合わせるとき、同じ順序に従って接ぎ合わせることができる。例えば、文ごとに対しては、いずれも第1の表現、第2の表現、第3の表現、注意力表現の順序に従って接ぎ合わせる。
ステップ309において、文表現や検索情報に基づいてマッチング度を確定し、マッチング度合いが上位である、プリセットの数の文を目標文として確定する。
具体的に、関係図を1つしか確定しない場合、該関係図に対応する文表現に基づいて本ステップを直接に実行することができる。関係図を複数確定した場合、完全な文表現に基づいて本ステップを実行することができる。
さらに、一文の文表現や検索情報の距離を計算し、該距離を文のマッチング度として確定することができる。例えば、一文表現Hと検索情報Qとの余弦値を計算し、該余弦値を両者の距離とすることができる。
実際に応用する際、余弦値を確定するとき、文表現をベクトル式に転換してもよく、検索情報をベクトル式に転換してもよい。これにより、2つのベクトルの余弦値を確定し、即ち、文と検索情報とのマッチング度を得ることができる。
マッチング度合いが高い文を目標文として確定することができる。例えば、数の値Nをプリセットし、マッチング度合いが上位であるN個の文を選出して目標文とすることができる。さらに、例えば、比率の値Mを設置することができ、文の数と比率の値との相乗積を数の値Nとして確定することができる。
具体的に、検索した文章が、複数の文章の段落を含む場合、段落ごとの文の文表現を処理し、マッチング度合いが高い目標文を確定することができる。
ステップ310において、目標文に基づいて目標内容を確定する。
ステップ310とステップ203とでは、目標内容を確定する具体的な原理や実現形態が類似し、ここでは繰り返して説明しないようにする。
図4は、本願の一例示的な実施例によって示される目標内容の確定装置の構造図である。
図4に示すように、本実施例で提供される目標内容の確定装置は、
検索情報に基づいて確定される文章の段落を複数の文に分割し、そして、前記文の属性に基づいて文間の関係を確定するための分割モジュール41と、
前記文間の関係に基づいて前記文ごとに対応する文表現を確定するための表現確定モジュール42と、
前記文の文表現や前記検索情報に基づいて目標文を確定し、そして、前記目標文に基づいて目標内容を確定するための目標確定モジュール43と、を含む。
本実施例で提供される目標内容の確定装置は、検索情報に基づいて確定される文章の段落を複数の文に分割し、そして、文の属性に基づいて文間の関係を確定するための分割モジュールと、文間の関係に基づいて文ごとに対応する文表現を確定するための表現確定モジュールと、文の文表現や検索情報に基づいて目標文を確定し、そして、目標文に基づいて目標内容を確定するための目標確定モジュールと、を含む。本実施例で提供される装置では、文間の関係を確定し、そして、文間の関係に基づいて文の文表現を再確定し、さらに、文表現に基づいて文の中から目標文を確定することで、本実施例で提供される装置により、文間の関係と合わせて句ごとに分析することによって、検索情報に一層マッチングする目標内容を確定することができる。
本実施例で提供される目標内容の確定装置の具体的な原理や実現形態は、いずれも図2に示すような実施例に類似し、ここでは繰り返して説明しないようにする。
図5は、本願の他の例示的な実施例によって示される目標内容の確定装置の構造図である。
図5に示すように、本実施例で提供される目標内容の確定装置は、上記実施例を基礎として、前記分割モジュール41は、
文に含まれているエンティティを取得すること、及び
前記文間の対応するエンティティの重畳度に基づき、前記文間の第1の関係を確定すること、に用いられる第1の関係確定ユニット411を含む。
前記分割モジュール41は、前記文章の段落における前記文の位置番号を確定し、そして、前記位置番号に基づいて前記文間の第2の関係を確定するための第2の関係確定ユニット412を含む。
前記分割モジュール41は、前記文ごとに対応する文ベクトルを確定し、そして、前記文ベクトルに基づいて文間の第3の関係を確定するための第3の関係確定ユニット413を含む。
前記分割モジュール41は、プリセットのルールに基づいて前記文間の影響重みを確定し、そして、前記文に対応する前記影響重みに基づいて前記文に対する他の文の注意力を確定するための第4の関係確定ユニット414を含む。
前記表現確定モジュール42は、
前記文間の関係に基づいて前記関係に対応する関係図を確定するためのグラフ確定ユニット421と、
プリセットのニューラルネットワークによって前記関係図において前記文ごとの文表現を確定するための表現確定ユニット422と、を含む。
前記関係図の数が1よりも大きい場合、
前記表現確定モジュール42は、表現確定ユニット422がプリセットのニューラルネットワークによって前記関係図において前記文ごとの文表現を確定した後に、
前記文に対応する文表現を接ぎ合わせ、前記文に対応する完全な表現を得るための接ぎ合わせユニット423をさらに含む。
前記目標確定モジュール43は、具体的に、
前記文表現や前記検索情報に基づいてマッチング度を確定すること、及び
マッチング度合いが上位である、プリセットの数の文を目標文として確定すること、に用いられる。
本願の実施例により、本願は、さらに、電子機器と可読記憶媒体とを提供する。
本願の実施例により、本願は、コンピュータプログラム製品を提供し、前記プログラム製品は、コンピュータプログラムを含み、前記コンピュータプログラムは、可読記憶媒体に記憶され、電子機器の少なくとも1つのプロセッサは、前記可読記憶媒体から前記コンピュータプログラムを読み取ることができ、前記少なくとも1つのプロセッサは、前記コンピュータプログラムを実行することによって、前記電子機器に上記のいずれか1つの実施例による手段を実行させる。
本願の実施例により、本願は、コンピュータプログラムを提供し、前記コンピュータプログラムは、可読記憶媒体に記憶され、電子機器の少なくとも1つのプロセッサは、前記可読記憶媒体から前記コンピュータプログラムを読み取ることができ、前記少なくとも1つのプロセッサは、前記コンピュータプログラムを実行することによって、前記電子機器に上記のいずれか1つの実施例による手段を実行させる。
図6に示すように、本願の実施例に係る目標内容の確定方法に基づく電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、作業台、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及びその他の適切なコンピュータなどのような、様々な形のデジタルコンピュータを表すことを旨とする。電子機器はまた、パーソナルデジタルアシスタント、セルラーテレフォン、スマートフォーン、ウェアラブルデバイス及びその他の類似するコンピューティングデバイスなどのような、様々な形のモバイル装置を表すこともできる。本文に示すコンポーネント、それらの連結や関係、及び、それらの機能は、あくまで例示的なものであり、本文に記載の及び/又は本文が求める本願の実現を制限することを意図しない。
図6に示すように、該電子機器は、1つ又は複数のプロセッサ601、メモリ602、及び各コンポーネントを連結するためのインターフェースを含み、該インターフェースは、高速インターフェースと低速インターフェースとを含む。個々のコンポーネントは、異なるバスを使用して互いに接続され、パブリックメインボードにインストールされるか、又は、ニーズに応じて他の方式でインストールされることができる。プロセッサは、電子機器内で実行される命令を処理することができ、外部の入力/出力装置(インターフェースにカップリングされたディスプレイデバイスなど)でグラフィカル・ユーザー・インターフェース(Graphical User Interface、GUI)のグラフィクス情報をディスプレイするための、メモリ内又はメモリ上に記憶されている命令が含まれている。他の実施形態では、ニーズに応じて、複数のプロセッサ及び/又は複数のバスを複数のメモリと一緒に使用することができる。同様に、複数の電子機器に接続することができ、個々の機器は、必要な操作(例えば、サーバアレイ、一揃いのブレードサーバ、または、マルチプロセッサシステムとする)を一部提供する。図6には、1つのプロセッサ601を例としている。
メモリ602は、本願で提供される非一時的なコンピュータ可読記憶媒体である。前記メモリには、少なくとも1つのプロセッサによって実行可能な命令が記憶されることにより、前記少なくとも1つのプロセッサに本願で提供される目標内容の確定方法を実行させる。本願に係る非一時的なコンピュータ可読記憶媒体には、コンピュータ命令が記憶されており、該コンピュータ命令は、コンピュータに本願で提供される目標内容の確定方法を実行させるためのものである。
メモリ602は、非一時的なコンピュータ可読記憶媒体として、非一時的なソフトウェアプログラム、非一時的なコンピュータによる実行可能なプログラム及びモジュール、例えば、本願の実施例における目標内容の確定方法に対応するプログラム命令/モジュール(例えば、図4に示すような分割モジュール41、表現確定モジュール42や目標確定モジュール43)を記憶するために使用することができる。プロセッサ601は、メモリ602に記憶されている非一時的なソフトウェアプログラム、命令およびモジュールを実行することにより、サーバの様々な機能アプリケーションおよびデータ処理を実行し、即ち、上記の方法の実施例における目標内容の確定方法を実現する。
メモリ602は、プログラム記憶エリアとデータ記憶エリアとを含むことができ、そのうち、プログラム記憶エリアは、操作システム、少なくとも1つの機能に必要なアプリケーションプログラムを記憶することができ、データ記憶エリアは、目標内容の確定及び電子機器の使用によって作成されるデータなどを記憶することができる。また、メモリ602は、高速ランダムアクセスメモリを含むことができ、また、少なくとも1つの磁気ディスク記憶デバイス、フラッシュメモリデバイス、又はその他の非一時的なソリッドステートストレージデバイスなどの非一時的なメモリを含むこともできる。いくつかの実施例において、メモリ602は、プロセッサ601に対して遠隔に設置されているメモリを選択的に含むことができ、それらの遠隔メモリは、ネットワークを介して目標内容の確定用電子機器に接続されることができる。上記のネットワークの実例は、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びそれらの組み合わせを含むが、これらに限定されない。
目標内容の確定方法の電子機器はまた、入力装置603と出力装置604とを含んでもよい。プロセッサ601、メモリ602、入力装置603及び出力装置604は、バス又はその他の方式によって接続されることができ、図6では、バスによって接続される方式を例としている。
入力装置603は、入力される数字又はキャラクタ情報を受信し、目標内容の確定用電子機器のユーザ設定、および機能制御に関連するキーシグナルの入力が発生することができ、例えばタッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、インディケータロッド、1つ又は複数のマウスボタン、トラックボール、操縦ハンドルなどの入力装置が挙げられる。出力装置604は、ディスプレイデバイス、補助照明装置(LEDなど)や触感フィードバック装置(振動モータなど)などを含むことができる。該ディスプレイデバイスは、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイやプラズマディスプレイを含むことができるが、それらに限定されない。いくつかの実施形態では、ディスプレイデバイスはタッチスクリーンであってもよい。
ここに記載のシステムや技術の様々な実施形態は、デジタル電子回路、集積回路システム、特定用途向けASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせで実現されてよい。それらの様々な実施形態は、1つ又は複数のコンピュータプログラムに実施される形態を含むことができ、該1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステムで実行及び/又は解釈されることができ、該プログラマブルプロセッサは、特定用途向け、または、汎用プログラマブルプロセッサであってもよく、記憶システム、少なくとも1つの入力装置、及び少なくとも1つの出力装置から、データや命令を受信し、そして、データや命令を該記憶システム、該少なくとも1つの入力装置や、該少なくとも1つの出力装置に伝送することができる。
これらのコンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、または、コードとも呼ばれる)は、プログラマブルプロセッサの機械命令を含み、アドバンスプロセス及び/又はオブジェクト指向型プログラミング言語、及び/又はアセンブリ言語/機械言語を利用してこれらのコンピュータプログラムを実施することができる。例えば、本文で使用する用語「機械可読媒体」や「コンピュータ可読媒体」は、機械命令及び/又はデータをプログラマブルプロセッサに提供するための任意のコンピュータプログラム製品、デバイス、及び/又は装置(磁気ディスク、光ディスク、メモリ、プログラマブルロジック装置(PLD)など)のことを指し、機械可読信号としての機械命令を受信する機械可読媒体を含む。用語「機械可読信号」は、機械命令及び/又はデータをプログラマブルプロセッサに提供するための任意の信号のことを指す。
ユーザとのインタラクションを提供するために、ここに記載のシステムや技術をコンピュータで実施することができ、該コンピュータは、ユーザへ情報をディスプレイするためのディスプレイ装置(CRT(陰極線管)またはLCD(液晶ディスプレイ)モニターなど)、及びキーボードやポインティングデバイス(マウス又はトラックボールなど)があり、ユーザは、該キーボードや該ポインティングデバイスを通じ、入力をコンピュータに提供することができる。その他の種類の装置は、ユーザとのインタラクションを提供するために使用されることができ、例えば、ユーザに提供されるフィードバックは、任意の形の感覚フィードバック(視覚フィードバック、聴覚フィードバック、または触感フィードバックなど)であってもよく、ユーザからの入力を任意の形(音入力、音声入力又は触感入力を含む)で受信することができる。
ここに記載のシステムや技術は、バックグランドコンポーネントを含むコンピューティングシステム(データサーバとして作用するなど)に、または、ミドルウェアコンポーネントを含むコンピューティングシステム(アプリケーションサーバなど)に、または、フロントエンドコンポーネントを含むコンピューティングシステム(図形ユーザインターフェース、またはネットワークブラウザを備えるユーザコンピュータなど、ユーザは、該図形ユーザインターフェース、または該ネットワークブラウザを通じてここに記載のシステムや技術に係る実施形態とイントラクションをすることができる)に、またはこのようなバックグランドコンポーネント、ミドルウェアコンポーネント、またはフロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムに実施されてもよい。任意の形、または媒体のデジタルデータ通信(通信ネットワークなど)を通じてシステムのコンポーネントを互いに接続することができる。通信ネットワークは、例示的に、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)やインターネットを含む。
コンピューティングシステムは、クライアントやサーバを含んでもよい。クライアントやサーバは、一般的に、互いに遠く離れており、通信ネットワークを通じてイントラクションをしている。対応するコンピュータでの実行、および、互いにクライアント・サーバという関係を有するコンピュータプログラムにより、クライアントとサーバとの関係を築き上げる。
理解すべきものとして、上記に示した様々な形のフローを使用し、ステップを改めて並べ替えたり、増加したり、又は削除したりすることができる。例えば、本願に記載の各ステップは、本願に開示された技術的解決手段による所望の結果さえ実現されれば、並行して実行されてもよく、順に沿って実行されてもよく、又は順番を乱して実行されてもよいから、本文は、ここで限定しない。
上記の具体的な実施形態は、本願の保護範囲に対する制限を構成しない。当業者であれば、設計要件やその他の要素に基づいた修正、組み合わせ、下位組み合わせや代替が可能であると理解するべきである。本願の精神や原則の範囲内に行われるすべての修正、同等置換や改善は、いずれも本願の保護範囲に含まれるべきである。

Claims (19)

  1. 目標内容の確定方法であって、
    検索情報に基づいて確定される文章の段落を複数の文に分割し、そして、前記文の属性に基づいて文間の関係を確定することと、
    前記文間の関係に基づいて前記文ごとに対応する文表現を確定することと、
    前記文の文表現及び前記検索情報に基づいて目標文を確定し、そして、前記目標文に基づいて目標内容を確定することと、を含むことを特徴とする、目標内容の確定方法。
  2. 前記文の属性に基づいて文間の関係を確定することは、
    文に含まれているエンティティを取得することと、
    前記文間の対応するエンティティの重畳度に基づき、前記文間の第1の関係を確定することと、を含むことを特徴とする、請求項1に記載の方法。
  3. 前記文の属性に基づいて文間の関係を確定することは、
    前記文章の段落における前記文の位置番号を確定し、そして、前記位置番号に基づいて前記文間の第2の関係を確定することを含むことを特徴とする、請求項1に記載の方法。
  4. 前記文の属性に基づいて文間の関係を確定することは、
    前記文ごとに対応する文ベクトルを確定し、そして、前記文ベクトルに基づいて文間の第3の関係を確定することを含むことを特徴とする、請求項1に記載の方法。
  5. 前記文の属性に基づいて文間の関係を確定することは、
    プリセットのルールに基づいて前記文間の影響重みを確定し、そして、前記文に対応する前記影響重みに基づいて前記文に対する他の文の注意力を確定することを含むことを特徴とする、請求項1に記載の方法。
  6. 前記文間の関係に基づいて前記文ごとに対応する文表現を確定することは、
    前記文間の関係に基づいて前記関係に対応する関係図を確定することと、
    プリセットのニューラルネットワークによって前記関係図において前記文ごとの文表現を確定することと、を含むことを特徴とする、請求項1〜請求項5のいずれか1項に記載の方法。
  7. 前記関係図の数が1よりも大きい場合、
    プリセットのニューラルネットワークによって前記関係図において前記文ごとの文表現を確定した後に、前記方法は、
    前記文に対応する文表現を接ぎ合わせ、前記文に対応する完全な表現を得ることをさらに含むことを特徴とする、請求項6に記載の方法。
  8. 前記文の文表現や前記検索情報に基づいて目標文を確定することは、
    前記文表現や前記検索情報に基づいてマッチング度を確定することと、
    マッチング度合いが上位である、プリセットの数の文を目標文として確定することと、を含むことを特徴とする、請求項1に記載の方法。
  9. 目標内容の確定装置であって、
    検索情報に基づいて確定される文章の段落を複数の文に分割し、そして、前記文の属性に基づいて文間の関係を確定するための分割モジュールと、
    前記文間の関係に基づいて前記文ごとに対応する文表現を確定するための表現確定モジュールと、
    前記文の文表現や前記検索情報に基づいて目標文を確定し、そして、前記目標文に基づいて目標内容を確定するための目標確定モジュールと、を含むことを特徴とする、目標内容の確定装置。
  10. 前記分割モジュールは、
    文に含まれているエンティティを取得すること、及び
    前記文間の対応するエンティティの重畳度に基づき、前記文間の第1の関係を確定すること、に用いられる第1の関係確定ユニットを含むことを特徴とする、請求項9に記載の装置。
  11. 前記分割モジュールは、
    前記文章の段落における前記文の位置番号を確定し、そして、前記位置番号に基づいて前記文間の第2の関係を確定するための第2の関係確定ユニットを含むことを特徴とする、請求項9に記載の装置。
  12. 前記分割モジュールは、
    前記文ごとに対応する文ベクトルを確定し、そして、前記文ベクトルに基づいて文間の第3の関係を確定するための第3の関係確定ユニットを含むことを特徴とする、請求項9に記載の装置。
  13. 前記分割モジュールは、
    プリセットのルールに基づいて前記文間の影響重みを確定し、そして、前記文に対応する前記影響重みに基づいて前記文に対する他の文の注意力を確定するための第4の関係確定ユニットを含むことを特徴とする、請求項9に記載の装置。
  14. 前記表現確定モジュールは、
    前記文間の関係に基づいて前記関係に対応する関係図を確定するためのグラフ確定ユニットと、
    プリセットのニューラルネットワークによって前記関係図において前記文ごとの文表現を確定するための表現確定ユニットと、を含むことを特徴とする、請求項9〜請求項13のいずれか1項に記載の装置。
  15. 前記関係図の数が1よりも大きい場合、
    前記表現確定モジュールは、表現確定ユニットがプリセットのニューラルネットワークによって前記関係図において前記文ごとの文表現を確定した後に、
    前記文に対応する文表現を接ぎ合わせ、前記文に対応する完全な表現を得るための接ぎ合わせユニットをさらに含むことを特徴とする、請求項14に記載の装置。
  16. 前記目標確定モジュールは、
    前記文表現や前記検索情報に基づいてマッチング度を確定すること、及び
    マッチング度合いが上位である、プリセットの数の文を目標文として確定すること、に用いられることを特徴とする、請求項9に記載の装置。
  17. 電子機器であって、
    少なくとも1つのプロセッサ、および
    前記少なくとも1つのプロセッサと通信的に接続されるメモリを含み、
    前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶されており、前記命令が前記少なくとも1つのプロセッサによって実行されることにより、前記少なくとも1つのプロセッサに、請求項1〜請求項8のいずれか1項に記載の方法を実行させることができることを特徴とする、電子機器。
  18. コンピュータ命令を記憶している非一時的なコンピュータ可読記憶媒体であって、前記コンピュータ命令は、コンピュータに請求項1〜請求項8のいずれか1項に記載の方法を実行させるためのものであることを特徴とする、非一時的なコンピュータ可読記憶媒体。
  19. コンピュータプログラムであって、前記コンピュータプログラムがプロセッサで実行されると、請求項1〜請求項8のいずれか1項に記載の方法を実行させることを特徴とする、コンピュータプログラム。
JP2021002847A 2020-01-09 2021-01-12 目標内容の確定方法、装置、機器及びコンピュータ可読記憶媒体 Active JP7139028B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010023642.9 2020-01-09
CN202010023642.9A CN111241242B (zh) 2020-01-09 2020-01-09 目标内容的确定方法、装置、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
JP2021082306A true JP2021082306A (ja) 2021-05-27
JP7139028B2 JP7139028B2 (ja) 2022-09-20

Family

ID=70864970

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021002847A Active JP7139028B2 (ja) 2020-01-09 2021-01-12 目標内容の確定方法、装置、機器及びコンピュータ可読記憶媒体

Country Status (5)

Country Link
US (1) US20210191961A1 (ja)
EP (1) EP3822820A1 (ja)
JP (1) JP7139028B2 (ja)
KR (1) KR102468342B1 (ja)
CN (1) CN111241242B (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113204629A (zh) * 2021-05-31 2021-08-03 平安科技(深圳)有限公司 文本匹配方法、装置、计算机设备及可读存储介质
CN113590745B (zh) * 2021-06-30 2023-10-10 中山大学 一种可解释的文本推断方法
CN113268581B (zh) * 2021-07-20 2021-10-08 北京世纪好未来教育科技有限公司 题目生成方法和装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10254883A (ja) * 1997-03-10 1998-09-25 Mitsubishi Electric Corp 文書自動分類方法
JPH11272680A (ja) * 1998-03-19 1999-10-08 Fujitsu Ltd 文書データ提供装置およびそのプログラム記録媒体
JP2000105769A (ja) * 1998-09-28 2000-04-11 Hitachi Ltd 文書表示方法
JP2002334070A (ja) * 2001-05-10 2002-11-22 Sony Corp 文書処理装置、文書処理方法および文書処理プログラム、ならびに、記録媒体
JP2012003697A (ja) * 2010-06-21 2012-01-05 Ricoh Co Ltd スニペット生成方法、スニペット生成装置、スニペット生成プログラムおよび記録媒体
CN102789452A (zh) * 2011-05-16 2012-11-21 株式会社日立制作所 类似内容提取方法
JP2016207141A (ja) * 2015-04-28 2016-12-08 ヤフー株式会社 要約生成装置、要約生成方法、及び要約生成プログラム
CN108763529A (zh) * 2018-05-31 2018-11-06 苏州大学 一种智能检索方法、装置和计算机可读存储介质
US20190129942A1 (en) * 2017-10-30 2019-05-02 Northern Light Group, Llc Methods and systems for automatically generating reports from search results

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05174019A (ja) * 1991-12-20 1993-07-13 Mitsubishi Electric Corp 文章評価システム
US7293175B2 (en) * 2000-06-29 2007-11-06 Lockheed Martin Corporation Automatic information sanitizer
US7587309B1 (en) * 2003-12-01 2009-09-08 Google, Inc. System and method for providing text summarization for use in web-based content
JP2007011973A (ja) * 2005-07-04 2007-01-18 Sharp Corp 情報検索装置及び情報検索プログラム
US20110238663A1 (en) * 2008-01-10 2011-09-29 Qin Zhang Search method and system using thinking system
JP2007188225A (ja) * 2006-01-12 2007-07-26 Yafoo Japan Corp 要約文抽出システム
US9218414B2 (en) * 2007-02-06 2015-12-22 Dmitri Soubbotin System, method, and user interface for a search engine based on multi-document summarization
US20090083026A1 (en) * 2007-09-24 2009-03-26 Microsoft Corporation Summarizing document with marked points
CN101452470B (zh) * 2007-10-18 2012-06-06 广州索答信息科技有限公司 摘要式网络搜索引擎系统及其搜索方法与应用
US20100287162A1 (en) * 2008-03-28 2010-11-11 Sanika Shirwadkar method and system for text summarization and summary based query answering
US8271502B2 (en) * 2009-06-26 2012-09-18 Microsoft Corporation Presenting multiple document summarization with search results
CN102411621B (zh) * 2011-11-22 2014-01-08 华中师范大学 一种基于云模型的中文面向查询的多文档自动文摘方法
CN107870964B (zh) * 2017-07-28 2021-04-09 北京中科汇联科技股份有限公司 一种应用于答案融合系统的语句排序方法及系统
CN107783960B (zh) * 2017-10-23 2021-07-23 百度在线网络技术(北京)有限公司 用于抽取信息的方法、装置和设备
CN108628833B (zh) * 2018-05-11 2021-01-22 北京三快在线科技有限公司 原创内容摘要确定方法及装置,原创内容推荐方法及装置
US10902350B2 (en) * 2018-07-20 2021-01-26 Verizon Media Inc. System and method for relationship identification
CN109284357B (zh) * 2018-08-29 2022-07-19 腾讯科技(深圳)有限公司 人机对话方法、装置、电子设备及计算机可读介质
CN110598078B (zh) * 2019-09-11 2022-09-30 京东科技控股股份有限公司 数据检索方法及装置、计算机可读存储介质、电子设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10254883A (ja) * 1997-03-10 1998-09-25 Mitsubishi Electric Corp 文書自動分類方法
JPH11272680A (ja) * 1998-03-19 1999-10-08 Fujitsu Ltd 文書データ提供装置およびそのプログラム記録媒体
JP2000105769A (ja) * 1998-09-28 2000-04-11 Hitachi Ltd 文書表示方法
JP2002334070A (ja) * 2001-05-10 2002-11-22 Sony Corp 文書処理装置、文書処理方法および文書処理プログラム、ならびに、記録媒体
JP2012003697A (ja) * 2010-06-21 2012-01-05 Ricoh Co Ltd スニペット生成方法、スニペット生成装置、スニペット生成プログラムおよび記録媒体
CN102789452A (zh) * 2011-05-16 2012-11-21 株式会社日立制作所 类似内容提取方法
JP2016207141A (ja) * 2015-04-28 2016-12-08 ヤフー株式会社 要約生成装置、要約生成方法、及び要約生成プログラム
US20190129942A1 (en) * 2017-10-30 2019-05-02 Northern Light Group, Llc Methods and systems for automatically generating reports from search results
CN108763529A (zh) * 2018-05-31 2018-11-06 苏州大学 一种智能检索方法、装置和计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
亀田 雅之: "段落間及び文間関連度を利用した段落シフト法に基づく重要文抽出", 情報処理学会研究報告, vol. 第97巻第86号, JPN6012058461, 12 September 1997 (1997-09-12), JP, pages 59 - 66, ISSN: 0004768693 *

Also Published As

Publication number Publication date
US20210191961A1 (en) 2021-06-24
CN111241242B (zh) 2023-05-30
KR102468342B1 (ko) 2022-11-17
EP3822820A1 (en) 2021-05-19
JP7139028B2 (ja) 2022-09-20
CN111241242A (zh) 2020-06-05
KR20210038441A (ko) 2021-04-07

Similar Documents

Publication Publication Date Title
JP7317791B2 (ja) エンティティ・リンキング方法、装置、機器、及び記憶媒体
US11200269B2 (en) Method and system for highlighting answer phrases
CN111125335B (zh) 问答处理方法、装置、电子设备和存储介质
KR102565659B1 (ko) 정보 생성 방법 및 장치
KR20210038449A (ko) 문답 처리, 언어 모델 훈련 방법, 장치, 기기 및 저장 매체
TWI464605B (zh) 由電腦實施的方法以及輸入方法編輯器伺服器
JP7108675B2 (ja) 意味マッチング方法、装置、電子機器、記憶媒体及びコンピュータプログラム
US9043300B2 (en) Input method editor integration
JP2021082306A (ja) 目標内容の確定方法、装置、機器及びコンピュータ可読記憶媒体
JP7412382B2 (ja) イベント抽出方法、イベント抽出装置、電子デバイス、記憶媒体及びコンピュータプログラム製品
US20210200813A1 (en) Human-machine interaction method, electronic device, and storage medium
JP2022050379A (ja) 意味検索方法、装置、電子機器、記憶媒体およびコンピュータプログラム
KR20210040329A (ko) 비디오 태그의 생성 방법, 장치, 전자 기기 및 저장 매체
US9460081B1 (en) Transcription correction using multi-token structures
CN115082602B (zh) 生成数字人的方法、模型的训练方法、装置、设备和介质
JP7093825B2 (ja) マンマシン対話方法、装置、及び機器
EP3832492A1 (en) Method and apparatus for recommending voice packet, electronic device, and storage medium
JP2021099890A (ja) 因果関係の判別方法、装置、電子機器及び記憶媒体
US11704326B2 (en) Generalization processing method, apparatus, device and computer storage medium
CN111966781B (zh) 数据查询的交互方法及装置、电子设备和存储介质
US10503818B2 (en) Content authoring inline commands
CN111984775A (zh) 问答质量确定方法、装置、设备和存储介质
CN111708800A (zh) 查询方法、装置及电子设备
US20210312308A1 (en) Method for determining answer of question, computing device and storage medium
CN111291184B (zh) 表情的推荐方法、装置、设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210202

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220325

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220510

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220809

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220823

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220905

R150 Certificate of patent or registration of utility model

Ref document number: 7139028

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150