JP2021111415A

JP2021111415A - テキストテーマ生成方法、テキストテーマ生成装置、電子機器、記憶媒体およびコンピュータプログラム

Info

Publication number: JP2021111415A
Application number: JP2021003994A
Authority: JP
Inventors: ツィジーリュウ，; Zhijie Liu; キーワン，; Qi Wang; ツィファンフェン，; Zhifan Feng; ヤンチャン，; Yan Zhang; ヨンチュウ，; Yong Zhu
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-01-14
Filing date: 2021-01-14
Publication date: 2021-08-02
Anticipated expiration: 2041-01-14
Also published as: EP3851975A1; KR102451496B1; US20210216580A1; KR20210092142A; CN111241282B; CN111241282A; JP7118184B2

Abstract

【課題】テキストに対するテーマを生成するテキストテーマ生成方法及びテキストテーマ生成装置を提供する。【解決手段】テキストテーマ生成方法は、処理すべきテキストに含まれる各エンティティを取得するステップ１０１と、エンティティリンクにより、知識グラフでの、各エンティティに対応する候補エンティティを決定するステップ１０２と、候補エンティティをクラスタリングし、コアエンティティセットを決定するステップ１０３と、処理すべきテキスト中の各キーワードのそれぞれと予め設定されたテーマグラフでの各参照テーマとのマッチング度に基づいて、各候補テーマを決定するステップ１０４と、コアエンティティセットにおける各コアエンティティと処理すべきテキストとの関連性及び各候補テーマと処理すべきテキストとの関連性に基づいて、コアエンティティセット及び各候補テーマから処理すべきテキストのテーマを取得するステップ１０５と、を含む。【選択図】図１

Description

本出願は、コンピュータ技術分野に関し、特にスマート検索技術分野に関し、テキストテーマ生成方法、テキストテーマ生成装置、電子機器、記憶媒体およびコンピュータプログラムを提供する。

関連技術では、通常、潜在的ディリクレ配分法（ＬａｔｅｎｔＤｉｒｉｃｈｌｅｔＡｌｌｏｃａｔｉｏｎ、ＬＤＡと略記）モデルを介してテキストを分析し、テキストのテーマを決定する。ＬＤＡテーマ生成モデルは、三層ベイズ確率モデルとも呼ばれ、単語、テーマ及びドキュメントといった三層の構造を含み、大規模なドキュメントセットまたはコーパスにおける潜在的なテーマ情報を認識するために用いられる。ＬＤＡは、単語の袋モデルを基に、テキスト中の単語の分布状況及び単語のテーマ分布状況を分析し、テキストテーマを決定する。

しかしながら、このようなテキストテーマの決定方式は、長いテキストデータに適合し、短いテキストの場合、精度が低い。

本出願に係るテキストテーマ生成方法、テキストテーマ生成装置、電子機器、記憶媒体およびコンピュータプログラムは、関連技術では、ＬＤＡモデルでテキストテーマを決定する方式が、長いテキストデータに適合し、短いテキストの場合、精度が低いという課題を解決するために用いられる。

本出願の１つの態様の実施例に係るテキストテーマ生成方法は、処理すべきテキストに対してエンティティマイニングを行い、処理すべきテキストに含まれる各エンティティを取得するステップと、エンティティリンクにより、知識グラフでの、前記処理すべきテキストに含まれる各エンティティにそれぞれ対応する各候補エンティティを決定するステップと、各候補エンティティと前記知識グラフでの他のエンティティとの関連性に基づいて、各候補エンティティをクラスタリングし、前記処理すべきテキストに対応するコアエンティティセットを決定するステップと、前記処理すべきテキスト中の各キーワードのそれぞれと予め設定されたテーマグラフでの各参照テーマとのマッチング度に基づいて、前記処理すべきテキストに含まれる各候補テーマを決定するステップと、前記コアエンティティセットにおける各コアエンティティと前記処理すべきテキストとの関連性、及び各候補テーマと前記処理すべきテキストとの関連性に基づいて、前記コアエンティティセット及び前記各候補テーマから前記処理すべきテキストのテーマを取得するステップと、を含む。

本出願の別の実施例に係るテキストテーマ生成装置は、処理すべきテキストに対してエンティティマイニングを行い、処理すべきテキストに含まれる各エンティティを取得するための第１の取得モジュールと、エンティティリンクにより、知識グラフでの、前記処理すべきテキストに含まれる各エンティティにそれぞれ対応する各候補エンティティを決定するための第１の決定モジュールと、各候補エンティティと前記知識グラフでの他のエンティティとの関連性に基づいて、各候補エンティティをクラスタリングし、前記処理すべきテキストに対応するコアエンティティセットを決定するための第２の決定モジュールと、前記処理すべきテキスト中の各キーワードのそれぞれと予め設定されたテーマグラフでの各参照テーマとのマッチング度に基づいて、前記処理すべきテキストに含まれる各候補テーマを決定するための第３の決定モジュールと、前記コアエンティティセットにおける各コアエンティティと前記処理すべきテキストとの関連性、及び各候補テーマと前記処理すべきテキストとの関連性に基づいて、前記コアエンティティセット及び前記各候補テーマから前記処理すべきテキストのテーマを取得するための第２の取得モジュールと、を備える。

本出願の他の態様の実施例に係る電子機器は、少なくとも１つのプロセッサと、前記少なくとも１つのプロセッサに通信接続されるメモリと、を備え、前記メモリには前記少なくとも１つのプロセッサによって実行可能な命令が記憶されており、前記命令は前記少なくとも１つのプロセッサが以上に記載のテキストテーマ生成方法を実行できるように、前記少なくとも１つのプロセッサによって実行される。

本出願の他の態様の実施例に係る、コンピュータ命令を記憶する非一時的なコンピュータ読み取り可能な記憶媒体であって、前記コンピュータ命令は、前記コンピュータに以上に記載のテキストテーマ生成方法を実行させるために用いられる、ことを特徴とする。

上記出願のいずれかの実施例は、以下の利点または有益な効果を有する。知識グラフ及びテーマグラフ情報を融合することで、短いテキストの情報及び候補テーマを拡張して、より多くの隠在的なテーマ情報をマイニングし、テキストテーマの生成精度を向上させる。エンティティリンクにより、知識グラフでの、それぞれ処理すべきテキストに含まれる各エンティティに対応する各候補エンティティを決定し、各候補エンティティと知識グラフでの他のエンティティとの関連性に基づいて、各候補エンティティをクラスタリングし、処理すべきテキストに対応するコアエンティティセットを決定し、この後、処理すべきテキスト中の各キーワードのそれぞれと予め設定されたテーマグラフでの各参照テーマとのマッチング度に基づいて、処理すべきテキストに含まれる各候補テーマを決定し、さらにコアエンティティセットにおける各コアエンティティと処理すべきテキストとの関連性、及び各候補テーマと処理すべきテキストとの関連性に基づいて、コアエンティティセット及び各候補テーマから、処理すべきテキストのテーマを取得するという技術手段を用いることにより、ＬＤＡモデルでテキストテーマを決定する方式では、短いテキストの場合、精度が低いという課題を解消し、さらに、短いテキスト情報及び候補テーマを拡張することで、より多くの隠在的なテーマ情報をマイニングし、テキストテーマの生成精度を向上させるという技術的効果を実現する。

上記選択可能な形態が持っている他の効果について、具体的な実施例を参照しながら以下に説明する。

図面は、本技術案がよりよく理解されるためのものであり、本出願を限定するものではない。
本出願の実施例に係るテキストテーマ生成方法の概略フローチャートである。本出願の実施例に係る各候補エンティティを含む関連性ネットワークの概略図である。本出願の実施例に係る二項分類ネットワークモデルのネットワーク概略構成図である。本出願の実施例に係る他のテキストテーマ生成方法の概略フローチャートである。本出願の実施例に係る他のテキストテーマ生成方法の概略フローチャートである。本出願の実施例に係る他のテキストテーマ生成方法の概略フローチャートである。本出願の実施例に係るテキストテーマ生成装置の概略構成図である。本出願の実施例に係る電子機器の概略構成図である。

以下、図面を参照して本出願の例示的な実施例を説明し、理解を容易にするためにその中には本出願の実施例の様々な詳細を含んでおり、それらは単なる例示するものと見なされるべきである。したがって、当業者は、本出願の範囲及び趣旨から逸脱することなく、ここで説明される実施例に対して様々な変更や修正を行うことができることを理解すべきである。同様に、明確及び簡潔にするために、以下の説明では、周知の機能及び構成の説明を省略する。

本出願の実施例は、関連技術で、ＬＤＡモデルでテキストテーマを決定する方式が長いテキストデータに適合し、短いテキストの場合、精度が低いという課題に対して、テキストテーマ生成方法を提供する。

以下、図面を参照して、本出願に係るテキストテーマ生成方法、装置、電子機器及び記憶媒体について詳細に説明する。

以下、図１を参照しながら、本出願の実施例に係るテキストテーマ生成方法について詳細に説明する。

図１は、本出願の実施例に係るテキストテーマ生成方法の概略フローチャートである。

図１に示すように、該テキストテーマ生成方法は、以下のステップを含む。

ステップ１０１：処理すべきテキストに対してエンティティマイニングを行い、処理すべきテキストに含まれる各エンティティを取得する。

処理すべきテキストとは、現在処理する必要があるテキストデータであり、短い文、ヘッダーなどの短いテキストであってもよく、文章などの長いテキストであってもよく、本出願の実施例は、これについて限定しない。

なお、処理すべきテキストは、任意のテキストデータであってもよい。実際の使用では、本出願の実施例のテキストテーマ生成方法の応用シナリオが異なり、処理すべきテキストの取得方式及びタイプも異なってもよい。例えば、本出願の実施例のテキストテーマ生成方法が検索システムに応用されると、処理すべきテキストは、ユーザにより入力される検索単語、システムにおいて分類するまたはテーマを決定する必要があるネットワークリソースなどであってもよい。

本出願の実施例では、処理すべきテキストに対してエンティティマイニングを行い、まず処理すべきテキストに対して単語分割処理を行って、処理すべきテキストに含まれる各分割された単語を決定し、さらに処理すべきテキストに含まれる各分割された単語に対して１つずつ認識処理を行い、処理すべきテキストに含まれる各分割された単語が知識グラフに含まれるエンティティであるか否かを判断し、知識グラフに含まれるエンティティであれば、該分割された単語を処理すべきテキストに含まれるエンティティとして決定し、そうでなければ、該分割された単語を捨てる。

任意選択的には、処理すべきテキストに含まれる単語分割に対して認識処理を行うことは、処理すべきテキスト中の各分割された単語の品詞性を認識し、さらに各分割された単語の品詞性に基づいて、各分割された単語がエンティティであるか否かを決定することであってもよい。具体的には、品詞性が名詞である分割された単語を、処理すべきテキストに含まれるエンティティとして決定することができる。例えば、人物、時間、地点、物の名称、作品の名称、動植物の名称などは、すべて、処理すべきテキストに含まれるエンティティとして決定することができる。

例としては、処理すべきテキストが「番組『楚喬伝』最終回放送趙麗穎及び林更新が主演するスパイの戦争容貌及び演技で人気上がり」であり、処理すべきテキストに対して単語分割処理を行い、処理すべきテキストに含まれる各分割された単語が「番組、楚喬伝、最終回、放送、趙麗穎、林更新、主演、スパイの戦争、容貌、演技、人気上がり」であってもよいと決定することができ、さらに各分割された単語の品詞性に基づいて、処理すべきテキストに含まれるエンティティが「番組、楚喬伝、最終回、趙麗穎、林更新、容貌、演技」であってもよいと決定することができる。

なお、上記例は、例示的なものにすぎず、本出願を制限するものとしてはいけない。実際の使用では、実際の需要及び具体的な応用シナリオに基づいて、処理すべきテキストに含まれるエンティティの決定方式を選択することができ、本出願の実施例は、これについて限定しない。

ステップ１０２：エンティティリンクにより、知識グラフでの、それぞれ処理すべきテキストに含まれる各エンティティに対応する各候補エンティティを決定する。

知識グラフは、人工知能技術の重要な構成部分であり、世界中の概念、エンティティ及びそれらの間の関係を構造化の方式で客観的に記述するものである。知識グラフ技術は、インターネットの大量の情報をよりよく組織、管理及び理解する能力を提供し、インターネットの情報を人間が認知する世界に近い形態として表現する。従って、意味処理能力及び開放型相互接続能力を有する知識ベースを構築し、スマート検索、スマートＱ＆Ａ、パーソナライズプッシュなどのスマート情報サービスにおいて応用価値を生じることができる。本出願の実施例の知識グラフは、汎用知識グラフであってもよく、特定の応用ニーズに応じてあらかじめ構築されるものであってもよく、本出願の実施例の知識グラフでの各エンティティは、すべて、唯一のエンティティアイデンティティコード（Ｉｄｅｎｔｉｔｙ、ＩＤと略記）を有し、それにより、エンティティＩＤに基づいて知識グラフでのエンティティを認識することができる。

エンティティリンクとは、決定処理すべきテキストに含まれる各エンティティを知識グラフにおいてエンティティＩＤに対応させる過程である。

候補エンティティとは、処理すべきテキストに含まれた、知識グラフに存在する対応するエンティティＩＤのエンティティである。

本出願の実施例では、処理すべきテキストに含まれる各エンティティを決定した後、豊かな知識グラフデータを活用し、知識強化技術を利用して認識モデルを訓練し、処理すべきテキストに含まれる各エンティティに対して認識処理を行って、知識グラフには処理すべきテキストに含まれる各エンティティが含まれるか否かを判断し、知識グラフにあるエンティティが含まれると、処理すべきテキストのコンテキストに基づいて該エンティティのエンティティＩＤを取得し、すなわち、該エンティティを知識グラフでの唯一のエンティティＩＤにリンクすることにより、処理すべきテキストに含まれる各エンティティに対応する各候補エンティティを決定する。

例としては、処理すべきテキストが「アップル（登録商標）携帯電話」であると、処理すべきテキストに含まれるエンティティ「アップル」（登録商標）に対して、エンティティリンクにより、該エンティティに対応するエンティティＩＤが「アイフォーン」（登録商標）という携帯電話ブランドに対応するエンティティＩＤであり、果物「アップル」に対応するエンティティＩＤではないと決定することができる。

別の例として、処理すべきテキストが「番組『楚喬伝』最終回放送趙麗穎及び林更新が主演するスパイの戦争容貌及び演技で人気上がり」であり、処理すべきテキストに含まれる各エンティティが「番組、楚喬伝、最終回、趙麗穎、林更新、容貌、演技」であり、エンティティリンクにより、知識グラフに含まれていない一部のエンティティを除去し、知識グラフに含まれる各エンティティに対応するエンティティＩＤを決定することができ、最終的に決定された各候補エンティティが「楚喬伝、趙麗穎、林更新」である。

ステップ１０３：各候補エンティティと知識グラフでの他のエンティティとの関連性に基づいて、各候補エンティティをクラスタリングし、処理すべきテキストに対応するコアエンティティセットを決定する。

コアエンティティセットとは、処理すべきテキストに対応する各候補エンティティから選択された、処理すべきテキストのキー情報をある程度まで概括できるエンティティセットである。

なお、知識グラフでの各エンティティは、独立して存在するものではなく、すべて関連する１つまたは複数のエンティティがあり、知識グラフを大量の「エンティティ−関係−エンティティ」トリプルを含む知識ベースと見なすことができる。

本出願の実施例では、処理すべきテキストに対応する候補エンティティが複数ある可能性があるが、候補エンティティが多い場合、すべてのエンティティが処理すべきテキストのキー情報を表現できるというわけではなく、それにより、各候補エンティティと知識グラフでの他のエンティティとの関連性に基づいて、冗長な候補エンティティを除去し、処理すべきテキストのキー情報を概括できるエンティティを、処理すべきテキストに対応するコアエンティティセットとして構成することができる。

具体的には、各候補エンティティと知識グラフでの他のエンティティとの関連性に基づいて、各候補エンティティを含む関連性ネットワークを構築し、さらに構築された関連性ネットワークに基づいて、処理すべきテキストに対応するコアエンティティセットを決定することができる。すなわち、本出願の実施例の１つの可能な実現形態では、上記ステップ１０３は、各候補エンティティと知識グラフでの他のエンティティとの関連性に基づいて、各候補エンティティを含む関連性ネットワークを構築するステップであって、関連性ネットワークにおける各ノードが１つの候補エンティティに対応し、２つのノード間のエッジの方向が２つのノード間の階層関係を特徴付けるステップと、各候補エンティティ間のエッジの方向に基づいて、各候補エンティティをクラスタリングし、処理すべきテキストに対応するコアエンティティセットを決定するステップと、を含むことができる。

本出願の実施例では、各候補エンティティを含む関連性ネットワークを構築するとき、関連性ネットワークにおける１つのノードで１つの候補エンティティを特徴付け、関連性ネットワークにおける２つのノード間のエッジで、２つのノード間が関連性を有することを特徴付け、２つのノード間のエッジの方向で２つのノード間の階層関係を特徴付けすることができる。任意選択的には、関連性を有する２つのノードの場合、この２つのノード間のエッジの方向の指すノードを上層ノードとすることができ、すなわち、エッジの方向の指すノードの階層が他のノードの階層より高い。

例としては、知識グラフでの各エンティティ間の関連性に基づいて、エンティティの「ヤオミン」とエンティティの「ロケッツ」とが関連性を有し、かつ構築される関連性ネットワークにおいて、エンティティ「ヤオミン」に対応するノードとエンティティ「ロケッツ」に対応するノードとの間のエッジの方向がエンティティ「ロケッツ」に対応するノードへ指し、エンティティ「ロケッツ」の階層が「ヤオミン」の階層より高いと決定することができる。

１つの可能な実現形態としては、各候補エンティティを含む関連性ネットワークに基づいて各候補エンティティをクラスタリングするとき、関連性ネットワークにおける階層が最も高い各候補エンティティをコアエンティティとして決定して、処理すべきテキストに対応するコアエンティティセットを構成することができる。

例としては、処理すべきテキストに対応する各候補エンティティが「楚喬伝、趙麗穎、林更新」であり、趙麗穎と林更新が番組『楚喬伝』に出演する俳優であり、それにより、各候補エンティティと知識グラフでの他のエンティティとの関連性に基づいて構築される関連性ネットワークは、図２に示され、候補エンティティ『楚喬伝』に対応するノードは、関連性ネットワークにおける階層が最も高いノードであり、それにより、処理すべきテキストに対応するコアエンティティセットが『楚喬伝』であると決定することができる。

ステップ１０４：処理すべきテキスト中の各キーワードのそれぞれと予め設定されたテーマグラフでの各参照テーマとのマッチング度に基づいて、処理すべきテキストに含まれる各候補テーマを決定する。

処理すべきテキスト中の各キーワードとは、処理すべきテキストに対して単語分割処理を行った後、処理すべきテキストに含まれる各分割された単語から選択された、処理すべきテキストのキー情報を表現できる分割された単語を意味する。例えば、処理すべきテキスト「番組『楚喬伝』最終回放送趙麗穎及び林更新が主演するスパイの戦争容貌及び演技で人気上がり」のキーワードが「楚喬伝、最終回放送、趙麗穎、林更新」を含んでもよい。本出願の実施例では、キーワードマッチング技術で処理すべきテキスト中の各キーワードを決定してもよい。

予め設定されたテーマグラフとは、あらかじめ構築された、テーマ及び各テーマ間の階層関係を含む知識ベースである。任意選択的には、予め設定されたテーマグラフは、インターネットにおける大量のデータに基づいて構築される汎用テーマグラフであってもよく、特定の応用シナリオに基づいて、該応用シナリオに関連する分野のデータで構築される専用テーマグラフであってもよい。

参照テーマとは、予め設定されたテーマグラフに含まれる各テーマである。

キーワードと参照テーマとのマッチング度は、キーワードの参照テーマ間の類似程度である。例えば、キーワードと参照テーマとのコサイン類似度をキーワードと参照テーマとのマッチング度として決定してもよく、本出願の実施例は、これについて限定しない。

処理すべきテキストに含まれる候補テーマとは、処理すべきテキスト中のキーワードとのマッチング度が予め設定された条件に一致する参照テーマである。任意選択的には、予め設定された条件は、「候補テーマと処理すべきテキスト中の少なくとも１つのキーワードとのマッチング度がマッチング度閾値より大きい」であってもよい。実際の使用では、実際需要に応じて、候補テーマが満たす必要がある予め設定された条件を選択してもよく、本出願の実施例は、これについて限定しない。

本出願の実施例では、知識グラフに基づいて、処理すべきテキストに含まれる隠在的なテーマ情報をマイニングすることができ、テキストテーマの生成精度をさらに向上させるために、さらに処理すべきテキストに含まれる各キーワードに基づいて、処理すべきテキストに顕在的に出現したテーマ情報をマイニングすることができる。従って、本出願の実施例では、さらに処理すべきテキストに含まれる各キーワードを取得し、各キーワードと予め設定されたテーマグラフでの各参照テーマとのマッチング度に基づいて、さらに各キーワードとのマッチング度が予め設定された条件に一致する参照テーマを処理すべきテキストに含まれる各候補テーマとして決定することができる。

例としては、予め設定された条件が「候補テーマと処理すべきテキスト中の少なくとも１つのキーワードとのマッチング度が０．９より大きい」であり、処理すべきテキストが「ビン南語歌陳百潭『甘い人生』人生を見返せば甘みがある」であり、キーワードマッチング技術により決定される処理すべきテキスト中のキーワードが「ビン南語歌、陳百潭」であり、それぞれキーワード「ビン南語歌」と予め設定されたテーマグラフでの各参照テーマとのマッチング度、及びキーワード「陳百潭」と予め設定されたテーマグラフでの各参照テーマとのマッチング度を計算し、さらにキーワード「ビン南語歌」と参照テーマ「ビン南語歌」とのマッチング度が１であり、テーマグラフにはキーワード「陳百潭」とのマッチング度が０．９より大きい参照テーマが存在しないと決定し、処理すべきテキストに含まれる候補テーマが「ビン南語歌」であると決定することができる。なお、「ビン南語歌」のビンは、もんがまえに「虫」である。

ステップ１０５：コアエンティティセットにおける各コアエンティティと処理すべきテキストとの関連性、及び各候補テーマと処理すべきテキストとの関連性に基づいて、コアエンティティセット及び各候補テーマから、処理すべきテキストのテーマを取得する。

コアエンティティと処理すべきテキストとの関連性は、文法、意味、コンテキストなどの面でのコアエンティティと処理すべきテキストとの関連度で判断することができる。

本出願の実施例では、処理すべきテキストに対応するコアエンティティセット及び処理すべきテキストに含まれる各候補テーマを決定した後、各コアエンティティと処理すべきテキストとの関連性、及び各候補テーマと処理すべきテキストとの関連性を決定し、さらに処理すべきテキストとの関連性が高いコアエンティティまたは候補テーマを処理すべきテキストのテーマとして決定することができる。

１つの可能な実現形態としては、分類モデルを予め訓練し、コアエンティティと処理すべきテキストとの関連性、及び候補テーマと処理すべきテキストとの関連性を決定してもよい。すなわち、本出願の実施例の１つの可能な実現形態では、上記ステップ１０５は、
知識グラフにおいて少なくとも２つの概念情報を含む第１のコアエンティティに対応する各概念情報及び処理すべきテキストに対して、予め設定された分類モデルを利用して、それぞれ符号化・復号化処理を行い、各概念情報と処理すべきテキストとの関連性を決定するステップと、第１のコアエンティティの各概念情報と処理すべきテキストとの関連性に基づいて、第１のコアエンティティと処理すべきテキストとの関連性を決定するステップと、第１のコアエンティティと処理すべきテキストとの関連性に基づいて、第１のコアエンティティが処理すべきテキストのテーマであるか否かを決定するステップと、を含むことができる。

予め設定された分類モデルとは、予め訓練された、入力された２種のテキスト情報の関連性を認識できるモデルである。例えば、予め設定された分類モデルは、二項分類ネットワークモデルであってもよく、モデルに入力された２種のテキスト情報の関連性を認識し、認識結果及び認識結果の信頼度を出力し、「０」、「１」という２種類の認識結果を出力でき、「０」は、モデルに入力された２種のテキスト情報が関連性を有さないことを表し、「１」は、モデルに入力された２種のテキスト情報が関連性を有することを表す。

第１のコアエンティティとは、コアエンティティセットにおける、少なくとも２つの概念情報を含むコアエンティティである。本出願の実施例では、知識グラフは、さらに、各エンティティに含まれる概念情報を含んでもよい。例えば、エンティティ『楚喬伝』に含まれる概念情報は、女性主役の努力伝奇時代劇、中国語番組、愛情番組、ストーリー番組を含んでもよい。

本出願の実施例では、複数の概念情報を含む第１のコアエンティティに対して、処理すべきテキスト及び第１のコアエンティティの各概念情報をそれぞれ予め設定された分類モデルに入力して、処理すべきテキストと各概念情報との関連性を決定し、さらに処理すべきテキストと各概念情報との関連性に基づいて、処理すべきテキストと第１のコアエンティティとの関連性を決定することができる。

具体的には、予め設定された分類モデルが二項分類ネットワークモデルである場合、第１のコアエンティティに関連性が「１」の概念情報が含まれると、処理すべきテキストと第１のコアエンティティとの関連性を「１」と決定し、すなわち、処理すべきテキストと第１のコアエンティティとの関連性を「関連あり」と決定することができ、第１のコアエンティティに含まれる各概念情報の関連性がいずれも「０」であると、処理すべきテキストと第１のコアエンティティとの関連性を「１」と決定し、すなわち、処理すべきテキストと第１のコアエンティティとの関連性を「非関連」と決定することができる。

任意選択的には、二項分類ネットワークモデルの出力が認識結果の信頼度を含み、さらに信頼度閾値を予め設定し、さらに処理すべきテキストと各概念情報との関連性及び信頼度閾値に基づいて、処理すべきテキストと第１のコアエンティティとの関連性を決定してもよい。例えば、第１のコアエンティティに処理すべきテキストとの関連性が「１」の概念情報が含まれ、かつ該概念情報の処理すべきテキストとの関連性が「１」であることの信頼度が信頼度閾値より大きい場合、処理すべきテキストと第１のコアエンティティとの関連性を「１」と決定し、すなわち、処理すべきテキストと第１のコアエンティティとの関連性を「関連あり」と決定することができる。

本出願の実施例では、第１のコアエンティティと処理すべきテキストとの関連性を「関連あり」と決定すると、第１のコアエンティティを処理すべきテキストのテーマとして決定することができ、第１のコアエンティティと処理すべきテキストとの関連性が「非関連」であると、第１のコアエンティティを捨てることができる。同様に、コアエンティティセットにおけるすべてのコアエンティティをトラバーサルするまで、予め設定された分類モデルを利用してコアエンティティセットにおける各コアエンティティと処理すべきテキストとの関連性を決定することができ、処理すべきテキストとすることが可能なすべてのテーマのコアエンティティを決定する。

例としては、予め設定された分類モデルが二項分類ネットワークモデルであり、図３に示すように、本出願の実施例に係る二項分類ネットワークモデルのネットワーク概略構成図であり、それから分かるように、二項分類ネットワークモデルは、入力層と、埋め込み層と、ネットワーク層と、活性化層と、出力層と、を備え、入力層は、２つの入力情報、すなわち、処理すべきテキストと第１のコアエンティティの１つの概念情報と、を含み、埋め込み層は、処理すべきテキスト中の単語と概念情報中の単語をそれぞれ意味及び文法情報を有する低次元ベクタ表現にマッピングし、特徴次元数を低下させ、長・短期記憶（ｌｏｎｇ−ｓｈｏｒｔｔｅｒｍｍｅｍｏｒｙ、ＬＳＴＭと略記）ネットワーク層は、処理すべきテキスト中のコンテキスト情報と概念情報中のコンテキスト情報を関連付け、処理すべきテキスト及び概念情報中の高次元情報表現を抽出し、活性化層は、処理すべき文のＬＳＴＭ出力と概念情報のＬＳＴＭ出力とを結合し、パラメータにより両者間の内部関係を取得し、関数をアクティブにした後に出力し、出力層の出力空間は、「０」、「１」という２つのタグを含み、「１」は、概念情報が処理すべきテキストと関連あることを表し、「０」は、概念情報が処理すべきテキストと関連ないことを表し、同時に認識結果の信頼度を出力する。

信頼度閾値が０．８であり、第１のコアエンティティが『楚喬伝』であり、知識グラフに含まれる第１のコアエンティティ『楚喬伝』の概念情報が「女性主役の努力伝奇時代劇、中国語番組、愛情番組、ストーリー番組」であると仮定すれば、各概念情報と処理すべきテキストを二項分類ネットワークモデルに入力し、概念情報「女性主役の努力伝奇時代劇」と処理すべきテキストとの関連性が「１」であり、信頼度が０．９であり、概念情報「中国語番組」と処理すべきテキストとの関連性が「１」であり、信頼度が０．７であり、概念情報「愛情番組」と処理すべきテキストとの関連性が「０」であり、信頼度が０．８であり、概念情報「ストーリー番組」と処理すべきテキストとの関連性が「０」であり、信頼度が０．９であると決定し、関連性が「１」でありかつ信頼度が信頼度閾値より大きい概念情報「女性主役の努力伝奇時代劇」が存在するため、第１のコアエンティティ『楚喬伝』と処理すべきテキストとの関連性を「関連あり」と決定することができ、それにより、『楚喬伝』を処理すべきテキストのテーマとして決定することができる。

同様に、処理すべきテキストに含まれる各候補テーマから、処理すべきテキストのテーマを取得するとき、同一の方法を用いて、各候補テーマを処理すべきテキストのテーマとすることができるか否かを決定してもよい。すなわち、予め設定された分類モデルを利用して処理すべきテキストと各候補テーマとの関連性を決定し、さらに処理すべきテキストとの関連性が「関連あり」の候補テーマを処理すべきテキストのテーマとして決定する。

本出願の実施例の技術案によれば、エンティティリンクにより、知識グラフでの、それぞれ処理すべきテキストに含まれる各エンティティに対応する各候補エンティティを決定し、各候補エンティティと知識グラフでの他のエンティティとの関連性に基づいて、各候補エンティティをクラスタリングし、処理すべきテキストに対応するコアエンティティセットを決定し、この後、処理すべきテキスト中の各キーワードのそれぞれと予め設定されたテーマグラフでの各参照テーマとのマッチング度に基づいて、処理すべきテキストに含まれる各候補テーマを決定し、さらにコアエンティティセットにおける各コアエンティティと処理すべきテキストとの関連性、及び各候補テーマと処理すべきテキストとの関連性に基づいて、コアエンティティセット及び各候補テーマから、処理すべきテキストのテーマを取得する。これによって、知識グラフ及びテーマグラフ情報を融合することで、短いテキスト情報及び候補テーマを拡張し、それにより、より多くの隠在的なテーマ情報をマイニングし、テキストテーマの生成精度を向上させる。

本出願の１つの可能な実現形態では、処理すべきテキスト中の隠在的なテーマ情報をさらにマイニングするために、処理すべきテキストのテーマ情報をナレッジグラによりフマイニングするとき、コアエンティティの概念情報を利用して処理すべきテキストのテーマを生成してもよく、テキストテーマの生成精度をさらに向上させる。

以下、図４を参照しながら、本出願の実施例に係るテキストテーマ生成方法についてさらに説明する。

図４は、本出願の実施例に係る他のテキストテーマ生成方法の概略フローチャートである。

図４に示すように、該テキストテーマ生成方法は、以下のステップを含む。

ステップ２０１：処理すべきテキストに対してエンティティマイニングを行い、処理すべきテキストに含まれる各エンティティを取得する。

ステップ２０２：エンティティリンクにより、知識グラフでの、それぞれ処理すべきテキストに含まれる各エンティティに対応する各候補エンティティを決定する。

ステップ２０３：各候補エンティティと知識グラフでの他のエンティティとの関連性に基づいて、各候補エンティティをクラスタリングし、処理すべきテキストに対応するコアエンティティセットを決定する。

ステップ２０４：処理すべきテキスト中の各キーワードのそれぞれと予め設定されたテーマグラフでの各参照テーマとのマッチング度に基づいて、処理すべきテキストに含まれる各候補テーマを決定する。

上記ステップ２０１〜２０４の具体的な実現過程及び原理については、上記実施例の詳細な説明を参照でき、ここで繰り返し説明しない。

ステップ２０５：予め設定された分類モデルを利用して、各コアエンティティの知識グラフでの各概念情報及び処理すべきテキストに対して符号化・復号化処理を行い、各コアエンティティの各概念情報と処理すべきテキストとの関連性を決定する。

本出願の実施例では、処理すべきテキストに含まれる隠在的なテーマを十分にマイニングし、テキストテーマの生成精度をさらに向上させるために、さらにコアエンティティの知識グラフでの概念情報を利用して処理すべきテキストのテーマを生成してもよい。具体的には、各コアエンティティの知識グラフでの各概念情報と処理すべきテキストとの関連性に基づいて、処理すべきテキストとする可能なテーマの概念情報を決定してもよい。

１つの可能な実現形態としては、各コアエンティティの知識グラフでの各概念情報と処理すべきテキストを予め設定された分類モデルに入力することで、予め設定された分類モデルが入力される概念情報及び処理すべきテキストに対して符号化・復号化処理を行い、それにより、各コアエンティティの知識グラフでの各概念情報と処理すべきテキストとの関連性を決定して出力してもよい。

例としては、予め設定された分類モデルが二項分類ネットワークモデルである場合、二項分類ネットワークモデルから出力される認識結果が「１」であると、概念情報と処理すべきテキストとの関連性を「関連あり」と決定することができ、二項分類ネットワークモデルから出力される認識結果が「０」であると、概念情報と処理すべきテキストとの関連性を「非関連」と決定することができる。

ステップ２０６：各コアエンティティの各概念情報と処理すべきテキストとの関連性に基づいて、各コアエンティティに対応する各概念情報から、処理すべきテキストのテーマを取得する。

本出願の実施例では、各コアエンティティの各概念情報と処理すべきテキストとの関連性を決定した後、処理すべきテキストとの関連性が高い概念情報を、処理すべきテキストのテーマとして決定してもよい。

任意選択的には、予め設定された分類モデルが関連性認識結果及び認識結果信頼度の両方を出力できる二項分類ネットワークモデルであると、さらに信頼度閾値を予め設定してもよく、各概念情報と処理すべきテキストとの関連性及び信頼度閾値に基づいて、関連性が「１」でありかつ信頼度が信頼度閾値より大きい概念情報を各概念情報から取得して、処理すべきテキストのテーマとする。

例としては、予め設定された分類モデルが二項分類ネットワークモデルであり、入力される２種のテキスト情報の関連性の認識結果及び認識結果の信頼度を出力することができ、信頼度閾値が０．８であり、処理すべきテキストに対応するコアエンティティセットが１つのコアエンティティ『楚喬伝』を含み、コアエンティティ『楚喬伝』の知識グラフでの概念情報が「女性主役の努力伝奇時代劇、中国語番組、愛情番組、ストーリー番組」であり、各概念情報と処理すべきテキストを二項分類ネットワークモデルに入力し、概念情報「女性主役の努力伝奇時代劇」と処理すべきテキストとの関連性が「１」であり、信頼度が０．９であり、概念情報「中国語番組」と処理すべきテキストとの関連性が「１」であり、信頼度が０．７であり、概念情報「愛情番組」と処理すべきテキストとの関連性が「０」であり、信頼度が０．８であり、概念情報「ストーリー番組」と処理すべきテキストとの関連性が「０」であり、信頼度が０．９であると決定し、概念情報「女性主役の努力伝奇時代劇」との関連性が１であり、かつ信頼度が信頼度閾値より大きいため、「女性主役の努力伝奇時代劇」を処理すべきテキストのテーマとすることができる。

なお、処理すべきテキストに含まれる各候補テーマから、処理すべきテキストのテーマを取得する具体的な実現過程及び原理については、上記実施例の詳細な説明を参照でき、ここで繰り返し説明しない。

本出願の実施例の技術案によれば、エンティティリンクにより、知識グラフでの、それぞれ処理すべきテキストに含まれる各エンティティに対応する各候補エンティティを決定し、各候補エンティティと知識グラフでの他のエンティティとの関連性に基づいて、各候補エンティティをクラスタリングし、処理すべきテキストに対応するコアエンティティセットを決定し、この後、処理すべきテキスト中の各キーワードのそれぞれと予め設定されたテーマグラフでの各参照テーマとのマッチング度に基づいて、処理すべきテキストに含まれる各候補テーマを決定し、さらに予め設定された分類モデルを利用して、各コアエンティティの各概念情報と処理すべきテキストとの関連性を決定して、各コアエンティティの各概念情報と処理すべきテキストとの関連性に基づいて、各コアエンティティに対応する各概念情報から、処理すべきテキストのテーマを取得する。これによって、知識グラフを融合することで、コアエンティティの知識グラフでの概念情報を利用して短いテキスト情報を拡張し、それにより、より多くの隠在的なテーマ情報をマイニングし、テキストテーマの生成精度をさらに向上させる。

本出願の１つの可能な実現形態では、処理すべきテキスト中の隠在的なテーマ情報をさらにマイニングするために、処理すべきテキストのテーマ情報をテーマグラフによりマイニングするとき、さらに候補テーマに対応する上位テーマを利用して処理すべきテキストのテーマを審査してもよく、テキストテーマの生成精度をさらに向上させる。

以下、図５を参照しながら、本出願の実施例に係るテキストテーマ生成方法についてさらに説明する。

図５は、本出願の実施例に係る再びテキストテーマ生成方法の概略フローチャートである。

図５に示すように、該テキストテーマ生成方法は、以下のステップを含む。

ステップ３０１：処理すべきテキストに対してエンティティマイニングを行い、処理すべきテキストに含まれる各エンティティを取得する。

ステップ３０２：エンティティリンクにより、知識グラフでの、それぞれ処理すべきテキストに含まれる各エンティティに対応する各候補エンティティを決定する。

ステップ３０３：各候補エンティティと知識グラフでの他のエンティティとの関連性に基づいて、各候補エンティティをクラスタリングし、処理すべきテキストに対応するコアエンティティセットを決定する。

ステップ３０４：処理すべきテキスト中の各キーワードのそれぞれと予め設定されたテーマグラフでの各参照テーマとのマッチング度に基づいて、処理すべきテキストに含まれる各候補テーマを決定する。

上記ステップ３０１〜３０４の具体的な実現過程及び原理については、上記実施例の詳細な説明を参照でき、ここで繰り返し説明しない。

ステップ３０５：予め設定されたテーマグラフから、各候補テーマに対応する上位テーマを処理すべきテキストに対応する拡張テーマとして抽出する。

本出願の実施例では、予め設定されたテーマグラフは、テーマ及び各テーマ間の階層関係を含んでもよい。従って、１つの可能な実現形態としては、処理すべきテキストに対応する各候補テーマを決定した後、各候補テーマの予め設定されたテーマグラフでの階層関係に基づいて、予め設定されたテーマグラフから各候補テーマの上位テーマを、処理すべきテキストの拡張テーマとして抽出して、処理すべきテキストの隠在的なテーマ情報を予め設定されたテーマグラフによりさらにマイニングし、テーマ生成精度を向上させる。

ステップ３０６：各拡張テーマと処理すべきテキストとの関連性に基づいて、拡張テーマから処理すべきテキストのテーマを取得する。

本出願の実施例では、処理すべきテキストに対応する各拡張テーマを決定した後、予め設定された分類モデルを利用して各拡張テーマと処理すべきテキストとの関連性を決定し、さらに処理すべきテキストとの関連性が高い拡張テーマを処理すべきテキストのテーマとして決定することができる。

なお、拡張テーマと処理すべきテキストとの関連性を決定する方式は、コアエンティティの概念情報と処理すべきテキストとの関連を決定する方式と同じであり、各拡張テーマと処理すべきテキストとの関連性に基づいて、拡張テーマから処理すべきテキストのテーマを取得する方式は、各概念情報と処理すべきテキストとの関連性に基づいて、各概念情報から処理すべきテキストを取得する方式と同じであり、具体的な実現過程及び原理については、上記実施例の詳細な説明を参照でき、ここで繰り返し説明しない。

ステップ３０７：コアエンティティセットにおける各コアエンティティと処理すべきテキストとの関連性、及び各候補テーマと処理すべきテキストとの関連性に基づいて、コアエンティティセット及び各候補テーマから、処理すべきテキストのテーマを取得する。

上記ステップ３０７の具体的な実現過程及び原理については、上記実施例の詳細な説明を参照でき、ここで繰り返し説明しない。

本出願の実施例の技術案によれば、エンティティリンクにより、知識グラフでの、それぞれ処理すべきテキストに含まれる各エンティティに対応する各候補エンティティを決定し、各候補エンティティと知識グラフでの他のエンティティとの関連性に基づいて、各候補エンティティをクラスタリングし、処理すべきテキストに対応するコアエンティティセットを決定し、この後、処理すべきテキスト中の各キーワードのそれぞれと予め設定されたテーマグラフでの各参照テーマとのマッチング度に基づいて、処理すべきテキストに含まれる各候補テーマを決定し、さらに予め設定されたテーマグラフから、各候補テーマに対応する上位テーマを処理すべきテキストに対応する拡張テーマとして抽出して、各拡張テーマと処理すべきテキストとの関連性に基づいて、拡張テーマから処理すべきテキストのテーマを取得し、コアエンティティセットにおける各コアエンティティと処理すべきテキストとの関連性、及び各候補テーマと処理すべきテキストとの関連性に基づいて、コアエンティティセット及び各候補テーマから、処理すべきテキストのテーマを取得する。これによって、テーマグラフを融合することで、候補テーマのテーマグラフでの上位テーマを利用して処理すべきテキストのテーマを拡張し、それにより、より多くの隠在的なテーマ情報をマイニングし、テキストテーマの生成精度をさらに向上させる。

本出願の１つの可能な実現形態では、処理すべきテキストに対応するコアエンティティセットを決定した後、さらに知識グラフでのコアエンティティセットの特性に基づいて、コアエンティティセットの一部を削除し、それにより、一部が削除された後のコアエンティティセットが一層処理すべきテキストのテーマに一致し、テキストテーマの生成精度をさらに向上させる。

以下、図６を参照しながら、本出願の実施例に係るテキストテーマ生成方法について、さらに説明する。

図６は、本出願の実施例に係る他のテキストテーマ生成方法の概略フローチャートである。

図６に示すように、該テキストテーマ生成方法は、以下のステップを含む。

ステップ４０１：処理すべきテキストに対してエンティティマイニングを行い、処理すべきテキストに含まれる各エンティティを取得する。

ステップ４０２：エンティティリンクにより、知識グラフでの、それぞれ処理すべきテキストに含まれる各エンティティに対応する各候補エンティティを決定する。

ステップ４０３：各候補エンティティと知識グラフでの他のエンティティとの関連性に基づいて、各候補エンティティをクラスタリングし、処理すべきテキストに対応するコアエンティティセットを決定する。

上記ステップ４０１〜４０３の具体的な実現過程及び原理については、上記実施例の詳細な説明を参照でき、ここで繰り返し説明しない。

ステップ４０４：各コアエンティティの各概念情報と上位経路情報とのマッチング度を決定し、コアエンティティセットには、各コアエンティティに対応する概念情報セット及び上位経路情報が含まれる。

概念情報と上位経路情報とのマッチング度は、意味類似度など、概念情報と上位経路情報との類似程度であってもよい。例えば、概念情報と上位経路情報とのコサイン類似度を利用して、両者のマッチング度を表してもよい。

本出願の実施例では、知識グラフは、エンティティ及び各エンティティに対応する概念情報と上位経路情報を含んでもよい。例えば、エンティティ『楚喬伝』に対応する概念情報セットが「女性主役の努力伝奇時代劇、中国語番組、愛情番組、ストーリー番組」であり、上位経路情報が「楚喬伝→小説原作番組→小説原作ドラマ→小説原作作品→作品→文化→ルート（ｒｏｏｔ）」である。エンティティの知識グラフでの概念情報と上位経路情報とのマッチング度は、該エンティティの情報確実性を表すことができ、それにより、コアエンティティの各概念情報と上位経路情報とのマッチング度に基づいて、コアエンティティセットの一部を削除することができる。

具体的には、処理すべきテキストに対応するコアエンティティを決定した後、該コアエンティティに対応する概念情報セット及び上位経路情報を知識グラフから取得して、コアエンティティセットを構成してもよい。コアエンティティセットにおける各コアエンティティに対して、それぞれ概念情報セット中の各概念情報と上位経路情報のうちの各経路情報とのマッチング度を決定してもよい。

例としては、概念情報と上位経路情報とのマッチング度が両者間のコサイン類似度であり、コアエンティティセットに１つのコアエンティティ『楚喬伝』が含まれ、コアエンティティ『楚喬伝』に対応する概念情報セットが「女性主役の努力伝奇時代劇、中国語番組、愛情番組、ストーリー番組」であり、上位経路情報が「楚喬伝→小説原作番組→小説原作ドラマ→小説原作作品→作品→文化→ルート（ｒｏｏｔ）」であり、概念情報「女性主役の努力伝奇時代劇」と小説原作番組、小説原作ドラマ、小説原作作品、作品、文化、ルート（ｒｏｏｔ）のそれぞれとのコサイン類似度、すなわち、概念情報「女性主役の努力伝奇時代劇」と各経路情報とのマッチング度を計算してもよく、これに対応して、同一の方式で概念情報セット中の他の各概念情報のそれぞれと各上位経路情報とのマッチング度を順次決定する。

ステップ４０５：各コアエンティティの各概念情報と上位経路情報とのマッチング度に基づいて、処理すべきテキストに対応するコアエンティティセットの一部を削除する。

本出願の実施例では、各コアエンティティの各概念情報と上位経路情報とのマッチング度に基づいて、コアエンティティセットにおける、マッチング度が低いコアエンティティを除去するか、またはコアエンティティに対応する、マッチング度が低い概念情報を除去することで、コアエンティティセットの一部を削除することができる。すなわち、本出願の実施例の１つの可能な実現形態では、上記ステップ４０５は、各コアエンティティの各概念情報と上位経路情報とのマッチング度に基づいて、各コアエンティティの概念情報セットの一部を削除するステップ、及び／または、各コアエンティティの各概念情報と上位経路情報とのマッチング度に基づいて、各コアエンティティの信頼度を決定するステップと、各コアエンティティの信頼度に基づいて、コアエンティティの数を減少させるステップと、を含んでもよい。

１つの可能な実現形態としては、マッチング度閾値を予め設定してもよく、それにより、各コアエンティティの各概念情報と上位経路情報とのマッチング度及びマッチング度閾値に基づいて、各上位経路情報のマッチング度がいずれもマッチング度閾値より小さい概念情報をコアエンティティセットから除去する。

１つの可能な実現形態としては、コアエンティティの各概念情報と各上位経路情報とのマッチング度がいずれもマッチング度閾値より小さい場合、該コアエンティティの信頼度が低いと決定することができ、それにより、該コアエンティティをコアエンティティセットから除去できる。

例としては、コアエンティティセットにコアエンティティ『楚喬伝』及び「趙麗穎」が含まれ、コアエンティティ『楚喬伝』に対応する概念情報セットが「女性主役の努力伝奇時代劇、中国語番組、愛情番組、ストーリー番組、愛情物語」であり、上位経路情報が「楚喬伝→小説原作番組→小説原作ドラマ→小説原作作品→作品→文化→ルート（ｒｏｏｔ）」であり、コアエンティティ「趙麗穎」に対応する概念情報セットが「俳優、女性」であり、上位経路情報が「趙麗穎→小説原作番組→小説原作ドラマ→小説原作作品→作品→文化→ルート（ｒｏｏｔ）」であり、概念情報「女性主役の努力伝奇時代劇」と「小説原作番組」とのマッチング度がマッチング度閾値より大きく、概念情報「中国語番組」、「愛情番組」、「ストーリー番組」のそれぞれと「作品」とのマッチング度がマッチング度閾値より大きく、概念情報「愛情物語」と任意の上位経路情報とのマッチング度がいずれもマッチング度閾値より小さく、それにより、概念情報「愛情物語」をコアエンティティセットから除去することができ、コアエンティティ「趙麗穎」の概念情報「俳優」、「女性」と任意の上位経路情報とのマッチング度がいずれもマッチング度閾値より小さいと決定すると、コアエンティティ「趙麗穎」の信頼度が低いと決定することができ、それにより、コアエンティティ「趙麗穎」をコアエンティティセットから除去することができる。

ステップ４０６：処理すべきテキスト中の各キーワードのそれぞれと予め設定されたテーマグラフでの各参照テーマとのマッチング度に基づいて、処理すべきテキストに含まれる各候補テーマを決定する。

ステップ４０７：コアエンティティセットにおける各コアエンティティと処理すべきテキストとの関連性、及び各候補テーマと処理すべきテキストとの関連性に基づいて、コアエンティティセット及び各候補テーマから、処理すべきテキストのテーマを取得する。

上記ステップ４０６〜４０７の具体的な実現過程及び原理については、上記実施例の詳細な説明を参照でき、ここで繰り返し説明しない。

本出願の実施例の技術案によれば、エンティティリンクにより、知識グラフでの、それぞれ処理すべきテキストに含まれる各エンティティに対応する各候補エンティティを決定し、各候補エンティティと知識グラフでの他のエンティティとの関連性に基づいて、各候補エンティティをクラスタリングし、処理すべきテキストに対応するコアエンティティセットを決定し、この後、各コアエンティティの各概念情報と上位経路情報とのマッチング度を決定し、各コアエンティティの各概念情報と上位経路情報とのマッチング度に基づいて、処理すべきテキストに対応するコアエンティティセットの一部を削除し、及び処理すべきテキスト中の各キーワードのそれぞれと予め設定されたテーマグラフでの各参照テーマとのマッチング度に基づいて、処理すべきテキストに含まれる各候補テーマを決定し、さらにコアエンティティセットにおける各コアエンティティと処理すべきテキストとの関連性、及び各候補テーマと処理すべきテキストとの関連性に基づいて、コアエンティティセット及び各候補テーマから、処理すべきテキストのテーマを取得する。これによって、知識グラフ及びテーマグラフ情報を融合することで、短いテキスト情報及び候補テーマを拡張し、知識グラフ情報を利用して信頼度が低いコアエンティティを除去し、それにより、より多くの隠在的なテーマ情報をマイニングするとともに、隠在的なテーマの信頼度を向上させ、テキストテーマの生成精度をさらに向上させる。

本出願は、上記実施例を実現するために、テキストテーマ生成装置をさらに提供する。

図７は、本出願の実施例に係るテキストテーマ生成装置の概略構成図である。

図７に示すように、該テキストテーマ生成装置５０は、処理すべきテキストに対してエンティティマイニングを行い、処理すべきテキストに含まれる各エンティティを取得するための第１の取得モジュール５１と、エンティティリンクにより、知識グラフでの、それぞれ処理すべきテキストに含まれる各エンティティに対応する各候補エンティティを決定するための第１の決定モジュール５２と、各候補エンティティと知識グラフでの他のエンティティとの関連性に基づいて、各候補エンティティをクラスタリングし、処理すべきテキストに対応するコアエンティティセットを決定するための第２の決定モジュール５３と、処理すべきテキスト中の各キーワードのそれぞれと予め設定されたテーマグラフでの各参照テーマとのマッチング度に基づいて、処理すべきテキストに含まれる各候補テーマを決定するための第３の決定モジュール５４と、コアエンティティセットにおける各コアエンティティと処理すべきテキストとの関連性、及び各候補テーマと処理すべきテキストとの関連性に基づいて、コアエンティティセット及び各候補テーマから、処理すべきテキストのテーマを取得するための第２の取得モジュール５５と、を備える。

実際の使用では、本出願の実施例に係るテキストテーマ生成装置は、前述したテキストテーマ生成方法を実行するために、任意の電子機器に配置されてもよい。

本出願の１つの可能な実現形態では、上記第２の決定モジュール５３は、具体的には、各候補エンティティと知識グラフでの他のエンティティとの関連性に基づいて、各候補エンティティを含む関連性ネットワークを構築し、関連性ネットワークにおける各ノードが１つの候補エンティティに対応し、２つのノード間のエッジの方向が２つのノード間の階層関係を特徴付け、各候補エンティティ間のエッジの方向に基づいて、各候補エンティティをクラスタリングし、処理すべきテキストに対応するコアエンティティセットを決定するために用いられる。

さらに、本出願の他の可能な実現形態では、上記コアエンティティセットには、各コアエンティティに対応する概念情報セット及び上位経路情報が含まれ、これに対応し、上記テキストテーマ生成装置５０は、各コアエンティティの各概念情報と上位経路情報とのマッチング度を決定するための第４の決定モジュールと、各コアエンティティの各概念情報と上位経路情報とのマッチング度に基づいて、処理すべきテキストに対応するコアエンティティセットの一部を削除するための部分削除モジュールと、をさらに備える。

さらに、本出願の他の可能な実現形態では、上記部分削除モジュールは、具体的には、各コアエンティティの各概念情報と上位経路情報とのマッチング度に基づいて、各コアエンティティの概念情報セットの一部を削除し、及び／または、各コアエンティティの各概念情報と上位経路情報とのマッチング度に基づいて、各コアエンティティの信頼度を決定し、各コアエンティティの信頼度に基づいて、コアエンティティの数を減少させるために用いられる。

さらに、本出願の他の可能な実現形態では、上記テキストテーマ生成装置５０は、予め設定されたテーマグラフから、各候補テーマに対応する上位テーマを処理すべきテキストに対応する拡張テーマとして抽出するための抽出モジュールと、各拡張テーマと処理すべきテキストとの関連性に基づいて、拡張テーマから処理すべきテキストのテーマを選択するための第３の取得モジュールと、をさらに備える。

さらに、本出願の他の可能な実現形態では、第１のコアエンティティは、知識グラフにおいて少なくとも２つの概念情報を含み、これに対応し、上記第２の取得モジュール５５は、具体的には、予め設定された分類モデルを利用して、それぞれ第１のコアエンティティに対応する各概念情報及び処理すべきテキストに対して符号化・復号化処理を行い、各概念情報と処理すべきテキストとの関連性を決定し、第１のコアエンティティの各概念情報と処理すべきテキストとの関連性に基づいて、第１のコアエンティティと処理すべきテキストとの関連性を決定し、第１のコアエンティティと処理すべきテキストとの関連性に基づいて、第１のコアエンティティが処理すべきテキストのテーマであるか否かを決定するために用いられる。

さらに、本出願の他の可能な実現形態では、上記テキストテーマ生成装置５０は、予め設定された分類モデルを利用して、各コアエンティティの知識グラフでの各概念情報及び処理すべきテキストに対して符号化・復号化処理を行い、各コアエンティティの各概念情報と処理すべきテキストとの関連性を決定するための第５の決定モジュールをさらに備え、前記第２の取得モジュール５５は、さらに、各コアエンティティの各概念情報と処理すべきテキストとの関連性に基づいて、各コアエンティティに対応する各概念情報から、処理すべきテキストのテーマを取得するために用いられる。

なお、図１、図４、図５、図６に示すテキストテーマ生成方法実施例についての前述した説明も該実施例のテキストテーマ生成装置５０に適用でき、ここで繰り返し説明しない。

本出願の実施例によれば、本出願は、電子機器及び読み取り可能な記憶媒体をさらに提供する。

図８に示すように、本出願の実施例によるテキストテーマ生成方法の電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレーム、及び他の適切なコンピュータなどの様々な形態のデジタルコンピュータを表すことを目的とする。電子機器は、携帯情報端末、携帯電話、スマートフォン、ウェアラブルデバイス、他の同様のコンピューティングデバイスなどの様々な形態のモバイルデバイスを表すこともできる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は単なる例であり、本明細書の説明及び／または要求される本出願の実現を制限することを意図したものではない。

図８に示すように、該電子機器は、１つのまたは複数のプロセッサ８０１と、メモリ８０２と、高速インターフェース及び低速インターフェースを含む各コンポーネントを接続するためのインターフェースと、を備える。各コンポーネントは、異なるバスで相互に接続され、共通のマザーボードに取り付けられるか、または必要に応じて他の方式で取り付けることができる。プロセッサは、メモリ内またはメモリ上において外部入力／出力装置（例えば、インターフェースにカップリングされた表示機器）にＧＵＩのグラフィック情報を表示する命令を含んだ、電子機器内に実行される命令を処理する。他の実施形態では、必要であれば、複数のプロセッサ及び／または複数のバスを、複数のメモリと複数のメモリとともに使用することができる。同様に、複数の電子機器を接続することができ、各電子機器は、一部の必要な操作（例えば、サーババンク、１群のブレードサーバ、またはマルチプロセッサシステムとして）を提供することができる。図８では、１つのプロセッサ８０１を例とする。

メモリ８０２は、本出願に係る非一時的なコンピュータ読み取り可能な記憶媒体である。前記記憶装置には、少なくとも１つのプロセッサによって実行可能な命令を記憶し、それにより、前記少なくとも１つのプロセッサが本出願に係るテキストテーマ生成方法を実行する。本出願の非一時的なコンピュータ読み取り可能な記憶媒体にはコンピュータ命令を記憶し、該コンピュータ命令は、コンピュータに本出願に係るテキストテーマ生成方法を実行させるために用いられる。

メモリ８０２は、非一時的なコンピュータ読み取り可能な記憶媒体として、本出願の実施例に係るテキストテーマ生成方法に対応するプログラム命令／モジュール（例えば、図７に示す第１の取得モジュール５１、第１の決定モジュール５２、第２の決定モジュール５３、第３の決定モジュール５４及び第２の取得モジュール５５）などの、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能なプログラム及びモジュールを記憶するように構成される。プロセッサ８０１は、メモリ８０２に記憶されている非一時的なソフトウェアプログラム、命令及びモジュールを実行することによって、サーバの様々な機能アプリケーション及びデータ処理を実行し、すなわち、上記方法実施例に係るテキストテーマ生成方法を実現する。

メモリ８０２は、プログラム記憶領域とデータ記憶領域と、を含むことができ、ここで、プログラム記憶領域は、オペレーティングシステム、少なくとも１つの機能に必要なアプリケーションプログラムを記憶することができ、記憶データ領域は、テキストテーマ生成方法の電子機器の使用に基づいて作成されるデータなどを記憶することができる。また、メモリ８０２は、高速ランダムアクセスメモリを含んでもよく、非一時的なメモリをさらに含んでもよく、例えば、少なくとも１つのディスクストレージデバイス、フラッシュメモリデバイス、または他の非一時的なソリッドステートストレージデバイスである。いくつかの実施例では、メモリ８０２は、プロセッサ８０１に対して遠隔に設けられたメモリを選択的に含んでもよく、これらの遠隔メモリは、ネットワークを介してテキストテーマ生成方法の電子機器に接続されてもよい。上記ネットワークの例としては、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びその組み合わせを含むが、これらに限定されない。

テキストテーマ生成方法の電子機器は、さらに、入力装置８０３及び出力装置８０４を備えてもよい。プロセッサ８０１、メモリ８０２、入力装置８０３及び出力装置８０４は、バスまたは他の方式を介して接続することができ、図８では、バスによる接続を例とする。

入力装置８０３は、入力された数字またはキャラクタ情報を受信し、テキストテーマ生成方法の電子機器のユーザ〜を設置する及び機能コントロールに関連するキー信号入力を生成してもよく、例えばタッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、インジケータースティック、１つのまたは複数のマウスキー、トラックボール、ジョイスティックなどの入力装置である。出力装置８０４は、表示機器、補助照明装置（例えば、ＬＥＤ）及び触覚フィードバック装置（例えば、バイブラモータ）などを含んでもよい。該表示機器は、液晶ディスプレイ（ＬＣＤ）、発光ダイオード（ＬＥＤ）ディスプレイ及びプラズマディスプレイを含んでもよいがこれらに限られない。いくつかの実施形態では、表示機器は、タッチスクリーンであり得る。

ここで説明されるシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向けＡＳＩＣ（特定用途向け集積回路）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／またはそれらの組合せで実現することができる。これらの様々な実施形態は、１つまたは複数のコンピュータプログラムで実施されること、を含むことができ、該１つまたは複数のコンピュータプログラムは、少なくとも１つのプログラマブルプロセッサを含むプログラマブルシステムで実行及び／または解釈でき、該プログラマブルプロセッサは、特定用途向けまたは汎用プログラマブルプロセッサであってもよく、ストレージシステム、少なくとも１つの入力装置、及び少なくとも１つの出力装置からデータ及び命令を受信し、該ストレージシステム、該少なくとも１つの入力装置、及び該少なくとも１つの出力装置に伝送することができる。

これらのコンピュータプログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、またはコードとも称される）は、プログラマブルプロセッサに対するマシン命令を含み、高度レベル手続き型及び／またはオブジェクト指向プログラミング言語、および／またはアセンブリ／マシン言語で実施することができる。本明細書で使用される際、「マシン読み取り可能な媒体」及び「コンピュータ読み取り可能な媒体」という用語は、マシン命令及び／またはデータをプログラマブルプロセッサに提供するための任意のコンピュータプログラム製品、機器、及び／または装置（例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス（ＰＬＤ））であり、マシン読み取り可能な信号であるマシン命令を受信する機器読み取り可能な媒体を含む。用語「マシン読み取り可能な信号」とは、マシン命令及び／またはデータをプログラマブルプロセッサに提供するための任意の信号である。

ユーザとのインタラクションを提供するために、ここで説明されているシステム及び技術をコンピュータ上で実施することができ、該コンピュータは、ユーザに情報を表示するための表示機器（例えば、ＣＲＴ（陰極線管）またはＬＣＤ（液晶ディスプレイ）モニタ）と、キーボード及びポインティングデバイス（例えば、マウスまたはトラックボール）とを有し、ユーザは、該キーボード及び該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置は、ユーザとのインタラクションを提供するために用いられてもよい。例えば、ユーザに提供されるフィードバックは、任意の形態のセンシングフィードバック（例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック）であってもよく、任意の形態（音響入力と、音声入力と、触覚入力と、を含む）でユーザからの入力を受信することができる。

ここで説明されるシステム及び技術は、バックエンドコンポーネントを含むコンピューティングシステム（例えば、データサーバとする）、またはミドルウェアコンポーネントを含むコンピューティングシステム（例えば、アプリケーションサーバ）、またはフロントエンドコンポーネントを含むコンピューティングシステム（例えば、グラフィカルユーザインタフェースまたはウェブブラウザを有するユーザコンピュータ、ユーザは、該グラフィカルユーザインタフェースまたは該ウェブブラウザによってここで説明されるシステム及び技術の実施形態とインタラクションする）、またはこのようなバックエンドコンポーネント、ミドルウェアコンポーネント、及びフロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムで実施することができる。任意の形態または媒体のデジタルデータ通信（例えば、通信ネットワーク）によってシステムのコンポーネントを相互に接続されてもよい。通信ネットワークの例としては、ローカルエリアネットワーク（ＬＡＮ）と、ワイドエリアネットワーク（ＷＡＮ）と、インターネットと、を含む。

コンピュータシステムは、クライアント側とサーバと、を含むことができる。クライアント側とサーバは、一般的に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、互いにクライアント−サーバ関係を有するコンピュータプログラムによってクライアント側とサーバとの関係が生成される。

上記に示される様々な形式のフローを使用して、ステップを並べ替え、追加、または削除することができることを理解されたい。例えば、本出願に記載されている各ステップは、並列に実行されてもよいし、順次的に実行されてもよいし、異なる順序で実行されてもよいが、本出願で開示されている技術案の所望の結果を実現することができれば、本明細書では限定されない。

上記具体的な実施形態は、本出願の保護範囲を制限するものではない。当業者は、設計要件及び他の要因に応じて、様々な修正、組み合わせ、サブコンビネーション、及び置換を行うことができる。本出願の要旨と原則内で行われる任意の修正、同等の置換や改良などは、いずれも本出願の保護範囲内に含まれるべきである。

Claims

テキストテーマ生成方法であって、
処理すべきテキストに対してエンティティマイニングを行い、処理すべきテキストに含まれる各エンティティを取得するステップと、
エンティティリンクにより、知識グラフでの、前記処理すべきテキストに含まれる各エンティティにそれぞれ対応する各候補エンティティを決定するステップと、
各候補エンティティと前記知識グラフでの他のエンティティとの関連性に基づいて、各候補エンティティをクラスタリングし、前記処理すべきテキストに対応するコアエンティティセットを決定するステップと、
前記処理すべきテキスト中の各キーワードのそれぞれと予め設定されたテーマグラフでの各参照テーマとのマッチング度に基づいて、前記処理すべきテキストに含まれる各候補テーマを決定するステップと、
前記コアエンティティセットにおける各コアエンティティと前記処理すべきテキストとの関連性、及び各候補テーマと前記処理すべきテキストとの関連性に基づいて、前記コアエンティティセット及び前記各候補テーマから前記処理すべきテキストのテーマを取得するステップと、を含む、テキストテーマ生成方法。
各候補エンティティと前記知識グラフでの他のエンティティとの関連性に基づいて、各候補エンティティをクラスタリングするステップは、
各候補エンティティと前記知識グラフでの他のエンティティとの関連性に基づいて、前記各候補エンティティを含む関連性ネットワークを構築するステップであって、前記関連性ネットワークにおける各ノードが１つの候補エンティティに対応し、２つのノード間のエッジの方向が２つのノード間の階層関係を特徴付けるステップと、
各候補エンティティ間のエッジの方向に基づいて、各候補エンティティをクラスタリングし、前記処理すべきテキストに対応するコアエンティティセットを決定するステップと、を含む、請求項１に記載の方法。
前記コアエンティティセットには、各コアエンティティに対応する概念情報セット及び上位経路情報が含まれ、
前記処理すべきテキストに対応するコアエンティティセットを決定するステップの後、
各コアエンティティの各概念情報と上位経路情報とのマッチング度を決定するステップと、
各コアエンティティの各概念情報と上位経路情報とのマッチング度に基づいて、前記処理すべきテキストに対応するコアエンティティセットの一部を削除するステップと、を含む、請求項１に記載の方法。
前記処理すべきテキストに対応するコアエンティティセットの一部を削除するステップは、
各コアエンティティの各概念情報と上位経路情報とのマッチング度に基づいて、各コアエンティティの概念情報セットの一部を削除するステップ、
及び／または、
各コアエンティティの各概念情報と上位経路情報とのマッチング度に基づいて、各コアエンティティの信頼度を決定するステップと、各コアエンティティの信頼度に基づいて、コアエンティティの数を減少させるステップと、を含む、請求項３に記載の方法。
前記処理すべきテキストに含まれる各候補テーマを決定するステップの後、
前記予め設定されたテーマグラフから、各候補テーマに対応する上位テーマを前記処理すべきテキストに対応する拡張テーマとして抽出するステップと、
各拡張テーマと前記処理すべきテキストとの関連性に基づいて、前記拡張テーマから前記処理すべきテキストのテーマを取得するステップと、をさらに含む、請求項１に記載の方法。
第１のコアエンティティは、前記知識グラフにおいて少なくとも２つの概念情報を含み、
前記コアエンティティセット及び前記各候補テーマから前記処理すべきテキストのテーマを取得するステップは、
予め設定された分類モデルを利用して、それぞれ第１のコアエンティティに対応する各概念情報及び前記処理すべきテキストに対して符号化・復号化処理を行い、各概念情報と前記処理すべきテキストとの関連性を決定するステップと、
前記第１のコアエンティティの各概念情報と前記処理すべきテキストとの関連性に基づいて、前記第１のコアエンティティと前記処理すべきテキストとの関連性を決定するステップと、
前記第１のコアエンティティと前記処理すべきテキストとの関連性に基づいて、前記第１のコアエンティティが前記処理すべきテキストのテーマであるか否かを決定するステップと、を含む、請求項１から請求項５のいずれか１項に記載の方法。
前記コアエンティティセット及び前記各候補テーマから前記処理すべきテキストのテーマを取得するステップの前、
予め設定された分類モデルを利用して、各コアエンティティの前記知識グラフでの各概念情報及び前記処理すべきテキストに対して符号化・復号化処理を行い、各コアエンティティの各概念情報と前記処理すべきテキストとの関連性を決定するステップをさらに含み、
前記コアエンティティセット及び前記各候補テーマから前記処理すべきテキストのテーマを取得するステップは、
各コアエンティティの各概念情報と前記処理すべきテキストとの関連性に基づいて、各コアエンティティに対応する各概念情報から、前記処理すべきテキストのテーマを取得するステップを含む、請求項１から請求項５のいずれか１項に記載の方法。
テキストテーマ生成装置であって、
処理すべきテキストに対してエンティティマイニングを行い、処理すべきテキストに含まれる各エンティティを取得するための第１の取得モジュールと、
エンティティリンクにより、知識グラフでの、前記処理すべきテキストに含まれる各エンティティにそれぞれ対応する各候補エンティティを決定するための第１の決定モジュールと、
各候補エンティティと前記知識グラフでの他のエンティティとの関連性に基づいて、各候補エンティティをクラスタリングし、前記処理すべきテキストに対応するコアエンティティセットを決定するための第２の決定モジュールと、
前記処理すべきテキスト中の各キーワードのそれぞれと予め設定されたテーマグラフでの各参照テーマとのマッチング度に基づいて、前記処理すべきテキストに含まれる各候補テーマを決定するための第３の決定モジュールと、
前記コアエンティティセットにおける各コアエンティティと前記処理すべきテキストとの関連性、及び各候補テーマと前記処理すべきテキストとの関連性に基づいて、前記コアエンティティセット及び前記各候補テーマから前記処理すべきテキストのテーマを取得するための第２の取得モジュールと、を備える、テキストテーマ生成装置。
前記第２の決定モジュールは、具体的には、
各候補エンティティと前記知識グラフでの他のエンティティとの関連性に基づいて、前記各候補エンティティを含む関連性ネットワークを構築し、前記関連性ネットワークにおける各ノードが１つの候補エンティティに対応し、２つのノード間のエッジの方向が２つのノード間の階層関係を特徴付け、
各候補エンティティ間のエッジの方向に基づいて、各候補エンティティをクラスタリングし、前記処理すべきテキストに対応するコアエンティティセットを決定するために用いられる、請求項８に記載の装置。
前記コアエンティティセットには、各コアエンティティに対応する概念情報セット及び上位経路情報が含まれ、
各コアエンティティの各概念情報と上位経路情報とのマッチング度を決定するための第４の決定モジュールと、
各コアエンティティの各概念情報と上位経路情報とのマッチング度に基づいて、前記処理すべきテキストに対応するコアエンティティセットの一部を削除するための部分削除モジュールと、をさらに備える、請求項８に記載の装置。
前記部分削除モジュールは、具体的には、
各コアエンティティの各概念情報と上位経路情報とのマッチング度に基づいて、各コアエンティティの概念情報セットの一部を削除し、
及び／または、
各コアエンティティの各概念情報と上位経路情報とのマッチング度に基づいて、各コアエンティティの信頼度を決定し、各コアエンティティの信頼度に基づいて、コアエンティティの数を減少させるために用いられる、請求項１０に記載の装置。
前記予め設定されたテーマグラフから、各候補テーマに対応する上位テーマを前記処理すべきテキストに対応する拡張テーマとして抽出するための抽出モジュールと、
各拡張テーマと前記処理すべきテキストとの関連性に基づいて、前記拡張テーマから前記処理すべきテキストのテーマを選択するための第３の取得モジュールと、をさらに備える、請求項８に記載の装置。
第１のコアエンティティは、前記知識グラフにおいて少なくとも２つの概念情報を含み、
前記第２の取得モジュールは、具体的には、
予め設定された分類モデルを利用して、それぞれ第１のコアエンティティに対応する各概念情報及び前記処理すべきテキストに対して符号化・復号化処理を行い、各概念情報と前記処理すべきテキストとの関連性を決定し、
前記第１のコアエンティティの各概念情報と前記処理すべきテキストとの関連性に基づいて、前記第１のコアエンティティと前記処理すべきテキストとの関連性を決定し、
前記第１のコアエンティティと前記処理すべきテキストとの関連性に基づいて、前記第１のコアエンティティが前記処理すべきテキストのテーマであるか否かを決定するために用いられる、請求項８から請求項１２のいずれか１項に記載の装置。
予め設定された分類モデルを利用して、各コアエンティティの前記知識グラフでの各概念情報及び前記処理すべきテキストに対して符号化・復号化処理を行い、各コアエンティティの各概念情報と前記処理すべきテキストとの関連性を決定するための第５の決定モジュールをさらに備え、
前記第２の取得モジュールは、さらに、
各コアエンティティの各概念情報と前記処理すべきテキストとの関連性に基づいて、各コアエンティティに対応する各概念情報から、前記処理すべきテキストのテーマを取得するために用いられる、請求項８から請求項１２のいずれか１項に記載の装置。
電子機器であって、
少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサに通信接続されるメモリと、を備え、
前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶されており、前記命令は、前記少なくとも１つのプロセッサによって実行される場合、前記少なくとも１つのプロセッサが請求項１から請求項７のいずれか１項に記載の方法を実行できる、電子機器。
コンピュータ命令を記憶する非一時的なコンピュータ読み取り可能な記憶媒体であって、前記コンピュータ命令は、前記コンピュータに請求項１から請求項７のいずれか１項に記載の方法を実行させるために用いられる、非一時的なコンピュータ読み取り可能な記憶媒体。
コンピュータ上で動作しているときに、請求項１から請求項７のいずれか１項に記載の方法を前記コンピュータに実行させる、コンピュータプログラム。