JP6011856B2 - 文書間関係推定モデル学習装置、文書間関係推定装置、方法、及びプログラム - Google Patents
文書間関係推定モデル学習装置、文書間関係推定装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP6011856B2 JP6011856B2 JP2012247625A JP2012247625A JP6011856B2 JP 6011856 B2 JP6011856 B2 JP 6011856B2 JP 2012247625 A JP2012247625 A JP 2012247625A JP 2012247625 A JP2012247625 A JP 2012247625A JP 6011856 B2 JP6011856 B2 JP 6011856B2
- Authority
- JP
- Japan
- Prior art keywords
- learning
- documents
- predicate
- divided
- relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Description
また、本発明に係る文書間関係推定モデル学習装置は、複数の学習用文書からなる学習用文書群を、複数の分割文書群に分割する分割手段と、前記複数の分割文書群の各々に対して、前記分割文書群における学習用文書間の各々について文書間の特徴を示す観測述語を抽出すると共に、前記分割文書群における学習用文書の各々の特徴を示す観測述語を抽出する特徴抽出手段と、前記複数の分割文書群の各々に対して、前記分割文書群における学習用文書間の各々について予め与えられた文書間の関係と、前記特徴抽出手段によって前記分割文書群に対して抽出された前記観測述語とに基づいて、前記観測述語又は文書間の関係を示す潜在述語を用いて記述された各論理式を用いて構築されるマルコフロジックネットワーク(MLN:Markov Logic Network)における各論理式の重みを用いて、前記マルコフロジックネットワークにより、推定対象の文書間の特徴を示す観測述語及び前記推定対象の文書の各々の特徴を示す観測述語に対して尤もらしい、前記推定対象の文書間の関係を示す潜在述語を推定するための推定モデルにおける各論理式の重みを学習する学習手段とを含み、前記学習手段は、他の分割文書群に対して学習された前記推定モデルにおける各論理式の重みを用いて、前記マルコフロジックネットワークにより、前記分割文書群の学習用文書間の各々の関係を示す潜在述語を推定し、前記推定された前記潜在述語が示す学習用文書間の各々の関係と、前記学習用文書間の各々について予め与えられた文書間の関係とが一致するように、前記推定モデルにおける各論理式の重みを学習することを、前記複数の分割文書群の各々に対して繰り返し、前記分割手段は、前記学習用文書群を、他の分割文書群と重複するように前記複数の分割文書群に分割し、前記学習手段は、前記分割文書群に対して前記推定モデルにおける各論理式の重みを学習する際に、他の分割文書群に対する学習において推定された前記学習用文書間の各々の関係を示す潜在述語を、観測述語として追加し、前記他の分割文書群と重複する学習用文書に関する前記追加された観測述語と前記観測述語に対応する潜在述語とを用いて記述される論理式、及び複数の潜在述語間の関係を記述した論理式を含む、前記推定モデルにおける各論理式の重みを学習する。
また、本発明に係る文書間関係推定モデル学習方法は、分割手段によって、複数の学習用文書からなる学習用文書群を、複数の分割文書群に分割し、特徴抽出手段によって、前記複数の分割文書群の各々に対して、前記分割文書群における学習用文書間の各々について文書間の特徴を示す観測述語を抽出すると共に、前記分割文書群における学習用文書の各々の特徴を示す観測述語を抽出し、学習手段によって、前記複数の分割文書群の各々に対して、前記分割文書群における学習用文書間の各々について予め与えられた文書間の関係と、前記特徴抽出手段によって前記分割文書群に対して抽出された前記観測述語とに基づいて、前記観測述語又は文書間の関係を示す潜在述語を用いて記述された各論理式を用いて構築されるマルコフロジックネットワーク(MLN:Markov Logic Network)における各論理式の重みを用いて、前記マルコフロジックネットワークにより、推定対象の文書間の特徴を示す観測述語及び前記推定対象の文書の各々の特徴を示す観測述語に対して尤もらしい、前記推定対象の文書間の関係を示す潜在述語を推定するための推定モデルにおける各論理式の重みを学習することを含み、前記学習手段によって学習することは、他の分割文書群に対して学習された前記推定モデルにおける各論理式の重みを用いて、前記マルコフロジックネットワークにより、前記分割文書群の学習用文書間の各々の関係を示す潜在述語を推定し、前記推定された前記潜在述語が示す学習用文書間の各々の関係と、前記学習用文書間の各々について予め与えられた文書間の関係とが一致するように、前記推定モデルにおける各論理式の重みを学習することを、前記複数の分割文書群の各々に対して繰り返し、前記分割手段によって分割することは、前記学習用文書群を、他の分割文書群と重複するように前記複数の分割文書群に分割し、前記学習手段によって学習することは、前記分割文書群に対して前記推定モデルにおける各論理式の重みを学習する際に、他の分割文書群に対する学習において推定された前記学習用文書間の各々の関係を示す潜在述語を、観測述語として追加し、前記他の分割文書群と重複する学習用文書に関する前記追加された観測述語と前記観測述語に対応する潜在述語とを用いて記述される論理式、及び複数の潜在述語間の関係を記述した論理式を含む、前記推定モデルにおける各論理式の重みを学習する。
図1に示すように、本発明の第1の実施の形態に係る発言間関係推定装置100は、発言を示すテキストデータの集合が入力され、各発言間の関係を出力する。1つの発言は1つ以上の文からなるテキストデータである。この発言間関係推定装置100は、CPUと、RAMと、後述するモデル学習処理ルーチン及び発言間関係推定処理ルーチンを実行するためのプログラムを記憶したROMとを備えたコンピュータで構成され、機能的には次に示すように構成されている。図1に示すように、発言間関係推定装置100は、入力部10と、演算部20と、出力部30とを備えている。
hidden: loc (推定する対象の述語として地名の一部かどうか)
dynamic: dloc (動的な述語として、以前の推定結果を表すための述語(dyn_dlocとobs_dlocが自動的に定義される))
weight w_word:WORD->Double; (単語wの地名らしさw_wordを重みとして学習させる)
factor: for Id i, WORD w
if word(i, w) add [loc(i)] * w_word(w);
if loc(i): dyn_dloc(i);
factor: for Id i
if obs_dloc(i-1) add[loc(i)]*w_last;
--分割
word(2, "新宿区")
--分割
word(3, "新宿")
if obs_dloc(i): dyn_dloc(i);
次に、第1の実施の形態に係る発言間関係推定装置100の作用について説明する。まず、発言の集合と、各発言間に対して手動で付与した発言間の関係を示すラベルの集合とを含む学習データが発言間関係推定装置100に入力されると、発言間関係推定装置100によって、入力された、学習データが、発言集合データベース21へ格納される。
if obs_dloc(i) add [loc(i)] * w_dloc;
学習データを元にMLNによってモデルを学習し、テストを行った。ここでは、93ツイートからなるデータを4分割して、学習・テストを行った実験結果を示す。ツイート間の関係のあるなしのみの関係を扱った。この実験はクローズドな実験であり、学習とテストに同じデータを用いている。
20 演算部
21 発言集合データベース
23、33 事例分割部
24、34 分割データ記憶部
26 学習制御部
25、35 特徴量抽出部
27、36 論理式生成部
28 モデル学習部
29、38 特徴量追加部
30 出力部
31 モデル記憶部
32 入力発言集合データベース
37 関係推定部
100 発言間関係推定装置
Claims (7)
- 複数の学習用文書からなる学習用文書群を、複数の分割文書群に分割する分割手段と、
前記複数の分割文書群の各々に対して、前記分割文書群における学習用文書間の各々について文書間の特徴を示す観測述語を抽出すると共に、前記分割文書群における学習用文書の各々の特徴を示す観測述語を抽出する特徴抽出手段と、
前記複数の分割文書群の各々に対して、前記分割文書群における学習用文書間の各々について予め与えられた文書間の関係と、前記特徴抽出手段によって前記分割文書群に対して抽出された前記観測述語とに基づいて、前記観測述語又は文書間の関係を示す潜在述語を用いて記述された各論理式を用いて構築されるマルコフロジックネットワーク(MLN:Markov Logic Network)における各論理式の重みを用いて、前記マルコフロジックネットワークにより、推定対象の文書間の特徴を示す観測述語及び前記推定対象の文書の各々の特徴を示す観測述語に対して尤もらしい、前記推定対象の文書間の関係を示す潜在述語を推定するための推定モデルにおける各論理式の重みを学習する学習手段とを含み、
前記学習手段は、
他の分割文書群に対して学習された前記推定モデルにおける各論理式の重みを用いて、前記マルコフロジックネットワークにより、前記分割文書群の学習用文書間の各々の関係を示す潜在述語を推定し、前記推定された前記潜在述語が示す学習用文書間の各々の関係と、前記学習用文書間の各々について予め与えられた文書間の関係とが一致するように、前記推定モデルにおける各論理式の重みを学習することを、前記複数の分割文書群の各々に対して繰り返し、
前記学習手段は、前記分割文書群に対して前記推定モデルにおける各論理式の重みを学習する際に、他の分割文書群に対する学習において推定された前記学習用文書間の各々の関係を示す潜在述語を、前記分割文書群に関する観測述語として追加し、前記特徴抽出手段によって前記分割文書群に対して抽出された前記観測述語と前記追加された前記観測述語に基づいて、前記追加された観測述語と文書間の関係を示す潜在述語とを用いて記述された論理式を含む前記推定モデルにおける各論理式の重みを学習する
文書間関係推定モデル学習装置。 - 複数の学習用文書からなる学習用文書群を、複数の分割文書群に分割する分割手段と、
前記複数の分割文書群の各々に対して、前記分割文書群における学習用文書間の各々について文書間の特徴を示す観測述語を抽出すると共に、前記分割文書群における学習用文書の各々の特徴を示す観測述語を抽出する特徴抽出手段と、
前記複数の分割文書群の各々に対して、前記分割文書群における学習用文書間の各々について予め与えられた文書間の関係と、前記特徴抽出手段によって前記分割文書群に対して抽出された前記観測述語とに基づいて、前記観測述語又は文書間の関係を示す潜在述語を用いて記述された各論理式を用いて構築されるマルコフロジックネットワーク(MLN:Markov Logic Network)における各論理式の重みを用いて、前記マルコフロジックネットワークにより、推定対象の文書間の特徴を示す観測述語及び前記推定対象の文書の各々の特徴を示す観測述語に対して尤もらしい、前記推定対象の文書間の関係を示す潜在述語を推定するための推定モデルにおける各論理式の重みを学習する学習手段とを含み、
前記学習手段は、
他の分割文書群に対して学習された前記推定モデルにおける各論理式の重みを用いて、前記マルコフロジックネットワークにより、前記分割文書群の学習用文書間の各々の関係を示す潜在述語を推定し、前記推定された前記潜在述語が示す学習用文書間の各々の関係と、前記学習用文書間の各々について予め与えられた文書間の関係とが一致するように、前記推定モデルにおける各論理式の重みを学習することを、前記複数の分割文書群の各々に対して繰り返し、
前記分割手段は、前記学習用文書群を、他の分割文書群と重複するように前記複数の分割文書群に分割し、
前記学習手段は、前記分割文書群に対して前記推定モデルにおける各論理式の重みを学習する際に、他の分割文書群に対する学習において推定された前記学習用文書間の各々の関係を示す潜在述語を、観測述語として追加し、前記他の分割文書群と重複する学習用文書に関する前記追加された観測述語と前記観測述語に対応する潜在述語とを用いて記述される論理式、及び複数の潜在述語間の関係を記述した論理式を含む、前記推定モデルにおける各論理式の重みを学習する
文書間関係推定モデル学習装置。 - 複数の文書からなる推定対象の文書群を、複数の推定用分割文書群に分割する推定用分割手段と、
前記複数の推定用分割文書群の各々に対して、前記推定用分割文書群における文書間の各々について文書間の特徴を示す観測述語を抽出すると共に、前記推定用分割文書群における文書の各々の特徴を示す観測述語を抽出する推定用特徴抽出手段と、
前記複数の推定用分割文書群の各々に対して、請求項1又は2に記載の文書間関係推定モデル学習装置によって学習された前記推定モデル、及び前記推定用特徴抽出手段によって抽出された前記推定用分割文書群に対する前記観測述語に基づいて、前記マルコフロジックネットワークにより、前記推定用分割文書群における前記文書間の関係を示す潜在述語を推定する推定用文書間関係推定手段と、
を含む文書間関係推定装置。 - 分割手段によって、複数の学習用文書からなる学習用文書群を、複数の分割文書群に分割し、
特徴抽出手段によって、前記複数の分割文書群の各々に対して、前記分割文書群における学習用文書間の各々について文書間の特徴を示す観測述語を抽出すると共に、前記分割文書群における学習用文書の各々の特徴を示す観測述語を抽出し、
学習手段によって、前記複数の分割文書群の各々に対して、前記分割文書群における学習用文書間の各々について予め与えられた文書間の関係と、前記特徴抽出手段によって前記分割文書群に対して抽出された前記観測述語とに基づいて、前記観測述語又は文書間の関係を示す潜在述語を用いて記述された各論理式を用いて構築されるマルコフロジックネットワーク(MLN:Markov Logic Network)における各論理式の重みを用いて、前記マルコフロジックネットワークにより、推定対象の文書間の特徴を示す観測述語及び前記推定対象の文書の各々の特徴を示す観測述語に対して尤もらしい、前記推定対象の文書間の関係を示す潜在述語を推定するための推定モデルにおける各論理式の重みを学習することを含み、
前記学習手段によって学習することは、
他の分割文書群に対して学習された前記推定モデルにおける各論理式の重みを用いて、前記マルコフロジックネットワークにより、前記分割文書群の学習用文書間の各々の関係を示す潜在述語を推定し、前記推定された前記潜在述語が示す学習用文書間の各々の関係と、前記学習用文書間の各々について予め与えられた文書間の関係とが一致するように、前記推定モデルにおける各論理式の重みを学習することを、前記複数の分割文書群の各々に対して繰り返し、
前記学習手段によって学習することは、前記分割文書群に対して前記推定モデルにおける各論理式の重みを学習する際に、他の分割文書群に対する学習において推定された前記学習用文書間の各々の関係を示す潜在述語を、前記分割文書群に関する観測述語として追加し、前記特徴抽出手段によって前記分割文書群に対して抽出された前記観測述語と前記追加された前記観測述語に基づいて、前記追加された観測述語と文書間の関係を示す潜在述語とを用いて記述された論理式を含む前記推定モデルにおける各論理式の重みを学習する
文書間関係推定モデル学習方法。 - 分割手段によって、複数の学習用文書からなる学習用文書群を、複数の分割文書群に分割し、
特徴抽出手段によって、前記複数の分割文書群の各々に対して、前記分割文書群における学習用文書間の各々について文書間の特徴を示す観測述語を抽出すると共に、前記分割文書群における学習用文書の各々の特徴を示す観測述語を抽出し、
学習手段によって、前記複数の分割文書群の各々に対して、前記分割文書群における学習用文書間の各々について予め与えられた文書間の関係と、前記特徴抽出手段によって前記分割文書群に対して抽出された前記観測述語とに基づいて、前記観測述語又は文書間の関係を示す潜在述語を用いて記述された各論理式を用いて構築されるマルコフロジックネットワーク(MLN:Markov Logic Network)における各論理式の重みを用いて、前記マルコフロジックネットワークにより、推定対象の文書間の特徴を示す観測述語及び前記推定対象の文書の各々の特徴を示す観測述語に対して尤もらしい、前記推定対象の文書間の関係を示す潜在述語を推定するための推定モデルにおける各論理式の重みを学習することを含み、
前記学習手段によって学習することは、
他の分割文書群に対して学習された前記推定モデルにおける各論理式の重みを用いて、前記マルコフロジックネットワークにより、前記分割文書群の学習用文書間の各々の関係を示す潜在述語を推定し、前記推定された前記潜在述語が示す学習用文書間の各々の関係と、前記学習用文書間の各々について予め与えられた文書間の関係とが一致するように、前記推定モデルにおける各論理式の重みを学習することを、前記複数の分割文書群の各々に対して繰り返し、
前記分割手段によって分割することは、前記学習用文書群を、他の分割文書群と重複するように前記複数の分割文書群に分割し、
前記学習手段によって学習することは、前記分割文書群に対して前記推定モデルにおける各論理式の重みを学習する際に、他の分割文書群に対する学習において推定された前記学習用文書間の各々の関係を示す潜在述語を、観測述語として追加し、前記他の分割文書群と重複する学習用文書に関する前記追加された観測述語と前記観測述語に対応する潜在述語とを用いて記述される論理式、及び複数の潜在述語間の関係を記述した論理式を含む、前記推定モデルにおける各論理式の重みを学習する
文書間関係推定モデル学習方法。 - 推定用分割手段によって、複数の文書からなる推定対象の文書群を、複数の推定用分割文書群に分割し、
推定用特徴抽出手段によって、前記複数の推定用分割文書群の各々に対して、前記推定用分割文書群における文書間の各々について文書間の特徴を示す観測述語を抽出すると共に、前記推定用分割文書群における文書の各々の特徴を示す観測述語を抽出し、
推定用文書間関係推定手段によって、前記複数の推定用分割文書群の各々に対して、請求項4又は5に記載の文書間関係推定モデル学習方法によって学習された前記推定モデル、及び前記推定用特徴抽出手段によって抽出された前記推定用分割文書群に対する前記観測述語に基づいて、前記マルコフロジックネットワークにより、前記推定用分割文書群における前記文書間の関係を示す潜在述語を推定すること
を含む文書間関係推定方法。 - コンピュータを、請求項1又は2記載の文書間関係推定モデル学習装置又は請求項3記載の文書間関係推定装置を構成する各手段として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012247625A JP6011856B2 (ja) | 2012-11-09 | 2012-11-09 | 文書間関係推定モデル学習装置、文書間関係推定装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012247625A JP6011856B2 (ja) | 2012-11-09 | 2012-11-09 | 文書間関係推定モデル学習装置、文書間関係推定装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014096058A JP2014096058A (ja) | 2014-05-22 |
JP6011856B2 true JP6011856B2 (ja) | 2016-10-19 |
Family
ID=50939074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012247625A Active JP6011856B2 (ja) | 2012-11-09 | 2012-11-09 | 文書間関係推定モデル学習装置、文書間関係推定装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6011856B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7161091B2 (ja) * | 2017-10-31 | 2022-10-26 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、情報処理方法、プログラム |
JP7363407B2 (ja) * | 2019-11-21 | 2023-10-18 | オムロン株式会社 | 追加学習装置、方法、及びプログラム |
CN111859982B (zh) * | 2020-06-19 | 2024-04-26 | 北京百度网讯科技有限公司 | 语言模型的训练方法、装置、电子设备及可读存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2763317B2 (ja) * | 1989-02-20 | 1998-06-11 | 富士通株式会社 | データ処理装置の学習処理方式 |
-
2012
- 2012-11-09 JP JP2012247625A patent/JP6011856B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014096058A (ja) | 2014-05-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108959246B (zh) | 基于改进的注意力机制的答案选择方法、装置和电子设备 | |
US20210232762A1 (en) | Architectures for natural language processing | |
Agrawal et al. | Learning emotion-enriched word representations | |
Zhu et al. | Flexible end-to-end dialogue system for knowledge grounded conversation | |
US20180357240A1 (en) | Key-Value Memory Networks | |
US7865356B2 (en) | Method and apparatus for providing proper or partial proper name recognition | |
CN111506714A (zh) | 基于知识图嵌入的问题回答 | |
US8239349B2 (en) | Extracting data | |
WO2019212006A1 (ja) | 事象予測装置、予測モデル生成装置および事象予測用プログラム | |
CN112328800A (zh) | 自动生成编程规范问题答案的系统及方法 | |
JP2016170636A (ja) | 接続関係推定装置、方法、及びプログラム | |
Khasnabish et al. | Detecting programming language from source code using bayesian learning techniques | |
Polignano et al. | Identification Of Bot Accounts In Twitter Using 2D CNNs On User-generated Contents. | |
JP6011856B2 (ja) | 文書間関係推定モデル学習装置、文書間関係推定装置、方法、及びプログラム | |
Caicedo et al. | Bootstrapping semi-supervised annotation method for potential suicidal messages | |
EP3413218A1 (en) | Key-value memory networks | |
Alabdullatif et al. | Classification of Arabic Twitter users: a study based on user behaviour and interests | |
Violos et al. | Clustering documents using the 3-gram graph representation model | |
WO2021160822A1 (en) | A method for linking a cve with at least one synthetic cpe | |
Chaonithi et al. | A hybrid approach for Thai word segmentation with crowdsourcing feedback system | |
Umare et al. | A survey on machine learning techniques to extract chemical names from text documents | |
Lee | N-Gram Language Model | |
JP5717103B2 (ja) | 文書間関係推定装置、方法、及びプログラム | |
Sheeba et al. | A fuzzy logic based improved keyword extraction from meeting transcripts | |
Singha et al. | Bengali Text Summarization with Attention-Based Deep Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141209 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20141209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160308 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160509 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160823 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160907 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6011856 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |