JP6767042B2 - シナリオパッセージ分類器、シナリオ分類器、及びそのためのコンピュータプログラム - Google Patents
シナリオパッセージ分類器、シナリオ分類器、及びそのためのコンピュータプログラム Download PDFInfo
- Publication number
- JP6767042B2 JP6767042B2 JP2016186466A JP2016186466A JP6767042B2 JP 6767042 B2 JP6767042 B2 JP 6767042B2 JP 2016186466 A JP2016186466 A JP 2016186466A JP 2016186466 A JP2016186466 A JP 2016186466A JP 6767042 B2 JP6767042 B2 JP 6767042B2
- Authority
- JP
- Japan
- Prior art keywords
- scenario
- score
- candidate
- unit
- classifier
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
〔構成〕
〈全体構成〉
図1に、本発明の一実施の形態に係るシナリオ生成システム30のブロック図を示す。図1を参照して、シナリオ生成システム30は、因果関係を表すイベント表現のペアからなる因果関係表現を多数記憶するための、コンピュータ読出可能な記憶装置である因果関係表現記憶部40と、因果関係表現記憶部40に接続され、因果関係表現記憶部40に含まれる因果関係の内、一方の因果関係の結果部分と、他方の因果関係の原因部分とが実質的に一致するような因果関係ペアを取出し、実質的に一致する部分でこのペアを連鎖させることによりシナリオ候補を生成するためのシナリオ候補生成部42と、シナリオ候補生成部42により生成された多数のシナリオ候補を記憶するためのシナリオ候補記憶部44と、シナリオ候補記憶部44に記憶されたシナリオ候補の各々について、それらが現れる文脈を考慮して、因果関係を表すものとして妥当か否かを示すスコアを算出し、スコアの降順にシナリオ候補を並べたシナリオ候補ランキング52を出力するためのシナリオ分類器46とを含む。シナリオ候補生成部42によるシナリオ候補の生成は非特許文献1によるものと同様である。
図2を参照して、シナリオ候補生成部42は、因果関係表現記憶部40に記憶されている因果関係の内、一方の結果部と他方の原因部とが名詞句を共有するような因果関係の対を選択する因果関係対選択部70と、因果関係対選択部70により選択された因果関係の対の内、両者が共有する名詞句を結果部に持つ第1の因果関係候補を選択する第1候補選択部72と、両者が共有する名詞句を原因部に持つ第2の因果関係候補を選択する第2候補選択部74とを含む。
図3を参照して、シナリオ分類器46は、シナリオ候補記憶部44に記憶されたシナリオ候補を順番に1つずつ読出し出力するシナリオ候補読出部100と、シナリオ候補読出部100が出力したシナリオ候補について、後述するような基本素性122を抽出し、あわせて、シナリオパッセージ分類器48の出力を用いて得られるSPPR素性の抽出に用いられるSPPR素性生成用情報104を出力する基本素性抽出部102と、シナリオ候補読出部100の出力するシナリオ候補をシナリオパッセージ分類器48に送信し、SPPR素性の出力を要求するシナリオ送信部106と、シナリオ送信部106により送信された要求に応じてシナリオパッセージ分類器48から送信されてくる、そのシナリオ候補が実際の文書の文書断片によりどの程度サポートされているかを示すスコアを受信し、信頼度スコア120として出力するスコア受信部108とを含む。信頼度スコア120は、このスコアとともに、シナリオ候補をサポートするサポートパッセージが見つかったか否かを示すフラグを含む。
図4を参照して、基本素性抽出部102は、種々様々な情報を用いて基本素性122を生成する。基本素性抽出部102が基本素性122を生成する際に使用する情報には、因果関係スコア、対数頻度、名詞句クラス、抽出元文書、含意関係スコア、及び述語テンプレート極性がある。これらについて以下、説明する。
因果関係スコアとは、与えられたシナリオに含まれる因果関係の各々について、非特許文献1による教師なしのシナリオ生成で使用されていたSVMの出力するスコアを、シグモイド関数で[0,1]の範囲に正規化した値のことをいう。このスコアは、各因果関係自身の、因果関係としての確からしさを表す指標の1つである。この値は事前に計算され、因果関係ごとに因果関係スコア記憶部140にDB化して記憶されており、因果関係をキーにその因果関係スコアを検索できる。因果関係スコアの算出には、本実施の形態では非特許文献1の手法を用いた。
事前に、大量の文書に含まれる名詞句毎に、その出現頻度を求めて対数をとったものである。この情報は対数頻度記憶部142にDB化されて記憶されており、名詞句をキーに、その対数頻度を検索できる。
名詞句の意味クラスである。本実施の形態では、末尾に記載した参考文献1に開示された手法をベースに、ウェブアーカイブに含まれる大量の文書から名詞句クラスを予め算出し、名詞句クラス記憶部144にDB化して記憶してある。名詞句クラスは、名詞句をキーに名詞句クラス記憶部144を検索することができる。
後述するように、素性の一部は、与えられたシナリオに含まれる因果関係の抽出元の文書間の単語重複の類似度(コサイン類似度)を含む。本実施の形態では、この素性を算出するために、シナリオの抽出元となる文書を全て抽出元文書記憶部146に記憶しておき、実際のシナリオ候補が選択されると、その都度この類似度を算出する。
含意関係スコアは、2つの述語テンプレートの間で、一方が他方を含意している程度を表すスコアである。述語テンプレートの順序を変えることにより、2つの述語テンプレートの間でこのスコアは2つ算出される。含意関係スコアは、参考文献2にしたがって予め算出し、含意関係スコア記憶部148に2つの述語テンプレートの順序付ペアをキーにしてデータベース化し、記憶してある。
各述語テンプレートには、前述したとおり非特許文献2の技術を用いて極性が割り当てられている。この値を述語テンプレートごとに極性記憶部150に記憶しておき、述語テンプレートをキーにその極性を知ることができる。
図5を参照して、SPPR素性抽出部110は、図3に示すスコア受信部108からの信頼度スコア120、基本素性抽出部102からのSPPR素性生成用情報104(極性180、シナリオスコア182、名詞句クラス184)、及び予め算出されたグループ別意味シナリオスコアを用いてSPPR素性124を算出する。
図6を参照して、シナリオパッセージ分類器48は、ウェブ上の大量の文書を予め収集し記憶しておくウェブアーカイブ記憶部308と、シナリオ分類器46からシナリオ候補を受信するためのシナリオ候補受信部300と、シナリオ候補受信部300が受信したシナリオ候補を記憶するためのシナリオ候補記憶部302と、シナリオ候補記憶部302に記憶されたシナリオ候補328からシナリオ名詞句を抽出するための名詞句抽出部304と、名詞句抽出部304により抽出されたシナリオ名詞句が、1文書の一定範囲(本実施の形態では3文以内で、全ての名詞句を含む最小の文数の文)に全て共起している文書断片をウェブアーカイブ記憶部308で検索して取出すための文書断片検索部306とを含む。本実施の形態では、一定範囲として3文以内としているが、2文以内でもよく、また4以上の任意の文数を上限としてもよい。好ましくは、この範囲は2文以上でかつ10文以下、より好ましくは3文以上で8文以下である。
図7を参照して、シナリオパッセージ分類器48の素性抽出部314は、文書断片検索部306からの文書断片340を受けると、その中に含まれる各文について形態素解析を行って形態素列を出力する形態素解析部350と、形態素解析部350から出力される形態素列に対して係り受け解析を行い、係り受け木を出力する係り受け解析部352とを含む。こうして得られた形態素列及び係り受け木から、文書断片がシナリオ候補を表現しているか否かを判定する分類器に使用される素性が抽出される。これら素性は、大きく分けて、単語部分列(WS)、係り受け木の部分木(D1、D2)、名詞句のクラス(NC)、述語テンプレートの極性(EP1、EP2)に分類される。これら素性の概略を図10に示す。
図5に示すグループ別意味シナリオスコア記憶部220に記憶されるグループ別意味シナリオスコアの作成方法について、図8を参照して説明する。図8は、グループ別意味シナリオスコアを算出する処理を実現するプログラムのフローチャートである。
〈シナリオパッセージ分類器48の事前学習〉
図6に示すシナリオパッセージ分類器48については、事前に機械学習による学習を行う。すなわち、最初にシナリオ候補とそのシナリオ候補のサポートパッセージとからなる学習データを準備する。この学習データのシナリオ候補をシナリオ候補記憶部302に記憶させ、名詞句抽出部304によりそのシナリオ候補を十分にサポートするシナリオパッセージを予め準備しておき、素性抽出部314により素性を抽出する。分類器316にこの素性を正例として与える。また、シナリオ候補に対して明らかにそれをサポートしないパッセージをこれも予め選択しておき、同様にして素性抽出部314で素性を抽出し、分類器316に負例として与える。こうした事前学習により、分類器316によるサポーパッセージスコアの算出を事前学習できる。
図5に示すグループ別意味シナリオスコア記憶部220が記憶するグループ別意味シナリオスコア記憶部220についても、予め作成する必要がある。ただしグループ別意味シナリオスコア記憶部220は、シナリオ生成システム30の全体がある程度動作可能にならないと集積ができない。そこで、グループ別意味シナリオスコアについては、学習当初はグループ別に暫定的な値をセットしておき、シナリオ生成システム30の学習が進んでいくのにあわせて、図8に示す方法で新たに作成しなおしていくことが望ましい。
シナリオ分類器46の学習を行うにあたり、人手で学習データを準備してもよいが、学習データを準備するのは大変である。そこで、図6に示すシナリオパッセージ分類器48を用いて予め正例と思われるデータを正例記憶部54に蓄積する。この処理では、まず図1に示すウェブアーカイブ50に大量の文書を準備する。因果関係表現記憶部40には、予めこれら文書から一定量の因果関係表現を抽出し記憶させておく。
図2を参照して、シナリオ候補生成部42の因果関係対選択部70は、因果関係表現記憶部40に記憶されている因果関係の内、一方の結果部と他方の原因部とがシナリオ名詞句を共有するような因果関係の対を選択する。第1候補選択部72は、因果関係対選択部70により選択された因果関係の対の内、両者が共有するシナリオ名詞句を結果部に持つ第1の因果関係候補を選択する。第2候補選択部74は、両者が共有するシナリオ名詞句を原因部に持つ第2の因果関係候補を選択する。第1候補極性判定部76は、テンプレート極性記憶部80を参照することにより、第1候補選択部72により選択された第1の因果関係候補の述語テンプレートの極性を判定し、第1の因果関係候補に付して出力する。同様に、第2候補極性判定部78は、テンプレート極性記憶部80を参照して、第2候補選択部74により選択された第2の因果関係候補の述語テンプレートの極性を判定し、第2の因果関係候補に付して出力する。シナリオ候補選択部82は、第1候補極性判定部76の出力する第1の因果関係候補と、第2候補極性判定部78が出力する第2の因果関係候補とについて、それらの述語テンプレートの極性が一致する因果関係候補の組合せをシナリオ候補として選択し、シナリオ候補記憶部44に出力する。
図3を参照して、シナリオ分類器46のシナリオ候補読出部100は、シナリオ候補記憶部44に記憶されたシナリオ候補を順番に1つずつ読出して出力する。基本素性抽出部102は、シナリオ候補読出部100が出力したシナリオ候補から基本素性122を抽出してSVM112に出力し、あわせて、SPPR素性の抽出に用いられるSPPR素性生成用情報104をSPPR素性抽出部110に出力する。基本素性抽出部102の動作については、図4を参照して説明したことから明らかであるので、ここでは繰返さない。
上のような構成を持つシナリオ生成システム30について、テストデータを用いて従来の手法と比較する実験を行った。
テストデータとして、2つの因果関係を連結して作成した217,836のシナリオ候補を準備した。以降このデータをSRsourceと呼ぶ。シナリオランキングの評価のために、SRsourceから6,000のシナリオ候補をランダムにサンプルした後、3人のアノテータによって、サンプルしたシナリオ候補がシナリオとして適切かを判定した。シナリオ候補判定の際は、構成している因果関係それぞれが正しく、かつシナリオ全体に一貫性があり、イベント表現の繋がりが適切な場合に、シナリオ候補が適切であると判定するようにアノテータに指示した。評価に用いる最終的なラベルは多数決によって決定した。Kappa値は、0.51であった。以降、このアノテーションした6,000のシナリオをSRsamplesと呼ぶ。
まず、表2のデータを用いてサポートパッセージ判定の評価を実施した。
表1のデータを用いて、本発明の提案手法であるサポートパッセージの有無を素性として取入れたシナリオランキングのモデルの評価を実施した。本実験では、SRtraining上の交差検定によって、SVMのハイパーパラメータであるカーネルとC値を、それぞれ3次多項式カーネル、C=0.001に決定した。
この発明の上記実施の形態に係るシナリオ生成システム30及びその構成要素は、コンピュータハードウェアと、そのコンピュータハードウェアにより実行されるプログラムと、コンピュータハードウェアに格納されるデータとにより実現される。図13はこのコンピュータシステム530の外観を示し、図14はコンピュータシステム530の内部構成を示す。
〈参考文献1〉
Kazama, J. and Torisawa, K. (2008). “Inducing gazetteers for named entity recognition by large-scale clustering of dependency relations.” In Proceedings of the 46th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies (ACL-08: HLT), pp. 407-415.
〈参考文献2〉
Chikara Hashimoto, Kentaro Torisawa, Kow Kuroda, Masaki Murata, and Jun’ichi Kazama. 2009. Large-scale verb entailment acquisition from the web. In Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing (EMNLP2009), pages 1172-1181.
40 因果関係表現記憶部
42 シナリオ候補生成部
44、302 シナリオ候補記憶部
46 シナリオ分類器
48 シナリオパッセージ分類器
50 ウェブアーカイブ
52 シナリオ候補ランキング
54 正例記憶部
70 因果関係対選択部
80 テンプレート極性記憶部
82 シナリオ候補選択部
100 シナリオ候補読出部
102 基本素性抽出部
104 SPPR素性生成用情報
106 シナリオ送信部
110 SPPR素性抽出部
112 SVM
118 シナリオ候補ランキング部
140 因果関係スコア記憶部
142 対数頻度記憶部
144、310 名詞句クラス記憶部
146 抽出元文書記憶部
152、328 シナリオ候補
154 対数頻度検出部
156、304、364 名詞句抽出部
158、366 名詞句クラス決定部
164、368、374 テンプレート抽出部
168 シナリオスコア算出部
172、370、376 極性決定部
174 単語類似度算出部
220 グループ別意味シナリオスコア記憶部
306 文書断片検索部
314 素性抽出部
316 分類器
318 スコア蓄積部
330 最大値選択部
340 文書断片
Claims (6)
- 連鎖した因果関係を表す可能性がある少なくとも3つのイベント表現からなるシナリオ候補を受け、複数の文書において当該シナリオ候補の内容を支持するパッセージを求めることにより、当該シナリオ候補の信頼度を表すスコアを出力するためのシナリオパッセージ分類器であって、
シナリオパッセージ分類器は、前記複数の文書を記憶する、機械可読な記憶装置に接続されて用いられ、
前記シナリオ候補に含まれる全ての名詞句が、1文書の一定数以内の文を含む文書断片内で共起しているような文書断片の集合を前記複数の文書内で検索するための文書断片検索手段と、
前記シナリオ候補と、前記文書断片検索手段により検索された各文書断片の各々との組み合わせの各々から、予め定められた素性を抽出するための素性抽出手段と、
前記シナリオ候補に関する前記組み合わせの各々について、前記素性を受け、当該素性の元となった前記文書断片に基づいて算出される、入力されたシナリオ候補の信頼度を表すスコアを出力するよう、予め機械学習により学習済のスコア出力手段と、
前記シナリオ候補に関する前記組み合わせの各々について、前記スコア出力手段により出力されたスコアの内の最大値を前記シナリオ候補の信頼度として選択し出力するためのスコア選択手段とを含む、シナリオパッセージ分類器。 - 前記一定数は2以上かつ10以下の整数である、請求項1に記載のシナリオパッセージ分類器。
- 前記一定数は3以上かつ8以下である、請求項2に記載のシナリオパッセージ分類器。
- 前記シナリオ候補のうち、前記スコアがしきい値以上となったシナリオ候補を記憶するための記憶手段をさらに含む、請求項1に記載のシナリオパッセージ分類器。
- 連鎖した因果関係を表す可能性がある少なくとも3つのイベント表現からなるシナリオ候補を受け、当該シナリオ候補が因果関係として妥当か否かを判定するシナリオ分類器であって、
前記シナリオ候補の入力を受け、当該シナリオ候補を、請求項1〜請求項3の何れかに記載のシナリオパッセージ分類器に与え、当該シナリオパッセージ分類器の出力する信頼度のスコアを受信するスコア受信手段と、
前記シナリオ候補から、所定の素性を抽出するための素性抽出手段と、
前記素性抽出手段により抽出された前記所定の素性と、前記スコア受信手段が受信したスコアとを含む入力を受けると、前記シナリオ候補の、因果関係としての妥当性を示すスコアを出力するよう、予め機械学習により学習済の判定手段とを含む、シナリオ分類器。 - コンピュータを、請求項1〜請求項5の何れかに記載の各手段として機能させる、コンピュータプログラム。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016186466A JP6767042B2 (ja) | 2016-09-26 | 2016-09-26 | シナリオパッセージ分類器、シナリオ分類器、及びそのためのコンピュータプログラム |
KR1020197006484A KR20190057282A (ko) | 2016-09-26 | 2017-09-25 | 시나리오 패시지 분류기, 시나리오 분류기, 및 그것을 위한 컴퓨터 프로그램 |
CN201780057398.4A CN109791632B (zh) | 2016-09-26 | 2017-09-25 | 场景片段分类器、场景分类器以及记录介质 |
PCT/JP2017/034405 WO2018056423A1 (ja) | 2016-09-26 | 2017-09-25 | シナリオパッセージ分類器、シナリオ分類器、及びそのためのコンピュータプログラム |
US16/331,977 US10963646B2 (en) | 2016-09-26 | 2017-09-25 | Scenario passage pair recognizer, scenario classifier, and computer program therefor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016186466A JP6767042B2 (ja) | 2016-09-26 | 2016-09-26 | シナリオパッセージ分類器、シナリオ分類器、及びそのためのコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018055142A JP2018055142A (ja) | 2018-04-05 |
JP6767042B2 true JP6767042B2 (ja) | 2020-10-14 |
Family
ID=61689998
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016186466A Active JP6767042B2 (ja) | 2016-09-26 | 2016-09-26 | シナリオパッセージ分類器、シナリオ分類器、及びそのためのコンピュータプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US10963646B2 (ja) |
JP (1) | JP6767042B2 (ja) |
KR (1) | KR20190057282A (ja) |
CN (1) | CN109791632B (ja) |
WO (1) | WO2018056423A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6721179B2 (ja) * | 2016-10-05 | 2020-07-08 | 国立研究開発法人情報通信研究機構 | 因果関係認識装置及びそのためのコンピュータプログラム |
US10682761B2 (en) * | 2017-06-21 | 2020-06-16 | Nice Ltd | System and method for detecting and fixing robotic process automation failures |
JP6875457B2 (ja) * | 2019-06-18 | 2021-05-26 | ヤフー株式会社 | 取得装置、取得方法、および取得プログラム |
KR102270169B1 (ko) * | 2019-07-26 | 2021-06-25 | 주식회사 수아랩 | 데이터 관리 방법 |
US11328019B2 (en) * | 2020-04-03 | 2022-05-10 | International Business Machines Corporation | Providing causality augmented information responses in a computing environment |
JP2022122029A (ja) * | 2021-02-09 | 2022-08-22 | 株式会社東芝 | データ処理装置、データ処理方法及びデータ処理プログラム |
JP2022156335A (ja) * | 2021-03-31 | 2022-10-14 | 株式会社日立製作所 | 多段推論装置及びその方法 |
CN113590903B (zh) * | 2021-09-27 | 2022-01-25 | 广东电网有限责任公司 | 一种情报数据的管理方法及装置 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11250085A (ja) | 1998-03-02 | 1999-09-17 | Nippon Telegr & Teleph Corp <Ntt> | 事象推移予測方法および事象推移予測プログラムを記録した記録媒体 |
JP4565106B2 (ja) * | 2005-06-23 | 2010-10-20 | 独立行政法人情報通信研究機構 | 二項関係抽出装置,二項関係抽出処理を用いた情報検索装置,二項関係抽出処理方法,二項関係抽出処理を用いた情報検索処理方法,二項関係抽出処理プログラム,および二項関係抽出処理を用いた情報検索処理プログラム |
JP5034580B2 (ja) * | 2007-03-15 | 2012-09-26 | オムロン株式会社 | 因果推論装置、その制御プログラムおよび制御方法 |
JP4778474B2 (ja) * | 2007-05-14 | 2011-09-21 | 日本電信電話株式会社 | 質問応答装置、質問応答方法、質問応答プログラム並びにそのプログラムを記録した記録媒体 |
CN101242278A (zh) * | 2008-02-18 | 2008-08-13 | 华中科技大学 | 网络多步攻击意图在线识别方法 |
CN101751626B (zh) * | 2010-01-04 | 2012-08-29 | 北京航空航天大学 | 组合服务演化中运行实例的在线迁移方法 |
US9367609B1 (en) * | 2010-03-05 | 2016-06-14 | Ustringer LLC | Method and apparatus for submitting, organizing, and searching for content |
US9092561B2 (en) * | 2010-10-20 | 2015-07-28 | Microsoft Technology Licensing, Llc | Model checking for distributed application validation |
JP2012093870A (ja) * | 2010-10-26 | 2012-05-17 | Nec Corp | システム開発における要求獲得支援システム、要求獲得支援方法およびプログラム |
CN102427507B (zh) * | 2011-09-30 | 2014-03-05 | 北京航空航天大学 | 一种基于事件模型的足球视频集锦自动合成方法 |
JP5834883B2 (ja) * | 2011-12-20 | 2015-12-24 | 日本電気株式会社 | 因果関係要約方法、因果関係要約装置及び因果関係要約プログラム |
JP5825676B2 (ja) * | 2012-02-23 | 2015-12-02 | 国立研究開発法人情報通信研究機構 | ノン・ファクトイド型質問応答システム及びコンピュータプログラム |
US10679166B2 (en) * | 2012-09-28 | 2020-06-09 | Oracle International Corporation | Supply chain financial orchestration system |
US9092332B2 (en) * | 2013-05-02 | 2015-07-28 | Microsoft Technology Licensing, Llc | Activity based sampling of diagnostics data |
JP6150282B2 (ja) * | 2013-06-27 | 2017-06-21 | 国立研究開発法人情報通信研究機構 | ノン・ファクトイド型質問応答システム及びコンピュータプログラム |
JP5904559B2 (ja) * | 2013-12-20 | 2016-04-13 | 国立研究開発法人情報通信研究機構 | シナリオ生成装置、及びそのためのコンピュータプログラム |
JP5907393B2 (ja) * | 2013-12-20 | 2016-04-26 | 国立研究開発法人情報通信研究機構 | 複雑述語テンプレート収集装置、及びそのためのコンピュータプログラム |
JP6403382B2 (ja) * | 2013-12-20 | 2018-10-10 | 国立研究開発法人情報通信研究機構 | フレーズペア収集装置、及びそのためのコンピュータプログラム |
US9336126B1 (en) * | 2014-06-24 | 2016-05-10 | Amazon Technologies, Inc. | Client-side event logging for heterogeneous client environments |
EP2985711A1 (en) * | 2014-08-14 | 2016-02-17 | Accenture Global Services Limited | System for automated analysis of clinical text for pharmacovigilance |
JP6618735B2 (ja) * | 2015-08-31 | 2019-12-11 | 国立研究開発法人情報通信研究機構 | 質問応答システムの訓練装置及びそのためのコンピュータプログラム |
US10303695B2 (en) * | 2015-10-21 | 2019-05-28 | Oracle International Corporation | Query decomposition for scalability of continuous query processing |
CN105808244A (zh) * | 2016-03-01 | 2016-07-27 | 杭州师范大学 | 一种基于工作流的动态数据可视化分析工具 |
-
2016
- 2016-09-26 JP JP2016186466A patent/JP6767042B2/ja active Active
-
2017
- 2017-09-25 US US16/331,977 patent/US10963646B2/en active Active
- 2017-09-25 CN CN201780057398.4A patent/CN109791632B/zh active Active
- 2017-09-25 WO PCT/JP2017/034405 patent/WO2018056423A1/ja active Application Filing
- 2017-09-25 KR KR1020197006484A patent/KR20190057282A/ko unknown
Also Published As
Publication number | Publication date |
---|---|
US10963646B2 (en) | 2021-03-30 |
WO2018056423A1 (ja) | 2018-03-29 |
KR20190057282A (ko) | 2019-05-28 |
US20190251171A1 (en) | 2019-08-15 |
CN109791632B (zh) | 2023-07-21 |
JP2018055142A (ja) | 2018-04-05 |
CN109791632A (zh) | 2019-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6767042B2 (ja) | シナリオパッセージ分類器、シナリオ分類器、及びそのためのコンピュータプログラム | |
JP7282940B2 (ja) | 電子記録の文脈検索のためのシステム及び方法 | |
US20240028837A1 (en) | Device and method for machine reading comprehension question and answer | |
US10496928B2 (en) | Non-factoid question-answering system and method | |
US10339453B2 (en) | Automatically generating test/training questions and answers through pattern based analysis and natural language processing techniques on the given corpus for quick domain adaptation | |
JP2013502643A (ja) | 構造化データ翻訳装置、システム及び方法 | |
JP5216063B2 (ja) | 未登録語のカテゴリを決定する方法と装置 | |
JP5710581B2 (ja) | 質問応答装置、方法、及びプログラム | |
Abdeen et al. | A closer look at arabic text classification | |
Aquino et al. | Keyword identification in spanish documents using neural networks | |
Zhang et al. | Multilingual sentence categorization and novelty mining | |
JP2014106665A (ja) | 文書検索装置、文書検索方法 | |
US11227183B1 (en) | Section segmentation based information retrieval with entity expansion | |
JP4979637B2 (ja) | 複合語の区切り位置を推定する複合語区切り推定装置、方法、およびプログラム | |
CN110705285B (zh) | 一种政务文本主题词库构建方法、装置、服务器及可读存储介质 | |
Klang et al. | Linking, searching, and visualizing entities in wikipedia | |
Ali et al. | A novel framework for plagiarism detection: A case study for urdu language | |
US9507855B2 (en) | System and method for searching index content data using multiple proximity keyword searches | |
Plum et al. | Toponym detection in the bio-medical domain: A hybrid approach with deep learning | |
Nyandag et al. | Keyword extraction based on statistical information for Cyrillic Mongolian script | |
Nawab et al. | External plagiarism detection using information retrieval and sequence alignment | |
Dai et al. | Improving scientific relation classification with task specific supersense | |
Mehryary et al. | Filtering large-scale event collections using a combination of supervised and unsupervised learning for event trigger classification | |
Wang et al. | A context-aware automatic Chinese transliterated person names recognition approach | |
Doshi et al. | Automatic Metadata Harvesting from Digital Content Using NLP |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190822 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200908 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200914 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6767042 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |