JP2012243125A - 因果単語対抽出装置、因果単語対抽出方法および因果単語対抽出用プログラム - Google Patents
因果単語対抽出装置、因果単語対抽出方法および因果単語対抽出用プログラム Download PDFInfo
- Publication number
- JP2012243125A JP2012243125A JP2011113402A JP2011113402A JP2012243125A JP 2012243125 A JP2012243125 A JP 2012243125A JP 2011113402 A JP2011113402 A JP 2011113402A JP 2011113402 A JP2011113402 A JP 2011113402A JP 2012243125 A JP2012243125 A JP 2012243125A
- Authority
- JP
- Japan
- Prior art keywords
- expression
- cause
- word
- pair
- causal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】問題・原因表現関連度計算手段85は、抽出された問題表現と原因表現との関連度を、その問題表現と原因表現の組に含まれる各因果単語対候補の尤度スコア、その問題表現における因果単語対候補の問題単語の特徴度、および、その原因表現における因果単語対候補の原因単語の特徴度に基づいて計算する。因果単語対学習手段86は、問題・原因表現関連度計算手段85が計算した問題表現・原因表現対の関連度と、その問題表現・原因表現対における問題表現とその問題表現・原因表現対における原因表現とは異なる原因表現との関連度の差が予め定めた閾値以下である場合、その関連度の計算に利用した因果単語対候補の尤度スコアを、問題表現における問題単語の特徴度と、原因表現における原因単語の特徴度との積に比例した値に応じて変化させる。
【選択図】図5
Description
図1は、本発明による因果単語対抽出装置の一実施形態を示すブロック図である。本実施形態における因果単語対抽出装置は、入力手段1と、プログラム制御により動作するデータ処理装置2と、記憶装置3と、出力手段4とを備えている。
(されません|されませんでした).{0,5}(。|、|$)
(てしまいます|てしまいました).{0,5}(。|、|$)
(失敗します|失敗しました).{0,5}(。|、|$)
エラーコード[0−9]+(が|も)(発生|出る|でる).{0,5}(。|、|$)
...
ことが原因.{0,5}(思われ|考えられ|。|、|$)
ため.{0,5}(思われ|考えられ|。|、|$)
ことにより
...
2 データ処理装置
21 問題・原因表現対抽出手段
22 因果単語対候補抽出手段
23 問題・原因表現関連度計算手段
24 因果単語対学習手段
25 因果単語対抽出手段
3 記憶装置
31 問題パタン辞書記憶手段
32 原因パタン辞書記憶手段
4 出力手段
Claims (9)
- ある事象の問題の内容を示す表現である問題表現を抽出する規則を含む問題パタン辞書を記憶する問題パタン辞書記憶手段と、
ある事象で問題が発生した原因を示す表現である原因表現を抽出する規則を含む原因パタン辞書を記憶する原因パタン辞書記憶手段と、
入力された複数の応答事例を含む文書群の中から前記問題パタン辞書を用いて前記問題表現を抽出し、前記文書群の中から前記原因パタン辞書を用いて前記原因表現を抽出し、同一の応答事例から抽出した前記問題表現と前記原因表現の対である問題表現・原因表現対を作成する問題・原因表現対抽出手段と、
抽出された問題表現・原因表現対の各々について、問題表現中に含まれる単語である問題単語および原因表現中に含まれる単語である原因単語を抽出し、当該問題単語と当該原因単語のそれぞれを対にした単語対を因果単語対候補として作成する因果単語対候補抽出手段と、
前記問題・原因表現対抽出手段が抽出した問題表現と原因表現との関連度を、当該問題表現と原因表現の組に含まれる各因果単語対候補の当該因果単語対候補が因果単語対である尤もらしさを示すスコアである尤度スコア、当該問題表現における因果単語対候補の問題単語の特徴度、および、当該原因表現における因果単語対候補の原因単語の特徴度に基づいて計算する問題・原因表現関連度計算手段と、
前記問題・原因表現関連度計算手段が計算した問題表現・原因表現対の関連度と、当該問題表現・原因表現対における問題表現と当該問題表現・原因表現対における原因表現とは異なる原因表現との関連度の差が予め定めた閾値以下である場合、当該関連度の計算に利用した因果単語対候補の前記尤度スコアを、前記問題表現における問題単語の特徴度と、前記原因表現における原因単語の特徴度との積に比例した値に応じて変化させる因果単語対学習手段と、
前記尤度スコアが閾値以上の因果単語対候補を因果単語対として抽出する因果単語対抽出手段とを備えた
ことを特徴とする因果単語対抽出装置。 - 因果単語対候補抽出手段は、抽出した単語対のうち、入力された複数の応答事例全件に対する出現頻度が、予め定めた基準よりも高い単語対を因果単語対候補として抽出する
請求項1記載の因果単語対抽出装置。 - 因果単語対学習手段は、両者の関連度の差が予め定めた閾値以下である場合、因果単語対候補の尤度スコアを、問題表現・原因表現対に含まれる原因表現の問題単語の特徴度と当該問題表現・原因表現対における原因表現とは異なる原因表現の特徴度との差分値に対して問題表現における問題単語の特徴度を乗じた値に応じて変化させる
請求項1または請求項2記載の因果単語対抽出装置。 - 因果単語対候補抽出手段は、問題単語の特徴度として問題表現に偏って出現するほど高くなる特徴度を用い、原因単語の特徴度として原因表現に偏って出現する単語ほど高くなる特徴度を用いる
請求項1から請求項3のうちのいずれか1項に記載の因果単語対抽出装置。 - 因果単語対学習手段は、オンライン学習により学習データを作成する
請求項1から請求項4のうちのいずれか1項に記載の因果単語対抽出装置。 - 入力された複数の応答事例を含む文書群の中から、ある事象の問題の内容を示す表現である問題表現を抽出する規則を含む問題パタン辞書を用いて当該問題表現を抽出し、
前記文書群の中から、ある事象で問題が発生した原因を示す表現である原因表現を抽出する規則を含む原因パタン辞書を用いて当該原因表現を抽出し、
同一の応答事例から抽出された前記問題表現と前記原因表現の対である問題表現・原因表現対を作成し、
抽出された問題表現・原因表現対の各々について、問題表現中に含まれる単語である問題単語および原因表現中に含まれる単語である原因単語を抽出し、
前記問題単語と前記原因単語のそれぞれを対にした単語対を因果単語対候補として作成し、
前記文書群から抽出された問題表現と原因表現との関連度を、当該問題表現と原因表現の組に含まれる各因果単語対候補の当該因果単語対候補が因果単語対である尤もらしさを示すスコアである尤度スコア、当該問題表現における因果単語対候補の問題単語の特徴度、および、当該原因表現における因果単語対候補の原因単語の特徴度に基づいて計算し、
問題表現・原因表現対の関連度と、当該問題表現・原因表現対における問題表現と当該問題表現・原因表現対における原因表現とは異なる原因表現との関連度の差が予め定めた閾値以下である場合、当該関連度の計算に利用した因果単語対候補の前記尤度スコアを、前記問題表現における問題単語の特徴度と、前記原因表現における原因単語の特徴度との積に比例した値に応じて変化させ、
前記尤度スコアが閾値以上の因果単語対候補を因果単語対として抽出する
ことを特徴とする因果単語対抽出方法。 - 抽出された単語対のうち、入力された複数の応答事例全件に対する出現頻度が、予め定めた基準よりも高い単語対を因果単語対候補として抽出する
請求項6記載の因果単語対抽出方法。 - コンピュータに、
入力された複数の応答事例を含む文書群の中から、ある事象の問題の内容を示す表現である問題表現を抽出する規則を含む問題パタン辞書を用いて当該問題表現を抽出し、前記文書群の中から、ある事象で問題が発生した原因を示す表現である原因表現を抽出する規則を含む原因パタン辞書を用いて当該原因表現を抽出し、同一の応答事例から抽出した前記問題表現と前記原因表現の対である問題表現・原因表現対を作成する問題・原因表現対抽出処理、
抽出された問題表現・原因表現対の各々について、問題表現中に含まれる単語である問題単語および原因表現中に含まれる単語である原因単語を抽出し、当該問題単語と当該原因単語のそれぞれを対にした単語対を因果単語対候補として作成する因果単語対候補抽出処理、
前記問題・原因表現対抽出処理で抽出された問題表現と原因表現との関連度を、当該問題表現と原因表現の組に含まれる各因果単語対候補の当該因果単語対候補が因果単語対である尤もらしさを示すスコアである尤度スコア、当該問題表現における因果単語対候補の問題単語の特徴度、および、当該原因表現における因果単語対候補の原因単語の特徴度に基づいて計算する問題・原因表現関連度計算処理、
前記問題・原因表現関連度計算処理で計算された問題表現・原因表現対の関連度と、当該問題表現・原因表現対における問題表現と当該問題表現・原因表現対における原因表現とは異なる原因表現との関連度の差が予め定めた閾値以下である場合、当該関連度の計算に利用した因果単語対候補の前記尤度スコアを、前記問題表現における問題単語の特徴度と、前記原因表現における原因単語の特徴度との積に比例した値に応じて変化させる因果単語対学習処理、および、
前記尤度スコアが閾値以上の因果単語対候補を因果単語対として抽出する因果単語対抽出処理
を実行させるための因果単語対抽出用プログラム。 - コンピュータに、
因果単語対候補抽出処理で、抽出した単語対のうち、入力された複数の応答事例全件に対する出現頻度が、予め定めた基準よりも高い単語対を因果単語対候補として抽出させる
請求項8記載の因果単語対抽出用プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011113402A JP5682448B2 (ja) | 2011-05-20 | 2011-05-20 | 因果単語対抽出装置、因果単語対抽出方法および因果単語対抽出用プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011113402A JP5682448B2 (ja) | 2011-05-20 | 2011-05-20 | 因果単語対抽出装置、因果単語対抽出方法および因果単語対抽出用プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012243125A true JP2012243125A (ja) | 2012-12-10 |
JP5682448B2 JP5682448B2 (ja) | 2015-03-11 |
Family
ID=47464759
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011113402A Active JP5682448B2 (ja) | 2011-05-20 | 2011-05-20 | 因果単語対抽出装置、因果単語対抽出方法および因果単語対抽出用プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5682448B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017037544A (ja) * | 2015-08-12 | 2017-02-16 | 国立研究開発法人情報通信研究機構 | 未来シナリオ生成装置及び方法、並びにコンピュータプログラム |
JP2018129022A (ja) * | 2017-02-09 | 2018-08-16 | キーランド テクノロジー シーオー., エルティーディー. | インダストリアル・インターネットオペレーティングシステムに基づく異種フィールドデバイス制御管理システム |
WO2020144736A1 (ja) * | 2019-01-08 | 2020-07-16 | 三菱電機株式会社 | 意味関係学習装置、意味関係学習方法、及び意味関係学習プログラム |
JP2021108212A (ja) * | 2019-06-18 | 2021-07-29 | ヤフー株式会社 | 取得装置、取得方法、および取得プログラム |
WO2021220478A1 (ja) * | 2020-04-30 | 2021-11-04 | 三菱電機株式会社 | 学習データ作成装置、方法、及びプログラム |
WO2022144968A1 (ja) * | 2020-12-28 | 2022-07-07 | 日本電気株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101741248B1 (ko) | 2016-09-29 | 2017-05-31 | 중앙대학교 산학협력단 | 복수의 변수를 이용한 인과관계 추정 방법 및 장치 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008226168A (ja) * | 2007-03-15 | 2008-09-25 | Omron Corp | 因果推論装置、その制御プログラムおよび制御方法 |
JP2009059323A (ja) * | 2007-09-04 | 2009-03-19 | Omron Corp | 知識生成システム |
-
2011
- 2011-05-20 JP JP2011113402A patent/JP5682448B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008226168A (ja) * | 2007-03-15 | 2008-09-25 | Omron Corp | 因果推論装置、その制御プログラムおよび制御方法 |
JP2009059323A (ja) * | 2007-09-04 | 2009-03-19 | Omron Corp | 知識生成システム |
Non-Patent Citations (2)
Title |
---|
山田 一郎: "クローズドキャプションを対象とした因果関係知識抽出の検討", FIT2005 第4回情報科学技術フォーラム 一般講演論文集 第2分冊, JPN6014040892, 22 August 2005 (2005-08-22), ISSN: 0002965406 * |
村田 真樹: "機械学習法を用いた日本語格解析−教師信号借用型と非借用型,さらには併用型−", 情報処理学会研究報告, vol. 第2001巻第69号, JPN6014040894, 17 July 2001 (2001-07-17), pages 113 - 120, ISSN: 0002965407 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017037544A (ja) * | 2015-08-12 | 2017-02-16 | 国立研究開発法人情報通信研究機構 | 未来シナリオ生成装置及び方法、並びにコンピュータプログラム |
JP2018129022A (ja) * | 2017-02-09 | 2018-08-16 | キーランド テクノロジー シーオー., エルティーディー. | インダストリアル・インターネットオペレーティングシステムに基づく異種フィールドデバイス制御管理システム |
WO2020144736A1 (ja) * | 2019-01-08 | 2020-07-16 | 三菱電機株式会社 | 意味関係学習装置、意味関係学習方法、及び意味関係学習プログラム |
JPWO2020144736A1 (ja) * | 2019-01-08 | 2021-02-18 | 三菱電機株式会社 | 意味関係学習装置、意味関係学習方法、及び意味関係学習プログラム |
JP2021108212A (ja) * | 2019-06-18 | 2021-07-29 | ヤフー株式会社 | 取得装置、取得方法、および取得プログラム |
JP7292324B2 (ja) | 2019-06-18 | 2023-06-16 | ヤフー株式会社 | 取得装置、取得方法、および取得プログラム |
JPWO2021220478A1 (ja) * | 2020-04-30 | 2021-11-04 | ||
JP7106036B2 (ja) | 2020-04-30 | 2022-07-25 | 三菱電機株式会社 | 学習データ作成装置、方法、及びプログラム |
KR20220145422A (ko) * | 2020-04-30 | 2022-10-28 | 미쓰비시덴키 가부시키가이샤 | 학습 데이터 작성 장치, 방법, 및 프로그램 |
EP4131056A4 (en) * | 2020-04-30 | 2023-04-26 | Mitsubishi Electric Corporation | DEVICE, METHOD AND PROGRAM FOR GENERATION OF TRAINING DATA |
WO2021220478A1 (ja) * | 2020-04-30 | 2021-11-04 | 三菱電機株式会社 | 学習データ作成装置、方法、及びプログラム |
KR102635118B1 (ko) * | 2020-04-30 | 2024-02-07 | 미쓰비시덴키 가부시키가이샤 | 학습 데이터 작성 장치, 방법, 및 프로그램 |
WO2022144968A1 (ja) * | 2020-12-28 | 2022-07-07 | 日本電気株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JP7529048B2 (ja) | 2020-12-28 | 2024-08-06 | 日本電気株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5682448B2 (ja) | 2015-03-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rousselet et al. | An introduction to the bootstrap: a versatile method to make inferences by using data-driven simulations. | |
KR102408083B1 (ko) | 논팩토이드형 질의응답 시스템 및 방법 그리고 그것을 위한 컴퓨터 프로그램 | |
JP5682448B2 (ja) | 因果単語対抽出装置、因果単語対抽出方法および因果単語対抽出用プログラム | |
Mena‐Chalco et al. | Brazilian bibliometric coauthorship networks | |
US9946763B2 (en) | Evaluating passages in a question answering computer system | |
US11436416B2 (en) | Automated conversation review to surface virtual assistant misunderstandings | |
CN112667794A (zh) | 一种基于孪生网络bert模型的智能问答匹配方法及系统 | |
US20190286693A1 (en) | Structured term recognition | |
Zhang et al. | Big data versus the crowd: Looking for relationships in all the right places | |
US9270749B2 (en) | Leveraging social media to assist in troubleshooting | |
US20120310930A1 (en) | Keyword Suggestion for Efficient Legal E-Discovery | |
US11875240B1 (en) | Tuning a generative artificial intelligence model | |
Kejriwal et al. | A two-step blocking scheme learner for scalable link discovery. | |
CN114090784A (zh) | 一种材料领域知识图谱的实体标签聚类方法及装置 | |
Sarkar et al. | NLP algorithm based question and answering system | |
Avogadro et al. | Estimating Link Confidence for Human-in-the-loop Table Annotation | |
Weis | A case based reasoning approach for answer reranking in question answering | |
Braylan et al. | A General Model for Aggregating Annotations Across Simple, Complex, and Multi-Object Annotation Tasks | |
Dumitrache et al. | False positive and cross-relation signals in distant supervision data | |
CN113297419B (zh) | 视频知识点确定方法、装置、电子设备和存储介质 | |
CN112507082B (zh) | 一种智能识别不当文本交互的方法、装置和电子设备 | |
Lu et al. | Semantic link analysis for finding answer experts | |
Bansal et al. | Literature review of finding duplicate bugs in open source systems | |
Cai et al. | TKG: Telecom Knowledge Governance Framework for LLM Application | |
Wunderle et al. | Pointer Networks: A Unified Approach to Extracting German Opinions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140402 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140910 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140930 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141127 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141216 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141229 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5682448 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |