JP2011232902A - 不具合を示す述語表現を抽出するための不具合述語表現抽出装置、不具合述語表現抽出方法及び不具合述語表現抽出プログラム - Google Patents
不具合を示す述語表現を抽出するための不具合述語表現抽出装置、不具合述語表現抽出方法及び不具合述語表現抽出プログラム Download PDFInfo
- Publication number
- JP2011232902A JP2011232902A JP2010101663A JP2010101663A JP2011232902A JP 2011232902 A JP2011232902 A JP 2011232902A JP 2010101663 A JP2010101663 A JP 2010101663A JP 2010101663 A JP2010101663 A JP 2010101663A JP 2011232902 A JP2011232902 A JP 2011232902A
- Authority
- JP
- Japan
- Prior art keywords
- expression
- predicate
- defect
- indicating
- predicate expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/008—Reliability or availability analysis
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【解決手段】不具合述語表現抽出装置100は、突然性を示す連用修飾表現または再現性を示す連用修飾語のいずれか一方の近傍に現れる述語表現を、不具合を示す述語表現の候補として抽出し、また、常性を示す連用修飾表現の近傍に現れる述語表現を、正常を示す述語表現として抽出し、不具合を示す述語表現の候補のリストから、正常を示す述語表現を取り除いて、不具合を示す述語表現を抽出する。
【選択図】図1
Description
これに代えて、検出した述語表現の近傍の定義を、検出した述語表現の主格としてもよい。即ち、分析対象抽出部150は、不具合述語表現格納部145に格納されている述語表現と一致する表現を解析対象のテキスト・データから検出し、該検出した述語表現の主格を抽出して、検出した述語表現の近傍に出現する名詞表現としてもよい。
ここでDは全データを表現し、#はデータの件数を示す。すなわち、#(A∩B)はAとBの両方を含むデータの件数であり、#Dはデータ全体の件数である。相関値は上記の数式における#(A∩B) が小さい場合、値の信頼性が低くなる。 信頼性が無いのに高い相関値が算出されてしまい、分析作業の効率や精度が落ちる、といったことがないように、区間推定を用いて、信頼性の無い値は小さめに補正することができる。区間推定法では、「文書が無限にある場合の真の相関値αを未知数とした際、一定確率以下の偶然を除いて、現状の相関値を実現し得る最小のα」を算出する。分析結果生成部160により生成された分析結果は、プリンタやディスプレイ等の出力装置に出力してよい。
Claims (9)
- 特定の製品分野に属する製品の使用に関するテキスト・データから、不具合を示す述語表現を抽出するための不具合述語表現抽出装置であって、
突然性を示す連用修飾表現または再現性示す連用修飾表現の少なくとも一方の連用修飾表現を格納する不具合表現検出用の連用修飾表現格納部と、
前記不具合表現検出用の連用修飾表現格納部に格納されている連用修飾表現と一致する表現を前記テキスト・データから検出し、検出した前記表現の近傍に出現する前記テキスト・データ内の述語表現を、不具合を示す述語表現の候補として抽出する不具合述語表現候補抽出部と、
正常性を示す連用修飾表現を格納する正常表現検出用の連用修飾表現格納部と、
前記正常表現検出用の連用修飾表現格納部に格納されている連用修飾表現と一致する表現を前記テキスト・データから検出し、検出した前記表現の近傍に出現する前記テキスト・データ内の述語表現を、正常を示す述語表現として抽出する正常述語表現抽出部と、
前記不具合を示す述語表現の候補として抽出された述語表現のリストから、前記正常述語表現抽出部により抽出された述語表現を除いた残りを、前記不具合を示す述語表現として取得する不具合述語表現取得部と
を含む不具合述語表現抽出装置。 - 前記突然性を示す連用修飾表現は、「突然」、「急に」、「いきなり」、「突如」、「突如として」、「突然に」、「不意に」、「唐突」、「たちまち」、「出し抜け」、「咄嗟」、「俄然」、「忽然」、及び「はたと」のうちの少なくとも1つを含み、前記再現性を示す連用修飾表現は、「度々」、「時々」、「頻繁」に、「何度も」、「再三」、及び「しきりに」のうちの少なくとも1つを含み、前記正常性を示す連用修飾表現は、「きちんと」、「しっかり」、「正しく」、「普通に」、「正確に」、「一向に」、「全然」、「ほとんど」、「正常に」、「きっちりと」、「ちゃんと」、「ちょうど」、「整然と」、「きっかり」、「きっかりと」、及び「かっちり」のうちの少なくとも1つを含む、請求項1に記載の不具合述語表現抽出装置。
- 前記不具合述語表現候補抽出部は、前記不具合表現検出用の連用修飾表現格納部に格納されている連用修飾表現と一致する表現を前記テキスト・データから検出し、検出した前記表現が直接修飾する述語表現を、前記不具合を示す述語表現の候補として抽出し、前記正常述語表現抽出部は、前記正常表現検出用の連用修飾表現格納部に格納されている連用修飾表現と一致する表現を前記テキスト・データから検出し、検出した前記表現が直接修飾する述語表現を、前記正常を示す述語表現として抽出する、請求項2に記載の不具合述語表現抽出装置。
- 前記不具合述語表現候補抽出部は、前記不具合を示す述語表現の候補として抽出する各述語表現について、前記不具合表現検出用の連用修飾表現格納部に格納されている1以上の連用修飾表現のいずれかの近傍に出現する出現回数をカウントし、前記正常述語表現抽出部は、前記正常を示す述語表現として抽出する各述語表現について、前記正常表現検出用の連用修飾表現格納部に格納されている1以上の連用修飾表現のいずれかの近傍に出現する出現回数をカウントし、前記不具合述語表現取得部は、前記不具合述語表現候補抽出部及び前記正常述語表現抽出部の両抽出部によって同じ述語表現が抽出された場合、該述語表現に対し前記両抽出部がそれぞれカウントした出現回数に基づいて、前記同じ述語表現を、前記不具合を示す述語表現とするか否かを決定する、請求項2に記載の不具合述語表現抽出装置。
- 製品の使用に関するテキスト・データから、特定の不具合を示す述語表現と共起する連用修飾表現を抽出し、該連用修飾表現を前記不具合表現検出用の連用修飾表現格納部に登録する、不具合表現検出用の連用修飾表現登録部を更に含む請求項2に記載の不具合述語表現抽出装置。
- 前記不具合述語表現取得部により取得された前記不具合を示す述語表現を格納する不具合述語表現格納部と、
前記特定の製品分野に属する製品の使用に関する解析対象のテキスト・データから、前記不具合述語表現格納部に格納されている不具合を示す述語表現と一致する表現を検出し、検出した前記表現の近傍に出現する前記解析対象のテキスト・データ内の名詞表現を抽出する分析対象抽出部と、
検出された前記不具合を示す述語表現と一致する前記表現と抽出された前記名詞表現との組を分析対象として、該分析対象を、該分析対象の抽出回数に関連付けて格納する分析対象格納部と、
を更に含む、請求項2に記載の不具合述語表現抽出装置。 - 前記分析対象格納部に格納される前記分析対象ごとにその相関値を算出し、前記分析対象ごとの前記相関値を分析結果として生成する分析結果生成部を更に含む、請求項6に記載の不具合述語表現抽出装置。
- 特定の製品分野に属する製品の使用に関するテキスト・データから、不具合を示す述語表現をコンピュータにより抽出するための不具合述語表現抽出方法であって、
突然性を示す連用修飾表現または再現性示す連用修飾表現の少なくとも一方の連用修飾表現を、前記コンピュータの処理によって実現される不具合表現検出用の連用修飾表現格納部により、不具合表現検出用の連用修飾表現として登録させるステップと、
前記コンピュータの処理によって実現される不具合述語表現候補抽出部により、前記不具合表現検出用の連用修飾表現格納部に格納されている連用修飾表現と一致する表現を前記テキスト・データから検出し、検出した前記表現の近傍に出現する前記テキスト・データ内の述語表現を、不具合を示す述語表現の候補として抽出するステップと、
正常性を示す連用修飾表現を、前記コンピュータの処理によって実現される正常表現検出用の連用修飾表現格納部により、正常表現検出用の連用修飾表現として登録させるステップと、
前記コンピュータの処理によって実現される正常述語表現抽出部により、前記正常表現検出用の連用修飾表現格納部に格納されている連用修飾表現と一致する表現を前記テキスト・データから検出し、検出した前記表現の近傍に出現する前記テキスト・データ内の述語表現を、正常を示す述語表現として抽出するステップと、
前記コンピュータの処理によって実現される不具合述語表現取得部により、前記不具合を示す述語表現の候補として抽出された述語表現のリストから、前記正常述語表現抽出部により抽出された述語表現を除いた残りを、前記不具合を示す述語表現として取得するステップと
を含む不具合述語表現抽出方法。 - 特定の製品分野に属する製品の使用に関するテキスト・データから、不具合を示す述語表現をコンピュータにより抽出するための不具合述語表現抽出プログラムであって、前記プログラムは、前記コンピュータを、
突然性を示す連用修飾表現または再現性示す連用修飾表現の少なくとも一方の連用修飾表現を格納する不具合表現検出用の連用修飾表現格納部と、
前記不具合表現検出用の連用修飾表現格納部に格納されている連用修飾表現と一致する表現を前記テキスト・データから検出し、検出した前記表現の近傍に出現する前記テキスト・データ内の述語表現を、不具合を示す述語表現の候補として抽出する不具合述語表現候補抽出部と、
正常性を示す連用修飾表現を格納する正常表現検出用の連用修飾表現格納部と、
前記正常表現検出用の連用修飾表現格納部に格納されている連用修飾表現と一致する表現を前記テキスト・データから検出し、検出した前記表現の近傍に出現する前記テキスト・データ内の述語表現を、正常を示す述語表現として抽出する正常述語表現抽出部と、
前記不具合を示す述語表現の候補として抽出された述語表現のリストから、前記正常述語表現抽出部により抽出された述語表現を除いた残りを、前記不具合を示す述語表現として取得する不具合述語表現取得部と
して機能させる不具合述語表現抽出プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010101663A JP5390463B2 (ja) | 2010-04-27 | 2010-04-27 | 不具合を示す述語表現を抽出するための不具合述語表現抽出装置、不具合述語表現抽出方法及び不具合述語表現抽出プログラム |
US13/087,639 US8484622B2 (en) | 2010-04-27 | 2011-04-15 | Defect predicate expression extraction |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010101663A JP5390463B2 (ja) | 2010-04-27 | 2010-04-27 | 不具合を示す述語表現を抽出するための不具合述語表現抽出装置、不具合述語表現抽出方法及び不具合述語表現抽出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011232902A true JP2011232902A (ja) | 2011-11-17 |
JP5390463B2 JP5390463B2 (ja) | 2014-01-15 |
Family
ID=44816871
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010101663A Expired - Fee Related JP5390463B2 (ja) | 2010-04-27 | 2010-04-27 | 不具合を示す述語表現を抽出するための不具合述語表現抽出装置、不具合述語表現抽出方法及び不具合述語表現抽出プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8484622B2 (ja) |
JP (1) | JP5390463B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020119449A (ja) * | 2019-01-28 | 2020-08-06 | 富士ゼロックス株式会社 | 設計支援システムおよびプログラム |
JP2020531957A (ja) * | 2017-08-17 | 2020-11-05 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 領域特化字句駆動型プレパーサ |
WO2021019817A1 (ja) * | 2019-07-29 | 2021-02-04 | 株式会社日立製作所 | 修理リコメンドシステム、修理リコメンド方法、及びプログラム |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10084611B2 (en) * | 2012-06-29 | 2018-09-25 | Siemens Schweiz Ag | Programmable symbol animation pre-processor for building automation graphics |
US9710525B2 (en) * | 2013-03-15 | 2017-07-18 | Bmc Software, Inc. | Adaptive learning of effective troubleshooting patterns |
JP6642429B2 (ja) * | 2014-07-23 | 2020-02-05 | 日本電気株式会社 | テキスト処理システム、テキスト処理方法およびテキスト処理プログラム |
JP6074820B2 (ja) * | 2015-01-23 | 2017-02-08 | 国立研究開発法人情報通信研究機構 | アノテーション補助装置及びそのためのコンピュータプログラム |
US11205103B2 (en) | 2016-12-09 | 2021-12-21 | The Research Foundation for the State University | Semisupervised autoencoder for sentiment analysis |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002236692A (ja) * | 2001-02-09 | 2002-08-23 | Fujitsu Ltd | 障害情報管理装置 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2855409B2 (ja) * | 1994-11-17 | 1999-02-10 | 日本アイ・ビー・エム株式会社 | 自然言語処理方法及びシステム |
JP3266586B2 (ja) * | 1999-07-07 | 2002-03-18 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データ分析システム |
US7346492B2 (en) | 2001-01-24 | 2008-03-18 | Shaw Stroz Llc | System and method for computerized psychological content analysis of computer and media generated communications to produce communications management support, indications, and warnings of dangerous behavior, assessment of media images, and personnel selection support |
US7272750B2 (en) * | 2003-06-30 | 2007-09-18 | Texas Instruments Incorporated | Expert system for intelligent testing |
US8200477B2 (en) * | 2003-10-22 | 2012-06-12 | International Business Machines Corporation | Method and system for extracting opinions from text documents |
JP3962382B2 (ja) | 2004-02-20 | 2007-08-22 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 表現抽出装置、表現抽出方法、プログラム及び記録媒体 |
US7818723B2 (en) * | 2004-09-07 | 2010-10-19 | Sap Ag | Antipattern detection processing for a multithreaded application |
WO2006039566A2 (en) | 2004-09-30 | 2006-04-13 | Intelliseek, Inc. | Topical sentiments in electronically stored communications |
JP4148522B2 (ja) * | 2004-11-19 | 2008-09-10 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 表現検出システム、表現検出方法、及びプログラム |
JP2007179276A (ja) * | 2005-12-27 | 2007-07-12 | Internatl Business Mach Corp <Ibm> | 適合判定方法、装置、およびプログラム |
US7792841B2 (en) * | 2006-05-30 | 2010-09-07 | Microsoft Corporation | Extraction and summarization of sentiment information |
US8862591B2 (en) * | 2006-08-22 | 2014-10-14 | Twitter, Inc. | System and method for evaluating sentiment |
US7930302B2 (en) * | 2006-11-22 | 2011-04-19 | Intuit Inc. | Method and system for analyzing user-generated content |
US20080249764A1 (en) * | 2007-03-01 | 2008-10-09 | Microsoft Corporation | Smart Sentiment Classifier for Product Reviews |
JP4338145B2 (ja) * | 2007-03-08 | 2009-10-07 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 事象の発生を決定付けるキーワードを検索する技術 |
US7996210B2 (en) | 2007-04-24 | 2011-08-09 | The Research Foundation Of The State University Of New York | Large-scale sentiment analysis |
EP2240874A1 (en) * | 2008-01-10 | 2010-10-20 | Yissum Research Development Company of the Hebrew University of Jerusalem, Ltd. | Method and system for automatically ranking product reviews according to review helpfulness |
US20090192784A1 (en) * | 2008-01-24 | 2009-07-30 | International Business Machines Corporation | Systems and methods for analyzing electronic documents to discover noncompliance with established norms |
US9646078B2 (en) | 2008-05-12 | 2017-05-09 | Groupon, Inc. | Sentiment extraction from consumer reviews for providing product recommendations |
US20090306967A1 (en) | 2008-06-09 | 2009-12-10 | J.D. Power And Associates | Automatic Sentiment Analysis of Surveys |
US8307351B2 (en) * | 2009-03-18 | 2012-11-06 | Oracle International Corporation | System and method for performing code provenance review in a software due diligence system |
US8595707B2 (en) * | 2009-12-30 | 2013-11-26 | Microsoft Corporation | Processing predicates including pointer information |
-
2010
- 2010-04-27 JP JP2010101663A patent/JP5390463B2/ja not_active Expired - Fee Related
-
2011
- 2011-04-15 US US13/087,639 patent/US8484622B2/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002236692A (ja) * | 2001-02-09 | 2002-08-23 | Fujitsu Ltd | 障害情報管理装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020531957A (ja) * | 2017-08-17 | 2020-11-05 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 領域特化字句駆動型プレパーサ |
JP7082185B2 (ja) | 2017-08-17 | 2022-06-07 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 領域特化字句駆動型プレパーサ |
JP2020119449A (ja) * | 2019-01-28 | 2020-08-06 | 富士ゼロックス株式会社 | 設計支援システムおよびプログラム |
JP7251168B2 (ja) | 2019-01-28 | 2023-04-04 | 富士フイルムビジネスイノベーション株式会社 | 設計支援システムおよびプログラム |
WO2021019817A1 (ja) * | 2019-07-29 | 2021-02-04 | 株式会社日立製作所 | 修理リコメンドシステム、修理リコメンド方法、及びプログラム |
JP2021022205A (ja) * | 2019-07-29 | 2021-02-18 | 株式会社日立製作所 | 修理リコメンドシステム、修理リコメンド方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20110265065A1 (en) | 2011-10-27 |
US8484622B2 (en) | 2013-07-09 |
JP5390463B2 (ja) | 2014-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5390463B2 (ja) | 不具合を示す述語表現を抽出するための不具合述語表現抽出装置、不具合述語表現抽出方法及び不具合述語表現抽出プログラム | |
EP2664997B1 (en) | System and method for resolving named entity coreference | |
Baron et al. | Word frequency and key word statistics in historical corpus linguistics | |
KR101498331B1 (ko) | 텍스트 세그먼트를 가진 문서로부터 용어를 추출하기 위한 시스템 | |
US8359294B2 (en) | Incorrect hyperlink detecting apparatus and method | |
US20110257839A1 (en) | Aviation field service report natural language processing | |
Zeroual et al. | Towards a standard Part of Speech tagset for the Arabic language | |
KR20100031800A (ko) | 병렬 코퍼스를 이용한 기계번역 오류 탐지 방법 및 장치 | |
US9542383B2 (en) | Example-based error detection system for automatic evaluation of writing, method for same, and error detection apparatus for same | |
Kutuzov et al. | Contextualized language models for semantic change detection: lessons learned | |
Ehsan et al. | Towards grammar checker development for Persian language | |
Singh et al. | Review of real-word error detection and correction methods in text documents | |
Pham et al. | Information extraction for Vietnamese real estate advertisements | |
JP2010271819A (ja) | 語句関係抽出装置、語句関係抽出方法及びプログラム | |
Duran et al. | Some issues on the normalization of a corpus of products reviews in Portuguese | |
KR20190021015A (ko) | 패러프레이징을 이용한 감정 사전 구축 및 이를 이용한 텍스트 상의 감정 구조 인식 시스템 및 방법 | |
Quochi et al. | A MWE acquisition and lexicon builder web service | |
Mapa et al. | Text normalization in social media by using spell correction and dictionary based approach | |
Aotaiwe et al. | Enhancing Arabic named entity recognition using parallel techniques | |
Okgetheng et al. | Bantu Spell Checker and Corrector using Modified Edit Distance Algorithm (MEDA) | |
Haripriya et al. | Location Based Real-time Sentiment Analysis of Top Trending Event Using Hybrid Approach | |
JP2014215970A (ja) | 誤り検出装置、方法、及びプログラム | |
Thenmozhi et al. | An open information extraction for question answering system | |
Alkhalifa et al. | A Dataset for Detecting Humor in Arabic Text | |
JP5221751B2 (ja) | 著者行動推定装置、著者行動推定モデル学習装置、著者行動推定方法、著者行動推定モデル学習方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130115 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130917 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130924 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131010 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5390463 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |