JP5390463B2 - 不具合を示す述語表現を抽出するための不具合述語表現抽出装置、不具合述語表現抽出方法及び不具合述語表現抽出プログラム - Google Patents
不具合を示す述語表現を抽出するための不具合述語表現抽出装置、不具合述語表現抽出方法及び不具合述語表現抽出プログラム Download PDFInfo
- Publication number
- JP5390463B2 JP5390463B2 JP2010101663A JP2010101663A JP5390463B2 JP 5390463 B2 JP5390463 B2 JP 5390463B2 JP 2010101663 A JP2010101663 A JP 2010101663A JP 2010101663 A JP2010101663 A JP 2010101663A JP 5390463 B2 JP5390463 B2 JP 5390463B2
- Authority
- JP
- Japan
- Prior art keywords
- expression
- predicate
- defect
- indicating
- predicate expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/008—Reliability or availability analysis
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
これに代えて、検出した述語表現の近傍の定義を、検出した述語表現の主格としてもよい。即ち、分析対象抽出部150は、不具合述語表現格納部145に格納されている述語表現と一致する表現を解析対象のテキスト・データから検出し、該検出した述語表現の主格を抽出して、検出した述語表現の近傍に出現する名詞表現としてもよい。
ここでDは全データを表現し、#はデータの件数を示す。すなわち、#(A∩B)はAとBの両方を含むデータの件数であり、#Dはデータ全体の件数である。相関値は上記の数式における#(A∩B) が小さい場合、値の信頼性が低くなる。 信頼性が無いのに高い相関値が算出されてしまい、分析作業の効率や精度が落ちる、といったことがないように、区間推定を用いて、信頼性の無い値は小さめに補正することができる。区間推定法では、「文書が無限にある場合の真の相関値αを未知数とした際、一定確率以下の偶然を除いて、現状の相関値を実現し得る最小のα」を算出する。分析結果生成部160により生成された分析結果は、プリンタやディスプレイ等の出力装置に出力してよい。
Claims (9)
- 特定の製品分野に属する製品の使用に関するテキスト・データから、不具合を示す述語表現を抽出するための不具合述語表現抽出装置であって、
突然性を示す連用修飾表現または再現性示す連用修飾表現の少なくとも一方の連用修飾表現を格納する不具合表現検出用の連用修飾表現格納部と、
前記不具合表現検出用の連用修飾表現格納部に格納されている連用修飾表現と一致する表現を前記テキスト・データから検出し、検出した前記表現の近傍に出現する前記テキスト・データ内の述語表現を、不具合を示す述語表現の候補として抽出する不具合述語表現候補抽出部と、
正常性を示す連用修飾表現を格納する正常表現検出用の連用修飾表現格納部と、
前記正常表現検出用の連用修飾表現格納部に格納されている連用修飾表現と一致する表現を前記テキスト・データから検出し、検出した前記表現の近傍に出現する前記テキスト・データ内の述語表現を、正常を示す述語表現として抽出する正常述語表現抽出部と、
前記不具合を示す述語表現の候補として抽出された述語表現のリストから、前記正常述語表現抽出部により抽出された述語表現を除いた残りを、前記不具合を示す述語表現として取得する不具合述語表現取得部と
を含む不具合述語表現抽出装置。 - 前記突然性を示す連用修飾表現は、「突然」、「急に」、「いきなり」、「突如」、「突如として」、「突然に」、「不意に」、「唐突」、「たちまち」、「出し抜け」、「咄嗟」、「俄然」、「忽然」、及び「はたと」のうちの少なくとも1つを含み、前記再現性を示す連用修飾表現は、「度々」、「時々」、「頻繁」に、「何度も」、「再三」、及び「しきりに」のうちの少なくとも1つを含み、前記正常性を示す連用修飾表現は、「きちんと」、「しっかり」、「正しく」、「普通に」、「正確に」、「一向に」、「全然」、「ほとんど」、「正常に」、「きっちりと」、「ちゃんと」、「ちょうど」、「整然と」、「きっかり」、「きっかりと」、及び「かっちり」のうちの少なくとも1つを含む、請求項1に記載の不具合述語表現抽出装置。
- 前記不具合述語表現候補抽出部は、前記不具合表現検出用の連用修飾表現格納部に格納されている連用修飾表現と一致する表現を前記テキスト・データから検出し、検出した前記表現が直接修飾する述語表現を、前記不具合を示す述語表現の候補として抽出し、前記正常述語表現抽出部は、前記正常表現検出用の連用修飾表現格納部に格納されている連用修飾表現と一致する表現を前記テキスト・データから検出し、検出した前記表現が直接修飾する述語表現を、前記正常を示す述語表現として抽出する、請求項2に記載の不具合述語表現抽出装置。
- 前記不具合述語表現候補抽出部は、前記不具合を示す述語表現の候補として抽出する各述語表現について、前記不具合表現検出用の連用修飾表現格納部に格納されている1以上の連用修飾表現のいずれかの近傍に出現する出現回数をカウントし、前記正常述語表現抽出部は、前記正常を示す述語表現として抽出する各述語表現について、前記正常表現検出用の連用修飾表現格納部に格納されている1以上の連用修飾表現のいずれかの近傍に出現する出現回数をカウントし、前記不具合述語表現取得部は、前記不具合述語表現候補抽出部及び前記正常述語表現抽出部の両抽出部によって同じ述語表現が抽出された場合、該述語表現に対し前記両抽出部がそれぞれカウントした出現回数に基づいて、前記同じ述語表現を、前記不具合を示す述語表現とするか否かを決定する、請求項2に記載の不具合述語表現抽出装置。
- 製品の使用に関するテキスト・データから、特定の不具合を示す述語表現と共起する連用修飾表現を抽出し、該連用修飾表現を前記不具合表現検出用の連用修飾表現格納部に登録する、不具合表現検出用の連用修飾表現登録部を更に含む請求項2に記載の不具合述語表現抽出装置。
- 前記不具合述語表現取得部により取得された前記不具合を示す述語表現を格納する不具合述語表現格納部と、
前記特定の製品分野に属する製品の使用に関する解析対象のテキスト・データから、前記不具合述語表現格納部に格納されている不具合を示す述語表現と一致する表現を検出し、検出した前記表現の近傍に出現する前記解析対象のテキスト・データ内の名詞表現を抽出する分析対象抽出部と、
検出された前記不具合を示す述語表現と一致する前記表現と抽出された前記名詞表現との組を分析対象として、該分析対象を、該分析対象の抽出回数に関連付けて格納する分析対象格納部と、
を更に含む、請求項2に記載の不具合述語表現抽出装置。 - 前記分析対象格納部に格納される前記分析対象ごとにその相関値を算出し、前記分析対象ごとの前記相関値を分析結果として生成する分析結果生成部を更に含む、請求項6に記載の不具合述語表現抽出装置。
- 特定の製品分野に属する製品の使用に関するテキスト・データから、不具合を示す述語表現をコンピュータにより抽出するための不具合述語表現抽出方法であって、
突然性を示す連用修飾表現または再現性示す連用修飾表現の少なくとも一方の連用修飾表現を、前記コンピュータの処理によって実現される不具合表現検出用の連用修飾表現格納部により、不具合表現検出用の連用修飾表現として登録させるステップと、
前記コンピュータの処理によって実現される不具合述語表現候補抽出部により、前記不具合表現検出用の連用修飾表現格納部に格納されている連用修飾表現と一致する表現を前記テキスト・データから検出し、検出した前記表現の近傍に出現する前記テキスト・データ内の述語表現を、不具合を示す述語表現の候補として抽出するステップと、
正常性を示す連用修飾表現を、前記コンピュータの処理によって実現される正常表現検出用の連用修飾表現格納部により、正常表現検出用の連用修飾表現として登録させるステップと、
前記コンピュータの処理によって実現される正常述語表現抽出部により、前記正常表現検出用の連用修飾表現格納部に格納されている連用修飾表現と一致する表現を前記テキスト・データから検出し、検出した前記表現の近傍に出現する前記テキスト・データ内の述語表現を、正常を示す述語表現として抽出するステップと、
前記コンピュータの処理によって実現される不具合述語表現取得部により、前記不具合を示す述語表現の候補として抽出された述語表現のリストから、前記正常述語表現抽出部により抽出された述語表現を除いた残りを、前記不具合を示す述語表現として取得するステップと
を含む不具合述語表現抽出方法。 - 特定の製品分野に属する製品の使用に関するテキスト・データから、不具合を示す述語表現をコンピュータにより抽出するための不具合述語表現抽出プログラムであって、前記プログラムは、前記コンピュータを、
突然性を示す連用修飾表現または再現性示す連用修飾表現の少なくとも一方の連用修飾表現を格納する不具合表現検出用の連用修飾表現格納部と、
前記不具合表現検出用の連用修飾表現格納部に格納されている連用修飾表現と一致する表現を前記テキスト・データから検出し、検出した前記表現の近傍に出現する前記テキスト・データ内の述語表現を、不具合を示す述語表現の候補として抽出する不具合述語表現候補抽出部と、
正常性を示す連用修飾表現を格納する正常表現検出用の連用修飾表現格納部と、
前記正常表現検出用の連用修飾表現格納部に格納されている連用修飾表現と一致する表現を前記テキスト・データから検出し、検出した前記表現の近傍に出現する前記テキスト・データ内の述語表現を、正常を示す述語表現として抽出する正常述語表現抽出部と、
前記不具合を示す述語表現の候補として抽出された述語表現のリストから、前記正常述語表現抽出部により抽出された述語表現を除いた残りを、前記不具合を示す述語表現として取得する不具合述語表現取得部と
して機能させる不具合述語表現抽出プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010101663A JP5390463B2 (ja) | 2010-04-27 | 2010-04-27 | 不具合を示す述語表現を抽出するための不具合述語表現抽出装置、不具合述語表現抽出方法及び不具合述語表現抽出プログラム |
US13/087,639 US8484622B2 (en) | 2010-04-27 | 2011-04-15 | Defect predicate expression extraction |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010101663A JP5390463B2 (ja) | 2010-04-27 | 2010-04-27 | 不具合を示す述語表現を抽出するための不具合述語表現抽出装置、不具合述語表現抽出方法及び不具合述語表現抽出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011232902A JP2011232902A (ja) | 2011-11-17 |
JP5390463B2 true JP5390463B2 (ja) | 2014-01-15 |
Family
ID=44816871
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010101663A Expired - Fee Related JP5390463B2 (ja) | 2010-04-27 | 2010-04-27 | 不具合を示す述語表現を抽出するための不具合述語表現抽出装置、不具合述語表現抽出方法及び不具合述語表現抽出プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8484622B2 (ja) |
JP (1) | JP5390463B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10084611B2 (en) * | 2012-06-29 | 2018-09-25 | Siemens Schweiz Ag | Programmable symbol animation pre-processor for building automation graphics |
US9710525B2 (en) * | 2013-03-15 | 2017-07-18 | Bmc Software, Inc. | Adaptive learning of effective troubleshooting patterns |
WO2016013157A1 (ja) * | 2014-07-23 | 2016-01-28 | 日本電気株式会社 | テキスト処理システム、テキスト処理方法およびテキスト処理プログラム |
JP6074820B2 (ja) * | 2015-01-23 | 2017-02-08 | 国立研究開発法人情報通信研究機構 | アノテーション補助装置及びそのためのコンピュータプログラム |
US11205103B2 (en) | 2016-12-09 | 2021-12-21 | The Research Foundation for the State University | Semisupervised autoencoder for sentiment analysis |
US10445423B2 (en) * | 2017-08-17 | 2019-10-15 | International Business Machines Corporation | Domain-specific lexically-driven pre-parser |
JP7251168B2 (ja) * | 2019-01-28 | 2023-04-04 | 富士フイルムビジネスイノベーション株式会社 | 設計支援システムおよびプログラム |
JP2021022205A (ja) * | 2019-07-29 | 2021-02-18 | 株式会社日立製作所 | 修理リコメンドシステム、修理リコメンド方法、及びプログラム |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2855409B2 (ja) * | 1994-11-17 | 1999-02-10 | 日本アイ・ビー・エム株式会社 | 自然言語処理方法及びシステム |
JP3266586B2 (ja) * | 1999-07-07 | 2002-03-18 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データ分析システム |
US7346492B2 (en) | 2001-01-24 | 2008-03-18 | Shaw Stroz Llc | System and method for computerized psychological content analysis of computer and media generated communications to produce communications management support, indications, and warnings of dangerous behavior, assessment of media images, and personnel selection support |
JP2002236692A (ja) * | 2001-02-09 | 2002-08-23 | Fujitsu Ltd | 障害情報管理装置 |
US7272750B2 (en) * | 2003-06-30 | 2007-09-18 | Texas Instruments Incorporated | Expert system for intelligent testing |
US8200477B2 (en) * | 2003-10-22 | 2012-06-12 | International Business Machines Corporation | Method and system for extracting opinions from text documents |
JP3962382B2 (ja) | 2004-02-20 | 2007-08-22 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 表現抽出装置、表現抽出方法、プログラム及び記録媒体 |
US7818723B2 (en) * | 2004-09-07 | 2010-10-19 | Sap Ag | Antipattern detection processing for a multithreaded application |
WO2006039566A2 (en) | 2004-09-30 | 2006-04-13 | Intelliseek, Inc. | Topical sentiments in electronically stored communications |
JP4148522B2 (ja) * | 2004-11-19 | 2008-09-10 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 表現検出システム、表現検出方法、及びプログラム |
JP2007179276A (ja) * | 2005-12-27 | 2007-07-12 | Internatl Business Mach Corp <Ibm> | 適合判定方法、装置、およびプログラム |
US7792841B2 (en) * | 2006-05-30 | 2010-09-07 | Microsoft Corporation | Extraction and summarization of sentiment information |
US8862591B2 (en) * | 2006-08-22 | 2014-10-14 | Twitter, Inc. | System and method for evaluating sentiment |
US7930302B2 (en) * | 2006-11-22 | 2011-04-19 | Intuit Inc. | Method and system for analyzing user-generated content |
US20080249764A1 (en) * | 2007-03-01 | 2008-10-09 | Microsoft Corporation | Smart Sentiment Classifier for Product Reviews |
JP4338145B2 (ja) * | 2007-03-08 | 2009-10-07 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 事象の発生を決定付けるキーワードを検索する技術 |
US7996210B2 (en) | 2007-04-24 | 2011-08-09 | The Research Foundation Of The State University Of New York | Large-scale sentiment analysis |
US8930366B2 (en) * | 2008-01-10 | 2015-01-06 | Yissum Research Development Comapny of the Hebrew University of Jerusalem Limited | Method and system for automatically ranking product reviews according to review helpfulness |
US20090192784A1 (en) * | 2008-01-24 | 2009-07-30 | International Business Machines Corporation | Systems and methods for analyzing electronic documents to discover noncompliance with established norms |
US9646078B2 (en) | 2008-05-12 | 2017-05-09 | Groupon, Inc. | Sentiment extraction from consumer reviews for providing product recommendations |
US20090306967A1 (en) | 2008-06-09 | 2009-12-10 | J.D. Power And Associates | Automatic Sentiment Analysis of Surveys |
US8307351B2 (en) * | 2009-03-18 | 2012-11-06 | Oracle International Corporation | System and method for performing code provenance review in a software due diligence system |
US8595707B2 (en) * | 2009-12-30 | 2013-11-26 | Microsoft Corporation | Processing predicates including pointer information |
-
2010
- 2010-04-27 JP JP2010101663A patent/JP5390463B2/ja not_active Expired - Fee Related
-
2011
- 2011-04-15 US US13/087,639 patent/US8484622B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011232902A (ja) | 2011-11-17 |
US20110265065A1 (en) | 2011-10-27 |
US8484622B2 (en) | 2013-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5390463B2 (ja) | 不具合を示す述語表現を抽出するための不具合述語表現抽出装置、不具合述語表現抽出方法及び不具合述語表現抽出プログラム | |
EP2664997B1 (en) | System and method for resolving named entity coreference | |
US8359294B2 (en) | Incorrect hyperlink detecting apparatus and method | |
KR101498331B1 (ko) | 텍스트 세그먼트를 가진 문서로부터 용어를 추출하기 위한 시스템 | |
US20110257839A1 (en) | Aviation field service report natural language processing | |
Zeroual et al. | Towards a standard Part of Speech tagset for the Arabic language | |
US9542383B2 (en) | Example-based error detection system for automatic evaluation of writing, method for same, and error detection apparatus for same | |
CN111027323A (zh) | 一种基于主题模型和语义分析的实体指称项识别方法 | |
Kutuzov et al. | Contextualized language models for semantic change detection: lessons learned | |
Ehsan et al. | Towards grammar checker development for Persian language | |
Singh et al. | Review of real-word error detection and correction methods in text documents | |
JP2010271819A (ja) | 語句関係抽出装置、語句関係抽出方法及びプログラム | |
Pham et al. | Information extraction for Vietnamese real estate advertisements | |
Duran et al. | Some issues on the normalization of a corpus of products reviews in Portuguese | |
Alfonseca et al. | German decompounding in a difficult corpus | |
Li-Juan et al. | A classification method of Vietnamese news events based on maximum entropy model | |
Haripriya et al. | Location Based Real-time Sentiment Analysis of Top Trending Event Using Hybrid Approach | |
Akter et al. | Extracting RDF triples from raw text | |
Quochi et al. | A MWE acquisition and lexicon builder web service | |
Azimizadeh et al. | Persian part of speech tagger based on Hidden Markov Model | |
Alkhalifa et al. | A Dataset for Detecting Humor in Arabic Text | |
Mapa et al. | Text normalization in social media by using spell correction and dictionary based approach | |
Aotaiwe et al. | Enhancing Arabic named entity recognition using parallel techniques | |
Okgetheng et al. | Bantu Spell Checker and Corrector using Modified Edit Distance Algorithm (MEDA) | |
JP5221751B2 (ja) | 著者行動推定装置、著者行動推定モデル学習装置、著者行動推定方法、著者行動推定モデル学習方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130115 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130917 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130924 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131010 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5390463 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |