JP7256935B2 - 辞書作成装置及び辞書作成方法 - Google Patents
辞書作成装置及び辞書作成方法 Download PDFInfo
- Publication number
- JP7256935B2 JP7256935B2 JP2019159570A JP2019159570A JP7256935B2 JP 7256935 B2 JP7256935 B2 JP 7256935B2 JP 2019159570 A JP2019159570 A JP 2019159570A JP 2019159570 A JP2019159570 A JP 2019159570A JP 7256935 B2 JP7256935 B2 JP 7256935B2
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- character string
- log
- extracted
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
- G06F40/157—Transformation using dictionaries or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0787—Storage of error reports, e.g. persistent data storage, storage using memory protection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/079—Root cause analysis, i.e. error or fault diagnosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Machine Translation (AREA)
- Debugging And Monitoring (AREA)
Description
以下、図6~図8のフローチャートに沿って、その他図面を適宜参照しつつ、辞書作成装置10の処理について詳細に説明する。図6は、辞書作成装置10の全体処理を示すフローチャートであり、図7は、図6のステップS10の詳細処理を示すフローチャートであり、図8は、図6のステップS14の詳細処理を示すフローチャートである。
図7の処理では、まずステップS40において、第1抽出部20が、基点と比較対象を設定する。例えば、既存装置の辞書が図9(a)に示すような11個のフレーズを有していたとする。この場合、第1抽出部20は、図9(b)に示すように、既存装置の辞書全体を処理対象とし、最初のフレーズ(1番のフレーズ)を基点として設定し、残りの2番~11番のフレーズを比較対象として設定する。
図8の処理では、まず、ステップS60において、選択された固定部に対応する可変部がワイルドカードであるか否かを判断する。このステップS60の判断が否定されると、ステップS61に移行する。
(付記1) 第1の装置のログから抽出する文字列を登録する第1の辞書から、一部に共通部分を有する複数の文字列を抽出して、抽出した前記複数の文字列の種類を特定する第1特定部と、
前記第1の装置のログから前記共通部分を含む文字列を抽出し、抽出した文字列の種類を特定する第2特定部と、
前記第2特定部が特定した文字列の種類に対して、前記第1特定部が特定した文字列の種類が限定的であるか判断する第1判断部と、
前記第1判断部の判断の結果、限定的であった場合に、前記第1の装置とは異なる第2の装置のログから一部に前記共通部分を含む文字列を抽出し、抽出した文字列の種類を特定するとともに、特定した該文字列の種類と、前記第2特定部が特定した文字列の種類との一致度が所定以上かを判断する第2判断部と、
前記一致度が所定以上の場合に、前記第1特定部が抽出した前記複数の文字列を、前記第2の装置のログから抽出する文字列を登録する第2の辞書に含める、辞書編集部と、
を備える辞書作成装置。
(付記2) 前記第1判断部は、前記第2特定部が特定した文字列の種類の中に、前記第1特定部が特定した文字列の種類の全てが含まれ、かつ、前記第2特定部が特定した文字列の種類と前記第1特定部が特定した文字列の種類とが完全一致していない場合に、限定的であると判断する、ことを特徴とする付記1に記載の辞書作成装置。
(付記3) 前記辞書編集部は、前記第1判断部の判断の結果、限定的でなかった場合、前記共通部分を有する全ての文字列を前記第2の装置のログから抽出するための情報を、前記第2の辞書に含めることを特徴とする付記1又は2に記載の辞書作成装置。
(付記4) 前記辞書編集部は、前記一致度が所定以上でない場合に、前記共通部分を含む全ての文字列を前記第2の装置のログから抽出するための情報を、前記第2の辞書に含めることを特徴とする付記1~3のいずれかに記載の辞書作成装置。
(付記5) 前記辞書編集部は、前記第2判断部が前記第2の装置のログから前記共通部分を含む文字列を抽出できなかった場合に、前記共通部分を含む文字列を前記第2の辞書に含めないことを特徴とする付記1~4のいずれかに記載の辞書作成装置。
(付記6) 前記辞書編集部は、前記第1の辞書に任意文字が指定された箇所を含む文字列が登録されている場合に、該文字列を前記第2の辞書に含める、ことを特徴とする付記1~5のいずれかに記載の辞書作成装置。
(付記7) 前記文字列の種類を特定する処理は、前記文字列のうち共通部分以外の部分の種類を特定する処理である、ことを特徴とする付記1~6のいずれかに記載の辞書作成装置。
(付記8) 第1の装置のログから抽出する文字列を登録する第1の辞書から、一部に共通部分を有する複数の文字列を抽出して、抽出した前記複数の文字列の種類を特定し、
前記第1の装置のログから前記共通部分を含む文字列を抽出し、抽出した文字列の種類を特定し、
前記第1の装置のログから特定した文字列の種類に対して、前記第1の辞書から特定した文字列の種類が限定的であるか判断し、
前記判断の結果、限定的であった場合に、前記第1の装置とは異なる第2の装置のログから一部に前記共通部分を含む文字列を抽出し、抽出した文字列の種類を特定するとともに、特定した該文字列の種類と、前記第1の装置のログから特定した文字列の種類との一致度が所定以上かを判断し、
前記一致度が所定以上の場合に、前記第1の辞書から抽出した前記複数の文字列を、前記第2の装置のログから抽出する文字列を登録する第2の辞書に含める、
処理をコンピュータが実行することを特徴する辞書作成方法。
(付記9) 前記限定的であるか判断する処理では、前記第1の装置のログから特定した文字列の種類の中に、前記第1の装置の辞書から特定した文字列の種類の全てが含まれ、かつ、前記第1の装置のログから特定した文字列の種類と前記第1の装置の辞書から特定した文字列の種類とが完全一致していない場合に、限定的であると判断する、ことを特徴とする付記8に記載の辞書作成方法。
(付記10) 前記限定的であるか判断する処理の結果、限定的でなかった場合、前記共通部分を有する全ての文字列を前記第2の装置のログから抽出するための情報を、前記第2の辞書に含めることを特徴とする付記8又は9に記載の辞書作成方法。
(付記11) 前記一致度が所定以上でない場合に、前記共通部分を含む全ての文字列を前記第2の装置のログから抽出するための情報を、前記第2の辞書に含めることを特徴とする付記8~10のいずれかに記載の辞書作成方法。
(付記12) 前記第2の装置のログから前記共通部分を含む文字列を抽出できなかった場合に、前記共通部分を含む文字列を前記第2の辞書に含めないことを特徴とする付記8~11のいずれかに記載の辞書作成方法。
(付記13) 前記第1の辞書に任意文字が指定された箇所を含む文字列が登録されている場合に、該文字列を前記第2の辞書に含める、ことを特徴とする付記8~12のいずれかに記載の辞書作成方法。
(付記14) 前記文字列の種類を特定する処理は、前記文字列のうち共通部分以外の部分の種類を特定する処理である、ことを特徴とする付記8~13のいずれかに記載の辞書作成方法。
20 第1抽出部(第1特定部の一部)
22 第2抽出部(第2特定部の一部)
24 絞り込み判断部(第1特定部の一部、第2特定部の一部、第1判断部)
26 第3抽出部(第2判断部の一部)
28 一致度判定部(第2判断部の一部)
30 登録フレーズ決定部(辞書編集部)
Claims (8)
- 第1の装置のログから抽出する文字列を登録する第1の辞書から、一部に共通部分を有する複数の文字列を抽出して、抽出した前記複数の文字列の種類を特定する第1特定部と、
前記第1の装置のログから前記共通部分を含む文字列を抽出し、抽出した文字列の種類を特定する第2特定部と、
前記第2特定部が特定した文字列の種類に対して、前記第1特定部が特定した文字列の種類が限定的であるか判断する第1判断部と、
前記第1判断部の判断の結果、限定的であった場合に、前記第1の装置とは異なる第2の装置のログから一部に前記共通部分を含む文字列を抽出し、抽出した文字列の種類を特定するとともに、特定した該文字列の種類と、前記第2特定部が特定した文字列の種類との一致度が所定以上かを判断する第2判断部と、
前記一致度が所定以上の場合に、前記第1特定部が抽出した前記複数の文字列を、前記第2の装置のログから抽出する文字列を登録する第2の辞書に含める、辞書編集部と、
を備える辞書作成装置。 - 前記第1判断部は、前記第2特定部が特定した文字列の種類の中に、前記第1特定部が特定した文字列の種類の全てが含まれ、かつ、前記第2特定部が特定した文字列の種類と前記第1特定部が特定した文字列の種類とが完全一致していない場合に、限定的であると判断する、ことを特徴とする請求項1に記載の辞書作成装置。
- 前記辞書編集部は、前記第1判断部の判断の結果、限定的でなかった場合、前記共通部分を有する全ての文字列を前記第2の装置のログから抽出するための情報を、前記第2の辞書に含めることを特徴とする請求項1又は2に記載の辞書作成装置。
- 前記辞書編集部は、前記一致度が所定以上でない場合に、前記共通部分を含む全ての文字列を前記第2の装置のログから抽出するための情報を、前記第2の辞書に含めることを特徴とする請求項1~3のいずれか一項に記載の辞書作成装置。
- 前記辞書編集部は、前記第2判断部が前記第2の装置のログから前記共通部分を含む文字列を抽出できなかった場合に、前記共通部分を含む文字列を前記第2の辞書に含めないことを特徴とする請求項1~4のいずれか一項に記載の辞書作成装置。
- 前記辞書編集部は、前記第1の辞書に任意文字が指定された箇所を含む文字列が登録されている場合に、該文字列を前記第2の辞書に含める、ことを特徴とする請求項1~5のいずれか一項に記載の辞書作成装置。
- 前記文字列の種類を特定する処理は、前記文字列のうち共通部分以外の部分の種類を特定する処理である、ことを特徴とする請求項1~6のいずれか一項に記載の辞書作成装置。
- 第1の装置のログから抽出する文字列を登録する第1の辞書から、一部に共通部分を有する複数の文字列を抽出して、抽出した前記複数の文字列の種類を特定し、
前記第1の装置のログから前記共通部分を含む文字列を抽出し、抽出した文字列の種類を特定し、
前記第1の装置のログから特定した文字列の種類に対して、前記第1の辞書から特定した文字列の種類が限定的であるか判断し、
前記判断の結果、限定的であった場合に、前記第1の装置とは異なる第2の装置のログから一部に前記共通部分を含む文字列を抽出し、抽出した文字列の種類を特定するとともに、特定した該文字列の種類と、前記第1の装置のログから特定した文字列の種類との一致度が所定以上かを判断し、
前記一致度が所定以上の場合に、前記第1の辞書から抽出した前記複数の文字列を、前記第2の装置のログから抽出する文字列を登録する第2の辞書に含める、
処理をコンピュータが実行することを特徴する辞書作成方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019159570A JP7256935B2 (ja) | 2019-09-02 | 2019-09-02 | 辞書作成装置及び辞書作成方法 |
US16/990,542 US11144712B2 (en) | 2019-09-02 | 2020-08-11 | Dictionary creation apparatus, dictionary creation method, and non-transitory computer-readable storage medium for storing dictionary creation program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019159570A JP7256935B2 (ja) | 2019-09-02 | 2019-09-02 | 辞書作成装置及び辞書作成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021039488A JP2021039488A (ja) | 2021-03-11 |
JP7256935B2 true JP7256935B2 (ja) | 2023-04-13 |
Family
ID=74681651
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019159570A Active JP7256935B2 (ja) | 2019-09-02 | 2019-09-02 | 辞書作成装置及び辞書作成方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11144712B2 (ja) |
JP (1) | JP7256935B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7047661B2 (ja) * | 2018-08-09 | 2022-04-05 | 日本電信電話株式会社 | ログ情報収集装置およびログ情報収集方法 |
CN114328076B (zh) * | 2021-09-18 | 2024-04-30 | 腾讯科技(深圳)有限公司 | 日志信息提取方法、装置、计算机设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110066908A1 (en) | 2009-09-17 | 2011-03-17 | Microsoft Corporation | Similarity detection for error reports |
JP2013008372A (ja) | 2010-11-10 | 2013-01-10 | Rakuten Inc | 関連語登録装置、情報処理装置、関連語登録方法、関連語登録装置用プログラム、および、記録媒体 |
US20190034517A1 (en) | 2016-01-30 | 2019-01-31 | Entit Software Llc | Log event cluster analytics management |
JP2019053767A (ja) | 2012-12-28 | 2019-04-04 | 株式会社ユニバーサルエンターテインメント | 保守装置 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11154160A (ja) | 1997-11-21 | 1999-06-08 | Hitachi Ltd | データ検索システム |
JP2002259367A (ja) | 2001-03-02 | 2002-09-13 | Denso Corp | 電子機器の情報登録方法及び電子機器並びにコンピュータプログラム |
US7039833B2 (en) * | 2002-10-21 | 2006-05-02 | I2 Technologies Us, Inc. | Stack trace generated code compared with database to find error resolution information |
JP2005190232A (ja) | 2003-12-26 | 2005-07-14 | Seiko Epson Corp | 質問回答装置の精度向上支援装置及び精度向上支援方法ならびにそのプログラム |
US7594141B2 (en) * | 2006-05-26 | 2009-09-22 | International Business Machines Corporation | Apparatus, system, and method for signaling logical errors in an EIS remote function call |
US7877636B2 (en) * | 2008-08-28 | 2011-01-25 | Honeywell International Inc. | System and method for detecting temporal relationships uniquely associated with an underlying root cause |
KR20130029250A (ko) * | 2011-09-14 | 2013-03-22 | 한국전자통신연구원 | 장애 발견 및 진단 요청 방법 및 장치 |
CN103793284B (zh) * | 2012-10-29 | 2017-06-20 | 伊姆西公司 | 基于共同序列模式的、用于智能客户服务的分析系统和方法 |
JP6388212B2 (ja) | 2015-01-22 | 2018-09-12 | パナソニックIpマネジメント株式会社 | タグ付与方法、タグ付与装置、プログラム及び質問回答検索方法 |
JP6753401B2 (ja) * | 2015-07-24 | 2020-09-09 | 富士通株式会社 | 符号化プログラム、符号化装置、及び符号化方法 |
JP6868416B2 (ja) | 2017-02-21 | 2021-05-12 | 株式会社野村総合研究所 | 障害対応支援システム |
US20200372113A1 (en) * | 2019-05-24 | 2020-11-26 | Sap Se | Log file meaning and syntax generation system |
-
2019
- 2019-09-02 JP JP2019159570A patent/JP7256935B2/ja active Active
-
2020
- 2020-08-11 US US16/990,542 patent/US11144712B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110066908A1 (en) | 2009-09-17 | 2011-03-17 | Microsoft Corporation | Similarity detection for error reports |
JP2013008372A (ja) | 2010-11-10 | 2013-01-10 | Rakuten Inc | 関連語登録装置、情報処理装置、関連語登録方法、関連語登録装置用プログラム、および、記録媒体 |
JP2019053767A (ja) | 2012-12-28 | 2019-04-04 | 株式会社ユニバーサルエンターテインメント | 保守装置 |
US20190034517A1 (en) | 2016-01-30 | 2019-01-31 | Entit Software Llc | Log event cluster analytics management |
Also Published As
Publication number | Publication date |
---|---|
JP2021039488A (ja) | 2021-03-11 |
US11144712B2 (en) | 2021-10-12 |
US20210064814A1 (en) | 2021-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8176050B2 (en) | Method and apparatus of supporting creation of classification rules | |
WO2018157805A1 (zh) | 一种自动问答处理方法及自动问答系统 | |
CN107346433B (zh) | 一种文本数据分类方法及服务器 | |
JP5245255B2 (ja) | 固有表現抽出プログラム、固有表現抽出方法および固有表現抽出装置 | |
JP6912488B2 (ja) | 文字列距離計算方法及び装置 | |
JP7256935B2 (ja) | 辞書作成装置及び辞書作成方法 | |
CN110134777B (zh) | 问题去重方法、装置、电子设备和计算机可读存储介质 | |
JP7024515B2 (ja) | 学習プログラム、学習方法および学習装置 | |
CN110659175A (zh) | 日志的主干提取方法、分类方法、设备及存储介质 | |
CN109791570B (zh) | 高效且精确的命名实体识别方法和装置 | |
US20030158725A1 (en) | Method and apparatus for identifying words with common stems | |
US20120197889A1 (en) | Information matching apparatus, information matching method, and computer readable storage medium having stored information matching program | |
JP6780244B2 (ja) | 判定方法、判定プログラムおよび判定装置 | |
WO2007132564A1 (ja) | データ処理装置及び方法 | |
KR20200080401A (ko) | 데이터 분류 규칙 추정 방법, 이를 수행하기 위한 장치 및 기록매체 | |
JP2002297660A (ja) | 文字列類似度算出方法、装置、プログラム及び記録媒体 | |
US20180011919A1 (en) | Systems and method for clustering electronic documents | |
JP2008282111A (ja) | 類似文書検索方法、プログラムおよび装置 | |
JPWO2019171537A1 (ja) | 意味推定システム、方法およびプログラム | |
CN114816518A (zh) | 基于simhash的源代码中开源成分筛选识别方法及系统 | |
CN112559474A (zh) | 日志处理方法和装置 | |
KR101697992B1 (ko) | 다중 개발자 네트워크 기반의 버그 정정 개발자 추천 시스템 및 방법 | |
JP2014235584A (ja) | 文書分析システム、文書分析方法およびプログラム | |
JPWO2019171538A1 (ja) | 意味推定システム、方法およびプログラム | |
CN107203512A (zh) | 用于从用户的自然语言输入中提取关键元素的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220517 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230222 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230228 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230313 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7256935 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |