JP7256935B2 - Dictionary creation device and dictionary creation method - Google Patents

Dictionary creation device and dictionary creation method Download PDF

Info

Publication number
JP7256935B2
JP7256935B2 JP2019159570A JP2019159570A JP7256935B2 JP 7256935 B2 JP7256935 B2 JP 7256935B2 JP 2019159570 A JP2019159570 A JP 2019159570A JP 2019159570 A JP2019159570 A JP 2019159570A JP 7256935 B2 JP7256935 B2 JP 7256935B2
Authority
JP
Japan
Prior art keywords
dictionary
character string
log
extracted
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019159570A
Other languages
Japanese (ja)
Other versions
JP2021039488A (en
Inventor
祐治 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2019159570A priority Critical patent/JP7256935B2/en
Priority to US16/990,542 priority patent/US11144712B2/en
Publication of JP2021039488A publication Critical patent/JP2021039488A/en
Application granted granted Critical
Publication of JP7256935B2 publication Critical patent/JP7256935B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • G06F40/157Transformation using dictionaries or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0787Storage of error reports, e.g. persistent data storage, storage using memory protection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Machine Translation (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明は、辞書作成装置及び辞書作成方法に関する。 The present invention relates to a dictionary creation device and a dictionary creation method.

装置のサポート業務を行う場合に、装置を導入した顧客からの問い合わせに対して適切な回答を行うために、装置から出力されたログを解析する技術が知られている。近年、このような技術において、機械学習を利用することがある。機械学習においては、例えば、ログから特徴的なフレーズ(文字列)を抽出し、抽出結果から回答を推論する推論モデルを作成する。この特徴的なフレーズの一部は、辞書に登録されており、当該辞書が適切に作成されているか否かが、推論モデルの推論精度に大きく影響することが知られている。 2. Description of the Related Art Techniques for analyzing logs output from a device are known in order to appropriately respond to inquiries from customers who have introduced the device when performing support work for the device. In recent years, machine learning may be used in such techniques. In machine learning, for example, characteristic phrases (character strings) are extracted from logs and an inference model is created to infer answers from the extracted results. Some of these characteristic phrases are registered in dictionaries, and it is known that whether or not the dictionaries are appropriately created greatly affects the inference accuracy of the inference model.

特開2016-134124号公報JP 2016-134124 A 特開平11-154160号公報JP-A-11-154160

辞書に登録するフレーズは、各装置のログを特徴づける重要なフレーズであり、予め担当者がピックアップしているが、装置ごとに異なるため、装置ごとに辞書に登録する内容をカスタマイズする必要がある。 Phrases to be registered in the dictionary are important phrases that characterize the logs of each device, and are picked up in advance by the person in charge. .

したがって、新たにサポートする装置が追加された場合、当該装置の辞書を作成するのに多大な工数や時間を要するおそれがある。また、サポート業務をある程度行った後でなければ、辞書に登録すべきフレーズがわからない場合もある。 Therefore, when a device to be newly supported is added, it may take a lot of man-hours and time to create a dictionary for the device. In addition, there are cases in which a phrase to be registered in the dictionary is not known until after a certain amount of support work has been performed.

1つの側面では、本発明は、装置のログから抽出すべき文字列を登録する辞書を簡易に作成することが可能な辞書作成装置及び辞書作成方法を提供することを目的とする。 In one aspect, an object of the present invention is to provide a dictionary creation device and a dictionary creation method capable of easily creating a dictionary for registering character strings to be extracted from device logs.

一つの態様では、辞書作成装置は、第1の装置のログから抽出する文字列を登録する第1の辞書から、一部に共通部分を有する複数の文字列を抽出して、抽出した前記複数の文字列の種類を特定する第1特定部と、前記第1の装置のログから前記共通部分を含む文字列を抽出し、抽出した文字列の種類を特定する第2特定部と、前記第2特定部が特定した文字列の種類に対して、前記第1特定部が特定した文字列の種類が限定的であるか判断する第1判断部と、前記第1判断部の判断の結果、限定的であった場合に、前記第1の装置とは異なる第2の装置のログから一部に前記共通部分を含む文字列を抽出し、抽出した文字列の種類を特定するとともに、特定した該文字列の種類と、前記第2特定部が特定した文字列の種類との一致度が所定以上かを判断する第2判断部と、前記一致度が所定以上の場合に、前記第1特定部が抽出した前記複数の文字列を、前記第2の装置のログから抽出する文字列を登録する第2の辞書に含める、辞書編集部と、を備えている。 In one aspect, the dictionary creation device extracts a plurality of character strings having a common part from a first dictionary that registers character strings extracted from a log of the first device, and extracts the extracted plurality of character strings. a first identifying unit that identifies the type of the character string of the first device, a second identifying unit that extracts the character string including the common part from the log of the first device and identifies the type of the extracted character string; 2 a first determination unit that determines whether the type of the character string specified by the first specification unit is limited with respect to the type of the character string specified by the specification unit; If it is limited, a character string partly including the common part is extracted from the log of a second device different from the first device, and the type of the extracted character string is specified and identified a second judging unit for judging whether the degree of matching between the type of the character string and the type of the character string identified by the second identifying unit is equal to or greater than a predetermined degree; a dictionary editing unit that includes the plurality of character strings extracted by the unit in a second dictionary that registers character strings extracted from the log of the second device.

装置のログから抽出すべき文字列を登録する辞書を簡易に作成することができる。 A dictionary for registering character strings to be extracted from device logs can be easily created.

一実施形態に係る辞書作成装置の利用シーンを概略的に示す図である。It is a figure which shows roughly the usage scene of the dictionary creation apparatus which concerns on one Embodiment. サポート業務支援装置によるログの解析方法の一例を示す図である。It is a figure which shows an example of the analysis method of the log by a support operation assistance apparatus. 辞書作成装置のハードウェア構成を示す図である。It is a figure which shows the hardware constitutions of a dictionary creation apparatus. 辞書作成装置の機能ブロック図である。It is a functional block diagram of a dictionary creation device. 辞書作成装置の処理の概要を示す図である。It is a figure which shows the outline|summary of the process of a dictionary creation apparatus. 辞書作成装置の全体処理を示すフローチャートである。It is a flowchart which shows the whole process of a dictionary creation apparatus. 図6のステップS10の詳細処理を示すフローチャートである。FIG. 7 is a flowchart showing detailed processing in step S10 of FIG. 6. FIG. 図6のステップS14の詳細処理を示すフローチャートである。FIG. 7 is a flowchart showing detailed processing in step S14 of FIG. 6. FIG. 図9(a)は、既存装置の辞書の一例を示す図であり、図9(b)は、処理対象を示す図である。FIG. 9(a) is a diagram showing an example of a dictionary of an existing device, and FIG. 9(b) is a diagram showing a processing target. 図10(a)~図10(d)は、図6のステップS10の処理を説明するための図である。10(a) to 10(d) are diagrams for explaining the process of step S10 in FIG. 図11(a)は、既存装置のログの一例を示す図であり、図11(b)は、既存装置のログから抽出されたフレーズを示す図である。FIG. 11(a) is a diagram showing an example of the log of the existing device, and FIG. 11(b) is a diagram showing phrases extracted from the log of the existing device. 既存装置のログにおいて特定された可変部に対して、既存装置の辞書において特定された可変部が絞り込まれている状態を説明するための図である。FIG. 10 is a diagram for explaining a state in which variable parts specified in a dictionary of an existing device are narrowed down with respect to variable parts specified in a log of an existing device; 既存装置のログにおいて特定された可変部に対して、既存装置の辞書において特定された可変部が絞り込まれていない状態を説明するための図である。FIG. 10 is a diagram for explaining a state in which variable parts specified in a dictionary of an existing device are not narrowed down with respect to variable parts specified in a log of an existing device; 図14(a)は、既存装置のログにおいて特定された可変部に対して、既存装置の辞書において特定された可変部が絞り込まれていない状態の別例を示す図であり、図14(b)は、絞り込まれている状態の別例を示す図である。FIG. 14(a) is a diagram showing another example in which the variable part specified in the dictionary of the existing device is not narrowed down with respect to the variable part specified in the log of the existing device, and FIG. ) is a diagram showing another example of the narrowed down state. 図15(a)~図15(d)は、一致度が閾値以上である場合の例を示す図である。FIGS. 15(a) to 15(d) are diagrams showing examples when the degree of matching is equal to or higher than the threshold. 図16(a)、図16(b)は、一致度が閾値未満である場合の例を示す図であり、図16(c)は、選択された固定部に対応する可変部がワイルドカードである場合において新規装置の辞書に登録されるフレーズを示す図である。16(a) and 16(b) are diagrams showing examples in which the degree of matching is less than the threshold. FIG. 10 is a diagram showing phrases registered in the dictionary of the new device in one case;

以下、一実施形態に係る辞書作成装置について、図1~図16に基づいて詳細に説明する。 Hereinafter, a dictionary creation device according to one embodiment will be described in detail with reference to FIGS. 1 to 16. FIG.

図1には、本実施形態の辞書作成装置10の利用シーンが概略的に示されている。図1に示すように、本実施形態においては、サポートセンターの担当者は、顧客に導入した装置(例えばネットワーク装置)に関する顧客からの問い合わせを受け付けると、適切な回答を行うためにサポート業務支援装置を利用する。このサポート業務支援装置に対して、辞書作成装置10は接続されている。 FIG. 1 schematically shows a usage scene of the dictionary creation device 10 of this embodiment. As shown in FIG. 1, in this embodiment, when the person in charge of the support center receives an inquiry from a customer regarding a device (for example, a network device) that has been introduced to the customer, the person in charge of the support center take advantage of A dictionary creation device 10 is connected to this support work support device.

顧客は、ネットワーク装置に不具合等が発生した場合に、ネットワーク装置から出力されるログをサポートセンターに送信することにより、不具合に対する問い合わせを行う。サポートセンターの担当者は、受信したログをサポート業務支援装置に入力し、解析することで、得られた回答パターンを参考にして、顧客に対して回答を行う。ここで、辞書作成装置10は、ネットワーク装置から出力されるログを事前に取得し、サポート業務支援装置が解析に用いる辞書を作成し、提供する。 When a problem or the like occurs in a network device, the customer sends an inquiry about the problem by sending a log output from the network device to the support center. The person in charge of the support center inputs the received log into the support operation support device, analyzes it, and refers to the response pattern obtained to respond to the customer. Here, the dictionary creation device 10 acquires in advance the log output from the network device, creates and provides a dictionary to be used for analysis by the support work support device.

図2は、サポート業務支援装置によるログの解析方法の一例を示す図である。本実施形態では、サポート業務支援装置は、機械学習を利用してログを解析し、回答パターンを出力する。機械学習においては、前処理として、過去の問い合わせログから多数のフレーズ(文字列)を抽出し、各ログにおけるフレーズ(Word_1、Word_2、…Word_n)ごとのベクトル値を算出する。このベクトル値は、例えば、問い合せログに含まれる各フレーズの出現回数のカウント値などである。このとき、問い合わせログから抽出するフレーズは、各ネットワーク装置のログを特徴づける重要なフレーズであり、その一部の強制的に抽出するフレーズが辞書作成装置10により作成された辞書に格納されている。辞書に格納されているフレーズは、例えば、ある回答パターンに対応するログだけに含まれているフレーズなどである。そして、図2の表Aに示すように、各問い合わせログの各フレーズのベクトル値と、回答パターン(ラベル)の番号とを対応付け、これに基づいて、推論モデルを作成する。 FIG. 2 is a diagram illustrating an example of a log analysis method by the support work support device. In this embodiment, the support work support device uses machine learning to analyze the log and output the response pattern. In machine learning, as preprocessing, many phrases (character strings) are extracted from past inquiry logs, and vector values are calculated for each phrase (Word_1, Word_2, . . . Word_n) in each log. This vector value is, for example, a count value of the number of occurrences of each phrase included in the inquiry log. At this time, the phrases extracted from the inquiry log are important phrases that characterize the log of each network device, and some of the forcedly extracted phrases are stored in the dictionary created by the dictionary creation device 10. . Phrases stored in the dictionary are, for example, phrases contained only in logs corresponding to certain answer patterns. Then, as shown in Table A of FIG. 2, the vector value of each phrase in each inquiry log is associated with the answer pattern (label) number, and based on this, an inference model is created.

一方、新規問い合わせログをサポートセンターの担当者が入力すると、過去の問い合わせログと同様に、前処理として、新規問い合わせログから多数のフレーズを抽出してベクトル値を算出し、算出したベクトル値を推論モデルに入力する。この結果、新規問い合わせログに対応する回答パターンの候補が確信度の値とともに出力される(図2の表B参照)。 On the other hand, when a new inquiry log is entered by a support center representative, as with past inquiry logs, as preprocessing, many phrases are extracted from the new inquiry log, vector values are calculated, and the calculated vector values are inferred. Enter the model. As a result, answer pattern candidates corresponding to the new inquiry log are output together with the confidence value (see Table B in FIG. 2).

サポートセンターの担当者は、表Bを参照することで、適切な回答パターンを選択し、顧客の問い合わせに対する回答を行うことができる。 By referring to Table B, the person in charge of the support center can select an appropriate response pattern and respond to the customer's inquiry.

ところで、推論モデルが作成されていない新たなネットワーク装置(新規装置)をサポート対象とする場合には、新規装置の辞書を新たに作成しなおす必要がある。この作業を担当者が行うこととすると、多大な工数と時間を要するおそれがある。そこで、本実施形態においては、辞書作成装置10は、既存装置(既にサポート対象となっている装置)のサポートに利用する辞書(第1の辞書)を用いて、新規装置のサポートに利用する辞書(第2の辞書)を作成する。 By the way, when a new network device (new device) for which an inference model has not been created is to be supported, it is necessary to create a new dictionary for the new device. If the person in charge performs this work, it may require a great deal of man-hours and time. Therefore, in the present embodiment, the dictionary creation device 10 uses a dictionary (first dictionary) used to support existing devices (devices that are already supported) and a dictionary to be used to support new devices. (second dictionary).

なお、新規装置の辞書を作成する場合の既存装置としては、新規装置と同一ベンダであるなど、新規装置と類似する装置を採用することができる。これにより、新規装置の辞書をより精度良く作成できる可能性がある。ただし、これに限らず、既存装置としては、新規装置に関係なく、種々の既存装置を採用してもよい。 As the existing device when creating a dictionary for the new device, a device similar to the new device, such as being of the same vendor as the new device, can be adopted. This may allow the dictionary of the new device to be created more accurately. However, the present invention is not limited to this, and various existing devices may be adopted as the existing device regardless of the new device.

以下、辞書作成装置10について、詳細に説明する。図3には、辞書作成装置10のハードウェア構成が示されている。辞書作成装置10は、CPU(Central Processing Unit)90、ROM(Read Only Memory)92、RAM(Random Access Memory)94、記憶部(ここではHDD(Hard Disk Drive))96、ネットワークインタフェース97、表示部93、入力部95、及び可搬型記憶媒体用ドライブ99等を備えている。これら辞書作成装置10の構成各部は、バス98に接続されている。辞書作成装置10では、ROM92あるいはHDD96に格納されているプログラム(辞書作成プログラムを含む)、或いは可搬型記憶媒体用ドライブ99が可搬型記憶媒体91から読み取ったプログラムをCPU90が実行することにより、図4に示す、各部の機能が実現される。なお、図4の各部の機能は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。 The dictionary creation device 10 will be described in detail below. FIG. 3 shows the hardware configuration of the dictionary creation device 10. As shown in FIG. The dictionary creation device 10 includes a CPU (Central Processing Unit) 90, a ROM (Read Only Memory) 92, a RAM (Random Access Memory) 94, a storage unit (here, a HDD (Hard Disk Drive)) 96, a network interface 97, a display unit 93, an input unit 95, a portable storage medium drive 99, and the like. Each component of the dictionary creation device 10 is connected to the bus 98 . In the dictionary creation device 10, the CPU 90 executes a program (including a dictionary creation program) stored in the ROM 92 or HDD 96, or a program read from the portable storage medium 91 by the portable storage medium drive 99. 4 are realized. 4 may be implemented by an integrated circuit such as an ASIC (Application Specific Integrated Circuit) or an FPGA (Field Programmable Gate Array).

図4には、辞書作成装置10の機能ブロック図が示されている。辞書作成装置10においては、CPU90がプログラムを実行することにより、第1抽出部20、第2抽出部22、第1判断部としての絞り込み判断部24、第3抽出部26、一致度判定部28、辞書編集部としての登録フレーズ決定部30、としての機能が実現されている。以下、辞書作成装置10の処理の概要を示す図5を参照しつつ、辞書作成装置10の各部の機能について説明する。 FIG. 4 shows a functional block diagram of the dictionary creation device 10. As shown in FIG. In the dictionary creation device 10, the CPU 90 executes a program so that the first extracting section 20, the second extracting section 22, the narrowing determination section 24 as the first determining section, the third extracting section 26, and the degree of matching determination section 28 , and a registered phrase determining unit 30 as a dictionary editing unit. The function of each unit of the dictionary creation device 10 will be described below with reference to FIG. 5 showing an overview of the processing of the dictionary creation device 10.

第1抽出部20は、既存装置の辞書から、一部が共通するフレーズを抽出してグループ化し(図5のステップS100)、抽出したフレーズの共通部分(固定部と呼ぶ)と、共通しない部分(可変部と呼ぶ)とに分ける(ステップS110)。以下、この固定部と可変部に分ける処理を「整形」と呼ぶ。なお、図5では、固定部(HARDWARE FAULT)を有するフレーズのグループのみを図示しているが、第1抽出部20は、既存装置の辞書から、一部が共通するフレーズのグループを全て抽出して、整形する。 The first extraction unit 20 extracts and groups partially common phrases from the dictionary of the existing device (step S100 in FIG. 5), and extracts common parts (called fixed parts) of the extracted phrases and uncommon parts. (referred to as a variable portion) (step S110). Hereinafter, this process of dividing into the fixed part and the variable part will be referred to as "shaping". Although FIG. 5 shows only a group of phrases having a fixed part (HARDWARE FAULT), the first extraction unit 20 extracts all groups of phrases having a common part from the dictionary of the existing device. and shape it.

第2抽出部22は、第1抽出部20が抽出したフレーズの固定部を含むフレーズを既存装置のログから抽出してグループ化し、整形する(ステップS120)。なお、図5においては、固定部(HARDWARE FAULT)を有するフレーズのグループのみを図示している。 The second extraction unit 22 extracts phrases including fixed parts of the phrases extracted by the first extraction unit 20 from the log of the existing device, groups them, and shapes them (step S120). Note that FIG. 5 shows only a group of phrases having a fixed portion (HARDWARE FAULT).

絞り込み判断部24は、第2抽出部22が抽出したある固定部(例えば「HARDWARE FAULT」)に対応する可変部の種類(バリエーション)を特定する。また、絞り込み判断部24は、第1抽出部20が抽出したある固定部(例えば「HARDWARE FAULT」)に対応する可変部の種類(バリエーション)を特定する。そして、それぞれの可変部の種類を参照して、既存装置の辞書において特定された可変部の種類が、既存装置のログにおいて特定された可変部の種類に対して絞り込まれた状態であるかを判断する(ステップS130)。すなわち、図5の例では、絞り込み判断部24は、符号F2で示す可変部が、符号F1で示す可変部の全てを含み、かつ、完全一致していない場合に、絞り込まれた状態であると判断する。ここで、既存装置の辞書においてフレーズが絞り込まれていることは、ログに存在するフレーズのうち、特徴的なフレーズのみが辞書に登録されている可能性が高いことを意味する。 The narrowing-down determination unit 24 identifies the type (variation) of the variable portion corresponding to the fixed portion (for example, “HARDWARE FAULT”) extracted by the second extraction unit 22 . In addition, the narrowing-down determination unit 24 identifies the type (variation) of the variable portion corresponding to a certain fixed portion (for example, “HARDWARE FAULT”) extracted by the first extraction unit 20 . Then, by referring to the type of each variable part, it is determined whether the type of the variable part specified in the dictionary of the existing device is narrowed down to the type of the variable part specified in the log of the existing device. It judges (step S130). That is, in the example of FIG. 5, the narrowing-down determination unit 24 determines that the narrowed-down state is in the case where the variable part indicated by symbol F2 includes all of the variable parts indicated by symbol F1 and does not completely match. to decide. Here, the fact that phrases are narrowed down in the dictionary of the existing device means that there is a high possibility that only characteristic phrases among the phrases existing in the log are registered in the dictionary.

第3抽出部26は、絞り込み判断部24により、絞り込まれた状態であると判断された場合に、新規装置のログから固定部(例えば、「HARDWARE FAULT」)を含むフレーズを既存装置のログから抽出して、整形する(ステップS140)。 The third extraction unit 26 extracts a phrase including a fixed part (for example, "HARDWARE FAULT") from the log of the new device from the log of the existing device when the narrowing-down determination unit 24 determines that the state is narrowed down. It is extracted and shaped (step S140).

一致度判定部28は、第2抽出部22が抽出したフレーズの可変部の種類(F2)と、第3抽出部26が抽出したフレーズの可変部の種類(F3)との一致度(一致割合)を判定する(ステップS150)。なお、一致度の詳細については、後述する。 The matching degree determination unit 28 determines the degree of matching (matching ratio ) is determined (step S150). Details of the degree of matching will be described later.

登録フレーズ決定部30は、絞り込み判断部24の判断結果と、一致度判定部28の判定結果と、に基づいて、新規装置の辞書に登録するフレーズを決定する(ステップS160)。登録フレーズ決定部30の処理の詳細については後述する。 The registration phrase determination unit 30 determines phrases to be registered in the dictionary of the new device based on the determination result of the narrowing down determination unit 24 and the determination result of the matching degree determination unit 28 (step S160). Details of the processing of the registered phrase determination unit 30 will be described later.

(辞書作成装置10の処理について)
以下、図6~図8のフローチャートに沿って、その他図面を適宜参照しつつ、辞書作成装置10の処理について詳細に説明する。図6は、辞書作成装置10の全体処理を示すフローチャートであり、図7は、図6のステップS10の詳細処理を示すフローチャートであり、図8は、図6のステップS14の詳細処理を示すフローチャートである。
(Regarding the processing of the dictionary creation device 10)
Hereinafter, the processing of the dictionary creation device 10 will be described in detail along the flow charts of FIGS. 6 to 8 and with appropriate reference to other drawings. 6 is a flow chart showing the overall processing of the dictionary creation device 10, FIG. 7 is a flow chart showing the detailed processing of step S10 in FIG. 6, and FIG. 8 is a flow chart showing the detailed processing of step S14 in FIG. is.

図6の処理においては、まず、ステップS10において、第1抽出部20が、既存装置の辞書からフレーズを抽出し、整形する処理を実行する。このステップS10においては、具体的には、図7のフローチャートに沿った処理を実行する。 In the process of FIG. 6, first, in step S10, the first extraction unit 20 extracts a phrase from the dictionary of the existing device and executes processing to shape it. Specifically, in this step S10, the process according to the flowchart of FIG. 7 is executed.

(ステップS10の詳細処理)
図7の処理では、まずステップS40において、第1抽出部20が、基点と比較対象を設定する。例えば、既存装置の辞書が図9(a)に示すような11個のフレーズを有していたとする。この場合、第1抽出部20は、図9(b)に示すように、既存装置の辞書全体を処理対象とし、最初のフレーズ(1番のフレーズ)を基点として設定し、残りの2番~11番のフレーズを比較対象として設定する。
(Detailed processing of step S10)
In the process of FIG. 7, first, in step S40, the first extraction unit 20 sets a base point and a comparison target. For example, assume that the dictionary of the existing device has 11 phrases as shown in FIG. 9(a). In this case, as shown in FIG. 9(b), the first extraction unit 20 processes the entire dictionary of the existing device, sets the first phrase (the first phrase) as a base point, and sets the remaining second to The 11th phrase is set as a comparison target.

次いで、ステップS42では、第1抽出部20が、基点のフレーズと各比較対象のフレーズを比較する。この場合、第1抽出部20は、単語単位で、基点のフレーズに含まれる単語と一致している単語と、一致していない単語を判別する。 Next, in step S42, the first extraction unit 20 compares the base phrase and each comparison target phrase. In this case, the first extraction unit 20 distinguishes, on a word-by-word basis, words that match the words contained in the base phrase and words that do not match.

そして、ステップS44では、第1抽出部20が、一致語の位置と不一致語の位置のパターンが同じ比較対象と、基点をグループ化する。例えば、図9(b)の例では、基点と比較対象1~6とが、一致語(HARDWARE FAULT)が1単語目と2単語目で、不一致語が3単語目であり、一致語及び不一致語の位置のパターンが同じである。したがって、第1抽出部20は、これらのフレーズを1つのグループとする。 Then, in step S44, the first extraction unit 20 groups comparison objects having the same pattern of the position of the matching word and the position of the non-matching word, and the base point. For example, in the example of FIG. 9B, the reference point and the comparison objects 1 to 6 are the matching words (HARDWARE FAULT) in the first and second words, and the non-matching word in the third word. The pattern of word positions is the same. Therefore, the first extraction unit 20 groups these phrases into one group.

次いで、ステップS46では、第1抽出部20が、グループに含まれる各フレーズの一致語(HARDWARE FAULT)を固定部、不一致語(HARDWARE FAULT以外)を可変部とすることで、フレーズを整形する。図10(a)には、基点と比較対象1~6とを整形した状態(抽出フレーズ(整形後))が示されている。 Next, in step S46, the first extraction unit 20 shapes the phrase by setting the matching word (HARDWARE FAULT) of each phrase included in the group as a fixed part and the non-matching word (other than HARDWARE FAULT) as a variable part. FIG. 10(a) shows a state (extracted phrase (after shaping)) in which the base point and comparison objects 1 to 6 are shaped.

次いで、ステップS48では、第1抽出部20が、グループ化したものを処理対象から除外する。この場合、処理対象は、図9(a)の既存装置の辞書から図10(a)の抽出されたフレーズを除いた、図10(b)に示すものになる。 Next, in step S48, the first extraction unit 20 excludes the grouped items from the processing targets. In this case, the object to be processed is as shown in FIG. 10(b), which is obtained by removing the extracted phrases of FIG. 10(a) from the dictionary of the existing device shown in FIG. 9(a).

次いで、ステップS50では、第1抽出部20が、処理対象が残っているか否かを判断する。このステップS50の判断が肯定された場合には、ステップS40に戻る。その後、第1抽出部20は、図10(b)の処理対象に対して、基点と比較対象1、2、3を設定し(S40)、基点と比較対象1、2とをグループ化し(S44)、整形する(S46)。これにより、図10(c)に示すような抽出フレーズ(整形後)が得られることになる。 Next, in step S50, the first extraction unit 20 determines whether or not there are any remaining processing targets. If the determination in step S50 is affirmative, the process returns to step S40. After that, the first extraction unit 20 sets a base point and comparison targets 1, 2, and 3 for the processing target in FIG. 10B (S40), and groups the base point and comparison targets 1 and 2 (S44 ) and shaping (S46). As a result, an extracted phrase (after shaping) as shown in FIG. 10(c) is obtained.

その後は、処理対象からグループ化されたフレーズが除外されるが、処理対象には、「Service Level * has occurred with core」が残っているため、ステップS50の判断が肯定され、ステップS40に戻る。その後、ステップS40~S50を更に実行することで、図10(d)に示すような抽出フレーズ(整形後)が得られる。なお、「Service Level * has occurred with core」には、ワイルドカード(任意の文字列)を示す「*」が含まれている。このような場合には、ワイルドカード(*)を不一致語(可変部)とし、それ以外を一致語(固定部)とする。その後、ステップS50の判断が否定されると、図6のステップS12に移行する。 After that, the grouped phrases are excluded from the processing targets, but since "Service Level * has occurred with core" remains in the processing targets, the determination in step S50 is affirmative, and the process returns to step S40. After that, by further executing steps S40 to S50, an extracted phrase (after shaping) as shown in FIG. 10(d) is obtained. "Service Level * has occurred with core" includes "*" indicating a wildcard (arbitrary character string). In such a case, the wild card (*) is treated as a non-matching word (variable part), and the rest is treated as a matching word (fixed part). Thereafter, if the determination in step S50 is negative, the process proceeds to step S12 in FIG.

図6に戻り、ステップS12に移行すると、絞り込み判断部24が、ステップS10で得られたグループ(抽出フレーズ(整形後))の中から固定部を1つ選択する。ここでは、絞り込み判断部24は、図10(a)、図10(c)、図10(d)の中から固定部「HARDWARE FAULT」を選択したものとする。 Returning to FIG. 6, when the process proceeds to step S12, the narrowing down determination unit 24 selects one fixed part from the group (extracted phrase (after shaping)) obtained in step S10. Here, it is assumed that the narrow-down determination unit 24 selects the fixed part "HARDWARE FAULT" from among FIGS. 10(a), 10(c), and 10(d).

次いで、ステップS14では、絞り込み判断部24及び第2抽出部22が、選択された固定部に関し、絞り込み、未絞り込みを確認する処理を実行する。このステップS14では、具体的には、図8のフローチャートに沿った処理を実行する。 Next, in step S14, the narrowing determination unit 24 and the second extraction unit 22 perform processing for confirming whether the selected fixed portion is narrowed down or not narrowed down. Specifically, in this step S14, the process according to the flowchart of FIG. 8 is executed.

(ステップS14の詳細処理)
図8の処理では、まず、ステップS60において、選択された固定部に対応する可変部がワイルドカードであるか否かを判断する。このステップS60の判断が否定されると、ステップS61に移行する。
(Detailed processing of step S14)
In the process of FIG. 8, first, in step S60, it is determined whether or not the variable part corresponding to the selected fixed part is a wild card. If the determination in step S60 is negative, the process proceeds to step S61.

ステップS61に移行すると、絞り込み判断部24は、既存装置の辞書(図9(a))において、選択された固定部(HARDWARE FAULT)に対応する可変部の種類(バリエーション)を特定する。ここでは、絞り込み判断部24は、図10(a)に示されている7種類((I/OMod-EX)、(MDirAgnt 100)、…、(PRB))を特定する。なお、ここで特定される7種類は、既存装置の辞書から抽出されたフレーズ(図10(a))の種類数であるともいえる。 In step S61, the narrowing-down determination unit 24 identifies the type (variation) of the variable part corresponding to the selected fixed part (HARDWARE FAULT) in the existing device dictionary (FIG. 9A). Here, the narrowing-down determination unit 24 identifies seven types ((I/OMod-EX), (MDirAgnt 100), . . . , (PRB)) shown in FIG. 10(a). It can be said that the seven types specified here are the number of types of phrases (FIG. 10(a)) extracted from the dictionary of the existing device.

次いで、ステップS62では、第2抽出部22が、既存装置のログにおいて、選択された固定部(HARDWARE FAULT)に対応するフレーズを抽出する。また、絞り込み判断部24が、可変部の種類(バリエーション)を特定する。より具体的には、第2抽出部22は、図11(a)に示すような既存装置のログを準備する。なお、既存装置のログは、顧客から問い合わせがあった際に送付されたログである。そして、第2抽出部22は、既存装置のログから、選択された固定部(HARDWARE FAULT)を含むフレーズを抽出し、図11(b)に示すように、固定部と可変部に分ける(整形する)。図11(b)の例では、絞り込み判断部24は、可変部の種類として8種類((I/OMod-EX)、(MDirAgnt 100)、…、(PRB)、(YMZ))を特定する。なお、ここで特定された8種類は、既存装置のログから抽出されたフレーズ(図11(b))の種類数であるともいえる。 Next, in step S62, the second extractor 22 extracts a phrase corresponding to the selected fixed part (HARDWARE FAULT) in the log of the existing device. Further, the narrowing-down determination unit 24 specifies the type (variation) of the variable portion. More specifically, the second extractor 22 prepares the log of the existing device as shown in FIG. 11(a). Note that the log of the existing device is a log sent when an inquiry is received from the customer. Then, the second extraction unit 22 extracts phrases including the selected fixed part (HARDWARE FAULT) from the log of the existing device, and divides them into the fixed part and the variable part (shaping) as shown in FIG. do). In the example of FIG. 11B, the narrowing-down determination unit 24 specifies eight types ((I/OMod-EX), (MDirAgnt 100), . It can be said that the eight types specified here are the number of types of phrases (FIG. 11(b)) extracted from the log of the existing device.

次いで、ステップS64では、絞り込み判断部24が、既存装置の辞書において特定された可変部の種類(図10(a))と、既存装置のログにおいて特定された可変部の種類(図11(b))と、を比較する。この比較においては、既存装置の辞書において特定された可変部の種類が、既存装置のログにおいて特定された可変部の種類に対して限定的であるかを確認する。ここで、限定的とは、既存装置の辞書において特定された可変部それぞれが、既存装置のログにおいて特定された可変部に含まれており、かつ、完全一致ではないことを意味する。 Next, in step S64, the narrowing-down determination unit 24 determines the type of the variable part specified in the dictionary of the existing device (FIG. 10A) and the type of the variable part specified in the log of the existing device (FIG. 11B )) and compare. The comparison checks to see if the type of variable portion identified in the dictionary of the existing device is specific to the type of variable portion identified in the log of the existing device. Here, "restrictive" means that each variable part specified in the dictionary of the existing device is included in the variable part specified in the log of the existing device and is not a perfect match.

次いで、ステップS66では、絞り込み判断部24が、限定的か否かを判断する。図10(a)と図11(b)の例では、図12に示すように、既存装置の辞書において特定された可変部(8種類)に、既存装置のログにおいて特定された可変部(7種類)の全てと、それ以外の可変部も含まれているため、限定的であると判断される。この場合、図8のステップS66の判断は肯定され、ステップS68に移行する。 Next, in step S66, the narrowing-down determination unit 24 determines whether or not it is restrictive. In the examples of FIGS. 10A and 11B, as shown in FIG. 12, the variable parts (8 types) specified in the dictionary of the existing device are added to the variable parts (7 types) specified in the log of the existing device. Type) and other variable parts are included, so it is judged to be limited. In this case, the determination in step S66 of FIG. 8 is affirmative, and the process proceeds to step S68.

ステップS68に移行すると、絞り込み判断部24は、絞り込まれていると判断し、図8の全処理を終了し、図6のステップS16に移行する。 When the process proceeds to step S68, the narrowing down determination unit 24 determines that the narrowing down has been performed, ends all the processes in FIG. 8, and proceeds to step S16 in FIG.

一方、ステップS66の判断が否定された場合には、ステップS70に移行する。例えば、図13の下段に示すように、既存装置のログにおいて特定された可変部が7種類であった場合に、図13の上段に示すように、既存装置の辞書において特定された可変部が7種類であり、完全一致していたとする。この場合には、限定的でないため、ステップS66の判断が否定され、ステップS70に移行し、絞り込み判断部24は、絞り込みされていないと判断する。その後は、図6のステップS16に移行する。 On the other hand, if the determination in step S66 is negative, the process proceeds to step S70. For example, as shown in the lower part of FIG. 13, if there are seven types of variable parts specified in the log of the existing device, as shown in the upper part of FIG. It is assumed that there are 7 types and that they are completely matched. In this case, since it is not restrictive, the determination in step S66 is negative, the process proceeds to step S70, and the narrowing down determination unit 24 determines that the narrowing down is not performed. After that, the process proceeds to step S16 in FIG.

なお、例えば、図14(a)の左上図に示すように、固定部として「Service Level、has occurred with core」が選択され、既存装置の辞書から2種類のフレーズが抽出されたとする。また、既存装置のログから、選択された固定部「Service Level、has occurred with core」を含むフレーズとして、図14(a)の右下図に示す2種類のフレーズが抽出されたとする。このような場合には、図14(a)の左上図と右下図とにおいて、可変部の種類が完全一致しているため、既存装置の辞書は絞り込まれていないと判断される(S70)。一方、図14(b)の左上図に示すように、固定部として「Service Level、has occurred with core」が選択され、既存装置の辞書から1種類のフレーズが抽出されたとする。また、既存装置のログから、選択された固定部「Service Level、has occurred with core」を含むフレーズとして、図14(b)の右下図に示す2種類のフレーズが抽出されたとする。このような場合には、既存装置の辞書は、絞り込まれていると判断される(S68)。 For example, as shown in the upper left diagram of FIG. 14(a), it is assumed that "Service Level, has occurred with core" is selected as the fixed part and two types of phrases are extracted from the dictionary of the existing device. It is also assumed that two types of phrases shown in the lower right diagram of FIG. 14A are extracted from the log of the existing device as phrases containing the selected fixed part "Service Level, has occurred with core". In such a case, it is determined that the dictionaries of the existing devices have not been narrowed down because the types of the variable portions are exactly the same in the upper left diagram and the lower right diagram of FIG. 14(a) (S70). On the other hand, as shown in the upper left diagram of FIG. 14B, it is assumed that "Service Level, has occurred with core" is selected as the fixed part and one type of phrase is extracted from the dictionary of the existing device. It is also assumed that two types of phrases shown in the lower right diagram of FIG. 14B are extracted from the log of the existing device as phrases containing the selected fixed part "Service Level, has occurred with core". In such a case, it is determined that the dictionaries of existing devices have been narrowed down (S68).

ところで、図6のステップS12において、固定部として、図10(d)の固定部「Service Level、has occurred with core」が選択されたとする。この場合、可変部がワイルドカードであるので、図8の処理においては、ステップS60の判断が肯定され、ステップS61~S66の処理・判断を経ずに、ステップS70に移行する。ステップS70に移行すると、絞り込み判断部24は、既存装置の辞書は絞り込まれていないと判断する。 By the way, it is assumed that the fixed part "Service Level, has occurred with core" in FIG. 10D is selected as the fixed part in step S12 of FIG. In this case, since the variable part is a wild card, the determination in step S60 is affirmative in the process of FIG. In step S70, the narrowing down determination unit 24 determines that the dictionaries of the existing devices have not been narrowed down.

図6に戻り、ステップS16に移行すると、絞り込み判断部24は、絞り込まれているか否かを判断する。このステップS16の判断が肯定されると、ステップS18に移行する。 Returning to FIG. 6, when the process moves to step S16, the narrowing-down determination unit 24 determines whether or not the narrowing-down is performed. If the determination in step S16 is affirmative, the process proceeds to step S18.

ステップS18に移行した場合、第3抽出部26は、選択された固定部(HARDWARE FAULT)に対応するフレーズを新規装置のログから抽出するとともに、固定部と可変部に分けて整形する。この場合、第3抽出部26は、新規装置のログにおいて「HARDWARE FAULT」を含むフレーズを検索する。例えば、新規装置のログから抽出されたフレーズが、図15(a)に示すようなフレーズであったとする。 When the process proceeds to step S18, the third extraction unit 26 extracts the phrase corresponding to the selected fixed part (HARDWARE FAULT) from the log of the new device, and separates it into the fixed part and the variable part for shaping. In this case, the third extraction unit 26 searches for phrases including "HARDWARE FAULT" in the log of the new device. For example, assume that the phrases extracted from the log of the new device are the phrases shown in FIG. 15(a).

次いで、ステップS20では、一致度判定部28が、新規装置のログから、選択された固定部を含むフレーズが抽出されたか否かを判断する。図15(a)のようにフレーズが1つでも抽出された場合には、ステップS20の判断が肯定され、ステップS22に移行する。 Next, in step S20, the degree-of-match determination unit 28 determines whether or not a phrase including the selected fixed part has been extracted from the log of the new device. If at least one phrase is extracted as shown in FIG. 15A, the determination in step S20 is affirmative, and the process proceeds to step S22.

ステップS22に移行すると、一致度判定部28は、新規装置のログから抽出されたフレーズ(図15(a))と、既存装置のログから抽出されたフレーズ(図15(b)参照)と、の一致度を算出する。具体的には、一致度判定部28は、既存装置のログから抽出されたフレーズ(図15(b))と、新規装置のログから抽出されたフレーズ(図15(a))を用いて、図15(c)のような表を作成する。ここで、図15(c)の表には、図15(a)、図15(b)の全フレーズ(固定部と可変部)が列挙されており、それぞれのフレーズが既存装置のログや新規装置のログから抽出されたかが「有」/「無」にて示されている。一致度判定部28は、この図15(c)の表から、全フレーズにおける既存装置のログと新規装置のログの両方から抽出されたフレーズの割合を「一致度」として求める。図15(c)の例では、抽出された全フレーズ数に対する、既存装置のログの欄に「有」が格納され、新規装置のログの欄に「有」が格納されているフレーズ数の割合(一致数/全フレーズ数=6/9≒0.67)を求め、一致度とする。 In step S22, the degree-of-match determination unit 28 determines the phrase extracted from the log of the new device (FIG. 15(a)), the phrase extracted from the log of the existing device (see FIG. 15(b)), Calculate the degree of matching. Specifically, the matching degree determination unit 28 uses the phrase extracted from the log of the existing device (FIG. 15B) and the phrase extracted from the log of the new device (FIG. 15A) to Create a table as shown in FIG. 15(c). Here, in the table of FIG. 15(c), all phrases (fixed parts and variable parts) of FIGS. Whether or not it is extracted from the log of the device is indicated by "yes"/"no". From the table of FIG. 15(c), the degree-of-match determination unit 28 obtains the percentage of phrases extracted from both the log of the existing device and the log of the new device in all phrases as the "degree of match." In the example of FIG. 15(c), the ratio of the number of phrases for which "Yes" is stored in the log column of the existing device and "Yes" is stored in the log column of the new device to the total number of extracted phrases. (Number of matches/number of all phrases=6/9≈0.67) is obtained as the degree of matching.

次いで、ステップS24では、一致度判定部28が、一致度が閾値以上であるか否かを判断する。例えば、閾値が0.6であるとすると、図15(c)の例では、ステップS24の判断は肯定され、ステップS26に移行する。なお、ステップS24においては、既存装置における絞り込みが新規装置でも有効か否かを判断していると言える。 Next, in step S24, the degree-of-match determination unit 28 determines whether or not the degree of match is greater than or equal to a threshold. For example, assuming that the threshold is 0.6, in the example of FIG. 15(c), the determination in step S24 is affirmative, and the process proceeds to step S26. Incidentally, in step S24, it can be said that it is determined whether or not the narrowing down of the existing devices is also effective in the new device.

ステップS26に移行した場合、既存装置のログにおいて特定された可変部のバリエーションが新規装置のログにおいて特定された可変部のバリエーションとほぼ同じと見做せる。この場合、新規装置においても既存装置と同じ絞り込みルールを用いることが有効であると考えられる。したがって、ステップS26においては、登録フレーズ決定部30は、既存装置の辞書のうち選択されている固定部(HARDWARE FAULT)を有するフレーズを新規装置の辞書にそのまま流用して登録する(図15(d)参照)。その後は、ステップS32に移行する。 If the process proceeds to step S26, it can be assumed that the variation of the variable part specified in the log of the existing device is substantially the same as the variation of the variable part specified in the log of the new device. In this case, it is considered effective to use the same narrowing rule as the existing device for the new device. Therefore, in step S26, the registration phrase determination unit 30 registers the phrase having the selected fixed part (HARDWARE FAULT) in the dictionary of the existing device as it is in the dictionary of the new device (Fig. 15(d) )reference). After that, the process proceeds to step S32.

一方、図16(a)には、一致度が閾値未満になる例が示されている。図16(a)の例では、新規装置のログに含まれるフレーズの有無と、既存装置のログに含まれるフレーズの有無があまり一致していない。図16(a)において、図15(c)と同様に一致度を算出すると、一致度=4/11≒0.36となり、閾値=0.6未満となる。このような場合には、ステップS24の判断が否定され、ステップS30に移行する。ステップS30に移行した場合、既存装置のログにおいて特定された可変部のバリエーションが新規装置のログにおいて特定された可変部のバリエーションと大きく異なると見做せるので、既存装置と同じ絞り込みルールを用いることはできない。したがって、ステップS30においては、登録フレーズ決定部30は、図16(b)に示すように可変部をワイルドカード(*)指定(任意の文字列)にして新規装置の辞書に登録する。すなわち、固定部(HARDWARE FAULT)を有するフレーズの全てを抽出するという情報を新規装置の辞書に登録する。その後は、ステップS32に移行する。 On the other hand, FIG. 16A shows an example in which the degree of matching is less than the threshold. In the example of FIG. 16A, the presence/absence of phrases included in the log of the new device and the presence/absence of phrases included in the log of the existing device do not match very much. In FIG. 16(a), when the degree of matching is calculated in the same manner as in FIG. 15(c), the degree of matching is 4/11≈0.36, and the threshold value is less than 0.6. In such a case, the determination in step S24 is negative, and the process proceeds to step S30. If the process proceeds to step S30, it can be assumed that the variation of the variable part specified in the log of the existing device is significantly different from the variation of the variable part specified in the log of the new device, so the same narrowing rule as that of the existing device should be used. can't. Therefore, in step S30, the registered phrase determination unit 30 designates the variable part as a wild card (*) (arbitrary character string) and registers it in the dictionary of the new device as shown in FIG. 16(b). That is, information is registered in the dictionary of the new device to extract all phrases having a fixed part (HARDWARE FAULT). After that, the process proceeds to step S32.

ところで、ステップS16の判断が否定されたとき、すなわち、既存装置の辞書から抽出されたフレーズが、既存装置のログから抽出されたフレーズに対して絞り込まれていなかった場合にも、登録フレーズ決定部30は、ステップS30に移行する。この場合にも、登録フレーズ決定部30は、図16(b)に示すように可変部をワイルドカード指定にして新規装置の辞書に登録する。なお、ステップS16の判断が否定される場合には、図10(d)のような、既存装置の辞書から抽出されたフレーズの可変部がワイルドカードである場合も含まれる。この場合には、登録フレーズ決定部30は、ステップS30において、図16(c)に示すように、既存装置の辞書から抽出されたフレーズそのものを新規装置の辞書に登録する。 By the way, when the determination in step S16 is negative, that is, when the phrases extracted from the dictionary of the existing device have not been narrowed down to the phrases extracted from the log of the existing device, the registered phrase determining unit 30 moves to step S30. In this case as well, the registered phrase determination unit 30 designates the variable part as a wildcard and registers it in the dictionary of the new device as shown in FIG. 16(b). It should be noted that the case where the determination in step S16 is negative also includes the case where the variable part of the phrase extracted from the dictionary of the existing device is a wild card, as shown in FIG. 10(d). In this case, the registered phrase determination unit 30 registers the phrase itself extracted from the dictionary of the existing device in the dictionary of the new device in step S30, as shown in FIG. 16(c).

また、図6の処理においてステップS20の判断が否定された場合、すなわち、新規装置のログから、選択された固定部(HARDWARE FAULT)を含むフレーズが抽出されなかった場合には、登録フレーズ決定部30は、ステップS28に移行する。ステップS28に移行した場合、登録フレーズ決定部30は、選択された固定部(HARDWARE FAULT)を有するフレーズを新規装置の辞書には登録しないこととする。その後は、ステップS32に移行する。 If the determination in step S20 in the process of FIG. 6 is negative, that is, if no phrase containing the selected fixed part (HARDWARE FAULT) is extracted from the log of the new device, the registered phrase determination unit 30 moves to step S28. When proceeding to step S28, the registered phrase determining unit 30 does not register the phrase having the selected fixed part (HARDWARE FAULT) in the dictionary of the new device. After that, the process proceeds to step S32.

ステップS32に移行すると、絞り込み判断部24は、全ての固定部を選択したか否かを判断する。このステップS32の判断が否定された場合には、ステップS12に戻り、ステップS32の判断が肯定されるまで、上述したステップS12~S32の処理が繰り返し実行されることになる。そして、ステップS32の判断が肯定されると、図6の全処理が終了する。 After moving to step S32, the narrowing-down determination unit 24 determines whether or not all the fixed portions have been selected. If the determination in step S32 is negative, the process returns to step S12, and the processes of steps S12 to S32 are repeatedly executed until the determination in step S32 is positive. Then, when the determination in step S32 is affirmative, all the processing in FIG. 6 ends.

これまでの説明からわかるように、本実施形態では、第1抽出部20と絞り込み判断部24とにより、既存装置の辞書からフレーズを抽出して、抽出したフレーズの種類(可変部の種類)を特定する第1特定部としての機能が実現されている。また、第2抽出部22と絞り込み判断部24とにより、既存装置のログからフレーズを抽出し、抽出したフレーズの種類(可変部の種類)を特定する第2特定部としての機能が実現されている。更に、第3抽出部26と一致度判定部28とにより、新規装置のログからフレーズを抽出して、抽出したフレーズの種類(可変部の種類)を特定するとともに、特定した種類と、既存装置のログから抽出されたフレーズの種類(可変部の種類)との一致度が所定以上かを判断する第2判断部としての機能が実現されている。 As can be seen from the above description, in this embodiment, the first extraction unit 20 and the narrowing-down judgment unit 24 extract phrases from the dictionary of the existing device, A function as a first specifying unit for specifying is realized. In addition, the second extraction unit 22 and the narrowing determination unit 24 realize a function as a second identification unit that extracts phrases from the log of the existing device and identifies the type of the extracted phrase (type of variable part). there is Furthermore, the third extraction unit 26 and the degree of matching determination unit 28 extract phrases from the log of the new device, identify the type of the extracted phrase (type of variable part), and function as a second determination unit that determines whether the degree of matching with the type of phrase (type of variable part) extracted from the log of 1 is above a predetermined level.

以上、詳細に説明したように、本実施形態によると、第1抽出部20は、既存装置のログから抽出するフレーズを登録する辞書(既存装置の辞書)から、一部が共通する複数のフレーズを抽出し(S10)、絞り込み判断部24は、共通する部分(固定部)以外の可変部の種類を特定する(S61)。また、第2抽出部22は、既存装置のログから固定部を含むフレーズを抽出し、絞り込み判断部24は、抽出したフレーズに含まれる可変部の種類を特定する(S62)。また、絞り込み判断部24は、既存装置のログから特定された可変部の種類に対して、既存装置の辞書から特定された可変部の種類が限定的であるかを判断する(S66~S70、S16)。この判断の結果、限定的であった場合(S16:肯定)には、第3抽出部26が、新規装置のログから固定部を含むフレーズを抽出する(S18)。また、一致度判定部28が、新規装置のログから抽出したフレーズに含まれる可変部の種類と、既存装置のログから特定された可変部の種類との一致度が閾値以上かを判断する(S24)。そして、登録フレーズ決定部30は、閾値以上の場合(S24:肯定)に、既存装置の辞書から抽出した複数のフレーズをそのまま新規装置の辞書に登録する(S26)。これにより、本実施形態では、既存装置の辞書に特徴的なフレーズが絞り込んで登録されており、かつ、新規装置のログにおいても特徴的なフレーズの絞り込みが有効であるときに、既存装置の辞書の特徴的なフレーズを新規装置の辞書に自動的に登録することができる。したがって、作業工数をかけることなく、新規装置の辞書に適切なフレーズを登録することが可能である。 As described in detail above, according to the present embodiment, the first extraction unit 20 extracts a plurality of partially common phrases from a dictionary (existing device dictionary) that registers phrases to be extracted from logs of an existing device. (S10), and the narrowing-down determination unit 24 identifies the type of variable portion other than the common portion (fixed portion) (S61). Further, the second extraction unit 22 extracts phrases including fixed parts from the log of the existing device, and the narrowing-down determination unit 24 specifies the types of variable parts included in the extracted phrases (S62). In addition, the narrowing-down determination unit 24 determines whether the type of the variable part specified from the dictionary of the existing device is limited to the type of the variable part specified from the log of the existing device (S66 to S70, S16). As a result of this determination, if it is limited (S16: affirmative), the third extraction unit 26 extracts phrases including fixed parts from the log of the new device (S18). Also, the matching degree determination unit 28 determines whether the degree of matching between the types of variable portions included in the phrase extracted from the log of the new device and the type of variable portions specified from the log of the existing device is equal to or greater than a threshold value ( S24). Then, if the number of phrases is equal to or greater than the threshold (S24: Yes), the registered phrase determination unit 30 registers the phrases extracted from the dictionary of the existing device as they are in the dictionary of the new device (S26). As a result, in the present embodiment, when characteristic phrases are narrowed down and registered in the dictionary of the existing device, and narrowing down of characteristic phrases is effective in the log of the new device, the dictionary of the existing device characteristic phrases can be automatically registered in the new device's dictionary. Therefore, it is possible to register appropriate phrases in the dictionary of the new device without spending work man-hours.

また、本実施形態では、新規装置が既存装置の系列の装置である場合以外にも、新規装置の構成物(ラインカード、インタフェースカード、チップ、部品)が既存装置と共通又は類似する場合等において、作業工数をかけずに新規装置の辞書を自動的に作成することができる。 In addition, in this embodiment, in addition to the case where the new device is a device of the series of the existing device, when the configuration of the new device (line card, interface card, chip, parts) is common or similar to the existing device , it is possible to automatically create a new device dictionary without spending a lot of work.

ここで、新規装置の辞書を作成する際に、既存装置の辞書を全て流用することも考えられる。しかしながら、この場合には、一致度が閾値未満の場合(図16(a)の場合)にも、絞り込まれたフレーズしか新規装置の辞書に登録されないことになる。したがって、適切なフレーズを用いた機械学習が行われなくなるため、回答パターンの推論精度が低下するおそれがある。これに対し、本実施形態では、一致度が閾値以上でない場合に、固定部を含む全てのフレーズ(可変部がワイルドカード指定のフレーズ)を新規装置の辞書に登録するようにしている。これにより、新規装置のログから適切なフレーズ(既存装置のログには無いが、新規装置のログにある特徴的なフレーズ)が抽出されることになる。したがって、既存装置の辞書をそのまま新規装置の辞書に登録する場合よりも、回答パターンの推論精度を向上することができる。 Here, when creating a dictionary for a new device, it is conceivable to use all the dictionaries of existing devices. However, in this case, even when the degree of matching is less than the threshold (case of FIG. 16A), only the narrowed down phrases are registered in the dictionary of the new device. Therefore, since machine learning using appropriate phrases is no longer performed, there is a risk that the inference accuracy of the answer pattern will decrease. On the other hand, in the present embodiment, all phrases including fixed parts (phrases whose variable parts are designated as wildcards) are registered in the dictionary of the new device when the degree of matching is not equal to or greater than the threshold. As a result, appropriate phrases (characteristic phrases in the log of the new device but not in the log of the existing device) are extracted from the log of the new device. Therefore, it is possible to improve the accuracy of answer pattern inference as compared with the case where the dictionary of the existing device is registered as it is in the dictionary of the new device.

一方、一致率が低い場合には、選択されている固定部を含むフレーズを新規装置の辞書へ登録しないという方法も考えられる。しかしながら、選択されている固定部を含むフレーズが新規装置のログに含まれている以上、少なくとも選択されている固定部に関しては新規装置のログを特徴づける重要なフレーズである可能性が高い。したがって、本実施形態では、このようなフレーズをワイルドカード指定で新規装置の辞書に登録して、強制的に抽出するようにしている。このようにすることで、新規装置のサポート開始時点での推論精度を高くすることができる。 On the other hand, if the match rate is low, a method of not registering the phrase containing the selected fixed part in the dictionary of the new device is also conceivable. However, as long as the phrase containing the selected fixed part is included in the log of the new device, there is a high possibility that at least the selected fixed part is an important phrase that characterizes the log of the new device. Therefore, in the present embodiment, such phrases are registered in the dictionary of the new device with a wildcard specification, and are forcibly extracted. By doing so, it is possible to improve the inference accuracy at the time of starting support for the new device.

また、本実施形態では、絞り込み判断部24は、既存装置のログにおいて特定された可変部の種類の中に、既存装置の辞書において特定された可変部の種類の全てが含まれており、かつ、完全一致していない場合に、限定的であると判断する(S14、図8)。これにより、既存装置の辞書に特徴的なフレーズが登録されているか否かを適切に判断することができる。 Further, in the present embodiment, the narrowing-down determination unit 24 includes all types of variable portions specified in the dictionary of the existing device in the types of variable portions specified in the log of the existing device, and , and if they do not completely match, it is determined to be limited (S14, FIG. 8). Thereby, it is possible to appropriately determine whether or not a characteristic phrase is registered in the dictionary of the existing device.

また、本実施形態では、絞り込み判断部24の判断の結果、限定的でなかった場合(S16:否定)、登録フレーズ決定部30は、選択された固定部を含む全てのフレーズ(可変部がワイルドカード指定されたフレーズ)を新規装置の辞書に登録する(S30)。これにより、新規装置のログからの特徴的なフレーズの抽出漏れを抑制することができる。 Further, in the present embodiment, if the result of determination by the narrowing-down determination unit 24 is that it is not restrictive (S16: No), the registered phrase determination unit 30 selects all phrases including the selected fixed part (the variable part is wild). card-specified phrase) is registered in the dictionary of the new device (S30). As a result, it is possible to suppress omission of extraction of characteristic phrases from the log of the new device.

また、本実施形態では、新規装置のログから選択された固定部を含むフレーズを抽出できなかった場合(S20:否定)に、登録フレーズ決定部30は、選択された固定部を含むフレーズを新規装置の辞書に登録しないこととしている(S28)。これにより、新規装置のログから回答パターンを得る際に不要である可能性の高いフレーズを新規装置の辞書に登録しないようにすることができる。 Further, in the present embodiment, when a phrase containing the selected fixed part cannot be extracted from the log of the new device (S20: No), the registered phrase determination unit 30 adds the phrase containing the selected fixed part to the new device. It is not registered in the dictionary of the device (S28). This makes it possible to avoid registering phrases that are highly likely to be unnecessary when obtaining answer patterns from the log of the new device in the dictionary of the new device.

また、本実施形態では、登録フレーズ決定部30は、既存装置の辞書にワイルドカード指定を含むフレーズが登録されている場合に、当該フレーズを新規装置の辞書に含める(S60:肯定、S70、S16:否定、S30)。これにより、新規装置のログからの特徴的なフレーズの抽出漏れを抑制することができる。 In addition, in the present embodiment, when a phrase including a wildcard designation is registered in the dictionary of the existing device, the registered phrase determination unit 30 includes the phrase in the dictionary of the new device (S60: affirmative, S70, S16 : No, S30). As a result, it is possible to suppress omission of extraction of characteristic phrases from the log of the new device.

また、本実施形態では、フレーズのうち、固定部を除く可変部の種類を特定して、絞り込まれているか否かの判断や一致度の算出を行う。したがって、フレーズ全体を用いて、絞り込まれているか否かの判断や一致度の算出を行う場合と比べて、処理量を低減することができる。 Further, in the present embodiment, types of variable parts other than fixed parts are specified in phrases, and whether or not they are narrowed down is determined and the degree of matching is calculated. Therefore, the amount of processing can be reduced compared to the case of determining whether or not the phrases have been narrowed down and calculating the degree of matching using the entire phrase.

なお、上記実施形態では、辞書やログから抽出したフレーズを固定部と可変部に分けて整形し、可変部の種類を用いて、絞り込まれているか否かの判断や一致度の算出を行う場合について説明したが、これに限られるものではない。すなわち、辞書やログから抽出したフレーズそのものの種類を用いて、絞り込まれているか否かの判断や一致度の算出を行うこととしてもよい。 In the above embodiment, phrases extracted from dictionaries and logs are divided into fixed parts and variable parts and shaped, and the types of the variable parts are used to determine whether or not the phrases have been narrowed down and to calculate the degree of matching. has been described, but it is not limited to this. That is, it is possible to determine whether or not the phrases have been narrowed down and calculate the degree of matching using the types of phrases extracted from a dictionary or log.

なお、上記の処理機能は、コンピュータによって実現することができる。その場合、処理装置が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記憶媒体(ただし、搬送波は除く)に記録しておくことができる。 Note that the processing functions described above can be realized by a computer. In that case, a program is provided that describes the processing contents of the functions that the processing device should have. By executing the program on a computer, the above processing functions are realized on the computer. A program describing the processing content can be recorded in a computer-readable storage medium (excluding carrier waves).

プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD(Digital Versatile Disc)、CD-ROM(Compact Disc Read Only Memory)などの可搬型記憶媒体の形態で販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。 When a program is distributed, it is sold in the form of a portable storage medium such as a DVD (Digital Versatile Disc) or a CD-ROM (Compact Disc Read Only Memory) on which the program is recorded. It is also possible to store the program in the storage device of the server computer and transfer the program from the server computer to another computer via the network.

プログラムを実行するコンピュータは、例えば、可搬型記憶媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記憶媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。 A computer that executes a program stores, for example, a program recorded on a portable storage medium or a program transferred from a server computer in its own storage device. The computer then reads the program from its own storage device and executes processing according to the program. The computer can also read the program directly from the portable storage medium and execute processing according to the program. In addition, the computer can also execute processing in accordance with the received program each time the program is transferred from the server computer.

上述した実施形態は本発明の好適な実施の例である。但し、これに限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変形実施可能である。 The embodiments described above are examples of preferred implementations of the present invention. However, the present invention is not limited to this, and various modifications can be made without departing from the spirit of the present invention.

なお、以上の実施形態の説明に関して、更に以下の付記を開示する。
(付記1) 第1の装置のログから抽出する文字列を登録する第1の辞書から、一部に共通部分を有する複数の文字列を抽出して、抽出した前記複数の文字列の種類を特定する第1特定部と、
前記第1の装置のログから前記共通部分を含む文字列を抽出し、抽出した文字列の種類を特定する第2特定部と、
前記第2特定部が特定した文字列の種類に対して、前記第1特定部が特定した文字列の種類が限定的であるか判断する第1判断部と、
前記第1判断部の判断の結果、限定的であった場合に、前記第1の装置とは異なる第2の装置のログから一部に前記共通部分を含む文字列を抽出し、抽出した文字列の種類を特定するとともに、特定した該文字列の種類と、前記第2特定部が特定した文字列の種類との一致度が所定以上かを判断する第2判断部と、
前記一致度が所定以上の場合に、前記第1特定部が抽出した前記複数の文字列を、前記第2の装置のログから抽出する文字列を登録する第2の辞書に含める、辞書編集部と、
を備える辞書作成装置。
(付記2) 前記第1判断部は、前記第2特定部が特定した文字列の種類の中に、前記第1特定部が特定した文字列の種類の全てが含まれ、かつ、前記第2特定部が特定した文字列の種類と前記第1特定部が特定した文字列の種類とが完全一致していない場合に、限定的であると判断する、ことを特徴とする付記1に記載の辞書作成装置。
(付記3) 前記辞書編集部は、前記第1判断部の判断の結果、限定的でなかった場合、前記共通部分を有する全ての文字列を前記第2の装置のログから抽出するための情報を、前記第2の辞書に含めることを特徴とする付記1又は2に記載の辞書作成装置。
(付記4) 前記辞書編集部は、前記一致度が所定以上でない場合に、前記共通部分を含む全ての文字列を前記第2の装置のログから抽出するための情報を、前記第2の辞書に含めることを特徴とする付記1~3のいずれかに記載の辞書作成装置。
(付記5) 前記辞書編集部は、前記第2判断部が前記第2の装置のログから前記共通部分を含む文字列を抽出できなかった場合に、前記共通部分を含む文字列を前記第2の辞書に含めないことを特徴とする付記1~4のいずれかに記載の辞書作成装置。
(付記6) 前記辞書編集部は、前記第1の辞書に任意文字が指定された箇所を含む文字列が登録されている場合に、該文字列を前記第2の辞書に含める、ことを特徴とする付記1~5のいずれかに記載の辞書作成装置。
(付記7) 前記文字列の種類を特定する処理は、前記文字列のうち共通部分以外の部分の種類を特定する処理である、ことを特徴とする付記1~6のいずれかに記載の辞書作成装置。
(付記8) 第1の装置のログから抽出する文字列を登録する第1の辞書から、一部に共通部分を有する複数の文字列を抽出して、抽出した前記複数の文字列の種類を特定し、
前記第1の装置のログから前記共通部分を含む文字列を抽出し、抽出した文字列の種類を特定し、
前記第1の装置のログから特定した文字列の種類に対して、前記第1の辞書から特定した文字列の種類が限定的であるか判断し、
前記判断の結果、限定的であった場合に、前記第1の装置とは異なる第2の装置のログから一部に前記共通部分を含む文字列を抽出し、抽出した文字列の種類を特定するとともに、特定した該文字列の種類と、前記第1の装置のログから特定した文字列の種類との一致度が所定以上かを判断し、
前記一致度が所定以上の場合に、前記第1の辞書から抽出した前記複数の文字列を、前記第2の装置のログから抽出する文字列を登録する第2の辞書に含める、
処理をコンピュータが実行することを特徴する辞書作成方法。
(付記9) 前記限定的であるか判断する処理では、前記第1の装置のログから特定した文字列の種類の中に、前記第1の装置の辞書から特定した文字列の種類の全てが含まれ、かつ、前記第1の装置のログから特定した文字列の種類と前記第1の装置の辞書から特定した文字列の種類とが完全一致していない場合に、限定的であると判断する、ことを特徴とする付記8に記載の辞書作成方法。
(付記10) 前記限定的であるか判断する処理の結果、限定的でなかった場合、前記共通部分を有する全ての文字列を前記第2の装置のログから抽出するための情報を、前記第2の辞書に含めることを特徴とする付記8又は9に記載の辞書作成方法。
(付記11) 前記一致度が所定以上でない場合に、前記共通部分を含む全ての文字列を前記第2の装置のログから抽出するための情報を、前記第2の辞書に含めることを特徴とする付記8~10のいずれかに記載の辞書作成方法。
(付記12) 前記第2の装置のログから前記共通部分を含む文字列を抽出できなかった場合に、前記共通部分を含む文字列を前記第2の辞書に含めないことを特徴とする付記8~11のいずれかに記載の辞書作成方法。
(付記13) 前記第1の辞書に任意文字が指定された箇所を含む文字列が登録されている場合に、該文字列を前記第2の辞書に含める、ことを特徴とする付記8~12のいずれかに記載の辞書作成方法。
(付記14) 前記文字列の種類を特定する処理は、前記文字列のうち共通部分以外の部分の種類を特定する処理である、ことを特徴とする付記8~13のいずれかに記載の辞書作成方法。
In addition, the following additional remarks will be disclosed with respect to the above description of the embodiment.
(Appendix 1) A plurality of character strings having a common part are extracted from a first dictionary for registering character strings extracted from the log of the first device, and the types of the extracted character strings are determined. a first identifying part to identify;
a second identification unit that extracts a character string including the common part from the log of the first device and identifies the type of the extracted character string;
a first determining unit that determines whether the type of character string specified by the first specifying unit is limited with respect to the type of character string specified by the second specifying unit;
If the result of the determination by the first determination unit is limited, a character string including the common part is extracted from the log of the second device different from the first device, and the extracted character a second determining unit that identifies the type of the string and determines whether the degree of matching between the identified character string type and the character string type identified by the second identifying unit is equal to or greater than a predetermined value;
a dictionary editing unit including the plurality of character strings extracted by the first identifying unit in a second dictionary for registering character strings extracted from the log of the second device when the degree of matching is equal to or greater than a predetermined value; and,
A dictionary creation device comprising:
(Supplementary Note 2) The first determining unit determines that the types of character strings specified by the second specifying unit include all of the types of character strings specified by the first specifying unit, and 1. The method according to appendix 1, wherein if the type of the character string specified by the specifying unit and the type of the character string specified by the first specifying unit do not completely match, it is determined that the character string is limited. Dictionary creation device.
(Supplementary note 3) If the result of the determination by the first determination unit is that the dictionary editing unit is not restrictive, the dictionary editing unit provides information for extracting all character strings having the common part from the log of the second device. , is included in the second dictionary.
(Supplementary Note 4) The dictionary editing unit stores information for extracting all character strings including the common part from the log of the second device in the second dictionary when the degree of matching is not equal to or greater than a predetermined value. 4. The dictionary creation device according to any one of appendices 1 to 3, characterized in that it is included in.
(Additional Note 5) When the second determination unit fails to extract the character string including the common portion from the log of the second device, the dictionary editing unit may extract the character string including the common portion from the log of the second device. 5. The dictionary creation device according to any one of Appendices 1 to 4, characterized in that it does not include in the dictionary of.
(Supplementary Note 6) The dictionary editing unit includes the character string in the second dictionary when the character string including the part where the arbitrary character is specified is registered in the first dictionary. The dictionary creation device according to any one of appendices 1 to 5.
(Appendix 7) The dictionary according to any one of Appendices 1 to 6, characterized in that the process of identifying the type of the character string is a process of identifying the type of a portion of the character string other than a common portion. creation device.
(Appendix 8) A plurality of character strings having a common part are extracted from the first dictionary that registers the character strings extracted from the log of the first device, and the types of the extracted character strings are determined. identify,
Extracting a character string containing the common part from the log of the first device, identifying the type of the extracted character string,
determining whether the type of character string identified from the first dictionary is limited to the type of character string identified from the log of the first device;
As a result of the determination, if it is limited, a character string partly including the common part is extracted from the log of the second device different from the first device, and the type of the extracted character string is specified. and determining whether the degree of matching between the type of the specified character string and the type of the character string specified from the log of the first device is equal to or greater than a predetermined value;
If the degree of matching is equal to or greater than a predetermined value, include the plurality of character strings extracted from the first dictionary in a second dictionary for registering character strings extracted from the log of the second device;
A dictionary creation method characterized in that the processing is executed by a computer.
(Supplementary Note 9) In the processing for determining whether it is restrictive, all the types of character strings specified from the dictionary of the first device are included in the types of character strings specified from the log of the first device. is included and the type of character string identified from the log of the first device and the type of character string identified from the dictionary of the first device do not completely match, it is determined to be limited The dictionary creation method according to Supplementary Note 8, characterized by:
(Supplementary Note 10) If the result of the processing for determining whether it is restrictive is not restrictive, the information for extracting all character strings having the common part from the log of the second device is added to the log of the second device. 10. The dictionary creation method according to appendix 8 or 9, wherein the dictionary is included in the dictionary of appendix 8 or 9.
(Appendix 11) The second dictionary includes information for extracting all character strings including the common portion from the log of the second device when the degree of matching is not equal to or higher than a predetermined value. The dictionary creation method according to any one of Supplements 8 to 10.
(Supplementary note 12) Supplementary note 8 characterized by not including the character string including the common part in the second dictionary when the character string including the common part cannot be extracted from the log of the second device. 12. The method for creating a dictionary according to any one of 11.
(Supplementary Note 13) Supplementary notes 8 to 12 characterized in that, when a character string including a portion where an arbitrary character is specified is registered in the first dictionary, the character string is included in the second dictionary. A method for creating a dictionary according to any one of the above.
(Appendix 14) The dictionary according to any one of Appendices 8 to 13, characterized in that the process of identifying the type of the character string is a process of identifying the type of a portion of the character string other than a common portion. How to make.

10 辞書作成装置
20 第1抽出部(第1特定部の一部)
22 第2抽出部(第2特定部の一部)
24 絞り込み判断部(第1特定部の一部、第2特定部の一部、第1判断部)
26 第3抽出部(第2判断部の一部)
28 一致度判定部(第2判断部の一部)
30 登録フレーズ決定部(辞書編集部)
10 dictionary creation device 20 first extraction unit (part of first identification unit)
22 second extraction unit (part of second identification unit)
24 Narrowing down judgment unit (part of first identification unit, part of second identification unit, first judgment unit)
26 Third extraction unit (part of second determination unit)
28 matching degree determination unit (a part of the second determination unit)
30 registered phrase determination unit (dictionary editing unit)

Claims (8)

第1の装置のログから抽出する文字列を登録する第1の辞書から、一部に共通部分を有する複数の文字列を抽出して、抽出した前記複数の文字列の種類を特定する第1特定部と、
前記第1の装置のログから前記共通部分を含む文字列を抽出し、抽出した文字列の種類を特定する第2特定部と、
前記第2特定部が特定した文字列の種類に対して、前記第1特定部が特定した文字列の種類が限定的であるか判断する第1判断部と、
前記第1判断部の判断の結果、限定的であった場合に、前記第1の装置とは異なる第2の装置のログから一部に前記共通部分を含む文字列を抽出し、抽出した文字列の種類を特定するとともに、特定した該文字列の種類と、前記第2特定部が特定した文字列の種類との一致度が所定以上かを判断する第2判断部と、
前記一致度が所定以上の場合に、前記第1特定部が抽出した前記複数の文字列を、前記第2の装置のログから抽出する文字列を登録する第2の辞書に含める、辞書編集部と、
を備える辞書作成装置。
A first for extracting a plurality of character strings having a common part from a first dictionary for registering character strings extracted from a log of a first device and specifying the types of the plurality of character strings extracted a specific part;
a second identification unit that extracts a character string including the common part from the log of the first device and identifies the type of the extracted character string;
a first determining unit that determines whether the type of character string specified by the first specifying unit is limited with respect to the type of character string specified by the second specifying unit;
If the result of the determination by the first determination unit is limited, a character string including the common part is extracted from the log of the second device different from the first device, and the extracted character a second determining unit that identifies the type of the string and determines whether the degree of matching between the identified character string type and the character string type identified by the second identifying unit is equal to or greater than a predetermined value;
a dictionary editing unit including the plurality of character strings extracted by the first identifying unit in a second dictionary for registering character strings extracted from the log of the second device when the degree of matching is equal to or greater than a predetermined value; and,
A dictionary creation device comprising:
前記第1判断部は、前記第2特定部が特定した文字列の種類の中に、前記第1特定部が特定した文字列の種類の全てが含まれ、かつ、前記第2特定部が特定した文字列の種類と前記第1特定部が特定した文字列の種類とが完全一致していない場合に、限定的であると判断する、ことを特徴とする請求項1に記載の辞書作成装置。 The first determining unit determines that the character string types specified by the second specifying unit include all of the character string types specified by the first specifying unit, and the second specifying unit specifies 2. The dictionary creation device according to claim 1, wherein when the type of the character string specified does not completely match the type of the character string specified by the first specifying unit, it is determined that the character string is limited. . 前記辞書編集部は、前記第1判断部の判断の結果、限定的でなかった場合、前記共通部分を有する全ての文字列を前記第2の装置のログから抽出するための情報を、前記第2の辞書に含めることを特徴とする請求項1又は2に記載の辞書作成装置。 If the result of the determination by the first determining unit is that the dictionary editing unit is not restrictive, the dictionary editing unit stores the information for extracting all character strings having the common part from the log of the second device. 3. The dictionary creation device according to claim 1, wherein the dictionary is included in the second dictionary. 前記辞書編集部は、前記一致度が所定以上でない場合に、前記共通部分を含む全ての文字列を前記第2の装置のログから抽出するための情報を、前記第2の辞書に含めることを特徴とする請求項1~3のいずれか一項に記載の辞書作成装置。 The dictionary editing unit includes information for extracting all character strings including the common part from the log of the second device in the second dictionary when the degree of matching is not equal to or greater than a predetermined value. A dictionary creation device according to any one of claims 1 to 3. 前記辞書編集部は、前記第2判断部が前記第2の装置のログから前記共通部分を含む文字列を抽出できなかった場合に、前記共通部分を含む文字列を前記第2の辞書に含めないことを特徴とする請求項1~4のいずれか一項に記載の辞書作成装置。 The dictionary editing unit includes the character string including the common portion in the second dictionary when the second determination unit cannot extract the character string including the common portion from the log of the second device. The dictionary creation device according to any one of claims 1 to 4, characterized in that there is no 前記辞書編集部は、前記第1の辞書に任意文字が指定された箇所を含む文字列が登録されている場合に、該文字列を前記第2の辞書に含める、ことを特徴とする請求項1~5のいずれか一項に記載の辞書作成装置。 4. The dictionary editing unit includes, when a character string including a portion where an arbitrary character is specified is registered in the first dictionary, the character string to be included in the second dictionary. 6. The dictionary creation device according to any one of 1 to 5. 前記文字列の種類を特定する処理は、前記文字列のうち共通部分以外の部分の種類を特定する処理である、ことを特徴とする請求項1~6のいずれか一項に記載の辞書作成装置。 7. The dictionary creation according to any one of claims 1 to 6, characterized in that the process of identifying the type of the character string is a process of identifying the type of a portion of the character string other than a common portion. Device. 第1の装置のログから抽出する文字列を登録する第1の辞書から、一部に共通部分を有する複数の文字列を抽出して、抽出した前記複数の文字列の種類を特定し、
前記第1の装置のログから前記共通部分を含む文字列を抽出し、抽出した文字列の種類を特定し、
前記第1の装置のログから特定した文字列の種類に対して、前記第1の辞書から特定した文字列の種類が限定的であるか判断し、
前記判断の結果、限定的であった場合に、前記第1の装置とは異なる第2の装置のログから一部に前記共通部分を含む文字列を抽出し、抽出した文字列の種類を特定するとともに、特定した該文字列の種類と、前記第1の装置のログから特定した文字列の種類との一致度が所定以上かを判断し、
前記一致度が所定以上の場合に、前記第1の辞書から抽出した前記複数の文字列を、前記第2の装置のログから抽出する文字列を登録する第2の辞書に含める、
処理をコンピュータが実行することを特徴する辞書作成方法。
extracting a plurality of character strings having a common part from a first dictionary for registering character strings extracted from the log of the first device, identifying the types of the plurality of extracted character strings;
Extracting a character string containing the common part from the log of the first device, identifying the type of the extracted character string,
determining whether the type of character string identified from the first dictionary is limited to the type of character string identified from the log of the first device;
As a result of the determination, if it is limited, a character string partly including the common part is extracted from the log of the second device different from the first device, and the type of the extracted character string is specified. and determining whether the degree of matching between the type of the specified character string and the type of the character string specified from the log of the first device is equal to or greater than a predetermined value;
If the degree of matching is equal to or greater than a predetermined value, include the plurality of character strings extracted from the first dictionary in a second dictionary for registering character strings extracted from the log of the second device;
A dictionary creation method characterized in that the processing is executed by a computer.
JP2019159570A 2019-09-02 2019-09-02 Dictionary creation device and dictionary creation method Active JP7256935B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019159570A JP7256935B2 (en) 2019-09-02 2019-09-02 Dictionary creation device and dictionary creation method
US16/990,542 US11144712B2 (en) 2019-09-02 2020-08-11 Dictionary creation apparatus, dictionary creation method, and non-transitory computer-readable storage medium for storing dictionary creation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019159570A JP7256935B2 (en) 2019-09-02 2019-09-02 Dictionary creation device and dictionary creation method

Publications (2)

Publication Number Publication Date
JP2021039488A JP2021039488A (en) 2021-03-11
JP7256935B2 true JP7256935B2 (en) 2023-04-13

Family

ID=74681651

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019159570A Active JP7256935B2 (en) 2019-09-02 2019-09-02 Dictionary creation device and dictionary creation method

Country Status (2)

Country Link
US (1) US11144712B2 (en)
JP (1) JP7256935B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7047661B2 (en) * 2018-08-09 2022-04-05 日本電信電話株式会社 Log information collection device and log information collection method
CN114328076B (en) * 2021-09-18 2024-04-30 腾讯科技(深圳)有限公司 Log information extraction method, device, computer equipment and storage medium

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110066908A1 (en) 2009-09-17 2011-03-17 Microsoft Corporation Similarity detection for error reports
JP2013008372A (en) 2010-11-10 2013-01-10 Rakuten Inc Related word registration device, information processor, related word registration method, program for related word registration device, and recording medium
US20190034517A1 (en) 2016-01-30 2019-01-31 Entit Software Llc Log event cluster analytics management
JP2019053767A (en) 2012-12-28 2019-04-04 株式会社ユニバーサルエンターテインメント Maintenance device

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11154160A (en) 1997-11-21 1999-06-08 Hitachi Ltd Data retrieval system
JP2002259367A (en) 2001-03-02 2002-09-13 Denso Corp Information registering method for electronic equipment, electronic equipment and computer program
US7039833B2 (en) * 2002-10-21 2006-05-02 I2 Technologies Us, Inc. Stack trace generated code compared with database to find error resolution information
JP2005190232A (en) 2003-12-26 2005-07-14 Seiko Epson Corp Accuracy improvement support device for question answering apparatus, accuracy improvement support method, and program of the same
US7594141B2 (en) * 2006-05-26 2009-09-22 International Business Machines Corporation Apparatus, system, and method for signaling logical errors in an EIS remote function call
US7877636B2 (en) * 2008-08-28 2011-01-25 Honeywell International Inc. System and method for detecting temporal relationships uniquely associated with an underlying root cause
KR20130029250A (en) * 2011-09-14 2013-03-22 한국전자통신연구원 Method and apparatus for requesting examination and fault detection
CN103793284B (en) * 2012-10-29 2017-06-20 伊姆西公司 Analysis system and method based on consensus pattern, for smart client service
JP6388212B2 (en) 2015-01-22 2018-09-12 パナソニックIpマネジメント株式会社 Tag assignment method, tag assignment device, program, and question answer search method
WO2017017738A1 (en) * 2015-07-24 2017-02-02 富士通株式会社 Encoding program, encoding device, and encoding method
JP6868416B2 (en) 2017-02-21 2021-05-12 株式会社野村総合研究所 Failure response support system
US20200372113A1 (en) * 2019-05-24 2020-11-26 Sap Se Log file meaning and syntax generation system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110066908A1 (en) 2009-09-17 2011-03-17 Microsoft Corporation Similarity detection for error reports
JP2013008372A (en) 2010-11-10 2013-01-10 Rakuten Inc Related word registration device, information processor, related word registration method, program for related word registration device, and recording medium
JP2019053767A (en) 2012-12-28 2019-04-04 株式会社ユニバーサルエンターテインメント Maintenance device
US20190034517A1 (en) 2016-01-30 2019-01-31 Entit Software Llc Log event cluster analytics management

Also Published As

Publication number Publication date
US20210064814A1 (en) 2021-03-04
JP2021039488A (en) 2021-03-11
US11144712B2 (en) 2021-10-12

Similar Documents

Publication Publication Date Title
US8176050B2 (en) Method and apparatus of supporting creation of classification rules
WO2018157805A1 (en) Automatic questioning and answering processing method and automatic questioning and answering system
CN107346433B (en) Text data classification method and server
JP5245255B2 (en) Specific expression extraction program, specific expression extraction method, and specific expression extraction apparatus
JP6912488B2 (en) Character string distance calculation method and device
JP7024515B2 (en) Learning programs, learning methods and learning devices
JP7256935B2 (en) Dictionary creation device and dictionary creation method
CN110134777B (en) Question duplication eliminating method and device, electronic equipment and computer readable storage medium
US20160147867A1 (en) Information matching apparatus, information matching method, and computer readable storage medium having stored information matching program
CN110659175A (en) Log trunk extraction method, log trunk classification method, log trunk extraction equipment and log trunk storage medium
CN109791570B (en) Efficient and accurate named entity recognition method and device
US20030158725A1 (en) Method and apparatus for identifying words with common stems
JP6780244B2 (en) Judgment method, judgment program and judgment device
CN105988989B (en) A kind of recognition methods, device and the server of Chinese surname
WO2007132564A1 (en) Data processing device and method
KR20200080401A (en) Method for estimating data classification rule, device and computer readable medium for performing the method
JP2002297660A (en) Method, device, program, and recording medium for character similarity calculation
CN115496066A (en) Text analysis system, text analysis method, electronic device, and storage medium
KR20230141147A (en) Method and non-transitory computer-readable recording medium for classifying patent by technical field
US20180011919A1 (en) Systems and method for clustering electronic documents
JP2008282111A (en) Similar document retrieval method, program and device
JPWO2019171537A1 (en) Semantic estimation systems, methods and programs
CN114816518A (en) Simhash-based open source component screening and identifying method and system in source code
JP2021179832A (en) Program, device, and method for detecting change
CN112559474A (en) Log processing method and device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220517

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230222

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230228

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230313

R150 Certificate of patent or registration of utility model

Ref document number: 7256935

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150