WO2023238304A1 - 判定装置、判定方法および判定プログラム - Google Patents

判定装置、判定方法および判定プログラム Download PDF

Info

Publication number
WO2023238304A1
WO2023238304A1 PCT/JP2022/023206 JP2022023206W WO2023238304A1 WO 2023238304 A1 WO2023238304 A1 WO 2023238304A1 JP 2022023206 W JP2022023206 W JP 2022023206W WO 2023238304 A1 WO2023238304 A1 WO 2023238304A1
Authority
WO
WIPO (PCT)
Prior art keywords
document
concept
words
subordinate
superordinate
Prior art date
Application number
PCT/JP2022/023206
Other languages
English (en)
French (fr)
Inventor
弘毅 中西
史拓 横瀬
晴夫 大石
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to PCT/JP2022/023206 priority Critical patent/WO2023238304A1/ja
Publication of WO2023238304A1 publication Critical patent/WO2023238304A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms

Definitions

  • the present invention relates to a determination device, a determination method, and a determination program.
  • the present invention has been made in view of the above, and determines whether or not the document of the lower-level concept complies with the document of the higher-level concept by comparing the document of the higher-level concept and the document of the lower-level concept regarding rules.
  • the purpose is to make it possible.
  • a determination device includes a storage unit that stores the correspondence between words representing a superordinate concept and words representing a subordinate concept, and a document of the superordinate concept regarding rules.
  • an extraction unit that extracts words that correspond to variables of the same predetermined fixed sentence that the document of the superordinate concept regarding the rule and the document of the subordinate concept of the rule follow, from each of the documents of the subordinate concept regarding the rule;
  • the present invention is characterized by comprising an evaluation unit that evaluates whether the words extracted from the document of the superordinate concept and the words extracted from the document of the subordinate concept correspond to the correspondence relationship.
  • FIG. 1 is a diagram for explaining an overview of the determination device of this embodiment.
  • FIG. 2 is a schematic diagram illustrating a schematic configuration of the determination device of this embodiment.
  • FIG. 3 is a diagram illustrating the data structure of the concept correspondence table.
  • FIG. 4 is a flowchart showing the determination processing procedure.
  • FIG. 5 is a diagram showing an example of a computer that executes a determination program.
  • FIG. 1 is a diagram for explaining an overview of the determination device of this embodiment.
  • the determination device of this embodiment compares a document of a superordinate concept and a document of a subordinate concept regarding rules, and determines whether the document of a subordinate concept complies with the document of a superordinate concept.
  • the determination device performs a pattern match between a document of a higher-level concept and a document of a lower-level concept with a fixed phrase, and identifies the same fixed phrase that matches both documents.
  • FIG. 1A illustrates a case where the same fixed phrase regarding obligation rules is specified, which is followed by both a document of a superordinate concept and a document of a subordinate concept.
  • the determination device extracts words that correspond to the variables of the specified fixed phrase from the superordinate concept document and the subordinate concept document.
  • the words “at the start of use (regularly)”, “antivirus software”, “virus definition file”, The words “updated,” “at the start of use (regularly),” “AAA,” “virus definition file,” and “updated” in the subordinate concept document are extracted.
  • the determination device creates a concept correspondence table in advance between the words of the document of the superordinate concept and the words of the document of the subordinate concept, for words that are different between the document of the superordinate concept and the document of the subordinate concept among the extracted words. Evaluate whether there is a defined correspondence between higher-level concepts and lower-level concepts.
  • the determination device determines whether a document with a superordinate concept is a document with a superordinate concept Determine that it complies with the document.
  • the determination device determines whether the lower-level concept document is a higher-level concept document. It is judged that it is not compliant.
  • the determination device of the present embodiment compares the document of the superordinate concept and the document of the subordinate concept regarding rules, and determines whether the document of the subordinate concept complies with the document of the superordinate concept. becomes possible.
  • FIG. 2 is a schematic diagram illustrating a schematic configuration of the determination device of this embodiment.
  • the determination device 10 of this embodiment is realized by a general-purpose computer such as a personal computer, and includes an input section 11, an output section 12, a communication control section 13, a storage section 14, and a control section 15.
  • the input unit 11 is realized using an input device such as a keyboard or a mouse, and inputs various instruction information such as starting processing to the control unit 15 in response to an input operation by an operator.
  • the output unit 12 is realized by a display device such as a liquid crystal display, a printing device such as a printer, and the like. For example, the output unit 12 displays the results of determination processing, which will be described later.
  • the communication control unit 13 is realized by a NIC (Network Interface Card) or the like, and controls communication between an external device and the control unit 15 via a telecommunication line such as a LAN (Local Area Network) or the Internet.
  • a telecommunication line such as a LAN (Local Area Network) or the Internet.
  • the communication control unit 13 controls communication between the control unit 15 and a management device that manages superordinate concept documents and subordinate concept documents related to rules.
  • the storage unit 14 is realized by a semiconductor memory element such as a RAM (Random Access Memory) or a flash memory, or a storage device such as a hard disk or an optical disk.
  • a processing program for operating the determination device 10 data used during execution of the processing program, etc. are stored in advance, or are temporarily stored each time processing is performed.
  • the storage unit 14 may be configured to communicate with the control unit 15 via the communication control unit 13.
  • the storage unit 14 stores a predetermined fixed phrase 14a that describes a rule, and a concept correspondence table 14b that is information representing the correspondence between words representing a superordinate concept and words representing a subordinate concept.
  • the fixed sentences 14a include mandatory fixed sentences and prohibited fixed sentences.
  • a fixed phrase of obligation is a fixed phrase expressing an obligation such as "must” or “to do.”
  • the prohibited fixed phrase is a fixed phrase that expresses prohibition, such as "must not do”.
  • each fixed-form sentence includes a portion corresponding to a variable of the fixed-form sentence, as illustrated by ⁇ in FIG. 1(a), and various words are applied to the portion.
  • FIG. 3 is a diagram illustrating the data structure of the concept correspondence table.
  • the words "AAA” and “BBB” as subordinate concepts corresponding to the word “antivirus software” as a generic concept are illustrated.
  • the control unit 15 is implemented using a CPU (Central Processing Unit) or the like, and executes a processing program stored in a memory. Thereby, the control unit 15 functions as the acquisition unit 15a, the identification unit 15b, the extraction unit 15c, and the evaluation unit 15d, and executes the determination process, as illustrated in FIG. Note that each or a part of these functional units may be implemented in different hardware. For example, the acquisition unit 15a and identification unit 15b, and the extraction unit 15c and evaluation unit 15d may be implemented in different hardware. Further, the control unit 15 may include other functional units.
  • CPU Central Processing Unit
  • the acquisition unit 15a acquires a document of a superordinate concept related to a rule and a document of a subordinate concept related to a rule. For example, the acquisition unit 15a receives, via the input unit 11 or the communication control unit 13 from a management device that manages documents of superordinate concepts and documents of subordinate concepts related to rules, a superordinate concept related to the rule that is the target of the determination process. , and documents of sub-concepts related to rules.
  • the acquisition unit 15a may cause the storage unit 14 to store the acquired document of the higher-level concept regarding the rule and the document of the lower-level concept regarding the rule, prior to the processing described below. At this time, the acquisition unit 15a separately stores and manages a group of documents created as documents of a superordinate concept related to rules and a group of documents created as documents of a subordinate concept related to rules in the storage unit 14. Good too.
  • the specifying unit 15b identifies, among the fixed sentences 14a, the same fixed phrase that is followed by a document with a higher-level concept regarding rules and a document with a lower-level concept regarding rules. For example, the specifying unit 15b identifies which fixed phrase each document is similar to by comparing each document with each fixed phrase of the fixed phrases 14a by pattern matching. Then, the specifying unit 15b specifies the same fixed phrase in which both the document of the superordinate concept regarding the rule and the document of the subordinate concept regarding the rule are similar.
  • the identifying unit 15b cannot identify the same fixed phrase, it means that the two documents to be processed are not in a compliant-compliant relationship. In this case, it is determined that the document of the lower level concept does not conform to the document of the higher level concept, and the subsequent processing is omitted.
  • the extraction unit 15c extracts, from each of the document for the superordinate concept regarding rules and the document for the subordinate concept for rules, the variables of the same predetermined fixed phrase that are followed by the document for the superordinate concept regarding rules and the document for the subordinate concept regarding rules. Extract the words.
  • the extraction unit 15c extracts words that correspond to the variables of the specified fixed phrase from each of the document of the superordinate concept related to the rule and the document of the subordinate concept related to the rule. For example, the extraction unit 15c compares each of a document with a superordinate concept related to rules and a document with a subordinate concept related to rules with the specified fixed phrase, and extracts words corresponding to variables of the fixed phrase from each document. Extract from.
  • the evaluation unit 15d evaluates whether the words extracted from the superordinate concept document and the words extracted from the subordinate concept document correspond to the correspondence relationship in the concept correspondence table 14b. That is, the evaluation unit 15d evaluates the difference between the words extracted from the superordinate concept document and the word extracted from the subordinate concept document for words that are different between the superordinate concept document and the subordinate concept document among the extracted words. It is evaluated whether the correspondence relationship is defined in the concept correspondence table 14b.
  • the evaluation unit 15d determines that the subordinate concept document regarding the rule is It is determined that it complies with the document of the superordinate concept regarding rules.
  • the evaluation unit 15d determines whether a document with a lower-level concept is a document when the correspondence between a word extracted from a document with a higher-level concept and a word extracted from a document with a lower-level concept is defined in the concept correspondence table 14b. It is judged that it complies with the document of the superordinate concept. On the other hand, if the correspondence between the words extracted from the document of the superordinate concept and the words extracted from the document of the subordinate concept is not specified in the concept correspondence table 14b, the document of the subordinate concept is It is determined that the document does not comply with the document.
  • FIG. 4 is a flowchart showing the determination processing procedure.
  • the flowchart in FIG. 4 is started, for example, at the timing instructed by the examiner on the determination device.
  • the acquisition unit 15a acquires a document of a superordinate concept regarding a rule and a document of a subordinate concept regarding a rule. Further, the specifying unit 15b identifies, among the fixed phrases 14a, the same fixed phrase that is followed by a document with a higher-level concept regarding rules and a document with a lower-level concept regarding rules (step S1). For example, the specifying unit 15b identifies which fixed phrase each document is similar to by comparing each document with each fixed phrase of the fixed phrases 14a by pattern matching. Then, the specifying unit 15b specifies the same fixed phrase in which both the document of the superordinate concept regarding the rule and the document of the subordinate concept regarding the rule are similar.
  • the extraction unit 15c extracts words that correspond to the specified variable of the same predetermined fixed phrase from each of the document of the superordinate concept regarding the rule and the document of the subordinate concept regarding the rule (step S2). For example, the extraction unit 15c compares each document of a superordinate concept related to rules and the document of a subordinate concept related to rules with the specified fixed phrase, and extracts words corresponding to variables of the fixed phrase from each document. Extract.
  • the evaluation unit 15d evaluates whether the words extracted from the superordinate concept document and the words extracted from the subordinate concept document correspond to the correspondence relationship in the concept correspondence table 14b (step S3). That is, the evaluation unit 15d evaluates the difference between the words extracted from the superordinate concept document and the word extracted from the subordinate concept document for words that are different between the superordinate concept document and the subordinate concept document among the extracted words. It is evaluated whether the correspondence relationship is defined in the concept correspondence table 14b.
  • the evaluation unit 15d determines the rule It is determined that the document of the lower-level concept regarding the rule conforms to the document of the higher-level concept regarding the rule (step S4), and the series of determination processes is ended.
  • step S3 No if the word extracted from the document of the superordinate concept and the word extracted from the document of the subordinate concept do not correspond to the correspondence relationship in the concept correspondence table 14b (step S3, No), the evaluation unit 15d It is determined that the document of the lower level concept regarding the rule does not conform to the document of the higher level concept regarding the rule (step S5), and the series of determination processes is terminated.
  • the storage unit 14 stores the concept correspondence table 14b representing the correspondence between words representing a superordinate concept and words representing a subordinate concept. Further, the extraction unit 15c extracts variables of the same predetermined fixed phrase that are followed by the document of the superordinate concept regarding rules and the document of the subordinate concept of rules, respectively, from the document of the superordinate concept regarding rules and the document of subordinate concept regarding rules. Extract words that correspond to . Furthermore, the evaluation unit 15d evaluates whether the words extracted from the document of the superordinate concept and the words extracted from the document of the subordinate concept correspond to the correspondence relationship in the concept correspondence table 14b.
  • the storage unit 14 stores a predetermined fixed form sentence 14a that describes a rule
  • the identification unit 15b determines which of the fixed form sentences 14a, a document with a superordinate concept regarding the rule and a document with a low level concept regarding the rule. Identify the same boilerplate to follow.
  • the evaluation unit 15d determines that when the words extracted from the document of the superordinate concept and the words extracted from the document of the subordinate concept correspond to the concept correspondence table 14b, the document of the subordinate concept regarding the rule is Determine that it conforms to the concept document.
  • the determination device 10 can be implemented by installing a determination program that executes the above-described determination process into a desired computer as packaged software or online software. For example, by causing the information processing device to execute the above determination program, the information processing device can be caused to function as the determination device 10.
  • the information processing device referred to here includes a desktop or notebook personal computer.
  • information processing devices include mobile communication terminals such as smartphones, mobile phones, and PHSs (Personal Handyphone Systems), as well as slate terminals such as PDAs (Personal Digital Assistants).
  • the functions of the determination device 10 may be implemented in a cloud server.
  • FIG. 5 is a diagram showing an example of a computer that executes the determination program.
  • Computer 1000 includes, for example, memory 1010, CPU 1020, hard disk drive interface 1030, disk drive interface 1040, serial port interface 1050, video adapter 1060, and network interface 1070. These parts are connected by a bus 1080.
  • the memory 1010 includes a ROM (Read Only Memory) 1011 and a RAM 1012.
  • the ROM 1011 stores, for example, a boot program such as BIOS (Basic Input Output System).
  • Hard disk drive interface 1030 is connected to hard disk drive 1031.
  • Disk drive interface 1040 is connected to disk drive 1041.
  • a removable storage medium such as a magnetic disk or an optical disk is inserted into the disk drive 1041, for example.
  • a mouse 1051 and a keyboard 1052 are connected to the serial port interface 1050.
  • a display 1061 is connected to the video adapter 1060.
  • the hard disk drive 1031 stores, for example, an OS 1091, an application program 1092, a program module 1093, and program data 1094. Each piece of information described in the above embodiments is stored in, for example, the hard disk drive 1031 or the memory 1010.
  • the determination program is stored in the hard disk drive 1031, for example, as a program module 1093 in which commands to be executed by the computer 1000 are written. Specifically, a program module 1093 in which each process executed by the determination device 10 described in the above embodiment is described is stored in the hard disk drive 1031.
  • data used for information processing by the determination program is stored as program data 1094 in, for example, the hard disk drive 1031.
  • the CPU 1020 reads out the program module 1093 and program data 1094 stored in the hard disk drive 1031 to the RAM 1012 as necessary, and executes each of the above-described procedures.
  • program module 1093 and program data 1094 related to the determination program are not limited to being stored in the hard disk drive 1031; for example, they may be stored in a removable storage medium and read by the CPU 1020 via the disk drive 1041 or the like. may be done.
  • the program module 1093 and program data 1094 related to the determination program are stored in another computer connected via a network such as a LAN or WAN (Wide Area Network), and read out by the CPU 1020 via the network interface 1070. It's okay.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

記憶部(14)が、上位概念を表す単語と下位概念を表す単語との対応関係を表す概念対応表(14b)を記憶する。抽出部(15c)が、ルールに関する上位概念の文書と、ルールに関する下位概念の文書とのそれぞれから、ルールに関する上位概念の文書とルールに関する下位概念の文書とが従う同一の所定の定型文の変数に該当する単語を抽出する。評価部(15d)が、上位概念の文書から抽出された単語と、下位概念の文書から抽出された単語とが、概念対応表(14b)の対応関係に該当するか否かを評価する。

Description

判定装置、判定方法および判定プログラム
 本発明は、判定装置、判定方法および判定プログラムに関する。
 ルールに関する文書について、下位概念の文書が上位概念の文書に準拠しているか否かを推定する場合に、2つの文書を比較して関係性を評価する。従来、2つの文書を比較して関係性を評価するために、単語の類似度を定量化して、類似度が高い単語を共通に使用している文書同士を類似していると判定する技術が知られている(特許文献1、非特許文献1参照)。
特開2007-26116号公報
鵜野和也、「はじめての自然言語処理 類似文書検索の手法と精度比較」、[online]、2019年3月、オージス総研、[2022年4月12日検索]、インターネット<URL:https://www.ogis-ri.co.jp/otc/hiroba/technical/similar-document-search/part1.html>
 しかしながら、従来技術では、ルールに関する上位概念の文書と下位概念の文書とを比較して、下位概念の文書が上位概念の文書に準拠しているか否かを判定することが困難であった。例えば、ルールに関する文書では、「しなければならない」という義務が記載された文書と、「してはいけない」という禁止が記載された文書とがある。従来技術によりルールに関する2つの文書を単語の類似度で評価すると、義務が記載された文書と禁止が記載された文書とが類似していると判定される場合がある。そのため、ルールに関する下位概念の文書が上位概念の文書に準拠しているか否かを判定することが困難であった。
 本発明は、上記に鑑みてなされたものであって、ルールに関する上位概念の文書と下位概念の文書とを比較して、下位概念の文書が上位概念の文書に準拠しているか否かを判定可能とすることを目的とする。
 上述した課題を解決し、目的を達成するために、本発明に係る判定装置は、上位概念を表す単語と下位概念を表す単語との対応関係を記憶する記憶部と、ルールに関する上位概念の文書と、ルールに関する下位概念の文書とのそれぞれから、前記ルールに関する上位概念の文書と前記ルールに関する下位概念の文書とが従う同一の所定の定型文の変数に該当する単語を抽出する抽出部と、前記上位概念の文書から抽出された単語と、前記下位概念の文書から抽出された単語とが、前記対応関係に該当するか否かを評価する評価部と、を有することを特徴とする。
 本発明によれば、ルールに関する上位概念の文書と下位概念の文書とを比較して、下位概念の文書が上位概念の文書に準拠しているか否かを判定することが可能となる。
図1は、本実施形態の判定装置の概要を説明するための図である。 図2は、本実施形態の判定装置の概略構成を例示する模式図である。 図3は、概念対応表のデータ構成を例示する図である。 図4は、判定処理手順を示すフローチャートである。 図5は、判定プログラムを実行するコンピュータの一例を示す図である。
 以下、図面を参照して、本発明の一実施形態を詳細に説明する。なお、この実施形態により本発明が限定されるものではない。また、図面の記載において、同一部分には同一の符号を付して示している。
[判定装置の概要]
 図1は、本実施形態の判定装置の概要を説明するための図である。本実施形態の判定装置は、ルールに関する上位概念の文書と下位概念の文書とを比較して、下位概念の文書が上位概念の文書に準拠しているか否かを判定する。
 例えば、判定装置は、上位概念の文書と下位概念の文書とを、定型文とのパターンマッチを行って、両者がマッチする同一の定型文を特定する。図1には、図1(a)に例示するように、上位概念の文書および下位概念の文書の両者が従う、義務のルールに関する同一の定型文が特定された場合が例示されている。
 次に、判定装置は、上位概念の文書および下位概念の文書から、特定された定型文の変数に該当する単語を抽出する。図1(a)に示した例では、定型文の変数〇〇に該当する上位概念の文書の単語「使用開始時(定期的に)」、「ウイルス対策ソフトウェア」、「ウイルス定義ファイル」、「最新化」、下位概念の文書の単語「使用開始時(定期的に)」、「AAA」、「ウイルス定義ファイル」、「最新化」が抽出されている。
 そして、判定装置は、抽出された単語のうち上位概念の文書と下位概念の文書とで異なる単語について、上位概念の文書の単語と下位概念の文書の単語との間に、予め概念対応表に規定された上位概念-下位概念の対応関係があるか否かを評価する。
 図1に示す例では、図1(b)に例示した上位概念の文書から抽出された単語「ウイルス対策ソフトウェア」と下位概念の文書から抽出された単語「AAA」との間に、図1(c)に例示するように、上位概念-下位概念の対応関係が規定されている。このように、上位概念の文書の単語と下位概念の文書の単語との間に、上位概念-下位概念の対応関係が規定されている場合に、判定装置は、下位概念の文書が上位概念の文書に準拠していると判定する。
 一方、上位概念の文書の単語と下位概念の文書の単語との間に、上位概念-下位概念の対応関係が規定されていない場合に、判定装置は、下位概念の文書が上位概念の文書に準拠していないと判定する。
 このようにして、本実施形態の判定装置は、ルールに関する上位概念の文書と下位概念の文書とを比較して、下位概念の文書が上位概念の文書に準拠しているか否かを判定することが可能となる。
[判定装置の構成]
 図2は、本実施形態の判定装置の概略構成を例示する模式図である。図2に例示するように、本実施形態の判定装置10は、パソコン等の汎用コンピュータで実現され、入力部11、出力部12、通信制御部13、記憶部14、および制御部15を備える。
 入力部11は、キーボードやマウス等の入力デバイスを用いて実現され、操作者による入力操作に対応して、制御部15に対して処理開始などの各種指示情報を入力する。出力部12は、液晶ディスプレイなどの表示装置、プリンター等の印刷装置等によって実現される。例えば、出力部12には、後述する判定処理の結果等が表示される。
 通信制御部13は、NIC(Network Interface Card)等で実現され、LAN(Local Area Network)やインターネットなどの電気通信回線を介した外部の装置と制御部15との通信を制御する。例えば、通信制御部13は、ルールに関する上位概念文書や下位概念文書を管理する管理装置等と制御部15との通信を制御する。
 記憶部14は、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部14には、判定装置10を動作させる処理プログラムや、処理プログラムの実行中に使用されるデータなどが予め記憶され、あるいは処理の都度一時的に記憶される。なお、記憶部14は、通信制御部13を介して制御部15と通信する構成でもよい。
 本実施形態において、記憶部14は、ルールを記述する所定の定型文14aと、上位概念を表す単語と下位概念を表す単語との対応関係を表す情報である概念対応表14bとを記憶する。
 ここで、定型文14aには、義務の定型文と、禁止の定型文とが含まれる。義務の定型文とは、「しなければならない」、「すること」等の義務を表す定型文である。また、禁止の定型文とは、「してはいけない」等の禁止を表す定型文である。また、各定型文には、図1(a)に〇〇で例示したように、定型文の変数に該当する部分が含まれ、当該部分に様々な単語が適用される。
 また、図3は、概念対応表のデータ構成を例示する図である。図3には、例えば、上位概念の単語「ウイルス対策ソフトウェア」に対応する下位概念の単語「AAA」、「BBB」が例示されている。
 図2の説明に戻る。制御部15は、CPU(Central Processing Unit)等を用いて実現され、メモリに記憶された処理プログラムを実行する。これにより、制御部15は、図2に例示するように、取得部15a、特定部15b、抽出部15cおよび評価部15dとして機能して、判定処理を実行する。なお、これらの機能部は、それぞれ、あるいは一部が異なるハードウェアに実装されてもよい。例えば、取得部15aおよび特定部15bと、抽出部15cおよび評価部15dとは、異なるハードウェアに実装されてもよい。また、制御部15は、その他の機能部を備えてもよい。
 取得部15aは、ルールに関する上位概念の文書とルールに関する下位概念の文書とを取得する。例えば、取得部15aは、入力部11を介して、あるいはルールに関する上位概念の文書や下位概念の文書を管理する管理装置から通信制御部13を介して、判定処理の対象とするルールに関する上位概念の文書とルールに関する下位概念の文書とを取得する。
 取得部15aは、以下に説明する処理に先立って、取得したルールに関する上位概念の文書とルールに関する下位概念の文書とを記憶部14に記憶させてもおいてもよい。その際に、取得部15aは、ルールに関する上位概念の文書として作成された文書群と、ルールに関する下位概念の文書として作成された文書群とを、別々に記憶部14に記憶させて管理してもよい。
 特定部15bは、定型文14aのうち、ルールに関する上位概念の文書と、ルールに関する下位概念の文書とが従う同一の定型文を特定する。例えば、特定部15bは、各文書と定型文14aの各定型文とをパターンマッチで比較することにより、どの定型文に類似しているかを特定する。そして、特定部15bは、ルールに関する上位概念の文書と、ルールに関する下位概念の文書との双方が類似する同一の定型文を特定する。
 なお、特定部15bが同一の定型文を特定できない場合には、処理対象の2つの文書が準拠-被準拠の関係にはないことを意味する。この場合には、下位概念の文書は上位概念の文書に準拠しないと判定され、以降の処理は省略される。
 抽出部15cは、ルールに関する上位概念の文書と、ルールに関する下位概念の文書とのそれぞれから、ルールに関する上位概念の文書とルールに関する下位概念の文書とが従う同一の所定の定型文の変数に該当する単語を抽出する。
 具体的には、抽出部15cは、ルールに関する上位概念の文書と、ルールに関する下位概念の文書とのそれぞれから、特定された定型文の変数に該当する単語を抽出する。例えば、抽出部15cは、ルールに関する上位概念の文書、ルールに関する下位概念の文書のそれぞれと、特定された定型文とをパターンマッチで比較することにより、定型文の変数に該当する単語を各文書から抽出する。
 評価部15dは、上位概念の文書から抽出された単語と、下位概念の文書から抽出された単語とが、概念対応表14bの対応関係に該当するか否かを評価する。すなわち、評価部15dは、抽出された単語のうち上位概念の文書と下位概念の文書とで異なる単語について、上位概念の文書から抽出された単語と、下位概念の文書から抽出された単語との対応関係が、概念対応表14bに規定されているか否かを評価する。
 そして、評価部15dは、上位概念の文書から抽出された単語と、下位概念の文書から抽出された単語とが、概念対応表14bの対応関係に該当する場合に、ルールに関する下位概念の文書がルールに関する上位概念の文書に準拠すると判定する。
 すなわち、評価部15dは、上位概念の文書から抽出された単語と、下位概念の文書から抽出された単語との対応関係が、概念対応表14bに規定されている場合に、下位概念の文書が上位概念の文書に準拠すると判定する。一方、該上位概念の文書から抽出された単語と、下位概念の文書から抽出された単語との対応関係が、概念対応表14bに規定されていない場合には、下位概念の文書が上位概念の文書に準拠しないと判定する。
 このように、ルールに関する上位概念の文書と下位概念の文書とを比較して、下位概念の文書が上位概念の文書に準拠しているか否かを正確に判定することが可能となる。
[判定処理]
 次に、図4は、判定処理手順を示すフローチャートである。図4のフローチャートは、例えば、検査者が判定装置において指示したタイミングで開始される。
 まず、取得部15aが、ルールに関する上位概念の文書とルールに関する下位概念の文書とを取得する。また、特定部15bが、定型文14aのうち、ルールに関する上位概念の文書と、ルールに関する下位概念の文書とが従う同一の定型文を特定する(ステップS1)。例えば、特定部15bは、各文書と定型文14aの各定型文とをパターンマッチで比較することにより、どの定型文に類似しているかを特定する。そして、特定部15bは、ルールに関する上位概念の文書と、ルールに関する下位概念の文書との双方が類似する同一の定型文を特定する。
 次に、抽出部15cが、ルールに関する上位概念の文書と、ルールに関する下位概念の文書とのそれぞれから、特定された同一の所定の定型文の変数に該当する単語を抽出する(ステップS2)。例えば、抽出部15cは、ルールに関する上位概念の文書、ルールに関する下位概念の文書のそれぞれと、特定された定型文とをパターンマッチで比較することにより、各文書から定型文の変数に該当する単語を抽出する。
 評価部15dは、上位概念の文書から抽出された単語と、下位概念の文書から抽出された単語とが、概念対応表14bの対応関係に該当するか否かを評価する(ステップS3)。すなわち、評価部15dは、抽出された単語のうち上位概念の文書と下位概念の文書とで異なる単語について、上位概念の文書から抽出された単語と、下位概念の文書から抽出された単語との対応関係が、概念対応表14bに規定されているか否かを評価する。
 そして、評価部15dは、上位概念の文書から抽出された単語と、下位概念の文書から抽出された単語とが、概念対応表14bの対応関係に該当する場合に(ステップS3、Yes)、ルールに関する下位概念の文書がルールに関する上位概念の文書に準拠すると判定し(ステップS4)、一連の判定処理を終了させる。
 一方、評価部15dは、上位概念の文書から抽出された単語と、下位概念の文書から抽出された単語とが、概念対応表14bの対応関係に該当しない場合に(ステップS3、No)、ルールに関する下位概念の文書がルールに関する上位概念の文書に準拠しないと判定し(ステップS5)、一連の判定処理を終了させる。
[効果]
 以上、説明したように、本実施形態の判定装置10において、記憶部14が、上位概念を表す単語と下位概念を表す単語との対応関係を表す概念対応表14bを記憶する。また、抽出部15cが、ルールに関する上位概念の文書と、ルールに関する下位概念の文書とのそれぞれから、ルールに関する上位概念の文書とルールに関する下位概念の文書とが従う同一の所定の定型文の変数に該当する単語を抽出する。また、評価部15dが、上位概念の文書から抽出された単語と、下位概念の文書から抽出された単語とが、概念対応表14bの対応関係に該当するか否かを評価する。
 具体的には、記憶部14が、ルールを記述する所定の定型文14aを記憶し、特定部15bが、定型文14aのうち、ルールに関する上位概念の文書と、ルールに関する下位概念の文書とが従う同一の定型文を特定する。
 また、評価部15dは、上位概念の文書から抽出された単語と、下位概念の文書から抽出された単語とが、概念対応表14bに該当する場合に、ルールに関する下位概念の文書がルールに関する上位概念の文書に準拠すると判定する。
 これにより、ルールに関する文書を、ルールに関する義務あるいは禁止等の言い回しの違いを考慮して、紛らわしいパターンを除外して比較することが可能となる。したがって、従来は類似していると誤り易い2つの文書の関係を正確に判定することが可能となる。このように、ルールに関する上位概念の文書と下位概念の文書とを比較して、下位概念の文書が上位概念の文書に準拠しているか否かを判定することが可能となる。
[プログラム]
 上記実施形態に係る判定装置10が実行する処理をコンピュータが実行可能な言語で記述したプログラムを作成することもできる。一実施形態として、判定装置10は、パッケージソフトウェアやオンラインソフトウェアとして上記の判定処理を実行する判定プログラムを所望のコンピュータにインストールさせることによって実装できる。例えば、上記の判定プログラムを情報処理装置に実行させることにより、情報処理装置を判定装置10として機能させることができる。ここで言う情報処理装置には、デスクトップ型またはノート型のパーソナルコンピュータが含まれる。また、その他にも、情報処理装置にはスマートフォン、携帯電話機やPHS(Personal Handyphone System)などの移動体通信端末、さらには、PDA(Personal Digital Assistant)などのスレート端末などがその範疇に含まれる。また、判定装置10の機能を、クラウドサーバに実装してもよい。
 図5は、判定プログラムを実行するコンピュータの一例を示す図である。コンピュータ1000は、例えば、メモリ1010と、CPU1020と、ハードディスクドライブインタフェース1030と、ディスクドライブインタフェース1040と、シリアルポートインタフェース1050と、ビデオアダプタ1060と、ネットワークインタフェース1070とを有する。これらの各部は、バス1080によって接続される。
 メモリ1010は、ROM(Read Only Memory)1011およびRAM1012を含む。ROM1011は、例えば、BIOS(Basic Input Output System)等のブートプログラムを記憶する。ハードディスクドライブインタフェース1030は、ハードディスクドライブ1031に接続される。ディスクドライブインタフェース1040は、ディスクドライブ1041に接続される。ディスクドライブ1041には、例えば、磁気ディスクや光ディスク等の着脱可能な記憶媒体が挿入される。シリアルポートインタフェース1050には、例えば、マウス1051およびキーボード1052が接続される。ビデオアダプタ1060には、例えば、ディスプレイ1061が接続される。
 ここで、ハードディスクドライブ1031は、例えば、OS1091、アプリケーションプログラム1092、プログラムモジュール1093およびプログラムデータ1094を記憶する。上記実施形態で説明した各情報は、例えばハードディスクドライブ1031やメモリ1010に記憶される。
 また、判定プログラムは、例えば、コンピュータ1000によって実行される指令が記述されたプログラムモジュール1093として、ハードディスクドライブ1031に記憶される。具体的には、上記実施形態で説明した判定装置10が実行する各処理が記述されたプログラムモジュール1093が、ハードディスクドライブ1031に記憶される。
 また、判定プログラムによる情報処理に用いられるデータは、プログラムデータ1094として、例えば、ハードディスクドライブ1031に記憶される。そして、CPU1020が、ハードディスクドライブ1031に記憶されたプログラムモジュール1093やプログラムデータ1094を必要に応じてRAM1012に読み出して、上述した各手順を実行する。
 なお、判定プログラムに係るプログラムモジュール1093やプログラムデータ1094は、ハードディスクドライブ1031に記憶される場合に限られず、例えば、着脱可能な記憶媒体に記憶されて、ディスクドライブ1041等を介してCPU1020によって読み出されてもよい。あるいは、判定プログラムに係るプログラムモジュール1093やプログラムデータ1094は、LANやWAN(Wide Area Network)等のネットワークを介して接続された他のコンピュータに記憶され、ネットワークインタフェース1070を介してCPU1020によって読み出されてもよい。
 以上、本発明者によってなされた発明を適用した実施形態について説明したが、本実施形態による本発明の開示の一部をなす記述および図面により本発明は限定されることはない。すなわち、本実施形態に基づいて当業者等によりなされる他の実施形態、実施例および運用技術等は全て本発明の範疇に含まれる。
 10 判定装置
 11 入力部
 12 出力部
 13 通信制御部
 14 記憶部
 14a 定型文
 14b 概念対応表
 15 制御部
 15a 取得部
 15b 特定部
 15c 抽出部
 15d 評価部

Claims (5)

  1.  上位概念を表す単語と下位概念を表す単語との対応関係を記憶する記憶部と、
     ルールに関する上位概念の文書と、ルールに関する下位概念の文書とのそれぞれから、前記ルールに関する上位概念の文書と前記ルールに関する下位概念の文書とが従う同一の所定の定型文の変数に該当する単語を抽出する抽出部と、
     前記上位概念の文書から抽出された単語と、前記下位概念の文書から抽出された単語とが、前記対応関係に該当するか否かを評価する評価部と、
     を有することを特徴とする判定装置。
  2.  ルールを記述する所定の定型文をさらに記憶部に記憶し、
     前記定型文のうち、前記ルールに関する上位概念の文書と、前記ルールに関する下位概念の文書とが従う同一の定型文を特定する特定部を、さらに有することを特徴とする請求項1に記載の判定装置。
  3.  前記評価部は、前記上位概念の文書から抽出された単語と、前記下位概念の文書から抽出された単語とが、前記対応関係を表す情報に該当する場合に、前記ルールに関する下位概念の文書が前記ルールに関する上位概念の文書に準拠すると判定することを特徴とする請求項1に記載の判定装置。
  4.  判定装置が実行する判定方法であって、
     前記判定装置は、上位概念を表す単語と下位概念を表す単語との対応関係を記憶する記憶部を有し、
     ルールに関する上位概念の文書と、ルールに関する下位概念の文書とのそれぞれから、前記ルールに関する上位概念の文書と前記ルールに関する下位概念の文書とが従う同一の所定の定型文の変数に該当する単語を抽出する抽出工程と、
     前記上位概念の文書から抽出された単語と、前記下位概念の文書から抽出された単語とが、前記対応関係に該当するか否かを評価する評価工程と、
     を含むことを特徴とする判定方法。
  5.  上位概念を表す単語と下位概念を表す単語との対応関係を記憶する記憶部を参照し、
     ルールに関する上位概念の文書と、ルールに関する下位概念の文書とのそれぞれから、前記ルールに関する上位概念の文書と前記ルールに関する下位概念の文書とが従う同一の所定の定型文の変数に該当する単語を抽出する抽出ステップと、
     前記上位概念の文書から抽出された単語と、前記下位概念の文書から抽出された単語とが、前記対応関係に該当するか否かを評価する評価ステップと、
     をコンピュータに実行させるための判定プログラム。
PCT/JP2022/023206 2022-06-08 2022-06-08 判定装置、判定方法および判定プログラム WO2023238304A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/JP2022/023206 WO2023238304A1 (ja) 2022-06-08 2022-06-08 判定装置、判定方法および判定プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2022/023206 WO2023238304A1 (ja) 2022-06-08 2022-06-08 判定装置、判定方法および判定プログラム

Publications (1)

Publication Number Publication Date
WO2023238304A1 true WO2023238304A1 (ja) 2023-12-14

Family

ID=89117776

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2022/023206 WO2023238304A1 (ja) 2022-06-08 2022-06-08 判定装置、判定方法および判定プログラム

Country Status (1)

Country Link
WO (1) WO2023238304A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07210564A (ja) * 1994-01-13 1995-08-11 Kenji Kurono 文章作成補助装置および文章作成用辞書作成装置
JP2012141713A (ja) * 2010-12-28 2012-07-26 Osaka Prefecture Univ 擬似会話装置及びコンピュータプログラム
WO2014002774A1 (ja) * 2012-06-25 2014-01-03 日本電気株式会社 同義語抽出システム、方法および記録媒体
JP2014132406A (ja) * 2013-01-07 2014-07-17 Nec Corp 同義語抽出システム、方法およびプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07210564A (ja) * 1994-01-13 1995-08-11 Kenji Kurono 文章作成補助装置および文章作成用辞書作成装置
JP2012141713A (ja) * 2010-12-28 2012-07-26 Osaka Prefecture Univ 擬似会話装置及びコンピュータプログラム
WO2014002774A1 (ja) * 2012-06-25 2014-01-03 日本電気株式会社 同義語抽出システム、方法および記録媒体
JP2014132406A (ja) * 2013-01-07 2014-07-17 Nec Corp 同義語抽出システム、方法およびプログラム

Similar Documents

Publication Publication Date Title
EP3330879B1 (en) Vulnerability discovering device, vulnerability discovering method, and vulnerability discovering program
US10095610B2 (en) Testing applications with a defined input format
US11403388B2 (en) Assignment device, assignment method, and assignment program
CN116868193A (zh) 固件组件标识和漏洞评估
CN114003725A (zh) 信息标注模型的构建方法以及信息标注的生成方法
WO2023238304A1 (ja) 判定装置、判定方法および判定プログラム
JP5317061B2 (ja) 単語間の意味的関係の有無についての、複数言語での同時分類器及びそのためのコンピュータプログラム。
CN115858776B (zh) 一种变体文本分类识别方法、系统、存储介质和电子设备
CN111796832B (zh) 热补丁文件生成方法、装置、设备及存储介质
US20180046604A1 (en) Annotating chemical reactions
WO2020170804A1 (ja) 同義語抽出装置、同義語抽出方法、および、同義語抽出プログラム
CN112000354A (zh) 版本信息更新方法、装置、设备及存储介质
JP2020123134A (ja) 抽出方法,情報処理装置および抽出プログラム
JP6437936B2 (ja) 提示装置、提示方法、および提示プログラム
WO2021106306A1 (ja) ラベル付与装置およびラベル付与プログラム
JP7355211B2 (ja) シグネチャ生成装置、シグネチャ生成方法およびシグネチャ生成プログラム
WO2021234798A1 (ja) 生成装置、生成方法および生成プログラム
WO2021149119A1 (ja) 推定システム及び推定プログラム
AU2019387658B2 (en) Information creation device, information creation method, and information creation program
WO2021009886A1 (ja) 支援装置、支援方法および支援プログラム
JPWO2011118428A1 (ja) 要求獲得システム、要求獲得方法、及び要求獲得用プログラム
WO2021260865A1 (ja) 分類装置、分類方法および分類プログラム
KR102130944B1 (ko) 개체명 인식 기반의 디바이스 정보 식별 방법 및 그 장치
WO2021084631A1 (ja) 情報処理装置、抽出方法および抽出プログラム
CN114064390A (zh) 日志碰撞规则转化方法、装置、系统和电子装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22945807

Country of ref document: EP

Kind code of ref document: A1