JP2009110405A - Document data processor - Google Patents

Document data processor Download PDF

Info

Publication number
JP2009110405A
JP2009110405A JP2007283722A JP2007283722A JP2009110405A JP 2009110405 A JP2009110405 A JP 2009110405A JP 2007283722 A JP2007283722 A JP 2007283722A JP 2007283722 A JP2007283722 A JP 2007283722A JP 2009110405 A JP2009110405 A JP 2009110405A
Authority
JP
Japan
Prior art keywords
concept
document data
dictionary
name
hierarchical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007283722A
Other languages
Japanese (ja)
Other versions
JP4672714B2 (en
Inventor
Kyoko Makino
恭子 牧野
Rumi Hayakawa
ルミ 早川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2007283722A priority Critical patent/JP4672714B2/en
Publication of JP2009110405A publication Critical patent/JP2009110405A/en
Application granted granted Critical
Publication of JP4672714B2 publication Critical patent/JP4672714B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To appropriately determine the correctness of description in document data, and to facilitate the management of a dictionary for the determination. <P>SOLUTION: A concept extraction part 13 extracts a concept name associated with a surface expression corresponding to an expression in a first column of input document data from a surface expression dictionary. A written concept extraction part 15 extracts a concept name associated with a surface expression corresponding to an expression in a second column of the input document data from the surface expression dictionary. A determination part 17 determines that an expression to be described in the second column related to the expression in the first column in the document data is missing unless the concept name extracted from the written concept extraction part 15 is not included in a related concept list. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、文書データの記述の解析を行なう文書データ処理装置に関する。   The present invention relates to a document data processing apparatus that analyzes a description of document data.

従来、文書データの作成や校正を支援するために、分野依存辞書を使用して入力文書データ中の記述が対応する分野の単語が優先的に提示する技術や、構文解析により文単位で文法チェックを行なう技術がある。   Conventionally, to support the creation and proofreading of document data, a field-dependent dictionary is used to preferentially present words in the field corresponding to the description in the input document data, and grammar checking is performed on a sentence-by-sentence basis through syntax analysis. There is technology to do.

また、例えば特許文献1に開示されるように、入力文書データ中の記述のうち具体性に欠ける部分を提示する技術がある。この技術では、入力文書データ中の記述に予め定められた特徴部分が含まれる場合に、この特徴部分を有する文が具体的であるために欠落すべきでない5W1H(when,whereなど)を含んでいる否かを判定する技術がある。   Further, as disclosed in, for example, Patent Document 1, there is a technique for presenting a portion lacking in concreteness among descriptions in input document data. In this technique, when a predetermined characteristic part is included in the description in the input document data, a sentence having this characteristic part is included, and 5W1H (when, where, etc.) that should not be omitted is included. There is a technique for determining whether or not there is.

また、例えば特許文献2に開示されるように、語の概念関係を記述したオントロジ辞書を参照し、分野特有の辞書自動構築を支援するものがある。
特開2002−183117号公報 特開2001−67356号公報
Further, as disclosed in, for example, Patent Document 2, there is a technique that supports automatic construction of a dictionary unique to a field by referring to an ontology dictionary that describes a conceptual relationship between words.
JP 2002-183117 A JP 2001-67356 A

しかし、前述したように文書データ中の記述が関わる分野の単語を優先的に表示させたり文法チェックを行なったりする技術では、記述内容の意味的不足を判定することはできない。また、前述したように文書データ中の予め定められた特徴を有する文に5W1Hが含まれているか否かを判定すれば具体性のない文をチェックすることができるが、5W1Hは概念的な要素であるので、文書データが例えば製品の修理報告書である場合に、当該修理報告書に記述されるべき具体的な単語が無い場合にこれを指摘するものではない。   However, as described above, the technology that preferentially displays the words in the field related to the description in the document data or performs the grammar check cannot determine the semantic deficiency of the description content. Further, as described above, if it is determined whether or not 5W1H is included in a sentence having predetermined characteristics in document data, it is possible to check a sentence having no concreteness, but 5W1H is a conceptual element. Therefore, when the document data is, for example, a product repair report, this is not pointed out when there is no specific word to be described in the repair report.

また、特許文献2に開示された技術では、語の概念関係を記述したオントロジ辞書を参照し、分野特有の辞書自動構築を支援するために階層化した辞書を用いているが、複数の概念体系の関係付けに関しての言及が不明確であり、装置としての実現が確実ではなかった。   Further, in the technique disclosed in Patent Document 2, a hierarchical dictionary is used to refer to an ontology dictionary that describes the conceptual relationship of words and to support field-specific automatic dictionary construction. The reference regarding the relationship between the two was unclear, and the realization as a device was not certain.

そこで、本発明の目的は、文書データ中の記述の正当性を的確に判定し、この判定のための辞書の管理を容易にすることが可能である文書内データ処理装置を提供することにある。   SUMMARY OF THE INVENTION An object of the present invention is to provide an in-document data processing apparatus capable of accurately determining the validity of a description in document data and facilitating management of a dictionary for this determination. .

すなわち、本発明に係わる文書データ処理装置は、概念名および当該概念名の表層表現を対応付けた表層表現辞書を記憶する表層表現記憶手段と、概念名の体系情報および、前記概念名のうち第1の概念名と当該第1の概念名の上位概念名や下位概念名でなく当該第1の概念名に対応する表現とともに前記文書データ中に含まれるべき表現に対応する第2の概念名とのリンク情報を含む階層概念辞書を記憶する階層概念記憶手段と、入力文書データ中の第1の表現に関わる表層表現に対応付けられる概念名を前記表層表現辞書から抽出する第1の抽出手段と、入力文書データ中に第1の表現とともに記述される第2の表現に関わる表層表現に対応付けられる概念名を表層表現辞書から抽出する第2の抽出手段とを備え、階層概念辞書の体系情報およびリンク情報をもとに、第1の抽出手段により抽出した概念名の関連概念名を抽出し、この関連概念名に第2の抽出手段により抽出した概念名が含まれていない場合に、入力文書データ中に第1の表現とともに記述されるべき表現が不足していると判定することを特徴とする。   That is, the document data processing apparatus according to the present invention includes a surface expression storage means for storing a surface expression dictionary in which a concept name and a surface expression of the concept name are associated with each other, system information of the concept name, and the concept name. A first concept name and a second concept name corresponding to an expression to be included in the document data together with an expression corresponding to the first concept name, not an upper concept name or a lower concept name of the first concept name Hierarchical concept storage means for storing a hierarchical concept dictionary including the link information, and first extraction means for extracting a concept name associated with the surface expression related to the first expression in the input document data from the surface expression dictionary And a second extraction means for extracting a concept name associated with the surface expression related to the second expression described together with the first expression in the input document data from the surface expression dictionary, and system information of the hierarchical concept dictionary Based on the link information, the related concept name extracted by the first extraction means is extracted, and input when the related concept name does not include the concept name extracted by the second extraction means. It is determined that the expression to be described together with the first expression is insufficient in the document data.

本発明によれば、文書データ中の記述の正当性を的確に判定し、この判定のための辞書の管理を容易にすることができる。   According to the present invention, it is possible to accurately determine the legitimacy of the description in the document data, and to easily manage the dictionary for this determination.

以下図面により本発明の実施形態について説明する。
(第1の実施形態)
まず、本発明の第1の実施形態について説明する。
図1は、本発明の実施形態にしたがった文書データ処理装置の構成例を示すブロック図である。
図1に示すように、本発明の実施形態にしたがった文書データ処理装置は、装置全体の制御を司る制御部11、記憶装置12、概念抽出部13、概念選択部14、記載概念抽出部15、入出力インタフェース16、判定部17、を備え、それぞれがバス18を介して相互に接続される。
Embodiments of the present invention will be described below with reference to the drawings.
(First embodiment)
First, a first embodiment of the present invention will be described.
FIG. 1 is a block diagram illustrating a configuration example of a document data processing apparatus according to an embodiment of the present invention.
As shown in FIG. 1, a document data processing apparatus according to an embodiment of the present invention includes a control unit 11 that controls the entire apparatus, a storage device 12, a concept extraction unit 13, a concept selection unit 14, and a written concept extraction unit 15. The input / output interface 16 and the determination unit 17 are connected to each other via a bus 18.

記憶装置12は例えばハ−ドディスクドライブや不揮発性メモリ装置などのハードウェアで構成される。記憶装置12は制御部11、概念抽出部13、概念選択部14、記載概念抽出部15による実行対象の制御プログラムを記憶するのに加え、判定ルール記憶部21、表層表現辞書記憶部22および階層概念辞書記憶部23を有する。   The storage device 12 is configured by hardware such as a hard disk drive or a nonvolatile memory device. The storage device 12 stores a control program to be executed by the control unit 11, the concept extraction unit 13, the concept selection unit 14, and the written concept extraction unit 15, in addition to a determination rule storage unit 21, a surface layer expression dictionary storage unit 22, and a hierarchy A concept dictionary storage unit 23 is included.

判定ルール記憶部21には、入力文書データのある欄、例えば「症状」欄で記載を求められた概念に対して、別の欄、例えば「報告内容」欄の記載が不足しているか否かを判定するための判定ルールが記憶される。
判定ルールは、例えば「症状」欄で記載が求められたと判定された概念Aに対して、「報告内容」欄の記載が、(1)概念Aが記載されていれば良い、(2)概念A、もしくは概念Aの上位概念のいずれかが記載されていれば良い、(3)概念A、もしくは概念Aの上位概念、もしくは概念Aの下位概念のいずれかが記載されていれば良い、(4)概念A、もしくは概念Aのリンク先概念のいずれかが記載されていれば良い、(5)概念A、もしくは概念Aの上位・下位概念、もしくは概念Aのリンク先概念、もしくは概念Aのリンク先概念の上位・下位概念のいずれかが記載されていれば良い、などが挙げられ、いずれかが設定される。
Whether or not the determination rule storage unit 21 is insufficiently described in another column, for example, the “report content” column, with respect to the concept requested to be described in a column of the input document data, for example, the “symptom” column. A determination rule for determining is stored.
For example, for the concept A that is determined to be described in the “symptom” column, the determination rule is that the description in the “report content” column is (1) the concept A is described. (2) the concept Either A or a superordinate concept of concept A may be described. (3) It is only necessary that either concept A, a superordinate concept of concept A, or a subordinate concept of concept A is described. 4) It is sufficient that either concept A or concept A linked concept is described. (5) concept A, concept A higher or lower concept, concept A linked concept, or concept A Any one of the upper and lower concepts of the link destination concept may be described, and one of them is set.

図2は、本発明の第1の実施形態にしたがった文書データ処理装置1の記憶装置12に記憶される表層表現辞書の構成例を表形式で示す図である。この表層表現辞書は、家電の故障診断報告書をもとにした例である。
表層表現辞書記憶部22には図2に示した構成の表層表現辞書が記憶される。この表層表現辞書は、入力文書データ中に予め定められた概念に対応する表現が含まれているか否かの判定のために用いられ、概念名に関連付ける表層表現と、その概念が関わる対象機器・機種のリストである。
表層表現とは、入力文書中における実際の表現である。表層表現辞書中の機器、機種や表層表現は、正規表現を用いて記述することができる。
FIG. 2 is a diagram showing a configuration example of the surface layer expression dictionary stored in the storage device 12 of the document data processing apparatus 1 according to the first embodiment of the present invention in the form of a table. This surface expression dictionary is an example based on a failure diagnosis report of home appliances.
The surface expression dictionary storage unit 22 stores the surface expression dictionary having the configuration shown in FIG. This surface expression dictionary is used to determine whether or not the input document data contains expressions corresponding to a predetermined concept, and the surface expression associated with the concept name and the target device It is a list of models.
The surface representation is an actual representation in the input document. The device, model, and surface expression in the surface expression dictionary can be described using regular expressions.

表層表現辞書の概念名の欄は、入力文書に記載される可能性のある概念の名称を記述するものである。対象機器・機種の欄は、「概念名」列に記述された概念が記載される可能性がある機器名や機種名が記述される。
表層表現の欄は、入力文書中で、概念名の欄に記述された概念が実際に記載される場合の表現が記述される。報告内容判定時の表層表現の欄は、入力文書中「報告内容」の判定時には表層表現の欄の記載に別の表層表現を加えて判定したい場合に、追加する表層表現が記述される。
The concept name column of the surface layer expression dictionary describes the names of concepts that may be described in the input document. In the target device / model column, a device name and a model name in which the concept described in the “concept name” column may be described.
In the surface expression column, an expression when the concept described in the concept name column is actually described in the input document is described. The column of the surface layer expression at the time of report content determination describes the surface layer expression to be added when it is desired to make a determination by adding another surface layer expression to the description of the surface layer expression column at the time of the determination of “report content” in the input document.

また、概念体系上の概念としては記述したい一方で入力文書の「症状」、「報告内容」欄からは概念として抽出しない方が良い概念については、「表層表現」欄及び「報告内容判定時の表層表現」欄を特定の記述、例えば「none」としてもよい。
さらに、入力文書データの「症状」欄の記載概念判定時は概念として抽出することが好ましくない一方で、「報告内容」欄では上位概念・下位概念として抽出したい概念については、「表層表現」欄を「none」として、「報告内容判定時の表層表現」欄をその概念が実際に記載される場合の表現としてもよい。
For concepts that should be described as concepts in the conceptual system but should not be extracted as concepts from the “symptoms” and “report contents” columns of the input document, the “surface expression” column and “report content judgment” The “surface expression” column may be a specific description, for example, “none”.
Furthermore, while it is not preferable to extract the concept as a concept when determining the description concept in the “symptom” column of the input document data, the “surface expression” column indicates the concept to be extracted as a superordinate concept / subordinate concept in the “report content” column. May be “none”, and the “surface expression at the time of report content determination” field may be an expression when the concept is actually described.

本発明の実施形態にしたがった文書データ処理装置1は、入力文書データ中の表現に表層表現辞書で管理される表層表現と同じ表現が存在する場合に、これと表層表現辞書上で関連付けられる概念名に対応する表現が入力文書データに含まれていると判定する。   In the document data processing apparatus 1 according to the embodiment of the present invention, when an expression in the input document data includes the same expression as the surface expression managed by the surface expression dictionary, the document data processing apparatus 1 associates the expression with the expression in the surface expression dictionary. It is determined that an expression corresponding to the name is included in the input document data.

図3は、本発明の第1の実施形態にしたがった文書データ処理装置が管理する階層概念の一例を示す図である。
本発明の第1の実施形態にしたがった文書データ処理装置は、図3に示したような階層概念を管理する。図3に示した階層概念は、「部品」「症状」のような、独立した複数階層概念、つまりカテゴリである。図3に示した階層概念の各階層の概念名は、図2に示した表層表現辞書上の「概念名」の列の各概念名と対応する。
FIG. 3 is a diagram showing an example of a hierarchical concept managed by the document data processing apparatus according to the first embodiment of the present invention.
The document data processing apparatus according to the first embodiment of the present invention manages the hierarchical concept as shown in FIG. The hierarchical concept shown in FIG. 3 is an independent multi-level concept such as “component” and “symptom”, that is, a category. The concept name of each hierarchy of the hierarchy concept shown in FIG. 3 corresponds to each concept name in the column of “concept name” on the surface expression dictionary shown in FIG.

具体的には、この階層概念では、第1の階層の概念名「部品」の下位の第2の階層の概念名として「冷熱部品」、「フィルタ」、「ホース」、「回転部品」、「ターンテーブル」、「ヒータ」が関連付けられる。
また、第2の階層の概念名「冷熱部品」の下位の第3の階層の概念名として「コンプレッサ」、「冷媒」が関連付けられ、第2の階層の概念名「回転部品」の下位の第3の階層の概念名として「モータ」、「ベルト」が関連付けられる。
また、第1の階層の概念名「症状」の下位の第2の階層の概念名として「動作時の異常症状」、「電源OFF時の異常」、「目視可能な破損」が関連付けられる。また、第2の階層の概念名「動作時の異常症状」の下位の第3の階層の概念名として「動作不良」、「異常終了」、「その他異常」が関連付けられる。
また、第3の階層の概念名「動作不良」の下位の第4の階層の概念名として「冷えない」、「温まらない」、「回らない」が関連付けられる。また、第3の階層の概念名「異常終了」の下位の第4の階層の概念名として「動かない」、「途中で止まる」が関連付けられる。また、第3の階層の概念名「その他異常」の下位の第4の階層の概念名として「水漏れ」、「異常音」が関連付けられる。
Specifically, in this hierarchical concept, “cooling component”, “filter”, “hose”, “rotating component”, “rotating component”, “ “Turntable” and “Heater” are associated.
Further, “compressor” and “refrigerant” are associated as the concept names of the third hierarchy subordinate to the concept name “cooling component” of the second hierarchy, and the second subordinate of the concept name “rotating parts” of the second hierarchy. “Motor” and “belt” are associated as concept names of the third hierarchy.
Further, “abnormal symptom during operation”, “abnormality when power is turned off”, and “visible damage” are associated as concept names in the second hierarchy lower than the concept name “symptom” in the first hierarchy. In addition, “bad operation”, “abnormal termination”, and “other abnormalities” are associated as conceptual names of the third hierarchy subordinate to the concept name “abnormal symptom during operation” of the second hierarchy.
In addition, “not cool”, “not warm”, and “do not rotate” are associated as concept names of the fourth hierarchy lower than the concept name “malfunction” of the third hierarchy. Also, “does not move” and “stops halfway” are associated as the concept names of the fourth hierarchy lower than the concept name “abnormal termination” of the third hierarchy. Further, “water leak” and “abnormal sound” are associated as the concept names of the fourth layer lower than the concept name “other abnormality” of the third layer.

また、この階層概念ではカテゴリ内の上下関係だけではなく、別のカテゴリへのリンク情報も管理される。カテゴリを跨るリンク情報は、概念としては直接の関係がないが、文書中の記載判定においては関連性のある概念を関連付ける情報である。つまり、リンク情報とは、階層概念における概念名と、当該概念名が属する体系と別の体系、つまり上位概念でも下位概念でもない概念名との組み合わせである。   Further, in this hierarchical concept, not only the hierarchical relationship within a category but also link information to another category is managed. Link information across categories does not have a direct relationship as a concept, but is information for associating related concepts in determination of description in a document. In other words, the link information is a combination of a concept name in the hierarchical concept and a system different from the system to which the concept name belongs, that is, a concept name that is neither a superordinate concept nor a subordinate concept.

図3および図4に示した例では、4つのリンク情報が設定される。図3中の点線が、他カテゴリとのリンクを示している。第1のリンク情報は、第1の階層の概念名「部品」の下位の第2の階層の概念名「冷熱部品」と第1の階層の概念名「症状」の下位の第4の階層の概念名「冷えない」との組み合わせである。
また、第2のリンク情報は、第1の階層の概念名「部品」の下位の第2の階層の概念名「ホース」と第1の階層の概念名「症状」の下位の第4の階層の概念名「水漏れ」との組み合わせである。
また、第3のリンク情報は、第1の階層の概念名「部品」の下位の第2の階層の概念名「回転部品」と第1の階層の概念名「症状」の下位の第4の階層の概念名「回らない」との組み合わせである。
また、第4のリンク情報は、第1の階層の概念名「部品」の下位の第2の階層の概念名「ターンテーブル」と第1の階層の概念名「症状」の下位の第4の階層の概念名「回らない」との組み合わせである。
In the example shown in FIGS. 3 and 4, four pieces of link information are set. A dotted line in FIG. 3 indicates a link with another category. The first link information includes the concept name “cooling component” in the second hierarchy lower than the concept name “component” in the first hierarchy and the fourth hierarchy lower than the concept name “symptom” in the first hierarchy. It is a combination with the concept name “I do not get cold”.
The second link information includes a concept name “hose” in the second hierarchy lower than the concept name “component” in the first hierarchy and a fourth hierarchy lower than the concept name “symptom” in the first hierarchy. It is a combination with the concept name “water leak”.
Further, the third link information includes a second hierarchical concept name “rotating part” lower than the first hierarchical concept name “component” and a fourth hierarchical subordinate to the first hierarchical concept name “symptom”. This is a combination with the concept name “do not turn” in the hierarchy.
Further, the fourth link information includes a second hierarchical concept name “turn table” lower than the first hierarchical concept name “component” and a fourth hierarchical subordinate to the first hierarchical concept name “symptom”. This is a combination with the concept name “do not turn” in the hierarchy.

これらのリンク情報を管理しておけば、入力文書データの記述が、機器名「電子レンジ」で部品「ターンテーブル」に関する記述である場合、その文書は前述した第4のリンク情報をもとに、当該部品「ターンテーブル」に特有の症状「回らない」に関して記載されるとみなすことができ、部品および当該部品に特有の症状を関連付けることができる。   If the link information is managed, if the description of the input document data is a description of the component “turntable” with the device name “microwave oven”, the document is based on the fourth link information described above. , Can be considered to be described with respect to a symptom “does not turn” specific to the part “turntable”, and can associate a part and a symptom specific to the part.

このリンク情報には作成ルールが存在する。この作成ルールは、例えば「同じカテゴリ内にリンクを張らない」、「ある枝から別カテゴリの同一の枝に対して複数リンクを張らない」、「リンクが張られた項目を削除する場合、張られていたリンクは上位概念に移行する」などである。   A creation rule exists for this link information. For example, this creation rule is: “Do not create links in the same category”, “Do not create multiple links from one branch to the same branch in another category”, “When deleting an item with a link, The link that has been moved to a higher concept ".

また、図3に示した例では、リンク情報とは別に、第1の階層の概念名「症状」の下位の第4の階層の概念名「水漏れ」と第1の階層の概念名「症状」の下位の第3の階層の概念名「水漏れ」とが同一項目である旨を管理されている。この管理によって、これらの概念名は表層表現などの辞書情報を共有できる。   Further, in the example shown in FIG. 3, apart from the link information, the concept name “water leak” in the fourth hierarchy lower than the concept name “symptom” in the first hierarchy and the concept name “symptom” in the first hierarchy. The concept name “water leakage” in the third hierarchy below “” is managed to be the same item. With this management, these concept names can share dictionary information such as surface expression.

図4は、本発明の第1の実施形態にしたがった文書データ処理装置の記憶装置12に記憶される階層概念辞書の構成例を表形式で示す図である。
図4に示すように、本発明の第1の実施形態にしたがった文書データ処理装置の階層概念辞書記憶部23には階層概念辞書が記憶される。
FIG. 4 is a diagram showing a configuration example of the hierarchical concept dictionary stored in the storage device 12 of the document data processing device according to the first embodiment of the present invention in the form of a table.
As shown in FIG. 4, a hierarchical concept dictionary is stored in the hierarchical concept dictionary storage unit 23 of the document data processing apparatus according to the first embodiment of the present invention.

この階層概念辞書は、図3に示した階層構造を具現化したものである。この階層概念辞書では、行のラベル(ID)、概念名、他概念の行ラベルとのリンク情報、階層構成情報が関連付けられて管理される。
階層構成情報は、階層概念辞書上で関連付けられる概念名が属する概念体系を最上位から該当概念名まで列挙する欄である。この欄は図4に示した階層概念辞書上の「階層01」、「階層02、「階層03」、「階層04」が該当する。
階層概念辞書の行のラベルは、各行に異なる文字列が割り付けられる。概念名は、概念体系が異なれば、階層概念辞書中で同じものが複数回現れてもよい。
階層概念辞書は、図4に示した例では、便宜上、上位概念の行から順に並べて管理されるが、概念体系が上位概念から順に取り出せれば、実際に階層概念辞書記憶部23に記憶される順番はこれに限定されない。
This hierarchical concept dictionary embodies the hierarchical structure shown in FIG. In this hierarchical concept dictionary, row labels (ID), concept names, link information with row labels of other concepts, and hierarchy configuration information are associated and managed.
The hierarchy configuration information is a column for enumerating the concept system to which the concept name associated in the hierarchy concept dictionary belongs from the highest level to the corresponding concept name. This column corresponds to “hierarchy 01”, “hierarchy 02”, “hierarchy 03”, and “hierarchy 04” on the hierarchical concept dictionary shown in FIG.
A different character string is assigned to each line of the label of the hierarchical concept dictionary. The same concept name may appear multiple times in the hierarchical concept dictionary as long as the concept system is different.
In the example shown in FIG. 4, the hierarchical concept dictionary is managed side by side in the order of the superordinate concepts for convenience. However, if the concept system can be extracted in order from the superordinate concepts, it is actually stored in the hierarchical concept dictionary storage unit 23. The order is not limited to this.

概念抽出部13は、入力文書の所定の欄の表現に対応する概念名を、表層表現辞書記憶部22に記憶された表層表現辞書から抽出することで、入力文書データ中で記載が求められている概念を抽出する。
概念選択部14は、入力文書の所定の欄の表記に従い、当該入力文書の報告で記載が可能である概念名を表層表現辞書に登録された概念名から選択する。
記載概念抽出部15は、入力文書の所定の欄の表現に対応する概念名を報告内容欄チェック用辞書から抽出する。報告内容欄チェック用辞書は表層表現辞書に後述する必須情報フラグの列を加えたものである。
The concept extraction unit 13 extracts the concept name corresponding to the expression in the predetermined column of the input document from the surface expression dictionary stored in the surface expression dictionary storage unit 22, so that the description is requested in the input document data. To extract the concept.
The concept selection unit 14 selects a concept name that can be described in the report of the input document from the concept names registered in the surface expression dictionary according to the notation in a predetermined column of the input document.
The description concept extraction unit 15 extracts a concept name corresponding to the expression in a predetermined column of the input document from the report content column check dictionary. The report content column check dictionary is obtained by adding a column of essential information flags to be described later to the surface layer expression dictionary.

入出力インタフェース16は、ユーザ端末装置2との間でデータのやりとりを行なう。また、入出力インタフェース16は図示しない外部記憶装置とケーブルを介して接続可能であり、この外部記憶装置との間で文書データを入出力する。
判定部17は、概念抽出部13で抽出した概念名と、記載概念抽出部15で抽出した概念名と、判定ルール記憶部21に記憶された判定ルールに従い、入力文書データ中における記載概念抽出部15により参照した欄の記述が不足しているか否かを判定する。
The input / output interface 16 exchanges data with the user terminal device 2. The input / output interface 16 can be connected to an external storage device (not shown) via a cable, and inputs / outputs document data to / from the external storage device.
The determination unit 17 follows the concept name extracted by the concept extraction unit 13, the concept name extracted by the description concept extraction unit 15, and the determination rule stored in the determination rule storage unit 21. It is determined whether or not the description of the column referred to by 15 is insufficient.

図5は、本発明の第1の実施形態にしたがった文書データ処理装置と接続されるユーザ端末装置の構成例を示すブロック図である。
ユーザ端末装置2は、整合性チェックを行なう文書を作成するユーザが取り扱う端末装置である。図5に示すように、ユーザ端末装置2は、装置全体の処理を司る制御部31、記憶装置32、表示装置33、入力装置34、通信インタフェース35を備え、それぞれがバス36を介して相互に接続される。
FIG. 5 is a block diagram showing a configuration example of a user terminal device connected to the document data processing device according to the first embodiment of the present invention.
The user terminal device 2 is a terminal device handled by a user who creates a document to be checked for consistency. As shown in FIG. 5, the user terminal device 2 includes a control unit 31 that controls the processing of the entire device, a storage device 32, a display device 33, an input device 34, and a communication interface 35, which are mutually connected via a bus 36. Connected.

記憶装置32は、例えばハ−ドディスクドライブや不揮発性メモリ装置などのハードウェアで構成された記憶装置である。記憶装置32は、制御用のプログラムを記憶する。また、記憶装置32は、制御部31による各種処理のワークメモリとしても機能する。
表示装置33は、例えば液晶ディスプレイであり、文書データ処理装置1の判定部17の判定結果をユーザに向けて出力する。メッセージは、例えば「症状Aに関する記載が求められていますが、報告内容に関連する記載がありません。」「症状に対して記載が不足した概念はありません。」である。
The storage device 32 is a storage device configured by hardware such as a hard disk drive or a nonvolatile memory device. The storage device 32 stores a control program. The storage device 32 also functions as a work memory for various processes performed by the control unit 31.
The display device 33 is a liquid crystal display, for example, and outputs the determination result of the determination unit 17 of the document data processing device 1 to the user. For example, the message “Symptom A is required to be described, but there is no description related to the report contents.” “There is no concept lacking description for the symptom”.

入力装置34は例えばキーボードやマウスであり、文書内整合性チェックを行なう文書作成にかかる操作を受け付ける。通信インタフェース35は、ケーブルを介して文書データ処理装置1と接続され、ユーザ端末装置2において作成された入力文書や文書データ処理装置1の処理結果などのやり取りを行う。
また、通信インタフェース35は外部記憶装置とケーブルを介して接続可能であり、この外部記憶装置との間で入力文書を入出力することもできる。
The input device 34 is, for example, a keyboard or a mouse, and accepts an operation related to document creation for performing intra-document consistency check. The communication interface 35 is connected to the document data processing apparatus 1 via a cable, and exchanges an input document created in the user terminal apparatus 2 and a processing result of the document data processing apparatus 1.
The communication interface 35 can be connected to an external storage device via a cable, and input documents can be input / output to / from the external storage device.

次に、図1に示した構成の文書データ処理装置の動作について説明する。図6は、本発明の第1の実施形態にしたがった文書データ処理装置1の処理動作の一例を示すフローチャートである。   Next, the operation of the document data processing apparatus having the configuration shown in FIG. 1 will be described. FIG. 6 is a flowchart showing an example of the processing operation of the document data processing apparatus 1 according to the first embodiment of the present invention.

まず、入力文書データは、ユーザ端末装置2の入力装置34に対する操作により作成されて、この文書データが通信インタフェース35から文書データ処理装置1の入出力インタフェース16へ入力される、または、外部記憶装置に記憶された作成済みの入力文書データが文書データ処理装置1の入出力インタフェース16に入力されるとする。文書データ処理装置1の制御部11は入出力インタフェース16に入力された文書データを記憶装置12に記憶する(ステップS1)。   First, input document data is created by an operation on the input device 34 of the user terminal device 2, and this document data is input from the communication interface 35 to the input / output interface 16 of the document data processing device 1, or an external storage device. Assume that the input document data that has already been stored is input to the input / output interface 16 of the document data processing apparatus 1. The control unit 11 of the document data processing apparatus 1 stores the document data input to the input / output interface 16 in the storage device 12 (step S1).

図7は、本発明の第1の実施形態にしたがった文書データ処理装置に入力される入力文書データの構成例を示す図である。
この入力文書データは冷蔵庫の故障診断報告書であり、対象機器名、機種名、症状および報告内容が表形式で記述されたものである。
図7に示した例では、機器名の欄の記載は「冷蔵庫」であり、機種名の欄の記載は「RFxx−yyy」であり、症状の欄の記載は「庫内が冷えない」であり、報告内容の欄の記載は「コンプレッサ不良。交換必要。」である。
なお、入力文書データは図7に示した表形式に限らず、箇条書き形式であってもよいし通常の文章形式であってもよい。
FIG. 7 is a diagram showing a configuration example of input document data input to the document data processing apparatus according to the first embodiment of the present invention.
The input document data is a refrigerator failure diagnosis report in which the target device name, model name, symptom, and report content are described in a table format.
In the example shown in FIG. 7, the description in the device name column is “refrigerator”, the description in the model name column is “RFxx-yyy”, and the description in the symptom column is “the cabinet does not cool”. Yes, and the description in the report content column is "Compressor defective. Replaceable."
Note that the input document data is not limited to the table format shown in FIG. 7, but may be a bullet format or a normal text format.

概念選択部14は、表層表現辞書記憶部22に記憶された表層表現辞書を読み込み(ステップS2)、概念抽出部13と連動して表層表現の各行に対する判定を実行する(ステップS3)。   The concept selection unit 14 reads the surface layer expression dictionary stored in the surface layer expression dictionary storage unit 22 (step S2), and executes determination on each row of the surface layer expression in conjunction with the concept extraction unit 13 (step S3).

概念選択部14は、表層表現辞書の1行を取り出し、入力文書の「機器名」、「機種名」欄の表現に、表層表現辞書の選択行の「対象機器・機種」欄の表現が文字列としてマッチするか否かを判定する(ステップS4)。
概念選択部14は、表層表現辞書の選択行の「対象機器・機種」欄の表現が入力文書の「機器名」「機種名」欄の表現にマッチしない場合は(ステップS4のNO)、当該表層表現辞書の次の行の処理に移る。
一方、概念選択部14が、表層表現辞書の選択行の「対象機器・機種」欄の表現が入力文書の「機器名」、「機種名」欄の表現にマッチすると判定した場合は(ステップS4のYES)、概念抽出部13は、図7に示した入力文書の「症状」欄の表現に、表層表現辞書の選択行の「表層表現」欄の表現が文字列としてマッチするか否かを判定する(ステップS5)。
The concept selection unit 14 extracts one line of the surface expression dictionary, and the expression in the “device name” and “model name” fields of the input document is expressed in the “target device / model” field in the selected line of the surface expression dictionary. It is determined whether or not they match as a column (step S4).
When the expression in the “target device / model” column of the selected row of the surface expression dictionary does not match the expression in the “device name” and “model name” column of the input document (NO in step S4), the concept selection unit 14 Move on to the next line of the surface expression dictionary.
On the other hand, when the concept selection unit 14 determines that the expression in the “target device / model” column in the selected row of the surface expression dictionary matches the expression in the “device name” and “model name” columns of the input document (step S4). YES), the concept extraction unit 13 determines whether the expression in the “surface expression” column of the selected line of the surface expression dictionary matches the expression in the “symptom” field of the input document shown in FIG. 7 as a character string. Determine (step S5).

概念抽出部13は、入力文書の「症状」欄の記載に、表層表現辞書の選択行の「表層表現」欄の内容が文字列としてマッチする場合は(ステップS5のYES)、必須情報フラグを新たに付加し、表層表現辞書の選択行の必須情報フラグの値を「1」にする(ステップS6)。
また、概念抽出部13は、入力文書の「症状」欄の記載に、表層表現辞書の選択行の「表層表現」欄の内容が文字列としてマッチしない場合は(ステップS5のNO)、必須情報フラグを新たに付加し、当該選択行の必須情報フラグの値を「0」にする。
The concept extraction unit 13 sets an essential information flag when the contents of the “surface expression” field in the selected line of the surface expression dictionary match the description in the “symptom” field of the input document as a character string (YES in step S5). Newly added and the value of the essential information flag in the selected row of the surface expression dictionary is set to “1” (step S6).
In addition, if the contents of the “surface expression” column of the selected line of the surface expression dictionary do not match the description in the “symptom” field of the input document as a character string (NO in step S5), the concept extraction unit 13 is required information A flag is newly added, and the value of the essential information flag of the selected row is set to “0”.

概念抽出部13は、表層表現辞書の選択行に必須情報フラグを加えた情報を、新たに生成する報告内容欄チェック用辞書のエントリとして記憶装置12に出力する(ステップS7)。
概念抽出部13は、表層表現辞書の全ての行に対する処理の終了後、記憶装置12に出力された報告内容欄チェック用辞書エントリをまとめ、報告内容欄チェック用辞書として記憶する(ステップS8→S9)。
The concept extraction unit 13 outputs information obtained by adding the essential information flag to the selected line of the surface expression dictionary to the storage device 12 as an entry of a newly generated report content column check dictionary (step S7).
The concept extraction unit 13 collects the report content column check dictionary entries output to the storage device 12 after the processing for all the rows in the surface expression dictionary is completed, and stores it as a report content column check dictionary (steps S8 → S9). ).

図8は、本発明の第1の実施形態にしたがった文書データ処理装置の途中出力である報告内容欄チェック用辞書の一例を示す図である。
図8に示した報告内容欄チェック用辞書は、図2に示した表層表現辞書の各行のうち「対象機器・機種」欄が図7に示した入力文書の「機器名」、「機種名」欄の表現にマッチしない行は含まれていない。
また、図8に示した報告内容欄チェック用辞書は、図2に示した表層表現辞書と比較して、必須情報フラグの列が追加され、各行のうち入力文書の「症状」欄の表現にマッチする表層表現「冷えない」の行の必須情報フラグの欄に「1」が記入される。
FIG. 8 is a diagram showing an example of a report content column check dictionary that is an intermediate output of the document data processing apparatus according to the first embodiment of the present invention.
In the report content column check dictionary shown in FIG. 8, the “target device / model” column in each row of the surface expression dictionary shown in FIG. 2 includes “device name” and “model name” of the input document shown in FIG. Lines that do not match the column representation are not included.
In addition, the report content column check dictionary shown in FIG. 8 has a column of essential information flags added to the surface layer expression dictionary shown in FIG. “1” is entered in the column of the essential information flag in the line of the matching surface expression “not cool”.

記載概念抽出部15は、記憶装置12に記憶された報告内容欄チェック用辞書を読み込み、その1行ごとに判定処理を行なう(ステップS10)。
記載概念抽出部15は、報告内容欄チェック用辞書の1行を取り出し、入力文書の「報告内容」欄の記載に、報告内容欄チェック用辞書の選択行の「表層表現」欄の記載が文字列としてマッチするか否かを判定する(ステップS11)。
ただし、記載概念抽出部15は、報告内容欄チェック用辞書の選択行の「報告内容判定時の表層表現」欄が空欄ではない場合は、その内容を当該辞書の「表層表現」欄の記載と合わせて、マッチするか否かの判定対象とする。
The description concept extraction unit 15 reads the report content column check dictionary stored in the storage device 12, and performs the determination process for each line (step S10).
The description concept extraction unit 15 extracts one line of the report content column check dictionary, and the description of the “surface expression” column of the selected row of the report content column check dictionary is a character in the description of the “report content” column of the input document. It is determined whether or not they match as a column (step S11).
However, if the “surface expression at the time of report content determination” field in the selected row of the report content field check dictionary is not blank, the description concept extraction unit 15 sets the contents as described in the “surface expression” field of the dictionary. At the same time, it is determined whether or not to match.

記載概念抽出部15は、入力文書の「報告内容」欄の記載が、報告内容欄チェック用辞書の選択行の「表層表現」欄の記載、および「報告内容判定時の表層表現」欄の空白でない記載のいずれかとマッチする場合は(ステップS11のYES)、報告内容欄有無フラグの列を新たに設定し、報告内容欄チェック用辞書の選択行の報告内容欄有無フラグの値を「1」にする(ステップS12)。
一方、記載概念抽出部15は、入力文書の「報告内容」欄の記載が、報告内容欄チェック用辞書の選択行の「表層表現」欄の記載、および「報告内容判定時の表層表現」欄の空白でない記載のいずれともマッチしない場合は(ステップS11のNO)、報告内容欄有無フラグの列を新たに設定し、当該選択行の報告内容欄有無フラグの値を「0」にする。
The description concept extracting unit 15 includes a description in the “report content” column of the input document, a description in the “surface expression” column of the selected row of the report content column check dictionary, and a blank in the “surface expression at the time of report content determination” column. If it matches any of the descriptions that are not (YES in step S11), a new report content column presence / absence flag column is set, and the value of the report content column presence / absence flag in the selected row of the report content column check dictionary is set to “1”. (Step S12).
On the other hand, the description concept extraction unit 15 includes the description in the “report content” column of the input document, the description in the “surface expression” column of the selected row of the report content column check dictionary, and the “surface expression at the time of report content determination” column. If it does not match any of the non-blank descriptions (NO in step S11), the column of the report content column presence / absence flag is newly set, and the value of the report content column presence / absence flag of the selected row is set to “0”.

図9は、本発明の第1の実施形態にしたがった文書データ処理装置の途中出力である報告内容欄チェック結果の一例を示す図である。
図9に示した報告内容欄チェック結果は、図8に示した報告内容欄チェック用辞書の各行のうち、必須情報フラグが「1」である行、つまり概念名が「冷えない」である行について、もしくは、報告内容欄記載有無フラグが「1」である行、つまり概念名が「コンプレッサ」である行を残し、これらの行のうち概念名、必須情報フラグ、報告内容欄記載有無フラグの列を残したものである。
FIG. 9 is a diagram showing an example of a report content column check result that is an intermediate output of the document data processing apparatus according to the first embodiment of the present invention.
The report content column check result shown in FIG. 9 is the row where the essential information flag is “1” among the rows of the report content column check dictionary shown in FIG. 8, that is, the concept name is “not cool”. Or the report content column description presence flag is “1”, that is, the concept name is “compressor”, and among these lines, the concept name, required information flag, report content column description presence flag It is what left the column.

記載概念抽出部15は、報告内容欄有無フラグの値を設定した後、報告内容欄チェック用辞書の選択行の必須情報フラグの値と報告内容欄有無フラグの値がともに「0」であるか否かをチェックする(ステップS13)。
記載概念抽出部15は、両方のフラグのいずれかが「1」である場合には(ステップS13のNO)、新たに生成する報告内容チェック結果リストのエントリとして、概念名、必須情報フラグの値、報告内容欄有無フラグの値を記憶装置12に出力する(ステップS14)。
After setting the value of the report content column presence / absence flag, the description concept extraction unit 15 determines whether both the value of the mandatory information flag and the value of the report content column presence / absence flag in the selected row of the report content column check dictionary are “0”. It is checked whether or not (step S13).
If either of the flags is “1” (NO in step S13), the written concept extraction unit 15 uses the concept name and the value of the essential information flag as an entry in the newly generated report content check result list. Then, the value of the report content column presence / absence flag is output to the storage device 12 (step S14).

記載概念抽出部15は、ステップS14の処理後、もしくはステップS13の処理で「YES」と判定した場合には当該報告内容欄チェック用辞書の次の行の処理に移る(ステップS15)。
記載概念抽出部15は、報告内容欄チェック用辞書の全行に対する処理終了後、記憶装置12に記憶された報告内容欄チェック結果リストエントリをまとめ、報告内容欄チェック結果として記憶する(ステップS16)。
The description concept extraction unit 15 proceeds to the process of the next line in the report content column check dictionary after the process of step S14 or when “YES” is determined in the process of step S13 (step S15).
The description concept extraction unit 15 collects the report content column check result list entries stored in the storage device 12 after the processing for all the lines in the report content column check dictionary and stores it as a report content column check result (step S16). .

判定部17は、記載概念抽出部15の出力である報告内容欄チェック結果と、判定ルール記憶部21に記憶された判定ルールを用い、階層概念辞書記憶部23に記憶された階層概念辞書をチェックする(ステップS17)。   The determination unit 17 checks the hierarchical concept dictionary stored in the hierarchical concept dictionary storage unit 23 using the report content column check result output from the description concept extraction unit 15 and the determination rule stored in the determination rule storage unit 21. (Step S17).

ここで、判定部17の処理であるステップS17の処理の詳細を述べる。図10は、本発明の第1の実施形態にしたがった文書データ処理装置1の判定部17の処理動作の一例を示すフローチャートである。
判定部17は、記憶装置12に記憶された報告内容欄チェック結果リストを読み込む(ステップS21)。次に、判定部17は階層概念辞書記憶部23に記憶された階層概念辞書を読み込む(ステップS22)。
Here, details of the process of step S17 which is the process of the determination unit 17 will be described. FIG. 10 is a flowchart showing an example of the processing operation of the determination unit 17 of the document data processing apparatus 1 according to the first embodiment of the present invention.
The determination unit 17 reads the report content column check result list stored in the storage device 12 (step S21). Next, the determination unit 17 reads the hierarchical concept dictionary stored in the hierarchical concept dictionary storage unit 23 (step S22).

判定部17は、報告内容欄チェック結果リストを1行ずつ取り出し、この報告内容欄チェック結果リストの選択行の、報告内容欄記載有無フラグの値をチェックする(ステップS24)。
判定部17は、報告内容欄記載有無フラグの値が「1」ならば(ステップS24のYES)、報告欄チェック結果リストの選択行の概念名と同じ概念名の行を階層概念辞書から探し、当該階層概念辞書の同じ概念名の行に「記載」の列を新たに付加し、この値を「有」とする(ステップS25)。
The determination unit 17 extracts the report content column check result list line by line, and checks the value of the report content column description presence flag in the selected row of the report content column check result list (step S24).
If the value of the report content column description presence flag is “1” (YES in step S24), the determination unit 17 searches the hierarchical concept dictionary for a row having the same concept name as the concept name of the selected row in the report column check result list. A column of “description” is newly added to the row of the same concept name in the hierarchical concept dictionary, and this value is set to “present” (step S25).

判定部17は、ステップS25の処理後、もしくはステップS24の処理で「NO」と判定した場合、報告内容欄チェック結果リストの選択行の必須情報フラグの値をチェックする(ステップS26)。判定部17は、報告内容欄チェック結果リストの選択行で、必須情報フラグの値が「1」ならば(ステップS26のYES)、階層概念辞書の選択行の概念名を、新たに生成するチェック対象概念リストのエントリとして記憶装置12に出力する(ステップS27)。   The determination unit 17 checks the value of the essential information flag in the selected row of the report content column check result list after the process of step S25 or when determining “NO” in the process of step S24 (step S26). If the value of the mandatory information flag is “1” in the selected row of the report content column check result list (YES in step S26), the determination unit 17 newly generates the concept name of the selected row in the hierarchical concept dictionary. It is output to the storage device 12 as an entry in the target concept list (step S27).

判定部17は、ステップS27の処理後、もしくはステップS26の処理で「NO」と判定した場合には当該報告内容欄チェック結果リストの次の行の処理に移る(ステップS28)。   The determination part 17 moves to the process of the next line of the said report content column check result list after the process of step S27, or when it determines with "NO" by the process of step S26 (step S28).

判定部17は、報告内容欄チェック結果リストの全行の処理終了後、記憶装置12に出力されたチェック対象概念リストのエントリをまとめて、チェック対象概念リストとして記憶装置12に記憶する(ステップS29)。   The determination unit 17 collects the entries of the check target concept list output to the storage device 12 after the processing of all the rows in the report content column check result list is completed, and stores the check target concept list in the storage device 12 as a check target concept list (step S29). ).

図11は、本発明の第1の実施形態にしたがった文書データ処理装置の途中出力であるチェック対象概念リストの一例を示す図である。
図11に示した例では、チェック対象概念リストは、報告内容欄チェック結果リストにおいて必須情報フラグの値が「1」であった列の概念名「冷えない」が管理される。図11に示した例では、チェック対象概念リストの行は1行のみであるが、リストは1行とは限らない。
FIG. 11 is a diagram showing an example of a check target concept list that is an intermediate output of the document data processing apparatus according to the first embodiment of the present invention.
In the example illustrated in FIG. 11, in the concept list to be checked, the concept name “not cooled” of the column whose essential information flag value is “1” in the report content column check result list is managed. In the example shown in FIG. 11, the check target concept list has only one row, but the list is not limited to one row.

図12は、本発明の第1の実施形態にしたがった文書データ処理装置の途中出力である記載有無情報を付与した階層概念辞書の一例を示す図である。図12に示した例では、図4に示した階層概念辞書に「記載」の列を付与し、この列におけるステップS24の処理で「YES」と判定した時点での当該階層概念辞書の選択行の欄に「有」が設定されている。   FIG. 12 is a diagram showing an example of a hierarchical concept dictionary to which description presence / absence information, which is an intermediate output of the document data processing apparatus according to the first embodiment of the present invention, is given. In the example shown in FIG. 12, a column “description” is added to the hierarchical concept dictionary shown in FIG. 4, and the selected row of the hierarchical concept dictionary at the time when “YES” is determined in the process of step S24 in this column. "Yes" is set in the column of.

判定部17は、記憶装置12に記憶されたチェック対象概念リストを読み込み、リストを1行ずつ選択する(ステップS30)
判定部17は、チェック対象概念リストの選択行の概念名を図12に示した階層概念辞書上で探し、判定ルール記憶部21に記憶された判定ルールに従い、チェック対象概念リストの選択行の概念名の関連概念を図12に示した階層概念辞書から抽出してリスト化する(ステップS31)。
The determination unit 17 reads the check target concept list stored in the storage device 12, and selects the list line by line (step S30).
The determining unit 17 searches the hierarchical concept dictionary shown in FIG. 12 for the concept name of the selected row in the check target concept list and follows the determination rule stored in the determination rule storage unit 21 to select the concept of the selected row in the check target concept list. Name related concepts are extracted from the hierarchical concept dictionary shown in FIG. 12 and listed (step S31).

ここで、例えば、前述した判定ルールの例である、(5)「概念A、もしくは概念Aの上位・下位概念、概念Aの他カテゴリへのリンク先概念、リンク先概念の上位下位概念のいずれかが記載されていれば良い」が設定されているとする。   Here, for example, (5) “Concept A, or a concept that is a superordinate / subordinate concept of concept A, a concept linked to another category of concept A, or a superordinate / subordinate concept of a linked concept, for example, ”Is sufficient if it is described” is set.

図13は、本発明の第1の実施形態にしたがった文書データ処理装置の途中出力である関連概念リストの一例を示す図である。
図13に示した関連概念リストは、チェック対象概念リストの選択行の概念名「冷えない」の関連概念リストである。
FIG. 13 is a diagram showing an example of a related concept list which is an intermediate output of the document data processing apparatus according to the first embodiment of the present invention.
The related concept list shown in FIG. 13 is a related concept list of the concept name “not cool” in the selected row of the check target concept list.

まず、判定部17は、チェック対象概念リストの選択行の概念名「冷えない」、ID「s4」および「記載」の列の値からなる行を図12に示した階層概念辞書から抽出して空のリストに追加する。次に、判定部17は、当該選択行の概念名「冷えない」の上位概念である概念名「症状」、「動作時の異常症状」、「動作不良」、当該概念名のIDおよび「記載」の列の値からなる行を図12に示した階層概念辞書から抽出してリストに追加する。   First, the determination unit 17 extracts, from the hierarchical concept dictionary illustrated in FIG. 12, a row including the values of the columns of the concept name “not cool”, ID “s4”, and “description” of the selected row of the check target concept list. Add to an empty list. Next, the determination unit 17 includes the concept name “symptom”, “abnormal symptom during operation”, “operation failure”, the ID of the concept name, and “description”, which are the superordinate concepts of the concept name “not cool” in the selected row. ”Is extracted from the hierarchical concept dictionary shown in FIG. 12 and added to the list.

上位概念とは、チェック対象概念リストの選択行の概念名「冷えない」よりも階層数が少なく、全階層構成名が概念名「冷えない」の対応する階層の名称と一致する概念を示す。概念名「冷えない」には下位概念がないため、関連概念リストに概念名「冷えない」の下位概念が関わる行は追加されない。
また、下位概念とは、チェック対象概念リストの選択行の概念名「冷えない」よりも階層数が多く、概念名「冷えない」の全階層構成の名称が対応する階層の名称と一致する概念を示す。判定部17は、概念名「冷えない」が図12に示した階層概念辞書上で複数箇所に現れる場合は、その全ての階層概念辞書上の行に対して同じ処理を行う。
The superordinate concept is a concept having a lower number of layers than the concept name “not cooled” in the selected row of the check target concept list, and the entire hierarchy configuration name matches the name of the corresponding hierarchy of the concept name “not cooled”. Since the concept name “does not cool” has no subordinate concept, a row related to the subordinate concept of the concept name “does not cool” is not added to the related concept list.
The subordinate concept has a higher number of layers than the concept name “not cool” in the selected row of the check target concept list, and the concept name “not cool” matches the name of the corresponding hierarchy. Indicates. When the concept name “not cool” appears in a plurality of locations on the hierarchical concept dictionary shown in FIG. 12, the determination unit 17 performs the same process on all the rows in the hierarchical concept dictionary.

また、判定部17は、図12に示した階層概念辞書上でIDが「s4」である概念名「冷えない」にはリンク先として「p2_冷熱部品」が設定されているため、図12に示した階層概念辞書上のID「p2」、概念名「冷熱部品」および「記載」の列の値でなる行を図12に示した階層概念辞書から抽出してリストに追加する。   In addition, the determination unit 17 sets “p2_cooling component” as the link destination in the concept name “not cool” with the ID “s4” on the hierarchical concept dictionary illustrated in FIG. A row including values of the columns of ID “p2”, concept name “cooling component” and “description” on the hierarchical concept dictionary shown is extracted from the hierarchical concept dictionary shown in FIG. 12 and added to the list.

さらに、判定部17は、IDが「p2」である概念名「冷熱部品」の上位概念名「部品」、下位概念名「コンプレッサ」、「冷媒」、当該概念名のIDおよび「記載」の列の値からなる行を図12に示した階層概念辞書から抽出して関連概念リストに追加する。   Furthermore, the determination unit 17 includes a column of a higher concept name “component”, a lower concept name “compressor”, “refrigerant”, an ID of the concept name, and “description” of the concept name “cooling component” whose ID is “p2”. Are extracted from the hierarchical concept dictionary shown in FIG. 12 and added to the related concept list.

判定部17は、作成した関連概念リストを1行ずつ選択する(ステップS32)。判定部17は、関連概念リストの選択行で「記載」欄の「有」の有無をチェックする(ステップS33)。
判定部17は、関連概念リストの選択行の「記載」欄が「有」である場合は(ステップS33のYES)、処理中のチェック対象概念リストの選択行に記載ありを示す情報を付与する(ステップS34)。
The determination unit 17 selects the created related concept list line by line (step S32). The determination unit 17 checks the presence / absence of “present” in the “description” column in the selected row of the related concept list (step S33).
When the “description” column of the selected row in the related concept list is “present” (YES in step S33), the determination unit 17 gives information indicating that there is a description in the selected row of the check target concept list being processed. (Step S34).

判定部17は、ステップS34の処理後、もしくはステップS33の処理で「NO」と判定した場合には当該関連概念リストの次の行の処理に移る(ステップS35)。
判定部17は、関連概念リストの全行に対する処理終了後、チェック対象概念リストの選択行に記載ありを示す情報が付与されているか否かをチェックする(ステップS36)。
The determination unit 17 proceeds to the process of the next row in the related concept list after the process of step S34 or when determining “NO” in the process of step S33 (step S35).
The determination unit 17 checks whether or not information indicating that there is a description is given to the selected row of the check target concept list after the processing for all the rows of the related concept list is completed (step S36).

判定部17は、チェック対象概念リストの選択行に記載ありを示す情報が付与されていない場合は(ステップS36のNO)、チェック対象概念リストの選択行の概念名に対応する表現は入力文書中の報告内容の欄に記載されなかったと判定し、これを示す情報をアラームリストエントリとして記憶装置12に出力する(ステップS37)。   When the information indicating that there is a description in the selected row of the check target concept list is not given (NO in step S36), the determination unit 17 displays the expression corresponding to the concept name of the selected row of the check target concept list in the input document. The information indicating this is output to the storage device 12 as an alarm list entry (step S37).

判定部17は、ステップS37の処理後、もしくはステップS36の処理で「YES」と判定した場合には当該チェック対象概念リストの次の行の処理に移る(ステップS38)。   The determination unit 17 proceeds to the process of the next row in the check target concept list after the process of step S37 or when “YES” is determined in the process of step S36 (step S38).

判定部17は、チェック対象概念リストの全行に対する処理終了後(ステップS38)、記憶装置12に記憶されたアラームリストエントリをまとめ、ユーザに提示するメッセージを入出力インタフェース16を介してユーザ端末装置2に出力する(ステップS38)。
ユーザ端末装置2の通信インタフェース35がメッセージを入力すると、制御部31は、メッセージを文書内整合性チェック結果として表示装置33に表示させる(ステップS18)。
また、判定部17は、アラームリストエントリが全くない場合は、「記載不足の概念はありません。」とのメッセージを出力してもよい。
The determination unit 17 collects the alarm list entries stored in the storage device 12 after completing the processing for all the rows of the check target concept list (step S38), and sends a message to the user via the input / output interface 16 to the user terminal device. 2 (step S38).
When the communication interface 35 of the user terminal device 2 inputs a message, the control unit 31 causes the display device 33 to display the message as an in-document consistency check result (step S18).
Further, when there is no alarm list entry, the determination unit 17 may output a message “There is no concept of insufficient description”.

以上のように、本発明の第1の実施形態にしたがった文書データ処理装置では、入力文書データ中の例えば「症状」欄で記載が求められたと判定された概念に対して、リンク情報をもつ階層概念辞書と、当該階層概念辞書から関連概念と認識される概念の記載有無をチェックすることにより、記載が求められた概念ばかりでなく、その上位概念、下位概念、他のカテゴリでリンクにより関連付けられた概念などの記載も必要な情報を記載したと判定できる。よって、前述した「症状」欄と完全に同じ表現を用いずに必要な情報を記載した場合も、記載不足と誤判定することがない。   As described above, the document data processing apparatus according to the first embodiment of the present invention has link information for the concept determined to be described in, for example, the “symptom” column in the input document data. By checking whether the hierarchical concept dictionary and concepts recognized as related concepts from the hierarchical concept dictionary are described, not only the concepts that are required to be described, but also their higher-level concepts, lower-level concepts, and other categories are linked by links. It can be determined that the necessary information has also been described. Therefore, even if necessary information is described without using the completely same expression as the “symptom” column described above, it is not erroneously determined that the description is insufficient.

また、階層概念辞書上で関連付けられた情報が全く記載されていない場合には記載不足と判定できるので、文書データ作成時の不備の修正を支援することができ、ユーザによる文書データ作成の負荷を軽減することができる。   In addition, since it can be determined that the information associated with the hierarchical concept dictionary is not described at all, it can be determined that the description is insufficient, so that it is possible to support correction of deficiencies in document data creation, and the burden of document data creation by the user is reduced. Can be reduced.

また、階層概念辞書と表層表現辞書を個別に管理するため、図4に示した概念名「水漏れ」のように階層概念辞書中で複数回現れる概念の表層表現を修正する場合にも、表層表現の修正は表層表現辞書上の1行のみでよく、管理の負荷が軽減される。   Further, since the hierarchical concept dictionary and the surface expression dictionary are managed separately, the surface layer expression of a concept that appears multiple times in the hierarchical concept dictionary such as the concept name “water leak” shown in FIG. The correction of the expression is only one line on the surface expression dictionary, and the management load is reduced.

本実施形態では、階層概念管理部で管理される概念体系(カテゴリ)が2つである例を示したが、カテゴリの数は2に限定するものではなく、3以上であってもよい。
また、この発明は、対象を家電機器の故障修理に関する報告書に限らない。例えば、病院の検査レポートを対象とし、階層概念を「身体部位」「疾患」「検査・治療」などのカテゴリから構成し、検査目的欄に記載された疾患に対して、その疾患が関連する部位の検査結果を記載することで、必要な情報が記載されたと判定するように構成することも可能である。
In the present embodiment, an example is shown in which there are two concept systems (categories) managed by the hierarchical concept management unit. However, the number of categories is not limited to two, and may be three or more.
In addition, the present invention is not limited to a report related to repair of a home appliance failure. For example, for a hospital test report, the hierarchy concept is composed of categories such as “body part”, “disease”, and “examination / treatment”, and the part related to the disease described in the test purpose column It is also possible to configure so that it is determined that necessary information is described by describing the inspection result.

(第2の実施形態)
次に、本発明の第2の実施形態について説明する。なお、本実施形態に係る文書データ処理装置の構成のうち図1に示したものと同一部分の説明は省略する。
図14は、本発明の第2の実施形態にしたがった文書データ処理装置の構成例を示すブロック図である。
図14に示すように、本発明の第2の実施形態にしたがった文書データ処理装置は、第1の実施形態の構成に加え、記憶装置12は、階層概念体系の構成ルールを記憶する階層概念ルール記憶部41を有する。また、この階層概念体系構成ルールに従い階層概念体系を解析する階層概念解析部42を備える。
(Second Embodiment)
Next, a second embodiment of the present invention will be described. Note that the description of the same part of the configuration of the document data processing apparatus according to the present embodiment as shown in FIG. 1 is omitted.
FIG. 14 is a block diagram showing a configuration example of a document data processing apparatus according to the second embodiment of the present invention.
As shown in FIG. 14, the document data processing apparatus according to the second embodiment of the present invention has a hierarchical concept for storing the configuration rules of the hierarchical conceptual system in addition to the configuration of the first embodiment. A rule storage unit 41 is included. In addition, a hierarchical concept analysis unit 42 for analyzing the hierarchical conceptual system according to the hierarchical conceptual system configuration rules is provided.

階層概念ルール記憶部41に記憶される階層概念体系の構成ルールは、例えば、「同じカテゴリ内にリンクを付与しない」や「階層概念上の同じ枝に属する概念から別カテゴリの同じ枝に属する概念にリンクを付与しない。」である。例えば、階層概念辞書上のリンク付与に関して「同じカテゴリ内にリンクを付与しない」という構成ルールが設定されている場合、図4に示す階層概念辞書において、最上位概念が「部品」の行の間ではユーザ端末装置2への操作を行なってもリンク情報を付与できない。   The hierarchical concept system configuration rules stored in the hierarchical concept rule storage unit 41 include, for example, “no link is given in the same category” or “a concept belonging to the same branch in another category from a concept belonging to the same branch in the hierarchical concept” No link is given to ". For example, in the hierarchical concept dictionary shown in FIG. 4, when the configuration rule “do not give a link in the same category” is set with respect to the link assignment on the hierarchical concept dictionary, between the lines where the highest concept is “part” Then, even if the user terminal device 2 is operated, the link information cannot be given.

また、同じく階層概念辞書上のリンク付与に関して「階層概念上の同じ枝に属する概念から別カテゴリの同じ枝に属する概念にリンクを付与しない。」という構成ルールが設定されており、図4に示す階層概念辞書上でIDが「p2」である概念名「冷熱部品」とIDが「s4」である概念名「冷えない」の間にリンク情報が設定されている場合、IDが「p2」である概念名「冷熱部品」の下位概念「コンプレッサ」、とIDが「s4」である概念名「冷えない」の上位概念名、つまりIDが「s2」である概念名「動作時の異常症状」の間にはリンクを設定できない。
ここで、「階層概念上の同じ枝に属する概念」とは、お互いが上位概念・下位概念の関係になっている複数概念からなるグループを示す。
Similarly, with respect to link assignment in the hierarchical concept dictionary, a configuration rule is set that “a link is not given from a concept belonging to the same branch in the hierarchical concept to a concept belonging to the same branch in another category”, as shown in FIG. When link information is set between a concept name “cooling component” whose ID is “p2” and a concept name “not cool” whose ID is “s4” on the hierarchical concept dictionary, the ID is “p2”. A subordinate concept “compressor” of a certain concept name “cooling component”, and a superordinate concept name of a concept name “not cool” with ID “s4”, that is, a concept name “abnormal symptom during operation” with ID “s2”. No link can be set between
Here, the “concept belonging to the same branch on the hierarchical concept” indicates a group composed of a plurality of concepts that are in a relationship between a superordinate concept and a subordinate concept.

階層概念解析部42は、階層概念ルール記憶部41に記憶された階層概念体系の構成ルールに従って階層概念辞書をチェックし、構成ルールに反する部分を発見した場合に、ユーザ端末装置2の表示装置33にユーザ向けアラームを提示する。   The hierarchical concept analysis unit 42 checks the hierarchical concept dictionary in accordance with the configuration rules of the hierarchical concept system stored in the hierarchical concept rule storage unit 41, and when a portion that violates the configuration rules is found, the display device 33 of the user terminal device 2. Presents an alarm for the user.

階層概念解析部42は、例えば、IDが「p2」である概念名「冷熱部品」とIDが「s4」である概念名「冷えない」の間と、IDが「p3」である概念名コンプレッサ」とIDが「s2」である概念名動作時の異常症状」の間にそれぞれリンク情報が付与されている場合、「部品カテゴリ上の枝の2箇所から、症状カテゴリの同一の枝にリンクが設定されています。どちらかを削除してください。」とのメッセージと、階層概念上の該当箇所をユーザに提示するための提示対象の情報を入出力インタフェース16を介してユーザ端末装置2に出力する。   The hierarchical concept analysis unit 42, for example, between the concept name “cooling component” whose ID is “p2” and the concept name “not cool” whose ID is “s4” and the concept name compressor whose ID is “p3” ”And“ abnormal symptom at the time of operation of the concept name whose ID is “s2” ”, the link information is given to“ the same branch of the symptom category from two branches on the component category ”. "Please delete one of them." And output the information to be presented to the user terminal device 2 via the input / output interface 16 to present to the user the relevant part of the hierarchical concept. To do.

また、階層概念解析部42は、既に設定されたリンク情報から、さらに設定すべきリンクの候補を解析し、ユーザに提示する機能を有する。
例えば、図4の階層概念辞書上でID「p6」の概念名「ホース」とID「s11」の概念名「水漏れ」の間のリンク情報が付与されている場合、階層概念解析部42は、ID「s11」の概念名「水漏れ」と同じ概念名、つまりID「s14」の概念名「水漏れ」を階層概念辞書から抽出する。
Further, the hierarchical concept analysis unit 42 has a function of analyzing link candidates to be further set from link information that has already been set and presenting them to the user.
For example, when the link information between the concept name “hose” with ID “p6” and the concept name “water leak” with ID “s11” is given on the hierarchical concept dictionary in FIG. The concept name “water leak” of ID “s11”, that is, the concept name “water leak” of ID “s14” is extracted from the hierarchical concept dictionary.

そして階層概念解析部42は、前述したID「p6」の概念名「ホース」や当該概念名の上位概念・下位概念にリンクが付与されておらず、その組み合わせが階層概念ルール記憶部41でされる階層概念体系の構成ルールに反しない場合は、新たなリンク付与候補としてID「s14」の概念名「水漏れ」とID「p6」の概念名「ホース」の組み合わせをユーザに提示するために、提示用の情報を入出力インタフェース16を介してユーザ端末装置2に出力する。   The hierarchical concept analysis unit 42 does not give a link to the above-described concept name “hose” of the ID “p6” or the higher-order concept / lower-order concept of the concept name. In order to present a combination of the concept name “water leak” with ID “s14” and the concept name “hose” with ID “p6” to the user as a new link grant candidate. The information for presentation is output to the user terminal device 2 via the input / output interface 16.

また、階層概念解析部42は、概念名とその表層表現を解析し、同じ単語を含む概念の組み合わせを新たなリンク付与候補としてユーザに提示する。
例えば、階層概念解析部42は、図2に示した表層表現辞書上の概念名「回らない」の表層表現「回転しない」と、概念名「回転部品」及び当該概念名の表層表現は単語「回転」を含むので、その組み合わせが階層概念ルール記憶部41で管理される階層概念体系の構成ルールに反しない場合は、新たなリンク候補としてユーザに提示するために、提示用の情報を入出力インタフェース16を介してユーザ端末装置2に出力する。なお、概念名もしくは表層表現に含まれる単語を判定する処理は、公知技術である形態素解析により実施できる。
Further, the hierarchical concept analysis unit 42 analyzes the concept name and its surface layer expression, and presents a combination of concepts including the same word to the user as a new link grant candidate.
For example, the hierarchical concept analysis unit 42 displays the surface name “not rotate” of the concept name “does not rotate” on the surface expression dictionary shown in FIG. If the combination does not violate the composition rule of the hierarchical concept system managed by the hierarchical concept rule storage unit 41, input and output information for presentation is presented to the user as a new link candidate. The data is output to the user terminal device 2 via the interface 16. In addition, the process which determines the word contained in a concept name or surface expression can be implemented by the morphological analysis which is a well-known technique.

以上のように、本発明の第2の実施形態にしたがった文書データ処理装置では、作成済みの階層概念辞書を階層概念解析部42がチェックし、間違いを指摘するので、階層概念管理の負荷が軽減される。また、階層概念解析部42は、新たなリンク候補をユーザに提示するので、階層概念辞書の作成の負荷が軽減される。   As described above, in the document data processing apparatus according to the second embodiment of the present invention, the hierarchical concept analysis unit 42 checks the created hierarchical concept dictionary and points out an error. It is reduced. Further, since the hierarchical concept analysis unit 42 presents new link candidates to the user, the load of creating the hierarchical concept dictionary is reduced.

(第3の実施形態)
次に、本発明の第3の実施形態について説明する。なお、本実施形態に係る文書データ処理装置の構成のうち図1に示したものと同一部分の説明は省略する。
図15は、本発明の第3の実施形態にしたがった文書データ処理装置の構成例を示すブロック図である。
図15に示すように、本発明の第3の実施形態にしたがった文書データ処理装置は、第1の実施形態の構成に加え、表層表現に対応付けられる概念名に関わる構文解析を行う構文解析部52、概念抽出部13の出力から判定事項を抽出する判定事項抽出部53を備える。また、この第3の実施形態にしたがった文書データ処理装置は、第1の実施形態の構成と比較して概念選択部14および記載概念抽出部15を備えない。
(Third embodiment)
Next, a third embodiment of the present invention will be described. Note that the description of the same part of the configuration of the document data processing apparatus according to the present embodiment as shown in FIG. 1 is omitted.
FIG. 15 is a block diagram showing a configuration example of a document data processing apparatus according to the third embodiment of the present invention.
As shown in FIG. 15, the document data processing apparatus according to the third embodiment of the present invention, in addition to the configuration of the first embodiment, performs syntax analysis related to the concept name associated with the surface representation. A determination item extraction unit 53 that extracts a determination item from the output of the unit 52 and the concept extraction unit 13. Further, the document data processing apparatus according to the third embodiment does not include the concept selection unit 14 and the description concept extraction unit 15 as compared with the configuration of the first embodiment.

この第3の実施形態では、RCM(Risk Control Matrix)の記述の正当性をチェックする。
RCMの記述のチェックとは、業務プロセスが正しく遂行されていることを確認するために、業務ステップ毎に、誰が何を実行するか、その業務の責任者は誰か、関連する文書は何か、その業務ステップで発生する可能性があるリスクは何か、などを整理したRCMに不備が無いかをチェックするものである。
In the third embodiment, the validity of the description of the RCM (Risk Control Matrix) is checked.
Checking the description of the RCM is to confirm that the business process is executed correctly, who executes what at each business step, who is responsible for the business, what documents are relevant, This is to check whether there is any deficiency in the RCM that sorts out the risks that may occur in the business step.

文書データ処理装置1は、RCMの記述内容に不備がある場合は、その箇所に記載不備を指摘するアラームを表示するなどの処理をする。
本実施形態では、RCMとして、企業内において休暇申請と承認を行なう業務プロセスに関して記述された例を用いる。
When the description content of the RCM is deficient, the document data processing apparatus 1 performs processing such as displaying an alarm indicating the deficiency in the description.
In the present embodiment, an example described as a business process for applying and approving leave in a company is used as the RCM.

図16は、本発明の第3の実施形態にしたがった文書データ処理装置が管理する休暇取扱基準の一例を示す図である。
文書データ処理装置1の記憶装置12には、図16に示した休暇取扱基準の情報が記憶される。この休暇取扱基準は、企業内に存在する規程類の一種であり、企業内で休暇の申請と承認に関するルールが記される。
FIG. 16 is a diagram showing an example of a vacation handling standard managed by the document data processing apparatus according to the third embodiment of the present invention.
The storage device 12 of the document data processing apparatus 1 stores vacation handling standard information shown in FIG. This vacation handling standard is a kind of regulations existing in a company, and rules concerning leave application and approval are described in the company.

図17は、本発明の第3の実施形態にしたがった文書データ処理装置が管理する休暇取扱基準から導出される、申請者と承認者の関係の判定ルールを示した図である。
本実施形態では、判定ルールとして、図17に示した、申請者と承認者の関係の情報が判定ルール記憶部21に記憶される。
FIG. 17 is a diagram showing a determination rule for the relationship between the applicant and the approver, which is derived from the vacation handling standard managed by the document data processing apparatus according to the third embodiment of the present invention.
In the present embodiment, information on the relationship between the applicant and the approver shown in FIG. 17 is stored in the determination rule storage unit 21 as the determination rule.

A社では、図16に示すような休暇取扱基準が規程として定められている。この休暇取扱基準の記述内容を、休暇の申請者と承認者の観点で整理すると、図17のようになる。A社内で休暇申請処理を行なう際は、図17に示された条件を満たす必要がある。   In Company A, leave handling standards as shown in FIG. 16 are defined as regulations. The description contents of the vacation handling standard are arranged from the viewpoint of the vacation applicant and the approver as shown in FIG. When vacation application processing is performed in company A, the conditions shown in FIG. 17 must be satisfied.

図18は、本発明の第3の実施形態にしたがった文書データ処理装置が管理する階層概念の一例を示す図である。
本発明の第3の実施形態にしたがった文書データ処理装置は、図18に示したような階層概念を管理する。図18に示した階層概念は、企業内の、「規程」、「組織・役職」、「社内システム」という3つの概念体系を階層的に示したものである。
また、図18に示すように、第2の階層の概念名「組織構成」の下位の概念名「担当職」と、上位概念でも下位概念でもなく、同一項目であって、第2の階層の概念名「役職」の下位の概念名「担当職」とのリンク情報が記憶装置12に記憶されて管理される。
FIG. 18 is a diagram showing an example of a hierarchical concept managed by the document data processing apparatus according to the third embodiment of the present invention.
The document data processing apparatus according to the third embodiment of the present invention manages the hierarchical concept as shown in FIG. The hierarchical concept shown in FIG. 18 is a hierarchical representation of three conceptual systems in the company: “Regulations”, “Organization / Position”, and “In-house system”.
In addition, as shown in FIG. 18, the concept name “in charge” of the concept name “organization structure” of the second hierarchy is the same item, not the superordinate concept or the subordinate concept. Link information with the concept name “in charge” subordinate to the concept name “position” is stored in the storage device 12 and managed.

図19は、本発明の第3の実施形態にしたがった文書データ処理装置の記憶装置12に記憶される階層概念辞書の構成例を表形式で示す図である。
本発明の第3の実施形態にしたがった文書データ処理装置の階層概念辞書記憶部23には図19に示した構成の階層概念辞書が記憶される。この階層概念辞書は、図18に示した階層概念の、「規程」、「組織・役職」、「社内システム」の関係を階層化した辞書として表現した例である。
FIG. 19 is a diagram showing a configuration example of the hierarchical concept dictionary stored in the storage device 12 of the document data processing device according to the third embodiment of the present invention in a table format.
The hierarchical concept dictionary storage unit 23 of the document data processing apparatus according to the third embodiment of the present invention stores the hierarchical concept dictionary having the configuration shown in FIG. This hierarchical concept dictionary is an example in which the relationship of “rules”, “organization / post”, and “in-house system” in the hierarchical concept shown in FIG. 18 is expressed as a hierarchical dictionary.

図20は、本発明の第3の実施形態にしたがった文書データ処理装置1の記憶装置12に記憶される表層表現辞書の構成例を表形式で示す図である。
表層表現辞書記憶部22には図20に示した構成の表層表現辞書が記憶される。この表層表現辞書は、「規程」、「組織・役職」、「社内システム」内の概念名、概念分類、表層表現が関連付けられて管理される。
FIG. 20 is a diagram showing a configuration example of the surface layer expression dictionary stored in the storage device 12 of the document data processing apparatus 1 according to the third embodiment of the present invention in a table format.
The surface expression dictionary storage unit 22 stores the surface expression dictionary having the configuration shown in FIG. This surface expression dictionary is managed by associating concept names, concept classifications, and surface expression in “rules”, “organization / post”, and “in-house system”.

次に、本発明の第3の実施形態にしたがった文書データ処理装置1の処理動作について説明する。図21は、本発明の第3の実施形態にしたがった文書データ処理装置の処理動作の一例を示すフローチャートである。
図22は、本発明の第3の実施形態にしたがった文書データ処理装置が入力するRCMの一例を示す図である。ここではRCMは休暇申請と承認の方法について記述される。
Next, the processing operation of the document data processing apparatus 1 according to the third embodiment of the present invention will be described. FIG. 21 is a flowchart showing an example of the processing operation of the document data processing apparatus according to the third embodiment of the present invention.
FIG. 22 is a diagram showing an example of the RCM input by the document data processing apparatus according to the third embodiment of the present invention. Here, the RCM describes a leave application and approval method.

A社にあるB研究所では、自部門のリスク管理のために、ユーザ端末装置2の入力装置34に対する操作により図22に示した構成のRCMが作成される。このRCMが通信インタフェース35から文書データ処理装置1の入出力インタフェース16へ入力される。文書データ処理装置1の制御部11は入出力インタフェース16が入力した文書データを記憶装置12に記憶する(ステップS41)。   In the laboratory B in company A, an RCM having the configuration shown in FIG. 22 is created by operating the input device 34 of the user terminal device 2 for risk management of its own department. This RCM is input from the communication interface 35 to the input / output interface 16 of the document data processing apparatus 1. The control unit 11 of the document data processing apparatus 1 stores the document data input by the input / output interface 16 in the storage device 12 (step S41).

概念抽出部13は、表層表現辞書記憶部22に記憶された表層表現辞書を読み込む(ステップS42)。また、判定事項抽出部53と判定部17は、それぞれ、判定ルール記憶部21に記憶された判定ルールを読み込む(ステップS43)。構文解析部52は、入力文書データであるRCMの業務内容列の文章を、文単位で構文解析する(ステップS44)。   The concept extraction unit 13 reads the surface layer expression dictionary stored in the surface layer expression dictionary storage unit 22 (step S42). Moreover, the determination item extraction part 53 and the determination part 17 each read the determination rule memorize | stored in the determination rule memory | storage part 21 (step S43). The syntax analysis unit 52 parses the sentence in the business content sequence of the RCM, which is input document data, in sentence units (step S44).

図23は、図22に示したRCMのサブステップ番号「Step1-01」が関わる行の「業務内容」の列に記載された文章中の第3文の構文解析を行った結果の例である。図23中で、サブステップ番号「Step1-01」が関わる行の「業務内容」の列に記載された文章中の第3文は文節に分割されている。   FIG. 23 is an example of a result of a syntactic analysis of the third sentence in the sentence described in the column of “work contents” in the row related to the sub step number “Step 1-01” of the RCM shown in FIG. . In FIG. 23, the third sentence in the sentence described in the column of “work contents” in the row related to the sub step number “Step 1-01” is divided into clauses.

図23中で実線で接続された文節の組み合わせは、係り受けの関係があると判定されたものである。概念抽出部13は、ステップS42の処理で読み込んだ表層表現辞書を用い、構文解析結果を解析することで、例えば図22に示したRCMのサブステップ番号「Step1-01」が関わる行の「業務内容」の列に記述された文章中の第3文の構文解析結果から、表層表現辞書の表層表現と一致する「研究主務」「ラボ長」「ラボ長」「SM」を、業務に関わる役職名やそれに準ずる表現として抽出し、これらの表層表現に当該表層表現辞書で対応する概念名を付与する(ステップS45)。
図24は、図22に示したRCMのサブステップ番号「Step1-01」が関わる行の「業務内容」の列に記述された文章中の第3文の構文解析結果に、概念名を付与した結果の例である。
判定事項抽出部53は、ステップS43の処理で読み込んだ判定ルールにしたがって、概念抽出部13の出力から判定事項を抽出する(ステップS46)。図17に示す判定ルールでは、登録された2つのルールで、それぞれ、「承認者」と「申請者」の関係が決められている。この判定ルールにしたがい、判定事項抽出部53は、概念抽出部13の出力で、「承認者」もしくは「申請者」が係り受けしている表層表現に関連付けられた概念名を取得する。
In FIG. 23, combinations of clauses connected by a solid line are determined to have a dependency relationship. The concept extraction unit 13 analyzes the syntax analysis result by using the surface expression dictionary read in the process of step S42, so that, for example, the “business” of the row related to the substep number “Step1-01” of the RCM shown in FIG. From the parsing result of the third sentence in the sentence described in the “Content” column, the “Research Director”, “Lab Director”, “Lab Director” and “SM” that match the surface expression of the surface expression dictionary are assigned to the positions related to the work. Names and expressions corresponding to the names are extracted, and corresponding surface names are given to these surface layer expressions in the surface layer expression dictionary (step S45).
In FIG. 24, a concept name is given to the parsing result of the third sentence in the sentence described in the column of “work contents” in the row related to the sub step number “Step1-01” of the RCM shown in FIG. It is an example of a result.
The determination item extraction unit 53 extracts the determination item from the output of the concept extraction unit 13 according to the determination rule read in the process of step S43 (step S46). In the determination rule shown in FIG. 17, the relationship between “approver” and “applicant” is determined by the two registered rules. In accordance with this determination rule, the determination item extraction unit 53 acquires the concept name associated with the surface expression on which the “approver” or “applicant” is dependent on the output of the concept extraction unit 13.

図24に示す概念抽出結果、つまり図22に示したRCMのサブステップ番号「Step1-01」が関わる行の「業務内容」の列に記述された文章中の第3文の概念抽出結果からは、第一の申請者として表層表現「研究主務」かつ概念名「主任」、第一の承認者として表層表現「ラボ長」かつ概念名「研究室長」、第二の申請者として表層表現「ラボ長」かつ概念名「研究室長」、第二の承認者として表層表現「SM」かつ概念名「研究部長」が抽出される。   From the concept extraction result shown in FIG. 24, that is, from the concept extraction result of the third sentence in the sentence described in the column of “work contents” in the row related to the sub step number “Step1-01” of RCM shown in FIG. , Surface expression “Research Director” and concept name “Principal” as first applicant, surface expression “Lab Director” and concept name “Lab Director” as first approver, surface expression “Lab” as second applicant "Super chief" and concept name "Laboratory head", and surface expression "SM" and concept name "Research manager" are extracted as the second approver.

判定事項抽出部53は、さらに、抽出した申請者、承認者の組み合わせを判定する。この判定は、例えば、第一の申請者と組み合わせる承認者は、図24に示す概念抽出結果で最も文節間の距離が近い、すなわち、文節間を接続する実線の数が少なくて到達できる第一の承認者を判定することで行う。   The determination item extraction unit 53 further determines the combination of the extracted applicant and approver. For example, the approver combined with the first applicant is the first one that can be reached with the shortest distance between phrases in the concept extraction result shown in FIG. 24, that is, the number of solid lines connecting the phrases is small. This is done by determining the approver.

この組み合わせ判定により、図24に示す概念抽出結果から、図25の第1行および第2行に示す2組の判定事項が抽出される。さらに、図22に示したRCMのサブステップ番号「Step1-02」の行の業務内容の列に対して同様の構文解析及び概念抽出及び判定事項抽出処理を行うことで、図25の第3行に示す判定事項が抽出される。   By this combination determination, two sets of determination items shown in the first row and the second row in FIG. 25 are extracted from the concept extraction result shown in FIG. Further, by performing similar syntax analysis, concept extraction, and judgment item extraction processing on the column of business contents in the row of the RCM substep number “Step 1-02” shown in FIG. 22, the third row of FIG. The judgment items shown in are extracted.

判定部17は、図19に示した階層概念辞書を読み込む(ステップS47)。また、判定部17は、図25に示す判定事項抽出結果リストを1行ずつ取り出し、この判定事項抽出結果リストの選択行の、申請者概念名と承認者概念名の関係をチェックする(ステップS48)。
判定部17は、図25の判定事項抽出結果リストの第1行の処理にあたっては、階層概念辞書における概念名のうち、申請者および承認者に関わる概念名「主任」、「研究室長」が関わる行に着目する。
The determination unit 17 reads the hierarchical concept dictionary shown in FIG. 19 (step S47). Further, the determination unit 17 extracts the determination item extraction result list shown in FIG. 25 line by line, and checks the relationship between the applicant concept name and the approver concept name in the selected row of the determination item extraction result list (step S48). ).
In the processing of the first row of the determination matter extraction result list in FIG. 25, the determination unit 17 includes the concept names “chief” and “lab manager” related to the applicant and the approver among the concept names in the hierarchical concept dictionary. Focus on the line.

判定部17は、図19に示した階層概念辞書上のID「s25」の概念名「主任」は上位のID「s15」の概念名「役職」に関する階層定義であり、当該概念名「主任」の1つ上の上位概念名がID「s24」の「担当職」であることから、主任が「担当職」であると判定する。
また、判定部17は、主任が所属する組織の管理者が誰かを知るために、前述したリンク情報により関連付けられる同一項目名であって、ID「s14」の概念名「担当職」に着目し、これは上位のID「s2」の概念名「組織構成」に関する階層定義であり、当該概念名「担当職」の1つ上の上位概念名はID「s13」の概念名「研究室長」であると判別する。
In the determination unit 17, the concept name “chief” of the ID “s25” on the hierarchical concept dictionary shown in FIG. 19 is a hierarchy definition regarding the concept name “position” of the higher-level ID “s15”, and the concept name “chief” Since the superordinate concept name one above is “in charge” with ID “s24”, it is determined that the chief is “in charge”.
In addition, the determination unit 17 pays attention to the concept name “in charge” of the ID “s14”, which is the same item name associated with the above-described link information in order to know who the administrator of the organization to which the chief belongs. This is a hierarchical definition related to the concept name “organization structure” of the higher-level ID “s2”, and the higher-level concept name immediately above the concept name “in charge” is the concept name “laboratory” of the ID “s13”. Determine that there is.

判定部17は、ステップS43の処理で読み込んだ、判定ルール記憶部21に記憶された判定ルールにしたがい、入力したRCM中の解析箇所に記述された申請者および承認者に関わる概念名「主任」、「研究室長」に対応する当該RCM中の表現の関係が判定ルールに合致するか否かを判定する(ステップS49)。
ステップS49の処理として、具体的には、判定部17は図19に示した階層概念辞書上のID「s25」の概念名「主任」はID「s13」の概念名「研究室長」の下位概念名であり、概念名「主任」に対応するRCM中の表現が申請者「研究主務」であり、概念名「研究室長」に対応するRCM中の表現が申請者「ラボ長」であると判定する。
The determination unit 17 follows the determination rule stored in the determination rule storage unit 21 read in the process of step S43, and the concept name “chief” related to the applicant and the approver described in the analysis location in the input RCM. Then, it is determined whether or not the expression relationship in the RCM corresponding to the “laboratory manager” matches the determination rule (step S49).
Specifically, in step S49, the determination unit 17 uses the concept name “chief” of the ID “s25” on the hierarchical concept dictionary shown in FIG. 19 as the subordinate concept of the concept name “laboratory” of the ID “s13”. The expression in the RCM corresponding to the concept name “chief” is the applicant “Research Director”, and the expression in the RCM corresponding to the concept name “Laboratory” is the applicant “Lab Director” To do.

そして、判定部17は、RCM中の解析箇所の表現である承認者「ラボ長」は申請者「研究主務」が所属する組織の管理者であって、判定ルールに合致すると判定する。よって、判定部17は、RCM中の解析箇所の表現である第1の申請者「研究主務」および当該申請者の承認者「ラボ長」の記述は正しいと判定する(ステップS49のYES)。この場合にはアラームが出力されることなく処理が終了し、判定事項抽出結果リストの次の行の処理に移る(ステップS51)。   Then, the determination unit 17 determines that the approver “lab director”, who is the expression of the analysis location in the RCM, is an administrator of the organization to which the applicant “research supervisor” belongs and matches the determination rule. Therefore, the determination unit 17 determines that the descriptions of the first applicant “Research Director” and the applicant's approver “Lab Director”, which are expressions of the analysis location in the RCM, are correct (YES in Step S49). In this case, the process ends without outputting an alarm, and the process proceeds to the next line in the determination item extraction result list (step S51).

判定部17は、図25に示した判定事項抽出結果リスト第2行に記載された、RCM中の解析箇所の表現のもう一つの組み合わせである、第2の申請者「ラボ長」と承認者「SM」の関係も表層表現辞書と階層概念辞書を用いることにより、同様に正しい記述であると判定できる。   The determination unit 17 includes the second applicant “Lab Director” and the approver, which is another combination of the expression of the analysis part in the RCM described in the second line of the determination item extraction result list shown in FIG. Similarly, the relationship of “SM” can be determined to be a correct description by using the surface expression dictionary and the hierarchical concept dictionary.

一方、図25に示した判定事項抽出結果リスト第3行に記載された、別の業務内容である、図22に示したRCMのサブステップ番号「Step1-02」の行の業務内容の列においては、申請者「SM」と承認者「ラボ長」の組み合わせが記述されている。判定部17は、判定事項抽出結果リストの記載内容から、これらの記述を申請者「研究部長」と承認者「研究室長」に読み替える。   On the other hand, in the column of the business content in the row of the RCM substep number “Step1-02” shown in FIG. 22, which is another business content described in the third row of the judgment item extraction result list shown in FIG. 25. Describes the combination of the applicant “SM” and the approver “lab director”. The determination unit 17 replaces these descriptions with the applicant “Research Department Manager” and the approver “Research Department Manager” based on the contents of the determination item extraction result list.

判定部17は、図19に示した階層概念辞書の概念名のうち、前述したように表層表現を読み替えた概念名であるID「s12」の概念名「研究部長」を参照し、1階層上の概念名はID「s9」の「研究所長」であり、前述したように読み替えたID「s13」概念名「研究室長」は1階層下の概念名であると判別する。   The determination unit 17 refers to the concept name “Research Manager” of the ID “s12”, which is the concept name obtained by replacing the surface expression as described above, among the concept names in the hierarchical concept dictionary shown in FIG. Is the “laboratory head” of ID “s9”, and the ID “s13” concept name “laboratory head” read as described above is determined to be a concept name one level below.

よって、RCMの記述内容である申請者「SM」は承認者「ラボ長」が所属する組織の管理者であるので、判定ルールに合致していないと判定する。よって、判定部17は、RCMチェック結果として、図22に示したRCMのサブステップ番号「Step1-02」の行の業務内容の欄に記述不備のアラームを表示する指示信号を入出力インタフェース16を介してユーザ端末装置2に出力する。   Therefore, since the applicant “SM”, which is the description content of the RCM, is an administrator of the organization to which the approver “lab manager” belongs, it is determined that it does not match the determination rule. Therefore, the determination unit 17 sends an instruction signal for displaying an incomplete description alarm in the column of business contents in the row of the substep number “Step 1-02” of the RCM shown in FIG. To the user terminal device 2.

図25は、本発明の第3の実施形態にしたがった文書データ処理装置が入力したRCMにアラームを付した例を示す図である。
この指示信号をユーザ端末装置2の通信インタフェース35が入力すると、制御部31は、入力文書データであるRCMのサブステップ番号「Step1-02」の行の業務内容の欄に記述不備のアラームのウインドウを付した画面を表示装置33に表示させる(ステップS50)。
FIG. 25 is a diagram showing an example in which an alarm is added to the RCM input by the document data processing apparatus according to the third embodiment of the present invention.
When the communication interface 35 of the user terminal device 2 inputs this instruction signal, the control unit 31 displays an incompletely described alarm window in the business content column in the line of the sub step number “Step 1-02” of the RCM that is the input document data. Is displayed on the display device 33 (step S50).

以上のように、本発明の第3の実施形態にしたがった文書データ処理装置では入力文書データがRCMである場合に、表層表現辞書や階層概念辞書を活用することにより、RCMの記述内容の不備の有無をチェックすることができる。   As described above, in the document data processing apparatus according to the third embodiment of the present invention, when the input document data is the RCM, the description contents of the RCM are incomplete by utilizing the surface expression dictionary and the hierarchical concept dictionary. The presence or absence can be checked.

なお、この発明は前記実施形態そのままに限定されるものではなく実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、前記実施形態に開示されている複数の構成要素の適宜な組み合わせにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を省略してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。   The present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. Various inventions can be formed by appropriately combining a plurality of constituent elements disclosed in the embodiment. For example, some components may be omitted from all the components shown in the embodiment. Furthermore, you may combine suitably the component covering different embodiment.

本発明の第1の実施形態にしたがった文書データ処理装置の構成例を示すブロック図。1 is a block diagram showing a configuration example of a document data processing apparatus according to a first embodiment of the present invention. 本発明の第1の実施形態にしたがった文書データ処理装置の記憶装置に記憶される表層表現辞書の構成例を表形式で示す図。The figure which shows the structural example of the surface layer expression dictionary memorize | stored in the memory | storage device of the document data processing apparatus according to the 1st Embodiment of this invention in a table format. 本発明の第1の実施形態にしたがった文書データ処理装置が管理する階層概念の一例を示す図。The figure which shows an example of the hierarchy concept which the document data processing apparatus according to the 1st Embodiment of this invention manages. 本発明の第1の実施形態にしたがった文書データ処理装置の記憶装置に記憶される階層概念辞書の一例を表形式で示す図。The figure which shows an example of the hierarchy concept dictionary memorize | stored in the memory | storage device of the document data processing apparatus according to the 1st Embodiment of this invention. 本発明の第1の実施形態にしたがったユーザ端末装置の構成例を示すブロック図。The block diagram which shows the structural example of the user terminal device according to the 1st Embodiment of this invention. 本発明の第1の実施形態にしたがった文書データ処理装置の処理動作の一例を示すフローチャート。6 is a flowchart illustrating an example of a processing operation of the document data processing apparatus according to the first embodiment of the present invention. 本発明の第1の実施形態にしたがった文書データ処理装置に入力される入力文書データの構成例を示す図。FIG. 5 is a diagram showing a configuration example of input document data input to the document data processing apparatus according to the first embodiment of the present invention. 本発明の第1の実施形態にしたがった文書データ処理装置の途中出力である報告内容欄チェック用辞書の一例を示す図。The figure which shows an example of the dictionary for the report content column check which is the middle output of the document data processing apparatus according to the 1st Embodiment of this invention. 本発明の第1の実施形態にしたがった文書データ処理装置の途中出力である報告内容欄チェック結果の一例を示す図。The figure which shows an example of the report content column check result which is the middle output of the document data processing apparatus according to the 1st Embodiment of this invention. 本発明の第1の実施形態にしたがった文書データ処理装置の判定部の処理動作の一例を示すフローチャート。6 is a flowchart illustrating an example of a processing operation of a determination unit of the document data processing apparatus according to the first embodiment of the present invention. 本発明の第1の実施形態にしたがった文書データ処理装置の途中出力であるチェック対象概念リストの一例を示す図。The figure which shows an example of the check object concept list | wrist which is the middle output of the document data processing apparatus according to the 1st Embodiment of this invention. 本発明の実施形態にしたがった文書データ処理装置の途中出力である記載有無情報を付与した階層概念辞書の一例を示す図。The figure which shows an example of the hierarchy concept dictionary which provided the description presence information which is the middle output of the document data processing apparatus according to embodiment of this invention. 本発明の第1の実施形態にしたがった文書データ処理装置の途中出力である関連概念リストの一例を示す図。The figure which shows an example of the related concept list | wrist which is the middle output of the document data processing apparatus according to the 1st Embodiment of this invention. 本発明の第2の実施形態にしたがった文書データ処理装置の構成例を示すブロック図。The block diagram which shows the structural example of the document data processing apparatus according to the 2nd Embodiment of this invention. 本発明の第3の実施形態にしたがった文書データ処理装置の構成例を示すブロック図。The block diagram which shows the structural example of the document data processing apparatus according to the 3rd Embodiment of this invention. 本発明の第3の実施形態にしたがった文書データ処理装置が管理する休暇取扱基準の一例を示す図。The figure which shows an example of the vacation handling standard which the document data processing apparatus according to the 3rd Embodiment of this invention manages. 本発明の第3の実施形態にしたがった文書データ処理装置が管理する休暇取扱基準から導出される、申請者と承認者の関係の判定ルールを示した図。The figure which showed the determination rule of the relationship between an applicant and an approver derived | led-out from the vacation handling reference | standard managed by the document data processing apparatus according to the 3rd Embodiment of this invention. 本発明の第3の実施形態にしたがった文書データ処理装置が入力するRCMの一例を示す図。FIG. 10 is a diagram showing an example of an RCM input by a document data processing apparatus according to the third embodiment of the present invention. 本発明の第3の実施形態にしたがった文書データ処理装置の記憶装置に記憶される階層概念辞書の構成例を表形式で示す図。The figure which shows the structural example of the hierarchy concept dictionary memorize | stored in the memory | storage device of the document data processing apparatus according to the 3rd Embodiment of this invention with a table format. 本発明の第3の実施形態にしたがった文書データ処理装置の記憶装置に記憶される表層表現辞書の構成例を表形式で示す図。The figure which shows the structural example of the surface layer expression dictionary memorize | stored in the memory | storage device of the document data processing apparatus according to the 3rd Embodiment of this invention in a table format. 本発明の第3の実施形態にしたがった文書データ処理装置の処理動作の一例を示すフローチャート。10 is a flowchart showing an example of processing operation of the document data processing apparatus according to the third embodiment of the present invention. 本発明の第3の実施形態にしたがった文書データ処理装置が入力するRCMの一例を示す図。FIG. 10 is a diagram showing an example of an RCM input by a document data processing apparatus according to the third embodiment of the present invention. 本発明の第3の実施形態にしたがった文書データ処理装置の途中出力である構文解析部の途中出力の一例を示す図。The figure which shows an example of the halfway output of the syntax analysis part which is the halfway output of the document data processing apparatus according to the 3rd Embodiment of this invention. 本発明の第3の実施形態にしたがった文書データ処理装置の途中出力である構文解析部の出力の一例を示す図。The figure which shows an example of the output of the syntax analysis part which is the middle output of the document data processing apparatus according to the 3rd Embodiment of this invention. 本発明の第3の実施形態にしたがった文書データ処理装置の途中出力である判定事項抽出結果の一例を示す図。The figure which shows an example of the determination matter extraction result which is the middle output of the document data processing apparatus according to the 3rd Embodiment of this invention. 本発明の第3の実施形態にしたがった文書データ処理装置が入力したRCMにアラームを付した例を示す図。The figure which shows the example which attached | subjected the alarm to RCM which the document data processing apparatus according to the 3rd Embodiment of this invention input.

符号の説明Explanation of symbols

1…文書データ処理装置、2…ユーザ端末装置、11,31…制御部、12,32…記憶装置、13…概念抽出部、14…概念選択部、15…記載概念抽出部、16…入出力インタフェース、17…判定部、18,36…バス、21…判定ルール記憶部、22…表層表現辞書記憶部、23…階層概念辞書記憶部、33…表示装置、34…入力装置、35…通信インタフェース、52…構文解析部、53…判定事項抽出部。   DESCRIPTION OF SYMBOLS 1 ... Document data processing apparatus, 2 ... User terminal device, 11, 31 ... Control part, 12, 32 ... Memory | storage device, 13 ... Concept extraction part, 14 ... Concept selection part, 15 ... Description concept extraction part, 16 ... Input / output Interface: 17: Determination unit, 18, 36: Bus, 21: Determination rule storage unit, 22: Surface expression dictionary storage unit, 23: Hierarchical concept dictionary storage unit, 33: Display device, 34: Input device, 35: Communication interface 52 ... Syntax analysis unit, 53 ... Determination item extraction unit.

Claims (4)

文書データを入力する入力手段と、
概念名および当該概念名の表層表現を対応付けた表層表現辞書を記憶する表層表現記憶手段と、
概念名の体系情報および、前記概念名のうち第1の概念名と当該第1の概念名の上位概念名や下位概念名でなく当該第1の概念名に対応する表現とともに前記文書データ中に含まれるべき表現に対応する第2の概念名とのリンク情報を含む階層概念辞書を記憶する階層概念記憶手段と、
前記入力手段により入力した文書データ中の第1の表現に関わる表層表現に対応付けられる概念名を前記表層表現辞書から抽出する第1の抽出手段と、
前記入力した文書データ中に前記第1の表現とともに記述される第2の表現に関わる表層表現に対応付けられる概念名を前記表層表現辞書から抽出する第2の抽出手段と、
前記階層概念辞書の体系情報およびリンク情報をもとに、前記第1の抽出手段により抽出した概念名の関連概念名を抽出する第3の抽出手段と、
前記関連概念名に前記第2の抽出手段により抽出した概念名が含まれていない場合に、前記入力した文書データ中に前記第1の表現とともに記述されるべき表現が不足していると判定する判定手段と
を備えたことを特徴とする文書データ処理装置。
An input means for inputting document data;
A surface expression storage unit for storing a surface expression dictionary in which a concept name and a surface expression of the concept name are associated with each other;
In the document data, the system information of the concept name and the expression corresponding to the first concept name, not the first concept name and the upper concept name or the lower concept name of the first concept name. Hierarchical concept storage means for storing a hierarchical concept dictionary including link information with a second concept name corresponding to an expression to be included;
First extraction means for extracting from the surface expression dictionary a concept name associated with the surface expression related to the first expression in the document data input by the input means;
Second extraction means for extracting a concept name associated with a surface expression related to a second expression described together with the first expression in the input document data from the surface expression dictionary;
Third extraction means for extracting a related concept name of the concept name extracted by the first extraction means based on system information and link information of the hierarchical concept dictionary;
When the related concept name does not include the concept name extracted by the second extraction means, it is determined that the input document data lacks an expression to be described together with the first expression A document data processing apparatus comprising: a determination unit.
前記リンク情報の構成条件を定めた構成条件定義手段と、
前記構成条件をもとに、前記階層概念辞書のリンク情報の構成の正当性を判定するリンク情報判定手段と
をさらに備えたことを特徴とする請求項1に記載の文書データ処理装置。
A configuration condition defining means for defining a configuration condition of the link information;
The document data processing apparatus according to claim 1, further comprising: a link information determination unit that determines the validity of the configuration of link information of the hierarchical concept dictionary based on the configuration condition.
前記リンク情報の構成条件を定めた構成条件定義手段と、
前記構成条件をもとに、前記階層概念記憶手段に記憶される階層概念辞書の概念のうち新たに前記リンク情報に関わるべき概念かどうかを判定するリンク情報判定手段と
をさらに備えたことを特徴とする請求項1に記載の文書データ処理装置。
A configuration condition defining means for defining a configuration condition of the link information;
Link information determination means for determining whether or not the concept of the hierarchical concept dictionary stored in the hierarchical concept storage means is a new concept related to the link information based on the configuration condition. The document data processing apparatus according to claim 1.
事業活動のリスク低減のための管理内容を含む文書データを入力する入力手段と、
概念名および当該概念名の表層表現を対応付けた表層表現辞書を記憶する表層表現記憶手段と、
概念名の体系情報および、前記概念名のうち第1の概念名と当該第1の概念名の上位概念名や下位概念名でない第2の概念名とのリンク情報を含む階層概念辞書を記憶する階層概念記憶手段と、
前記入力した文書データ中の文章の構文解析を行う構文解析部と、
前記構文解析部の出力中の当該文書データの記述の正当性の判定材料となる複数の表現に関わる表層表現に対応付けられる概念名を前記表層表現辞書から抽出する抽出手段と、
前記抽出手段により抽出した概念同士の関係を判定事項として抽出する判定事項抽出部と、
前記階層概念辞書の体系情報およびリンク情報をもとに、前記判定事項抽出手段により抽出した概念名同士の関係が所定の条件を満たさない場合に前記入力した文書データ中の記述が正しくないと判定する判定手段と
を備えたことを特徴とする文書データ処理装置。
An input means for inputting document data including management contents for risk reduction of business activities;
A surface expression storage unit for storing a surface expression dictionary in which a concept name and a surface expression of the concept name are associated with each other;
A hierarchical concept dictionary including system information of concept names and link information between a first concept name of the concept names and a second concept name that is not a higher concept name or a lower concept name of the first concept name is stored. Hierarchical concept storage means;
A syntax analysis unit that performs syntax analysis of sentences in the input document data;
Extraction means for extracting from the surface expression dictionary a concept name associated with a surface expression related to a plurality of expressions that serve as a material for determining the validity of the description of the document data being output from the parsing unit;
A determination item extraction unit that extracts a relationship between concepts extracted by the extraction unit as a determination item;
Based on system information and link information of the hierarchical concept dictionary, it is determined that the description in the input document data is not correct when the relationship between the concept names extracted by the determination item extraction unit does not satisfy a predetermined condition And a document data processing apparatus.
JP2007283722A 2007-10-31 2007-10-31 Document data processing device Expired - Fee Related JP4672714B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007283722A JP4672714B2 (en) 2007-10-31 2007-10-31 Document data processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007283722A JP4672714B2 (en) 2007-10-31 2007-10-31 Document data processing device

Publications (2)

Publication Number Publication Date
JP2009110405A true JP2009110405A (en) 2009-05-21
JP4672714B2 JP4672714B2 (en) 2011-04-20

Family

ID=40778805

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007283722A Expired - Fee Related JP4672714B2 (en) 2007-10-31 2007-10-31 Document data processing device

Country Status (1)

Country Link
JP (1) JP4672714B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015194140A1 (en) * 2014-06-18 2015-12-23 日本電気株式会社 Document data processing device, document data processing method, and recording medium
JP2017187898A (en) * 2016-04-04 2017-10-12 株式会社東芝 Information processing device, information processing method and program
CN111971754A (en) * 2018-05-29 2020-11-20 株式会社日立制作所 Medical information processing apparatus, medical information processing method, and storage medium

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6325764A (en) * 1986-07-18 1988-02-03 Matsushita Electric Ind Co Ltd Documentation device
JPH07210546A (en) * 1995-01-27 1995-08-11 Hitachi Ltd Document preparing device
JPH10116287A (en) * 1997-11-11 1998-05-06 Nec Corp Natural language dialog device
JP2006350750A (en) * 2005-06-17 2006-12-28 Fujitsu Ltd Green procurement device and green procurement processing program

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6325764A (en) * 1986-07-18 1988-02-03 Matsushita Electric Ind Co Ltd Documentation device
JPH07210546A (en) * 1995-01-27 1995-08-11 Hitachi Ltd Document preparing device
JPH10116287A (en) * 1997-11-11 1998-05-06 Nec Corp Natural language dialog device
JP2006350750A (en) * 2005-06-17 2006-12-28 Fujitsu Ltd Green procurement device and green procurement processing program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015194140A1 (en) * 2014-06-18 2015-12-23 日本電気株式会社 Document data processing device, document data processing method, and recording medium
JP2017187898A (en) * 2016-04-04 2017-10-12 株式会社東芝 Information processing device, information processing method and program
CN111971754A (en) * 2018-05-29 2020-11-20 株式会社日立制作所 Medical information processing apparatus, medical information processing method, and storage medium
CN111971754B (en) * 2018-05-29 2023-09-29 株式会社日立制作所 Medical information processing device, medical information processing method, and storage medium

Also Published As

Publication number Publication date
JP4672714B2 (en) 2011-04-20

Similar Documents

Publication Publication Date Title
CN104871136B (en) Real-time online technical support
US8214383B2 (en) Mixed mode (mechanical process and english text) query building support for improving the process of building queries correctly
US20100106547A1 (en) Automated workflow generation
Burge et al. An integrated approach for software design checking using design rationale
Piasecki et al. WordNetLoom: a WordNet development system integrating form-based and graph-based perspectives
JP4672714B2 (en) Document data processing device
US9952962B2 (en) Increasing accuracy of traceability links and structured data
JP5747698B2 (en) Requirements management support device
Harolds Quality and safety in healthcare, part XC: the A3 approach and Lean in healthcare
US20090228794A1 (en) Business specification comprehension assistance system and method
Soliman et al. A tentative integration of value stream mapping (VSM) and BPMN for improved process mapping
US10832809B2 (en) Case management model processing
JP2000200308A (en) Project management method, project management system and recording medium
US20070220439A1 (en) Information Management Device
JP6775740B1 (en) Design support device, design support method and design support program
JP2010128870A (en) Data processor
Wallace et al. Explanations for whom
JP6562850B2 (en) Difference analysis apparatus, difference analysis method, and difference analysis program
Jikeli et al. Antisemitic messages? a guide to high-quality annotation and a labeled dataset of tweets
JP5308991B2 (en) Maintenance work plan support method and system
US20130093645A1 (en) Computer-readable recording medium, apparatus, and method for creating setting information
Pigola et al. Innovative behaviors: A survey about their associated effects in a dynamic environment
JP6603461B2 (en) Work procedure table creation support program, method and apparatus
De Paula et al. Using an interaction model to support communication among HCI design team members from multidisciplinary backgrounds
CN103679328B (en) Level in refinement object-oriented model

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100706

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100906

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101221

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110119

R150 Certificate of patent or registration of utility model

Ref document number: 4672714

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140128

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees