JP5535270B2 - Document component analysis apparatus and program - Google Patents

Document component analysis apparatus and program Download PDF

Info

Publication number
JP5535270B2
JP5535270B2 JP2012102847A JP2012102847A JP5535270B2 JP 5535270 B2 JP5535270 B2 JP 5535270B2 JP 2012102847 A JP2012102847 A JP 2012102847A JP 2012102847 A JP2012102847 A JP 2012102847A JP 5535270 B2 JP5535270 B2 JP 5535270B2
Authority
JP
Japan
Prior art keywords
viewpoint
document
character string
component matrix
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012102847A
Other languages
Japanese (ja)
Other versions
JP2013232058A (en
Inventor
政久 篠崎
万里 位野木
敏行 加納
貴之 北川
隼人 木村
恭子 牧野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2012102847A priority Critical patent/JP5535270B2/en
Priority to PCT/JP2013/062432 priority patent/WO2013162011A1/en
Publication of JP2013232058A publication Critical patent/JP2013232058A/en
Application granted granted Critical
Publication of JP5535270B2 publication Critical patent/JP5535270B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/131Fragmentation of text files, e.g. creating reusable text-blocks; Linking to fragments, e.g. using XInclude; Namespaces

Description

本発明の実施形態は、文書成分分析装置およびプログラムに関する。   Embodiments described herein relate generally to a document component analysis apparatus and a program.

一般的に、例えばシステム開発等のプロジェクトの内容が記述された文書(ドキュメント)が作成された場合、当該作成された文書の内容を評価者が確認することによって、当該文書を評価することが行われている。   In general, when a document (document) in which the contents of a project such as system development is described is created, the evaluator confirms the contents of the created document so that the document can be evaluated. It has been broken.

この場合、評価者は、文書の全てに目を通し、当該文書が予め定められている基準または標準に沿っているかを確認する必要がある。   In this case, the evaluator needs to read through all of the documents and check whether the documents conform to a predetermined standard or standard.

特開2011−186762号公報JP 2011-186762 A 特開平11−288414号公報Japanese Patent Laid-Open No. 11-288414

上記した評価者による文書の評価は、網羅性(基準または標準が全て記述されているか)および記述量(十分な量の記述があるか)の観点で行わなければならず、多くの時間が必要となる。また、文書の記述量が多いような場合、評価者が文書の内容を全て把握するために、より多くの時間を費やす必要がある。   The evaluation of the document by the evaluator described above must be performed from the viewpoint of completeness (whether all the standards or standards are described) and the amount of description (whether there is a sufficient amount of description), and requires a lot of time. It becomes. Further, when there is a large amount of document description, it is necessary for the evaluator to spend more time in order to grasp all the contents of the document.

そこで、本発明が解決しようとする課題は、評価者による文書の評価を支援することが可能な文書成分分析装置およびプログラムを提供することにある。   Therefore, a problem to be solved by the present invention is to provide a document component analysis apparatus and program capable of supporting evaluation of a document by an evaluator.

実施形態に係る文書成分分析装置は、観点情報格納手段と、文書入力手段と、特定手段と、決定手段と、生成手段と、提示手段とを具備する。   The document component analysis apparatus according to the embodiment includes viewpoint information storage means, document input means, identification means, determination means, generation means, and presentation means.

観点情報格納手段は、予め定められている基準または標準として文書に記述すべき項目を表す第1の文字列および当該第1の文字列より詳細な項目を表す第2の文字列を対応づけて格納する。   The viewpoint information storage means associates a first character string representing an item to be described in the document as a predetermined reference or standard and a second character string representing an item more detailed than the first character string. Store.

文書入力手段は、文字列を含む複数の構成要素から構成される文書であって、前記観点情報格納手段に格納されている第1の文字列が指定された文書を入力する。   The document input means is a document composed of a plurality of components including a character string, and inputs a document in which the first character string stored in the viewpoint information storage means is designated.

特定手段は、前記入力された文書を構成する構成要素毎に、当該構成要素に含まれる前記指定された第1の文字列に対応づけて前記観点情報格納手段に格納されている第2の文字列の数を特定する。   For each component constituting the input document, the specifying unit associates the specified first character string included in the component with the second character stored in the viewpoint information storage unit. Specify the number of columns.

決定手段は、前記構成要素毎に特定された第2の文字列の数に基づいて、当該構成要素毎に、当該構成要素の観点を表す第2の文字列を決定する。   The determining unit determines, for each constituent element, a second character string representing the viewpoint of the constituent element based on the number of second character strings specified for each constituent element.

生成手段は、前記部分文書を示す部分文書名と、前記格納された第2の文字列とが各軸に配置され、当該部分文書名と当該第2の文字列との交点にあたるデータとして、当該部分文書名が示す部分文書を構成する複数の構成要素のうち、前記第2の文字列が決定された構成要素の数を示すデータが配置された第1の成分マトリックスを生成する。 The generation unit arranges a partial document name indicating the partial document and the stored second character string on each axis, and as data corresponding to an intersection of the partial document name and the second character string, A first component matrix is generated in which data indicating the number of components for which the second character string is determined among a plurality of components constituting the partial document indicated by the partial document name .

提示手段は、前記生成された第1の成分マトリックスを提示する。   The presenting means presents the generated first component matrix.

実施形態に係る文書成分分析装置のハードウェア構成を示すブロック図。The block diagram which shows the hardware constitutions of the document component analyzer which concerns on embodiment. 図1に示す文書成分分析装置30の主として機能構成を示すブロック図。FIG. 2 is a block diagram mainly showing a functional configuration of the document component analysis apparatus 30 shown in FIG. 1. 図2に示す観点情報格納部22のデータ構造の一例を示す図。The figure which shows an example of the data structure of the viewpoint information storage part 22 shown in FIG. 図2に示す実績格納部23に格納されているプロジェクト情報のデータ構造の一例を示す図。The figure which shows an example of the data structure of the project information stored in the results storage part 23 shown in FIG. 各成分マトリックスが格納されている領域を示す情報の一例を示す図。The figure which shows an example of the information which shows the area | region where each component matrix is stored. 図2に示す実績格納部23に格納されている評価情報のデータ構造の一例を示す図。The figure which shows an example of the data structure of the evaluation information stored in the performance storage part 23 shown in FIG. 本実施形態に係る文書成分分析装置30の処理手順を示すフローチャート。6 is a flowchart showing a processing procedure of the document component analysis apparatus 30 according to the present embodiment. 文書入力部31によって入力される文書のデータ構造の一例を示す図。FIG. 4 is a diagram illustrating an example of a data structure of a document input by a document input unit 31. 図7に示す観点(中)成分マトリックス生成処理の処理手順を示すフローチャート。The flowchart which shows the process sequence of the viewpoint (medium) component matrix production | generation process shown in FIG. 成分マトリックス生成部33によって生成された観点(中)成分マトリックスのデータ構造の一例を示す図。The figure which shows an example of the data structure of the viewpoint (middle) component matrix produced | generated by the component matrix production | generation part 33. FIG. 図7に示す延べ数成分マトリックス生成処理の処理手順を示すフローチャート。The flowchart which shows the process sequence of the total number component matrix production | generation process shown in FIG. 成分マトリックス生成部33によって生成された延べ数成分マトリックスのデータ構造の一例を示す図。The figure which shows an example of the data structure of the total number component matrix produced | generated by the component matrix production | generation part 33. FIG. 図7に示す観点(大)成分マトリックス生成処理の処理手順を示すフローチャート。The flowchart which shows the process sequence of the viewpoint (large) component matrix production | generation process shown in FIG. 成分マトリックス生成部33によって生成された観点(大)成分マトリックスのデータ構造の一例を示す図。The figure which shows an example of the data structure of the viewpoint (large) component matrix produced | generated by the component matrix production | generation part 33. FIG. 図7に示す自動評価処理の処理手順を示すフローチャート。The flowchart which shows the process sequence of the automatic evaluation process shown in FIG.

以下、図面を参照して、実施形態について説明する。   Hereinafter, embodiments will be described with reference to the drawings.

図1は、本実施形態に係る文書成分分析装置のハードウェア構成を示すブロック図である。図1に示すように、コンピュータ10は、例えばハードディスクドライブ(HDD:Hard Disk Drive)のような外部記憶装置20と接続されている。この外部記憶装置20は、コンピュータ10によって実行されるプログラム21を格納する。コンピュータ10および外部記憶装置20は、文書成分分析装置30を構成する。   FIG. 1 is a block diagram showing a hardware configuration of the document component analysis apparatus according to the present embodiment. As shown in FIG. 1, the computer 10 is connected to an external storage device 20 such as a hard disk drive (HDD). The external storage device 20 stores a program 21 executed by the computer 10. The computer 10 and the external storage device 20 constitute a document component analysis device 30.

図2は、図1に示す文書成分分析装置30の主として機能構成を示すブロック図である。   FIG. 2 is a block diagram mainly showing a functional configuration of the document component analyzing apparatus 30 shown in FIG.

図2に示すように、文書成分分析装置30は、文書入力部31、観点(大)取得部32、成分マトリックス生成部33、プロジェクト情報入力部34、類似プロジェクト特定部35、評価取得部36、提示部37および評価入力部38を含む。本実施形態において、これらの各部31〜38は、図1に示すコンピュータ10が外部記憶装置20に格納されているプログラム21を実行することにより実現されるものとする。このプログラム21は、コンピュータ読み取り可能な記憶媒体に予め格納して頒布可能である。また、このプログラム21が、例えばネットワークを介してコンピュータ10にダウンロードされても構わない。   As shown in FIG. 2, the document component analysis apparatus 30 includes a document input unit 31, a viewpoint (large) acquisition unit 32, a component matrix generation unit 33, a project information input unit 34, a similar project specification unit 35, an evaluation acquisition unit 36, A presentation unit 37 and an evaluation input unit 38 are included. In the present embodiment, these units 31 to 38 are realized by the computer 10 illustrated in FIG. 1 executing the program 21 stored in the external storage device 20. This program 21 can be stored in advance in a computer-readable storage medium and distributed. Further, this program 21 may be downloaded to the computer 10 via, for example, a network.

また、文書成分分析装置30は、観点情報格納部22および実績格納部23を含む。本実施形態において、観点情報格納部22および実績格納部23は、例えば外部記憶装置20に格納される。   In addition, the document component analysis device 30 includes a viewpoint information storage unit 22 and a performance storage unit 23. In the present embodiment, the viewpoint information storage unit 22 and the result storage unit 23 are stored in, for example, the external storage device 20.

観点情報格納部22には、観点(大)、観点(中)および観点(小)が対応づけて予め格納される。   In the viewpoint information storage unit 22, viewpoints (large), viewpoints (medium), and viewpoints (small) are stored in advance in association with each other.

観点(大)(第1の観点)は、予め定められている基準または標準として文書に記述すべき項目を表す文字列(第1の文字列)を含む。以下、観点(大)に含まれる文字列を、便宜的に、観点(大)の用語と称する。   The viewpoint (large) (first viewpoint) includes a character string (first character string) representing an item to be described in the document as a predetermined standard or standard. Hereinafter, a character string included in the viewpoint (large) is referred to as a term (large) for convenience.

観点(中)(第2の観点)は、対応づけられている観点(大)の用語より詳細な項目を表す文字列(第2の文字列)を含む。以下、観点(中)に含まれる文字列を、便宜的に、観点(中)の用語と称する。   The viewpoint (medium) (second viewpoint) includes a character string (second character string) representing a more detailed item than the term (large) term associated with the viewpoint. Hereinafter, a character string included in the viewpoint (medium) is referred to as a term (medium) for convenience.

観点(小)(第3の観点)は、対応づけられている観点(中)の用語より詳細な項目を表す文字列(第3の文字列)を含む。以下、観点(小)に含まれる文字列を、便宜的に、観点(小)の用語と称する。   The viewpoint (small) (third viewpoint) includes a character string (third character string) representing a more detailed item than the term (middle) term associated with the viewpoint. Hereinafter, a character string included in the viewpoint (small) is referred to as a viewpoint (small) term for convenience.

文書入力部31は、文書を入力する。文書入力部31によって入力される文書は、文字列を含む複数の構成要素(例えば、文字列が記述されたセル等)から構成される。また、文書入力部31によって入力される文書においては、上記した観点(大)の用語が指定されている。なお、文書入力部31によって入力される文書は、例えばシステム開発等のプロジェクトの内容が記述された文書である。また、文書入力部31によって入力される文書は、システムの開発者等によって作成される。   The document input unit 31 inputs a document. A document input by the document input unit 31 includes a plurality of components including a character string (for example, a cell in which the character string is described). Further, in the document input by the document input unit 31, the above-mentioned viewpoint (large) term is specified. The document input by the document input unit 31 is a document in which the content of a project such as system development is described. A document input by the document input unit 31 is created by a system developer or the like.

観点(大)取得部32は、文書入力部31によって入力された文書において指定されている観点(大)の用語を取得する。   The viewpoint (large) acquisition unit 32 acquires the viewpoint (large) term specified in the document input by the document input unit 31.

成分マトリックス生成部33は、観点情報格納部22に格納されている情報、文書入力部31によって入力された文書および観点特定部32によって取得された観点(大)の用語に基づいて、観点(中)成分マトリックス(第1の成分マトリックス)、延べ数成分マトリックス(第2の成分マトリックス)および観点(大)成分マトリックス(第3の成分マトリックス)を生成する。なお、詳細については後述するが、観点(中)成分マトリックスおよび観点(大)成分マトリックスは、文書入力部31によって入力された文書の網羅性(基準または標準が全て記述されているか)を判断するために有用な表である。一方、延べ数成分マトリックスは、文書入力部31によって入力された文書の記述量または詳細度(基準または標準が詳細に記述されているか)を判断するために有用な表である。   The component matrix generation unit 33 uses the viewpoint (medium) based on the information stored in the viewpoint information storage unit 22, the document input by the document input unit 31, and the viewpoint (large) term acquired by the viewpoint identification unit 32. ) Component matrix (first component matrix), total number component matrix (second component matrix) and viewpoint (large) component matrix (third component matrix). Although details will be described later, the viewpoint (medium) component matrix and the viewpoint (large) component matrix determine the completeness of the document input by the document input unit 31 (whether all the standards or standards are described). It is a useful table for. On the other hand, the total number component matrix is a table useful for determining the description amount or the degree of detail (whether the reference or standard is described in detail) of the document input by the document input unit 31.

成分マトリックス生成部33によって生成された観点(中)成分マトリックス、延べ数成分マトリックスおよび観点(大)成分マトリックスは、実績格納部23に格納される。   The viewpoint (medium) component matrix, the total number component matrix, and the viewpoint (large) component matrix generated by the component matrix generation unit 33 are stored in the result storage unit 23.

プロジェクト情報入力部34は、上記した文書入力部31によって入力された文書に記述されているプロジェクトの概要を示すプロジェクト情報(つまり、当該文書の内容に関連する関連情報)を入力する。なお、プロジェクト情報入力部34によって入力されるプロジェクト情報は、システムの開発者等によって作成される。プロジェクト情報入力部34によって入力されたプロジェクト情報(文書に記述されているプロジェクトの概要を示すプロジェクト情報)は、上記した成分マトリックス生成部33によって生成された各成分マトリックス(当該文書に対して生成された各成分マトリックス)に対応づけて実績格納部23に格納される。   The project information input unit 34 inputs project information indicating the outline of the project described in the document input by the document input unit 31 (that is, related information related to the contents of the document). The project information input by the project information input unit 34 is created by a system developer or the like. The project information (project information indicating the outline of the project described in the document) input by the project information input unit 34 is generated by each component matrix (generated for the document) generated by the component matrix generation unit 33 described above. Are stored in the result storage unit 23 in association with each component matrix).

なお、実績格納部23には、例えば過去の文書に記述されているプロジェクト毎に、プロジェクト情報、当該文書に対して生成された各成分マトリックスおよび当該文書の評価を示す評価情報が蓄積されている。   For example, project information, each component matrix generated for the document, and evaluation information indicating the evaluation of the document are accumulated in the result storage unit 23 for each project described in the past document, for example. .

類似プロジェクト特定部35は、成分マトリックス生成部33によって生成された各成分マトリックスおよびプロジェクト情報入力部34によって入力されたプロジェクト情報と、実績格納部23に格納されている過去の文書に対する各成分マトリックスおよびプロジェクト情報に基づいて、文書入力部31によって入力された文書に記述されているプロジェクトに類似するプロジェクト(以下、単に類似プロジェクトと表記)を特定する。   The similar project specifying unit 35 includes each component matrix generated by the component matrix generating unit 33 and project information input by the project information input unit 34, each component matrix for past documents stored in the result storage unit 23, and Based on the project information, a project similar to the project described in the document input by the document input unit 31 (hereinafter simply referred to as a similar project) is specified.

評価取得部36は、類似プロジェクト特定部35によって特定された類似プロジェクトの評価情報(当該類似プロジェクトの内容が記述された文書の評価を示す評価情報)を、実績格納部23から取得する。   The evaluation acquisition unit 36 acquires the evaluation information of the similar project specified by the similar project specification unit 35 (evaluation information indicating the evaluation of the document describing the contents of the similar project) from the result storage unit 23.

提示部37は、上記した成分マトリックス生成部33によって生成された各成分マトリックスおよび評価取得部36によって取得された評価情報を、例えば文書入力部31によって入力された文書の評価を行う評価者に対して提示する。   The presenting unit 37 gives each component matrix generated by the component matrix generating unit 33 and the evaluation information acquired by the evaluation acquiring unit 36 to an evaluator who evaluates a document input by the document input unit 31, for example. Present.

評価入力部38は、文書入力部31によって入力された文書の評価を行う評価者の操作に応じて、当該評価を示す評価情報を入力する。   The evaluation input unit 38 inputs evaluation information indicating the evaluation according to an operation of an evaluator who evaluates the document input by the document input unit 31.

図3は、図2に示す観点情報格納部22のデータ構造の一例を示す。図2に示すように、観点情報格納部22には、観点(大)、観点(中)および観点(小)が対応づけて格納されている。   FIG. 3 shows an example of the data structure of the viewpoint information storage unit 22 shown in FIG. As shown in FIG. 2, the viewpoint information storage unit 22 stores viewpoints (large), viewpoints (medium), and viewpoints (small) in association with each other.

上記したように観点(大)は、予め定められている基準または標準として文書に記述すべき項目を表す文字列(用語)である。観点(中)は、観点(大)より詳細な項目を表す文字列(用語)である。観点(小)は、観点(中)より詳細な項目を表す文字列(用語)である。   As described above, the viewpoint (large) is a character string (term) representing an item to be described in the document as a predetermined standard or standard. The viewpoint (medium) is a character string (term) representing a more detailed item than the viewpoint (large). The viewpoint (small) is a character string (term) representing an item more detailed than the viewpoint (medium).

つまり、観点情報格納部22には、観点(大)、観点(中)および観点(小)の3段階からなる階層構造を有する用語(文字列)の集合が格納されている。   That is, the viewpoint information storage unit 22 stores a set of terms (character strings) having a hierarchical structure including three stages of viewpoint (large), viewpoint (medium), and viewpoint (small).

図3に示す例では、観点情報格納部22には、観点(大)の用語「拡張性」に対応づけて観点(中)の用語「業務処理量」および「拡張対象」が格納されている。また、観点情報格納部22には、観点(中)の用語「業務処理量」に対応づけて観点(小)の用語「通常業務」および「繁忙期の業務」が格納されている。更に、観点情報格納部22には、観点(中)の用語「拡張対象」に対応づけて観点(小)の用語「CPU」および「メモリ」が格納されている。これによれば、観点(大)の用語「拡張性」より詳細な項目を表す用語が観点(中)の用語「業務処理量」および「拡張対象」であることが示されている。また、観点(中)の用語「業務処理量」より詳細な項目を表す用語が観点(小)の用語「通常業務」および「繁忙期の業務」であり、観点(中)の用語「拡張対象」より詳細な項目を表す用語が観点(小)の「CPU」および「メモリ」であることが示されている。   In the example illustrated in FIG. 3, the viewpoint information storage unit 22 stores the viewpoints (medium) terms “business processing amount” and “expansion target” in association with the viewpoint (large) term “extensibility”. . In addition, the viewpoint information storage unit 22 stores the viewpoints (small) terms “normal work” and “busy period work” in association with the viewpoint (medium) term “business processing amount”. Further, the viewpoint information storage unit 22 stores viewpoint (small) terms “CPU” and “memory” in association with the viewpoint (medium) term “expansion target”. According to this, it is shown that terms representing items in more detail than the term (large) term “extensibility” are the terms “business processing amount” and “expansion target”. In addition, terms that represent more detailed items than the term (medium) term “business processing volume” are the terms “normal business” and “busy business” in the perspective (small), and the term “medium extension” The terms representing more detailed items are “CPU” and “memory” in terms of viewpoints (small).

同様に、観点情報格納部22には、観点(大)の用語「可用性」に対応づけて観点(中)の用語「バックアップ」、「業務継続」および「回復」が格納されている。また、観点情報格納部22には、観点(中)の用語「バックアップ」に対応づけて観点(小)の用語「データ量」、「時間帯」、「対象範囲」、「バックアップ方法」および「復旧方法」が格納されている。また、観点情報格納部22には、観点(中)の用語「業務継続」に対応づけて観点(小)の用語「役割」、「要件」、「スケジュール」、「復旧水準」および「稼働率」が格納されている。また、観点情報格納部22には、観点(中)の用語「回復」に対応づけて観点(小)の用語「回復時間」および「可用性確認」が格納されている。これによれば、観点(大)の用語「可用性」より詳細な項目を表す用語が観点(中)の用語「バックアップ」、「業務継続」および「回復」であることが示されている。また、観点(中)の用語「バックアップ」より詳細な項目を表す用語が観点(小)の用語「データ量」、「時間帯」、「対象範囲」、「バックアップ方法」および「復旧方法」であることが示されている。また、観点(中)の用語「業務継続」より詳細な項目を表す用語が観点(小)の用語「役割」、「要件」、「スケジュール」、「復旧水準」および「稼働率」であることが示されている。また、観点(中)の用語「回復」より詳細な項目を表す用語が観点(小)の用語「回復時間」および「可用性確認」であることが示されている。   Similarly, the viewpoint information storage unit 22 stores the viewpoints (medium) terms “backup”, “business continuation”, and “recovery” in association with the viewpoint (large) term “availability”. Further, the viewpoint information storage unit 22 associates the terms “small” with the terms “data amount”, “time zone”, “target range”, “backup method”, and “backup method” in association with the term “medium”. "Recovery method" is stored. In addition, the viewpoint information storage unit 22 associates the viewpoint (medium) term “business continuity” with the viewpoint (small) terms “role”, “requirement”, “schedule”, “recovery level”, and “operation rate”. Is stored. In addition, the viewpoint information storage unit 22 stores the viewpoint (small) terms “recovery time” and “availability confirmation” in association with the term “medium” term “recovery”. According to this, it is shown that the terms representing the items in more detail than the term (large) term “availability” are the terms “backup”, “business continuation”, and “recovery”. In addition, terms that represent more detailed items than the term “middle” term “backup” are terms “data amount”, “time zone”, “target range”, “backup method”, and “recovery method”. It is shown that there is. In addition, the terms representing the items in more detail than the term “business continuity” in the perspective (medium) are the terms “role”, “requirement”, “schedule”, “recovery level” and “operation rate” in the perspective (small). It is shown. Further, it is indicated that terms representing items in more detail than the term “recovery” in the viewpoint (medium) are the terms “recovery time” and “availability confirmation” in the viewpoint (small).

次に、図4〜図6を参照して、図2に示す実績格納部23に格納されている情報について説明する。実績格納部23には、上記したように文書に記述されているプロジェクト毎に、プロジェクト情報、各成分マトリックス(観点(中)成分マトリックス、延べ数成分マトリックスおよび観点(大)成分マトリックス)および評価情報が対応づけて格納されている。   Next, information stored in the result storage unit 23 illustrated in FIG. 2 will be described with reference to FIGS. For each project described in the document as described above, project information, each component matrix (a viewpoint (medium) component matrix, a total number component matrix and a viewpoint (large) component matrix), and evaluation information are stored in the result storage unit 23. Stored in association.

図4は、実績格納部23に格納されているプロジェクト情報のデータ構造の一例を示す。プロジェクト情報は、例えば文書に記述されているプロジェクトの概要を示す。図4に示すように、プロジェクト情報には、例えばプロジェクト名、業種、製品ランク、規模および期間(の情報)が含まれる。   FIG. 4 shows an example of the data structure of project information stored in the result storage unit 23. The project information indicates, for example, an outline of a project described in a document. As shown in FIG. 4, the project information includes, for example, a project name, a business type, a product rank, a scale, and a period (information).

実績格納部23に格納されている各成分マトリックスは、対応づけられているプロジェクト情報によって概要が示されるプロジェクトの内容が記述された文書に対して生成された各成分マトリックスである。この各成分マトリックスのデータ構造の詳細については後述するが、当該各成分マトリックスは実績格納部23以外の記憶領域に格納されていてもよい。この場合、図5に示すように、実績格納部23には、各成分マトリックスが格納されている領域を示す情報が格納されていればよい。   Each component matrix stored in the result storage unit 23 is each component matrix generated for a document describing the contents of a project whose outline is indicated by the associated project information. Although details of the data structure of each component matrix will be described later, each component matrix may be stored in a storage area other than the record storage unit 23. In this case, as shown in FIG. 5, the record storage unit 23 only needs to store information indicating an area in which each component matrix is stored.

図6は、実績格納部23に格納されている評価情報のデータ構造の一例を示す。評価情報は、対応づけられているプロジェクト情報によって示されるプロジェクト(システム開発等)の内容が記述された文書に対する評価者の評価を示す。図6に示すように、評価情報には、例えば文書の網羅性および詳細度に関する評価が含まれる。   FIG. 6 shows an example of the data structure of the evaluation information stored in the result storage unit 23. The evaluation information indicates an evaluation of the evaluator with respect to a document in which the content of the project (system development or the like) indicated by the associated project information is described. As shown in FIG. 6, the evaluation information includes, for example, evaluation related to document completeness and detail.

次に、図7のフローチャートを参照して、本実施形態に係る文書成分分析装置30の処理手順について説明する。   Next, a processing procedure of the document component analysis apparatus 30 according to the present embodiment will be described with reference to the flowchart of FIG.

まず、文書入力部31は、評価者による評価の対象となる文書を入力する(ステップS1)。   First, the document input unit 31 inputs a document to be evaluated by the evaluator (step S1).

ここで、図8は、文書入力部31によって入力される文書のデータ構造の一例を示す。文書入力部31によって入力された文書は、複数の節から構成されているものとする。また、文書(を構成する節)は、当該文書の一部が記述された複数の構成要素(セル)から構成される。つまり、文書(の内容)は、複数の構成要素に分割されている。   Here, FIG. 8 shows an example of a data structure of a document input by the document input unit 31. It is assumed that the document input by the document input unit 31 is composed of a plurality of sections. A document (a section constituting the document) includes a plurality of components (cells) in which a part of the document is described. That is, the document (contents) is divided into a plurality of components.

なお、文書入力部31によって入力される文書のファイル形式は問わないが、図8に示すような形式でない文書(つまり、複数の構成要素に分割されていない文書)の場合は、当該文書の本文を各段落等で分割する等によって図8の形式に変換される。また、文書入力部31によって入力される文書は、当該文書から生成される成分マトリックスが見やすくなるため、例えば章、節、項に分かれている方が好ましい。   The file format of the document input by the document input unit 31 is not limited. However, in the case of a document that is not in the format shown in FIG. 8 (that is, a document that is not divided into a plurality of components), the text of the document Is converted into the format shown in FIG. Further, the document input by the document input unit 31 is preferably divided into, for example, chapters, sections, and terms because the component matrix generated from the document is easy to see.

なお、図8に示す文書においては省略されているが、文書入力部31によって入力される文書においては、例えば当該文書を構成する節毎に観点(大)の用語(観点(大)に含まれる文字列)が指定されているものとする。以下、文書入力部31によって入力された文書を対象文書と称する。   Although omitted in the document shown in FIG. 8, in the document input by the document input unit 31, for example, a viewpoint (large) term (included in the viewpoint (large) is included for each section constituting the document. Character string) is specified. Hereinafter, a document input by the document input unit 31 is referred to as a target document.

再び図7に戻ると、対象文書を構成する節の各々について以下のステップS2〜S5の処理が実行される。以下、ステップS2〜S5の処理の対象となる節を対象節と称する。   Returning to FIG. 7 again, the following steps S2 to S5 are executed for each of the sections constituting the target document. Hereinafter, the node that is the target of the processing in steps S2 to S5 is referred to as a target node.

観点取得部32は、対象節に指定されている観点(大)の用語を取得する(ステップS2)。   The viewpoint acquisition unit 32 acquires a term (large) term specified in the target clause (step S2).

次に、成分マトリックス生成部33は、対象節に対して観点(中)成分マトリックス生成処理を実行する(ステップS3)。この観点(中)成分マトリックス生成処理によれば、観点情報格納部22において観点(大)取得部32によって取得された対象節の観点(大)の用語に対応づけられている各観点(中)の用語に関する記述があるセル(当該対象節を構成するセル)の数を表す観点(中)成分マトリックスが生成される。なお、観点(中)成分マトリックス生成処理の詳細については後述する。   Next, the component matrix generation unit 33 performs a viewpoint (medium) component matrix generation process on the target clause (step S3). According to this viewpoint (middle) component matrix generation process, each viewpoint (middle) associated with the viewpoint (large) term of the target clause acquired by the viewpoint (large) acquisition unit 32 in the viewpoint information storage unit 22. A viewpoint (medium) component matrix is generated that represents the number of cells (cells that constitute the target section) that have a description of the term. Details of the viewpoint (medium) component matrix generation process will be described later.

また、成分マトリックス生成部33は、対象節に対して延べ数成分マトリックス生成処理を実行する(ステップS4)。この延べ数成分マトリックス生成処理によれば、観点情報格納部22において観点(大)取得部32によって取得された対象節の観点(大)の用語に対応づけられている各観点(中)の用語および当該各観点(中)の用語に対応づけられている観点(小)の用語に関する記述の量を表す延べ数成分マトリックスが生成される。なお、延べ数成分マトリックス生成処理の詳細については後述する。   In addition, the component matrix generation unit 33 executes a total number component matrix generation process on the target clause (step S4). According to this total number component matrix generation process, the terminology (medium) of each viewpoint associated with the term (large) term of the target clause acquired by the viewpoint (large) acquisition unit 32 in the viewpoint information storage unit 22 and A total number component matrix is generated that represents the amount of description relating to the term (small) term associated with the term (medium) term. The details of the total number component matrix generation process will be described later.

更に、成分マトリックス生成部33は、対象節に対して観点(大)成分マトリックス生成処理を実行する(ステップS5)。この観点(大)成分マトリックス生成処理によれば、対象節の観点(大)の用語および当該対象節を構成するセルの数を表す観点(第)成分マトリックスが生成される。なお、観点(大)成分マトリックス生成処理の詳細については後述する。   Furthermore, the component matrix generation unit 33 performs viewpoint (large) component matrix generation processing on the target clause (step S5). According to this viewpoint (large) component matrix generation process, a viewpoint (first) component matrix representing the viewpoint (large) term of the target section and the number of cells constituting the target section is generated. Details of the viewpoint (large) component matrix generation process will be described later.

上記したステップS3〜S5の処理によって生成された各成分マトリックス(つまり、対象文書から生成された各成分マトリックス)は、当該対象文書に記述されているプロジェクトの概要を示すプロジェクト情報とともに、実績格納部23に格納される。なお、プロジェクト情報は、例えばシステム開発者等によって作成され、プロジェクト情報入力部34によって入力される。   Each component matrix generated by the processing in steps S3 to S5 (that is, each component matrix generated from the target document) is stored together with project information indicating an outline of the project described in the target document, as well as a result storage unit. 23. The project information is created by, for example, a system developer or the like, and is input by the project information input unit 34.

次に、対象文書を構成する全ての節についてステップS2〜S5の処理が実行されたか否かが判定される(ステップS6)。   Next, it is determined whether or not the processing in steps S2 to S5 has been executed for all sections constituting the target document (step S6).

全ての節について処理が実行されていないと判定された場合(ステップS6のNO)、上記したステップS2に戻って処理が繰り返される。この場合、対象文書を構成する節のうちステップS2〜S5の処理が実行されていない節を対象節として処理が繰り返される。   If it is determined that the process has not been executed for all the nodes (NO in step S6), the process returns to the above-described step S2 and is repeated. In this case, the process is repeated with a section in which the process of steps S2 to S5 is not executed among the sections constituting the target document.

一方、全ての節について処理が実行されたと判定された場合(ステップS7のYES)、類似プロジェクト特定部35および評価取得部36は、成分マトリックス生成部33によって生成された各成分マトリックスおよび実績格納部23に格納されている情報に基づいて、自動評価処理を実行する(ステップS7)。この自動評価処理によれば、対象文書に記述されているプロジェクトと類似するプロジェクト(類似プロジェクト)が特定され、当該類似プロジェクトが記述された文書に対する評価を示す評価情報が取得される。なお、自動評価処理の詳細については後述する。   On the other hand, when it is determined that the processing has been executed for all the sections (YES in step S7), the similar project specifying unit 35 and the evaluation acquiring unit 36 each component matrix and actual result storage unit generated by the component matrix generation unit 33 Based on the information stored in 23, an automatic evaluation process is executed (step S7). According to this automatic evaluation process, a project similar to the project described in the target document (similar project) is specified, and evaluation information indicating evaluation for the document in which the similar project is described is acquired. Details of the automatic evaluation process will be described later.

提示部37は、成分マトリックス生成部33によって生成された各成分マトリックス(観点(中)成分マトリックス、延べ数成分マトリックスおよび観点(大)成分マトリックス)および自動評価処理において取得された評価情報を、例えば対象文書を評価する評価者に対して提示する(ステップS8)。   The presentation unit 37 uses each component matrix (a viewpoint (medium) component matrix, a total number component matrix and a viewpoint (large) component matrix) generated by the component matrix generation unit 33 and evaluation information acquired in the automatic evaluation process, for example, as a target The document is presented to the evaluator who evaluates the document (step S8).

これにより、評価者は、対象文書の評価を行う際に、提示された各成分マトリックスおよび評価情報を参考にすることができる。   Thereby, the evaluator can refer to each presented component matrix and evaluation information when evaluating the target document.

次に、図9のフローチャートを参照して、前述した観点(中)成分マトリックス生成処理(図7に示すステップS3の処理)の処理手順について説明する。この観点(中)成分マトリックス生成処理は、評価者が対象文書の網羅性を判断するために有用な表(観点(中)成分マトリックス)を生成するための処理である。   Next, a processing procedure of the above-described viewpoint (medium) component matrix generation process (the process of step S3 shown in FIG. 7) will be described with reference to the flowchart of FIG. This viewpoint (medium) component matrix generation process is a process for generating a table (viewpoint (medium) component matrix) useful for the evaluator to determine the completeness of the target document.

なお、文書入力部31によって入力された文書を対象文書、当該対象文書を構成する節のうち観点(中)成分マトリックス生成処理の対象となる節を対象節と称する。   Note that a document input by the document input unit 31 is referred to as a target document, and a clause that is subject to the viewpoint (medium) component matrix generation process among the clauses that constitute the target document is referred to as a target clause.

観点(中)成分マトリックス生成処理においては、対象節を構成するセル(構成要素)の各々について以下のステップS11〜S18の処理が実行される。   In the viewpoint (medium) component matrix generation process, the following steps S11 to S18 are executed for each cell (component) constituting the target clause.

まず、成分マトリックス生成部33は、対象文書に基づいて、対象節を構成するセルのうちの1つを取得する(ステップS11)。以下、ステップS11において取得されたセルを対象セルと称する。   First, the component matrix generation unit 33 acquires one of the cells constituting the target clause based on the target document (step S11). Hereinafter, the cell acquired in step S11 is referred to as a target cell.

次に、上述した観点(大)取得部32によって特定された対象節の観点(大)の用語に対応づけて観点情報格納部22に格納されている観点(中)の用語の各々について以下のステップS12〜S16の処理が実行される。   Next, for each of the viewpoint (medium) terms stored in the viewpoint information storage unit 22 in association with the viewpoint (large) term of the target clause specified by the viewpoint (large) acquisition unit 32 described below, Steps S12 to S16 are executed.

この場合、成分マトリックス生成部33は、対象節の観点(大)の用語に対応づけて観点情報格納部22に格納されている観点(中)の用語を1つ取得する(ステップS12)。   In this case, the component matrix generation unit 33 acquires one viewpoint (medium) term stored in the viewpoint information storage unit 22 in association with the viewpoint (large) term of the target clause (step S12).

成分マトリックス生成部33は、対象セル中に出現するステップS12において取得された観点(中)の用語の数(観点(中)の用語出現数)を特定する(ステップS13)。なお、成分マトリックス生成部33によって特定された観点(中)の用語出現数は、例えば成分マトリックス生成部33において保持される。   The component matrix generation unit 33 specifies the number of viewpoint (medium) terms (number of viewpoint (medium) appearances) acquired in step S12 appearing in the target cell (step S13). In addition, the term appearance number of the viewpoint (medium) specified by the component matrix generation unit 33 is held in the component matrix generation unit 33, for example.

また、ステップS12において取得された観点(中)の用語に対応づけて観点情報格納部22に格納されている観点(小)の用語の各々について以下のステップS14及びS15の処理が実行される。   Further, the following steps S14 and S15 are executed for each viewpoint (small) term stored in the viewpoint information storage unit 22 in association with the viewpoint (middle) term acquired in step S12.

この場合、成分マトリックス生成部33は、ステップS12において取得された観点(中)の用語に対応づけて観点情報格納部22に格納されている観点(小)の用語を1つ取得する(ステップS14)。   In this case, the component matrix generation unit 33 acquires one viewpoint (small) term stored in the viewpoint information storage unit 22 in association with the viewpoint (middle) term acquired in step S12 (step S14). ).

成分マトリックス生成部33は、対象セル中に出現するステップS14において取得された観点(小)の用語の数(観点(小)の用語出現数)を特定する(ステップS15)。なお、成分マトリックス生成部33によって特定された観点(小)の用語出現数は、例えば成分マトリックス生成部33において保持される。   The component matrix generation unit 33 identifies the number of viewpoint (small) terms (number of viewpoint (small) terms appearing) acquired in step S14 appearing in the target cell (step S15). In addition, the term appearance number of the viewpoint (small) specified by the component matrix generation unit 33 is held in the component matrix generation unit 33, for example.

ステップS15の処理が実行されると、成分マトリックス生成部33は、ステップS12において取得された観点(中)の用語に対応づけて観点情報格納部22に格納されている観点(小)の用語の全てについてステップS14およびS15の処理が実行されたか否かを判定する(ステップS16)。   When the process of step S15 is executed, the component matrix generation unit 33 associates the viewpoint (small) term stored in the viewpoint information storage unit 22 with the viewpoint (middle) term acquired in step S12. It is determined whether or not the processing of steps S14 and S15 has been executed for all (step S16).

観点(小)の用語の全てについて処理が実行されていないと判定された場合(ステップS16のNO)、上記したステップS14に戻って処理が繰り返される。この場合、ステップS14においては、ステップS14およびS15の処理が実行されていない観点(小)の用語が取得される。   When it is determined that the processing has not been executed for all the terms (small) (NO in step S16), the process returns to the above-described step S14 and is repeated. In this case, in step S14, terms (small) that are not executed in steps S14 and S15 are acquired.

一方、観点(小)の用語の全てについて処理が実行されたと判定された場合(ステップS16のYES)、成分マトリックス生成部33は、観点(大)取得部32によって取得された対象節の観点(大)の用語に対応づけて観点情報格納部22に格納されている観点(中)の用語の全てについてステップS12〜S16の処理が実行されたか否かを判定する(ステップS17)。   On the other hand, when it is determined that the processing has been executed for all the terms (small) (YES in step S16), the component matrix generation unit 33 determines the viewpoints of the target clause acquired by the viewpoint (large) acquisition unit 32 ( It is determined whether or not the processing of steps S12 to S16 has been executed for all of the viewpoint (medium) terms stored in the viewpoint information storage unit 22 in association with the large term (step S17).

観点(中)の用語の全てについて処理が実行されていないと判定された場合(ステップS17のNO)、上記したステップS12に戻って処理が繰り返される。この場合、ステップS12においては、ステップS12〜S16の処理が実行されていない観点(中)の用語が取得される。   When it is determined that the processing has not been executed for all the terms in the viewpoint (medium) (NO in step S17), the processing returns to the above-described step S12 and is repeated. In this case, in step S12, a term (middle) term in which the processes in steps S12 to S16 are not executed is acquired.

一方、観点(中)の用語の全てについて処理が実行されたと判定された場合(ステップS17のYES)、成分マトリックス生成部33においては、対象節の観点(大)の用語に対応づけられている各観点(中)の用語の対象セル中の出現数および当該観点(中)の用語に対応づけられている各観点(小)の用語の対象セル中の出現数が保持されている。   On the other hand, when it is determined that the processing has been executed for all the terms in the viewpoint (medium) (YES in step S17), the component matrix generation unit 33 associates the terms with the viewpoint (large) in the target clause. The number of appearances of each viewpoint (medium) term in the target cell and the number of occurrences of each viewpoint (small) term associated with the term (medium) term in the target cell are retained.

成分マトリックス生成部33は、当該成分マトリックス生成部33において保持されている各観点(中)の用語の対象セル中の出現数および観点(小)の用語の対象セル中の出現数に基づいて、対象セルの観点を表す観点(中)を決定する(ステップS18)。   The component matrix generation unit 33, based on the number of occurrences of each viewpoint (medium) term in the target cell and the number of occurrences of the term (small) term in the target cell held in the component matrix generation unit 33, A viewpoint (medium) representing the viewpoint of the target cell is determined (step S18).

ステップS18の処理においては、出現数が最も多い観点(中)の用語が対象セルの観点(中)として決定される。また、出願数が最も多い観点(中)の用語が複数存在する場合には、対応づけられている観点(小)の用語の対象セル中の出現数が最も多い観点(中)の用語が対象セルの観点(中)として決定される。更に、出願数が最も多い観点(中)の用語が複数存在する場合であって、対応づけられている観点(小)の用語の対象セル中の出現数も同一である場合には、観点情報格納部22において上位に記述されている用語が対象セルの観点(中)として決定される。また、観点(中)の用語が対象セル中に1つも出現していない場合には、対象セルの観点(中)をその他とする。   In the process of step S18, the viewpoint (medium) term having the largest number of appearances is determined as the viewpoint (medium) of the target cell. In addition, if there are multiple terms with the highest number of applications (medium), the terms with the highest number of occurrences in the target cell of the terms with the corresponding viewpoint (small) are targeted. Determined as cell perspective (middle). Furthermore, when there are a plurality of terms of the viewpoint (medium) with the largest number of applications, and the number of occurrences of the associated viewpoint (small) terms in the target cell is also the same, the viewpoint information The term described at the upper level in the storage unit 22 is determined as the viewpoint (medium) of the target cell. In addition, when no term (middle) term appears in the target cell, the viewpoint (middle) of the target cell is set as other.

ここで、前述した図3を参照して、ステップS18の処理について具体的に説明する。ここでは、対象節に指定されている観点(大)の用語が「可用性」であるものとして説明する。   Here, with reference to FIG. 3 mentioned above, the process of step S18 is demonstrated concretely. Here, the description will be made assuming that the viewpoint (large) term specified in the target section is “availability”.

例えば観点(中)の用語「バックアップ」が対象セル中に1つ出現している場合を想定する。この場合、対象セルにおいて出現数が最も多い観点(中)の用語は「バックアップ」であるため、対象セルの観点(中)は、「バックアップ」に決定される。   For example, it is assumed that one “backup” term (medium) appears in the target cell. In this case, since the term of the viewpoint (middle) having the highest number of appearances in the target cell is “backup”, the viewpoint (middle) of the target cell is determined as “backup”.

また、例えば観点(中)の用語「バックアップ」が1つ、「業務継続」が2つ対象セル中に出現している場合を想定する。この場合、対象セルにおいて出現数が最も多い観点(中)の用語は「業務継続」であるため、対象セルの観点(中)は、「業務継続」に決定される。   Further, for example, a case is assumed in which one term “middle” term “backup” and two “business continuation” appear in the target cell. In this case, since the term of the viewpoint (medium) having the highest number of appearances in the target cell is “business continuation”, the viewpoint (medium) of the target cell is determined as “business continuation”.

また、例えば観点(中)の用語「バックアップ」および「業務継続」が対象セル中に1つずつ出現し、観点(小)の用語「稼働率」が対象セル中に1つ出現している場合を想定する。この場合、対象セルにおいて出現数が最も多い観点(中)の用語は「バックアップ」および「業務継続」の2つであるが、観点(小)の用語「稼働率」は観点(中)の用語「業務継続」に対応づけられている用語であるため、対象セルの観点(中)は、「業務継続」に決定される。   In addition, for example, the terms “backup” and “business continuity” in the viewpoint (medium) appear one by one in the target cell, and the term “operating rate” in the viewpoint (small) appears one in the target cell. Is assumed. In this case, the terms (medium) with the highest number of occurrences in the target cell are the two terms “backup” and “business continuation”, but the term “operating rate” is the term “medium”. Since the term is associated with “business continuation”, the viewpoint (medium) of the target cell is determined as “business continuation”.

また、例えば観点(中)の用語「バックアップ」および「業務継続」が対象セル中に1つずつ出現している場合を想定する。この場合、対象セルにおいて出現数が最も多い観点(中)の用語は「バックアップ」および「業務継続」の2つであるが、図3において「バックアップ」は「業務継続」の上位に記述されているため、対象セルの観点(中)は、「バックアップ」に決定される。   Further, for example, a case is assumed where the terms “backup” and “business continuity” in the viewpoint (medium) appear one by one in the target cell. In this case, the terms (medium) that have the highest number of appearances in the target cell are two, “backup” and “business continuation”. In FIG. 3, “backup” is described above “business continuation”. Therefore, the viewpoint (medium) of the target cell is determined as “backup”.

また、例えば観点(小)の用語(例えば、「データ量」、「役割」および「回復時間」等)のみが対象セル中に出現している場合を想定する。この場合、対象セルにおいて観点(中)の用語は出現していないため、対象セルの観点(中)は、「その他」に決定される。   Further, for example, a case is assumed where only terms (small) terms (for example, “data amount”, “role”, “recovery time”, etc.) appear in the target cell. In this case, since the term (medium) term does not appear in the target cell, the viewpoint (middle) of the target cell is determined as “other”.

なお、例えば対象セル中に観点(中)の用語および観点(小)の用語が出現していない場合には、対象セルの観点(中)は決定されない。   For example, when the viewpoint (medium) term and the viewpoint (small) term do not appear in the target cell, the viewpoint (middle) of the target cell is not determined.

上記したようにステップS18の処理が実行されると、成分マトリックス生成部33は、対象節を構成する全てのセルについて上記したステップS11〜S18の処理が実行されたか否かを判定する(ステップS19)。   When the process of step S18 is executed as described above, the component matrix generation unit 33 determines whether or not the processes of steps S11 to S18 described above have been executed for all the cells constituting the target clause (step S19). ).

全てのセルについて処理が実行されていないと判定された場合(ステップS19のNO)、上記したステップS11に戻って処理が繰り返される。この場合、ステップS11においては、ステップS11〜S18の処理が実行されていないセルが取得される。   When it is determined that the process has not been executed for all the cells (NO in step S19), the process returns to the above-described step S11 and is repeated. In this case, in step S11, a cell in which the processes in steps S11 to S18 are not executed is acquired.

一方、全てのセルについて処理が実行されたと判定された場合(ステップS19のYES)、対象節を構成するセルの各々について観点(中)が決定されている。   On the other hand, when it is determined that the process has been executed for all the cells (YES in step S19), the viewpoint (medium) is determined for each of the cells constituting the target clause.

成分マトリックス生成部33は、対象節の観点(大)の用語に対応づけて観点情報格納部22に格納されている観点(中)の用語毎に、当該観点(中)の用語を観点(中)として決定されたセル(対象節を構成するセル)の数を含む観点(中)成分マトリックスを生成する(ステップS20)。   The component matrix generation unit 33 uses the viewpoint (medium) terminology for each viewpoint (medium) term stored in the viewpoint information storage unit 22 in association with the viewpoint (large) term of the target clause. A viewpoint (medium) component matrix including the number of cells (cells constituting the target clause) determined as) is generated (step S20).

ここで、図10は、成分マトリックス生成部33によって生成された観点(中)成分マトリックスのデータ構造の一例を示す。ここでは、対象節「10.2 バックアップ方針」に対して観点(中)成分マトリックス生成処理が実行されることによって生成された観点(中)成分マトリックスの一例を示す。なお、対象節を構成するセルの数は39であるものとする。   Here, FIG. 10 shows an example of the data structure of the viewpoint (medium) component matrix generated by the component matrix generation unit 33. Here, an example of the viewpoint (medium) component matrix generated by executing the viewpoint (medium) component matrix generation process for the target clause “10.2 backup policy” is shown. It is assumed that the number of cells constituting the target clause is 39.

図10に示す例によれば、対象節を構成する39セルのうち、10セルが観点(中)として「バックアップ」が決定されたことが示されている。また、対象節を構成する39セルのうち、9セルが観点(中)として「その他」が決定されたことが示されている。   The example illustrated in FIG. 10 indicates that “backup” is determined from the viewpoint (medium) of 10 cells among 39 cells constituting the target clause. In addition, it is shown that “others” is determined from the viewpoint (medium) of 9 cells among 39 cells constituting the target clause.

つまり、図10に示すような観点(中)成分マトリックスによれば、対象節「10.2 バックアップ方針」の39セルのうちの10セルが観点(中)「バックアップ」に関する記述であることが表されている。   That is, according to the viewpoint (medium) component matrix as shown in FIG. 10, it is shown that 10 out of 39 cells of the target section “10.2 backup policy” are descriptions regarding the viewpoint (medium) “backup”. Has been.

次に、図11のフローチャートを参照して、前述した延べ数成分マトリックス生成処理(図7に示すステップS4の処理)の処理手順について説明する。この延べ数成分マトリックス生成処理は、評価者が対象文書の詳細度を判断するために有用な表(延べ数成分マトリックス)を生成するための処理である。   Next, with reference to the flowchart of FIG. 11, the processing procedure of the total number component matrix generation process (the process of step S4 shown in FIG. 7) will be described. This total number component matrix generation process is a process for generating a table (total number component matrix) useful for the evaluator to determine the level of detail of the target document.

なお、前述した観点(中)成分マトリックス生成処理の場合と同様に、文書入力部31によって入力された文書を対象文書、当該対象文書を構成する節のうち延べ数成分マトリックス生成処理の対象となる節を対象節と称する。   As in the case of the above-described viewpoint (medium) component matrix generation process, the document input by the document input unit 31 is the target document, and the sections that are the target of the total number component matrix generation process among the sections constituting the target document. Is called the target section.

延べ数成分マトリックス生成処理においては、対象節を構成するセル(構成要素)の各々について以下のステップS21〜S28の処理が実行される。   In the total number component matrix generation process, the following steps S21 to S28 are executed for each cell (component) constituting the target clause.

まず、成分マトリックス生成部33は、対象文書に基づいて、対象節を構成するセルのうちの1つを取得する(ステップS21)。以下、ステップS11において取得されたセルを対象セルと称する。   First, the component matrix generation unit 33 acquires one of the cells constituting the target clause based on the target document (step S21). Hereinafter, the cell acquired in step S11 is referred to as a target cell.

次に、上述した観点(大)取得部32によって取得された対象節の観点(大)の用語に対応づけて観点情報格納部22に格納されている観点(中)の用語の各々について以下のステップS22〜S26の処理が実行される。   Next, for each of the viewpoint (medium) terms stored in the viewpoint information storage unit 22 in association with the viewpoint (large) term of the target clause acquired by the viewpoint (large) acquisition unit 32 described above, the following Steps S22 to S26 are executed.

この場合、成分マトリックス生成部33は、対象節の観点(大)の用語に対応づけて観点情報格納部22に格納されている観点(中)の用語を1つ取得する(ステップS22)。   In this case, the component matrix generation unit 33 acquires one viewpoint (medium) term stored in the viewpoint information storage unit 22 in association with the viewpoint (large) term of the target clause (step S22).

成分マトリックス生成部33は、対象セル中に出現するステップS22において取得された観点(中)の用語の数(観点(中)の用語出現数)を特定する(ステップS23)。なお、成分マトリックス生成部33によって特定された観点(中)の用語出現数は、例えば成分マトリックス生成部33において保持される。   The component matrix generation unit 33 specifies the number of viewpoint (medium) terms (number of viewpoint (medium) appearances) acquired in step S22 appearing in the target cell (step S23). In addition, the term appearance number of the viewpoint (medium) specified by the component matrix generation unit 33 is held in the component matrix generation unit 33, for example.

また、ステップS22において取得された観点(中)の用語に対応づけて観点情報格納部22に格納されている観点(小)の用語の各々について以下のステップS24およびS25の処理が実行される。   Further, the following steps S24 and S25 are executed for each of the viewpoint (small) terms stored in the viewpoint information storage unit 22 in association with the viewpoint (medium) term acquired in step S22.

この場合、成分マトリックス生成部33は、ステップS22において取得された観点(中)の用語に対応づけて観点情報格納部22に格納されている観点(小)の用語を1つ取得する(ステップS24)。   In this case, the component matrix generation unit 33 acquires one viewpoint (small) term stored in the viewpoint information storage unit 22 in association with the viewpoint (middle) term acquired in step S22 (step S24). ).

成分マトリックス生成部33は、対象セル中に出現するステップS24において取得された観点(小)の用語の数(観点(小)の用語出現数)を特定する(ステップS25)。なお、成分マトリックス生成部33によって特定された観点(小)の用語出現数は、例えば成分マトリックス生成部33において保持される。   The component matrix generation unit 33 specifies the number of viewpoint (small) terms (number of viewpoints (small) term appearance) acquired in step S24 that appears in the target cell (step S25). In addition, the term appearance number of the viewpoint (small) specified by the component matrix generation unit 33 is held in the component matrix generation unit 33, for example.

ステップS25の処理が実行されると、成分マトリックス生成部33は、ステップS12において取得された観点(中)の用語に対応づけて観点情報格納部22に格納されている観点(小)の用語の全てについてステップS24およびS25の処理が実行されたか否かを判定する(ステップS26)。   When the process of step S25 is executed, the component matrix generation unit 33 associates the viewpoint (middle) term acquired in step S12 with the viewpoint (small) term stored in the viewpoint information storage unit 22. It is determined whether or not the processing of steps S24 and S25 has been executed for all (step S26).

観点(小)の用語の全てについて処理が実行されていないと判定された場合(ステップS26のNO)、上記したステップS24に戻って処理が繰り返される。この場合、ステップS24においては、ステップS24およびS25の処理が実行されていない観点(小)の用語が取得される。   When it is determined that the processing has not been performed for all the terms (small) (NO in step S26), the process returns to the above-described step S24 and is repeated. In this case, in step S24, terms (small) that are not executed in steps S24 and S25 are acquired.

一方、観点(小)の用語の全てについて処理が実行されたと判定された場合(ステップS26のYES)、成分マトリックス生成部33は、観点(大)取得部32によって取得された対象節の観点(大)の用語に対応づけて観点情報格納部22に格納されている観点(中)の用語の全てについてステップS22〜S26の処理が実行されたか否かを判定する(ステップS27)。   On the other hand, when it is determined that the processing has been executed for all the terms (small) (YES in step S26), the component matrix generation unit 33 determines the viewpoint of the target clause acquired by the viewpoint (large) acquisition unit 32 ( It is determined whether or not the processing of steps S22 to S26 has been executed for all of the viewpoint (medium) terms stored in the viewpoint information storage unit 22 in association with the large term (step S27).

観点(中)の用語の全てについて処理が実行されていないと判定された場合(ステップS27のNO)、上記したステップS22に戻って処理が繰り返される。この場合、ステップS22においては、ステップS22〜S26の処理が実行されていない観点(中)の用語が取得される。   When it is determined that the processing has not been executed for all the terms in the viewpoint (medium) (NO in step S27), the process returns to the above-described step S22 and is repeated. In this case, in step S22, a term (middle) term in which the processes in steps S22 to S26 are not executed is acquired.

一方、観点(中)の用語の全てについて処理が実行されたと判定された場合(ステップS27のYES)、成分マトリックス生成部33においては、対象節の観点(大)の用語に対応づけられている各観点(中)の用語の対象セル中の出現数および当該観点(中)の用語に対応づけられている各観点(小)の用語の対象セル中の出現数が保持されている。   On the other hand, when it is determined that the processing has been executed for all the terms in the viewpoint (medium) (YES in step S27), the component matrix generation unit 33 associates the terms with the viewpoint (large) in the target clause. The number of appearances of each viewpoint (medium) term in the target cell and the number of occurrences of each viewpoint (small) term associated with the term (medium) term in the target cell are retained.

成分マトリックス生成部33は、当該成分マトリックス生成部33において保持されている各観点(中)の用語の対象セル中の出現数および観点(小)の用語の対象セル中の出現数に基づいて、対象セルに出現する各観点(中)の延べ数を決定する(ステップS28)。なお、成分マトリックス生成部33によって決定された各観点(中)の延べ数は、成分マトリックス生成部33において保持される。   The component matrix generation unit 33, based on the number of occurrences of each viewpoint (medium) term in the target cell and the number of occurrences of the term (small) term in the target cell held in the component matrix generation unit 33, The total number of viewpoints (medium) appearing in the target cell is determined (step S28). Note that the total number of each viewpoint (medium) determined by the component matrix generation unit 33 is held in the component matrix generation unit 33.

ステップS28の処理においては、観点(中)の用語の対象セル中の出現数を、当該観点(中)の用語の延べ数とする。また、観点(中)の用語とともに、当該観点(中)の用語に対応づけて観点情報格納部22に格納されている観点(小)の用語が対象セル中に出現している場合には、当該観点(小)の用語の対象セル中の出現数は、当該観点(中)の用語の延べ数として加算される。更に、観点(中)の用語が対象セル中に出現せず、当該観点(中)の用語に対応づけて観点情報格納部22に格納されている観点(小)の用語が対象セル中に出現している場合には、当該観点(小)の用語の対象セル中の出現数は、その他(の観点(中))の延べ数として加算する。   In the process of step S28, the number of occurrences of the term (middle) term in the target cell is set as the total number of terms of the term (middle). In addition to the viewpoint (medium) term, when the viewpoint (small) term stored in the viewpoint information storage unit 22 in association with the viewpoint (middle) term appears in the target cell, The number of appearances of the term (small) term in the target cell is added as the total number of terms of the term (medium). Further, the viewpoint (medium) term does not appear in the target cell, and the viewpoint (small) term stored in the viewpoint information storage unit 22 in association with the viewpoint (medium) term appears in the target cell. If this is the case, the number of occurrences of the term (small) term in the target cell is added as the total number of other (point of view (medium)).

ここで、前述した図3を参照して、ステップS28の処理について具体的に説明する。ここでは、対象節に指定されている観点(大)の用語が「可用性」であるものとして説明する。   Here, with reference to FIG. 3 mentioned above, the process of step S28 is demonstrated concretely. Here, the description will be made assuming that the viewpoint (large) term specified in the target section is “availability”.

例えば観点(中)の用語「バックアップ」が対象セル中に1つ出現している場合を想定する。この場合、観点(中)の用語「バックアップ」の対象セル中の出現数は1であるため、観点(中)の用語「バックアップ」の延べ数は1に決定される。   For example, it is assumed that one “backup” term (medium) appears in the target cell. In this case, since the number of occurrences of the term “backup” in the viewpoint (medium) in the target cell is 1, the total number of the term “backup” in the viewpoint (middle) is determined to be 1.

また、例えば観点(中)の用語「バックアップ」および「業務継続」が対象セル中に1つずつ出現している場合を想定する。この場合、観点(中)の用語「バックアップ」の対象セル中の出現数は1であるため、観点(中)の用語「バックアップ」の延べ数は1に決定される。また、観点(中)の用語「業務継続」の対象セル中の出現数は1であるため、観点(中)の用語「業務継続」の述べ数は1に決定される。   Further, for example, a case is assumed where the terms “backup” and “business continuity” in the viewpoint (medium) appear one by one in the target cell. In this case, since the number of occurrences of the term “backup” in the viewpoint (medium) in the target cell is 1, the total number of the term “backup” in the viewpoint (middle) is determined to be 1. In addition, since the number of appearances of the term “business continuation” in the viewpoint (medium) in the target cell is 1, the number of statements of the term “business continuation” in the viewpoint (middle) is determined to be 1.

また、例えば観点(中)の用語「バックアップ」が対象セル中に1つ出現し、観点(小)の用語「データ量」および「時間帯」が対象セル中に1つずつ出現している場合を想定する。この場合、観点(小)の用語「データ量」および「時間帯」は観点(中)の用語「バックアップ」に対応づけられている用語であるため、観点(小)の用語「データ量」および「時間帯」の対象セル中の出現数は観点(中)の用語「バックアップ」の延べ数に加算される。したがって、観点(中)の用語「バックアップ」の延べ数は3に決定される。   For example, when the term “backup” in the viewpoint (medium) appears in the target cell, and the terms “data amount” and “time zone” in the viewpoint (small) appear one by one in the target cell. Is assumed. In this case, the terms “data amount” and “time zone” in the viewpoint (small) are terms associated with the term “backup” in the viewpoint (medium), and therefore the terms “data amount” and The number of occurrences of the “time zone” in the target cell is added to the total number of terms “backup” in the viewpoint (medium). Therefore, the total number of terms “backup” in the viewpoint (medium) is determined to be 3.

また、対象セル中に観点(中)の用語「バックアップ」が対象セル中に1つ出現し、観点(小)の用語「データ量」が対象セル中に1つ出現し、観点(小)の用語「役割」が対象セル中に1つ出現している場合を想定する。この場合、観点(小)の用語「データ量」は観点(中)の用語「バックアップ」に対応づけられている用語であるため、観点(小)の用語「データ量」の対象セル中の出現数は観点(中)の用語「バックアップ」の延べ数に加算される。したがって、観点(中)の用語「バックアップ」の延べ数は2に決定される。また、観点(小)の用語「役割」に対応づけて観点情報格納部22に格納されている観点(中)の用語「業務継続」は対象セル中に出現していないため、当該観点(小)の用語「役割」の対象セル中の出現数は「その他」の延べ数に加算される。したがって、「その他」の延べ数は1に決定される。   In addition, the viewpoint (medium) term “backup” appears in the target cell, and the viewpoint (small) term “data amount” appears in the target cell. Assume that one term “role” appears in the target cell. In this case, since the term “data amount” of the viewpoint (small) is a term associated with the term “backup” of the viewpoint (medium), the appearance of the term “data amount” of the viewpoint (small) in the target cell. The number is added to the total number of terms “backup” in the perspective (medium). Accordingly, the total number of terms “backup” in the viewpoint (medium) is determined to be two. Further, the viewpoint (medium) term “business continuation” stored in the viewpoint information storage unit 22 in association with the viewpoint (small) term “role” does not appear in the target cell. The number of occurrences of the term “role” in the target cell is added to the total number of “others”. Therefore, the total number of “others” is determined to be 1.

また、例えば観点(小)の用語「データ量」および観点(小)の用語「役割」が対象セル中に1つずつ出現している場合を想定する。この場合、当該観点(小)の用語「データ量」に対応づけて観点情報格納部22に格納されている観点(中)の用語「バックアップ」および当該観点(小)の用語「役割」に対応づけて観点情報格納部22に格納されている観点(中)の用語「業務継続」は対象セル中に出現していないため、当該観点(小)の用語「データ量」および「役割」の対象セル中の出現数は観点(中)「その他」の延べ数に加算される。したがって、観点(中)「その他」の延べ数は2に決定される。   Further, for example, it is assumed that the viewpoint (small) term “data amount” and the viewpoint (small) term “role” appear one by one in the target cell. In this case, corresponding to the term “backup” of the viewpoint (middle) and the term “role” of the viewpoint (small) stored in the viewpoint information storage unit 22 in association with the term “data amount” of the viewpoint (small) Since the term “business continuation” of the viewpoint (medium) stored in the viewpoint information storage unit 22 does not appear in the target cell, the terms “data amount” and “role” of the viewpoint (small) The number of occurrences in the cell is added to the total number of viewpoints (medium) “others”. Therefore, the total number of viewpoints (medium) “others” is determined to be two.

上記したようにステップS28の処理が実行されると、成分マトリックス生成部33は、対象節を構成する全てのセルについて上記したステップS21〜S28の処理が実行されたか否かを判定する(ステップS29)。   When the process of step S28 is executed as described above, the component matrix generation unit 33 determines whether or not the processes of steps S21 to S28 described above have been executed for all the cells constituting the target clause (step S29). ).

全てのセルについて処理が実行されていないと判定された場合(ステップS29のNO)、上記したステップS21に戻って処理が繰り返される。この場合、ステップS21においては、ステップS21〜S28の処理が実行されていないセルが取得される。   When it is determined that the process has not been executed for all the cells (NO in step S29), the process returns to the above-described step S21 and is repeated. In this case, in step S21, a cell in which the processes in steps S21 to S28 are not executed is acquired.

一方、全てのセルについて処理が実行されたと判定された場合(ステップS29のYES)、成分マトリックス生成部33においては、対象節を構成するセル毎に、各観点(中)の用語の延べ数が保持されている。   On the other hand, when it is determined that the processing has been executed for all the cells (YES in step S29), the component matrix generation unit 33 holds the total number of terms in each viewpoint (medium) for each cell constituting the target clause. Has been.

成分マトリックス生成部33は、対象節を構成するセル毎の各観点(中)の用語の延べ数を合計した値を含む延べ数成分マトリックスを生成する(ステップS30)。   The component matrix generation unit 33 generates a total number component matrix including a value obtained by summing up the total number of terms in each viewpoint (medium) for each cell constituting the target clause (step S30).

ここで、図12は、成分マトリックス生成部33によって生成された延べ数成分マトリックスのデータ構造の一例を示す。ここでは、対象節「10.2 バックアップ方針」に対して延べ数成分マトリックス生成処理が実行されることによって生成された延べ数成分マトリックスの一例を示す。   Here, FIG. 12 shows an example of the data structure of the total number component matrix generated by the component matrix generation unit 33. Here, an example of the total number component matrix generated by executing the total number component matrix generation process for the target clause “10.2 backup policy” is shown.

図12に示す例によれば、対象節(を構成する全てのセル)において観点(中)の用語「バックアップ」の延べ数が22であり、「その他」の延べ数が11であることが示されている。   The example shown in FIG. 12 shows that the total number of terms “backup” in the viewpoint (medium) is 22 and the total number of “others” is 11 in the target clause (all cells constituting the target section). Yes.

つまり、図12に示すような延べ数成分マトリックスによれば、対象節「10.2 バックアップ方針」において、主として観点(中)「バックアップ」について詳細に記述されていることが表されている。   That is, according to the total number component matrix as shown in FIG. 12, it is expressed that the viewpoint (medium) “backup” is mainly described in detail in the target section “10.2 backup policy”.

なお、上述したように、観点(中)成分マトリックス生成処理(図9に示すステップS11〜S17)および延べ数成分マトリックス生成処理(図11に示すステップS21〜S27)の処理は共通している。このため、観点(中)成分マトリックス生成処理(図9に示すステップS11〜S17)の処理結果を利用することによって、延べ数成分マトリックス生成処理において同様の処理を省略することも可能である。   As described above, the viewpoint (medium) component matrix generation processing (steps S11 to S17 shown in FIG. 9) and the total number component matrix generation processing (steps S21 to S27 shown in FIG. 11) are common. For this reason, by using the processing result of the viewpoint (medium) component matrix generation process (steps S11 to S17 shown in FIG. 9), it is possible to omit the same process in the total number component matrix generation process.

次に、図13のフローチャートを参照して、前述した観点(大)成分マトリックス生成処理(図7に示すステップS5の処理)の処理手順について説明する。この観点(大)成分マトリックス生成処理は、例えば評価者が対象文書の内容を判断するために有用な表であって、上述した観点(中)成分マトリックスと比較してより上位の視点で表した表(観点(大)成分マトリックス)を生成するための処理である。   Next, the processing procedure of the viewpoint (large) component matrix generation process (the process of step S5 shown in FIG. 7) will be described with reference to the flowchart of FIG. This viewpoint (large) component matrix generation process is a useful table for the evaluator to judge the contents of the target document, for example, and is expressed from a higher viewpoint than the viewpoint (medium) component matrix described above. This is a process for generating a table (viewpoint (large) component matrix).

なお、前述した観点(中)成分マトリックス生成処理および延べ数成分マトリックス生成処理の場合と同様に、文書入力部31によって入力された文書を対象文書、当該対象文書を構成する節のうち観点(大)成分マトリックス生成処理の対象となる節を対象節と称する。   As in the case of the viewpoint (medium) component matrix generation process and the total number component matrix generation process described above, the document input by the document input unit 31 is the target document, and the viewpoint (large) among the sections constituting the target document. A clause that is a target of component matrix generation processing is referred to as a target clause.

まず、成分マトリックス生成部33は、対象文書を参照して、対象節を構成するセルの数をカウントする(ステップS31)。   First, the component matrix generation unit 33 refers to the target document and counts the number of cells constituting the target clause (step S31).

次に、成分マトリックス生成部33は、対象節の観点(大)の用語を特定する(ステップS32)。この場合、成分マトリックス生成部33は、例えば上述した観点(中)成分マトリックス生成処理において生成された観点(中)成分マトリックス(例えば、図10に示す観点(中)成分マトリックス)を参照して、値(セル数)が記述されている観点(中)に対応づけられている観点(大)の用語を対象節の観点(大)の用語として特定する。   Next, the component matrix production | generation part 33 pinpoints the term of view (large) of an object clause (step S32). In this case, the component matrix generation unit 33 refers to, for example, the viewpoint (medium) component matrix generated in the above-described viewpoint (medium) component matrix generation processing (for example, the viewpoint (medium) component matrix shown in FIG. 10), The viewpoint (large) term associated with the viewpoint (middle) in which the value (number of cells) is described is specified as the viewpoint (large) term of the target section.

なお、ステップS32の処理においては、前述したように対象文書を参照して対象節に指定されている観点(大)の用語に基づいて対象節の観点(大)の用語を特定してもよいし、観点(大)取得部32によって取得された対象節の観点(大)の用語を用いても構わない。   In the process of step S32, as described above, the viewpoint (large) term of the target section may be specified based on the viewpoint (large) term specified in the target section with reference to the target document. In addition, the viewpoint (large) term of the target clause acquired by the viewpoint (large) acquisition unit 32 may be used.

成分マトリックス生成部33は、ステップS32において特定された観点(大)の用語に対応づけてステップS31においてカウントされたセルの数を含む観点(大)成分マトリックスを生成する(ステップS33)。   The component matrix generation unit 33 generates a viewpoint (large) component matrix that includes the number of cells counted in step S31 in association with the viewpoint (large) term specified in step S32 (step S33).

ここで、図14は、成分マトリックス生成部33によって生成された観点(大)成分マトリックスのデータ構造の一例を示す。ここでは、対象節「10.2 バックアップ方針」に対して観点(大)成分マトリックス生成処理が実行されることによって生成された観点(大)成分マトリックスの一例を示す。   Here, FIG. 14 shows an example of the data structure of the viewpoint (large) component matrix generated by the component matrix generation unit 33. Here, an example of the viewpoint (large) component matrix generated by executing the viewpoint (large) component matrix generation process for the target clause “10.2 backup policy” is shown.

図14に示す例によれば、対象節を構成するセルの数が39であり、当該対象節が上位の視点として「可用性」について記述されていることが示されている。   The example shown in FIG. 14 shows that the number of cells constituting the target clause is 39, and that the target clause is described as “availability” as an upper viewpoint.

なお、上述した図7においては、図9に示す観点(中)成分マトリックス生成処理、図11に示す延べ数成分マトリックス生成処理および図13に示す観点(大)成分マトリックス生成処理の順に処理が実行されるものとして説明したが、これらの各処理の順番は適宜入れ替えられても構わない。   In FIG. 7 described above, the processing is executed in the order of the viewpoint (medium) component matrix generation processing shown in FIG. 9, the total number component matrix generation processing shown in FIG. 11, and the viewpoint (large) component matrix generation processing shown in FIG. Although described as an example, the order of these processes may be changed as appropriate.

次に、図15のフローチャートを参照して、前述した自動評価処理(図7に示すステップS7の処理)の処理手順について説明する。   Next, with reference to the flowchart of FIG. 15, the processing procedure of the automatic evaluation process described above (the process of step S7 shown in FIG. 7) will be described.

この自動評価処理においては、文書入力部31によって入力された文書を評価する際に参考となる評価情報が実績格納部23から取得される。なお、自動評価処理は、文書成分分析装置に含まれる類似プロジェクト特定部35および評価取得部36によって実行される。   In this automatic evaluation process, evaluation information that is used as a reference when evaluating a document input by the document input unit 31 is acquired from the result storage unit 23. The automatic evaluation process is executed by the similar project identification unit 35 and the evaluation acquisition unit 36 included in the document component analysis apparatus.

ここでは、実績格納部23には、過去の文書に記述されているプロジェクト毎に、当該プロジェクトの概要を示すプロジェクト情報、当該文書に対して生成された各成分マトリックス(観点(中)成分マトリックス、延べ数成分マトリックスおよび観点(大)成分マトリックス)および当該文書の評価を示す評価情報が対応づけて蓄積(格納)されているものとする。なお、実績格納部23に格納されている評価情報は、文書を評価する評価者によって作成され、評価入力部38によって入力されたものである。   Here, in the result storage unit 23, for each project described in the past document, project information indicating the outline of the project, each component matrix (perspective (medium) component matrix) generated for the document, Assume that the total number component matrix and the viewpoint (large) component matrix) and evaluation information indicating the evaluation of the document are accumulated (stored) in association with each other. Note that the evaluation information stored in the result storage unit 23 is created by an evaluator who evaluates a document and is input by the evaluation input unit 38.

また、実績格納部23には、上記したように文書入力部31によって入力された文書(評価の対象となる文書)に記述されているプロジェクトの概要を示すプロジェクト情報および当該文書に対して生成された各成分マトリックス(観点(中)成分マトリックス、延べ数成分マトリックスおよび観点(大)成分マトリックス)が対応づけて格納されているものとする。   Further, in the result storage unit 23, as described above, the project information indicating the outline of the project described in the document (document to be evaluated) input by the document input unit 31 and the generated document are generated. Each component matrix (a viewpoint (medium) component matrix, a total number component matrix, and a viewpoint (large) component matrix) is stored in association with each other.

以下、文書入力部31によって入力された文書に記述されているプロジェクトを対象プロジェクトと称し、当該対象プロジェクトの概要を示すプロジェクト情報を対象プロジェクト情報と称する。   Hereinafter, a project described in a document input by the document input unit 31 is referred to as a target project, and project information indicating an outline of the target project is referred to as target project information.

まず、類似プロジェクト特定部35は、対象プロジェクト情報を取得する(ステップS41)。   First, the similar project specifying unit 35 acquires target project information (step S41).

また、類似プロジェクト特定部35は、対象プロジェクト情報に対応づけて実績格納部23に格納されている観点(中)成分マトリックス、延べ数成分マトリックスおよび観点(大)成分マトリックスを取得する(ステップS42)。   Further, the similar project specifying unit 35 acquires the viewpoint (medium) component matrix, the total number component matrix, and the viewpoint (large) component matrix stored in the result storage unit 23 in association with the target project information (step S42).

次に、類似プロジェクト特定部35は、実績格納部23に格納されているプロジェクト情報および各成分マトリックスを参照して、文書入力部31によって入力された文書に記述されているプロジェクト(対象プロジェクト)と類似するプロジェクトを検索(特定)する。   Next, the similar project specifying unit 35 refers to the project information and each component matrix stored in the result storage unit 23, and the project (target project) described in the document input by the document input unit 31. Search for (identify) similar projects.

この場合、類似プロジェクト特定部35は、対象プロジェクト以外のプロジェクト(つまり、実績格納部23に格納されている対象プロジェクト情報以外のプロジェクト情報)の各々について以下のステップS43〜S45の処理を実行する。以下、ステップS43〜S45の処理の対象となるプロジェクト(プロジェクト情報)を類似候補プロジェクト(類似候補プロジェクト情報)と称する。   In this case, the similar project specifying unit 35 executes the following steps S43 to S45 for each of the projects other than the target project (that is, project information other than the target project information stored in the result storage unit 23). Hereinafter, the project (project information) to be processed in steps S43 to S45 is referred to as a similar candidate project (similar candidate project information).

まず、類似プロジェクト特定部35は、類似候補プロジェクト情報を実績格納部23から取得する(ステップS43)。   First, the similar project specifying unit 35 acquires similar candidate project information from the result storage unit 23 (step S43).

次に、類似プロジェクト特定部35は、ステップS43において取得された類似候補プロジェクト情報に対応づけて実績格納部23に格納されている観点(中)成分マトリックス、延べ数成分マトリックスおよび観点(大)成分マトリックスを取得する(ステップS44)。   Next, the similar project specifying unit 35 associates the similar candidate project information acquired in step S43 with the viewpoint (medium) component matrix, the total number component matrix, and the viewpoint (large) component matrix stored in the result storage unit 23. Is acquired (step S44).

類似プロジェクト特定部35は、ステップS41において取得された対象プロジェクト情報をステップS43において取得された類似候補プロジェクト情報と比較し、ステップS42において取得された対象プロジェクト情報の各成分マトリックスをステップS44において取得された類似候補プロジェクト情報の各成分マトリックスと比較することによって、対象プロジェクトと類似候補プロジェクトとの類似度を算出する(ステップS45)。   The similar project specifying unit 35 compares the target project information acquired in step S41 with the similar candidate project information acquired in step S43, and each component matrix of the target project information acquired in step S42 is acquired in step S44. The degree of similarity between the target project and the similar candidate project is calculated by comparing with each component matrix of the similar candidate project information (step S45).

ここで、対象プロジェクトと類似候補プロジェクトとの類似度の算出処理について具体的に説明する。類似プロジェクト特定部35によって算出される対象プロジェクトと類似候補プロジェクトとの類似度には、プロジェクト情報の類似度および成分マトリックスの類似度が含まれる。   Here, the calculation process of the similarity between the target project and the similar candidate project will be specifically described. The similarity between the target project and the similar candidate project calculated by the similar project specifying unit 35 includes the similarity of the project information and the similarity of the component matrix.

まず、プロジェクト情報の類似度について説明する。ここでは、プロジェクト情報(対象プロジェクト情報および類似候補プロジェクト情報)が前述した図4に示すようなデータ構造を有しているものとする。この場合、対象プロジェクト情報および類似候補プロジェクト情報に含まれる業種が同一であれば、プロジェクト情報の類似度に10が加算される。また、対象プロジェクト情報および類似候補プロジェクト情報に含まれる製品ランクが同一であれば、プロジェクト情報の類似度に5が加算される。また、対象プロジェクト情報および類似候補プロジェクト情報に含まれる規模が同一であれば、プロジェクト情報の類似度に8が加算される。更に、対象プロジェクト情報および類似候補プロジェクト情報に含まれる期間の誤差が1ヶ月未満であればプロジェクト情報の類似度に5が加算され、誤差が2ヶ月未満であればプロジェクト情報の類似度に4が加算される。このようにプロジェクト情報の類似度は、対象プロジェクト情報および類似候補プロジェクト情報の各項目に対する類似度を加算することによって算出される。   First, the similarity of project information will be described. Here, it is assumed that the project information (target project information and similar candidate project information) has a data structure as shown in FIG. In this case, if the business types included in the target project information and the similar candidate project information are the same, 10 is added to the similarity of the project information. If the product ranks included in the target project information and the similar candidate project information are the same, 5 is added to the similarity of the project information. If the scales included in the target project information and the similar candidate project information are the same, 8 is added to the similarity of the project information. Further, if the error of the period included in the target project information and the similar candidate project information is less than one month, 5 is added to the similarity of the project information, and if the error is less than 2 months, 4 is added to the similarity of the project information. Is added. As described above, the similarity of the project information is calculated by adding the similarities to the items of the target project information and the similar candidate project information.

次に、成分マトリックスの類似度について説明する。成分マトリックスの類似度は、例えば対応する成分マトリックス毎に、「当該成分マトリックス(の全ての節)に記述されている値の合計値/当該成分マトリックスにおいて当該値が記述されている(セルの)数」の値の差を算出し、当該差を四捨五入した値を10から減算した値とする。   Next, the similarity of the component matrix will be described. The similarity of the component matrix is, for example, for each corresponding component matrix: “total value described in the component matrix (all clauses) / the value described in the component matrix (of the cell)” The difference between the values of “number” is calculated, and a value obtained by rounding off the difference is subtracted from 10.

つまり、ステップS42において取得された対象プロジェクト情報の観点(中)成分マトリックスおよびステップS44において取得された類似候補プロジェクト情報の観点(中)成分マトリックスの各々について「当該観点(中)成分マトリックス(の全ての節)に記述されている値の合計値/当該観点(中)成分マトリックスにおいて当該値が記述されている数」を算出し、当該算出された値の差を四捨五入した値を10から減算した値を算出する。この算出処理を延べ数成分マトリックスおよび観点(大)成分マトリックスについても実行し、当該成分マトリックス毎に算出された値の合計値を成分マトリックスの類似度とする。なお、成分マトリックスの類似度は、各成分マトリックスを用いるものであれば、他の処理によって算出されても構わない。   That is, for each of the viewpoint (middle) component matrix of the target project information acquired in step S42 and the viewpoint (middle) component matrix of the similar candidate project information acquired in step S44, "all of the corresponding viewpoint (middle) component matrix" The total value of the values described in the section) / the number in which the value is described in the viewpoint (medium) component matrix is calculated, and the value obtained by rounding the difference between the calculated values is subtracted from 10 Calculate the value. This calculation process is also executed for the total number component matrix and the viewpoint (large) component matrix, and the total value of the values calculated for each component matrix is set as the similarity of the component matrix. Note that the degree of similarity of component matrices may be calculated by other processes as long as each component matrix is used.

対象プロジェクトと類似候補プロジェクトとの類似度は、上記したように算出されたプロジェクト情報の類似度および成分マトリックスの類似度の合計値とする。   The similarity between the target project and the similar candidate project is the total value of the similarity of the project information and the similarity of the component matrix calculated as described above.

なお、対象プロジェクトと類似候補プロジェクトとの類似度は、上記した以外の他の方法で算出されても構わない。また、対象プロジェクトと類似候補プロジェクトとの類似度は、プロジェクト情報および各成分マトリックスの全てを用いて算出されなくてもよく、例えばプロジェクト情報のみを用いて算出されてもよいし、各成分マトリックスのみを用いて算出されてもよい。   Note that the degree of similarity between the target project and the similar candidate project may be calculated by a method other than those described above. Also, the similarity between the target project and the similar candidate project may not be calculated using all of the project information and each component matrix, for example, may be calculated using only the project information, or only each component matrix It may be calculated using

上記したようにステップS45において対象プロジェクトと類似候補プロジェクトとの類似度が算出されると、類似プロジェクト特定部35は、対象プロジェクト以外のプロジェクト(実績格納部23に格納されている対象プロジェクト情報以外のプロジェクト情報)の全てについて上記したステップS43〜S45の処理が実行されたか否かを判定する(ステップS46)。   As described above, when the similarity between the target project and the similar candidate project is calculated in step S45, the similar project specifying unit 35 selects a project other than the target project (other than the target project information stored in the result storage unit 23). It is determined whether or not the processing of steps S43 to S45 described above has been executed for all of the project information) (step S46).

全てのプロジェクトについて処理が実行されていないと判定された場合(ステップS46のNO)、上記したステップS43に戻って処理が繰り返される。この場合、ステップS43〜S45の処理が実行されていないプロジェクトを類似候補プロジェクトとして処理が実行される。   When it is determined that the processing has not been executed for all the projects (NO in step S46), the process returns to the above-described step S43 and is repeated. In this case, a process that is not executed in steps S43 to S45 is executed as a similar candidate project.

一方、全てのプロジェクトについて処理が実行されていると判定された場合(ステップS46のYES)、類似プロジェクト特定部35は、算出された対象プロジェクトとの類似度が最も高いプロジェクト(類似候補プロジェクト)を当該対象プロジェクトに類似するプロジェクト(類似プロジェクト)として特定する(ステップS47)。   On the other hand, when it is determined that the processing is executed for all the projects (YES in step S46), the similar project specifying unit 35 selects a project (similar candidate project) having the highest similarity with the calculated target project. A project similar to the target project (similar project) is specified (step S47).

次に、評価取得部36は、類似プロジェクト特定部35によって特定された類似プロジェクトの評価情報(つまり、当該類似プロジェクトの概要を示すプロジェクト情報に対応づけて実績格納部23に格納されている評価情報)を取得する(ステップS48)。なお、このように評価取得部36によって取得された評価情報は、類似プロジェクトが記述された過去の文書に対する評価を示す情報である。   Next, the evaluation acquisition unit 36 evaluates the similar project identified by the similar project identifying unit 35 (that is, the evaluation information stored in the result storage unit 23 in association with the project information indicating the outline of the similar project). ) Is acquired (step S48). Note that the evaluation information acquired by the evaluation acquisition unit 36 in this way is information indicating an evaluation of a past document in which a similar project is described.

評価取得部36によって取得された評価情報は、上述したように文書入力部31によって入力された文書(評価の対象となる文書)に対して生成された観点(中)成分マトリックス、延べ数成分マトリックスおよび観点(大)成分マトリックスとともに、提示部37を介して当該文書の評価者に対して提示される。なお、評価情報が提示される場合、上記した対象プロジェクトと類似プロジェクトとの類似度がともに提示されてもよい。   The evaluation information acquired by the evaluation acquisition unit 36 includes the viewpoint (medium) component matrix, the total number component matrix, and the total number component matrix generated for the document (document to be evaluated) input by the document input unit 31 as described above. Along with the viewpoint (large) component matrix, it is presented to the evaluator of the document via the presentation unit 37. When the evaluation information is presented, the similarity between the target project and the similar project may be presented together.

上記したように本実施形態においては、文字列を含む複数のセル(構成要素)から構成される文書であって、観点(大)の用語(第1の文字列)が指定された文書を入力し、当該指定された観点(大)の用語に対応づけて観点情報格納部22に格納されている観点(中)の用語(第2の文字列)を取得し、入力された文書を構成するセル毎に、当該セルに含まれる観点(中)の用語の数を特定し、当該セル毎に特定された観点(中)の用語の数に基づいて、当該セル毎に、当該セルの観点(中)を表す観点(中)の用語を決定し、当該観点(中)の用語が決定されたセルの数を含む観点(中)成分マトリックス(第1の成分マトリックス)を生成し、当該生成された観点(中)成分マトリックスを提示する構成により、文書を評価する評価者が観点(中)成分マトリックスを参考にして当該文書の内容の網羅性を容易に把握することができるため、評価者による文書の評価を支援することが可能となる。   As described above, in this embodiment, a document composed of a plurality of cells (components) including a character string, in which a viewpoint (large) term (first character string) is designated, is input. Then, the viewpoint (middle) term (second character string) stored in the viewpoint information storage unit 22 in association with the designated viewpoint (large) term is acquired, and the input document is configured. For each cell, identify the number of terms (middle) terms included in the cell, and for each cell, based on the number of terms (middle) terms identified for the cell, Determining the term (medium) term representing the medium), generating a point (middle) component matrix (first component matrix) including the number of cells in which the term (middle) term is determined, Evaluator who evaluates the document with a configuration that presents the middle (main) component matrix Since then viewpoint Medium ingredient matrix reference can easily grasp the completeness of the contents of the document, it is possible to support the evaluation of the document by the evaluator.

更に、本実施形態においては、指定された観点(大)の用語に対応づけられている観点(中)の用語に対応づけて観点情報格納部22に格納されている観点(小)の用語(第3の文字列)を取得し、入力された文書を構成するセル毎に、当該セルに含まれる観点(小)の用語の数を特定し、当該セル毎に特定された観点(中)の用語の数および観点(小)の用語の数に基づいて、当該セル毎に、当該セルの観点を表す観点(中)の用語を決定することにより、観点(小)の用語を考慮したより詳細な観点(中)成分マトリックスを生成することができる。   Further, in the present embodiment, the viewpoint (small) term (stored in the viewpoint information storage unit 22 in association with the viewpoint (medium) term associated with the designated viewpoint (large) term ( (Third character string) is acquired, the number of viewpoint (small) terms included in the cell is specified for each cell constituting the input document, and the viewpoint (medium) specified for the cell is specified. Based on the number of terms and the number of terms in terms (small), for each cell, determine the terms in terms of perspective (medium) that represent the perspective of the cell, and more detailed considering the terms in terms of perspective (small) A (mid) component matrix can be generated.

また、本実施形態においては、セル毎に特定された観点(中)の用語の数および観点(小)の用語の数を含む延べ数成分マトリックス(第2の成分マトリックス)を生成し、当該生成された延べ数成分マトリックスを提示する構成により、文書を評価する評価者が延べ数成分マトリックスを参考にして当該文書の内容の詳細度を容易に把握することができるため、評価者による文書の評価をより支援することが可能となる。   Further, in the present embodiment, a total number component matrix (second component matrix) including the number of viewpoint (medium) terms specified for each cell and the number of viewpoint (small) terms is generated and generated. In addition, the configuration that presents the total number component matrix allows the evaluator who evaluates the document to easily understand the level of detail of the document with reference to the total number component matrix. It becomes possible to do.

更に、本実施形態においては、指定された観点(大)の用語および入力された文書を構成するセルの数を含む観点(大)成分マトリックス(第3の成分マトリックス)を生成し、当該観点(大)成分マトリックスを提示する構成により、例えばシステム開発等に携わっていない評価者であっても、上記した観点(中)成分マトリックスと比較してより上位の視点で文書の内容を把握することが可能となる。   Furthermore, in the present embodiment, a viewpoint (large) component matrix (third component matrix) including the term of the designated viewpoint (large) and the number of cells constituting the input document is generated, and the viewpoint (third component matrix) is generated. Large) By presenting the component matrix, even evaluators who are not engaged in system development, for example, can grasp the content of the document from a higher viewpoint than the above viewpoint (medium) component matrix It becomes possible.

また、本実施形態においては、入力された文書から生成された成分マトリックスと実績格納部23に格納されている成分マトリックスとを比較することによって類似度を算出し、当該算出された類似度に基づいて、当該成分マトリックスに対応づけて実績格納部23に格納されている評価情報を提示する構成により、評価の対象となる文書に類似する文書(当該評価の対象となる文書に記述されているプロジェクトに類似するプロジェクトの内容が記述された文書)に対する評価情報を参照して当該評価対象となる文書の評価を行うことが可能となる。   In the present embodiment, the similarity is calculated by comparing the component matrix generated from the input document and the component matrix stored in the result storage unit 23, and based on the calculated similarity. Thus, a document similar to the document to be evaluated (a project described in the document to be evaluated) is configured by presenting the evaluation information stored in the result storage unit 23 in association with the component matrix. It is possible to evaluate the document to be evaluated with reference to the evaluation information for the document in which the content of the project similar to is described.

更に、本実施形態においては、入力された文書に記述されているプロジェクトの概要を示す情報(第2の関連情報)と実績格納部23に格納されているプロジェクト情報(第1の関連情報)とを比較することによって類似度を算出し、当該算出された類似度に基づいて、当該プロジェクト情報に対応づけて実績格納部23に格納されている評価情報を提示することも可能である。   Furthermore, in the present embodiment, information (second related information) indicating the outline of the project described in the input document, project information (first related information) stored in the result storage unit 23, and It is also possible to calculate the similarity by comparing the two, and present the evaluation information stored in the record storage unit 23 in association with the project information based on the calculated similarity.

なお、本実施形態においては、観点(中)成分マトリックス、延べ数成分マトリックス、観点(大)成分マトリックスおよび評価情報が提示されるものとして説明したが、例えば観点(中)成分マトリックスのみが提示されるような構成であっても構わない。   In the present embodiment, the viewpoint (medium) component matrix, the total number component matrix, the viewpoint (large) component matrix, and the evaluation information are presented. However, for example, only the viewpoint (medium) component matrix is presented. Such a configuration may be used.

なお、上記した各実施形態に記載した手法は、コンピュータに実行させることのできるプログラムとして、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスクなど)、光ディスク(CD−ROM、DVDなど)光磁気ディスク(MO)、半導体メモリなどの記憶媒体に格納して頒布することもできる。   The method described in each of the above-described embodiments is a program that can be executed by a computer, such as a magnetic disk (floppy (registered trademark) disk, hard disk, etc.), an optical disk (CD-ROM, DVD, etc.), a magneto-optical disk ( MO), and can be stored and distributed in a storage medium such as a semiconductor memory.

また、この記憶媒体としては、プログラムを記憶でき、かつコンピュータが読み取り可能な記憶媒体であれば、その記憶形式は何れの形態であってもよい。   In addition, as long as the storage medium can store a program and can be read by a computer, the storage format may be any form.

また、記憶媒体からコンピュータにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワークソフト等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。   In addition, an OS (operating system) operating on the computer based on an instruction of a program installed in the computer from the storage medium, MW (middleware) such as database management software, network software, and the like implement the present embodiment. A part of each process may be executed.

更に、本発明における記憶媒体は、コンピュータと独立した媒体に限らず、LANやインターネット等により伝送されたプログラムをダウンロードして記憶または一時記憶した記憶媒体も含まれる。   Furthermore, the storage medium in the present invention is not limited to a medium independent of a computer, but also includes a storage medium in which a program transmitted via a LAN or the Internet is downloaded and stored or temporarily stored.

また、記憶媒体は1つに限らず、複数の媒体から本実施形態における処理が実行される場合も本発明における記憶媒体に含まれ、媒体構成は何れの構成であってもよい。   Further, the number of storage media is not limited to one, and the case where the processing in the present embodiment is executed from a plurality of media is also included in the storage media in the present invention, and the media configuration may be any configuration.

なお、本発明におけるコンピュータは、記憶媒体に記憶されたプログラムに基づき、本実施形態における各処理を実行するものであって、パソコン等の1つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であってもよい。   The computer according to the present invention executes each process according to the present embodiment based on a program stored in a storage medium, and includes a single device such as a personal computer or a system in which a plurality of devices are connected to a network. Any configuration may be used.

また、本発明におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本発明の機能を実現することが可能な機器、装置を総称している。   In addition, the computer in the present invention is not limited to a personal computer, but includes an arithmetic processing device, a microcomputer, and the like included in an information processing device, and is a generic term for devices and devices that can realize the functions of the present invention by a program. .

なお、本願発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に亘る構成要素を適宜組合せてもよい。   Note that the present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. Moreover, various inventions can be formed by appropriately combining a plurality of constituent elements disclosed in the embodiment. For example, some components may be deleted from all the components shown in the embodiment. Furthermore, constituent elements over different embodiments may be appropriately combined.

10…コンピュータ、20…外部記憶装置、22…観点情報格納部、23…実績格納部、30…文書成分分析装置、31…文書入力部、32…観点特定部、33…成分マトリクス生成部、34…プロジェクト情報入力部、35…類似プロジェクト特定部、36…評価取得部、37…提示部、38…評価入力部。   DESCRIPTION OF SYMBOLS 10 ... Computer, 20 ... External storage device, 22 ... Perspective information storage part, 23 ... Performance storage part, 30 ... Document component analyzer, 31 ... Document input part, 32 ... Perspective identification part, 33 ... Component matrix production | generation part, 34 ... project information input part, 35 ... similar project specifying part, 36 ... evaluation acquisition part, 37 ... presentation part, 38 ... evaluation input part.

Claims (7)

予め定められている基準または標準として文書に記述すべき項目を表す第1の文字列および当該第1の文字列より詳細な項目を表す第2の文字列を対応づけて格納する観点情報格納手段と、
文字列を含む複数の構成要素から構成される複数の部分文書から構成される文書であって、前記観点情報格納手段に格納されている第1の文字列が当該部分文書毎に指定された文書を入力する文書入力手段と、
前記入力された文書を構成する構成要素毎に、当該構成要素に含まれる前記指定された第1の文字列に対応づけて前記観点情報格納手段に格納されている第2の文字列の数を特定する特定手段と、
前記構成要素毎に特定された第2の文字列の数に基づいて、当該構成要素毎に、当該構成要素の観点を表す第2の文字列を決定する決定手段と、
前記部分文書を示す部分文書名と、前記格納された第2の文字列とが各軸に配置され、当該部分文書名と当該第2の文字列との交点にあたるデータとして、当該部分文書名が示す部分文書を構成する複数の構成要素のうち、前記第2の文字列が決定された構成要素の数を示すデータが配置された第1の成分マトリックスを生成する生成手段と、
前記生成された第1の成分マトリックスを提示する提示手段と
を具備することを特徴とする文書成分分析装置。
Perspective information storage means for associating and storing a first character string representing an item to be described in a document as a predetermined reference or standard and a second character string representing an item more detailed than the first character string When,
A document composed of a plurality of partial documents composed of a plurality of components including character strings, wherein the first character string stored in the viewpoint information storage means is designated for each partial document A document input means for inputting
For each component constituting the input document, the number of second character strings stored in the viewpoint information storage means in association with the designated first character string included in the component is calculated. Identification means to identify;
Determining means for determining, for each component, a second character string representing a viewpoint of the component based on the number of second character strings specified for each component;
The partial document name indicating the partial document and the stored second character string are arranged on each axis, and the partial document name is the data corresponding to the intersection of the partial document name and the second character string. Generating means for generating a first component matrix in which data indicating the number of components for which the second character string is determined among a plurality of components constituting the partial document to be displayed ;
A document component analyzing apparatus comprising: presenting means for presenting the generated first component matrix.
前記観点情報格納手段は、前記第2の文字列に対応づけて、前記第2の文字列より詳細な項目を表す第3の文字列を更に格納し、
前記特定手段は、前記入力された文書を構成する構成要素毎に、当該構成要素に含まれる、前記指定された第1の文字列に対応づけられている第2の文字列に対応づけて前記観点情報格納手段に格納されている第3の文字列の数を更に特定し、
前記決定手段は、前記構成要素毎に特定された第2の文字列の数および第3の文字列の数に基づいて、当該構成要素毎に、当該構成要素の観点を表す第2の文字列を決定する
ことを特徴とする請求項1記載の文書成分分析装置。
The viewpoint information storage means further stores a third character string representing an item more detailed than the second character string in association with the second character string;
The specifying means associates, for each component constituting the input document, the second character string associated with the designated first character string included in the component. Further specifying the number of third character strings stored in the viewpoint information storage means,
The determining means is configured to determine, based on the number of second character strings and the number of third character strings specified for each component, a second character string that represents the viewpoint of the component for each component. The document component analysis apparatus according to claim 1, wherein:
前記決定手段は、前記構成要素毎に特定された第2の文字列の数および第3の文字列の数に基づいて、当該構成要素毎に、当該構成要素に出現する第2の文字列の延べ数を更に決定し、
前記生成手段は、前記部分文書名と、前記格納された第2の文字列とが各軸に配置され、当該部分文書名と当該第2の文字列との交点にあたるデータとして、当該部分文書名が示す部分文書を構成する前記構成要素毎に決定された第2の文字列の延べ数を合計した値を示すデータが配置された第2の成分マトリックスを更に生成し、
前記提示手段は、前記生成された第2の成分マトリックスを更に提示する
ことを特徴とする請求項2記載の文書成分分析装置。
Based on the number of second character strings and the number of third character strings specified for each constituent element, the determining means determines, for each constituent element, the second character string that appears in the constituent element. Further determine the total number,
The generating unit arranges the partial document name and the stored second character string on each axis, and uses the partial document name as data corresponding to an intersection of the partial document name and the second character string. Further generating a second component matrix in which data indicating the total value of the total number of second character strings determined for each of the constituent elements constituting the partial document indicated by is arranged ,
The document component analysis apparatus according to claim 2, wherein the presenting unit further presents the generated second component matrix.
前記生成手段は、前記部分文書名と、前記格納された第1の文字列とが各軸に配置され、当該部分文書名と当該第1の文字列との交点にあたるデータとして、当該部分文書名が示す部分文書であって前記第1の文字列が指定された部分文書を構成する構成要素の数を示すデータが配置された第3の成分マトリックスを更に生成し、
前記提示手段は、前記生成された第3の成分マトリックスを更に提示する
ことを特徴とする請求項3記載の文書成分分析装置。
The generation unit includes the partial document name and the stored first character string arranged on each axis, and the partial document name as data corresponding to the intersection of the partial document name and the first character string. And further generating a third component matrix in which data indicating the number of components constituting the partial document in which the first character string is designated is arranged .
4. The document component analyzing apparatus according to claim 3, wherein the presenting unit further presents the generated third component matrix.
前記入力された文書とは異なる文書に対して生成された第1の成分マトリックスおよび当該文書に対する評価を示す評価情報を対応づけて格納する実績格納手段と、
前記生成された第1の成分マトリックスおよび前記実績格納手段に格納されている第1の成分マトリックスを比較することによって類似度を算出する算出手段と、
前記算出された類似度に基づいて、前記生成された第1の成分マトリックスと比較された第1の成分マトリックスに対応づけて前記実績格納手段に格納されている評価情報を取得する評価取得手段と
を更に具備し、
前記提示手段は、前記取得された評価情報を更に提示する
ことを特徴とする請求項1記載の文書成分分析装置。
A record storage means for storing the first component matrix generated for a document different from the input document and the evaluation information indicating the evaluation of the document in association with each other;
Calculating means for calculating a similarity by comparing the generated first component matrix and the first component matrix stored in the result storing means;
Evaluation acquisition means for acquiring evaluation information stored in the result storage means in association with the first component matrix compared with the generated first component matrix based on the calculated similarity; Further comprising
The document component analysis apparatus according to claim 1, wherein the presenting unit further presents the acquired evaluation information.
前記入力された文書とは異なる文書の内容に関連する第1の関連情報および当該文書に対する評価を示す評価情報を蓄積する実績格納手段と、
前記入力された文書の内容に関連する関連情報を入力する第2の関連情報入力手段と、
前記実績格納手段に格納されている第1の関連情報および前記関連情報入力手段によって入力された第2の関連情報を比較することによって類似度を算出する算出手段と、
前記算出された類似度に基づいて、前記第1の関連情報に対応づけて前記実績格納手段に格納されている評価情報を取得する評価取得手段と
を更に具備し、
前記提示手段は、前記取得された評価情報を更に提示する
ことを特徴とする請求項1記載の文書成分分析装置。
Record storage means for storing first related information related to the content of a document different from the input document and evaluation information indicating evaluation of the document;
Second related information input means for inputting related information related to the contents of the input document;
Calculating means for calculating the similarity by comparing the first related information stored in the record storing means and the second related information input by the related information input means;
Evaluation acquisition means for acquiring evaluation information stored in the result storage means in association with the first related information based on the calculated similarity; and
The document component analysis apparatus according to claim 1, wherein the presenting unit further presents the acquired evaluation information.
予め定められている基準または標準として文書に記述すべき項目を表す第1の文字列および当該第1の文字列より詳細な項目を表す第2の文字列を対応づけて格納する観点情報格納手段を有する外部記憶装置と、当該外部記憶装置を利用するコンピュータとから構成される文書成分分析装置において、前記コンピュータによって実行されるプログラムであって、
前記コンピュータに、
文字列を含む複数の構成要素から構成される複数の部分文書から構成される文書であって、前記観点情報格納手段に格納されている第1の文字列が当該部分文書毎に指定された文書を入力するステップと、
前記入力された文書を構成する構成要素毎に、当該構成要素に含まれる前記指定された第1の文字列に対応づけて前記観点情報格納手段に格納されている第2の文字列の数を特定するステップと、
前記構成要素毎に特定された第2の文字列の数に基づいて、当該構成要素毎に、当該構成要素の観点を表す第2の文字列を決定するステップと、
前記部分文書を示す部分文書名と、前記格納された第2の文字列とが各軸に配置され、当該部分文書名と当該第2の文字列との交点にあたるデータとして、当該部分文書名が示す部分文書を構成する複数の構成要素のうち、前記第2の文字列が決定された構成要素の数を示すデータが配置された第1の成分マトリックスを生成するステップと、
前記生成された第1の成分マトリックスを提示するステップと
を実行させるためのプログラム。
Perspective information storage means for associating and storing a first character string representing an item to be described in a document as a predetermined reference or standard and a second character string representing an item more detailed than the first character string In a document component analysis apparatus composed of an external storage device having a computer and a computer using the external storage device, a program executed by the computer,
In the computer,
A document composed of a plurality of partial documents composed of a plurality of components including character strings, wherein the first character string stored in the viewpoint information storage means is designated for each partial document A step of entering
For each component constituting the input document, the number of second character strings stored in the viewpoint information storage means in association with the designated first character string included in the component is calculated. Identifying steps;
Determining, for each constituent element, a second character string representing the viewpoint of the constituent element based on the number of second character strings specified for each constituent element;
The partial document name indicating the partial document and the stored second character string are arranged on each axis, and the partial document name is the data corresponding to the intersection of the partial document name and the second character string. Generating a first component matrix in which data indicating the number of components for which the second character string is determined among a plurality of components constituting the partial document to be shown ;
A program for executing the step of presenting the generated first component matrix.
JP2012102847A 2012-04-27 2012-04-27 Document component analysis apparatus and program Expired - Fee Related JP5535270B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012102847A JP5535270B2 (en) 2012-04-27 2012-04-27 Document component analysis apparatus and program
PCT/JP2013/062432 WO2013162011A1 (en) 2012-04-27 2013-04-26 Document component analysis device and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012102847A JP5535270B2 (en) 2012-04-27 2012-04-27 Document component analysis apparatus and program

Publications (2)

Publication Number Publication Date
JP2013232058A JP2013232058A (en) 2013-11-14
JP5535270B2 true JP5535270B2 (en) 2014-07-02

Family

ID=49483307

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012102847A Expired - Fee Related JP5535270B2 (en) 2012-04-27 2012-04-27 Document component analysis apparatus and program

Country Status (2)

Country Link
JP (1) JP5535270B2 (en)
WO (1) WO2013162011A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7074330B2 (en) * 2018-05-02 2022-05-24 学校法人 工学院大学 Verification equipment, methods, and programs

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004118262A (en) * 2002-09-24 2004-04-15 Toshiba Corp Document retrieval device, document retrieval method and document retrieval program
JP2008108264A (en) * 2007-11-15 2008-05-08 Toyoshi Fukuda Language analysis system and language analysis program

Also Published As

Publication number Publication date
WO2013162011A1 (en) 2013-10-31
JP2013232058A (en) 2013-11-14

Similar Documents

Publication Publication Date Title
US11106626B2 (en) Managing changes to one or more files via linked mapping records
US7886028B2 (en) Method and system for system migration
US7418453B2 (en) Updating a data warehouse schema based on changes in an observation model
JP6542612B2 (en) Test scenario generation support apparatus and test scenario generation support method
US8522078B2 (en) Trouble coping method for information technology system
JP2011516989A (en) Search result ranking using edit distance and document information
JP4736713B2 (en) Systems and methods to support the selection of project members
AU2016201273B2 (en) Recommending form fragments
KR101975272B1 (en) System and method for recommending component reuse based on collaboration dependency
Molka et al. Conformance checking for BPMN-based process models
JP6048957B2 (en) Information processing apparatus, program, and information processing method
JP5760732B2 (en) Business analysis device, business analysis program, and business analysis method
JP6120607B2 (en) Requirement detection apparatus and requirement detection program
JP2009069973A (en) Retrieval method, retrieval program, storage medium and information processor
JP5535270B2 (en) Document component analysis apparatus and program
Hübner et al. Using interaction data for continuous creation of trace links between source code and requirements in issue tracking systems
JP4535906B2 (en) UML model creation support method and apparatus
US20190265954A1 (en) Apparatus and method for assisting discovery of design pattern in model development environment using flow diagram
JP5615245B2 (en) Bug countermeasure priority display system
JP5309841B2 (en) TASK SEARCH DEVICE, TASK SEARCH METHOD, AND TASK SEARCH PROGRAM
JP6336919B2 (en) Source code review method and system
JP2004185346A (en) Method and system for supporting project work
JP2018060379A (en) Searching means selecting program, searching means selecting method and searching means selecting device
JP6676792B2 (en) Reviewer management system and method
JP6753190B2 (en) Document retrieval device and program

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20131205

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20131212

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20131219

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20131226

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20140109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140303

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140325

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140422

R150 Certificate of patent or registration of utility model

Ref document number: 5535270

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees