JP2020201815A - 計算機システム及び文書の評価方法 - Google Patents
計算機システム及び文書の評価方法 Download PDFInfo
- Publication number
- JP2020201815A JP2020201815A JP2019109531A JP2019109531A JP2020201815A JP 2020201815 A JP2020201815 A JP 2020201815A JP 2019109531 A JP2019109531 A JP 2019109531A JP 2019109531 A JP2019109531 A JP 2019109531A JP 2020201815 A JP2020201815 A JP 2020201815A
- Authority
- JP
- Japan
- Prior art keywords
- document
- annotation
- type
- target document
- evaluation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000011156 evaluation Methods 0.000 claims abstract description 141
- 238000004458 analytical method Methods 0.000 claims abstract description 90
- 238000012937 correction Methods 0.000 claims description 76
- 238000012986 modification Methods 0.000 claims description 61
- 230000004048 modification Effects 0.000 claims description 61
- 238000007726 management method Methods 0.000 description 30
- 238000013461 design Methods 0.000 description 17
- 238000012545 processing Methods 0.000 description 15
- 238000013523 data management Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 230000000717 retained effect Effects 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000033772 system development Effects 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】評価観点に基づいて文書を評価する方法を提供する。
【解決手段】文書の評価を行う計算機システムであって、評価観点に基づく評価が高い文書のデータを格納する文書データベースにアクセス可能であって、文字列に、評価観点に基づいて定義された複数の種別のアノテーションのうち、いずれかの種別のアノテーションを付与する文書解析部120と、ターゲット文書に含まれる文字列に付与されたアノテーションに基づいて、ターゲット文書を評価する評価部121と、を備える。評価部121は、ターゲット文書の各種別のアノテーションの割合及び文書データベースから取得された文書の各種別のアノテーションの割合を比較し、当該比較の結果に基づいて、ターゲット文書の修正が必要か否かを判定することによって、ターゲット文書を評価する。
【選択図】図1
【解決手段】文書の評価を行う計算機システムであって、評価観点に基づく評価が高い文書のデータを格納する文書データベースにアクセス可能であって、文字列に、評価観点に基づいて定義された複数の種別のアノテーションのうち、いずれかの種別のアノテーションを付与する文書解析部120と、ターゲット文書に含まれる文字列に付与されたアノテーションに基づいて、ターゲット文書を評価する評価部121と、を備える。評価部121は、ターゲット文書の各種別のアノテーションの割合及び文書データベースから取得された文書の各種別のアノテーションの割合を比較し、当該比較の結果に基づいて、ターゲット文書の修正が必要か否かを判定することによって、ターゲット文書を評価する。
【選択図】図1
Description
本発明は、文書の評価及び修正を実現するシステム及び方法に関する。
ソフトウェア開発又はシステム開発では、品質の高いソフトウェア又はシステムの設計書を作成することが求められる。近年、設計書を検査する熟練者が不足しているため、設計書の品質を維持することが困難になっている。また、人の技術及び経験のばらつきにより、検査結果に偏りが発生する場合もある。
したがって、設計書の評価及び修正を支援する技術が求められる。これに対して、特許文献1に記載の技術が知られている。
特許文献1には、「設計書評価装置は、1又は複数の検索用語を含む検索用語組合せと、検索用語組合せに関連する設計観点の種別とを関連付けた検査知識情報を記憶する記憶部と、検索用語を用いて評価対象の設計書を検索する検索部と、設計書に含まれる検索用語の数と、検索用語に関連する種別とを用いて設計書の評価情報を生成する評価部と、評価情報を出力する出力部と、を備える」ことが記載されている。
特許文献1に記載されているように、評価対象の文書における検索用語の有無及び検索用語の数等に基づく評価により、文書の傾向を知ることができる。しかし、文書の品質そのものを直接的に把握できる技術ではない。
本発明は、文書の品質等の評価観点に基づいて文書を評価するための技術を提供する。
本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、文書の評価を行う計算機システムであって、プロセッサ、メモリ、及び記憶装置を有する少なくとも一つの計算機を備え、評価観点に基づく評価が高い文書のデータを格納する文書データベースにアクセス可能であって、前記文書に含まれる文字列に、前記評価観点に基づいて定義された複数の種別のアノテーションのうち、いずれかの種別の前記アノテーションを付与する文書解析部と、前記評価観点に基づく評価を行うターゲット文書に含まれる文字列に付与された前記アノテーションに基づいて、前記ターゲット文書を評価する評価部と、を備え、前記評価部は、前記ターゲット文書の各種別の前記アノテーションの割合及び前記文書データベースから取得された比較用文書の各種別の前記アノテーションの割合を比較し、当該比較の結果に基づいて、前記ターゲット文書の修正が必要か否かを判定することによって、前記ターゲット文書を評価する。
本発明によれば、蓄積された文書を用いて、任意の評価観点に基づいて文書を評価できる。上記した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。
本明細書における用語について説明する。「文」は、完結した内容を表す最小の文字列の集合を表す。「文書」は、複数の文を含む、文字列の集合を表す。
以下、本発明の実施例を、図面を用いて説明する。ただし、本発明は以下に示す実施例の記載内容に限定して解釈されるものではない。本発明の思想ないし趣旨から逸脱しない範囲で、その具体的構成を変更し得ることは当業者であれば容易に理解される。
以下に説明する発明の構成において、同一又は類似する構成又は機能には同一の符号を付し、重複する説明は省略する。
本明細書等における「第1」、「第2」、「第3」等の表記は、構成要素を識別するために付するものであり、必ずしも、数又は順序を限定するものではない。
図面等において示す各構成の位置、大きさ、形状、及び範囲等は、発明の理解を容易にするため、実際の位置、大きさ、形状、及び範囲等を表していない場合がある。したがって、本発明では、図面等に開示された位置、大きさ、形状、及び範囲等に限定されない。
図1は、実施例1の計算機システムの構成例を示す図である。
計算機システムは、文書評価サーバ100、ファイルサーバ101、及びクライアント端末102から構成される。文書評価サーバ100、ファイルサーバ101、及びクライアント端末102は、WAN(Wide Area Network)及びLAN(Local Area Network)等のネットワークを介して互いに接続される。なお、ネットワークの接続方式は有線及び無線のいずれでもよい。
ファイルサーバ101は、文書のデータ(文書データ)を管理する。すなわち、ファイルサーバ101は文書データを管理するデータベースとして機能する。文書評価サーバ100は、文書を評価し、文書の修正の有無を判定し、また、文書の修正内容の候補を提示する。クライアント端末102はユーザが操作する端末である。
文書評価サーバ100は、CPU110、IOインタフェース111、ネットワークインタフェース112、主記憶装置113、及び副記憶装置114を有する。前述のハードウェアはバスを介して互いに接続される。
CPU110は、主記憶装置113に格納されるプログラムを実行する。CPU110がプログラムにしたがって処理を実行することによって、特定の機能を実現する機能部(モジュール)として動作する。以下の説明では、機能部を主語に処理を説明する場合、CPU110が当該モジュールを実現するプログラムを実行していることを示す。
IOインタフェース111は、入力装置115及び出力装置116等の外部装置と接続するためのインタフェースである。
ここで、入力装置115は、キーボード、マウス、及びタッチパネル等のデータを入力するための装置である。出力装置116は、ディスプレイ及びプリンタ等のデータを出力するための装置である。
ネットワークインタフェース112は、ネットワークを介して外部装置と通信するための装置である。
主記憶装置113は、CPU110が実行するプログラム及び情報を格納する記憶装置であり、例えば、メモリ等である。主記憶装置113はプログラムが一時的に使用するワークエリアとしても利用される。
ここで、主記憶装置113に格納されるプログラムについて説明する。主記憶装置113は、文書解析部120、評価部121、推薦部122、及び修正部123を実現するプログラムを格納する。主記憶装置113には、OS(Operating System)等の前述以外のプログラムが格納されてもよい。
なお、主記憶装置113に格納されるプログラムは副記憶装置114又はファイルサーバ101に格納されてもよい。この場合、CPU110が副記憶装置114又はファイルサーバ101からプログラムを取得し、主記憶装置113にロードする。
文書解析部120は、文書の各種解析を行う。文書解析部120は、後述するように、文字列に対して、評価観点に基づいて定義された複数の種別のアノテーションの中から、いずれかの種別のアノテーションを付与する。実施例1では、設計書に規定されたソフトウェアの品質が評価観点として設定される。例えば、ソフトウェアの品質の評価に関する国際規格であるISO/IEC 9126に基づいて定義されたアノテーションが設定される。
評価部121は、評価対象の文書に含まれる文字列に付与されたアノテーションに基づいて当該文書を評価し、当該文書の修正が必要か否かを判定する。文書の修正が必要な場合、評価部121は修正箇所を提示する。
推薦部122は、後述する修正履歴管理情報132を参照して、評価対象の文書の修正内容の候補を提示する。
修正部123は、評価対象の文書を修正し、また、修正内容を修正履歴管理情報132に登録する。文書の修正には、文又は文字列の追加、文又は文字列の削除、及び文又は文字列の変更が含まれる。
なお、文書評価サーバ100が有する各機能部については、複数の機能部を一つの機能部にまとめてもよいし、一つの機能部を機能毎に複数の機能部に分けてもよい。
副記憶装置114は、データを永続的に格納する記憶装置であり、例えば、HDD(Hard Disk Drive)及びSSD(Solid State Drive)等である。なお、副記憶装置114はワークエリアとして利用されてもよい。
ここで、副記憶装置114に格納されるデータについて説明する。副記憶装置114は、解析データ管理情報130、アノテーション管理情報131、修正履歴管理情報132、及びアノテーション定義情報133を格納する。副記憶装置114には、前述以外のデータが格納されてもよい。
解析データ管理情報130は、文書解析部120によって行われた文書の解析結果(解析データ)を管理するための情報である。解析データ管理情報130のデータ構造の詳細は図2を用いて説明する。
アノテーション管理情報131は、文書に付与されたアノテーションを管理するための情報である。アノテーション管理情報131のデータ構造の詳細は図3を用いて説明する。
修正履歴管理情報132は、修正履歴を管理するための情報である。修正履歴管理情報132のデータ構造の詳細は図4を用いて説明する。
アノテーション定義情報133は、評価観点に基づいて定義されたアノテーションを管理するための情報である。アノテーション定義情報133のデータ構造の詳細は図5を用いて説明する。
なお、アノテーション管理情報131及び修正履歴管理情報132はファイルサーバ101が管理してもよい。この場合、ファイルサーバ101は文書に付与されたアノテーション及び修正履歴を管理するデータベースとして機能する。
ファイルサーバ101は、CPU140、IOインタフェース141、ネットワークインタフェース142、主記憶装置143、及び副記憶装置144を有する。前述のハードウェアはバスを介して互いに接続される。IOインタフェース141には、入力装置145及び出力装置146が接続される。
CPU140、IOインタフェース141、ネットワークインタフェース142、主記憶装置143、及び副記憶装置144は、CPU110、IOインタフェース111、ネットワークインタフェース112、主記憶装置113、及び副記憶装置114と同一のものである。また、入力装置145及び出力装置146は、入力装置115及び出力装置116と同一のものである。
主記憶装置143には、文書データをファイルとして管理するためのプログラムが格納される。副記憶装置144には、文書データがファイルとして格納される。
なお、文書データは文書評価サーバ100の副記憶装置114に格納されてもよい。この場合、計算機システムはファイルサーバ101を含まない。
クライアント端末102は、CPU150、IOインタフェース151、ネットワークインタフェース152、及び主記憶装置153を有する。前述のハードウェアはバスを介して互いに接続される。IOインタフェース151には、入力装置155及び出力装置156が接続される。なお、クライアント端末102は副記憶装置を有してもよい。
CPU150、IOインタフェース151、ネットワークインタフェース152、及び主記憶装置153は、CPU110、IOインタフェース111、ネットワークインタフェース112、及び主記憶装置113と同一のものである。
実施例1では、ファイルサーバ101に格納される文書データ、すなわち、計算機システムにおいて管理される文書データは、ソフトウェア品質が高い設計書のデータであるものとする。
図2は、実施例1の解析データ管理情報130のデータ構造の一例を示す図である。
解析データ管理情報130は、文書ID201、帳票種別202、詳細種別203、テキスト204、及びブロック205から構成されるエントリを含む。一つのエントリは一つの解析データに対応する。
文書ID201は、文書の識別情報を格納するフィールドである。
帳票種別202は、文書の帳票種別を格納するフィールドである。例えば、ソフトウェア又はシステムの設計書に対応する文書の帳票種別202は「設計書」となる。文書の帳票種別は記述形式等に基づいて設定される。
詳細種別203は、同一の帳票種別の文書の詳細な種別を格納するフィールドである。例えば、OSの設計書の詳細種別203は「OS」となり、DBの設計書の詳細種別203は「DB」となる。
テキスト204は、ファイルサーバ101が管理する文書データの格納場所を格納するフィールドである。なお、テキスト204には、文書データそのものが格納されてもよい。
ブロック205は、所定の基準に基づいて文書を分割することによって生成されるブロックの情報を格納するフィールドである。ブロック205には、ブロックの識別番号及び文書中のブロックの位置の組から構成されるデータ(ブロックデータ)が一つ以上格納される。一つの行が一つのブロックデータに対応する。
例えば、章、節、及び項単位で分割した文の集合がブロックとなる。また、段落単位で分割された文の集合をブロックとしてもよい。実施例1では、文書を分割する基準を定めた分割条件が予め設定されているものとする。分割条件は、情報として保持してもよいし、文書解析部120のアルゴリズムに組み込んでもよい。
図3は、実施例1のアノテーション管理情報131のデータ構造の一例を示す図である。
アノテーション管理情報131は、文書ID301、アノテーション302、及びアノテーション割合303から構成されるエントリを含む。一つのエントリは一つの文書データに対応する。
文書ID301は文書ID201と同一のフィールドである。
アノテーション302は、文書に含まれる文字列に付与されたアノテーションに関する情報を格納するフィールドである。実施例1では、単語単位の文字列にアノテーションが付与される。したがって、アノテーション302には、単語に対応する文字列及びアノテーションの種別の組から構成されるデータ(アノテーションデータ)が一つ以上格納される。
アノテーション割合303は、各種別のアノテーションの割合に関する情報を格納するフィールドである。実施例1では、アノテーション割合303には、評価範囲及び各種別のアノテーションの割合の組から構成されるデータ(割合データ)が一つ以上格納される。一つの行が一つの割合データに対応する。なお、一つの評価範囲における各種別のアノテーションの割合は、合計値が100となるように算出される。
図3に示すように、実施例1では、文書全体の各種別のアノテーションの割合及びブロックの各種別のアノテーションの割合が算出される。
図4は、実施例1の修正履歴管理情報132のデータ構造の一例を示す図である。
修正履歴管理情報132は、文書ID401、修正内容402、アノテーション種別403、キーワード404、及び修正箇所405から構成されるエントリを含む。一つのエントリは一つの修正履歴に対応する。したがって、一つの文書に対して複数の修正履歴が存在する場合があり得る。
文書ID401は文書ID201と同一のフィールドである。
修正内容402は、文書の修正内容を格納するフィールドである。なお、修正内容402には、アノテーションが付与された文字列を示す情報が含まれてもよい。図4では、アノテーションが付与された文字列を示す情報として下線が挿入されている。
アノテーション種別403は、修正内容に対して付与されたアノテーションの種別を格納するフィールドである。
キーワード404は、修正内容の候補を提示する場合に使用するキーワード(文字列)を格納するフィールドである。
修正箇所405は、文書の修正が行われた位置を格納するフィールドである。例えば、修正箇所405にはブロックの識別情報が格納される。
図5は、実施例1のアノテーション定義情報133のデータ構造の一例を示す図である。
アノテーション定義情報133は、ID501、アノテーション種別502、及びキーワード503から構成されるエントリを含む。一つのエントリは一つのアノテーションの種別に対応する。
ID501は、アノテーション定義情報133のエントリを識別するための識別情報を格納するフィールドである。
アノテーション種別502は、アノテーションの種別を格納するフィールドである。
キーワード503は、アノテーション種別502に対応する種別のアノテーションを付与するキーワード(文字列)を格納するフィールドである。
次に、フローチャートを用いて文書評価サーバ100が実行する処理について説明する。
図6は、実施例1の文書解析部120が実行する処理の一例を説明するフローチャートである。図7は、実施例1の文書解析部120によって提示される画面の一例を示す図である。
文書解析部120は、クライアント端末102の出力装置156に図7に示すような画面700を提示し、処理対象の文書の入力を受け付ける。以下の説明では、処理対象の文書をターゲット文書とも記載する。
ここで、画面700について説明する。画面700は、文書欄701、帳票種別欄702、解析ボタン703、及び評価ボタン704を含む。
文書欄701は、ターゲット文書を指定するための欄である。文書欄701には、例えば、ファイルサーバ101に格納されるターゲット文書の格納場所、又は、ターゲット文書の識別情報が設定される。
帳票種別欄702は、ターゲット文書の帳票種別を入力するための欄である。なお、ターゲット文書に対応する文書データのメタデータに帳票種別が含まれる場合、帳票種別欄702は空欄でもよい。
解析ボタン703は、ターゲット文書の解析を指示するための操作ボタンである。ユーザが解析ボタン703を操作した場合、文書欄701及び帳票種別欄702に入力された値を含む解析要求が文書評価サーバ100に送信される。
評価ボタン704は、ターゲット文書の評価を指示するための操作ボタンである。ユーザが評価ボタン704を操作した場合、文書欄701及び帳票種別欄702に入力された値を含む評価要求が文書評価サーバ100に送信される。
以上が画面700の説明である。図6の説明に戻る。
文書解析部120は、解析要求又は評価要求を受信した場合、以下で説明する処理を開始する。
図6のフローチャートの説明に戻る。まず、文書解析部120は、変数iに初期値「1」を設定する(ステップS101)。変数iはブロックの識別情報である番号を示す変数である。このとき、文書解析部120は、以下のような処理を実行する。
(S101−1)ターゲット文書が新規文書である場合、文書解析部120は、新規文書の文書データをファイルサーバ101に送信する。
(S101−2)文書解析部120は、解析データ管理情報130を参照して、ターゲット文書のエントリが存在するか否かを判定する。解析データ管理情報130にターゲット文書のエントリが存在しない場合、文書解析部120は、解析データ管理情報130にエントリを追加し、追加されたエントリの文書ID201に識別情報を格納する。ターゲット文書の識別情報は、文書解析部120及びファイルサーバ101のいずれかによって付与される。文書解析部120は、追加されたエントリの帳票種別202に解析要求又は評価要求に含まれる値を設定する。また、文書解析部120は、追加されたエントリのテキスト204にターゲット文書に対応する文書データの格納場所を設定する。
(S101−3)また、文書解析部120は、ターゲット文書の最初の文の位置をブロックの開始位置に設定する。以上がステップS101の処理の説明である。
次に、文書解析部120は、分割条件に基づいてブロックを特定する(ステップS102)。文書の分割方法は公知の技術を用いればよいため詳細な説明を省略するが、例えば、以下のような方法が考えられる。
分割条件が「章」の場合、文書解析部120は、章のタイトル又は記号を基準としてターゲット文書を章単位で分割する。分割条件が「段落」の場合、文書解析部120は、先頭の空白又はタブを基準として文書を段落単位で分割する。
このとき、文書解析部120は、解析データ管理情報130のエントリのブロック205に、変数i及びブロックの位置を組み合わせたブロックデータを設定する。
次に、文書解析部120は、ターゲット文書の末尾であるか否かを判定する(ステップS103)。例えば、文書解析部120は、特定されたブロックの後に文が存在するか否かを判定する。特定されたブロックの後に文が存在しない場合、文書解析部120はターゲット文書の末尾であると判定する。
ターゲット文書の末尾でないと判定された場合、文書解析部120は、変数iに1を加算した値を新たな変数iとして設定し(ステップS104)、その後、ステップS102に戻る。このとき、文書解析部120は、特定されたブロックの直後の文の位置を、ブロックの開始位置に設定する。
ターゲット文書の末尾であると判定された場合、文書解析部120は、アノテーション定義情報133に基づいて、文書に含まれる文字列にアノテーションを付与する(ステップS105)。アノテーションの付与方法は公知の技術を用いればよいため詳細な説明は省略するが、例えば、以下のような方法が考えられる。
文書解析部120は、アノテーション管理情報131にエントリを追加し、追加されたエントリの文書ID301にターゲット文書の識別情報を設定する。
文書解析部120は、アノテーション定義情報133に定義された単語を文書から検索する。該当する単語が検索された場合、文書解析部120は、アノテーション管理情報131に追加されたエントリのアノテーション302に、文字列及びアノテーションの種別を組み合わせたアノテーションデータを設定する。
なお、ターゲット文書に対応するエントリが既に存在する場合、文書解析部120は、当該エントリに値を上書きしてもよいし、既存のエントリを削除した後に新たにエントリを追加してもよい。
次に、文書解析部120は、各種別のアノテーションの割合を算出する(ステップS106)。具体的には、以下のような処理が実行される。
(S106−1)文書解析部120は、文書全体に含まれる全ての種別のアノテーションの数を算出し、また、文書全体に含まれる各種別のアノテーションの数を算出する。
(S106−2)文書解析部120は、アノテーションの種別を選択し、文書全体に含まれる、選択された種別のアノテーションの数を、文書全体に含まれる全ての種別のアノテーションの数で除算することによって、文書全体における当該種別のアノテーションの割合を算出する。文書解析部120は、各種別のアノテーションについて同様の処理を実行する。このとき、文書解析部120は、各種別のアノテーションの割合の合計が100となるように正規化する。
(S106−3)文書解析部120は、アノテーション管理情報131のエントリのアノテーション割合303に、「全体」及び各種別のアノテーションの割合を組み合わせた割合データを設定する。
(S106−4)文書解析部120は、ブロックを選択し、ブロックに含まれる全ての種別のアノテーションの数を算出し、また、ブロックに含まれる各種別のアノテーションの数を算出する。
(S106−5)文書解析部120は、アノテーションの種別を選択し、ブロックに含まれる、選択された種別のアノテーションの数を、ブロックに含まれる全ての種別のアノテーションの数で除算することによって、ブロックにおける当該種別のアノテーションの割合を算出する。文書解析部120は、各種別のアノテーションについて同様の処理を実行する。このとき、文書解析部120は、各種別のアノテーションの割合の合計が100となるように正規化する。
(S106−6)文書解析部120は、アノテーション管理情報131のエントリのアノテーション割合303に、ブロックの識別情報及び各種別のアノテーションの割合を組み合わせた割合データを設定する。
文書解析部120は、全てのブロックについて(S106−4)から(S106−6)を実行する。
文書又はブロックの各種別のアノテーションの割合は、文書の特徴を示す指標であって、評価観点に基づいて文書を評価するために用いられる。以上がステップS106の処理の説明である。
次に、文書解析部120は、ファイルサーバ101に格納される文書データを用いて、ターゲット文書の詳細種別を特定し(ステップS107)、その後、処理を終了する。具体的には、以下のような処理が実行される。
(S107−1)文書解析部120は、ターゲット文書とファイルサーバ101に格納される文書との単語共起類似度を算出する。なお、文書間の単語共起類似度の算出方法は公知の技術であるため詳細な説明は省略する。
(S107−2)文書解析部120は、単語共起類似度に基づいて、最も類似する文書を特定する。文書解析部120は、解析データ管理情報130の特定された文書に対応するエントリを検索し、当該エントリの詳細種別203の値を取得する。
(S107−3)文書解析部120は、解析データ管理情報130のターゲット文書のエントリの詳細種別203に、取得した値を設定する。以上がステップS107の処理の説明である。
なお、受信した要求が評価要求である場合、文書解析部120は評価部121を呼び出した後、処理を終了する。このとき、文書解析部120は、ターゲット文書の識別情報を評価部121に出力する。
図8は、実施例1の評価部121が実行する処理の一例を説明するフローチャートである。図9は、実施例1の評価部121によって生成されるデータの一例を示す図である。図10は、実施例1の評価部121によって提示される画面の一例を示す図である。
評価部121は、文書解析部120から呼び出された場合、以下で説明する処理を開始する。
評価部121は、ターゲット文書の評価に用いる文書をファイルサーバ101から取得するための文書取得条件を設定する(ステップS201)。
文書取得条件は文書評価サーバ100に予め設定されているものとする。なお、文書取得条件は、情報として保持してもよいし、評価部121のアルゴリズムに組み込んでもよい。
実施例1では、帳票種別及び詳細種別がターゲット文書と一致する文書を取得するための取得条件が設定されているものとする。
以下の説明では、ターゲット文書の評価に用いる文書を比較用文書と記載する。なお、各比較用文書は、ターゲット文書と同じ文書構造であるものとする。すなわち、ブロックの構造が同一であるものとする。
次に、評価部121は、ファイルサーバ101に格納される文書の中から文書取得条件を満たす比較用文書を検索し(ステップS202)、比較用文書が存在するか否かを判定する(ステップS203)。
このとき、文書取得条件を満たす文書であっても、アノテーション管理情報131にエントリが存在しない文書は比較用文書からは除外される。
なお、評価部121は、アノテーション管理情報131にエントリが存在しない文書の解析を文書解析部120に指示してもよい。この場合、当該文書は比較用文書として扱われる。
比較用文書が存在しないと判定された場合、評価部121は、文書取得条件を変更し(ステップS204)、その後、ステップS202に戻る。
例えば、評価部121は、帳票種別がターゲット文書と一致する文書を取得するための文書取得条件を設定する。なお、本発明は文書取得条件の変更方法に限定されない。
比較用文書が存在すると判定された場合、評価部121は、比較用文書の各種別のアノテーションの割合の平均値を算出する(ステップS205)。具体的には、以下のような処理が実行される。
(S205−1)評価部121は、アノテーションの種別を選択する。
(S205−2)評価部121は、比較用文書における、選択された種別のアノテーションの割合の平均値を算出する。
(S205−3)評価部121は、ブロックを選択し、選択されたブロックにおける、選択された種別のアノテーションの割合の平均値を算出する。
評価部121は、全てのブロックについて(S205−3)の処理を実行する。また、評価部121は、全てのアノテーションの種別について(S205−1)、(S205−2)、(S205−3)を実行する。以上の処理によって、図9に示すような比較データ900が生成される。
比較データ900は、アノテーション種別901、範囲902、及び割合903から構成されるエントリを含む。一つのエントリは一つのアノテーションの種別に対応する。
アノテーション種別901はアノテーション種別502と同一のフィールドである。範囲902は評価範囲を格納するフィールドである。割合903は、評価範囲における任意種別のアノテーションの割合の平均値を格納するフィールドである。
なお、比較用文書が一つである場合には、ステップS205の処理は実行されなくてもよい。以上がステップS205の処理の説明である。
次に、評価部121は、ターゲット文書の各種別のアノテーションの割合及び比較用文書の各種別のアノテーションの割合の平均値に基づいて、ターゲット文書を評価する(ステップS206)。すなわち、評価観点に基づくターゲット文書の評価が高いか否かが判定される。より具体的には、ターゲット文書に規定されたソフトウェアの品質が高いか否かが判定される。具体的には、以下のような処理が実行される。
(S206−1)評価部121は、ターゲット文書の各種別のアノテーションの割合をアノテーション管理情報131から取得し、また、比較用文書の各種別のアノテーションの割合の平均値を比較データ900から取得する。評価部121は、各種別のアノテーションの割合の差を算出する。ここでは、絶対値として差が算出される。
(S206−2)評価部121は、(S206−1)において算出された差が最も大きいアノテーションの種別を修正アノテーション種別として特定する。
なお、全ての差が閾値より小さい場合、評価部121は修正が不要と判定してもよい。この場合、評価部121は、修正不要を示す情報を生成し、ステップS206の処理を終了してもよい。
(S206−3)評価部121は、ブロックを選択し、ターゲット文書の選択されたブロックの修正アノテーション種別の割合をアノテーション管理情報131から取得し、比較用文書の選択されたブロックの修正アノテーション種別の割合の平均値を比較データ900から取得する。評価部121は、修正アノテーション種別の割合の差を算出する。
評価部121は、全てのブロックについて(S206−3)の処理を実行する。
実施例1では、ターゲット文書及び比較用文書の文書構造が同一であるものと仮定している。なお、ターゲット文書及び比較用文書の文書構造が異なる場合、評価部121は、ターゲット文書の選択されたブロックの修正アノテーション種別の割合と、比較用文書の全体の修正アノテーション種別の割合の平均値との差を算出する。
(S206−4)評価部121は、(S206−3)において算出された差が最も大きいブロックを変更箇所として特定する。
(S206−5)評価部121は、修正アノテーション種別及び変更箇所の組から構成される指摘情報を生成する。
実施例1では、文書の各種別のアノテーションの割合を評価指標として用いる。文書の各種別のアノテーションの割合は、評価観点を反映した指標であって、文書の長さ及び単語の数等の文書の構造に依存しない指標である。これによって、文書そのものの類似性とは異なる観点から文書を評価することができる。すなわち、蓄積された文書を用いて、様々な文書の評価を実現できる。
実施例1では、ファイルサーバ101には品質の高い(評価が高い)設計書が格納されている。そこで、文書評価サーバ100は、ターゲット文書の全ての種別のアノテーションの割合が、設計書の全ての種別のアノテーションの割合と同一である場合、修正は必要ないと判定する。すなわち、ターゲット文書は品質が高いと判定される。文書評価サーバ100は、二つの文書の少なくとも一つの種別のアノテーションの割合が相違する場合、修正が必要であると判定する。
また、ブロックの各種別のアノテーションの割合を用いることによって、ターゲット文書の修正箇所を提示することができる。これによって、文書の修正に要するコストを削減することができる。以上がステップS206の処理の説明である。
次に、評価部121は、ステップS206の判定結果に基づいて、ターゲット文書の修正が必要か否かを判定する(ステップS207)。例えば、指摘情報が生成された場合、評価部121は、ターゲット文書の修正が必要であると判定する。
ターゲット文書の修正が必要でないと判定された場合、評価部121は処理を終了する。この場合、ターゲット文書で規定されたソフトウェアは品質が高いことを示す。なお、ワークエリアに後述する候補履歴を存在する場合、評価部121は修正部123に候補履歴の登録を指示する。
ターゲット文書の修正が必要であると判定された場合、評価部121は、指摘情報をワークエリアに格納し(ステップS208)、その後、処理を終了する。このとき、評価部121は、アノテーション管理情報131及び指摘情報に基づいて、クライアント端末102の出力装置156に、図10に示すような画面1000を表示する。
ここで、画面1000について説明する。画面1000は、アノテーション割合欄1001、修正アノテーション種別欄1002、修正箇所欄1003、及び候補提示ボタン1004を含む。
アノテーション割合欄1001は、ターゲット文書及び比較用文書の各種別のアノテーションの割合を表示する欄である。アノテーション割合欄1001は、評価範囲選択欄1011及びグラフ表示欄1012を含む。
評価範囲選択欄1011は評価範囲を選択する欄である。図10の評価範囲選択欄1011には、評価範囲がプルダウン形式で表示される。グラフ表示欄1012は、評価範囲におけるターゲット文書及び比較用文書の各種別のアノテーションの割合を示すグラフを表示する欄である。一つのアノテーションの種別に対して二つのグラフ1021、1022が表示される。グラフ1021は、ターゲット文書の各種別のアノテーションの割合を示すグラフである。グラフ1022は、比較用文書の各種別のアノテーションの割合の平均値を示すグラフである。なお、グラフ1021、1022を重ね合わせて一つのグラフとして表示してもよい。
修正アノテーション種別欄1002は、修正アノテーション種別を表示する欄である。修正箇所欄1003は、修正箇所を表示する欄である。
候補提示ボタン1004は、修正箇所の修正内容の候補を提示するための操作ボタンである。候補提示ボタン1004が操作された場合、候補提示要求が文書評価サーバ100に送信される。以上が画面1000の説明である。
図11は、実施例1の推薦部122が実行する処理の一例を説明するフローチャートである。図12は、実施例1の推薦部122によって提示される画面の一例を示す図である。
推薦部122は、候補提示要求を受信した場合、以下で説明する処理を開始する。
推薦部122は、修正内容を提示するために用いる修正履歴を取得するための履歴取得条件を設定する(ステップS301)。
履歴取得条件は文書評価サーバ100に予め設定されているものとする。なお、履歴取得条件は、情報として保持してもよいし、推薦部122のアルゴリズムに組み込んでもよい。
例えば、以下のような五つの条件を履歴取得条件として設定することが考えられる。
(1)アノテーションの種別が一致する。
(2)帳票種別が一致する。
(3)詳細種別が一致する。
(4)修正箇所が一致する。
(5)キーワード404に含まれる単語が、ターゲット文書の修正箇所に含まれていない。
(1)アノテーションの種別が一致する。
(2)帳票種別が一致する。
(3)詳細種別が一致する。
(4)修正箇所が一致する。
(5)キーワード404に含まれる単語が、ターゲット文書の修正箇所に含まれていない。
なお、履歴取得条件には、前述の五つの条件全てが含まれていなくてもよい。ただし、履歴取得条件には、少なくとも(1)の条件が含まれるものとする。なお、履歴取得条件に複数の条件が含まれる場合、優先順位を設定してもよい。
以下の説明では、修正内容を提示するために用いる修正履歴を参照履歴と記載する。
次に、推薦部122は、修正履歴管理情報132の中から履歴取得条件を満たす参照履歴を検索し(ステップS302)、参照履歴が存在するか否かを判定する(ステップS303)。
参照履歴が存在しないと判定された場合、推薦部122は、履歴取得条件を変更し(ステップS304)、その後、ステップS302に戻る。
例えば、評価部121は、履歴取得条件に含まれる条件の中から最も優先順位が低い条件を削除する。なお、本発明は履歴取得条件の変更方法に限定されない。
参照履歴が存在すると判定された場合、推薦部122は、参照履歴を提示するための表示情報を生成し(ステップS305)、表示情報をクライアント端末102に送信する(ステップS306)。その後、推薦部122は処理を終了する。
参照履歴が複数存在する場合、推薦部122は、ターゲット文書の修正箇所と、参照履歴の修正箇所との類似度を算出し、類似度が高い順に参照履歴を並べ替える。推薦部122は、類似度が最も大きい参照履歴を提示するための表示情報を生成する。なお、類似度順にソートされた参照履歴のリストを提示するための表示情報が生成されてもよい。
クライアント端末102の出力装置156には、表示情報に基づいて、図12に示すような画面1200が表示される。
ここで、画面1200について説明する。画面1200は、候補修正内容欄1201及び修正ボタン1202を含む。
候補修正内容欄1201は、参照履歴に含まれる修正内容を表示する欄である。候補修正内容欄1201には、参照履歴に対応するエントリの修正内容402が表示される。
修正ボタン1202は、ターゲット文書の修正箇所の修正を行うための操作ボタンである。ユーザが修正ボタン1202を操作した場合、候補修正内容欄1201に設定された修正内容を含む修正要求が文書評価サーバ100に送信される。以上が画面1200の説明である。
ユーザは、提示された修正履歴を参照することによって、ターゲット文書の修正箇所を容易かつ迅速に修正することができる。ユーザは、提示された修正履歴をそのまま利用してもよいし、修正履歴を参照した上、自ら修正箇所の修正を行ってもよい。例えば、候補修正内容欄1201を編集する方法が考えられる。
図13は、実施例1の修正部123が実行する処理の一例を説明するフローチャートである。図14は、実施例1の修正部123によって提示される画面の一例を示す図である。
修正部123は、修正要求を受信した場合、以下で説明する処理を開始する。
まず、修正部123は、修正要求に含まれる修正内容に基づいて、ターゲット文書を修正する(ステップS401)。このとき、修正部123は、修正されたターゲット文書の文書データをファイルサーバ101に送信する。
次に、修正部123は、修正内容へのアノテーションの付与を文書解析部120に指示する(ステップS402)。修正部123は、文書解析部120からの応答を受信するまで待ち状態に移行する。
文書解析部120は、修正部123からの指示を受け付けた場合、修正内容に含まれる文字列にアノテーションを付与する。アノテーションの付与方法はステップS105と同一である。文書解析部120は、文字列及びアノテーションの種別の組から構成されるアノテーションデータを含む応答を修正部123に出力する。
次に、修正部123は、候補履歴を生成し、ワークエリアに候補履歴を格納する(ステップS403)。具体的には、以下のような処理が実行される。
(S403−1)修正部123は、ターゲット文書の識別情報、修正内容、修正内容に付与されたアノテーションの種別、文字列、及び修正箇所の組から構成される候補履歴を生成する。
(S403−2)修正部123は、図14に示すような画面1400をクライアント端末102の出力装置156に表示する。
ここで、画面1400について説明する。画面1400は、修正内容欄1401、継続ボタン1402、及び完了ボタン1403を含む。
修正内容欄1401は、修正要求に含まれる修正内容を表示する欄である。
継続ボタン1402は、ターゲット文書の評価を継続するための操作ボタンである。ユーザが継続ボタン1402を操作した場合、ターゲット文書の識別情報を含む評価要求が文書評価サーバ100に送信される。
完了ボタン1403は、ターゲット文書の評価を完了するための操作ボタンである。ユーザが完了ボタン1403を操作した場合、完了要求が文書評価サーバ100に送信される。以上が画面1400の説明である。図13の説明に戻る。
(S403−3)修正部123は、画面1400を介した要求を受信するまで待ち状態に移行する。以上がステップS403の処理の説明である。
修正部123は、受信した要求が完了要求であるか否かを判定する(ステップS404)。
受信した要求が完了要求であると判定された場合、修正部123は、ワークエリアに格納される候補履歴を修正履歴管理情報132に登録し(ステップS405)、その後、処理を終了する。ワークエリアに複数の候補履歴が格納される場合、全ての候補履歴が修正履歴管理情報132に登録される。このように、文書の品質を向上させるために行った修正を履歴として保存することによって、後の文書の修正に活用できる。
受信した要求が継続要求であると判定された場合、修正部123は処理を終了する。
実施例1で説明した計算機システムでは、任意の評価観点に基づく評価が高い文書がファイルサーバ101に格納される。文書評価サーバ100は、比較用文書及びターゲット文書の各種別のアノテーションの割合を文書の評価指標として用いて、ターゲット文書を評価する。これによって、文書間の類似性に依存しない文書の評価を実現することができる。
文書評価サーバ100は、文字列を抽象化したアノテーションを用いているため、比較用文書及びターゲット文書の言語が異なっていても、文書の評価を実現できる。ただし、各言語のアノテーション定義情報133を設定する必要がある。
また、文書評価サーバ100は、文書の修正によって、評価が高くなったターゲット文書をファイルサーバ101に格納することによって、ターゲット文書を比較用文書として利用できる。
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。また、例えば、上記した実施例は本発明を分かりやすく説明するために構成を詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、各実施例の構成の一部について、他の構成に追加、削除、置換することが可能である。
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、本発明は、実施例の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をコンピュータに提供し、そのコンピュータが備えるプロセッサが記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施例の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、CD−ROM、DVD−ROM、ハードディスク、SSD(Solid State Drive)、光ディスク、光磁気ディスク、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどが用いられる。
また、本実施例に記載の機能を実現するプログラムコードは、例えば、アセンブラ、C/C++、perl、Shell、PHP、Python、Java(登録商標)等の広範囲のプログラム又はスクリプト言語で実装できる。
さらに、実施例の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することによって、それをコンピュータのハードディスクやメモリ等の記憶手段又はCD−RW、CD−R等の記憶媒体に格納し、コンピュータが備えるプロセッサが当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしてもよい。
上述の実施例において、制御線や情報線は、説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。
100 文書評価サーバ
101 ファイルサーバ
102 クライアント端末
110、140、150 CPU
111、141、151 IOインタフェース
112、142、152 ネットワークインタフェース
113、143、153 主記憶装置
114、144 副記憶装置
115、145、155 入力装置
116、146、出力装置 出力装置
120 文書解析部
121 評価部
122 推薦部
123 修正部
130 解析データ管理情報
131 アノテーション管理情報
132 修正履歴管理情報
133 アノテーション定義情報
101 ファイルサーバ
102 クライアント端末
110、140、150 CPU
111、141、151 IOインタフェース
112、142、152 ネットワークインタフェース
113、143、153 主記憶装置
114、144 副記憶装置
115、145、155 入力装置
116、146、出力装置 出力装置
120 文書解析部
121 評価部
122 推薦部
123 修正部
130 解析データ管理情報
131 アノテーション管理情報
132 修正履歴管理情報
133 アノテーション定義情報
Claims (14)
- 文書の評価を行う計算機システムであって、
プロセッサ、メモリ、及び記憶装置を有する少なくとも一つの計算機を備え、
評価観点に基づく評価が高い文書のデータを格納する文書データベースにアクセス可能であって、
前記文書に含まれる文字列に、前記評価観点に基づいて定義された複数の種別のアノテーションのうち、いずれかの種別の前記アノテーションを付与する文書解析部と、
前記評価観点に基づく評価を行うターゲット文書に含まれる文字列に付与された前記アノテーションに基づいて、前記ターゲット文書を評価する評価部と、を備え、
前記評価部は、前記ターゲット文書の各種別の前記アノテーションの割合及び前記文書データベースから取得された比較用文書の各種別の前記アノテーションの割合を比較し、当該比較の結果に基づいて、前記ターゲット文書の修正が必要か否かを判定することによって、前記ターゲット文書を評価することを特徴とする計算機システム。 - 請求項1に記載の計算機システムであって、
前記文書の識別情報、修正内容、及び前記修正内容に含まれる文字列に付与された前記アノテーションの種別から構成される修正履歴を格納する修正履歴データベースにアクセス可能であって、
前記ターゲット文書を修正する場合に前記修正履歴を修正候補として提示する推薦部を備え、
前記評価部は、前記ターゲット文書の修正が必要と判定された場合、前記ターゲット文書の各種別のアノテーションの割合及び前記比較用文書の各種別のアノテーションの割合の比較の結果に基づいて、前記修正履歴を取得するために用いる前記アノテーションの種別を特定し、
前記推薦部は、前記修正内容に含まれる文字列に付与されたアノテーションの種別が、前記特定されたアノテーションの種別と一致する前記修正履歴を提示することを特徴とする計算機システム。 - 請求項2に記載の計算機システムであって、
前記文書解析部は、前記文書を複数のブロックに分割し、
前記評価部は、
前記ターゲット文書の修正が必要と判定された場合、前記ターゲット文書の前記複数のブロックの各々の各種別の前記アノテーションの割合と、前記比較用文書の前記複数のブロックの各々の各種別の前記アノテーションの割合とを比較し、当該比較の結果に基づいて、修正が必要な前記ターゲット文書の前記ブロックを特定し、
前記特定されたターゲット文書のブロックを提示することを特徴とする計算機システム。 - 請求項3に記載の計算機システムであって、
前記修正履歴は、前記文書の前記ブロックの識別情報を含み、
前記推薦部は、前記修正内容に含まれる文字列に付与されたアノテーションの種別が前記特定されたアノテーションの種別と一致し、かつ、前記修正履歴に含まれる前記文書のブロックの識別情報が前記特定されたターゲット文書のブロックの識別情報と一致する前記修正履歴を提示することを特徴とする計算機システム。 - 請求項2に記載の計算機システムであって、
前記ターゲット文書の修正内容を取得し、前記ターゲット文書の修正内容に基づいて前記ターゲット文書を修正する修正部を備え、
前記修正部は、
前記文書解析部に前記ターゲット文書の修正内容に含まれる文字列への前記アノテーションの付与を指示し、
前記ターゲット文書の識別情報、前記ターゲット文書の修正内容、及び前記ターゲット文書の修正内容に含まれる文字列に付与された前記アノテーションの種別の組から構成される前記修正履歴を、前記修正履歴データベースに格納することを特徴とする計算機システム。 - 請求項1に記載の計算機システムであって、
前記評価部は、
前記文書データベースから複数の前記比較用文書が取得された場合、前記複数の比較用文書の各種別のアノテーションの割合の平均値を算出し、
前記ターゲット文書の各種別のアノテーションの割合及び前記複数の比較用文書の各種別のアノテーションの割合の平均値を比較することを特徴とする計算機システム。 - 請求項1に記載の計算機システムであって、
前記評価部は、前記ターゲット文書の各種別のアノテーションの割合及び前記比較用文書の各種別のアノテーションの割合をユーザに提示するための表示情報を生成し、出力することを特徴とする計算機システム。 - 計算機システムが実行する文書の評価方法であって、
前記計算機システムは、
プロセッサ、メモリ、及び記憶装置を有する少なくとも一つの計算機を有し、
評価観点に基づく評価が高い文書のデータを格納する文書データベースにアクセス可能な状態であって、
前記文書の評価方法は、
前記プロセッサが、前記評価観点に基づく評価を行うターゲット文書及び前記文書データベースから取得された比較用文書に含まれる文字列に、前記評価観点に基づいて定義された複数の種別のアノテーションのうち、いずれかの種別の前記アノテーションを付与する第1のステップと、
前記プロセッサが、前記ターゲット文書及び前記比較用文書の各々に付与された前記アノテーションに基づいて、前記ターゲット文書の各種別の前記アノテーションの割合と、前記比較用文書の各種別の前記アノテーションの割合と、を算出する第2のステップと、
前記プロセッサが、前記ターゲット文書の各種別のアノテーションの割合及び前記比較用文書の各種別のアノテーションの割合を比較し、当該比較の結果に基づいて、前記ターゲット文書の修正が必要か否かを判定することによって前記ターゲット文書を評価する第3のステップと、を含むことを特徴とする文書の評価方法。 - 請求項8に記載の文書の評価方法であって、
前記計算機システムは、前記文書の識別情報、修正内容、及び前記修正内容に含まれる文字列に付与された前記アノテーションの種別から構成される修正履歴を格納する修正履歴データベースにアクセス可能であって、
前記第3のステップは、前記プロセッサが、前記ターゲット文書の修正が必要と判定された場合、前記ターゲット文書の各種別のアノテーションの割合及び前記比較用文書の各種別のアノテーションの割合の比較の結果に基づいて、前記修正履歴を取得するために用いる前記アノテーションの種別を特定するステップを含み、
前記文書の評価方法は、前記プロセッサが、前記ターゲット文書の修正が必要と判定された場合、前記修正内容に含まれる文字列に付与されたアノテーションの種別が、前記特定されたアノテーションの種別と一致する前記修正履歴を修正候補として提示する第4のステップを含むことを特徴とする文書の評価方法。 - 請求項9に記載の文書の評価方法であって、
前記第1のステップは、前記プロセッサが、前記文書を複数のブロックに分割するステップを含み、
前記第3のステップは、
前記プロセッサが、前記ターゲット文書の修正が必要と判定された場合、前記ターゲット文書の前記複数のブロックの各々の各種別の前記アノテーションの割合と、前記比較用文書の前記複数のブロックの各々の各種別の前記アノテーションの割合とを比較し、当該比較の結果に基づいて、修正が必要な前記ターゲット文書の前記ブロックを特定するステップと、
前記プロセッサが、前記特定されたターゲット文書のブロックを提示するステップと、を含むことを特徴とする文書の評価方法。 - 請求項10に記載の文書の評価方法であって、
前記修正履歴は、前記文書の前記ブロックの識別情報を含み、
前記第4のステップは、前記プロセッサが、前記修正内容に含まれる文字列に付与されたアノテーションの種別が前記特定されたアノテーションの種別と一致し、かつ、前記修正履歴に含まれる前記文書のブロックの識別情報が前記特定されたターゲット文書のブロックと一致する前記修正履歴を提示するステップを含むことを特徴とする文書の評価方法。 - 請求項9に記載の文書の評価方法あって、
前記プロセッサが、前記ターゲット文書の修正内容を取得し、前記ターゲット文書の修正内容に基づいて前記ターゲット文書を修正するステップと、
前記プロセッサが、前記ターゲット文書の修正内容に含まれる文字列に前記アノテーションを付与するステップと、
前記プロセッサが、前記ターゲット文書の識別情報、前記ターゲット文書の修正内容、及び前記ターゲット文書の修正内容に含まれる文字列に付与された前記アノテーションの種別の組から構成される前記修正履歴を、前記修正履歴データベースに格納するステップと、を含むことを特徴とする文書の評価方法。 - 請求項8に記載の文書の評価方法であって、
前記第2のステップは、前記プロセッサが、前記文書データベースから複数の前記比較用文書が取得された場合、前記複数の比較用文書の各種別のアノテーションの割合の平均値を算出するステップを含み、
前記第3のステップは、前記プロセッサが、前記ターゲット文書の各種別のアノテーションの割合及び前記複数の比較用文書の各種別のアノテーションの割合の平均値を比較するステップを含むことを特徴とする文書の評価方法。 - 請求項8に記載の文書の評価方法であって、
前記プロセッサが、前記ターゲット文書の各種別のアノテーションの割合及び前記比較用文書の各種別のアノテーションの割合をユーザに提示するための表示情報を生成し、出力するステップを含むことを特徴とする文書の評価方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019109531A JP6884172B2 (ja) | 2019-06-12 | 2019-06-12 | 計算機システム及び文書の評価方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019109531A JP6884172B2 (ja) | 2019-06-12 | 2019-06-12 | 計算機システム及び文書の評価方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020201815A true JP2020201815A (ja) | 2020-12-17 |
JP6884172B2 JP6884172B2 (ja) | 2021-06-09 |
Family
ID=73743382
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019109531A Active JP6884172B2 (ja) | 2019-06-12 | 2019-06-12 | 計算機システム及び文書の評価方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6884172B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010072817A (ja) * | 2008-09-17 | 2010-04-02 | Hitachi Software Eng Co Ltd | 設計ドキュメント品質評価支援システム |
US20190050319A1 (en) * | 2017-08-08 | 2019-02-14 | Accenture Global Solutions Limited | Intellectual automated security, performance and code generation framework |
-
2019
- 2019-06-12 JP JP2019109531A patent/JP6884172B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010072817A (ja) * | 2008-09-17 | 2010-04-02 | Hitachi Software Eng Co Ltd | 設計ドキュメント品質評価支援システム |
US20190050319A1 (en) * | 2017-08-08 | 2019-02-14 | Accenture Global Solutions Limited | Intellectual automated security, performance and code generation framework |
Non-Patent Citations (3)
Title |
---|
原口 智史 外4名: "テキスト分析技術を用いた開発関連文書の文書品質の定量化", 電子情報通信学会技術研究報告, vol. 第111巻第98号, JPN6021012560, 17 June 2011 (2011-06-17), JP, pages 25 - 30, ISSN: 0004482412 * |
奈加 大樹 外3名: "共通語彙によるソフトウェア設計書の評価にむけた分析", 情報処理学会 論文誌(ジャーナル) VOL.57 NO.5 [ONLINE], vol. 第57巻第5号, JPN6021012564, 15 May 2016 (2016-05-15), JP, pages 1464 - 1476, ISSN: 0004482413 * |
藤田 悠 外5名: "組込みソフトウェア開発文書診断法", 電子情報通信学会技術研究報告, vol. 第109巻第475号, JPN6021012658, 19 March 2010 (2010-03-19), JP, pages 263 - 270, ISSN: 0004482414 * |
Also Published As
Publication number | Publication date |
---|---|
JP6884172B2 (ja) | 2021-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10169337B2 (en) | Converting data into natural language form | |
US8312067B2 (en) | Method and computer program product for analyzing documents | |
US8983965B2 (en) | Document rating calculation system, document rating calculation method and program | |
US20080040098A1 (en) | Machine translation apparatus and method | |
US10635897B2 (en) | Document understanding support apparatus, document understanding support method, non-transitory storage medium | |
JP4502615B2 (ja) | 類似文検索装置、類似文検索方法、およびプログラム | |
JP5900367B2 (ja) | 検索装置、検索方法及びプログラム | |
JP4237813B2 (ja) | 構造化文書管理システム | |
JP2000200281A (ja) | 情報検索装置および情報検索方法ならびに情報検索プログラムを記録した記録媒体 | |
CN110874364A (zh) | 一种查询语句处理方法、装置、设备及存储介质 | |
JP2009271659A (ja) | 情報処理装置、情報処理方法、情報処理プログラム及び記録媒体 | |
JP6884172B2 (ja) | 計算機システム及び文書の評価方法 | |
JP6549173B2 (ja) | 計算機システム及び文章データの検索方法 | |
JP6916437B2 (ja) | 情報処理装置、その制御方法、及びプログラム | |
JP5285491B2 (ja) | 情報検索システム、方法及びプログラム、索引作成システム、方法及びプログラム、 | |
US20230053344A1 (en) | Scenario generation apparatus, scenario generation method, and computer-readablerecording medium | |
JP5733285B2 (ja) | 検索装置、検索方法及びプログラム | |
JP6181890B2 (ja) | 文献解析装置、文献解析方法およびプログラム | |
JP2021033695A (ja) | 計算機システム及び業務の支援方法 | |
JP2009104475A (ja) | 類似文書検索装置、類似文書検索方法およびプログラム | |
JP6303508B2 (ja) | 文書分析装置、文書分析システム、文書分析方法およびプログラム | |
JP5417359B2 (ja) | 文書評価支援システム、及び文書評価支援方法 | |
JP2021009591A (ja) | データ取得装置、データ取得方法、およびデータ取得プログラム | |
JP4304226B2 (ja) | 構造化文書管理システム、構造化文書管理方法及びプログラム | |
JP2009070299A (ja) | 文書処理装置、プログラムおよび文書処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200123 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210413 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210511 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6884172 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |