JP2019028958A - 設計書学習装置および設計書学習方法 - Google Patents

設計書学習装置および設計書学習方法 Download PDF

Info

Publication number
JP2019028958A
JP2019028958A JP2017151263A JP2017151263A JP2019028958A JP 2019028958 A JP2019028958 A JP 2019028958A JP 2017151263 A JP2017151263 A JP 2017151263A JP 2017151263 A JP2017151263 A JP 2017151263A JP 2019028958 A JP2019028958 A JP 2019028958A
Authority
JP
Japan
Prior art keywords
diagram
design document
algorithm
design
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017151263A
Other languages
English (en)
Other versions
JP6960270B2 (ja
Inventor
豊臣 松田
Toyoo Matsuda
豊臣 松田
井奥 章
Akira Ioku
章 井奥
佐藤 直人
Naoto Sato
直人 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2017151263A priority Critical patent/JP6960270B2/ja
Publication of JP2019028958A publication Critical patent/JP2019028958A/ja
Application granted granted Critical
Publication of JP6960270B2 publication Critical patent/JP6960270B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Stored Programmes (AREA)

Abstract

【課題】人工知能による設計レビューにおいて、設計書が含む図に関する特徴量の効率的な抽出を精度良好に行い、ひいては、有識者による設計レビューの更なる効率化や品質向上を図る。【解決手段】設計書学習装置100において、設計書ファイルと、特徴量抽出用の複数種類のアルゴリズム110〜113と、を格納した記憶装置101と、前記設計書ファイルに含まれる図のデータの所定属性を読取り、当該属性が、設計対象におけるオブジェクト間の関係性を表す構造図に関するものか、前記構造図とは別種の図に関するものかに応じ、当該図に対応するアルゴリズムを前記複数種類のアルゴリズム110〜113中から選択して、当該図のデータが含むテキストに基づく特徴量の特定処理を当該アルゴリズムにより実行する演算装置104を含む構成とする。【選択図】図1

Description

本発明は、設計書学習装置および設計書学習方法に関するものであり、具体的には、人工知能による設計レビューにおいて、設計書が含む図に関する特徴量の効率的な抽出を精度良好に行い、ひいては、有識者による設計レビューの更なる効率化や品質向上を図る技術に関する。
システム開発の上流工程にて作成される設計書は、その良否によって、下流工程に大きな影響を及ぼす存在である。よって、その品質を確保すべく、有識者などによる設計レビューやそれに先立つ設計レビューアを適用することとなる。設計レビューアは、設計書の記述(日本語の表記ゆれ、誤り)のチェックや、設計内容における漏れの有無のチェック等を行い、設計レビューの時間短縮、およびレビュー品質の向上を図るものである。
一方、近年急速な進歩をみた人工知能技術を、上述の如きいわゆるドキュメントレビューに利用する動きも存在する。こうした人工知能によるレビュー技術においては、既存設計書から単語や意味関係など抽出して予め作成した用語辞書や文脈ベクトルをベースに、評価対象の設計書に対する上述の記述や漏れのチェックを行う。
こうした文書の特徴量等を抽出し、これを利用する従来技術としては、例えば、所望の種別の信号コンテンツ及び文書がそれぞれ1つ以上所与であり、前記信号コンテンツ及び前記文書の1つ以上の組の関係性の有無を表す関係指示子が所与である場合に、前記信号コンテンツの低次元特徴量を生成する特徴量変換関数を学習する特徴量生成方法であって、前記文書に含まれる単語の共起に基づいて、共起しやすい単語ほど相互に近い単語ベクトルになるように、各単語及び単語ベクトル間の対応関係を生成する単語ベクトル学習ステップと、学習した前記単語ベクトルを用いて、前記文書の文書特徴量を抽出する文書特徴抽出ステップと、前記信号コンテンツの初期特徴量を抽出する初期特徴量抽出ステップと、前記単語ベクトル及び前記文書特徴量のうちの少なくとも1つを用いて、前記信号コンテンツ及び前記文書の相対的幾何関係を求め、前記初期特徴量、前記相対的幾何関係、及び関係指示子に基づいて、前記初期特徴量を低次元特徴量に変換する特徴量変換関数を生成し、出力する特徴量変換関数生成ステップと、を有する特徴量生成方法(特許文献1参照)などが提案されている。
特開2017−27526号公報
設計書から特徴量を抽出する一般的な手法として、該当設計書の文中での単語の共起関係を特定するものがあげられる。設計書のうち文章部分については、従来技術によりそうした特徴量の抽出が可能である。ところが設計書のうち図に関しては、そもそも図中の記載文がテキストデータ化されていないケースや、テキストデータ化されていても、図の種類ごとに定義や構造が異なるため、特徴量の抽出が適宜に行えないケースも多い。
しかしながら、設計書におけるクラス図、フロー図、シーケンス図、或いはテーブルなどには、設計上の重要情報が示されているケースが多々ある。そのため、こうした図から特徴量の抽出を適宜に行う必要性は高いが、これに対応する技術は提案されていない。
そこで本発明の目的は、人工知能による設計レビューにおいて、設計書が含む図に関する特徴量の効率的な抽出を精度良好に行い、ひいては、有識者による設計レビューの更なる効率化や品質向上を図る技術を提供することにある。
上記課題を解決する本発明の設計書学習装置は、設計書ファイルと、特徴量抽出用の複数種類のアルゴリズムと、を格納した記憶装置と、前記設計書ファイルに含まれる図のデータの所定属性を読取り、当該属性が、設計対象におけるオブジェクト間の関係性を表す構造図に関するものか、前記構造図とは別種の図に関するものかに応じ、当該図に対応するアルゴリズムを前記複数種類のアルゴリズム中から選択して、当該図のデータが含むテキストに基づく特徴量の特定処理を当該アルゴリズムにより実行する演算装置と、を備えることを特徴とする。
また、本発明の設計書学習方法は、設計書ファイルと、特徴量抽出用の複数種類のアルゴリズムと、を格納した記憶装置を備える情報処理装置が、前記設計書ファイルに含まれる図のデータの所定属性を読取り、当該属性が、設計対象におけるオブジェクト間の関係性を表す構造図に関するものか、前記構造図とは別種の図に関するものかに応じ、当該図に対応するアルゴリズムを前記複数種類のアルゴリズム中から選択して、当該図のデータが含むテキストに基づく特徴量の特定処理を当該アルゴリズムにより実行する、ことを特徴とする。
本発明によれば、人工知能による設計レビューにおいて、設計書が含む図に関する特徴量の効率的な抽出を精度良好に行い、ひいては、有識者による設計レビューの更なる効率化や品質向上を可能とする。
本実施形態の設計書学習装置の構成例を示す図である。 本実施形態の設計書DBのデータ構成例を示す図である。 本実施形態の文脈ベクトルDBのデータ構成例1を示す図である。 本実施形態における設計書学習方法のフロー例1を示す図である。 本実施形態における設計書学習方法のフロー例2を示す図である。 本実施形態におけるdot形式のデータ例1を示す図である。 本実施形態におけるdot形式のデータ例2を示す図である。 本実施形態におけるクラス図の概念例1を示す図である。 本実施形態におけるクラス図の概念例2を示す図である。 本実施形態の文脈ベクトルDBのデータ構成例2を示す図である。 本実施形態における設計書学習方法のフロー例3を示す図である。
−−−装置構成−−−
以下に本発明の実施形態について図面を用いて詳細に説明する。図1は、本実施形態の設計書学習装置100の構成例を示す図である。図1に示す設計書学習装置100は、人工知能による設計レビューにおいて、設計書が含む図に関する特徴量の効率的な抽出を精度良好に行い、ひいては、有識者による設計レビューの更なる効率化や品質向上を図るコンピュータ装置である。
本実施形態の設計書学習装置100は、SSD(Solid State Drive
)やハードディスクドライブなど適宜な不揮発性記憶素子で構成される記憶装置101、RAMなど揮発性記憶素子で構成されるメモリ103、記憶装置101に保持されるプログラム102をメモリ103に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUなどの演算装置104、レビュアー等のユーザからのキー入力や音声入力を受け付ける入力装置105、処理データの表示を行うディスプレイ等の出力装置106、を備える。
なお、記憶装置101内には、本実施形態の設計書学習装置100として必要な機能を実装する為のプログラム102に加えて、設計書DB125、および、文脈ベクトルDB126が少なくとも記憶されている。これら各DBの詳細については後述する。
また、上述のプログラム102は、設計レビューの所定手順を実行する人工知能のアルゴリズムを含んでおり、それには、クラス図向けアルゴリズム110、非クラス図向け(エッジ無)アルゴリズム111、非クラス図向け(有向エッジ)アルゴリズム112、非クラス図向け(無向エッジ)アルゴリズム113、文書データ向けアルゴリズム114、および、イメージデータ向けアルゴリズム115の計6種を想定している。これら各アルゴリズムによる設計レビューの手順に応じた処理詳細についてはフローの説明に伴って後述する。
図1における設計書学習装置100は、いわゆるスタンドアロンマシーンとしての装置構成を例示しているが、これに限定せず、例えば、インターネットなどの適宜なネットワークを介して、設計担当者などレビュアーが操作する所定の端末との通信処理を担う通信装置を備えるとしてもよい。この場合、設計書学習装置100は、その端末から、設計書学習に関する指示を受け付けて、これに応じた設計書学習処理を実行し、処理結果を返す処理を行うこととなる。
−−−データ構造例−−−
続いて、本実施形態の設計書学習装置100が用いるテーブル類について説明する。図2に、本実施形態における設計書DB125の一例を示す。
本実施形態の設計書DB125は、設計書ファイルを蓄積したデータベースである。そのデータ構造は、対応する設計書の名称をキーとして、当該設計書ファイルの格納先と、当該設計書ファイルが示す設計書の評価結果とを対応付けたレコードの集合体となっている。なお、上述の評価結果は、例えば、相応の知見を有したレビュアーによる評価結果や、当該設計書を用いて実際に遂行された下流工程での不具合やそれによる手戻りの発生率の実績値などを想定可能である。
この設計書DB125に格納されている設計書ファイルとしては、既存設計書、および、今次のレビュー対象とされる設計書、の各ファイルを想定できる。また、設計書の種類としては、業務フロー、システム構成図、ER図、テーブル定義書、機能一覧表、方式設計書、画面/帳票レイアウト、など様々に想定される。
図3は、本実施形態の文脈ベクトルDB126のデータ構成例を示す図である。本実施形態の文脈ベクトルDB126は、設計書学習方法により特定された特徴量、すなわち、設計書の図におけるテキストデータ間での単語の共起性の判定結果を格納したデータベースである。
この文脈ベクトルDB126は、対象となる各設計書が含むそれぞれの図のタイトルのセットをキーとして、当該図におけるテキストデータ中の単語間での共起頻度の値をマトリクス状に対応付けた文脈ベクトルテーブル1261の集合体となっている。この文脈ベクトルDB126において格納される各文脈ベクトルテーブル1261は、本実施形態の
設計文書学習方法を実行することで生成されるものである。なお、共起頻度の値が例えば2以上など、所定の基準以上の値について、太字で下線として強調表示している。強い共起関係にある単語のセットに該当する。
−−−フロー例−−−
以下、本実施形態における設計書学習方法の実際手順について図に基づき説明する。以下で説明する設計書学習方法に対応する各種動作は、設計書学習装置100がメモリ等に読み出して実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
図4は、本実施形態における設計書学習方法のフロー例1を示す図である。この場合、設計書学習装置100は、記憶装置101の設計書DB125から、評価結果が所定基準以上の既存設計書のファイルを複数特定し、当該ファイルそれぞれに含まれる図のデータのプロパティ情報や或いは単に当該データの拡張子の値を、属性の情報として読み取る(s100)。例えば、当該図のデータの拡張子として、“dot”、“CSV”、“jpg”、などといった値が取得できる。
続いて、設計書学習装置100は、上述のs100で得た属性の情報が、クラス図に関するものか、または、それ以外の図に関するものかを判定する(s101)。上述の例であれば、当該図のデータの拡張子の値として、“dot”を得た場合、当該図はクラス図と判定する。また同様に、拡張子の値として、“CSV”を得た場合、当該図は表であると判定する。また、拡張子の値として、“jpg”を得た場合、当該図は文字認識処理や線分認識処理が必要となるイメージデータと判定する。
上述の判定の結果、s100で得た属性の情報が、クラス図以外の図にかんするものであることが判明した場合(s102:n)、設計書学習装置100は、処理をs104に遷移させる。
他方、上述の判定の結果、当該属性がクラス図に関するものであることが判明した場合(s102:y)、設計書学習装置100は、記憶装置101で保持するアルゴリズム110〜113のうち、クラス図向けアルゴリズム110を選択して呼び出し、これを実行する(s103)。
この場合の設計書学習装置100におけるクラス図向けアルゴリズム110は、図5のフロー例2に示す処理を実行する。
すなわち、クラス図向けアルゴリズム110は、クラス図のデータであることが判明したdot形式のデータ(図6:設計書Aが含んでいるタイトル“Stock Company”なるク
ラス図のデータ600)において、“edge define”なる記述で規定されたエッジの定義
部分を参照し、当該定義において、オブジェクト(図6:“Stock Company”の場合、“alpha”、“beta”、“E”、“D”)の記載と、当該オブジェクトの間を接続するエッジの有向/無向の記載(例:“alpha”から“beta”に向かう間に関して、矢印形状“normal
”すなわち有向)とを読み取る(s200)。 このs200の処理は、上述のs100で複数特定した既存設計書のファイルそれぞれにおけるクラス図のデータ、すなわちdot形式のデータに関して同様に行うものとする。例えば、図8に例示する、設計書Bが含んでいるタイトル“Bank”なるクラス図のデータ700の場合、“alpha”、“beta”、
“gamma”、“delta”のオブジェクトの記載と、当該オブジェクトの間を接続するエッジの有向/無向の記載とを読み取ることとなる。
クラス図向けアルゴリズム110は、上述のs200で、既存の設計書それぞれのクラス図のデータ、すなわち“Stock Company”なるクラス図、および、“Bank”なるクラス
図、の各dot形式のデータから得た、オブジェクトと、オブジェクトの間を接続するエッジとに関する各情報に基づき、上述のクラス図それぞれにおける、オブジェクト間の継承関係の有無および強度に応じた共起性を判定する(s201)。
例えば、図8の概念図で示すように、“Stock Company”なるクラス図において、オブ
ジェクト“alpha”とオブジェクト“beta”の間は、有向エッジで直接結ばれた強い継承
関係で共起性は“2”と判定する。また、オブジェクト“E”とオブジェクト“D”の間は、エッジで結ばれておらず、またその他のオブジェクトおよび有向エッジの向きからオブジェクト“E”とオブジェクト“D”の間が経路として結ばれる可能性が無いため、継承関係は無く強度無しで共起性は“0”と判定する。一方、オブジェクト“alpha”とオブジ
ェクト“E”の間、および、オブジェクト“alpha”とオブジェクト“D”の間は、それぞ
れオブジェクト“beta”からの有向エッジを介して間接的ながら結ばれた弱い継承関係で共起性度は“1”と判定する。
他方、図9の概念図で示すように、“Bank”なるクラス図において、オブジェクト“alpha”とオブジェクト“beta”の間は、有向エッジで直接結ばれた強い継承関係で共起性
は“2”と判定する。また、オブジェクト“beta”とオブジェクト“gamma”の間は、エ
ッジで結ばれておらず、またその他のオブジェクトおよび有向エッジの向きからオブジェクト“beta”とオブジェクト“gamma”の間が経路として結ばれる可能性が無いため、継
承関係は無く強度無しで共起性は“0”と判定する。一方、オブジェクト“alpha”とオ
ブジェクト“delta”の間は、オブジェクト“beta”やオブジェクト“gamma”からの有向エッジを介して間接的ながら結ばれた弱い継承関係であり、共起性は“1”と判定する。
続いて、クラス図向けアルゴリズム110は、s201で判定した共起性に基づいて、対象となった既存設計書それぞれのクラス図を跨がった、各オブジェクトクトが含むテキストデータの間での単語の共起頻度を集約した文脈ベクトルテーブル1261を生成する(s202)。
この場合のクラス図向けアルゴリズム110は、例えば、上述の“Stock Company”な
るクラス図および“Bank”なるクラス図に含まれるオブジェクトである、“alpha”、“beta”、“D”、“E”、“gamma”、“delta”、を行列の各項目として定義したマトリク
スにおいて、各オブジェクトの共起性の値を合算して、図3で例示したごとき文脈ベクトルテーブル1261を生成する。
なお、設計書学習装置100は、上述のようにクラス図など図のデータに関して共起性の判定や文脈ベクトルテーブル1261の生成を行うとともに、当該設計書における文書データが含むテキストに基づく特徴量の特定処理を文書データ向けのアルゴリズム114により実行しているものとする。但し、こうした文書データに関する処理自体は既存技術として存在するためここでの説明は省略する。一方、設計書学習装置100は、こうして文書データに関して特定した特徴量、すなわち共起性の判定結果を、当該設計書が含む上述のクラス図など図のデータに関して特定した特徴量、すなわち共起性の判定結果に併合し、図10のごとく文脈ベクトルテーブル1261を生成するとすれば更に好適である。
ここで、図4のフローの説明に戻る。上述のs101での判定の結果、s100で得た属性の情報が、クラス図以外の図にかんするものであることが判明した場合(s102:n)、設計書学習装置100は、当該図におけるオブジェクト間が有向エッジで結ばれたものか判定する(s104)。この判定は、該当図のデータにおけるオブジェクトおよびオブジェクト間を結ぶエッジに関する各記述に基づいて行うものとする。
上述の判定の結果、当該図におけるオブジェクト間が有向エッジで結ばれたものではな
いことが判明した場合(s105:n)、設計書学習装置100は、処理をs107に遷移させる。
他方、上述の判定の結果、当該図におけるオブジェクト間が有向エッジで結ばれたもの、すなわち当該図がフロー図やシーケンス図であることが判明した場合(s105:y)、設計書学習装置100は、非クラス図向け(有向エッジ)アルゴリズム112を記憶装置101から呼び出して、これを実行する(s106)。
この場合の非クラス図向け(有向エッジ)アルゴリズム112は、上述のクラス図向けアルゴリズム110と同様に、当該図におけるオブジェクト間での有向エッジの向きに則した直接ないし間接の接続関係の有無に応じて、当該オブジェクトそれぞれが含むテキストデータ間での単語の共起性を判定し、この判定結果に基づいてs201と同様に、文脈ベクトルテーブル1261を生成するものとする。
なお、ここでの共起性の判定では、クラス図に関して行ったように継承関係の有無および強度については考慮しないため、オブジェクト間での有向エッジの向きに則した接続関係が直接か間接かに係わらず存在する場合に共起性“1”、それ以外の場合に共起性“0”と判定する。
一方、上述のs104での判定の結果、当該図におけるオブジェクト間が有向エッジで結ばれたものではないことが判明した場合(s105:n)、設計書学習装置100は、当該図におけるオブジェクト間がエッジで結ばれているか判定する(s107)。
上述の判定の結果、当該図におけるオブジェクト間がエッジで結ばれていないことが判明した場合(s108:n)、設計書学習装置100は、記憶装置101の各アルゴリズム110〜113のうち、非クラス図向け(エッジ無)アルゴリズム111を呼び出して、これを実行する(s109)。
この場合の非クラス図向け(エッジ無)アルゴリズム111は、当該図におけるオブジェクトそれぞれが含むテキストデータ間での単語の共起性を判定し、この判定結果に基づいてs201と同様に、文脈ベクトルテーブル1261を生成するものとする。
なお、ここでの共起性の判定では、クラス図や有向エッジ有りの非クラス図に関して行ったように継承関係の有無および強度やエッジによる接続関係については考慮しないため、各オブジェクトに関して全て共起性“1”と判定する。
他方、上述の判定の結果、当該図におけるオブジェクト間がエッジで結ばれていることが判明した場合(s108:y)、設計書学習装置100は、記憶装置101の各アルゴリズム110〜113のうち、非クラス図向け(無向エッジ)アルゴリズム113を呼び出して、これを実行する(s110)。
この場合の非クラス図向け(無向エッジ)アルゴリズム113は、当該図におけるオブジェクト間での無向エッジによる直接ないし間接の接続関係の有無に応じて、当該オブジェクトそれぞれが含むテキストデータ間での単語の共起性を判定し、この判定結果に基づいてs201と同様に、文脈ベクトルテーブル1261を生成するものとする。
なお、ここでの共起性の判定では、クラス図や有向エッジ有りの非クラス図に関して行ったように継承関係の有無および強度や有向エッジによる接続関係については考慮しないため、直接か間接かに係わらず無向エッジで結ばれた各オブジェクトに関して全て共起性“1”と判定する。
設計書学習装置100は、以上のように文脈ベクトルテーブル1261を生成し、これを文脈ベクトルDB126に格納しておき、人工知能による設計レビューに際して基準となる辞書として利用することとなる。
例えば、文脈ベクトルDB126の文脈ベクトルテーブル1261と、設計レビュー対象の或る設計書とを当該人工知能におけるアルゴリズムで照合し、所定基準以上の共起頻度(例えば、図10の文脈ベクトルテーブル1261における、2以上)を示すべき単語のセット(図10の例では、“Bank”と“Money”、“Institution”と“Money”、“alpha”と“beta”、“alpha”と“gamma”)が漏れていないか判定し、当該漏れが生じている場合には、レビュー結果NGと判定する。こうした人工知能による設計レビューの基本機能自体は既存技術を適宜に採用すればよい。
−−−その他の例−−−
続いて、上述のフロー例1におけるs104での判定における更なる分岐例について説明する。図11は、本実施形態における設計書学習方法のフロー例3を示す図である。
このフローは、上述のフロー例1において、s100で得た属性の情報が、クラス図以外の図にかんするものであることが判明し(s102:n)、また、s104の判定の結果、当該図のデータの拡張子として得られたのが、“jpg”、などイメージデータを示すものであった場合のフローとなる。
この場合、設計書学習装置100は、当該図のデータは文字認識処理および線分認識処理が必要と判定し、記憶装置101の各アルゴリズムのうち、イメージデータ向けアルゴリズム115を呼び出して、これを実行する(s300)。
このイメージデータ向けアルゴリズム115は、イメージデータに対する文字認識処理および線分検出処理を実行して、当該イメージデータが含むオブジェクトと当該オブジェクトに記載されているテキストデータとを特定するものとなる。ただし、これら文字認識処理および線分認識処理のそれぞれの機能については、既存技術(文字認識処理は一般的なOCR用のアルゴリズム、線分認識処理は、例えば、Line Segment Detectorなどの線
分検出器)を適宜に採用すればよい。
設計書学習装置100は、上述のs300における文字認識処理および線分認識処理のそれぞれにより、当該イメージデータから特定したオブジェクトおよびテキストデータを、例えば、クラス図、フロー図、シーケンス図、といったシステム開発の設計書における種々の図のフォーマット等と照合し、当該図がクラス図か非クラス図かを判定する(s301)。
次に、設計書学習装置100は、上述の判定の結果に応じ、当該図に対応するアルゴリズムを上述のフロー例と同様、記憶装置101のアルゴリズム110〜113の中から選択してこれを実行し(s302)、文脈ベクトルテーブル1261を生成することとなる。
以上、本発明を実施するための最良の形態などについて具体的に説明したが、本発明はこれに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。
こうした本実施形態によれば、人工知能による設計レビューにおいて、設計書が含む図に関する特徴量の効率的な抽出を精度良好に行い、ひいては、有識者による設計レビューの更なる効率化や品質向上を図ることが可能となる。
本明細書の記載により、少なくとも次のことが明らかにされる。すなわち、本実施形態の設計書学習装置において、前記演算装置は、前記属性が前記構造図に関するものである場合、当該図に関するアルゴリズムとして、前記構造図におけるオブジェクト間の継承関係の有無および強度に応じて、当該オブジェクトそれぞれが含むテキストデータ間での単語の共起性を判定するアルゴリズムを記憶装置より選択し、当該アルゴリズムにより当該図における特徴量を特定するものである、としてもよい。
これによれば、設計書に含まれる図がクラス図など構造図である場合、各クラスの間の継承関係の有無および強度に基づき、単語の共起性判定、すなわち特徴量の特定を効率的かつ精度良好に行えることとなる。
また、本実施形態の設計書学習装置において、前記演算装置は、前記属性が前記構造図とは別種の図に関するもので、かつ、当該図におけるオブジェクト間が有向エッジで結ばれたものである場合、当該図に関するアルゴリズムとして、当該図におけるオブジェクト間での有向エッジの向きに則した直接ないし間接の接続関係の有無に応じて、当該オブジェクトそれぞれが含むテキストデータ間での単語の共起性を判定するアルゴリズムを記憶装置より選択し、当該アルゴリズムにより当該図における特徴量を特定するものである、としてもよい。
これによれば、設計書に含まれる図がフロー図やシーケンス図などの非クラス図で、その図を構成するオブジェクトの間が有向エッジで結ばれたものの場合、各オブジェクトの間が有向エッジの向きに則して直接/間接に接続されていることに応じて、単語の共起性判定、すなわち特徴量の特定を効率的かつ精度良好に行えることとなる。
また、本実施形態の設計書学習装置において、前記演算装置は、前記属性が前記構造図とは別種の図に関するもので、かつ、当該図におけるオブジェクト間がエッジで結ばれていないものである場合、当該図に関するアルゴリズムとして、当該図におけるオブジェクトそれぞれが含むテキストデータ間での単語の共起性を判定するアルゴリズムを記憶装置より選択し、当該アルゴリズムにより当該図における特徴量を特定するものである、としてもよい。
これによれば、設計書に含まれる図がテーブルなどの非クラス図で、その図を構成するオブジェクトの間がエッジで結ばれていないものの場合、オブジェクトそれぞれが含むテキストデータ間での単語の共起性判定、すなわち特徴量の特定を効率的かつ精度良好に行えることとなる。
また、本実施形態の設計書学習装置において、前記演算装置は、前記属性が前記構造図とは別種の図に関するもので、かつ、当該図におけるオブジェクト間が無向エッジで結ばれたものである場合、当該図に関するアルゴリズムとして、当該図におけるオブジェクト間での無向エッジによる直接ないし間接の接続関係の有無に応じて、当該オブジェクトそれぞれが含むテキストデータ間での単語の共起性を判定するアルゴリズムを記憶装置より選択し、当該アルゴリズムにより当該図における特徴量を特定するものである、としてもよい。
これによれば、設計書に含まれる図が非クラス図で、その図を構成するオブジェクトの間が無向エッジで結ばれたものの場合、各オブジェクトの間が無向エッジで直接/間接に接続されていることに応じて、単語の共起性判定、すなわち特徴量の特定を効率的かつ精度良好に行えることとなる。
また、本実施形態の設計書学習装置において、前記演算装置は、前記設計書ファイルに含まれる図のデータがイメージデータである場合、前記アルゴリズムの選択に際し、当該イメージデータに対する所定の文字認識処理および線分検出処理を実行して、当該イメージデータが含むオブジェクトと当該オブジェクトに記載されているテキストデータとを特定し、前記特定したオブジェクトおよびテキストデータに基づいて、当該図が前記構造図か前記別種の図かを判定して、当該判定の結果に応じ、当該図に対応するアルゴリズムを前記複数種類のアルゴリズム中から選択するものである、としてもよい。
これによれば、学習対象の設計書がイメージデータとしての図を含んでいる場合にも対応し、適宜な特徴量特定が可能となる。
また、本実施形態の設計文書学習装置において、前記演算装置は、前記設計書ファイルに含まれる文書データが含むテキストに基づく特徴量の特定処理を文書データ向けのアルゴリズムにより実行し、当該文書データに関して特定した特徴量と、当該設計書ファイルが含む前記図のデータに関して特定した特徴量とをあわせて、当該設計書ファイルに関する特徴量として特定する処理を更に実行するものである、としてもよい。
これによれば、設計書を構成する文書および図の各データに基づく特徴量を特定することが可能となり、設計書に関する特徴量の効率的な抽出を更に精度良好に行うことにつながる。
100 設計書学習装置
101 記憶装置
102 プログラム
103 メモリ
104 演算装置
105 入力装置
106 出力装置
110 クラス図向けアルゴリズム
111 非クラス図向け(エッジ無)アルゴリズム
112 非クラス図向け(有向エッジ)アルゴリズム
113 非クラス図向け(無向エッジ)アルゴリズム
114 文書データ向けアルゴリズム
115 イメージデータ向けアルゴリズム
125 設計書DB
126 文脈ベクトルDB
1261 文脈ベクトルテーブル

Claims (8)

  1. 設計書ファイルと、特徴量抽出用の複数種類のアルゴリズムと、を格納した記憶装置と、
    前記設計書ファイルに含まれる図のデータの所定属性を読取り、当該属性が、設計対象におけるオブジェクト間の関係性を表す構造図に関するものか、前記構造図とは別種の図に関するものかに応じ、当該図に対応するアルゴリズムを前記複数種類のアルゴリズム中から選択して、当該図のデータが含むテキストに基づく特徴量の特定処理を当該アルゴリズムにより実行する演算装置と、
    を備えることを特徴とする設計書学習装置。
  2. 前記演算装置は、
    前記属性が前記構造図に関するものである場合、当該図に関するアルゴリズムとして、前記構造図におけるオブジェクト間の継承関係の有無および強度に応じて、当該オブジェクトそれぞれが含むテキストデータ間での単語の共起性を判定するアルゴリズムを記憶装置より選択し、当該アルゴリズムにより当該図における特徴量を特定するものである、
    ことを特徴とする請求項1に記載の設計書学習装置。
  3. 前記演算装置は、
    前記属性が前記構造図とは別種の図に関するもので、かつ、当該図におけるオブジェクト間が有向エッジで結ばれたものである場合、当該図に関するアルゴリズムとして、当該図におけるオブジェクト間での有向エッジの向きに則した直接ないし間接の接続関係の有無に応じて、当該オブジェクトそれぞれが含むテキストデータ間での単語の共起性を判定するアルゴリズムを記憶装置より選択し、当該アルゴリズムにより当該図における特徴量を特定するものである、
    ことを特徴とする請求項2に記載の設計書学習装置。
  4. 前記演算装置は、
    前記属性が前記構造図とは別種の図に関するもので、かつ、当該図におけるオブジェクト間がエッジで結ばれていないものである場合、当該図に関するアルゴリズムとして、当該図におけるオブジェクトそれぞれが含むテキストデータ間での単語の共起性を判定するアルゴリズムを記憶装置より選択し、当該アルゴリズムにより当該図における特徴量を特定するものである、
    ことを特徴とする請求項3に記載の設計書学習装置。
  5. 前記演算装置は、
    前記属性が前記構造図とは別種の図に関するもので、かつ、当該図におけるオブジェクト間が無向エッジで結ばれたものである場合、当該図に関するアルゴリズムとして、当該図におけるオブジェクト間での無向エッジによる直接ないし間接の接続関係の有無に応じて、当該オブジェクトそれぞれが含むテキストデータ間での単語の共起性を判定するアルゴリズムを記憶装置より選択し、当該アルゴリズムにより当該図における特徴量を特定するものである、
    ことを特徴とする請求項3に記載の設計書学習装置。
  6. 前記演算装置は、
    前記設計書ファイルに含まれる文書データが含むテキストに基づく特徴量の特定処理を文書データ向けのアルゴリズムにより実行し、当該文書データに関して特定した特徴量と、当該設計書ファイルが含む前記図に関して特定した特徴量とをあわせて、当該設計書ファイルに関する特徴量として特定する処理を更に実行するものである、
    ことを特徴とする請求項1に記載の設計書学習装置。
  7. 前記演算装置は、
    前記設計書ファイルに含まれる図のデータがイメージデータである場合、前記アルゴリズムの選択に際し、当該イメージデータに対する所定の文字認識処理および線分検出処理を実行して、当該イメージデータが含むオブジェクトと当該オブジェクトに記載されているテキストデータとを特定し、前記特定したオブジェクトおよびテキストデータに基づいて、当該図が前記構造図か前記別種の図かを判定して、当該判定の結果に応じ、当該図に対応するアルゴリズムを前記複数種類のアルゴリズム中から選択するものである、
    ことを特徴とする請求項1に記載の設計書学習装置。
  8. 設計書ファイルと、特徴量抽出用の複数種類のアルゴリズムと、を格納した記憶装置を備える情報処理装置が、
    前記設計書ファイルに含まれる図のデータの所定属性を読取り、当該属性が、設計対象におけるオブジェクト間の関係性を表す構造図に関するものか、前記構造図とは別種の図に関するものかに応じ、当該図に対応するアルゴリズムを前記複数種類のアルゴリズム中から選択して、当該図のデータが含むテキストに基づく特徴量の特定処理を当該アルゴリズムにより実行する、
    ことを特徴とする設計書学習方法。
JP2017151263A 2017-08-04 2017-08-04 設計書学習装置および設計書学習方法 Active JP6960270B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017151263A JP6960270B2 (ja) 2017-08-04 2017-08-04 設計書学習装置および設計書学習方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017151263A JP6960270B2 (ja) 2017-08-04 2017-08-04 設計書学習装置および設計書学習方法

Publications (2)

Publication Number Publication Date
JP2019028958A true JP2019028958A (ja) 2019-02-21
JP6960270B2 JP6960270B2 (ja) 2021-11-05

Family

ID=65478481

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017151263A Active JP6960270B2 (ja) 2017-08-04 2017-08-04 設計書学習装置および設計書学習方法

Country Status (1)

Country Link
JP (1) JP6960270B2 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07114572A (ja) * 1993-10-18 1995-05-02 Sharp Corp 文書分類装置
JP2005149527A (ja) * 2004-12-27 2005-06-09 Toshiba Corp 顔認証装置および顔認証方法
JP2008059367A (ja) * 2006-08-31 2008-03-13 Fujitsu Ltd システムデータ構造管理プログラム、システムデータ構造管理装置、およびシステムデータ構造管理方法
JP2008186356A (ja) * 2007-01-31 2008-08-14 Hitachi Information Systems Ltd ドキュメントの整合性検査支援システムおよび方法、ならびにそのプログラム
JP2011248596A (ja) * 2010-05-26 2011-12-08 Hitachi Ltd 画像入り文書の検索システム及び検索方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07114572A (ja) * 1993-10-18 1995-05-02 Sharp Corp 文書分類装置
JP2005149527A (ja) * 2004-12-27 2005-06-09 Toshiba Corp 顔認証装置および顔認証方法
JP2008059367A (ja) * 2006-08-31 2008-03-13 Fujitsu Ltd システムデータ構造管理プログラム、システムデータ構造管理装置、およびシステムデータ構造管理方法
JP2008186356A (ja) * 2007-01-31 2008-08-14 Hitachi Information Systems Ltd ドキュメントの整合性検査支援システムおよび方法、ならびにそのプログラム
JP2011248596A (ja) * 2010-05-26 2011-12-08 Hitachi Ltd 画像入り文書の検索システム及び検索方法

Also Published As

Publication number Publication date
JP6960270B2 (ja) 2021-11-05

Similar Documents

Publication Publication Date Title
US11348352B2 (en) Contract lifecycle management
US10789429B2 (en) Visualizing comment sentiment
US20200073784A1 (en) Time-weighted risky code prediction
JP2020522790A (ja) 異種にプログラムされたデータ処理システムの自動依存性アナライザ
US10019535B1 (en) Template-free extraction of data from documents
US10380263B2 (en) Translation synthesizer for analysis, amplification and remediation of linguistic data across a translation supply chain
CN111324716A (zh) 指标数据获取方法、装置、计算机设备和存储介质
CN111651552B (zh) 结构化信息确定方法、装置和电子设备
WO2014064803A1 (ja) 文書処理プログラム、文書処理装置、文書処理システム、文書処理方法
US11093223B2 (en) Automatically converting a program written in a procedural programming language into a dataflow graph and related systems and methods
Petukhova et al. TextCL: A Python package for NLP preprocessing tasks
US7991727B2 (en) Mechanism to abstract fact types from a rule engine
Malhotra et al. Analyzing and evaluating security features in software requirements
JP2008117066A (ja) ソフトウェア開発支援方法、ソフトウェア開発支援装置、ソフトウェア開発支援プログラム、及び計算機システム
JP6960270B2 (ja) 設計書学習装置および設計書学習方法
CN114115878A (zh) 一种工作流节点推荐方法及装置
JP5900486B2 (ja) 関連仕様対応付けシステム、関連仕様対応付け方法およびプログラム
JP6347751B2 (ja) シミュレーションモデル生成支援方法およびシミュレーションモデルシステム
JP2016126721A (ja) プログラム生成装置、及び、プログラム生成方法
WO2023162129A1 (ja) 学習用データ生成装置、リスク検知装置、学習用データ生成方法、リスク検知方法、学習用データ生成プログラム及びリスク検知プログラム
US20240119387A1 (en) Computer-readable recording medium having stored therein machine learning program, machine learning method, and information processing apparatus
WO2024047997A1 (ja) 文書分析装置、及び文書分析用プログラム
WO2022049693A1 (ja) プログラム作成装置および方法
JP4663526B2 (ja) 帳票作成支援装置、帳票作成支援方法、および帳票作成支援プログラム
KR20240064451A (ko) 기계 학습 모델의 학습 데이터 품질 향상을 위한 특징 공학 파이프라인 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210330

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210510

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211005

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211011

R150 Certificate of patent or registration of utility model

Ref document number: 6960270

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150