以下、本発明の実施形態について、図面を参照して詳細に説明する。なお、各図面において、共通する構成要素には同一の符号を付し、重複した説明を省略する。
図1は、本発明の実施形態に係る文書作成支援装置1の機能ブロック構成の例を示した図である。図1に示すように、文書作成支援装置1は、テンプレート&文書メタデータ登録部11、新規文書作成支援部12、選択文書修正支援部13、要修正文書抽出部14、要修正文書修正支援部15、文書間修正頻度計数部16、文書間修正相関関係値算出部17、第2の要修正文書抽出部18などの情報処理に係る機能ブロックを含んで構成される。さらに、文書作成支援装置1は、テンプレート文書記憶部21、文書メタデータ記憶部22、文書間修正頻度記憶部23、文書間修正相関関係値記憶部24などの情報記憶に係る機能ブロックを含んで構成される。
以上のような構成された文書作成支援装置1は、ハードウエア的には、1つまたは複数のコンピュータにより実現される。すなわち、文書作成支援装置1を構成する前記情報処理に係る機能ブロックの機能は、前記1つまたは複数のコンピュータが記憶装置に記憶された所定のプログラムを実行することにより実現される。また、前記情報記憶に係る機能ブロックは、前記記憶装置上に構成される。
ざらに、図1に示すように、文書作成支援装置1は、通信ネットワーク3を介して複数の端末装置4に接続されている。ここで、端末装置4は、パーソナルコンピュータで構成され、少なくともLCD(Liquid Crystal Display)などの表示装置41と、キーボードやマウスなどの入力装置42と、を備える。
従って、文書作成支援装置1の利用者は、入力装置42を操作することにより、文書を作成しつつ、その文書を表示装置41に表示させることができ、また、その文書の作成時に、文書作成支援装置1による文書作成支援サービスを受けることができる。すなわち、本実施形態では、文書作成支援装置1は、主として、治験などの臨床研究の依頼者や研究担当者(被依頼者、例えば、治験担当医師)などが臨床研究に関連する文書を作成するとき、その文書の作成や修正を支援する。
なお、図1では、表示装置41および入力装置42は、文書作成支援装置1に通信ネットワーク3を介して接続された端末装置4を構成する構成要素となっているが、文書作成支援装置1に直接接続されるものであってもよい。
以上、図1に示した文書作成支援装置1を構成する各機能ブロックの詳細については、以下、順次説明する。
図2は、本発明の実施形態に係るテンプレート文書51の例を示した図である。テンプレート文書51は、複数の利用者が作成する文書で共通な部分が予め作成され、互いに相違する部分が空白とされた文書である。従って、テンプレート文書51の利用者は、その空白部分に必要な情報を記入することで必要な文書を作成することができる。図2のテンプレート文書51では、利用者が必要な情報を記入すべき空白部分は、実線の長方形の枠で示されており、以下、この長方形の枠を入力欄という。
本実施形態では、利用者が文書を作成する場合には、まず、図2に示すような入力欄を含んだテンプレート文書51が端末装置4の表示装置41に表示される。そこで、利用者は、表示装置41に表示された入力欄を、入力装置42を介して1つずつ選択しながら、その入力欄に必要な情報を記入(入力)する。
なお、ここでいう入力欄に入力する情報は、数字および記号を含む文字の単なる並びでも、自然言語でいう単語でも、複数の単語の並びでも、複数の単語からなる文章のいずれであってもよい。さらに、その入力欄に入力する情報は、文字列に限定されず、図形情報や画像情報などであってもよい。この入力欄に入力される情報は、同じテンプレート文書51を用いて複数の文書が作成されるとき、その複数の文書間で互いに相違し得る情報である。本明細書では、このような情報を、以下、「メタデータ値」といい、詳細は、図4を用いて説明する。
また、図2に示したテンプレート文書51は、治験依頼書のテンプレート文書の例であるが、テンプレート文書51は、この例に限定されない。本実施形態では、テンプレート文書51として、治験実施計画書のテンプレート文書、治験標準作業手順書のテンプレート文書など、治験などの臨床研究で用いられる様々な文書のテンプレート文書が用意される。
本実施形態では、同じ種類の文書(例えば、治験依頼書と呼ばれる文書、治験実施計画書と呼ばれる文書など)は、基本的には、同じテンプレートを用いて作成されるが、例えば、提出先などが異なれば、異なるテンプレート文書を用いて作成されてもよい。さらには、それぞれがフリーフォーマットで作成されてもよい。
一般に、フリーフォーマットの文書では、情報の記載箇所や記載順のは任意(フリー)である。しかしながら、フリーフォーマットの文書ではあっても、記載すべき情報の記載箇所は、その情報の名称が記載された箇所により、例えば、次のように明示される。
研究テーマ名:*****
治験担当医師名:****
このようにして指定される情報の記載箇所は、図2でいう入力欄に相当する。そこで、本実施形態では、フリーフォーマットの文書についても、テンプレート文書を仮定することができる。例えば、同じ種類のフリーフォーマットの複数の文書において、記載すべき情報の記載箇所や記載順序が同じである場合には、それらの文書は、同じテンプレート文書を用いて作成されたものする。一方、同じ種類のフリーフォーマットの複数の文書において、記載すべき情報の記載箇所や記載順序が互いに相違する場合には、それらの文書は、異なるテンプレート文書を用いて作成されたものとする。
図3は、テンプレート文書記憶部21に記憶されるテンプレートテーブル211の構成の例を示した図である。テンプレート文書記憶部21には、図2に示したような各種のテンプレート文書51と、この図3に示すようなテンプレートテーブル211とが記憶される。
テンプレートテーブル211は、図3に示すような複数の行と複数の列とからなるテーブルによって構成される。ここで、各行のデータには、その行のデータの名称である項目名が付与されている。そして、その項目名は、その項目名の種別に応じて、さらにグループ化されている。図3の例では、項目名は、書誌情報、治験情報、依頼元情報および実施機関情報のグループに分類されている。なお、項目名を分類するグループとしては、このほかにも、患者情報、添付文書情報などがあってもよい。
また、テンプレートテーブル211の各列のデータは、その列の第1行のテンプレートIDで特定されるテンプレート文書についてのデータであることを表している。図3の例では、第1列、第1行のデータから、第1列のデータがテンプレートID「TL001」のテンプレート文書についてのデータであることを表している。さらに、第1列、第2行のデータから、そのテンプレート文書が「治験依頼書」のテンプレート文書であることが分かる。なお、テンプレートテーブル211の各列、各行のデータを、以下、「項目値」という。
ここで、各列のデータのうち項目名が書誌情報に属する行の項目値は、そのテンプレートIDで特定されるテンプレート文書の属性を示した情報である。この書誌情報のグループには、テンプレートIDのほかに、文書名、Rev番号、作成日、作成者などが含まれる。
また、テンプレートテーブル211の各列の項目値のうち、項目名が書誌情報以外のグループに属する行の項目値は、その行の項目名で指定されるデータが各テンプレート文書51において入力されるべき入力欄の位置情報を表している。なお、入力欄の位置情報は、各テンプレート文書51に含まれる入力欄の識別番号であっても、文書中の段落番号や行番号などであってもよい。
本実施形態におけるテンプレートテーブル211では、文書名が同じでも記載内容が異なるテンプレート文書には、異なるテンプレートIDが付与される。また、あるテンプレートIDを有するテンプレート文書を修正してRev番号の異なる新たなテンプレート文書が作成された場合には、その新たなテンプレート文書には、修正前のテンプレート文書のテンプレートIDと異なるテンプレートIDが付与される。
なお、テンプレートテーブル211における項目名は、複数のテンプレート文書でそれぞれ用いられる項目名の和集合となっている。そのため、1つのテンプレート文書に注目すれば、そのテンプレート文書では使用されない項目名が現れる。例えば、図4では、各列のテンプレート文書で使用されない項目名に対応する項目値の欄には、空白であることを示す「−」が付されている。
図4は、文書メタデータ記憶部22に記憶されるメタデータテーブル221の構成の例を示した図である。メタデータテーブル221は、図4に示すような複数の行と複数の列とからなるテーブルによって構成される。ここで、各行のデータには、その行のデータの名称である項目名が付与され、その項目名は、その項目名の種別に応じて、さらにグループ化されている。なお、メタデータテーブル221の項目名およびそのグループ構成は、書誌情報の一部の項目名を除き、テンプレートテーブル211の項目名およびそのグループ構成と同じである。
ここで、メタデータテーブル221の各列のデータは、その列の第1行の文書IDで特定される文書についてのデータであることを表している。図4の例では、第1列〜第3列のデータは、その第1行、第2行のデータから、文書IDが「D000123」で、文書名が「治験依頼書」の文書であることが分かる。また、第3行のデータから、これらの文書のRev番号がそれぞれ「Rev01」〜「Rev03」であることが分かる。さらに、第4行のデータから、これらの文書がテンプレートID「TL001」のテンプレート文書を用いて作成されたものであることが分かる。
本実施形態では、メタデータテーブル221の各列の書誌情報の項目名として、以上の文書ID、文書名、Rev番号、テンプレートIDのほかに、当該文書の作成日、作成者などが付される。これらの情報により、各列の文書を特定することができる。
一方、メタデータテーブル221における書誌情報以外の各項目名に対する各列のデータは、その列の書誌情報で特定される文書に記入される具体的なデータである。例えば、図4のメタデータテーブル221において第3列の文書ID「D000123」で特定される文書は、研究テーマ名が「ABCD」の文書であることを表している。従って、この研究テーマ名「ABCD」は、テンプレートIDが「TL001」で特定されるテンプレート文書の「研究テーマ名」の欄に記入される(例えば、図2参照)。
本実施形態では、メタデータテーブル221の各列の各行のデータを「メタデータ値」という。従って、テンプレート文書51の各入力欄に記入されたデータは、メタデータテーブル221のメタデータ値として文書メタデータ記憶部22に記憶される。逆に、メタデータテーブル221の各列の書誌情報で特定される文書は、その列のメタデータ値と、テンプレートIDで特定されるテンプレート文書51を用いることにより再生することができる。
また、本実施形態では、メタデータ値としては、前記したように、単純な文字列だけでなく、文章、図形情報、画像情報などであってもよいとしている。このような場合には、情報量が大きくなるので、メタデータテーブル221の該当する行および列の欄には、文章、図形情報、画像情報などが記憶されたファイルの名称が格納されるものとする。
さらに、メタデータテーブル221の構成について補足する。本実施形態では、書誌情報以外に属する項目名は、それぞれ、治験情報、依頼元情報、実施機関情報などのグループに分類されるが、それぞれのグループの第1行の項目名としては、それぞれのグループを代表するような項目名が設定されるものとする。ちなみに、図4の例では、治験情報のグループの第1行の項目名は、研究テーマ名となっており、その第2行以下の項目名は、研究テーマに属する各種情報を特定する項目名となっている。同様に、依頼元情報のグループの第1行の項目名は、依頼元機関名となっており、その第2行以下の項目名は、依頼元機関名に属する各種情報を特定する項目名となっている。さらに、実施機関情報の項目名のグループについても同様である。
図5は、テンプレート&文書メタデータ登録部11により実行される処理フローの例を示した図である。テンプレート&文書メタデータ登録部11は、利用者が新規のテンプレート文書をテンプレートテーブル211に登録するとともに、その新規のテンプレート文書を用いて作成する文書に含まれるメタデータ値をメタデータテーブル221に登録するのを支援する。
図5に示すように、テンプレート&文書メタデータ登録部11は、まず、新規のテンプレート文書を取得し、その取得したテンプレート文書を表示装置41に表示する(ステップS11)。ここでは、新規のテンプレート文書は、予め作成されたものであるとする。従って、新規のテンプレート文書としては、例えば、カット・ドゥ・スクエア(非特許文献1参照)などで用意されているテンプレート文書を用いてもよく、あるいは、利用者が任意に作成したテンプレート文書を用いてもよい。
次に、テンプレート&文書メタデータ登録部11は、この新規のテンプレート文書に対し、テンプレートIDを設定し、テンプレートテーブル211(図3参照)に新たな列を1列追加する(ステップS12)。このとき、テンプレートIDは、当該テンプレート文書をユニークに識別可能なものであるとする。
次に、テンプレート&文書メタデータ登録部11は、新規のテンプレート文書からその文書名を取得し、その文書名を追加した列の項目名が文書名の欄に格納する(ステップS13)。なお、新規のテンプレート文書からその文書名を取得できない場合には、利用者が入力装置42を介して文書名を入力してもよい。また、ここでいう文書名は、「治験依頼書」、「治験実施計画書」などテンプレート文書を識別する名称を指し、研究テーマなどが違っても同じ文書名が使用されることが多い。
次に、テンプレート&文書メタデータ登録部11は、メタデータテーブル221に1列を追加し、追加した列の項目名が文書ID、文書名、テンプレートIDの欄にそれぞれの値を設定する(ステップS14)。ここで、文書IDは、当該文書をユニークに識別可能なように設定する。また、文書名は、ステップS13で取得された文書名、テンプレートIDは、ステップS12で設定されたテンプレートIDである。
次に、テンプレート&文書メタデータ登録部11は、利用者の入力装置42の操作に従い、表示装置41に表示されたテンプレート文書51から入力欄の1つを選択し、その入力欄の欄番号を取得する(ステップS15)。なお、このとき、表示装置41には、図2に示すようなテンプレート文書51が表示され、その入力欄(四角の実線で囲った部分)には、識別可能な欄番号が付されているものとする。なお、ここでいう欄番号は、当該テンプレート文書51中において、入力欄の位置を特定可能な情報であれば、どのような情報であってもよい。
次に、テンプレート&文書メタデータ登録部11は、メタデータテーブル221にステップS15で選択した入力欄に対応付ける項目名がすでに存在するか否かを判定する(ステップS16)。その判定の結果、入力欄に対応付ける項目名がすでに存在する場合には(ステップS16でYes)、その対応付ける項目名を選択する(ステップS17)。一方、入力欄に対応付ける項目名が存在しない場合には(ステップS16でNo)、テンプレートテーブル211およびメタデータテーブル221それぞれに1行追加し、その行の項目名を設定する(ステップS18)。なお、その項目名は、利用者が入力装置42を介して入力する情報に基づき設定される。
次に、テンプレート&文書メタデータ登録部11は、テンプレートテーブル211のステップS14で追加した列で、ステップS17、S18で選択または設定した項目名の行の欄にステップS15で取得した欄番号を格納する(ステップS19)。次に、テンプレート&文書メタデータ登録部11は、表示装置41に表示されたテンプレート文書51の入力欄を介して利用者により入力される入力値を取得する(ステップS20)。さらに、テンプレート&文書メタデータ登録部11は、メタデータテーブル221のステップS14で追加した列で、ステップS17、S18で選択または設定した項目名の行の欄に、ステップS20で取得した入力値を格納する(ステップS21)。
次に、テンプレート&文書メタデータ登録部11は、表示装置41に表示されたテンプレート文書51の入力欄を全て選択したか否かを判定する(ステップS22)。その判定の結果、入力欄を全て選択した場合には(ステップS22でYes)、テンプレート&文書メタデータ登録部11は、その処理を終了する。一方、入力欄を全て選択していない場合には(ステップS22でNo)、テンプレート&文書メタデータ登録部11は、ステップS15に戻り、ステップS15以下の処理を繰り返し実行する。
図6は、新規文書作成支援部12により実行される処理フローの例を示した図である。新規文書作成支援部12は、新規作成する文書に用いられるテンプレート文書51がテンプレートテーブル211に登録済みの場合に、利用者がその新規文書を作成するのを支援する。そして、そのとき作成される文書のメタデータ値をメタデータテーブル221に登録する。
図6に示すように、新規文書作成支援部12は、まず、メタデータテーブル221に新たな空白の列を1列追加する(ステップS31)。次に、新規文書作成支援部12は、利用者が入力装置42を介して入力する文書名(すなわち、利用者がこのとき作成しようとしている文書の文書名)を取得し、さらに、その文書に対し、文書IDを設定する(ステップS32)。なお、文書IDは、当該文書をユニークに識別可能なものであるとする。
次に、利用者は、テンプレートテーブル211に登録済のテンプレート文書51のうち、いずれのテンプレート文書51を使用するかを選択する。このとき、新規文書作成支援部12は、利用者によるテンプレート文書51を選択する入力操作に基づき、当該文書の作成に用いるテンプレート文書51のテンプレートIDを取得する(ステップS33)。
次に、利用者は、入力装置42を介して当該文書の研究テーマ名を入力する。そこで、新規文書作成支援部12は、その入力される研究テーマ名を取得する(ステップS34)。そして、その取得した研究テーマ名をメタデータテーブル221に追加した列の「研究テーマ名」のメタデータ値として登録する。なお、研究テーマ名は、それぞれの研究テーマごとに互いに相違するものとする。
次に、新規文書作成支援部12は、メタデータテーブル221を参照して、既存の列の「文書名」の行の欄に前記取得した研究テーマ名と同じ研究テーマ名が存在するか否かを判定する(ステップS35)。その判定の結果、同じ研究テーマ名が存在しない場合には(ステップS35でNo)、新規文書作成支援部12は、その実行ステップをステップS43へ移行させる。なお、この場合は、このとき作成しようとしている文書が当該研究テーマについて最初に作成される文書であることを意味する。
一方、同じ研究テーマ名が存在する場合には(ステップS35でYes)、新規文書作成支援部12は、その実行ステップをステップS36へ移行させる。なお、この場合は、このとき作成しようとしている文書が当該研究テーマについて2番目以降に作成される文書であることを意味する。これは、例えば、このとき作成しようとしている文書が「治験実施計画書」であり、同じ研究テーマについての「治験依頼書」がすでに作成済みであるような場合を意味する。このような場合、当該文書(作成しようとしている文書「治験実施計画書」)で用いられているメタデータ値の中には、例えば依頼元機関名など、作成済の文書(「治験依頼書」)で既に登録済のものがあると考えられる。このような場合には、そのメタデータ値については、利用者に再度入力を求めるのではなく、作成済の文書で登録されたメタデータ値をコピーする。
そこで、ステップS36では、新規文書作成支援部12は、メタデータテーブル221の中から、ステップS34で取得した研究テーマ名と同じ研究テーマ名を有する列を1つ選択する(ステップS36)。さらに、新規文書作成支援部12は、その選択した列の行の欄(ただし、書誌情報のグループに属する項目名に対応する行の欄を除く)のうち1つを選択する(ステップS37)。そして、その選択した欄が空白でなかった場合には(ステップS38でNo)、選択した欄に登録されている値(メタデータ値)をステップS31で追加した列の同じ行の欄にコピーする(ステップS39)。一方、前記選択した欄が空白であった場合には(ステップS38でYes)、ステップS39はスキップされる。
続いて、新規文書作成支援部12は、前記ステップS36で選択した列の全部の行の欄(ただし、書誌情報のグループに属する項目名に対応する行の欄を除く)を選択したか否かを判定する(ステップS40)。その判定の結果、全部の行の欄を選択していない場合には(ステップS40でNo)、新規文書作成支援部12は、ステップS37に戻って、ステップS37以下の処理を繰り返し実行する。一方、全部の行の欄を選択していた場合には(ステップS40でYes)、新規文書作成支援部12は、ステップS36で同じ研究テーマ名を有する全部の列を選択したか否かを判定する(ステップS41)。
その判定の結果、同じ研究テーマ名を有する全部の列を選択していない場合には(ステップS41でNo)、新規文書作成支援部12は、ステップS36に戻って、ステップS36以下の処理を繰り返し実行する。これに対し、同じ研究テーマ名を有する全部の列を選択していた場合には(ステップS41でYes)、作成済みの文書のメタデータ値を当該文書のメタデータ値としてコピーする処理が終了したことになる。そこで、新規文書作成支援部12は、ステップS31で追加した列のメタデータ値(各行の欄のデータ)を用いて作成した文書を表示装置41に表示する(ステップS42)。なお、このときの文書の作成に対しては、ステップS33で取得されたテンプレートIDで指定されるテンプレート文書51が用いられる。
以上のようにして表示された新規作成の文書(例えば、図2に示したような文書)は、入力すべき情報を研究テーマ名が同じ他の文書から単純にコピーしたものであるため、その入力欄に不適切な情報が入力されていたり、入力欄が空欄であったりする。そこで、利用者は、表示された文書を適宜修正することが必要となり、新規文書作成支援部12は、ステップS44以下の処理で利用者による修正作業を支援する。
ところで、ステップS35の判定で、同じ研究テーマ名が存在しない場合には(ステップS35でNo)、そのとき作成しようとしている文書が当該研究テーマについて最初に作成される文書である。そこで、新規文書作成支援部12は、ステップS33で取得されたテンプレートIDで指定されるテンプレート文書51を表示装置41に表示する(ステップS43)。この場合、表示装置41に表示されたテンプレート文書51の入力欄は、全て空欄であり、利用者は、この空欄に適宜情報を入力することにより、新規文書を作成する。そこで、新規文書作成支援部12は、ステップS44以下の処理で利用者による情報の入力作業を支援する。
以下、ステップS44以降の処理について説明する。新規文書作成支援部12は、表示装置41に表示された文書(例えば、図2参照)の入力欄の1つを選択し、その入力欄の欄番号を取得する(ステップS44)。なお、ここでいう欄番号は、テンプレート文書51の各空欄に付された番号をいう。このとき、利用者は、入力装置42を介して選択する入力欄を指定するので、新規文書作成支援部12は、その指定された入力欄の欄番号を取得する。
次に、新規文書作成支援部12は、テンプレートテーブル211を参照して、前記取得した欄番号が項目値として登録された項目名を取得する(ステップS45)。そして、表示装置41に表示された文書の入力欄を介して、利用者により入力される情報を取得する(ステップS46)。さらに、新規文書作成支援部12は、ステップS31でメタデータテーブル221に追加した列の、ステップS45で取得した項目名と同じ項目名を有する行の欄に、ステップS46で取得した入力情報を登録する(ステップS47)。
次に、新規文書作成支援部12は、ステップS42またはステップS43で表示された文書において、修正すべき入力欄または空欄の入力欄の選択が終了したか否かを判定する(ステップS48)。なお、このとき、新規文書作成支援部12は、入力欄の選択が終了したか否かを、利用者が入力する選択終了を指示する情報を受付けたか否かに基づき判定する。
ステップS48での判定の結果、修正すべき入力欄または空欄の入力欄の選択が終了していない場合には(ステップS48でNo)、新規文書作成支援部12は、ステップS44に戻って、ステップS44以下の処理を繰り返して実行する。一方、修正すべき入力欄または空欄の入力欄の選択が終了した場合には(ステップS48でYes)、新規文書作成支援部12は、ステップS31で追加した列のメタデータ値(各行の欄のデータ)を用いて作成した文書を表示装置41に表示する(ステップS49)。そして、以上により、新規文書作成支援部12の処理を終了する。
図7は、選択文書修正支援部13により実行される処理フローの例を示した図である。選択文書修正支援部13は、利用者が既に作成された文書を選択し、その選択した文書の一部を修正して、その文書の版をリビジョンアップするのを支援する。
図7に示すように、選択文書修正支援部13は、まず、メタデータテーブル221に新たな空白の列を1列追加する(ステップS51)。次に、選択文書修正支援部13は、メタデータテーブル221に含まれる修正対象(リビジョンアップ対象)の文書に対応する列を選択する(ステップS52)。なお、この選択は、利用者が入力装置42を介して入力する列の選択情報に基づき行われる。このとき、同じ文書IDの同じ文書名で複数の版(Rev番号)がある場合には、最新の版の文書が選択されるものとする。
次に、選択文書修正支援部13は、前記選択した列のメタデータ値をステップS51で追加した列にコピーするとともに(ステップS53)、その追加した列のRev番号に対応するメタデータ値を+1加算したものとする(ステップS54)。次に、選択文書修正支援部13は、選択文書修正支援部13は、前記追加した列のメタデータ値を用いて文書を表示装置41に表示する(ステップS55)。
このとき表示される文書は、ステップS52で選択された修正対象の文書であり、利用者は、このとき表示された文書をもとに、その文書の一部を修正する。そこで、選択文書修正支援部13は、ステップS56以下の処理で、この利用者による文書の修正作業を支援する。なお、ステップS56以降の処理は、次に示すように、図6のステップS44の以降の処理とほぼ同様の処理である。
選択文書修正支援部13は、表示装置41に表示された文書(例えば、図2参照)において、修正すべきメタデータ値が記載された入力欄の1つを選択し、その入力欄の欄番号を取得する(ステップS56)。なお、ここでいう欄番号は、テンプレート文書51の各入力欄に付された番号をいう。このとき、利用者は、入力装置42を介して選択する入力欄を指定するので、選択文書修正支援部13は、その指定された入力欄の欄番号を選択する。
次に、選択文書修正支援部13は、テンプレートテーブル211を参照して、前記取得した欄番号が項目値として登録された項目名を取得する(ステップS57)。そして、表示装置41に表示された文書の入力欄を介して、利用者により入力される情報を取得する(ステップS58)。さらに、選択文書修正支援部13は、ステップS51でメタデータテーブル221に追加した列の、ステップS57で取得した項目名と同じ項目名を有する行の欄に、ステップS58で取得した入力情報を登録する(ステップS59)。
次に、選択文書修正支援部13は、ステップS55で表示された文書において、修正すべきメタデータ値が記載された入力欄の選択が終了したか否かを判定する(ステップS60)。なお、このとき、選択文書修正支援部13は、入力欄の選択が終了したか否かを、利用者が入力する選択終了を指示する情報を受付けたか否かに基づき判定する。
ステップS60での判定の結果、修正すべきメタデータ値が記載された入力欄の選択が終了していない場合には(ステップS60でNo)、選択文書修正支援部13は、ステップS56に戻って、ステップS56以下の処理を繰り返して実行する。一方、メタデータ値が記載された入力欄の選択が終了した場合には(ステップS60でYes)、修正メタデータ一覧を作成し(ステップS61)、図7に示した選択文書修正支援部13の処理を終了する。
ここで、修正メタデータ一覧とは、ステップS60までの処理により修正されたメタデータ値(ただし、書誌情報の項目名に対応するメタデータ値を除く)とそのメタデータ値に対応する項目名とからなる1組以上の組のデータのことをいう。なお、以下、本明細書では、修正メタデータ一覧におけるメタデータ値を修正メタデータ値といい、その修正メタデータ値に対応する項目名を修正項目名という。
図8は、要修正文書抽出部14により実行される処理フローの例を示した図である。要修正文書抽出部14は、ある文書の版をリビジョンアップする修正が選択文書修正支援部13により行われたとき、その修正に併せて修正すべき他の文書を抽出する処理である。従って、この要修正文書抽出部14には、その処理の開始に当たって、選択文書修正支援部13で修正された文書の文書IDと、選択文書修正支援部13で作成された修正メタデータ一覧が供給される。
図8に示すように、要修正文書抽出部14は、まず、選択文書修正支援部13で作成された修正メタデータ一覧を取得する(ステップS71)。
次に、要修正文書抽出部14は、修正メタデータ一覧から修正メタデータ値と修正項目名とからなる組のデータを1組選択し(ステップS72)、さらに、その選択した組のデータの修正項目名が治験情報のグループに属するか否かを判定する(ステップS73)。
ここで、メタデータテーブル221における項目名は、図4に示したように、書誌情報を別として、治験情報、依頼元情報、実施機関情報のいずれかのグループに分類されるものとする。なお、項目名の分類数は、前記したように、この3つに限定されるわけではないが、ここでは、処理フローの説明を簡単化するために、項目名の分類数は、3つであるとする。
ステップS73での判定の結果、前記選択した組のデータの修正項目名が治験情報のグループに属する場合には(ステップS73でYes)、要修正文書抽出部14は、選択文書修正支援部13で修正した文書のメタデータ値から研究テーマ名を取得する(ステップS74)。さらに、要修正文書抽出部14は、メタデータテーブル221の中から、前記取得した研究テーマ名と同じ研究テーマ名を有する列の列データを抽出する(ステップS75)。これは、選択文書修正支援部13で、例えば、研究目的が変更された場合には、研究データが同じ他の文書についても、研究目的の記載欄があれば、その文書を抽出し、その研究目的を併せて同様に修正しようとするものである。
また、ステップS73での判定の結果、前記修正項目名が治験情報のグループに属さない場合には(ステップS73でNo)、前記項目名が依頼元情報のグループに属するか否かを判定する(ステップS76)。その判定の結果、前記修正項目名が依頼元情報のグループに属する場合には(ステップS76でYes)、要修正文書抽出部14は、選択文書修正支援部13で修正した文書のメタデータ値から依頼元機関名を取得する(ステップS77)。さらに、要修正文書抽出部14は、メタデータテーブル221を参照して、前記取得した依頼元機関名と同じ依頼元機関名を有する列の列データを抽出する(ステップS78)。
また、ステップS76での判定の結果、前記修正項目名が依頼元情報のグループに属しない場合には(ステップS76でNo)、要修正文書抽出部14は、選択文書修正支援部13で修正した文書のメタデータ値から実施機関名を取得する(ステップS79)。さらに、要修正文書抽出部14は、メタデータテーブル221を参照して、前記取得した実施機関名と同じ実施機関名を有する列の列データを抽出する(ステップS80)。
次に、要修正文書抽出部14は、ステップS75、S78またはS80で抽出した各列データの前記修正項目名に対応するメタデータ値を、前記選択した組のデータの修正メタデータ値と比較し、一致しない場合、その列データを取得する(ステップS81)。
次に、さらに、要修正文書抽出部14は、修正メタデータ一覧の全ての組のデータを選択したか否かを判定する(ステップS82)。その判定の結果、全ての組のデータを選択していなかった場合には(ステップS82でNo)、要修正文書抽出部14は、ステップS72に戻って、ステップS72以下の処理を繰り返し実行する。一方、全ての組のデータを選択していた場合には(ステップS82でYes)、要修正文書抽出部14は、ステップS81で取得した列データに含まれる文書IDの一覧を、要修正文書として表示装置41に表示する(ステップS83)。
なお、ステップS81で、文書名および研究テーマ名が同じでRev番号が異なる複数の文書の列データが取得された場合には、その中からさらに最新の版(Rev番号)を有する文書の列データのみを取得するものとする。
以上により、利用者がある文書を選択して修正した後に、併せて修正すべき文書、すなわち、要修正文書が抽出されたことになる。なお、ステップS83で文書IDの一覧表示する際には、その文書IDとともに、その文書の文書名や研究テーマ名なども併せて表示してもよい。
図9は、要修正文書修正支援部15により実行される処理フローの例を示した図である。要修正文書修正支援部15は、要修正文書抽出部14により抽出された要修正文書対する修正を支援する。なお、この処理では、要修正文書を自動的に修正できる項目については、自動的に修正し、その後、利用者が必要に応じて修正する項目については、その修正を支援する。
図9に示すように、要修正文書修正支援部15は、まず、要修正文書の列のデータを用いて作成される要修正文書を表示装置41に表示する(ステップS91)。次に、要修正文書修正支援部15は、当該要修正文書の修正が実際に必要か否かを判定する(ステップS92)。ただし、その判定は利用者が行い、要修正文書修正支援部15は、利用者が入力装置42を介して入力する情報に従って、修正が必要か否かを判定する。
ステップS92で当該要修正文書の修正が必要でないと判定された場合には(ステップS92でNo)、要修正文書修正支援部15は、その処理を終了する。また、当該要修正文書の修正が必要であると判定された場合には(ステップS92でYes)、要修正文書修正支援部15は、選択文書修正支援部13で作成された修正メタデータ一覧を取得する(ステップS93)。
次に、要修正文書修正支援部15は、メタデータテーブル221に当該要修正文書の列のデータをコピーした列を追加する(ステップS94)。そして、その追加した列のRev番号に対応するメタデータ値を+1加算したものとする(ステップS95)。
次に、要修正文書修正支援部15は、ステップS94で追加した列の、修正メタデータ一覧の修正項目名に対応するメタデータ値を、修正メタデータ一覧の修正メタデータ値で置換する(ステップS96)。このとき、要修正文書修正支援部15は、表示装置41に表示している要修正文書では、その置換した後のメタデータ値を、太字表示や赤字表示などにより、強調して表示する(ステップS97)。なお、このステップS96およびステップS97の処理は、修正メタデータ一覧に修正メタデータ値と修正項目名との組が複数組含まれている場合には、その複数組の数と同じ回数、繰り返し実行される。
以上、ステップS97までの処理により、自動で修正可能なメタデータ値は修正されたことになる。しかながら、この時点での修正文書には、余計な修正がされていることや、修正すべきメタデータが修正されていないことがあり得る。利用者は、このときの表示装置41に表示されている文書を見て、さらに利用者による修正が必要であるか否かを判断する。
そこで、要修正文書修正支援部15は、利用者が入力装置42を介して入力する判断結果の情報に基づき、さらに修正すべきメタデータ値があるか否かを判定する(ステップS98)。その判定で、さらに修正すべきメタデータ値はないと判定された場合には(ステップS98でNo)、要修正文書修正支援部15は、その処理を終了する。
一方、ステップS98で、さらに修正すべきメタデータ値があると判定された場合には(ステップS98でYes)、要修正文書修正支援部15は、表示装置41に表示された文書の入力欄の1つを選択し、その入力欄の欄番号を取得する(ステップS99)。なお、このとき、利用者は、入力装置42を介して選択する入力欄を指定するので、要修正文書修正支援部15は、その指定された入力欄の欄番号を選択する。
次に、要修正文書修正支援部15は、テンプレートテーブル211を参照して、前記取得した欄番号が項目値として登録された項目名を取得する(ステップS100)。そして、表示装置41に表示された文書の入力欄を介して、利用者により入力される情報を取得する(ステップS101)。さらに、要修正文書修正支援部15は、ステップS94で追加した列のステップS100で取得した項目名に対応する行のメタデータ値を、ステップS101で入力された情報を置換する(ステップS102)。
次に、要修正文書修正支援部15は、表示装置41に表示された文書において、修正すべき入力欄の選択が終了したか否かを判定する(ステップS103)。なお、このとき、要修正文書修正支援部15は、入力欄の選択が終了したか否かを、利用者が入力する選択終了を指示する情報を受付けたか否かに基づき判定する。
ステップS103での判定の結果、修正すべき入力欄の選択が終了していない場合には(ステップS103でNo)、要修正文書修正支援部15は、ステップS99に戻って、ステップS99以下の処理を繰り返して実行する。一方、修正すべき入力欄選択が終了した場合には(ステップS103でYes)、要修正文書修正支援部15は、ステップS94で追加した列のメタデータ値を用いて作成した文書を表示装置41に表示する(ステップS104)。以上により、要修正文書修正支援部15の処理を終了する。
以上に説明したテンプレート&文書メタデータ登録部11、新規文書作成支援部12、選択文書修正支援部13、要修正文書抽出部14および要修正文書修正支援部15により、本実施形態に係る文書作成支援装置1の基本的な機能が実現される。そのため、選択文書修正支援部13により利用者により選択された文書の修正が行われたときには、その修正内容と同様の修正をする必要があると判断される要修正文書が要修正文書抽出部14によってほぼ自動的に抽出される。そして、要修正文書抽出部14によって抽出された要修正文書については、要修正文書修正支援部15の前半部の処理(ステップS98までの処理)により選択文書修正支援部13で修正された内容と同様の修正がほぼ自動的に行われる。ここで、自動的とは、利用者による作業を伴わないことを意味するが、図9の処理の後半部の処理(ステップS99以降の処理)のように、最終的な修正を行うには、通常、利用者の入力操作が必要とされる。
ともかくも、多種多様かつ類似した文書が用いられる臨床研究などでは、ある文書を修正したとき、その修正と同様の修正をすることが可能な文書をほぼ自動的に抽出することが可能になるだけでも、文書作成・修正業務の工数低減を図ることができる。さらに、本実施形態では、その抽出された文書をほぼ自動的に修正することも可能であるので、さらなる文書作成・修正業務の工数低減を期待することができる。
<拡張機能についての説明>
以下に説明する文書間修正頻度計数部16、文書間修正相関関係値算出部17および第2の要修正文書抽出部18の機能は、本実施形態に係る文書作成支援装置1の拡張機能ともいうべき機能である。
文書間修正頻度計数部16は、1の文書が選択文書修正支援部13により修正される頻度を計数するとともに、その1の文書の修正に伴って、前記1の文書と異なる文書それぞれが要修正文書修正支援部15により修正される頻度を計数する。そして、次の図10に示すような文書間修正頻度テーブル231を作成する。
図10は、文書間修正頻度記憶部23に記憶される文書間修正頻度テーブル231の構成の例を示した図である。ここで、文書間修正頻度テーブル231の各行の項目名は、選択文書修正支援部13で修正された文書名を表し、各列の項目名は、要修正文書修正支援部15で修正された文書名を表している。
ここで、文書間修正頻度テーブル231の第i行、第j列(i≠j)のデータNijは、文書iが選択文書修正支援部13により修正される頻度Niiに対する、文書jが要修正文書修正支援部15により修正される頻度を表している。
すなわち、図10では、例えば、文書2が選択文書修正支援部13により10回修正され、その文書2の10回の修正に伴い、文書3が要修正文書修正支援部15により7回修正された場合には、N22=10,N23=7と表される。
文書間修正相関関係値算出部17は、文書間修正頻度計数部16で作成された文書間修正頻度テーブル231に基づき、次に図11に示すような文書間修正相関関係値テーブル241を作成する。
図11は、文書間修正相関関係値記憶部24に記憶される文書間修正相関関係値テーブル241の構成の例を示した図である。ここで、各行の項目名は、図10と同様に、選択文書修正支援部13で修正された文書名を表し、各列の項目名は、要修正文書修正支援部15で修正された文書名を表している。
文書間修正相関関係値算出部17は、文書間修正相関関係値テーブル241の第i行、第j列の文書間修正相関関係値Pij(i≠j)を、次の式により計算する。
Pij=Nij/Nii (i≠j)
この文書間修正相関関係値Pijは、文書iが修正される頻度に対する、文書iの修正に伴い文書jが修正される頻度の比を表している。従って、多数の文書について文書間修正相関関係値Pijが取得された場合には、この文書間修正相関関係値Pijは、文書iが修正されたとき、文書iの修正に伴い文書jが修正される確率ということもできる。
つまり、文書間修正相関関係値算出部17は、文書間修正相関関係値Pijを算出することにより、文書iが修正されたとき、文書iの修正に伴い文書jが修正される確率を、例えば75%などと具体的な数値で得ることができる。このことは、文書間修正相関関係値Pijを用いることにより、要修正文書を抽出することが可能になることを意味する。
そこで、第2の要修正文書抽出部18は、選択文書修正支援部13で文書iの修正がされたとき、文書間修正相関関係値テーブル241を参照して、文書間修正相関関係値Pijが所定の閾値(例えば、5%)よりも大きい文書jを要修正文書として抽出する。このような文書抽出の仕方には、抽出漏れが生じる恐れもあるが、多数のデータに基づき、文書間修正相関関係値テーブル241が作成されている場合には、抽出漏れの恐れは無視できるほど小さくすることができる。これは、多数の実績データの取得による学習効果ということができる。
以上のような第2の要修正文書抽出部18の処理は、図8に示した要修正文書抽出部14の処理に比べれば極めて簡単な処理である。従って、この第2の要修正文書抽出部18は、文書作成支援装置1の処理負荷を軽減する効果を奏する。
<実施形態の変形例>
次に、文書間修正頻度計数部16および文書間修正相関関係値算出部17の変形例について説明する。ここまでに説明した実施形態では、文書間修正頻度計数部16は、文書iの修正される頻度Niiを計数するとともに、さらに、文書iの修正に伴う文書jの修正の頻度Nijを計数する。それに対し、この変形例では、文書間修正頻度計数部16は、文書iの項目名kのメタデータ値が修正される頻度Nikを計数するとともに、文書iの項目名kのメタデータ値の修正に伴い文書jが修正される頻度Nikjを計数する。そして、図12に示すような文書間修正頻度テーブル232を作成する。
図12は、実施形態の変形例に係る文書間修正頻度テーブル232の構成の例を示した図である。ここで、文書間修正頻度テーブル232の各行の項目名は、選択文書修正支援部13で修正された文書ごとにそのそれぞれに含まれるメタデータテーブル221の項目名を表す。また、各列の項目名は、要修正文書修正支援部15で修正された文書名を表す。また、文書間修正頻度テーブル231の文書iの項目名kの行の、第j列(i≠j)のデータNikjは、文書iにおける項目名kのメタデータ値が選択文書修正支援部13により修正される頻度Nikに対する、文書jが要修正文書修正支援部15により修正される頻度を表している。
本変形例では、文書間修正頻度計数部16は、例えば、i番目の文書である「治験実施計画書」において、k番目の項目名である「治験薬名」を修正したとき、その頻度Nikを計数する。さらに、そのときには、そのi番目の文書の「治験薬名」の修正に伴いj番目の文書が修正される頻度Nikjを計数する。
図13は、実施形態の変形例に係る文書間修正相関関係値テーブル242の構成の例を示した図である。ここで、文書間修正相関関係値テーブル242の各行の項目名は、選択文書修正支援部13で修正された文書ごとにそのそれぞれに含まれるメタデータテーブル221の項目名を表す。また、各列の項目名は、要修正文書修正支援部15で修正された文書名を表す。
文書間修正相関関係値算出部17は、文書間修正相関関係値テーブル242の文書iの項目名kの行のデータを、文書間修正相関関係値Pikj(i≠j)として、次の式により計算する。
Pikj=Nikj/Nik (i≠j)
この文書間修正相関関係値Pikjは、文書iの項目名kのメタデータ値が修正される頻度に対する、文書iの項目名kのメタデータ値に伴い、文書jが修正される頻度の比を表している。従って、多数の文書について文書間修正相関関係値Pikjが取得された場合には、この文書間修正相関関係値Pikjは、文書iの項目名kのメタデータ値が修正されたとき、その修正に伴い文書jが修正される確率ということもできる。
そこで、第2の要修正文書抽出部18は、選択文書修正支援部13で文書iの項目名kのメタデータ値が修正されたときには、文書間修正相関関係値テーブル242を参照して、文書間修正相関関係値Pikjが所定の閾値(例えば、5%)よりも大きい文書jを要修正文書として抽出する。前記したように、このような文書抽出の仕方には、抽出漏れが生じる恐れもあるが、多数のデータに基づき、文書間修正相関関係値テーブル242が作成されている場合には、抽出漏れの恐れは無視できるほど小さくすることができる。
また、本変形例では、文書間修正相関関係値テーブル242は、修正された文書および修正されたメタデータ値の項目名ごとに、文書間修正相関関係値が算出されるので、要修正文書をより精度よく抽出することができる。