JP2015162004A - 開発ドキュメント間トレースリンク生成支援装置及び方法及びプログラム - Google Patents

開発ドキュメント間トレースリンク生成支援装置及び方法及びプログラム Download PDF

Info

Publication number
JP2015162004A
JP2015162004A JP2014035621A JP2014035621A JP2015162004A JP 2015162004 A JP2015162004 A JP 2015162004A JP 2014035621 A JP2014035621 A JP 2014035621A JP 2014035621 A JP2014035621 A JP 2014035621A JP 2015162004 A JP2015162004 A JP 2015162004A
Authority
JP
Japan
Prior art keywords
keyword
node
document
link
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014035621A
Other languages
English (en)
Inventor
角田 誠
Makoto Tsunoda
誠 角田
源吾 鈴木
Gengo Suzuki
源吾 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014035621A priority Critical patent/JP2015162004A/ja
Publication of JP2015162004A publication Critical patent/JP2015162004A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 ユーザ自身の知識にない検索キーワードを発見することを可能とし、また、被検索対象の粒度(ファイル単位、章単位、節単位、項単位など)に予め一つに決めることなく検索する。【解決手段】 本発明は、記憶装置に保存されている文書群に含まれる文書情報から、トレースリンクを作成する単位である文書単位(以下、「ノード」と記す)を識別し、該ノードの階層の木構造である文書木を構築する文書木構築手段と、ユーザが検索したい複数のキーワードを受け付けるキーワード入力手段と、検索されたリンク先候補を表示するリンク先候補検索結果表示手段と、キーワード入力手段で指定された複数のキーワードであるキーワード列から、文書木の階層構造に基づいて、該キーワード列に合致したリンク先候補を検索し、リンク先候補検索結果表示手段に通知するリンク先候補検索手段を有する。【選択図】 図1

Description

本発明は、開発ドキュメント間トレースリンク生成支援装置及び方法及びプログラムに係り、特に、トレースリンクを作成する対象である複数の開発ドキュメントからなる文書群が記憶装置に保存されている状況において、開発ドキュメント間の追跡可能性を確保するために用いられるトレースリンク生成時のリンク先の発見を支援するための開発ドキュメント間トレースリンク生成支援装置及び方法及びプログラムに関する。
ソフトウェア開発において、要求から要求に対応する設計、実装、試験項目が追跡可能であることは、要求に対する設計、実装、試験の過不足の確認や、設計や実装の変更による影響範囲を確認する作業を容易にするなど、ソフトウェアの品質を保証する上で重要である。ソフトウェア開発作業の一部に、トレーサビリティ管理ツールを使うなどの方法による追跡可能性確保作業を組み込むことで、追跡可能な状態を保つことは可能である。
しかし、既にある、追跡可能性が確保されていないソフトウェアに対する改造や更改の際に、追跡可能性を確保しようとすると、大量の文書群の中から、目的の要求や設計に関連する箇所を見つけ出すトレースリンク生成作業が必要で、この作業を効率化する技術が求められる。
ここで、トレースリンクとは、開発ドキュメントに記述されている要求とその要求を実現するための設計や外部設計とその設計を詳細化した内部設計など、直接関係のある二つの項目間を結び付けたリンクのことをいう。
トレースリンクが結ぶそれぞれの項目は、同じ開発工程のドキュメント内にあってもよいし、それぞれが異なる開発工程のドキュメントの中にあってもよい。
大規模システムの開発及び運用においては、既存システムの改造や更改が多く発生する。例えば、ある機能を改造する場合、その機能がどのような仕様や設計に基づいているかを知る必要があることに加え、その改造が他の機能に与える影響を、予め予測しておくことが必要である。また、運用中のシステムに不具合が発生したときには、不具合箇所を特定し、修正するだけでなく、その修正が他に悪影響を及ぼさないことを確認することが重要である。
当該システムに関する仕様や設計を正確に把握している人材がいれば、このような予測や確認は容易に可能であるかもしれないが、このような人材がいることは稀である上に、ノウハウが局所化することによるリスクも大きい。
トレースリンクが整備され、追跡可能性が確保されると、ソフトウェアの品質を保証する上で重要な要求に対する設計や実装、試験の過不足の確認や、設計や実装の変更による影響範囲を確認する作業を容易にすると共に、ソフトウェアシステムの改造更改時の影響分析や、運用中のシステムにおける不具合対応を、トレースリンクが整備されていないときに比べて、円滑に実施することが可能になる。
多くのシステムでは、そのシステムの重要事項を要件定義書や設計書に(機能や処理などの記載項目の種類によって様々な箇所に)一覧表として記載しているため、これらの表を分析することで、そのシステムを構成する事項やそれらの関連を推定することができ、これらの情報を用いることで、効果的なトレースリンクの生成支援が期待できる。
そのための技術として、近接演算子を用いて単語の並びの再現率を求める方法や、構造を考慮したドキュメント検索により、文書の階層を考慮する技術がある(例えば、特許文献1参照)。
また、ユーザに少なくとも1つのキーワードを入力させ、そのキーワードに関連するグラフを表示する方法(例えば、非特許文献1参照)や、事前にシソーラスを構築して、その分類階層等を利用して検索させる方法がある。
特許3598742号公報
国会図書館検索リサーチナビ(WikiPedia WikiLinks) http://rnavi.ndl.go.jp/rnavi/
しかしながら、近接演算子を利用することにより、AND指定に対しても再現率を上げることはできるが、単語の並びとして近くとも、構造上遠い場合(例えば、隣の章にまたがる)も候補となってしまい、適合率が十分に上がらない。また、構造を考慮した特許文献1の技術は、上位ノードの見出しのみの情報を利用しているために、十分な再現率を得ることができない、という問題がある。
また、一般的なインターネット検索において、ユーザが開発文書を検索したいときに、適切なキーワードを思いつかない場合が多いため、事前にそのキーワードを抽出して、全てのキーワードをビジュアルに提示する方法があるが、その表示量が膨大になる。そのため、ユーザに1つでもよいからキーワードを入力させ、そのキーワードに関連するグラフを表示する非特許文献2の技術では、全くキーワードを入力できない場合には実行できない。また、事前にシソーラスを構築して、その分類階層等を利用して検索させる方法は、各ユーザに適したシソーラス構築は現実的ではない。
上記からトレースリンクを利用することが望ましいが、トレースリンクを生成するためには、リンク元(要求項目や設計項目などトレースリンクを生成する起点となる箇所)に対応するリンク先(要求項目に対応する設計項目や設計項目をより詳細化した設計項目など)を見つける必要がある。(本発明では、開発工程の上下を区別する必要はなく、トレース元とトレース先は同じドキュメント群にあってもよいし、別々のドキュメント群にあってもよい。)
リンク元からリンク先を見つける作業を大別すると、以下の2種類に分けられる。
一つは、類似文検索技術を応用し、リンク先が含まれるであろう文書群の中から、リンク元に類似する箇所を見つけ出した上で、類似度の高い箇所から関連箇所であるか否かを確認する方法で、もう一つは、ユーザが指定したキーワードで全文検索し、返ってきた結果が関連箇所であるか否かを確認する方法である。
しかしながら、類似文検索技術を応用する方法では、関連箇所であるか否かを確認する際の類似度の基準を一般化することは難しい上に、必ずしも関連箇所の記載内容が類似しているとは限らない。また、文の類似を比較する必要性から、被検索対象の粒度(ファイル単位、章単位、節単位、項単位など)を予め決める必要があるが、関連箇所の粒度が一定である保証はない。
全文検索を利用する方法では、指定したキーワードでリポジトリ内にあるファイルを検索した上で、結果として得られたそれぞれのファイル個別にキーワード検索を行い、該当箇所を確認するといった複雑な作業が必要である。
その上、検索キーワードを指定するためには当該システムに関する知識が必要で、知識がないと検索キーワードを指定することもできないことがある。例えば、ある機能の構成要素(例えば、ある画面)に関する要件に対応する設計を探したいとき、必ずしも要件に目的の構成要素名が記載されているとは限らない。
また、システム開発の過程で、仕様や設計に関する文書を生成していれば、それらの文書群を理解することによって、当該システムに関する仕様や設計の把握を行える。しかし、大きなシステムほどその仕様や設計を記載した文書群は膨大になるため、全体の把握には多くの時間を要するだけでなく、ある特定の機能に関連する事項を把握する場合においても、どの文書の何処を参照すればよいのかは容易にはわからない。計算機を利用した従来の方法では、自然言語処理技術を用い、文章に記述された文章の主述関係を理解することで物事の関係性を明らかにしようとしてきたが、物事の関連や図や表などで示されることが多く、十分な効果が得られていない。
本発明は上記の点に鑑みなされたもので、ユーザがツリーノードやグラフノードをブラウズすることで、ユーザ自身の知識にない検索キーワードを発見することを可能とし、また、被検索対象の粒度(ファイル単位、章単位、節単位、項単位など)に予め一つに決めることなく検索することが可能な開発ドキュメント間トレースリンク作成支援装置及び方法及びプログラムを提供することを目的とする。
一態様によれば、トレースリンクを作成する対象である複数の開発ドキュメントからなる文書群が記憶装置に保存されている状況において、トレースリンク生成時のリンク先の発見を支援するための開発ドキュメント間トレースリンク作成支援装置であって、
ユーザインタフェース手段、文書群解析手段、問い合わせ実行手段を有し、
前記文書群解析手段は、
前記記憶装置に保存されている前記文書群に含まれる文書情報から、前記トレースリンクを作成する単位である文書単位(以下、「ノード」と記す)を識別し、該ノードの階層の木構造である文書木を構築する文書木構築手段を有し、
前記ユーザインタフェース手段は、
ユーザが検索したい複数のキーワードを受け付けるキーワード入力手段と、
検索されたリンク先候補を表示するリンク先候補検索結果表示手段と、
を有し、
前記問い合わせ実行手段は、
前記キーワード入力手段で指定された複数のキーワードであるキーワード列から、前記文書木の階層構造に基づいて、該キーワード列に合致したリンク先候補を検索し、前記リンク先候補検索結果表示手段に通知するリンク先候補検索手段を有する開発ドキュメント間トレースリンク作成支援装置が提供される。
一態様によれば、階層関係のあるドキュメントに対し、複数のキーワードを指定して、対応関係のあるノード(例えば、章や節)を発見したい場合において、適合率を低下させずに、再現率を向上させることが可能となる。また、ユーザがキーワードを選択する際に、候補となるキーワードを提示することが可能となり、ユーザは単にツリーノードやグラフノードをブラウズすることで、ユーザ自身の知識にない検索キーワードを発見することができる。
さらに、文書中に分散して記載されている表を分析することで、システムに関連する物事の関連を、計算機が理解可能な形で得ることができる。
本発明の第1の実施の形態における開発ドキュメント間トレースリンク作成支援装置の構成例。 本発明の第1の実施の形態における基本動作のフローチャート。 本発明の第1の実施の形態におけるリンク先候補検索部の適合判断のフローチャート。 本発明の第1の実施の形態におけるリンク先候補表示例。 本発明の第2の実施の形態におけるリンク元ノードに関連する検索キーワード列の表示・選択によるキーワード列へのキーワード追加・削除処理のフローチャート。 本発明の第3の実施の形態における開発ドキュメント間トレースリンク作成支援装置の構成例。 本発明の第3の実施の形態におけるキーワード間関係グラフからキーワードグラフを構築する際のフローチャート。 本発明の第4の実施の形態における開発ドキュメント間トレースリンク作成支援装置の構成例。 本発明の第4の実施の形態におけるキーワード分類ノードをノードとする有向グラフの構成例。 本発明の第4の実施の形態におけるキーワード分類グラフ表示のフローチャート。 本発明の第4の実施の形態におけるキーワード分類ノードの再構成の例。 本発明の第4の実施の形態におけるキーワード間関係グラフを表から自動的に生成するためのキーワード間関係グラフ構築部の構成図。 本発明の第4の実施の形態におけるグラフ構築のフローチャート。 本発明の第4の実施の形態における文書群から抽出された表の1行目が見出しである一覧表の例。 本発明の第4の実施の形態における文書群から抽出された表の見出しが複数の行にまたがる一覧表の例。 本発明の第4の実施の形態における一覧表でない表の例。 本発明の第4の実施の形態における一覧表判定部のフローチャート。 本発明の第4の実施の形態における複数の列にまたがる見出しの例。 本発明の第4の実施の形態における見出しと値のリンクの例。 本発明の第4の実施の形態における主従関係の判定基準の例。 本発明の第4の実施の形態における見出しの主従関係に基づく値のリンクの例。 本発明の一実施例における文書群の例。 本発明の一実施例における文書の木構造の例。 本発明の一実施の形態における表示例。 本発明の一実施例における検索の実行例。 本発明の一実施例における文書群に含まれる表の例。 本発明の一実施例における表からのグラフの構成例(1)。 本発明の一実施例における表からのグラフの構成例(2)。 本発明の一実施例における表からのグラフの構成例(3)。 本発明の一実施例におけるグラフ構成部によるグラフの合成例。
以下、図面と共に本発明の実施の形態を説明する。
[第1の実施の形態]
図1は、本発明の第1の実施の形態における開発ドキュメント間トレースリンク作成支援装の構成例を示す。
同図に示す装置100Aは、キーワード入力部10、リンク先候補検索結果表示部11、リンク元指定部12を有するユーザインタフェース部1と、リンク先候補検索部21、検索キーワード候補検索部22を有する問い合わせ実行部2と、文書木31、文書群32、キーワード表33を格納する記憶装置3と、文書木構築部41、キーワード抽出部42を有する文書群解析部4とを有する。記憶装置3の文書木31は、フォルダ階層、ファイル、章節構造またはシートやスライドを木構造で表現したもので、文書群解析部4の予め文書木構築部41で構築される。
本実施の形態では、上記の構成における入出力装置0からの入力により、メモリ(図示せず)内に格納される検索キーワード列の追加及び検索キーワード列からのキーワードの削除の処理について述べる。
図2は、本発明の第1の実施の形態における処理のフローチャートである。
ステップ110)キーワード入力部101は、0以上のキーワードを入力させる。
ステップ120)入力されたキーワードをキーワード列に追加し、キーワード列を問い合わせ実行部2のリンク先候補検索部21に送信する。
ステップ130)問い合わせ実行部2のリンク先候補検索部21は、キーワード入力部10から取得したキーワード列と記憶装置3の文書木31を照合し、合致するノードをリンク先候補としてリンク先候補検索結果表示部11に出力する。
キーワード列の長さが0のとき、つまり、キーワード列が入力されなかった場合は、文書木31の全てのノードが適合すると判断してもよいし、全てのノードが適合しないと判断してもよい。
以下に、当該リンク先候補検索部21の処理を説明する。
<リンク先候補の適合判断処理>
リンク先候補検索部21における適合の判断の手順を図3に示す。
リンク先候補検索部21は、文書木31からノードを一つ取得し(ステップ510)、全てのキーワードを含むノードは適合すると判断し(ステップ520,Yes)、ノードを検索結果リストに格納し(ステップ560)、ステップ570に移行する。
ノードが全てのキーワードを含まないと判断した場合(ステップ520,No)は、1つ以上のキーワードを含むノードで(ステップ530,Yes)、そのノードの先祖ノードが残りのキーワードを全て含んでいるとき(ステップ540,Yes)、そのノードは適合すると判断し(複数の先祖ノードに分散して含まれていてもよい)、ノードを検索結果リストに格納する(ステップ560)。
全てのキーワードのうち、ノードAの先祖ノードに含まれないキーワードが、ノードAの複数の子ノード以下の部分木に分散して含まれる時(ステップ550,Yes)、ノードは適合すると判断し、ノードを検索結果リストに格納する(ステップ560)。全てのノードの探索が終わったら(ステップ570,Yes)、検索結果リストを返信する(ステップ580)。なお、検索結果リストは図示しないが、問い合わせ実行部2内のメモリに格納されているものとする。
ここで、「ノードがあるキーワードを含む」とは、そのノードのラベルまたは内容を表す文字列に、そのキーワードが包含されていることを指し、「部分木があるキーワードを含む」とは、その部分木に含まれる全ノードのうちいずれかがそのキーワードを含んでいることを指す。
ステップ140)リンク先候補検索結果表示部11は、リンク先候補検索部21から返却されたリンク先候補を取得し、入出力装置0にツリー状に表示する(例えば、図4)。ツリー表示における各ノードのラベルは、ディレクトリ名、ファイル名、章節タイトル、シート名、スライド名など、ユーザが認識可能な文字列とする。
例えば、ツリーの各ノードが検索結果として適合していれば濃い色で、適合していなければ薄い色でラベルを表示する。適合しないノードで、適合するノードが子ノードにないノードは表示しなくてもよい。
ステップ150) ユーザから削除する検索キーワードが入力された場合は、検索キーワード列から削除し、上記のステップ130,140の処理に移行する。
[第2の実施の形態]
本実施の形態では、前述の第1の実施の形態における図1の構成において、リンク元ノードに関連する検索キーワード列の表示・選択によるキーワード列へのキーワード追加・削除処理について説明する。
図5は、本発明の第2の実施の形態におけるリンク元ノードに関連する検索キーワード列の表示・選択によるキーワード列へのキーワード追加・削除処理のフローチャートである。
ユーザインタフェース部1のリンク元指定部12は、記憶装置3の文書木31から、リンク元が含まれる文書木情報を読み込み、ツリー状に表示し(ステップ210)、ユーザにノードを選択させる。ツリー表示における各ノードのラベルは、ディレクトリ名、ファイル名、章節タイトル、シート名、スライド名など、ユーザが識別可能な文字列とする。
ユーザはリンク元指定部12によって表示されたツリーからノードを選択する(ステップ220)。リンク元指定部12は、ユーザから入力されたリンク元指定情報を検索キーワード候補検索部22に出力する。検索キーワード候補検索部22は、記憶装置3のキーワード表33と文書群32のノードに対応する文書情報を照合し、キーワード列とノードを紐付け、キーワード入力部10に出力する(ステップ230)。なお、キーワード表33は、人が作成してもよいし、文書群を解析し、文書群解析部4のキーワードを抽出するキーワード抽出部42が作成してもよい。また、キーワード抽出部42によるキーワード抽出方法は問わない。
リンク元指定部12は、検索キーワード候補検索部22から取得したキーワード列を入出力装置0に表示する(ステップ240)。このとき、ノードに対応する本文の内容を併せて表示してもよい。
ユーザは表示されたキーワード列からキーワードを選択することができ(ステップ250)、選択されたキーワードが検索キーワード列に含まれない場合には(ステップ260,No)、ユーザが選択したキーワードはキーワード入力部10に送信され、検索キーワード列に追加される(ステップ120)。選択されたキーワードが検索キーワード列に含まれる場合には(ステップ260,Yes)、選択されたキーワードを検索キーワード列から削除する(ステップ270)。以降、前述のステップ130の処理に移行する。
なお、キーワード入力部10における検索結果のツリー表示もリンク元指定部12のツリー表示と同様に、ユーザがノードを選択したときに、そのノードに紐付けられたキーワード列やノードに対応する本文の内容を表示してもよい。
[第3の実施の形態]
本実施の形態では、上記の第1、第2の実施の形態の機能に加え、キーワード間関係グラフの構築、及び、キーワード間関係グラフのノード選択によるキーワード列の追加・削除処理について説明する。
図6は、本発明の第3の実施の形態における開発ドキュメント間トレースリンク作成支援装置の構成例を示す。
図6の開発ドキュメント間トレースリンク作成支援装置100Bは、図1のユーザインタフェース部1にキーワードグラフ表示部13を加え、記憶装置3に図1のキーワード表33に代えてキーワード間関係グラフ34が格納され、文書群解析部4に、図1のキーワード抽出部42に代えて、キーワード間関係グラフ構築部44が設けられている。
<キーワードグラフ構築処理>
ユーザインタフェース部1のキーワードグラフ表示部13に表示されるキーワードグラフは、記憶装置3のキーワード間関係グラフ34から読み出される。キーワード間関係グラフ34の構成方法については特に限定しないが、キーワード間関係グラフ構築部44により、検索対象及び被検索対象文書をコンピュータにより解析することで得てもよいし、知識を有する人が手動で構築してもよい。
ユーザインタフェース部1のキーワードグラフ表示部13が、キーワード間関係グラフ34からキーワードグラフを構築する処理について図7のフローチャートを用いて説明する。
キーワード間関係グラフ34は、キーワードまたはキーワード分類をノードとする有向グラフであり、主従関係にあるキーワード間をつなぐ有向のエッジと、キーワード分類とその分類に属するキーワードをつなぐエッジからなる。
以後、キーワードを示すノードを「キーワードノード」、キーワード分類を示すノードを「キーワード分類ノード」と記す。なお、キーワードは複数の分類に属していてもよい。
キーワードグラフ表示部13は、記憶装置3からキーワード間関係グラフ34を読み込み、キーワード間関係グラフからキーワード分類ノードとキーワード分類ノードに接続するエッジを除いたキーワードグラフを構築し(ステップ310)、表示する(ステップ320)。ユーザは表示されたキーワードグラフから検索キーワード選択し(ステップ330)、図5のステップ260の処理(選択されたキーワードが検索キーワード列に含まれるかの判断)に移行する。
また、請求項4の目的のためには、キーワード分類ノードはなくてもよい。
ユーザは、表示されたキーワードのグラフのノードを選択することでキーワードを選択することができる(ステップ330)。これ以降の処理は、図5のステップ260以降の処理と同様であるので、その説明を省略する。
[第4の実施の形態]
本実施の形態では、第1〜第3の実施の形態の機能に加えて、キーワード分類グラフの構築及び、キーワード分類グラフのノード選択によるキーワード列の追加・削除を行う機能について述べる。
図8は、本発明の第4の実施の形態における開発ドキュメント間トレースリンク作成支援装置の構成例を示す。
図8に示す開発ドキュメント間トレースリンク作成支援装置100Cは、図1のユーザインタフェース部1にキーワード分類グラフノード表示部14が追加され、図1の問い合わせ実行部2にキーワード分類グラフ再構成部23とキーワード分類グラフ構築部24が加えられている。記憶装置3と文書解析部4の構成は、第3の実施の形態における図6の構成と同様である。
図8に示す構成では、ユーザは、キーワード分類グラフノード表示部14によって表示されたグラフノード列からの選択によってキーワードを設定することができる。
以下に、キーワード分類グラフ構成部23の処理を説明する。
<キーワード分類グラフ構築処理>
キーワード分類グラフは、最大でキーワード分類の数だけノードを持つ有向グラフであり、初期状態では、全てのノードがキーワード分類ノードである。
キーワード分類グラフは、問い合わせ実行部2のキーワード分類グラフ再構成部23により、キーワード分類ノードからキーワードノードへ置き換えられる。
問い合わせ実行部2のキーワード分類グラフ構築部24は、記憶装置3のキーワード間関係グラフ34から、キーワード分類をノードとする有向グラフを構成し、キーワード分類グラフとする。
キーワード分類グラフの構成方法を以下に示す。
あるキーワード分類ノードと、そのキーワード分類ノードに接続されたキーワードノードから出て行くエッジの頭キーワードノードに接続されたキーワード分類ノードがあるとき、全てのキーワード分類ノードと、頭キーワードノードに接続されたキーワード分類ノードの組み合わせを抽出し、各組み合わせに含まれる2ノードの前者を「尾ノード」、後者を「頭ノード」とするエッジを組み合わせの分だけ得る。その例を図9に示す。
以上により、全てのキーワード分類ノードと上記のエッジからなるグラフを構成する。
キーワード分類ノードには、キーワードまたはキーワード分類をノードとする有向グラフでそのキーワード分類に接続するキーワードのリストを属性として付加する。
次に、上記で構築されたキーワード分類グラフをユーザインタフェース部1を介して入出力装置0に表示する動作を説明する。
図10に、キーワード分類グラフ表示のフローチャートを示す。
キーワード分類グラフ構築部24は、初期表示用のキーワード分類グラフを構築し、キーワード分類グラフノード表示部14に出力する(ステップ410)。キーワード分類グラフノード表示部14は、そのキーワード分類グラフを表示する(ステップ420)。または、キーワード分類グラフ再構成部23で再構成された分類グラフ(ステップ460)を表示する(ステップ420)。ユーザは表示されたキーワード分類グラフのいずれかのノードを選択することができる。ユーザが選択したノードがキーワードノードのときは(ステップ470)、図5のステップ260以降の処理と同様であるので、その説明を省略する。
ユーザが選択したノードがキーワード分類ノードのとき(ステップ430)、そのキーワード分類ノードが属性として持つキーワード列を表示し(ステップ440)、ユーザに選択させる(ステップ450)。キーワード分類ノードとユーザが選択したキーワードをもとにキーワード分類グラフ再構成部23がキーワード分類グラフを再構成する(ステップ460)。
キーワード分類グラフ再構成部23は、キーワード分類ノードとキーワードノードのペアの列と、キーワード間関係グラフを入力として、キーワード分類グラフを構成する。
再構成されるグラフは、図11に示すように、キーワード間関係グラフ34のキーワード分類ノードのうち、ペアの列に含まれるキーワード分類ノードから、キーワード分類ノードと組み合わされたキーワードノード以外のノードと接続するエッジを削除したグラフをもとに、キーワード分類グラフを構成した上で、ペア列に含まれるキーワード分類ノードを、キーワード分類ノードと組み合わされたキーワードノードに置き換えたものである。
このとき、置き換えたキーワードノードのいずれへのパスがないキーワード分類ノードとそのノードに接続するエッジは削除してもよい。
<キーワード間関係グラフ構築処理>
次に、キーワード間関係グラフを文書群32に含まれる表から自動的に生成する方法について述べる。このときのキーワード間関係グラフ構築部44内部の構成を図12に示し、グラフ構築の流れを図13に示す。
キーワード間関係グラフ構築部44は、表抽出部441、見出し行識別部442、一覧表判定部443、見出し主従関係判定部444、グラフ構成部445、グラフ合成部446を有する。
表抽出部441は文書群32から表を抽出し(ステップ610)、分析する。本発明で分析する対象は、先頭に見出し行があり、値行が続く図14に代表されるような表である。表抽出部441は、解析対象文書群から表を抽出する。表はセルの列からなる行の列である。見出し識別部442は、抽出された表の見出し行を識別する(ステップ620)。通常、表の1行目を見出し行と見做す。但し、図15に示すように、1行目のセルにした行のセルと連結したセルがあるときは、連結セルの最下行を見出し行と見做す。これらは1行目に含まれるセルの最大の高さをnとしたとき、n行目を見出し行と見做すことで一般化できる。
一覧表判別部443は、抽出した表が一覧表であるか否かを判別する。例えば、図16に示す表は一覧表とは認められない。このような表を、見出し識別部442が見出し行と見做した行を元に識別する。このような表で、見出し行と見做された行の多くは、次にあげる特徴があることを利用する。
・値が含まれる;
・値が隣り合うセルに連続しては出現しない;
・値は異なるが他の部分が一致する見出し行(と見做された行)が他の表に存在する;
上記の特徴を持つ見出し行を次の手順により見つける。図17に一覧表か否かの判定の手順を示す。便宜上、見出し行と見做された行の各セルは値であるかもしれないものも含めて見出しという。
ステップ710) 一覧表判別部443は、処理済のパターン集合を作り「集合1」とする。
ステップ720) 同じパターンを持つ見出し行の集合からなる集合を作り「集合2」とする。
ステップ730) 「集合2」のうち、パターンが「集合1」の要素でないものの中で最大のものを「集合3」とする。ここで、次の条件を満たす見出し行の集合は同じパターンを持つという。
・集合に属する全ての見出し行で、見出しの数が等しい。
・集合に属する全ての見出し行の最左の見出しが等しい。
・ある同じ位置に異なる見出しがあるとき、その左隣りの見出しは全ての見出しで等しい。
・集合に属する少なくとも一つの見出し行の一つの見出しは、他のいずれの見出し行の同じ位置の見出しと異なる。
また、上記の条件を満たす全ての見出しで、同じ位置かつ同じ見出しであるもの、位置と見出しのペアの集合を「パターン」と呼ぶ。
ステップ740) 「集合3」が存在しない(「集合2」のパターンのすべてが「集合1」の要素である)または、「集合3」の要素数が1であるときは、判定処理を終了する。
ステップ750) 「集合3」を「集合1」に追加する。
ステップ760) 「集合3」の各見出し行から全ての見出し行で同じ位置かつ同じ見出しのセルを取り除いた、残りのセルからなる集合を作り「集合4」とする。
ステップ770) 「集合4」の要素数をa、「集合4」の要素のうち、文書群に含まれる表の見出し行より下のセルに一致するか、特定の文字パターンにマッチする見出しの数をbとする。
ステップ790) b/aがある値(例えば、2/3)よりも大きいとき、これらの見出し行を持つ表は、一覧表でないと判定する。
ステップ7A0) 「集合2」の各要素から「集合3」に含まれる要素を削除し、ステップ730の処理に戻る。
次に、図12のキーワード間関係グラフ構築部44の見出し主従関係判定部444について説明する。
見出し主従関係判定部444は、一覧表に含まれる列見出しの主従関係を判定する。
見出し主従関係判定部444は、同一の見出し行を持つ表を、先頭の表以外の見出し行を除き縦に連結した表を、一つの表として扱う。表中の特定のパターン(例:見出しが「項番」、「備考」にマッチする、値が全て数値である、値に句読点を含むなど)にマッチする見出しとその列は存在しないものとして扱ってもよい。
次に、値を同じ列の見出しとリンクする(図18)。一つの見出しの列が複数の列に分割されているときは、分割された数だけ見出しがあるものとして扱う(図19)。
次に、見出しの主従関係を次の基準で判断する(図20)。
・まず、見出しを次の規則に従って上下左右の2次元に並べる。
−表の中で、リンクされた値が最も少ない順に左から並べる。
−リンクされた値が同数の見出しは、表の中でより左にあるものが下に、より右にあるものが上になるように上下に並べる。
・最下段の見出しで、隣り合う二つの見出しの左を主、右を従とする。
・その他の見出しは、同じ列の最下段の見出しを主、上にある見出しを従とする。
キーワード間関係グラフ構築部44のグラフ構成部445は、値と見出しのリンクと、値にリンクされた見出しの主従関係に基づき生成された同じ列の値とのリンクを合成し、値と見出しをノードとするグラフを構成する。
グラフ構成部445は、まず、表中の値と見出しをノードとするグラフを次の手順で構成する。
・表の各値及び見出しをノードとする。
・見出しと値のリンクをエッジとする。
・同じ列で、リンクする見出しが主従関係にある値同士をリンクしエッジとする(図21)。
・特定のパターンにマッチする値(英数字、空文字列、ハイフンのみなど)があるときは、その列に限り、その値とその値がリンクする見出しと主従関係にある見出しにリンクした同列の値をリンクする代わりに、その値にリンクする見出しが従属する見出しと、その値にリンクする見出しに従属する見出しとの間に主従関係があると見做して、これら見出しとリンクされた列の値をリンクし、エッジとしてもよい。
[実施例]
以下に、開発ドキュメント間トレースリンク生成支援装置100の処理を具体的に説明する。
要件定義書のある箇所に関連する外部設計の検索を例に説明する。
図22に示す文書群があったとき、記憶装置3の文書木31は、図23のようになる。なお、説明の簡略化のため、本文は無視して考える。
また、キーワード間関係グラフ34は、図9の上に示すグラフを管理しているものとする。キーワード分類グラフ構築部24は、図9の(a)に示すグラフから同図(b)に示すキーワード分類グラフを構成する。文書木31の各ノードに関連付けるキーワードは、キーワード関連グラフのキーワードノードの中から一定の基準(例えば、当該文書木31に含まれるキーワード)のもとに選択する。
ユーザインタフェース部1は、問い合わせ実行部2から文書木とキーワード分類グラフを受信し、図24のように表示する。
節「ユーザ情報の登録」に関連する外部設計を木構造を利用して検索する手順は以下の通りである。図25に検索実行の例を示す。
(1)ユーザが「ユーザ情報の登録」ノードを選択する。
(2)リンク元指定部12の「ユーザ情報の登録」ノード付近にこのノードに関連付けられたキーワードを表示する。前述の基準によれば、「ユーザ情報の登録」ノードに関連付けられたキーワードは「ユーザ情報」と「登録」である(図25(2))。
(3)ユーザが、キーワード「ユーザ情報」「登録」を選択する(図25(3))。
(4)選択されたキーワードは、リンク先候補検索部21に送信される。
(5)リンク先候補検索部21は、キーワードに適合する文書木31中のノードを検索する。ここでは、「適合条件1」からノード「ユーザ情報の登録」と「1.ユーザ情報登録画面」が、「適合条件2」からノード「登録機能」が適合する。
(6)適合した3節{「ユーザ情報の登録」「1.ユーザ情報登録画面」「登録機能」}を検索結果として、リンク先候補検索結果表示部11に返却する。
仮に、本方式によらずにノード毎にANDでマッチさせると、ノード「登録機能」を漏らしてしまう。
(7)リンク先候補検索結果表示部11は検索結果を入出力装置0に表示する。検索結果は適合ノードを強調表示するなど、適合しないノードと区別がつくように表示する(図25(7))。
グラフを利用して、節「ユーザ情報の登録」に関連するキーワードを探索する例を示す。
図9に示すキーワード分類グラフの「情報」ノード(クラスノード)で「ユーザ情報」を選択する。キーワード分類グラフ再構成部23は、「情報」ノードを、「ユーザ情報」ノードに書き換え、グラフを再構成し、図11の(1)に示すグラフを得る。同様に「操作」、「画面」の各ノードで「登録」、「ユーザ登録画面」で置き換え、グラフを再構成する。「ユーザ登録画面」の「遷移先」ノードのキーワード「確認画面」は、節「ユーザ情報の登録」に関連するキーワードであることがわかる(図11(4))。
さらにキーワード分類グラフ構築の例を示す。
図26の(1)から(6)に示す6つの表を含む文書群32があるとする。
文書群解析部4のキーワード間関係グラフ構築部44の表抽出部441は、文書群32からこれらのグラフを抽出する。
<見出し識別>
次に、見出し行識別部442がそれぞれのグラフから見出しを識別する。それぞれのグラフとも1行目の高さは1であるので、各グラフの見出し行は1行目である。
<一覧表判定>
次に、一覧表判定部443は、各表が一覧表であるか否かを判定する。ここでは、一覧表であるか否かの閾値を2/3とした例を示す。6つの表の中で、同じパターンの見出しの集合であることを満たすのは、(3)、(4)を要素に持つ集合のみである。この集合でa=b=4(処理A11,A1、処理B21,B2)である。したがって、b/a>2/3を満たすので、表(3)及び表(4)は一覧表ではないと判定する。
<列見出し主従関係判定>
次に、列見出し主従関係判定部444が見出しの主従関係を判定する。例として、ここでは、見出しが「項番」、「備考」にマッチする列は存在しないものとして扱う。図26の(1)は見出し「機能ブロック」と同じ列の値が2セル、「機能」と同じ列の値が4セルあるため、「機能ブロック」と「機能」は主従の関係にあると判定する。同様に、図26の(2)は「ユースケース」と「関連機能」は主従の関係にあると判定する。図26の表(5)と表(6)は同じ見出し行を持つため2つの表を連結する。連結後の表では「機能」と同じ列の値が2セル、「処理」と同じ列の値が5セルあるため、「機能」と「処理」は主従の関係にあると判定する。
<グラフ構成>
次に、グラフ構成部445は、値と見出しをノードとする表単位のグラフを次の手順(図27〜図29)で構成し、最後に同一キーワード、同一キーワードの分類のノードをそれぞれ一つのノードに合成し、一つのグラフとする(図30)。
・各表の値と見出しをそれぞれノードとする。
・値から出て、その値と同じ列の見出しに入るエッジを追加する。
・同じ行にある値について、主従関係の主見出しと同じ列の値から出て、主従関係の従見出しと同じ列の値に入るエッジを追加する。
なお、本発明は、図1〜図3の開発ドキュメント間トレースリンク作成支援装置100の各構成要素の動作をプログラムとして構築し、開発ドキュメント間トレースリンク作成支援装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。
0 入出力装置
1 ユーザインタフェース部
2 問い合わせ実行部
3 記憶装置
4 文書群解析部
10 キーワード入力部
11 リンク先候補検索結果表示部
12 リンク元指定部
13 キーワードグラフ表示部
14 キーワード分類グラフノード表示部
21 リンク先候補検索部
22 検索キーワード候補検索部
23 キーワード分類グラフ再構成部
24 キーワード分類グラフ構築部
31 文書木
32 文書群
33 キーワード表
34 キーワード間関係グラフ
41 文書木構築部
42 キーワード抽出部
44 キーワード間関係グラフ構築部
100 開発ドキュメント間トレースリンク作成支援装置
441 表抽出部
442 見出し行識別部
443 一覧表判定部
444 見出し主従関係判定部
445 グラフ構成部
446 グラフ合成部

Claims (8)

  1. トレースリンクを作成する対象である複数の開発ドキュメントからなる文書群が記憶装置に保存されている状況において、トレースリンク生成時のリンク先の発見を支援するための開発ドキュメント間トレースリンク作成支援装置であって、
    ユーザインタフェース手段、文書群解析手段、問い合わせ実行手段を有し、
    前記文書群解析手段は、
    前記記憶装置に保存されている前記文書群に含まれる文書情報から、前記トレースリンクを作成する単位である文書単位(以下、「ノード」と記す)を識別し、該ノードの階層の木構造である文書木を構築する文書木構築手段を有し、
    前記ユーザインタフェース手段は、
    ユーザが検索したい複数のキーワードを受け付けるキーワード入力手段と、
    検索されたリンク先候補を表示するリンク先候補検索結果表示手段と、
    を有し、
    前記問い合わせ実行手段は、
    前記キーワード入力手段で指定された複数のキーワードであるキーワード列から、前記文書木の階層構造に基づいて、該キーワード列に適合したリンク先候補を検索し、前記リンク先候補検索結果表示手段に通知するリンク先候補検索手段を有する
    ことを特徴とする開発ドキュメント間トレースリンク作成支援装置。
  2. 前記リンク先候補検索手段は、
    前記キーワード列に適合したリンク先候補を検索する際に、
    全てのキーワードを含むノードは適合する;
    1つ以上のキーワードを含むノードで、該ノードの先祖ノードが残りのキーワードを全て含んでいるとき、当該ノードは適合する;
    全てのキーワードのうち、あるノードAの先祖ノードに含まれないキーワードが、該ノードAの複数の子ノード以下の部分木に分散して含まれるとき、当該ノードAは適合する;
    の条件を用いる
    請求項1記載の開発ドキュメント間トレースリンク作成支援装置。
  3. 前記文書群解析手段は、
    前記文書群から前記ユーザが指定したいキーワードの候補の集まりであるキーワード表を作成するキーワード抽出部を更に有し、
    前記ユーザインタフェース手段は、
    前記文書木の中から前記ユーザによって指定されたトレースリンクのリンク元であるノードに対応するキーワード列をユーザに提示し、その中から該ユーザに選択させ、検索のためのキーワードとするリンク元指定手段を更に有し、
    前記問い合わせ実行手段は、
    前記ユーザによって指定された前記リンク元であるノードに対して、前記キーワード表からリンク元に対応するキーワード列を検索し、前記リンク元指定手段に返却する検索キーワード候補検索手段を更に有する
    請求項1記載の開発ドキュメント間トレースリンク作成支援装置。
  4. 前記文書群解析手段は、
    前記文書群から複数のキーワードを抽出し、相互に関係のあるキーワードをノードとし、関係のあるキーワードを結ぶリンクをエッジとするキーワード間関係グラフを構築し、前記記憶装置に格納する第1のキーワード間関係グラフ構築手段を更に有し、
    前記ユーザインタフェース手段は、
    前記記憶装置から前記キーワード間関係グラフを読み込み、前記ユーザに対して表示し、該キーワード間関係グラフから該ユーザにより選択されたノードであるキーワードを検索のためのキーワードとするキーワードグラフ表示手段を更に有する
    請求項3記載の開発ドキュメント間トレースリンク作成支援装置。
  5. 前記文書群解析手段は、
    前記文書群から複数のキーワードを抽出し、抽出した個々のキーワードに対し1以上のキーワード分類を紐付け、相互に関係のあるキーワードを抽出し、該個々のキーワードと個々のキーワード分類をそれぞれキーワードノード、キーワード分類ノードとし、該関係のあるキーワードを結ぶエッジおよびキーワードノードと該キーワードノードに紐付いたキーワード分類ノードを結ぶエッジで構成されるキーワード間関係グラフを構築し、前記記憶装置に格納する第2のキーワード間関係グラフ構築手段を更に有し、
    前記問い合わせ実行手段は、
    前記キーワード分類ノードと、前記キーワード間関係グラフのうち任意のエッジで結ばれた二つのキーワードノードに紐付いたキーワード分類ノードを相互に結ぶエッジで構成されるキーワード分類グラフを構築するキーワード分類グラフ構築手段と、
    前記キーワード分類グラフにおいて、前記キーワード分類ノードと選択されたキーワード分類ノードと紐付いたキーワードの中から、前記ユーザが一つのキーワードを選択することによって、該キーワード分類ノードをキーワードノードに置き換え、キーワード分類グラフを再構成するキーワード分類グラフ再構成手段と、
    を更に有し、
    前記ユーザインタフェース手段は、
    前記キーワード分類グラフを前記ユーザに対して表示し、該キーワード分類グラフのキーワード分類ノードやキーワード分類に紐付いたキーワード及び、キーワードノードを選択させることにより、検索のためのキーワードを選択し、前記キーワード分類再構成手段に出力するキーワード分類グラフ表示手段を更に有する
    請求項3記載の開発ドキュメント間トレースリンク作成支援装置。
  6. トレースリンクを作成する対象である複数の開発ドキュメントからなる文書群が記憶装置に保存されている状況において、トレースリンク生成時のリンク先の発見を支援するための開発ドキュメント間トレースリンク作成支援方法であって、
    ユーザインタフェース手段、文書群解析手段、問い合わせ実行手段を有する装置において、
    前記文書群解析手段が、前記記憶装置に保存されている前記文書群に含まれる文書情報から、前記トレースリンクを作成する単位である文書単位(以下、「ノード」と記す)を識別し、該ノードの階層の木構造である文書木を構築する文書木構築ステップと、
    前記ユーザインタフェース手段が、ユーザが検索したい複数のキーワードを受け付けるキーワード入力ステップと、
    前記問い合わせ実行手段が、前記キーワード入力ステップで指定された複数のキーワードであるキーワード列から、前記文書木の階層構造に基づいて、該キーワード列に適合したリンク先候補を検索し、前記ユーザインタフェース手段に通知するリンク先候補検索ステップと
    前記ユーザインタフェース手段が、検索されたリンク先候補を表示するリンク先候補検索結果表示ステップと、
    を行うことを特徴とする開発ドキュメント間トレースリンク作成支援方法。
  7. 前記リンク先候補検索ステップにおいて、
    前記キーワード列に適合したリンク先候補を検索する際に、
    全てのキーワードを含むノードは適合する;
    1つ以上のキーワードを含むノードで、該ノードの先祖ノードが残りのキーワードを全て含んでいるとき、当該ノードは適合する;
    全てのキーワードのうち、あるノードAの先祖ノードに含まれないキーワードが、該ノードAの複数の子ノード以下の部分木に分散して含まれるとき、当該ノードAは適合する;
    の条件を用いる
    請求項6記載の開発ドキュメント間トレースリンク作成支援方法。
  8. コンピュータを、
    請求項1乃至5のいずれか1項の記載の開発ドキュメント間トレースリンク作成支援装置の各手段として機能させるための開発ドキュメント間トレースリンク作成支援プログラム。
JP2014035621A 2014-02-26 2014-02-26 開発ドキュメント間トレースリンク生成支援装置及び方法及びプログラム Pending JP2015162004A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014035621A JP2015162004A (ja) 2014-02-26 2014-02-26 開発ドキュメント間トレースリンク生成支援装置及び方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014035621A JP2015162004A (ja) 2014-02-26 2014-02-26 開発ドキュメント間トレースリンク生成支援装置及び方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2015162004A true JP2015162004A (ja) 2015-09-07

Family

ID=54185074

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014035621A Pending JP2015162004A (ja) 2014-02-26 2014-02-26 開発ドキュメント間トレースリンク生成支援装置及び方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2015162004A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106502995A (zh) * 2016-11-30 2017-03-15 福建榕基软件股份有限公司 一种层级信息智能识别方法及装置
US9934944B2 (en) 2015-07-15 2018-04-03 Kabushiki Kaisha Toshiba Plasma induced flow electrode structure, plasma induced flow generation device, and method of manufacturing plasma induced flow electrode structure
JP2020113048A (ja) * 2019-01-11 2020-07-27 富士ゼロックス株式会社 情報処理装置及びプログラム
US11755818B2 (en) 2021-01-29 2023-09-12 Fujitsu Limited Computer-readable recording medium storing design document management program, design document management method, and information processing apparatus

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9934944B2 (en) 2015-07-15 2018-04-03 Kabushiki Kaisha Toshiba Plasma induced flow electrode structure, plasma induced flow generation device, and method of manufacturing plasma induced flow electrode structure
CN106502995A (zh) * 2016-11-30 2017-03-15 福建榕基软件股份有限公司 一种层级信息智能识别方法及装置
CN106502995B (zh) * 2016-11-30 2019-10-15 福建榕基软件股份有限公司 一种层级信息智能识别方法及装置
JP2020113048A (ja) * 2019-01-11 2020-07-27 富士ゼロックス株式会社 情報処理装置及びプログラム
JP7238411B2 (ja) 2019-01-11 2023-03-14 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
US11755818B2 (en) 2021-01-29 2023-09-12 Fujitsu Limited Computer-readable recording medium storing design document management program, design document management method, and information processing apparatus

Similar Documents

Publication Publication Date Title
US9519706B2 (en) Multiple rule development support for text analytics
Isenberg et al. vispubdata. org: A metadata collection about IEEE visualization (VIS) publications
Gomez-Jauregui et al. Information management and improvement of citation indices
JP5040925B2 (ja) 情報抽出規則作成支援システム、情報抽出規則作成支援方法及び情報抽出規則作成支援プログラム
JP4862072B2 (ja) 設計チェック知識構築方法及びシステム
US20150026159A1 (en) Digital Resource Set Integration Methods, Interfaces and Outputs
JP2013105321A (ja) 文書処理装置、文書構成要素間の関係解析方法およびプログラム
US20120179709A1 (en) Apparatus, method and program product for searching document
Ujwal et al. Classification-based adaptive web scraper
JP2015162004A (ja) 開発ドキュメント間トレースリンク生成支援装置及び方法及びプログラム
Kumar Apache Solr search patterns
JP4924091B2 (ja) Fmeaシート作成装置
JP2014102625A (ja) 情報検索システム、プログラム、および方法
JP2014089646A (ja) 電子データ処理装置、及び電子データ処理方法
JP2021064143A (ja) 文作成装置、文作成方法および文作成プログラム
JP5273884B1 (ja) 構造解析装置及びプログラム
Ta et al. A model for enriching multilingual Wikipedias using infobox and Wikidata property alignment
JP2008210229A (ja) 知的財産情報検索装置、知的財産情報検索方法及び知的財産情報検索プログラム
Ryan Rapidminer for text analytic fundamentals
JP2020091630A (ja) ドキュメント作成支援システム
US20230409620A1 (en) Non-transitory computer-readable recording medium storing information processing program, information processing method, information processing device, and information processing system
Merhav et al. Basis Technology at TAC 2013 Entity Linking.
Zardari et al. The Impact of Data Mining on Digital Libraries–A bibliometric Study
Alam et al. The Impact of Data Mining on Digital Libraries–A bibliometric Study
JP2009181524A (ja) 文書検索システム及び文書検索方法