WO2023218594A1

WO2023218594A1 - 情報処理装置

Info

Publication number: WO2023218594A1
Application number: PCT/JP2022/020049
Authority: WO
Inventors: 孝大中村; 陽一郎古賀; 裕史古川
Original assignee: 三菱電機株式会社
Priority date: 2022-05-12
Filing date: 2022-05-12
Publication date: 2023-11-16

Abstract

本開示は、設計資産から必要な情報を効率的に探索することが可能な情報処理装置を提供することを目的とする。本開示による情報処理装置は、ユーザが入力した検索クエリから検索クエリタグを抽出するタグ抽出部と、設計資産に含まれるコンテンツから抽出されたコンテンツタグを管理するコンテンツタグデータベースと、検索クエリタグとコンテンツタグとに基づくコンテンツを類似コンテンツとして探索する類似コンテンツ探索部と、検索クエリと類似コンテンツとの類似度を算出する類似度算出部と、ユーザアクセス権限に基づいて、類似コンテンツをユーザが閲覧可能か否かを判定する閲覧権限判定部と、類似コンテンツと、類似度と、閲覧権限判定部による判定結果とに基づいて、ユーザが入力した検索クエリに対する探索結果を生成する探索結果生成部とを備える。

Description

情報処理装置

　本開示は、情報処理装置に関する。

　従来、文書中の秘匿対象の領域（テキスト、図面、画像など）に対して、ユーザのアクセス権限に応じてマスク処理を行い、当該マスク処理を施した文書をユーザ端末に出力する技術が開示されている（例えば、特許文献１，２，３参照）。具体的には、自然言語解析によって、予め指定されたカテゴリの単語、語句、および文章を文書中から抽出して分類し、ユーザのアクセス権限に応じて該当部分をマスクし、マスクした文書を出力する。あるいは、文書内の機密情報（テキスト、図面、画像など）に対して、ユーザのアクセス権限に応じてマスクして出力する。

　また、機密情報の範囲の指定、およびユーザの閲覧制限の設定をユーザが行う技術が開示されている（例えば、特許文献１，２，３参照）。開示不能と判定された構成要素については、予め登録した置換情報に置き換えて出力する技術が開示されている（例えば、特許文献４参照）。文書中の単語の重要度を計算する手法が開示されている（例えば、特許文献５参照）。

特開２０１９－８２８８４号公報特開２０２１－６０７９１号公報特開２００９－２７１５７３号公報特開２００１－３２５２４９号公報特開２００９－１２９１８５号公報

　組織内部に蓄積された過去のシステムソフトウェア資産（以下、「設計資産」という）は膨大であり、新たなシステム開発の際に設計資産を活用することが難しくなっている。システムの開発者は、開発の進行を妨げるような障害に直面すると、設計資産の中に有用な情報がないか探索する。ここで、開発の進行を妨げるような障害としては、例えば、流用しようとしている既存のコンポーネントがなぜこのような仕様であるのかが分からない、あるいは、流用部で発生した不具合の原因が分からないなどが挙げられる。また、有用な情報とは、最終的にこのような仕様とした（または、最終的にこのような設計にした）とする結論ではなく、むしろ結論に至るまでの「経緯、検討過程、設計根拠」であることが多い。

　しかし、「経緯、検討過程、設計根拠」は、「複数の文書、章、および節」、「プロジェクト管理ツールのチケット」、および「社内Ｗｉｋｉツール」などに分散して存在していることが多く、膨大な設計資産の中から関連する情報を拾い集める作業が必要となる。また、あるコンテンツで関連情報を見つけると、その関連情報から別のコンテンツを辿るといったような芋づる式に探索を進めなければならず、探索コストが膨大となる。

　また、「経緯、検討過程、設計根拠」を辿る過程では、開示範囲の制限が大きな障害となる。「経緯、検討過程、設計根拠」が含まれているコンテンツの中には、顧客名および売り上げなど、契約上、関係者以外に開示できない一部仕様の情報などが記載されていることがあり、このようなコンテンツは開示範囲が著しく制限される。特許文献１～３の中には、このようなコンテンツを検索および探索の対象から外すことが開示されているが、検索対象から外した場合の調査結果は全体ではなく部分的な範囲に留まるため、重要な情報を見落とすリスクが高まる。

　また、ユーザによっては開示範囲が制限され、途中で文書の内容（それが現在調べているトピックに関連するか否か）を確認することができなくなるため、それ以上の情報の追跡が困難になり、調査を諦めざるを得ない場合がある。従来の解決策として、予め登録した置換情報に置き換えてコンテンツを表示する技術（例えば、特許文献４参照）があるが、コンテンツの意味を損なって表示してしまうリスクがある。

　特許文献１～３では、開示範囲が制限されているコンテンツに対して、開示できない箇所を特定して黒塗り（マスキング）する技術が開示されている。当該技術では、文書の形態素解析、それによって抽出した各単語のブラックリストによる検閲、および単語のメタデータを根拠として、開示できない箇所をマスキングしている。しかし、ブラックリストおよびメタデータが必ずしも完全であるという保証はなく、マスキングの漏れがないことを装置側だけで保証することは困難である。仮に、一部にマスキングの漏れが発生して本来開示してはならない情報を開示してしまった場合、それはセキュリティ上の重大な事故であり、組織上、契約上、および法律上の要請に準拠していないとみなされるため、大きなリスクが伴う。

　このように、従来では、設計資産から必要な情報を効率的に探索することについて改善の余地があった。

　本開示は、このような問題を解決するためになされたものであり、設計資産から必要な情報を効率的に探索することが可能な情報処理装置を提供することを目的とする。

　上記の課題を解決するために、本開示による情報処理装置は、ユーザが入力した検索クエリからキーワードを検索クエリタグとして抽出するタグ抽出部と、設計資産に含まれるコンテンツから抽出されて当該コンテンツと紐づけられたタグであるコンテンツタグを管理するコンテンツタグデータベースと、タグ抽出部が抽出した検索クエリタグと、コンテンツタグデータベースで管理されているコンテンツタグとに基づくコンテンツを類似コンテンツとして探索する類似コンテンツ探索部と、検索クエリと、類似コンテンツ探索部が探索した類似コンテンツとの類似度を算出する類似度算出部と、ユーザがコンテンツにアクセス可能であることを示すユーザアクセス権限に基づいて、類似コンテンツ探索部が探索した類似コンテンツをユーザが閲覧可能か否かを判定する閲覧権限判定部と、類似コンテンツ探索部が探索した類似コンテンツと、類似度算出部が算出した類似度と、閲覧権限判定部による判定結果とに基づいて、ユーザが入力した検索クエリに対する探索結果を生成する探索結果生成部とを備える。

　本開示によれば、設計資産から必要な情報を効率的に探索することが可能となる。

　本開示の目的、特徴、態様、および利点は、以下の詳細な説明と添付図面とによって、より明白となる。

実施の形態による情報処理装置の構成の一例を示すブロック図である。実施の形態による検索クエリの構成の一例を示す図である。実施の形態による設計資産の構成の一例を示す図である。実施の形態によるコンテンツタグデータベースの構成の一例を示す図である。実施の形態による類似コンテンツ探索部および類似度算出部の動作の一例を示すフローチャートである。実施の形態による閲覧権限判定部の動作の一例を示すフローチャートである。実施の形態によるユーザ管理データベースの構成の一例を示す図である。実施の形態によるスニペット生成部の動作の一例を示すフローチャートである。実施の形態による表示情報制御部の動作の一例を示すフローチャートである。実施の形態による閲覧不能コンテンツ変換部の動作の一例を示すフローチャートである。実施の形態による閲覧不能コンテンツ変換部の動作を説明するための図である。実施の形態による探索結果の表示の一例を示す図である。実施の形態による探索結果の表示の一例を示す図である。実施の形態による情報処理装置のハードウェア構成の一例を示す図である。実施の形態による情報処理装置のハードウェア構成の一例を示す図である。

　＜実施の形態＞
　以下で説明する実施の形態では、組織、プロジェクト、あるいは何らかのカテゴリごとに設計資産を蓄積したコーパス群があり、当該コーパス群の一部にセキュリティ上の開示範囲が制限されている環境を想定する。開示範囲は、ユーザが所属する組織、職制、およびアサインされているプロジェクトなどによって決定される。ユーザが探索の過程で開示範囲が制限されたコーパスに格納されたコンテンツに遭遇すると、後述する図１に示す情報処理装置１によって、当該コンテンツの情報をユーザに開示することができるか否かが確認される。当該コンテンツを開示することができる場合、ユーザは、当該コンテンツの情報を自ら確認することができる。

　一方、当該コンテンツを開示することはできないが、ユーザが当該コンテンツを跨いでさらなる調査および探索を続行したいと考える場合、情報処理装置１によって、ユーザに代わって当該コンテンツを分析し、分析結果に基づいて別のコーパスに格納された関連性が高いと判断されるコンテンツにユーザを誘導することができる。このような開示範囲が制限されたコンテンツに関連する別のコンテンツの調査の代行は、数珠つなぎに連鎖して行うことができる。また、開示範囲が制限されたコンテンツを、開示範囲が制限されていない閲覧可能な関連するコンテンツ群に含まれる単語を用いて再構成して閲覧可能とすることによって、開示範囲の制限という組織上、契約上、および法律上の要請を遵守しながら、開示範囲が制限されたコンテンツの内容を損なわずに把握することができる。

　まとめると、情報処理装置１は、組織が保有する開示範囲が制限されたコンテンツを含む設計資産（あるいはコーパス）を探索するために、コンテンツを分析し、関連するコンテンツへのリンクを動的に構成する。これにより、ユーザは、開示範囲の制限という制約を乗り越えて、組織が保有する設計資産を対象に、必要とする情報、主に経緯、検討過程、および設計根拠の探索を実施することができるようになる。すなわち、実施の形態による情報処理装置１によれば、設計資産から必要な情報を効率的に探索することが可能となる。

　以下、実施の形態による情報処理装置１の構成および動作について説明する。

　＜情報処理装置１の構成＞
　図１は、実施の形態による情報処理装置１の構成の一例を示すブロック図である。

　情報処理装置１は、ユーザインタフェース部２と、タグ抽出部３と、設計資産４と、コンテンツタグデータベース５と、類似コンテンツ探索部６と、類似度算出部７と、閲覧権限判定部９と、ユーザ管理データベース１０と、探索結果生成部１１とを備えている。

　ユーザインタフェース部２は、ユーザの入力を受け付けた検索クエリ１２を取得し、取得した検索クエリ１２をタグ抽出部３に出力する。また、ユーザインタフェース部２は、探索結果生成部１１が生成した探索結果１４を表示する。検索クエリ１２の詳細は後述する。

　タグ抽出部３は、設計資産４に蓄積されているコンテンツまたは検索クエリ１２から、単語の出現頻度、共起、および単語の重みに基づくキーワードをタグとして抽出する。タグ抽出部３は、検索クエリ１２から抽出されたタグ１３（検索クエリタグ）を、検索クエリ１２とともに類似コンテンツ探索部６に出力する。また、タグ抽出部３は、設計資産４に蓄積されているコンテンツから抽出したタグ（コンテンツタグ）を、抽出元のコンテンツに紐づけてコンテンツタグデータベース５に出力する。

　設計資産４は、仕様書および設計書などを含む文書、プロジェクト管理ツールにおけるチケット、および社内Ｗｉｋｉツールにおける情報などのコンテンツを蓄積している。設計資産４の詳細は後述する。

　コンテンツタグデータベース５は、タグ抽出部３が抽出したタグを抽出元のコンテンツに紐づけて管理する。コンテンツタグデータベース５の詳細は後述する。

　類似コンテンツ探索部６は、タグ抽出部３から検索クエリ１２およびタグ１３を取得し、検索の効率化のために、タグ１３を用いたフィルタリングによって類似コンテンツを探索する。そして、類似コンテンツ探索部６は、類似コンテンツのリストを類似度算出部７に出力する。

　類似度算出部７は、類似コンテンツの文書と検索クエリ１２との類似度を算出し、類似度の高いコンテンツのリストを検索結果８として出力する。類似度算出部７の詳細は後述する。

　閲覧権限判定部９は、ユーザ管理データベース１０で管理されているユーザアクセス権限に従って、検索結果８をユーザが閲覧可能か否かを判定する。閲覧権限判定部９の詳細は後述する。

　ユーザ管理データベース１０は、ユーザの権限情報（ＩＤ、パスワード、職制など）を含むユーザアクセス権限を管理している。ユーザ管理データベース１０の詳細は後述する。

　探索結果生成部１１は、探索結果１４を生成する。そして、探索結果生成部１１は、生成した探索結果１４をユーザインタフェース部２に出力する。探索結果生成部１１の詳細は後述する。

　＜検索クエリ１２の構成＞
　図２は、検索クエリ１２の構成の一例を示す図である。

　検索クエリ１２は、ユーザが任意に入力した自然言語１２１と、ユーザが提示した検索元コンテンツ１２２とを含む。検索元コンテンツ１２２は、検索元コンテンツ１２２における章、節、および文を含む。

　自然言語１２１を検索クエリ１２とする場合、ユーザは任意の検索文１２３を入力することができる。このとき、検索内容を絞り込むために、検索文１２３に関連するメタデータ１２４、またはハッシュタグ１２５を用いた検索文１２３のタイプの指定が可能である。メタデータ１２４は、作者、作成日、更新日、日付範囲などを含む。ハッシュタグ１２５を用いた検索文１２３のタイプは、仕様書、設計書、不具合情報、Ｔｉｐｓなどを含む。

　また、検索元コンテンツ１２２を検索クエリ１２とする場合、コンテンツの中で検索したい章または節などを検索箇所１２６とすることができる。このとき、検索内容を絞り込むために、検索元コンテンツ１２２のメタデータ１２７の指定が可能である。メタデータ１２７は、上記で説明したメタデータ１２４と同様である。

　＜設計資産４の構成＞
　図３は、設計資産４の構成の一例を示す図である。

　設計資産４は、開発者にとって有用であるコンテンツが作成された「経緯、検討過程、設計根拠」が、「複数の文書、章、および節」、「プロジェクト管理ツールのチケット」、および「社内Ｗｉｋｉツール」などに分散して存在していることを考慮した構成となっている。

　具体的には、設計資産４は、ファイルサーバ４１、プロジェクト管理ツール４２、およびＷｉｋｉツール４３を含む。

　ファイルサーバ４１は、仕様書および設計書などのドキュメントを管理する。プロジェクト管理ツール４２は、Ｒｅｄｍｉｎｅ（登録商標）またはＪＩＲＡ（登録商標）のようなプロジェクトのチケット管理を有するツールである。Ｗｉｋｉツール４３は、他者とノウハウを共有するためのツールである。

　なお、図３では、設計資産４がファイルサーバ４１、プロジェクト管理ツール４２、およびＷｉｋｉツール４３を含む場合を示しているが、これら以外の情報を含んでもよい。すなわち、設計資産４は、コンテンツが作成された「経緯、検討過程、設計根拠」を追うために必要な情報を含むデータ群である。

　＜コンテンツタグデータベース５の構成＞
　図４は、コンテンツタグデータベース５の構成の一例を示す図である。

　コンテンツタグデータベース５は、設計資産４のコンテンツ５１と、タグ抽出部３が抽出したコンテンツのタグ５２とを紐づけたデータ群を格納している。タグ５２は、コンテンツ名５３、コンテンツ格納場所５４、キーワード５５、およびメタデータ５６を含む。

　コンテンツ名５３は、コンテンツ５１の名称である。コンテンツ格納場所５４は、設計資産４におけるコンテンツ５１の格納場所である。キーワード５５は、タグ抽出部３がコンテンツ５１から抽出したキーワードである。メタデータ５６は、コンテンツ５１の作者、作成日、文書タイプ（仕様書、設計書、不具合情報、Ｔｉｐｓなど）などのコンテンツ５１のプロパティである。

　設計資産４に新たなコンテンツが登録される度に、タグ抽出部３が抽出したタグがコンテンツに紐づけられて、コンテンツタグデータベース５に蓄積される。

　＜類似コンテンツ探索部６および類似度算出部７＞
　図５は、類似コンテンツ探索部６および類似度算出部７の動作の一例を示すフローチャートである。図５において、ステップＳ１０１～ステップＳ１０４は類似コンテンツ探索部６の動作に相当し、ステップＳ１０５は類似度算出部７の動作に相当する。

　ステップＳ１０１において、類似コンテンツ探索部６は、タグ抽出部３から検索クエリ１２およびタグ１３を取得する。

　ステップＳ１０２において、類似コンテンツ探索部６は、コンテンツタグデータベース５からコンテンツ５１に紐づけられたタグ５２を取得する。

　ステップＳ１０３において、類似コンテンツ探索部６のタグベースフィルタリング６１は、コンテンツタグデータベース５内でタグ１３と一致するタグ５２をフィルタリングし、検索対象のコンテンツを絞り込む。

　ステップＳ１０４において、類似コンテンツ探索部６は、フィルタリング後の検索対象コンテンツである類似コンテンツをリスト化する。

　ステップＳ１０５において、類似度算出部７は、検索クエリ１２と類似コンテンツとの類似度を算出し、類似度が高い順に並べられた類似コンテンツの情報、類似コンテンツに紐づくタグ、および検索クエリ１２との類似度を含むリストを検索結果８として出力する。

　類似度算出部７は、Ｅｌａｓｔｉｃ　Ｓｅａｒｃｈ（登録商標）、またはＡＩ（Artificial Intelligence）言語学習モデルなどによる全文検索の機能を有する。類似度算出部７は設計資産４における全てのコンテンツにアクセス可能であるため、抜けまたは漏れのない網羅的な検索を実施することができる。

　＜閲覧権限判定部９の動作＞
　図６は、閲覧権限判定部９の動作の一例を示すフローチャートである。

　ステップＳ２０１において、閲覧権限判定部９は、ユーザ名を取得する。

　ステップＳ２０２において、閲覧権限判定部９は、類似度算出部７から検索結果８を取得する。

　ステップＳ２０３において、閲覧権限判定部９は、ステップＳ２０１で取得したユーザ名に基づいてユーザ管理データベース１０に問い合わせ、ユーザ管理データベース１０からユーザアクセス権限１０１を取得する。

　ステップＳ２０４以降、閲覧権限判定部９は、ユーザが検索結果８に含まれる類似コンテンツにアクセス可能か否かを判断する処理を行う。

　ステップＳ２０５において、閲覧権限判定部９は、ステップＳ２０３で取得したユーザアクセス権限１０１に基づいて、ユーザが類似コンテンツにアクセス可能か否かを判断する。ユーザが類似コンテンツにアクセス可能である場合は、ステップＳ２０６に移行する。一方、ユーザが類似コンテンツにアクセス可能でない場合は、ステップＳ２０７に移行する。

　アクセス情報がユーザ管理データベース１０にないシステムへのアクセスが必要である場合（ステップＳ２０５で「Ｎｏ」の場合）、ステップＳ２０６において、閲覧権限判定部９は、ユーザに対してアクセス情報を入力するように要求する。そして、閲覧権限判定部９は、ユーザが入力したアクセス情報で類似コンテンツへのアクセスが可能か否かを判断する。ユーザが入力したアクセス情報で類似コンテンツへのアクセスが可能である場合は、ステップＳ２０７に移行する。一方、ユーザが入力したアクセス情報で類似コンテンツへのアクセスが可能でない場合は、ステップＳ２０８に移行する。

　ステップＳ２０７において、閲覧権限判定部９は、ユーザが入力したアクセス情報をユーザアクセス権限としてユーザ管理データベース１０に登録する。

　ステップＳ２０８において、閲覧権限判定部９は、ユーザがアクセスできない類似コンテンツを閲覧不能コンテンツとして閲覧不能リストに登録する。

　ステップＳ２０９において、閲覧権限判定部９は、ユーザがアクセス可能か否かを判断すべき類似コンテンツがあるか否かを判断する。ユーザがアクセス可能か否かを判断すべき類似コンテンツがある場合は、ステップＳ２０５に戻る。一方、ユーザがアクセス可能か否かを判断すべき類似コンテンツがない場合は、ステップＳ２１０に移行する。

　ステップＳ２１０において、閲覧権限判定部９は、ユーザが類似コンテンツにアクセス可能か否かの判断を終了する。

　＜ユーザ管理データベース１０の構成＞
　図７は、ユーザ管理データベース１０の構成の一例を示す図である。

　ユーザ管理データベース１０は、ユーザアクセス権限１０１に関する情報を管理している。ユーザアクセス権限１０１は、ユーザ名１００に紐づけられており、ファイルシステムアクセス情報１０２、プロジェクト管理ツールアクセス情報１０３、およびＷｉｋｉツールアクセス情報１０４を含む。

　ファイルシステムアクセス情報１０２は、ファイルシステムへのアクセス情報である。プロジェクト管理ツールアクセス情報１０３は、プロジェクト管理ツールへのアクセス情報である。Ｗｉｋｉツールアクセス情報１０４は、Ｗｉｋｉツールへのアクセス情報である。

　また、ユーザ管理データベース１０は、図６のステップＳ２０７においてユーザが入力したアクセス情報を蓄積する。

　なお、図７では、ユーザアクセス権限１０１がファイルシステムアクセス情報１０２、プロジェクト管理ツールアクセス情報１０３、およびＷｉｋｉツールアクセス情報１０４を含む場合を示しているが、設計資産４のコンテンツへのアクセス情報であれば、これら以外の情報を含んでもよい。

　＜スニペット生成部１１１の動作＞
　図８は、スニペット生成部１１１の動作の一例を示すフローチャートである。

　ステップＳ３０１において、スニペット生成部１１１は、検索結果８を取得する。

　ステップＳ３０２以降、スニペット生成部１１１は、類似コンテンツからスニペットを生成する処理を行う。

　ステップＳ３０３において、スニペット生成部１１１は、検索クエリ１２のタグ１３と一致するキーワードが類似コンテンツ内にあるか否かを判断する。タグ１３と一致するキーワードが類似コンテンツ内にある場合は、ステップＳ３０４に移行する。一方、タグ１３と一致するキーワードが類似コンテンツ内にない場合は、ステップＳ３０６に移行する。

　ステップＳ３０４において、スニペット生成部１１１は、類似コンテンツにおいてタグ１３と一致するキーワードの出現箇所を特定する。

　ステップＳ３０５において、スニペット生成部１１１は、キーワードを含む文章をスニペットとして生成し、生成したスニペットを類似コンテンツに紐づける。

　ステップＳ３０６において、スニペット生成部１１１は、類似コンテンツにおける文書の先頭部分をスニペットとして生成し、生成したスニペットを類似コンテンツに紐づける。

　ステップＳ３０７において、スニペット生成部１１１は、スニペットを生成していない類似コンテンツがあるか否かを判断する。スニペットを生成していない類似コンテンツがある場合は、ステップＳ３０３に戻る。一方、スニペットを生成していない類似コンテンツがない場合は、ステップＳ３０８に移行する。

　ステップＳ３０８において、スニペット生成部１１１は、スニペットの生成を終了する。

　上記のようにスニペットを生成することによって、コンテンツに直接アクセスすることなく、コンテンツの概要を確認することが可能となる。

　＜表示情報制御部１１２の動作＞
　図９は、表示情報制御部１１２の動作の一例を示すフローチャートである。

　ステップＳ４０１において、表示情報制御部１１２は、検索結果８を取得する。

　ステップＳ４０２において、表示情報制御部１１２は、閲覧権限判定部９から閲覧不能リストを取得する。

　ステップＳ４０３以降、表示情報制御部１１２は、表示コンテンツの制御を行う。

　ステップＳ４０４において、表示情報制御部１１２は、検索結果８に含まれる類似コンテンツが閲覧可能なコンテンツであるか否かを判断する。類似コンテンツが閲覧可能なコンテンツである場合は、ステップＳ４０５に移行する。一方、類似コンテンツが閲覧可能なコンテンツでない場合は、ステップＳ４０６に移行する。

　ステップＳ４０５において、表示情報制御部１１２は、類似コンテンツを表示する制御を行う。具体的には、表示情報制御部１１２は、類似コンテンツのスニペットを表示する制御を行う。

　ステップＳ４０６において、表示情報制御部１１２は、閲覧不能なコンテンツに対して閲覧不能表示処理を行い、表示可能なタグを選別して表示する制御を行う。ここで、表示可能なタグは、ユーザが入力した検索クエリ１２、あるいは一部のメタデータ（作成者、作成日時、更新日時、文書タイプ）とする。

　ステップＳ４０５およびステップＳ４０６において、表示情報制御部１１２は、コンテンツが作成された「経緯、設計根拠、検討過程」の候補となる情報をツリー形式で表示する制御を行う。このツリー形式で表示される情報が、探索結果１４に相当する。表示情報制御部１１２は、探索結果１４を生成する際に、閲覧可能な情報と、閲覧不能な情報とを色で分類する（後述の図１２，１３参照）。なお、ツリー形式で表示されるコンテンツ（類似コンテンツ）は、検索クエリ１２との類似度が高いものから順に１０個表示するようにしてもよい。表示するコンテンツの数は、ユーザが任意に設定してもよい。

　ステップＳ４０７において、表示情報制御部１１２は、表示すべきコンテンツがあるか否かを判断する。表示すべきコンテンツがある場合は、ステップＳ４０４に戻る。一方、表示すべきコンテンツがない場合は、ステップＳ４０８に移行する。

　ステップＳ４０８において、表示情報制御部１１２は、表示コンテンツの制御を終了する。

　＜閲覧不能コンテンツ変換部１１３の動作＞
　図１０は、閲覧不能コンテンツ変換部１１３の動作の一例を示すフローチャートである。図１１は、閲覧不能コンテンツ変換部の動作を説明するための図である。なお、図１１では、図１０において対応する処理（Ｓ５０１～Ｓ５０４）を併記している。

　ステップＳ５０１において、閲覧不能コンテンツ変換部１１３は、閲覧不能コンテンツの原文を取得する。閲覧不能コンテンツは、図９のステップＳ４０４で閲覧不能と判断されたコンテンツに相当する。

　ステップＳ５０２において、閲覧不能コンテンツ変換部１１３は、閲覧不能コンテンツから文章の構造を抽出する。具体的には、閲覧不能コンテンツ変換部１１３は、閲覧不能コンテンツの原文に対して形態素解析を行い、名詞以外を抜き出すことによって文章の構造を抽出する。

　ステップＳ５０３において、閲覧不能コンテンツ変換部１１３は、閲覧不能コンテンツの原文に含まれる名詞との類似度が高い名詞を、閲覧可能な類似コンテンツから抽出する。ここでの類似度は、例えば、単語の出現頻度およびＴＦ－ＩＤＦ（Term Frequency-Inverse Document Frequency）法によって単語の重みから計算する方法、あるいはＷｏｒｄ２ｖｅｃによって単語の分散表現を獲得して算出する方法がある。

　ステップＳ５０４において、閲覧不能コンテンツ変換部１１３は、閲覧不能コンテンツに含まれる名詞を、抽出した類似度が高い名詞に置き換えて、文章を再構成する。

　＜ユーザインタフェース部２の表示例＞
　図１２，１３は、探索結果１４をユーザインタフェース部２に表示する一例を示す図である。

　ユーザが検索クエリ１２を入力すると、ユーザインタフェース部２には図１２，１３に示すような探索結果１４（図１２，１３中の「探索ＵＩ」）を表示する。

　図１２に示すように、ユーザインタフェース部２には、検索クエリと、当該検索クエリから抽出したタグとが表示されている。ユーザがタグを選択すると、選択したタグで設計資産４のコンテンツがフィルタリングされ、検索対象となるコンテンツを絞り込んだ上で類似度が計算される。そして、検索クエリの「経緯、検討過程、設計根拠」の候補である類似コンテンツが、類似度が高い順に図中の右側にツリー形式で表示される。表示されたツリー形式のコンテンツのリストはリンクリストとなっており、ユーザがコンテンツを選択すると、選択したコンテンツが保存されているシステムにアクセスすることができる（図１３参照）。

　ユーザアクセス権限に応じて、閲覧不能コンテンツは例えば赤で表示され、閲覧可能な情報のみがユーザに開示される。閲覧可能コンテンツは、スニペットとともに類似度、およびコンテンツにアクセスするためのリンクが表示される。閲覧不能コンテンツに関しては、アクセス可能な類似文書が図中の右側に表示される。

　ユーザが閲覧不能コンテンツ自体の内容を把握することを希望する場合は、閲覧不能コンテンツを閲覧可能コンテンツに変換することによって、開示範囲の制限という組織上、契約上、および法律上の要請を遵守しながら内容を理解することができる。

　＜ハードウェア構成＞
　図１に示す情報処理装置１におけるユーザインタフェース部２、タグ抽出部３、類似コンテンツ探索部６、類似度算出部７、閲覧権限判定部９、および探索結果生成部１１の各機能は、処理回路により実現される。すなわち、情報処理装置１は、ユーザの入力を受け付けた検索クエリ１２を取得し、探索結果１４を表示し、検索クエリ１２からタグ１３（検索クエリタグ）を抽出し、設計資産４に蓄積されているコンテンツからタグ（コンテンツタグ）を抽出し、タグ１３を用いたフィルタリングによって類似コンテンツを探索し、類似コンテンツの文書と検索クエリ１２との類似度を算出し、ユーザアクセス権限に従って検索結果８をユーザが閲覧可能か否かを判定し、探索結果の表示情報を生成するための処理回路を備える。処理回路は、専用のハードウェアであっても、メモリに格納されるプログラムを実行するプロセッサ（ＣＰＵ（Central Processing Unit）、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、ＤＳＰ（Digital Signal Processor）ともいう）であってもよい。

　処理回路が専用のハードウェアである場合、図１４に示すように、処理回路２０は、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ＡＳＩＣ（Application Specific Integrated Circuit）、ＦＰＧＡ（Field Programmable Gate Array）、またはこれらを組み合わせたものが該当する。ユーザインタフェース部２、タグ抽出部３、類似コンテンツ探索部６、類似度算出部７、閲覧権限判定部９、および探索結果生成部１１の各機能を処理回路２０で実現してもよく、各機能をまとめて処理回路２０で実現してもよい。

　処理回路２０が図１５に示すプロセッサ２１である場合、ユーザインタフェース部２、タグ抽出部３、類似コンテンツ探索部６、類似度算出部７、閲覧権限判定部９、および探索結果生成部１１の各機能は、ソフトウェア、ファームウェア、またはソフトウェアとファームウェアとの組み合わせにより実現される。ソフトウェアまたはファームウェアは、プログラムとして記述され、メモリ２２に格納される。プロセッサ２１は、メモリ２２に記録されたプログラムを読み出して実行することにより、各機能を実現する。すなわち、情報処理装置１は、ユーザの入力を受け付けた検索クエリ１２を取得するステップ、探索結果１４を表示するステップ、検索クエリ１２からタグ１３（検索クエリタグ）を抽出するステップ、設計資産４に蓄積されているコンテンツからタグ（コンテンツタグ）を抽出するステップ、タグ１３を用いたフィルタリングによって類似コンテンツを探索するステップ、類似コンテンツの文書と検索クエリ１２との類似度を算出するステップ、ユーザアクセス権限に従って検索結果８をユーザが閲覧可能か否かを判定するステップ、探索結果の表示情報を生成するステップが結果的に実行されることになるプログラムを格納するためのメモリ２２を備える。また、これらのプログラムは、ユーザインタフェース部２、タグ抽出部３、類似コンテンツ探索部６、類似度算出部７、閲覧権限判定部９、および探索結果生成部１１の手順または方法をコンピュータに実行させるものであるともいえる。ここで、メモリとは、例えば、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、フラッシュメモリ、ＥＰＲＯＭ（Erasable Programmable Read Only Memory）、ＥＥＰＲＯＭ（Electrically Erasable Programmable Read Only Memory）等の不揮発性または揮発性の半導体メモリ、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ＤＶＤ（Digital Versatile Disc）等、または、今後使用されるあらゆる記憶媒体であってもよい。

　なお、ユーザインタフェース部２、タグ抽出部３、類似コンテンツ探索部６、類似度算出部７、閲覧権限判定部９、および探索結果生成部１１の各機能について、一部を専用のハードウェアで実現し、一部をソフトウェアまたはファームウェアで実現するようにしてもよい。

　このように、処理回路は、ハードウェア、ソフトウェア、ファームウェア、またはこれらの組み合わせによって、上述の各機能を実現することができる。

　なお、本開示の範囲内において、実施の形態を適宜、変形、省略したりすることが可能である。

　本開示は詳細に説明されたが、上記した説明は、すべての態様において、例示であって、限定的なものではない。例示されていない無数の変形例が想定され得るものと解される。

　１　情報処理装置、２　ユーザインタフェース部、３　タグ抽出部、４　設計資産、５　コンテンツタグデータベース、６　類似コンテンツ探索部、７　類似度算出部、８　検索結果、９　閲覧権限判定部、１０　ユーザ管理データベース、１１　探索結果生成部、１２　検索クエリ、１３　タグ、１４　探索結果、２０　処理回路、２１　プロセッサ、２２　メモリ、４１　ファイルサーバ、４２　プロフェクト管理ツール、４３　Ｗｉｋｉツール、５１　コンテンツ、５２　タグ、５３　コンテンツ名、５４　コンテンツ格納場所、５５　キーワード、５６　メタデータ、６１　タグベースフィルタリング、１００　ユーザ名、１０１　ユーザアクセス権限、１０２　ファイルシステムアクセス情報、１０３　プロジェクト管理ツールアクセス情報、１０４　Ｗｉｋｉツールアクセス情報、１１１　スニペット生成部、１１２　表示情報制御部、１１３　閲覧不能コンテンツ変換部、１２１　自然言語、１２２　検索元コンテンツ、１２３　検索文、１２４　メタデータ、１２５　ハッシュタグ、１２６　検索箇所、１２７　メタデータ。

Claims

　ユーザが入力した検索クエリからキーワードを検索クエリタグとして抽出するタグ抽出部と、
　設計資産に含まれるコンテンツから抽出されて当該コンテンツと紐づけられたタグであるコンテンツタグを管理するコンテンツタグデータベースと、
　前記タグ抽出部が抽出した前記検索クエリタグと、前記コンテンツタグデータベースで管理されている前記コンテンツタグとに基づく前記コンテンツを類似コンテンツとして探索する類似コンテンツ探索部と、
　前記検索クエリと、前記類似コンテンツ探索部が探索した前記類似コンテンツとの類似度を算出する類似度算出部と、
　前記ユーザが前記コンテンツにアクセス可能であることを示すユーザアクセス権限に基づいて、前記類似コンテンツ探索部が探索した前記類似コンテンツを前記ユーザが閲覧可能か否かを判定する閲覧権限判定部と、
　前記類似コンテンツ探索部が探索した前記類似コンテンツと、前記類似度算出部が算出した前記類似度と、前記閲覧権限判定部による判定結果とに基づいて、前記ユーザが入力した前記検索クエリに対する探索結果を生成する探索結果生成部と、
を備える、情報処理装置。
　前記検索クエリは、前記ユーザが任意に入力する自然言語と、前記ユーザが提示した検索の元となるコンテンツである検索元コンテンツとを含む、請求項１に記載の情報処理装置。
　前記検索元コンテンツは、当該検索元コンテンツにおける章、節、および文を含む、請求項２に記載の情報処理装置。
　前記類似コンテンツ探索部は、前記検索クエリタグと一致する前記コンテンツタグに紐づけられた前記コンテンツを前記類似コンテンツとして探索する、請求項１から３のいずれか１項に記載の情報処理装置。
　前記探索結果生成部は、
　前記閲覧権限判定部が閲覧可能と判定した前記類似コンテンツのスニペットを生成するスニペット生成部と、
　前記閲覧権限判定部が閲覧不能と判定した前記類似コンテンツについて、当該類似コンテンツに関連する閲覧可能な情報を表示する制御を行う表示情報制御部と、
　前記閲覧権限判定部が閲覧不能と判定した前記類似コンテンツを、前記閲覧権限判定部が閲覧可能と判定した前記類似コンテンツに含まれる単語を用いて閲覧可能なコンテンツに変換する閲覧不能コンテンツ変換部と、
を含む、請求項１から４のいずれか１項に記載の情報処理装置。
　前記類似コンテンツ探索部は、前記ユーザが前記検索クエリを入力するよりも前に作成された前記コンテンツを前記類似コンテンツとして探索し、
　前記探索結果生成部は、前記類似度算出部が算出した前記類似度が高い順に前記類似コンテンツを表示する、請求項１から５のいずれか１項に記載の情報処理装置。
　前記類似コンテンツ探索部は、前記コンテンツが設計された時点または前記コンテンツについて検討された時点以後に設計または検討された前記コンテンツを探索の対象とする、請求項１から６のいずれか１項に記載の情報処理装置。