JP2015032203A - ナレッジ体系作成装置、ナレッジ体系作成方法及びナレッジ体系作成プログラム - Google Patents

ナレッジ体系作成装置、ナレッジ体系作成方法及びナレッジ体系作成プログラム Download PDF

Info

Publication number
JP2015032203A
JP2015032203A JP2013162454A JP2013162454A JP2015032203A JP 2015032203 A JP2015032203 A JP 2015032203A JP 2013162454 A JP2013162454 A JP 2013162454A JP 2013162454 A JP2013162454 A JP 2013162454A JP 2015032203 A JP2015032203 A JP 2015032203A
Authority
JP
Japan
Prior art keywords
business
knowledge system
name
information
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013162454A
Other languages
English (en)
Inventor
健吾 沖津
Kengo Okitsu
健吾 沖津
哲雄 日高
Tetsuo Hidaka
哲雄 日高
隆彦 村山
Takahiko Murayama
隆彦 村山
淳一 赤埴
Junichi Akahani
淳一 赤埴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013162454A priority Critical patent/JP2015032203A/ja
Publication of JP2015032203A publication Critical patent/JP2015032203A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】業務の専門家でなくてもノウハウ体系を容易に生成すること。【解決手段】ナレッジ体系作成装置は、第1の記憶部と、第2の記憶部と、第1の抽出部と、第2の抽出部と、体系化部とを有する。第1の抽出部は、第1の記憶部によって記憶された作業名及びカテゴリ名の少なくとも一方を含んだ業務に関する情報を、各業務に関連したファイルに対するアクセス履歴と第2の記憶部によって記憶された業務に関する情報とから抽出する。第2の抽出部は、抽出された業務に関する情報のうち、カテゴリ名を含んだ業務に関する情報を取得して単語を抽出する。体系化部は、単語のうち、カテゴリ名との関係性を示す特徴量が第1の閾値を超える単語を特定し、階層構造において最上位に配置されたカテゴリ名の下位階層に特定した単語を配置し、第2の抽出部によって取得された業務に関する情報を特定した単語の下位階層に配置したナレッジ体系を生成する。【選択図】 図3

Description

本発明は、ナレッジ体系作成装置、ナレッジ体系作成方法及びナレッジ体系作成プログラムに関する。
企業内には、業務のノウハウ(Know-How)やノウフウ(Know-Who)といったナレッジが、過去の業務によって蓄積されている。このナレッジを活用することで、従業者は、生産性を高めることが可能となる。ここで、ナレッジは、ファイルやメール等の企業内情報として蓄積されているが、これらの企業内情報は、ナレッジを活用しやすい状態に整理されていない場合がある。また、これらの企業内情報は、整理に手間がかかることや直接的に業務上の成果にならないこと等を理由に、積極的に整理されづらい。
このようなことから、企業内情報からナレッジを自動的に抽出し、従業者がナレッジを活用しやすい状態に整理する技術が存在する。この技術では、例えば、業務の名称とプロダクト名についてのタクソノミと呼ばれる分類体系上に、企業内情報から自動抽出したナレッジを展開する。これにより、従業者は、業務のノウハウ(Know-How)やノウフウ(Know-Who)といったナレッジを活用することが可能となる。
特開2010−108091号公報
間所峻洋、中辻真、岡本賢一郎、宮崎純生、原田剛著、「タクソノミを活用したメールに潜むKnow−How,Know−Who可視化技術」、人工知能学会研究会資料、SIG−SWO−A802−04
しかしながら、上記の従来技術では、業務の専門家でなければナレッジ体系を生成することができないという問題がある。
具体的には、企業内情報から自動抽出したナレッジを展開する処理の前に、業務についての専門家が、業務の名称とプロダクト名についてのタクソノミと業務上使用する頻度の高い重要なキーワードリストを準備する。また、このようなタクソノミやキーワードのリストは時間と共に変化する可能性があり、その度に専門家がメンテナンスする必要がある。このような作業は専門家にとって負担になる。
更に、作成日時や作成者の情報の抽出ができないといった理由から、ナレッジの抽出対象はメールに限定されており、ファイルサーバ上の情報は対象とできていない。
開示の技術は、上述に鑑みてなされたものであって、業務の専門家でなくてもナレッジ体系を容易に生成することを目的とする。
本願の開示するナレッジ体系作成装置は、第1の記憶部と、第2の記憶部と、第1の抽出部と、第2の抽出部と、体系化部とを有する。第1の記憶部は、業務が属するカテゴリ名と、業務の際に行う一般的な作業名とを記憶する。第2の記憶部は、複数のユーザからアクセス可能な業務に関する情報を記憶する。第1の抽出部は、第1の記憶部によって記憶された作業名及びカテゴリ名の少なくとも一方を含んだ業務に関する情報を、各業務に関連したファイルに対するアクセス履歴と第2の記憶部によって記憶された業務に関する情報とから抽出する。第2の抽出部は、第1の抽出部によって抽出された業務に関する情報のうち、カテゴリ名を含んだ業務に関する情報を取得し、取得した業務に関する情報から単語を抽出する。体系化部は、第2の抽出部によって抽出された単語のうち、カテゴリ名との関係性を示す特徴量が第1の閾値を超える単語を特定し、階層構造において最上位に配置されたカテゴリ名の下位階層に特定した単語を配置し、第2の抽出部によって取得された業務に関する情報を特定した単語の下位階層に配置したナレッジ体系を生成する。
開示するナレッジ体系作成装置、ナレッジ体系作成方法及びナレッジ体系作成プログラムの一つの態様によれば、業務の専門家でなくてもナレッジ体系を容易に生成することができるという効果を奏する。
図1は、第1の実施形態に係るナレッジ体系作成装置による処理の概要を説明するための図である。 図2は、第1の実施形態に係るナレッジ体系作成装置による処理の概要を説明するための図である。 図3は、第1の実施形態に係るナレッジ体系作成装置の構成を示すブロック図である。 図4は、コラボレーションシステムに含まれる企業内情報の一例を示す図である。 図5は、アクセス履歴DBが記憶するデータ構造の一例を示す図である。 図6は、メタデータDBが記憶するデータ構造の一例を示す図である。 図7は、業務抽出部の処理動作を説明するための図である。 図8は、カテゴリ抽出部による処理動作を説明するための図である。 図9は、体系化部による処理動作を説明するための図である。 図10は、第1の実施形態に係るナレッジ体系作成装置によって作成されたナレッジ体系の一例を示す図である。 図11は、第1の実施形態に係るナレッジ体系作成装置による処理手順を示すフローチャートである。 図12は、第1の実施形態に係るナレッジ体系作成装置により得られる効果を説明するための図である。 図13は、業務用語辞書を用いない単語の抽出処理と、業務用語辞書を用いた単語の抽出処理との違いを説明するための図である。 図14は、ナレッジ体系作成装置と同様の機能を有するプログラムを実行するコンピュータの一例を示す図である。
以下に、開示するナレッジ体系作成装置、ナレッジ体系作成方法及びナレッジ体系作成プログラムの実施形態について、図面に基づいて詳細に説明する。なお、本実施形態により開示する発明が限定されるものではない。
(第1の実施形態)
まず、図1及び図2を用いて、ナレッジ体系作成装置10による処理の概要を説明する。図1及び図2は、第1の実施形態に係るナレッジ体系作成装置10による処理の概要を説明するための図である。図1に示す例では、企業内の従業者が、現在ソフトウェア開発の外部仕様設計を行っており、過去の業務によって企業内に蓄積された企業内情報を活用して、効率よく仕事を進めることを所望する場合を説明する。
図1に示すように、ナレッジ体系作成装置10は、ファイルサーバ、メール及びスケジューラなどに蓄積された企業内情報からナレッジを抽出する。そして、ナレッジ体系作成装置10は、抽出したナレッジからノウハウやノウフウを取得しやすいように、ナレッジ体系を作成する。
図2では、ナレッジ体系作成装置10が作成するナレッジ体系の一例を説明する。図2に示すナレッジ体系では、階層構造の最上位に「業務の大カテゴリ名」が配置される。そして、「業務の大カテゴリ名」の下位階層に「実際に企業内で行われた業務の中カテゴリ名」が配置され、「実際に企業内で行われた業務の中カテゴリ名」の下位階層に「実際に企業内で行われた業務」、「期間・関係者」及び「関連情報」が配置される。なお、ここで言う「実際に企業内で行われた業務」とは、実際に企業で実施された業務名を示す。また、ここで言う「実際に企業内で行われた業務の中カテゴリ名」とは、各業務名に対し、共通する上位の概念ごとに分類した業務のカテゴリ名を示す。また、ここで言う「業務の大カテゴリ名」とは、「実際に企業内で行われた業務の中カテゴリ名」に対し、さらに上位の共通する概念で分類した業務の大カテゴリ名を示す。また、ここで言う「期間・関係者」とは、業務の期間及び業務の関係者を示す。なお、「期間・関係者」のことを「基本情報」とも言う。また、ここで言う「関連情報」とは、業務に関連した情報を記録したファイルを示す。
図2に例示するナレッジ体系では、「業務の大カテゴリ名」として「ソフトウェア開発」が配置される。そして、この「ソフトウェア開発」の下位階層に「実際に企業内で行われた業務の中カテゴリ名」として「Aソフトウェア開発」と「Bソフトウェア開発」とが配置される。また、ナレッジ体系では、「実際に企業内で行われた業務の中カテゴリ名」の下位階層に、「実際に企業内で行われた業務」が配置される。図2に示す例では、「Aソフトウェア開発」の下位階層に「Aソフトウェア開発UI打合せ」と「外部仕様設計会議」とが配置され、「Bソフトウェア開発」の下位階層に「Bソフトウェア仕様設計の議論」と「基本仕様設計議論」とが配置される。
この「実際に企業内で行われた業務」には、業務の名称に対して、基本情報や関連情報が対応付けられる。このため、従業者(ユーザ)は、例えば、業務の大カテゴリ名から過去に行われた業務を特定し、この業務に対応付けられた関連情報を参照することで、過去に行われた業務で用いられたファイルなどのノウハウを活用することが可能となる。また、特定した業務に対応付けられている基本情報を参照することで、過去に行われた業務の参加者を特定することが可能となる。これにより、ユーザは、特定した参加者から過去に行われた業務に関する情報を得られるようになり、ノウフウを活用することができる。
ここで、ナレッジ体系作成装置10は、「業務の大カテゴリ名」と、「業務の際に行う一般的な作業名」とが事前に登録されている場合、メールやファイルサーバなどの企業内情報を用いて、図2に示すナレッジ体系を作成する。ここで、「業務の大カテゴリ名」と、「業務の際に行う一般的な作業名」とは、業務の専門家ではなくても容易に作成可能なものである。すなわち、ナレッジ体系作成装置10は、業務についての専門家がいなくても、ナレッジの保守者が継続的にタクソノミ及び業務上使用する頻度の高い重要なキーワードリストをメンテナンスできるように、業務についての体系を自動生成する。また、ナレッジ体系作成装置10は、自動生成した体系にファイルサーバの情報を含めた企業内情報と、人に関する情報を関連付ける。
次に、図3を用いて、第1の実施形態に係るナレッジ体系作成装置10について説明する。図3は、第1の実施形態に係るナレッジ体系作成装置10の構成を示すブロック図である。図3に示すように、このナレッジ体系作成装置10は、業務抽出部21と、カテゴリ抽出部22と、体系化部23とを有する。また、ナレッジ体系作成装置10は、図示しないネットワーク等を介してコラボレーションシステム11と、業務用語辞書12と、アクセス履歴DB(Date Base)13と、メタデータDB19とに接続される。
コラボレーションシステム11は、ネットワーク上での共同作業を支援するシステムであり、ファイルやメール等の企業内情報を記憶する。このコラボレーションシステム11では、企業内情報に対して複数のユーザがアクセス可能である。また、コラボレーションシステム11が記憶する企業内情報には、業務の名称、業務の期間、業務の関係者、及び業務に関連したファイルが含まれている。
図4を用いて、コラボレーションシステム11に含まれる企業内情報について説明する。図4は、コラボレーションシステム11に含まれる企業内情報の一例を示す図である。図4に示すように、例えば、コラボレーションシステム11は、ファイルサーバ11aと、メール11bと、スケジューラ11cとを有する。
ここで、ファイルサーバ11aとは、例えば、業務に関係するユーザが自由にアクセスできる文書、マルチメディアなどの様々なファイルを記憶するシステムに該当する。例えば、ファイルサーバ11aでは、フォルダの下位階層にファイルが格納される。また、メール11bとは、業務メーリングリストに対して送信されたメールのアーカイブに該当する。また、スケジューラ11cとは、例えば、ユーザの予定や、予定に関係する関係者などに関するスケジュール情報を記憶するシステムに該当する。なお、コラボレーションシステム11には、例えば、ある企業内において、技術報告資料などをまとめたサイトや掲示板、ブログに該当する企業内Webサイトが含まれてもよい。
業務用語辞書12は、「業務の大カテゴリ名」と、「業務の際に行う一般的な作業名」とを記憶する。例えば、業務用語辞書12は、「業務の大カテゴリ名」として「ソフトウェア開発」などの単語を記憶する。また、例えば、業務用語辞書12は、「業務の際に行う一般的な作業名」として「議論」、「会議」及び「打合せ」などの単語を記憶する。なお、ここで言う「業務の際に行う一般的な作業名」とは、各業務で必須のサブ業務を示す。
アクセス履歴DB13は、従業者などのユーザによるファイルに対するアクセスの履歴に関する情報(例えば、アクセス日時、ユーザのIPアドレスなどを含む)を記憶する。ここで、アクセスとは、ユーザが様々なファイルに対して行う基本的な操作のことをいい、例えば、作成、閲覧、編集などの操作のことをいう。また、アクセス履歴DB13は、コラボレーションシステム11の中でユーザからのアクセス履歴が取得可能なファイルサーバ11a、メール11b、及びスケジューラ11cと、企業内ユーザのID、名前、IPアドレスの関係を保持する情報とに基づいて構築される。
ここで、図5を用いて、アクセス履歴DB13が記憶するデータ構造について説明する。図5は、アクセス履歴DB13が記憶するデータ構造の一例を示す図である。図5に示すように、アクセス履歴DB13は、「アクセスID」と、「ファイルタイトル」と、「ファイルへのURI」と、「アクセス者ID」と、「アクセス日時」とを対応付けた情報を記憶する。
ここで、アクセス履歴DB13が記憶する「アクセスID」は、アクセスを一意に識別する情報を示す。例えば、「アクセスID」には、「#1」、「#2」などが格納される。また、アクセス履歴DB13が記憶する「ファイルタイトル」は、ファイルのタイトルを示す。例えば、「ファイルタイトル」には、「UI打合せ.doc」、「説明用ファイル.ppt」などが格納される。
また、アクセス履歴DB13が記憶する「ファイルへのURI」は、ファイルにアクセスするためのURIを示す。例えば、「ファイルへのURI」には、「//server1/project2/UI打合せ.doc」、「//server1/project1/説明用ファイル.ppt」などが格納される。また、アクセス履歴DB13が記憶する「アクセス者ID」は、アクセス者のIDを示す。例えば、「アクセス者ID」には、「101」、「102」などが格納される。
また、アクセス履歴DB13が記憶する「アクセス日時」は、アクセスされた日時を示す。例えば、「アクセス日時」には、「2013/7/2 13:56:21」、「2013/7/2 13:58:30」などが格納される。
メタデータDB19は、業務に関する情報を記憶する。ここで、業務に関する情報は、業務の名称に対して、当該業務の関係者、当該業務の期間及び当該業務に関連したファイルの少なくともいずれか一つが対応付けられた情報である。すなわち、メタデータDB19は、「業務名称」と、「業務に関連する情報」とを対応付けた情報をメタデータとして記憶する。
図6の例を用いて、メタデータDB19が記憶するデータ構造について説明する。図6は、メタデータDB19が記憶するデータ構造の一例を示す図である。図6に示すように、メタデータDB19は、「業務ID」と、「業務名称」と、「ファイル名」と、「ファイルパス」と、「期間」と、「関係者ID」と、「関連ファイルURI」とを対応付けた情報を記憶する。なお、「期間」及び「関係者ID」のことを「基本情報」と呼び、「関連ファイルURI」のことを「関連情報」と呼ぶ。
ここで、メタデータDB19が記憶する「業務ID」は、業務を一意に識別する情報を示す。例えば、「業務ID」には、「#1」、「#2」などが格納される。また、メタデータDB19が記憶する「業務名称」は、業務の名称を示す。例えば、「業務名称」には、「△△△ソフトウェア開発UI打合せ」、「外部仕様設計会議」などが格納される。
また、メタデータDB19が記憶する「ファイル名」は、ファイルの名称を示す。例えば、「ファイル名」には、「UI打合せ.doc」、「説明用ファイル.ppt」などが格納される。また、メタデータDB19が記憶する「ファイルパス」は、業務と関連するフォルダ名、予定件名、メール件名及びファイルへのURIを示す。例えば、「ファイルパス」には、「・・・/○○○/△△△ソフトウェア開発/●●●/□□□/・・・」が格納される。
また、メタデータDB19が記憶する「期間」は、業務の期間を示す。例えば、「期間」には、「5/15 13:00〜5/20 15:00」などが格納される。また、メタデータDB19が記憶する「関係者ID」は、業務の関係者を識別する情報を示す。例えば、「関係者ID」には、「101、102」、「104、105、106」などが格納される。また、メタデータDB19が記憶する「関連ファイルURI」は、添付ファイルへのURIを示す。例えば、「関連ファイルURI」には、「//server1/project2/UI打合せ.doc」などが格納される。なお、メタデータDB19に記憶される情報は、後述する業務抽出部21によって生成される。
図3に戻る。業務抽出部21は、業務用語辞書12によって記憶された「業務の大カテゴリ名」及び「業務の際に行う一般的な作業名」の少なくとも一方を含んだ業務に関する情報を、アクセス履歴DB13によって記憶された各業務に関連したファイルに対するアクセス履歴とコラボレーションシステム11によって記憶された業務に関する情報とから抽出する。そして、業務抽出部21は、抽出した業務に関する情報をメタデータDB19に記憶させる。例えば、業務抽出部21は、既存の技術(特開2013−114588号公報参照)を用いて、以下の処理を実行する。
図7は、業務抽出部21の処理動作を説明するための図である。図7に示す例では、業務用語辞書12には「業務の大カテゴリ名」として「ソフトウェア開発」が記憶され、「業務の際に行う一般的な作業名」として「議論」、「会議」及び「打合せ」が記憶される。そして、業務抽出部21は、図7に示すように、「ソフトウェア開発」、「議論」、「会議」及び「打合せ」のいずれかを含んだ業務に関する情報を、コラボレーションシステム11(ファイルサーバ11aと、メール11bと、スケジューラ11c)、及びアクセス履歴DB13(アクセスログ)から、抽出する。なお、図7では、業務抽出部21が、「業務名称」が「△△△ソフトウェア開発UI打合せ」、「外部仕様設計会議」、「×××ソフトウェア仕様設計の議論」、及び「基本仕様設計議論」である業務に関する情報を抽出した場合を例示する。
具体的な業務抽出部21の処理動作について説明する。業務抽出部21は、業務に関する情報を複数のユーザがアクセス可能なコラボレーションシステム11から、該コラボレーションシステム11が記憶する各ファイルの属性を示す属性情報(例えば、ファイルの名称やURI)と各ファイルに対するアクセス履歴に関する情報(例えば、アクセスされた期間やアクセスしたユーザのユーザID)とを取得する。
例えば、業務抽出部21は、アクセス履歴DB13やコラボレーションシステム11から、業務用語辞書12に記憶された単語を含んだフォルダ名、予定件名、メール件名及びファイルへのURIなどを抽出する。そして、業務抽出部21は、抽出したフォルダ名、予定件名、メール件名を「業務名称」に格納する。また、業務抽出部21は、フォルダ、予定、メールへのURIを「ファイルパス」に格納する。
ここで、業務抽出部21は、アクセス履歴DB13の「ファイルへのURI」がファイルサーバ11aへのURIである場合には、フォルダ名をメタデータDB19の「業務名称」に格納し、上位のフォルダのURIをメタデータDB19の「ファイルパス」に格納する。また、メール11bへのURIならば、件名を「業務名称」に格納し、URIをメタデータDB19の「ファイルパス」に格納する。また、業務抽出部21は、スケジューラ11cのようなアクセス履歴DB13にアクセス履歴が残らないコラボレーションシステム11については、予定件名を「業務名称」に格納する。また、業務抽出部21は、アクセス履歴DB13のアクセス日時が存在する期間の予定を抽出し、その予定へのURIを「ファイルパス」に格納する。
次に、業務抽出部21は、メタデータDB19の「期間」、「関係者ID」および「関連ファイルURI」の項目に情報を格納する。例えば、業務抽出部21は、メタデータDB19の「ファイルパス」がファイルサーバ11aへのURIである場合には、「期間」として、直下のファイルがアクセスされた期間を格納する。なお、業務抽出部21は、「期間」として、アクセス日時の平均と標準偏差を用いてもよく、例えば、平均から±標準偏差の定数倍の範囲を期間としてもよい。また、業務抽出部21は、「関係者ID」として、フォルダ作成者、直下のファイルを作成・ペーストした者のユーザIDを追加する。また、業務抽出部21は、「関連ファイルURI」として、フォルダ直下のファイルのURIを格納する。
また、業務抽出部21は、メタデータDB19の「ファイルパス」がメール11bへのURIである場合には、「期間」として、件名が同一の最初のメールの送信日時を開始日時、件名が同一のメールに対する最終メールの受信日時を最終日時として格納し、「関係者ID」として、作成者とコメント者のユーザIDを格納する。
また、業務抽出部21は、メタデータDB19の「ファイルパス」がスケジューラ11cへのURIである場合には、「期間」として、予定の開始日時から終了日時の期間を格納し、「関係者ID」として、予定の作成者と予定への出席者のユーザIDを格納する。また、業務抽出部21は、添付ファイルがある場合には、そのファイルへのURIを「関連ファイルURI」に格納する。
カテゴリ抽出部22は、業務抽出部21によって抽出された業務に関する情報のうち、業務の大カテゴリ名を含んだ業務に関する情報を取得し、取得した業務に関する情報から単語を抽出する。
図8は、カテゴリ抽出部22による処理動作を説明するための図である。図8では、カテゴリ抽出部22が、メタデータDB19が記憶する「ファイルパス」から単語を抽出する場合について説明する。なお、カテゴリ抽出部22は、ファイルパスからではなく、業務の名称などメタデータDB19が記憶する情報から単語を抽出するようにしてもよい。
図8では、「ファイルパス」に「・・・/○○○/△△△ソフトウェア開発/●●●/□□□/・・・」が格納されている場合を例示する。図8に示すように、カテゴリ抽出部22は、「ファイルパス」に業務の大カテゴリ名である「ソフトウェア開発」が含まれる業務に関する情報を取得する。ここで、カテゴリ抽出部22は、業務の大カテゴリ名と完全一致ではなくても部分一致する業務に関する情報を取得するようにしてもよい。なお、以下では、カテゴリ抽出部22が、メタデータDB19において、「業務名称」が「△△△ソフトウェア開発UI打合せ」及び「×××ソフトウェア仕様設計の議論」である業務に関する情報を取得した場合について説明する。
続いて、カテゴリ抽出部22は、取得した業務に関する情報から単語を抽出する。例えば、カテゴリ抽出部22は、スラッシュで区切られた単位から単語を抽出する。図8に示す例では、カテゴリ抽出部22は、「単語1(○○○)」、「単語2(△△△)ソフトウェア開発」、及び「単語3(●●●)」を抽出する。なお、カテゴリ抽出部22による単語の抽出には、既存の技術が適用可能である。
また、カテゴリ抽出部22は、同様にして他の文書ファイルについて、単語を抽出する。図8に示す例では、カテゴリ抽出部22は、文書8aから「単語4」、「単語5」、及び「単語6」を抽出し、文書8bから「単語7」及び「単語8」を抽出し、文書8cから「単語9」及び「単語10」を抽出する。
体系化部23は、カテゴリ抽出部22によって抽出された単語のうち、業務の大カテゴリ名との関係性を示す特徴量が第1の閾値を超える単語を特定する。そして、体系化部23は、階層構造において最上位に配置された業務の大カテゴリ名の下位階層に特定した単語を配置し、カテゴリ抽出部22によって取得された業務に関する情報を特定した単語の下位階層に配置したナレッジ体系を生成する。
例えば、体系化部23は、カテゴリ抽出部22によって抽出された単語の特徴量を、業務の大カテゴリ名との共起頻度又は格関係に基づいて算出する。言い換えると、体系化部23は、カテゴリ抽出部22によって抽出された単語について、例えば、業務の大カテゴリ名との関係(例えば、共起関係や共起頻度など)、業務の大カテゴリ名との格関係(目的格など)に基づいて特徴量を算出する。そして、体系化部23は、算出した特徴量が設定した第1の閾値を超えた場合に、カテゴリ抽出部22によって抽出された単語を新たなカテゴリとして特定する。ここで、特定された新たなカテゴリは、「実際に企業内で行われた業務の中カテゴリ名」となる。
図9は、体系化部23による処理動作を説明するための図である。図9では、体系化部23が、業務の大カテゴリ名を含む複数の業務に関する情報について同様に調べた結果、業務に関する情報「単語2(△△△)ソフトウェア開発UI打合せ」から「単語2(△△△)ソフトウェア開発」を新たなカテゴリに特定し、業務に関する情報「単語9(×××)ソフトウェア仕様設計の議論」から「単語9(×××)ソフトウェア開発」を新たなカテゴリに特定した場合を示す。
図9に示すように、体系化部23は、閾値を超えるのに貢献した業務に関する情報を、抽出カテゴリの下位階層に配置する。例えば、体系化部23は、「単語2(△△△)ソフトウェア開発」の下位階層に、「業務名称」が「単語2(△△△)ソフトウェア開発UI打合せ」である業務に関する情報を配置し、「単語9(×××)ソフトウェア開発」の下位階層に、「業務名称」が「単語9(×××)ソフトウェア仕様設計の議論」である業務に関する情報を配置。
また、体系化部23は、カテゴリ抽出部22によって取得された業務に関する情報と、業務抽出部21によって抽出された他の業務に関する情報との類似度を算出する。そして、体系化部23は、算出した類似度が第2の閾値を超えた他の業務に関する情報を、カテゴリ抽出部22によって取得された業務に関する情報と同じ単語の下位階層に配置したナレッジ体系を生成する。言い換えると、体系化部23は、新たに抽出したカテゴリの下位階層に位置づけた業務に関する情報と、その他の業務に関する情報との類似度を算出し、閾値を超えた業務に関する情報と同一のカテゴリに分類する。ここで、体系化部23は、業務の名称の類似度、当該業務の関係者の類似度、当該業務の期間の類似度及び当該業務に関連したファイルの類似度の少なくともいずれか一つを用いて類似度を算出する。
例えば、図9に示す例では、体系化部23は、「単語2(△△△)ソフトウェア開発UI打合せ」と「外部仕様設計会議」との類似度が第2の閾値を超えたと判定し、「単語2(△△△)ソフトウェア開発」の下位階層に、「業務名称」が「外部仕様設計会議」である業務に関する情報を更に配置する。また、体系化部23は、「単語9(×××)ソフトウェア仕様設計の議論」と「基本仕様設計議論」との類似度が第2の閾値を超えたと判定し、「単語9(×××)ソフトウェア開発」の下位階層に、「業務名称」が「基本仕様設計議論」である業務に関する情報を更に配置する。
図10は、第1の実施形態に係るナレッジ体系作成装置10によって作成されたナレッジ体系の一例を示す図である。図10に示す例では、業務用語辞書12に含まれる「業務の大カテゴリ名」及び「業務の際に行う一般的な作業名」のいずれか一方を含んだ業務に関する情報として、「業務名称」が「△△△ソフトウェア開発UI打合せ」、「外部仕様設計会議」、「×××ソフトウェア仕様設計の議論」、及び「基本仕様設計議論」である業務に関する情報を、ファイルサーバ11aとアクセス履歴DB13とから自動的に抽出する。
そして、ナレッジ体系作成装置10は、「業務の大カテゴリ名」が含まれる業務に関する情報から中カテゴリ名として「△△△ソフトウェア開発」及び「×××ソフトウェア開発」を抽出する。また、ナレッジ体系作成装置10は、「業務の大カテゴリ名」を階層構造の最上位に配置する。図10に示す例では、ナレッジ体系作成装置10は、「業務の大カテゴリ名」として「ソフトウェア開発」を階層構造の最上位に配置する。そして、ナレッジ体系作成装置10は、「業務の大カテゴリ名」の下位階層に抽出した中カテゴリ名を配置する。図10に示す例では、「ソフトウェア開発」の下位階層に「△△△ソフトウェア開発」と「×××ソフトウェア開発」とを配置する。
続いて、ナレッジ体系作成装置10は、中カテゴリ名を抽出した業務に関する情報を中カテゴリ名の下位階層に配置する。すなわち、ナレッジ体系作成装置10は、図10に示す例では、「△△△ソフトウェア開発」の下位階層に、「業務名称」が「△△△ソフトウェア開発UI打合せ」である業務に関する情報を配置し、「×××ソフトウェア開発」の下位階層に、「業務名称」が「×××ソフトウェア仕様設計の議論」である業務に関する情報を配置する。
さらに、ナレッジ体系作成装置10は、下位階層に配置した業務に関する情報との類似度に基づいて、中カテゴリ名を抽出していない業務をナレッジ体系上に分類する。例えば、図10に示す例では、ナレッジ体系作成装置10は、「△△△ソフトウェア開発」の下位階層に、「業務名称」が「外部仕様設計会議」である業務に関する情報を更に配置し、「×××ソフトウェア開発」の下位階層に、「業務名称」が「基本仕様設計議論」である業務に関する情報を更に配置する。
次に、図11を用いて、第1の実施形態に係るナレッジ体系作成装置10による処理手順について説明する。図11は、第1の実施形態に係るナレッジ体系作成装置10による処理手順を示すフローチャートである。
図11に示すように、業務抽出部21は、業務用語辞書12を参照して、コラボレーションシステム11とアクセス履歴DB13とから「業務に関する情報」と「ファイルに関する情報」とを抽出し、メタデータDB19を生成する(ステップS101)。
そして、カテゴリ抽出部22は、抽出した「業務に関する情報」のうち、業務の大カテゴリ名を含むものを取得する(ステップS102)。続いて、カテゴリ抽出部22は、取得した業務に関する情報の周辺情報からキーワードを抽出する(ステップS103)。
体系化部23は、抽出したキーワードのうち、特徴量が第1の閾値を超えたキーワードを新たなカテゴリとして抽出する(ステップS104)。そして、体系化部23は、抽出した「業務に関する情報」を新たなカテゴリの下位階層に配置する(ステップS105)。続いて、体系化部23は、カテゴリの下位に配置した業務に関する情報との類似度が第2の閾値を超えた「業務に関する情報」を同一のカテゴリの下位階層に配置する(ステップS106)。
上述してきたように、ナレッジ体系作成装置10は、「業務の大カテゴリ名」と、「業務の際に行う一般的な作業名」とを記憶する。そして、ナレッジ体系作成装置10は、「業務の大カテゴリ名」及び「業務の際に行う一般的な作業名」のいずれか一方を含んだ業務に関する情報をファイルサーバ11aとアクセス履歴DB13とから抽出する。また、ナレッジ体系作成装置10は、抽出した業務に関する情報のうち、業務の大カテゴリ名を含んだ業務に関する情報を取得し、取得した業務に関する情報から単語を抽出する。そして、ナレッジ体系作成装置10は、抽出した単語のうち、カテゴリ名との関係性を示す特徴量が第1の閾値を超えるキーワードを特定し、当該キーワードの下位階層に取得した業務に関する情報を配置する。
このようにしてナレッジ体系作成装置10が、「業務の大カテゴリ名」と、「業務の際に行う一般的な作業名」とに基づいて、自動的に業務についての体系を作成し、作成した体系にファイルサーバなどの情報を含めた企業内情報と人の情報の関連付けを行う。すなわち、ナレッジ体系作成装置10は、企業内に蓄積された情報から企業内のナレッジ体系を自動的に作成する。この結果、従業者は、ナレッジを活用可能となる。
また、ナレッジ体系作成装置10では、「業務の大カテゴリ名」と、「業務の際に行う一般的な作業名」とが事前に用意されるが、これら「業務の大カテゴリ名」及び「業務の際に行う一般的な作業名」は、業務の専門家がいなくても作成できる情報である。このため、業務の専門家に負担をかけずに、ノウハウ・ノウフウを獲得が可能となる。さらに、ナレッジ体系のメンテナンス効率が向上すると共に、ナレッジ体系の更新が定期的に可能となり、ナレッジの精度も向上することができる。
ここで、図12を用いて、第1の実施形態に係るナレッジ体系作成装置10により得られる効果を説明する。図12は、第1の実施形態に係るナレッジ体系作成装置10により得られる効果を説明するための図である。なお、図12では、ナレッジ体系作成装置10により得られる効果を、従来技術と比較して説明する。図12の左図に示すように、従来の技術では、ナレッジの作成・メンテナンスに業務についての専門家が必要であった。また、メンテナンスは、専門家にとって負担となるため、継続的なメンテナンスを行うには問題があった。一方、図12の右図に示すように、ナレッジ体系装置10は、専門家でなくても用意できる業務用語辞書12を元に、自動的にナレッジ体系を作成する。このため、業務についての専門家でなくても、ノウハウ・ノウフウの獲得が可能なナレッジ体系の作成が可能となり、かつ作成したナレッジ体系のメンテナンスも容易にできる。
また、ナレッジ体系作成装置10では、業務用語辞書12として「業務の大カテゴリ名」と「業務の際に行う一般的な作業名」とが事前に用意される。この専門家の手間がかからない業務用語辞書12を用いずに単語を抽出する処理を実行した場合、図13の上図に示すように、抽出される単語群は、何についてのキーワードなのか保証するものではない。また、処理の事前又は事後に、抽出したい単語についての知識を用いて、抽出した単語群をフィルタリングする必要がある。一方、図13の下図に示すように、業務用語辞書12を用いて単語を抽出する処理を実行した場合、保守者が専門的な知識を有さなくても自動的にフィルタリング処理することが可能となる。なお、図13は、業務用語辞書12を用いない単語の抽出処理と、業務用語辞書12を用いた単語の抽出処理との違いを説明するための図である。
(第2の実施形態)
以下、本発明に係るナレッジ体系作成装置、ナレッジ体系作成方法及びナレッジ体系作成プログラムの他の実施形態として第2の実施形態を説明する。
(装置構成等)
図3に示したナレッジ体系作成装置10の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、ナレッジ体系作成装置10の分散または統合の具体的形態は図示のものに限られず、例えば、カテゴリ抽出部22と体系化部23とが機能的または物理的に統合されていてもよい。このように、ナレッジ体系作成装置10の各構成要素の全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
(プログラム)
図14は、ナレッジ体系作成装置と同様の機能を有するプログラムを実行するコンピュータの一例を示す図である。図14に例示するように、コンピュータ3000は、例えば、メモリ3010と、CPU(Central Processing Unit)3020と、ネットワークインタフェース3070とを有する。コンピュータ3000の各部はバス3100によって接続される。
メモリ3010は、図14に例示するように、ROM3011及びRAM3012を含む。ROM3011は、例えば、BIOS(Basic Input Output System)等のブートプログラムを記憶する。
ここで、図14に例示するように、ハードディスクドライブ3080は、例えば、OS3081、アプリケーションプログラム3082、プログラムモジュール3083、プログラムデータ3084を記憶する。すなわち、開示の技術に係るナレッジ体系作成プログラムは、コンピュータによって実行される指令が記述されたプログラムモジュール3083として、例えばハードディスクドライブ3080に記憶される。具体的には、上記実施例で説明した業務抽出部21、カテゴリ抽出部22、及び体系化部23と同様の情報処理を実行する手順各々が記述されたプログラムモジュールが、ハードディスクドライブ3080に記憶される。
また、上記実施形態で説明したナレッジ体系作成装置10に記憶されるデータのように、ナレッジ体系作成プログラムによる情報処理に用いられるデータは、プログラムデータ3084として、例えばハードディスクドライブ3080に記憶される。そして、CPU3020が、ハードディスクドライブ3080に記憶されたプログラムモジュール3083やプログラムデータ3084を必要に応じてRAM3012に読み出し、各種の手順を実行する。
なお、ナレッジ体系作成プログラムに係るプログラムモジュール3083やプログラムデータ3084は、ハードディスクドライブ3080に記憶される場合に限られない。例えば、プログラムモジュール3083やプログラムデータ3084は、着脱可能な記憶媒体に記憶されても良い。この場合、CPU3020は、ディスクドライブなどの着脱可能な記憶媒体を介してデータを読み出す。また、同様に、ナレッジ体系作成プログラムに係るプログラムモジュール3083やプログラムデータ3084は、ネットワーク(LAN(Local Area Network)、WAN(Wide Area Network)等)を介して接続された他のコンピュータに記憶されても良い。この場合、CPU3020は、ネットワークインタフェースを介して他のコンピュータにアクセスすることで各種データを読み出す。
10 ナレッジ体系作成装置
11 コラボレーションシステム
12 業務用語辞書
13 アクセス履歴DB
19 メタデータDB
21 業務抽出部
22 カテゴリ抽出部
23 体系化部

Claims (7)

  1. 業務が属するカテゴリ名と、業務の際に行う一般的な作業名とを記憶する第1の記憶部と、
    複数のユーザからアクセス可能な業務に関する情報を記憶する第2の記憶部と、
    前記第1の記憶部によって記憶されたカテゴリ名及び作業名の少なくとも一方を含んだ業務に関する情報を、各業務に関連したファイルに対するアクセス履歴と前記第2の記憶部によって記憶された業務に関する情報とから抽出する第1の抽出部と、
    前記第1の抽出部によって抽出された前記業務に関する情報のうち、前記カテゴリ名を含んだ業務に関する情報を取得し、取得した業務に関する情報から単語を抽出する第2の抽出部と、
    前記第2の抽出部によって抽出された単語のうち、前記カテゴリ名との関係性を示す特徴量が第1の閾値を超える単語を特定し、階層構造において最上位に配置された前記カテゴリ名の下位階層に特定した前記単語を配置し、前記第2の抽出部によって取得された業務に関する情報を特定した前記単語の下位階層に配置したナレッジ体系を生成する体系化部と、
    を有することを特徴とするナレッジ体系作成装置。
  2. 前記業務に関する情報は、業務の名称に対して、当該業務の関係者、当該業務の期間及び当該業務に関連したファイルの少なくともいずれか一つが対応付けられた情報であることを特徴とする請求項1に記載のナレッジ体系作成装置。
  3. 前記体系化部は、前記単語の前記特徴量を、前記カテゴリ名との共起頻度又は格関係に基づいて算出することを特徴とする請求項1又は2に記載のナレッジ体系作成装置。
  4. 前記体系化部は、前記第2の抽出部によって取得された前記業務に関する情報と、前記第1の抽出部によって抽出された他の前記業務に関する情報との類似度を算出し、算出した類似度が第2の閾値を超えた他の前記業務に関する情報を、前記第2の抽出部によって取得された前記業務に関する情報と同じ単語の下位階層に配置したナレッジ体系を生成することを特徴とする請求項1〜3のいずれか一つに記載のナレッジ体系作成装置。
  5. 前記体系化部は、業務の名称、当該業務の関係者、当該業務の期間及び当該業務に関連したファイルの少なくともいずれか一つを用いて類似度を算出することを特徴とする請求項4に記載のナレッジ体系作成装置。
  6. ナレッジ体系作成装置で実行されるナレッジ体系作成方法であって、
    前記ナレッジ体系作成装置は、
    業務が属するカテゴリ名と、業務の際に行う一般的な作業名とを記憶する第1の記憶部と、
    複数のユーザからアクセス可能な業務に関する情報を記憶する第2の記憶部と、
    を備え、
    前記第1の記憶部によって記憶されたカテゴリ名及び作業名の少なくとも一方を含んだ業務に関する情報を、各業務に関連したファイルに対するアクセス履歴と前記第2の記憶部によって記憶された業務に関する情報とから抽出する第1の抽出工程と、
    前記第1の抽出工程によって抽出された前記業務に関する情報のうち、前記カテゴリ名を含んだ業務に関する情報を取得し、取得した業務に関する情報から単語を抽出する第2の抽出工程と、
    前記第2の抽出工程によって抽出された単語のうち、前記カテゴリ名との関係性を示す特徴量が第1の閾値を超える単語を特定し、階層構造において最上位に配置された前記カテゴリ名の下位階層に特定した前記単語を配置し、前記第2の抽出工程によって取得された業務に関する情報を特定した前記単語の下位階層に配置したナレッジ体系を生成する体系化工程と
    を含んだことを特徴とするナレッジ体系作成方法。
  7. 第1の記憶部によって記憶された、業務が属するカテゴリ名と業務の際に行う一般的な作業名との少なくとも一方を含んだ業務に関する情報を、各業務に関連したファイルに対するアクセス履歴と、第2の記憶部によって記憶された、複数のユーザからアクセス可能な業務に関する情報とから抽出する第1の抽出ステップと、
    前記第1の抽出ステップによって抽出された前記業務に関する情報のうち、前記カテゴリ名を含んだ業務に関する情報を取得し、取得した業務に関する情報から単語を抽出する第2の抽出ステップと、
    前記第2の抽出ステップによって抽出された単語のうち、前記カテゴリ名との関係性を示す特徴量が第1の閾値を超える単語を特定し、階層構造において最上位に配置された前記カテゴリ名の下位階層に特定した前記単語を配置し、前記第2の抽出ステップによって取得された業務に関する情報を特定した前記単語の下位階層に配置したナレッジ体系を生成する体系化ステップと
    をコンピュータに実行させるためのナレッジ体系作成プログラム。
JP2013162454A 2013-08-05 2013-08-05 ナレッジ体系作成装置、ナレッジ体系作成方法及びナレッジ体系作成プログラム Pending JP2015032203A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013162454A JP2015032203A (ja) 2013-08-05 2013-08-05 ナレッジ体系作成装置、ナレッジ体系作成方法及びナレッジ体系作成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013162454A JP2015032203A (ja) 2013-08-05 2013-08-05 ナレッジ体系作成装置、ナレッジ体系作成方法及びナレッジ体系作成プログラム

Publications (1)

Publication Number Publication Date
JP2015032203A true JP2015032203A (ja) 2015-02-16

Family

ID=52517448

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013162454A Pending JP2015032203A (ja) 2013-08-05 2013-08-05 ナレッジ体系作成装置、ナレッジ体系作成方法及びナレッジ体系作成プログラム

Country Status (1)

Country Link
JP (1) JP2015032203A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017059077A (ja) * 2015-09-18 2017-03-23 ヤフー株式会社 情報提供装置、情報提供方法および情報提供プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017059077A (ja) * 2015-09-18 2017-03-23 ヤフー株式会社 情報提供装置、情報提供方法および情報提供プログラム

Similar Documents

Publication Publication Date Title
US9529864B2 (en) Data mining electronic communications
US7831676B1 (en) Method and system for handling email
McGregor et al. More to meetings: challenges in using speech-based technology to support meetings
US6182067B1 (en) Methods and systems for knowledge management
RU2343537C2 (ru) Компьютерный поиск с помощью ассоциативных связей
US6578006B1 (en) Project work management method and system
CN1946075B (zh) 确定消息的用户特定关联性得分的方法和系统
US8666934B2 (en) System and method for managing activities in project management
JP2019537081A (ja) コンテンツ管理システムにおけるプロジェクトの作成
US11886796B2 (en) Collaborative matter management and analysis
US20160203217A1 (en) Data analysis using natural language processing to obtain insights relevant to an organization
JP2020501208A (ja) コンテンツ管理システムにおけるプロジェクトの管理
US20190325064A1 (en) Contextual aggregation of communications within an applicant tracking system
JP2013143039A (ja) 頻出パターン抽出装置、頻出パターン抽出方法、及びプログラム
JP2009223833A (ja) ワークフロー管理システム
US20210350303A1 (en) Task list for tasks created at a third-party source
JP2009223832A (ja) ワークフロー管理システム
JP2007193685A (ja) 人脈情報表示プログラム、該プログラムを記録した記録媒体、人脈情報表示装置、および人脈情報表示方法
JP2015032203A (ja) ナレッジ体系作成装置、ナレッジ体系作成方法及びナレッジ体系作成プログラム
US20170140338A1 (en) Method to automatically create collaboration groups using multifactor relationship data provided by users and systems
Beseiso et al. A new architecture for email knowledge extraction
Van der Aalst et al. Emailanalyzer: an e-mail mining plug-in for the prom framework
JP2013114588A (ja) メタデータ付与装置、メタデータ付与方法およびメタデータ付与プログラム
US20160019231A1 (en) Reporting tool and method therefor
JP2008210335A (ja) 意識体系構築装置、意識体系構築方法および意識体系構築プログラム