JP2016031733A - 推論容易性算出プログラム、装置、及び方法 - Google Patents

推論容易性算出プログラム、装置、及び方法 Download PDF

Info

Publication number
JP2016031733A
JP2016031733A JP2014155160A JP2014155160A JP2016031733A JP 2016031733 A JP2016031733 A JP 2016031733A JP 2014155160 A JP2014155160 A JP 2014155160A JP 2014155160 A JP2014155160 A JP 2014155160A JP 2016031733 A JP2016031733 A JP 2016031733A
Authority
JP
Japan
Prior art keywords
task
ease
task log
log
inference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014155160A
Other languages
English (en)
Inventor
聡 宗像
Satoshi Munakata
聡 宗像
裕司 溝渕
Yuji Mizobuchi
裕司 溝渕
高山 訓治
Kuniharu Takayama
訓治 高山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2014155160A priority Critical patent/JP2016031733A/ja
Priority to US14/740,671 priority patent/US20160034706A1/en
Publication of JP2016031733A publication Critical patent/JP2016031733A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • G06F21/6254Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2365Ensuring data consistency and integrity

Abstract

【課題】ワークフローシステムにおけるタスクログでマスキングされた箇所の推論容易性を、公開情報の組み合わせを考慮して算出する。【解決手段】関連性算出部15が、ワークフローシステムにおいて遂行されたタスクの記録であるタスクログにおいてマスキングされた非公開表現が、タスクログ中の公開表現に基づいて検索される複数の公開情報から推論される容易性を示す指標を、複数の公開情報の各々に対応するタスクログ間のワークフローシステムにおける関連性を用いて算出する。【選択図】図4

Description

本発明は、推論容易性算出プログラム、推論容易性算出装置、及び推論容易性算出方法に関する。
従来、ワークフローシステムに従ってタスクを遂行することで、業務の効率化を図ることが行われている。特に、過去に遂行したタスクの記録であるタスクログを、他の利用者が検索及び参照することで、自身がタスクを遂行する際の試行錯誤の時間を削減し、業務の効率化を図ることができる。
ここで、タスクログには、外部や他部署などに公開してはいけない機密情報が含まれる場合があるため、ワークフローシステムの管理者は、タスクログを公開するか非公開とするかを設定する。ワークフローシステムの利用者にとっては、これから遂行する業務に有用なタスクログを見つけ出すために、より多くのタスクログが公開されていることが望ましい。
また、個人情報の保護、ビジネスの機密保持などの観点から、テキストデータに含まれる人名、地名、組織名などの固有名詞を伏せ字や一般語に置換するマスキング技術が提案されている。このようなマスキング技術を公開するタスクログに適用することで、機密情報を含むタスクログでも、機密情報部分をマスキングして公開することができる。この場合、マスキング処理後のタスクログの有用性と危険性との間のトレードオフを解消する必要がある。すなわち、マスキング処理後のタスクログに残る情報が多いほど、そのタスクログの有用性は高くなるが、機密情報が推論される危険性が高くなる。
従来のマスキング技術では、公開してよい固有表現をホワイトリストとして事前に定義しておき、マスキング対象の文書に含まれる固有表現のうち、ホワイトリストに含まれない固有表現をマスキングする。そして、文書に含まれる固有表現の総数に対するマスキングされていない固有表現の個数の割合で表される可読性の指標に基づいてホワイトリストを再定義することで、有用性と危険性とのトレードオフを調整している。
また、匿名化したデータから個人の識別が困難であることを示す安全性の代表的な指標として、複数の項目で同じ値の組み合わせが少なくともk個存在することを表すk−匿名性という指標が知られている。この指標を、マスキング処理した文書の危険性を表す指標として用いることが考えられる。
鵜飼孝典、片山佳則、古川淳子、「事例で進化する動的ワークフロー」、社団法人情報処理学会研究報告、2002年10月、p.77−81 伊川洋平、宅間大介、金山博、「安全語のマスキングによる機密情報マスキングシステム」、社団法人情報処理学会研究報告、2006年7月、p.421−428
しかしながら、可読性を指標としてホワイトリストを再定義する従来技術では、公開された固有表現から検索される公開情報から、マスキングされている機密情報が推論される危険性を考慮することができない、という問題がある。
また、k−匿名性では、公開された固有表現から検索される公開情報を組み合わせて機密情報が推論される危険性を指標化することができない、という問題がある。特に、ワークフローシステムでは、参照できるタスクログは業務構造等に依存するため、タスクログにおいてマスキングされた機密情報が推論される危険性を表す指標として、k−匿名性は不十分である。
本発明は、一つの側面として、ワークフローシステムにおけるタスクログでマスキングされた箇所の推論容易性を、公開情報の組み合わせを考慮して算出することを目的とする。
一つの態様として、ワークフローシステムにおいて遂行されたタスクの記録であるタスクログにおいてマスキングされた非公開表現が前記タスクログ中の公開表現に基づいて検索される複数の公開情報から推論される容易性を示す指標を算出する。容易性を示す指標は、前記複数の公開情報の各々に対応するタスクログ間の前記ワークフローシステムにおける関連性を用いて算出する。
一つの側面として、ワークフローシステムにおけるタスクログでマスキングされた箇所の推論容易性を、公開情報の組み合わせを考慮して算出することができる、という効果を有する。
組織構造及び業務構造の一例を示す図である。 ワークフローシステムにおけるタスクの遂行を示す概略図である。 タスクログの一例を示す概略図である。 本実施形態に係る推論容易性算出装置の機能ブロック図である。 タスクログテーブルの一例を示す図である。 作業判断テーブルの一例を示す図である。 公開範囲テーブルの一例を示す図である。 業務構造DBの一例を示す図である。 文書テーブルの一例を示す図である。 各テーブル間の関係を示す図である。 ホワイトリストの一例を示す図である。 マスキング前後のタスクログの一例を示す図である。 マスキング後のタスクログが追加されたタスクログテーブルの一例を示す図である。 マスキング後の作業判断が追加された作業判断テーブルの一例を示す図である。 文書間及びタスクログ間の関連性を説明するための図である。 推移性の算出を説明するための図である。 特定性の算出を説明するための図である。 関連性の算出を説明するための図である。 業務構造におけるタスクログ間の関連性を説明するための図である。 表示画面の一例を示す図である。 公開範囲テーブルの一例を示す図である。 本実施形態に係る推論容易性算出装置として機能するコンピュータの概略構成を示すブロック図である。 本実施形態における推論容易性算出処理の一例を示すフローチャートである。 文書間及びタスクログ間の関連性を説明するための図である。
以下、図面を参照して開示の技術に係る実施形態の一例を詳細に説明する。本実施形態では、ワークフローシステムの管理者が、非公開のタスクログを公開するか否か、公開する場合にどの程度マスキングするかを決定する際に、対象のタスクログに対する推論容易性を算出する場合を例に説明する。
本実施形態の前提となるワークフローシステムは、例えば、図1のAに示すような組織構造、及び図1のBに示すような業務構造に応じて構築される。本実施形態における業務構造は、業務の種別を示すノード(図1中の<業務分類>)及びタスクを示すノード(図1中の<作業分類>)を、業務の種別及びタスク間の関係性に基づいて連結したツリー構造で表す。本実施形態の前提となるワークフローシステムでは、ワークフローシステムの利用者がワークフローに従ってタスクを遂行した際の記録であるタスクログが、各タスクに対応して記憶される。
また、記憶された各タスクログは、そのタスクログが示すタスクを遂行した利用者が所属する組織に対して公開されるように設定したり、組織全体に対して公開するように設定したりすることが可能である。なお、本実施形態では、タスクを遂行した利用者が所属する組織に対してのみ公開する場合を「非公開」、組織全体に対して公開する場合を「公開(全体公開)」という。例えば、図1の例では、タスクログAは、サポート部及び第1開発部に公開されており、タスクログBは、タスクを遂行した利用者が所属する組織である第1開発部のみに公開、すなわち非公開であることを表している。このように、タスクログは、組織構造及び業務構造に関連付けられている。
図2に、本実施形態の前提となるワークフローシステム200におけるタスクの遂行の様子を概略的に示す。ワークフローシステム200には、ワークフローシステム200に従って遂行される業務をモデル化した複数のワークフローモデルが、ワークフローモデルデータベース(DB)201に記憶されている。また、このワークフローモデルに従って遂行されるタスクの業務名、タスク名、指示内容等が記述されたタスク指示202が、タスク指示DB203に記憶されている。
タスクを遂行する利用者は、タスク指示DB203からタスク指示202を取得し、タスクの遂行を引き受ける。利用者は、タスクの遂行に当たって、ワークフローシステム200のタスクログDB21に蓄積された、過去に遂行されたタスクの記録であるタスクログ81から、引き受けたタスクの遂行の参考となるタスクログ81を検索する。利用者は、検索したタスクログ81、及びそのタスクログ81で参照されている文書82を参考に、自身が遂行するタスクに関する判断を行う。文書82は開示の技術の「公開情報」の一例であり、例えば、タスクの遂行により作成され、且つ公開されている文書や、タスクログ81に記述されている情報に基づいて検索されるWebサイト等を含み、文書DB23に格納されている。
利用者は、他のタスクログ81及び文書82を参考にしたタスクに関する判断の記録も含め、タスク遂行に関する作業内容をタスクログ81として記録し、タスクの依頼者へタスクを回送すると共に、タスクログ81を非公開の状態でタスクログDB21に蓄積する。
図3に、本実施形態におけるタスクログ81の一例を概略的に示す。図3に示すように、本実施形態におけるタスクログ81には、他のタスクログ81、及びそのタスクログ81で参照されている文書82を参考にして行った判断を示す情報である作業判断83が含まれる。作業判断83は、意味的に分割可能な1つの判断を1つの情報として扱う。従って、1つのタスクログ81に複数の作業判断83が含まれる場合がある。図3の例では、「作業判断」の項目の表の各行が1つの作業判断83を表しており、1つのタスクログ81に2つの作業判断83が含まれていることを表している。なお、作業判断83は、開示の技術の「参照情報」の一例である。本実施形態に係る推論容易性算出装置10は、上記のように記録及び蓄積されたタスクログ81を、推論容易性を算出する対象のタスクログ81とする。
図4に示すように、本実施形態に係る推論容易性算出装置10は、マスキング部11と、算出部12と、変更部18と、管理部19と、タスクログDB21と、業務構造DB22と、文書DB23とを含む。
タスクログDB21は、タスクログテーブル21Aと、作業判断テーブル21Bと、公開範囲テーブル21Cとを含む。
図5に、タスクログテーブル21Aの一例を示す。タスクログテーブル21Aには、上述したように、タスクを遂行した際の記録であるタスクログ81がタスク毎に記憶される。図5のタスクログテーブル21Aには、タスクの識別情報であるタスクID、遂行した作業内容、開始時刻、完了時刻、実施した作業を示す作業ID、タスクの遂行者が所属する組織の組織ID、及び変換前のタスクIDの項目が含まれる。作業IDは、後述する作業分類テーブルで定義された情報であり、組織IDは、後述する組織テーブルで定義された情報である。変換前のタスクIDは、後述するマスキング処理が行われたタスクログ81の元になったタスクログ81を示すタスクIDである。
図6に、作業判断テーブル21Bの一例を示す。作業判断テーブル21Bには、例えば図3に概略的に示したタスクログ81の作業判断83の内容が記憶される。図6の作業判断テーブル21Bには、作業判断83の識別情報である判断ID、判断の根拠、判断の結果、及び対応するタスクログ81のタスクIDの項目が含まれる。
図7に、公開範囲テーブル21Cの一例を示す。公開範囲テーブル21Cには、タスクログテーブル21Aに記憶されたタスクログ81、及び文書DB23に蓄積された文書82の各々の公開または非公開の設定情報が記憶される。図7の公開範囲テーブル21Cには、文書82またはタスクログ81の作成元の組織である公開元組織を示す組織ID、文書82の識別情報である文書ID、及びタスクIDの項目を含む。図7の例では、文書82毎に、及びタスクログ81毎に、公開元組織のみに公開(非公開)するか、組織全体に公開するかを定めている。例えばタスクID=31のタスクログ81は、組織ID=23の組織にのみ公開される設定であり、文書ID=10の文書は、組織全体に公開される設定である。
業務構造DB22は、例えば図8に示すように、組織テーブル22Aと、業務分類テーブル22Bと、作業分類テーブル22Cとを含む。
組織テーブル22Aには、例えば図1のAに示すような組織構造を定義した情報が記憶される。図8の組織テーブル22Aには、組織ID、各組織IDが示す組織の組織名、及び組織構造における各組織の親組織を示す組織IDの項目が含まれる。
業務分類テーブル22Bには、例えば図1のBに示すような業務構造における業務分類を定義した情報が記憶される。図8の業務分類テーブル22Bには、業務分類を識別する業務ID、各業務IDが示す業務分類の業務名、及び業務構造における各業務分類の親業務を示す業務IDの項目が含まれる。
作業分類テーブル22Cには、例えば図1のBに示すような業務構造における作業分類を定義した情報が記憶される。図8の作業分類テーブル22Cには、作業分類を識別する作業ID、各作業IDが示す作業分類の作業名、及び業務構造における各作業分類の親業務を示す業務IDの項目が含まれる。
文書DB23は、例えば図9に示すような文書テーブル23Aを含む。図9の文書テーブル23Aには、文書ID、各文書IDが示す文書の文書名、及び各文書の内容の項目が含まれる。また、文書テーブル23Aには、各文書を情報源として参照した作業判断83を示す判断ID、各文書を成果物として作成した作業判断83を示す判断ID、及び各文書を添付資料とするタスクログ81を示すタスクIDの項目を含む。
上述のように、タスクログ81には、作業分類テーブル22Cで定義された作業ID、及び組織テーブル22Aで定義された組織IDが含まれ、かつ公開範囲テーブル21Cで各タスクログ81の公開範囲が設定される。これらの情報により、例えば図1に示すように、業務構造及び組織構造における各タスクログ81の位置付けを把握することができる。
また、図10に、タスクログDB21、業務構造DB22、及び文書DB23の各々に記憶された各テーブル間の関係を示す。図10では、各テーブルを、< >内に示したテーブル名と、各テーブルに含まれる項目とを枠内に表記して示している。また、他のテーブルの項目と関連付けられた項目は、テーブル間を結ぶ接続線の関連先のテーブル側に表記している。「*」は、他のテーブルの項目と関連付けられた項目が「*」が表記されたテーブル側では重複可であることを示す。自テーブル内の情報を参照する項目は、各テーブルを示す枠外に表記している。「公開対象のタスクログ及び文書」は、公開範囲テーブル21C、タスクログテーブル21A、及び文書テーブル23Aの情報に基づいて、公開されるタスクログ81及び文書82が特定されることを表している。
マスキング部11は、タスクログDB21から、推論容易性を算出する対象のタスクログ81を取得し、取得したタスクログ81から固有表現を抽出する。固有表現とは、例えば、組織名、人名、地名、固有物名、日付表現、時間表現、金額表現、割合表現等の特定の個人や組織を表す語句、または特定の個人や組織を想起させる語句であり、機密情報である可能性が高い語句である。マスキング部11は、抽出した固有表現を黒く塗り潰すなどのマスキング処理を行う。
また、マスキング部11は、そのまま公開してもよい固有表現、及び公開の際に所定の変換処理を行う固有表現が予め定義された初期のホワイトリストの入力を受け付ける。図11にホワイトリストの一例を示す。図11の例では、固有表現「Tuscany」は、そのまま公開してよいことを表しており、固有表現「<数値>年前」(<数値>には具体的な数値が入る)は、「数年前」に変換した上で公開することを表している。また、固有表現「SOA」は、共起表現として定義された「OSS」と共起する場合のみ公開してよいことを表している。マスキング部11は、ホワイトリストに従って、タスクログ81に対してマスキング箇所の解除または変換を行う。マスキング部11は、マスキング後の各作業判断83に新たな判断IDを付与すると共に、マスキング後のタスクログ81に新たなタスクIDを付与する。
図12に、図11の例のホワイトリストを用いた場合における、マスキング前のタスクログ81Aと、マスキング後のタスクログ81Bの一例を示す。図12は、タスクID=31のタスクログ81Aに含まれる判断ID=41、51、52の作業判断83A、82B、83Cに対してマスキングした例である。マスキング後のタスクログ81Bには、タスクID=1500が付与され、各作業判断83D、83E、83Fには、判断ID=1501、1502、1503がそれぞれ付与されている。なお、図12の例では、タスクログ81のうち、作業判断83の「判断の根拠」のみを示している。以下の説明においても、タスクログ81の一部である「判断の根拠」のみを示して、「タスクログ81」と称する場合がある。また、個々の「判断の根拠」の記述を、それぞれ「作業判断83」と称する場合がある。また、以下では、マスキング後のタスクログ81におけるマスキングされた固有表現を「非公開表現」、マスキングされていない固有表現を「公開表現」という。
マスキング部11は、マスキング後のタスクログ81をタスクログテーブル21Aに追加すると共に、マスキング後の作業判断83を作業判断テーブル21Bに追加する。図13に、図12に示す例のマスキング後のタスクログ81Bを追加したタスクログテーブル21Aの一例を示す。図13中のAに示す行が追加されている。マスキング後のタスクログ81の「変換前(タスクID)」の項目には、対応するマスキング前のタスクログ81のタスクIDが登録される。また、図14に、図12に示す例のマスキング後の作業判断83D、83E、83Fを追加した作業判断テーブル21Bの一例を示す。図14中のAに示す行が追加されている。マスキング後の作業判断83の「タスクログ(タスクID)」の項目には、マスキング後の作業判断83を含むタスクログに付与されたタスクIDが登録される。
ここで、例えば図15に示すように、判断ID=1501で示されるマスキング後の作業判断83Dに記述された「OSS」及び「Tuscany」という公開表現から、B社及びC社の各々についての文書82A、82Bが検索されるものとする。この場合、作業判断83D内の非公開表現は、「2−匿名性」を持つ。すなわち、作業判断83D内の非公開表現は、50%の確率で特定可能である。
しかし、例えば、他の判断ID=1502の作業判断83E及び判断ID=1503の作業判断83Fの公開表現に基づいて検索される文書82C、82Dも含めた複数の文書82を考える。このうち、B社の公開文書を含む3つの文書82B、82C、82Dが、例えば「開発業務A」という業務に関するタスクログ81P、81Qで参照されている文書であるとする。この場合、これら3つの文書82B、82C、82Dを組み合わせてマスキング箇所を推論することが可能となる。図15の例では、これら3つの文書82B、82C、82Dを見比べることで、「B社が、TuscanyでSOA基盤を構築し、サービスコンポーネントをJava(登録商標)で開発すること」という内容が推論できる。
このように、マスキング後のタスクログ81における公開表現から検索される文書82が複数存在し、k−匿名性などの指標によれば、一見、非公開表現の推論が困難と思える場合でも、文書82の組み合わせが絞り込める場合がある。すなわち、k−匿名性などの指標が示す容易性より、非公開表現の推論が容易な場合がある。従って、k−匿名性などの指標に比べ、文書82の組み合わせの容易性も考慮した場合に、推論が容易であることを表現する指標が必要である。
そこで、本実施形態では、文書82の組み合わせの容易性も考慮した推論容易性を算出する。以下、推論容易性を算出する算出部12について詳述する。
図4に示すように、算出部12は、推移性算出部13と、特定性算出部14と、関連性算出部15と、推論容易性算出部16、可読性算出部17とを含む。
推移性算出部13は、ある非公開表現について、マスキング後のタスクログ81における公開表現に基づいて検索された複数の文書82のうち、ある文書82を根拠とする推論から、他の文書82を根拠とする推論へ推移する可能性を示す推移性を算出する。本実施形態では、各作業判断83に共通して含まれる非公開表現が多いほど、推移性が高い(推移し易い)とみなして推移性を算出する。
具体的には、推移性算出部13は、推論容易性を算出する対象であるマスキング後のタスクログ81をタスクログテーブル21Aから取得する。また、推移性算出部13は、取得したマスキング後のタスクログ81の「変換前(タスクID)」の項目に登録されたタスクIDにより特定される、対応するマスキング前のタスクログ81を取得する。推移性算出部13は、図16に示すように、取得したマスキング前のタスクログ81A、及びマスキング後のタスクログ81Bに基づいて、作業判断83毎に、非公開表現及び公開表現を抽出する。非公開表現は、マスキング後のタスクログ81Bにおいてマスキングされている箇所に対応するマスキング前のタスクログ81A内の固有表現を特定することにより抽出することができる。公開表現は、マスキング後のタスクログ81Bに含まれるマスキングされていない固有表現を特定することにより抽出することができる。推移性算出部13は、抽出した非公開表現に基づいて、例えば下記(1)式に示すような推移性を算出する。
(1)式は、マスキング後のタスクログ81に含まれる全作業判断83に対する各非公開表現を含む作業判断83の割合の全非公開表現についての和を表している。図16の例では、マスキング後のタスクログ81Bには、判断ID=1501、1502、1503の3つの作業判断83D、83E、83Fがあり、全部で5つ(5種類)の非公開表現を含む。そのうち、非公開表現「B社様」は2つの作業判断83D、83Eに含まれ、非公開表現「Java(登録商標)」は2つの作業判断83E、83Fに含まれる。また、非公開表現「5年前」は1つの作業判断83Dにのみ含まれ、非公開表現「情シス部」及び「10人以上」の各々は1つの作業判断83Eにのみ含まれている。従って、(1)式により推移性を算出すると、推移性=2/3+2/3+1/3+1/3+1/3=2.33となる。
特定性算出部14は、マスキング後のタスクログ81における公開表現に基づいて検索された複数の文書82のうち、非公開表現を推論可能な文書82の組み合わせを特定できる可能性を示す特定性を算出する。本実施形態では、公開表現に基づいて検索された文書のうち、非公開表現を含む文書数が多いほど特定性が高い(特定が容易)とみなして特定性を算出する。
具体的には、特定性算出部14は、図17に示すように、推移性算出部13により抽出された作業判断83毎の公開表現の情報を用いて、作業判断83毎に、文書DB23から公開表現を含む文書を抽出する。特定性算出部14は、抽出した文書に基づいて、例えば下記(2)式に示すような特定性を算出する。
図17の例では、判断ID=1501の作業判断83が公開表現を含み、その公開表現に基づいて、文書ID=10、109、23、401の4つの文書82が抽出されている。4つの文書82のうち、判断ID=1501の作業判断83に含まれる非公開表現を含む文書82として、文書ID=10、23の2つの文書が存在する。従って、(2)式により特定性を算出すると、特定性=2/4=0.50となる。
関連性算出部15は、マスキング後のタスクログ81における公開表現に基づいて検索された複数の文書82の各々の業務構造における関連性を算出する。業務が同一または関連性が高いほど、その業務に対応する文書間の関連性も高くなる。文書間の関連性が高い場合には、それらの文書82を組み合わせて非公開表現の推論に用いる可能性が高くなる。本実施形態では、文書間の関連性を、各文書が対応するタスクログ81の業務構造上の距離で表す。タスクログ81の距離が近いほど文書間の関連性が高いことを表す。
具体的には、関連性算出部15は、図18に示すように、特定性算出部14により抽出された文書82の全ての組み合わせについて、推移性算出部13で抽出された全ての非公開表現に対する両文書82に含まれる非公開表現の被覆率を計算する。例えば図16に示すように、全ての作業判断83から5つの非公開表現が抽出され、図17に示すような4つの文書82が抽出されているとする。この場合、例えば文書ID=10の文書82と文書ID=23の文書82とに含まれる非公開表現の数は4つである。従って、文書ID=10の文書82と文書ID=23の文書82との組み合わせについての非公開表現の被覆率は4/5=0.80となる。
関連性算出部15は、文書82の組み合わせ毎に計算した被覆率が予め定めた閾値以上となる文書82の組み合わせを抽出する。関連性算出部15は、抽出した文書82の組み合わせを構成する文書82の各々を組み合わせ候補文書とし、組み合わせ候補文書毎に、その文書を情報源または成果物として参照するタスクログ81のタスクIDを、タスクログDB21から抽出する。具体的に、組み合わせ候補文書の一例として、文書ID=10の文書82を参照するタスクログ81のタスクIDを抽出する場合について説明する。まず、文書テーブル23Aから文書ID=10の文書82を検索し、文書ID=10の文書82の「情報源参照(判断ID)」及び「成果物参照(判断ID)」の各々の項目に登録されている判断IDを抽出する。次に、抽出した判断IDの各々について、作業判断テーブル21Bの「タスクログ(タスクID)」の項目に登録されているタスクIDを抽出する。
関連性算出部15は、抽出した文書82の組み合わせ毎に、業務構造における、両文書82に対応するタスクログ間の最小パス長を求める。例えば図19に示すように、各作業分類は、作業分類テーブル22Cの「親業務(業務ID)」の項目に登録された業務IDが示す業務分類に紐付く。また、業務分類間の関係は、業務分類テーブル22Bの「親業務(業務ID)」の項目に登録された業務IDの業務分類との親子関係により定まる。一方、タスクログテーブル21Aにおいて、タスクID=10のタスクログ81の「実施作業(作業ID)」の項目には、作業ID=11が登録されている。すなわち、図19に示すように、タスクID=10のタスクログ81は、作業ID=11の作業分類(作業名「アーキ選定」)に紐付けられている。従って、上記のように文書IDに基づいて抽出されたタスクIDが示すタスクログ81の業務構造上の位置を特定することができる。
具体的には、関連性算出部15は、抽出した文書82の組み合わせ毎に、組み合わせ候補文書の各々について抽出されたタスクIDが示すタスクログ81の組み合わせの各々を抽出する。関連性算出部15は、抽出したタスクログ81の組み合わせ毎に、その組み合わせを構成する2つのタスクログ81の業務構造上での位置を特定する。そして、各タスクログ81から、業務構造の上位へ向かって作業分類を示すノード及び業務分類を示すノードを辿り、両タスクログ81の上位の業務構造として共通の業務構造のノードに到達するまでに辿ったノード数をパス長として求める。例えば、図19の例では、タスクID=10のタスクログ81Aと、タスクID=380のタスクログ81Bとを結ぶパスのパス長は「4」である。また、タスクID=10のタスクログ81Aと、タスクID=67のタスクログ81Cとのパス長は「6」である。関連性算出部15は、文書82の組み合わせ毎に抽出したタスクログ81の各組み合わせのパス長のうち最小のパス長を、その文書82の組み合わせの最小パス長とする。
図19に示すように、ツリー構造で業務構造を表現した場合、タスクログ81間のパス長が短いほど、業務の関連性が高いことを示す。そこで、関連性算出部15は、抽出した文書82の組み合わせ毎に求めた最小パス長を用いて、例えば、下記(3)式により関連性を算出する。
(3)式においてαは関連性の下限値を規定する定数で、例えば「0.1」等の値を予め設定しておく。(3)式に示す関連性の値は、文書82の組み合わせ毎に求めた最小パス長が短いほど、すなわち、業務の関連性が高いほど大きくなる。
推論容易性算出部16は、推移性算出部13で算出された推移性、特定性算出部14で算出された特定性、及び関連性算出部15で算出された関連性を統合して、推論容易性を算出する。例えば、推論容易性算出部16は、推移性、特定性、及び関連性の各々の値を乗算した値、重み付き和等を推論容易性の値として算出することができる。また、推論過程を仮定した確率モデルにより推論容易性を算出してもよい。
可読性算出部17は、対象のタスクログ81に含まれる固有表現の総数に対する公開表現の数を可読性として算出する。
変更部18は、対象のタスクログ81に含まれる固有表現のうち、初期のホワイトリストで非公開表現に設定されている固有表現の各々を公開表現に変更したホワイトリストの変更候補の各々を作成する。また、対象のタスクログ81に含まれる固有表現のうち、初期のホワイトリストで公開表現に設定されている固有表現の各々を取り除いたホワイトリストの変更候補の各々を作成する。変更部18は、マスキング部11に、ホワイトリストの変更候補の各々に基づいて対象のタスクログ81にマスキング処理を行うように指示する。また、変更部18は、算出部12に、ホワイトリストの変更候補の各々に基づいてマスキング処理された各パターンのタスクログ81に対する推論容易性及び可読性を算出するように指示する。
マスキング部11及び算出部12の各々は、変更部18の指示を受けて、初期のホワイトリストに基づく処理と同様に、ホワイトリストの変更候補の各々に基づいて、マスキング処理、並びに推論容易性及び可読性の算出処理を実行する。この際、マスキング部11は、ホワイトリストの変更候補に基づいてマスキング処理された各パターンのタスクログ81に、初期のホワイトリストに基づいてマスキング処理されたタスクログ81に付与されているタスクIDを対応付ける。そして、対応付けられたタスクID、及びホワイトリストのどの変更候補に基づいてマスキング処理されたどのパターンのタスクログ81かを示すパターン情報と共に、各パターンのタスクログ81を所定の記憶領域に記憶しておく。さらに、各パターンのタスクログ81について、算出部12で算出された推論容易性及び可読性も、各パターンのタスクログ81に対応付けて所定の記憶領域に記憶する。
また、変更部18は、初期のホワイトリストに基づいて、マスキング部11でマスキング処理されたタスクログ81、及びそのタスクログ81について算出部12で算出された推論容易性及び可読性を、例えばワークフローシステム200の管理者に提示する。さらに、変更部18は、ホワイトリストの変更候補の各々と、対応する各パターンのタスクログ81に対する推論容易性及び可読性の値とを、管理者により選択可能な形態で提示する。例えば、変更部18は、管理者が利用可能な表示装置に、図20に示すような表示画面105が表示されるように制御する。
図20に示す表示画面105は、変更一覧表示領域106、変更内容表示領域107、結果表示領域108、設定ボタン109、及びキャンセルボタン110を含む。変更一覧表示領域106には、初期のホワイトリスト及びホワイトリストの変更候補の各々と、対応する各パターンのタスクログ81に対する推論容易性及び可読性の値との一覧が表示される。なお、変更一覧表示領域106に表示する変更候補は、対応する各パターンのタスクログ81に対する推論容易性が予め定めた上限値以下で、かつ可読性が予め定めた下限値以上の候補に限定してもよい。管理者は、変更一覧表示領域106に表示されたホワイトリストの変更候補から、推論容易性及び可読性の値を参考にして、カーソル120をいずれかの変更候補に合わせるなどして、いずれかの変更候補を選択する。
変更内容表示領域107には、変更一覧表示領域106に表示された一覧から選択された変更候補の内容が適用された変更後のホワイトリストが表示される。表示画面105の初期状態では、初期のホワイトリストが選択された状態とすることができる。結果表示領域108には、変更内容表示領域107に表示されたホワイトリストに基づいてマスキング処理されたタスクログ81が表示される。
設定ボタン109は、結果表示領域108に表示されているタスクログ81を公開する場合に選択されるボタンである。キャンセルボタン110は、結果表示領域108に表示されているタスクログを公開しない場合に選択されるボタンである。
変更部18は、提示した表示画面105から、例えば管理者により設定ボタン109が選択された際に結果表示領域108に表示されているタスクログ81を、公開するためのマスキング処理後のタスクログ81として採用し、管理部19に通知する。変更部18は、採用したタスクログ81が初期のホワイトリストに基づくタスクログ81の場合には、管理部19にタスクIDを通知する。また、変更部18は、採用したタスクログ81がホワイトリストの変更候補に基づくいずれかのパターンのタスクログ81の場合には、タスクIDと共に、どのパターンのタスクログ81かを示すパターン情報を管理部19に通知する。
管理部19は、変更部18からタスクIDと共にパターン情報が通知された場合には、所定の記憶領域からパターン情報が示すパターンのタスクログ81を取得する。そして、管理部19は、タスクログテーブル21A及び作業判断テーブル21Bにおいて、通知されたタスクIDに対応する箇所を、取得したタスクログ81の内容で更新する。従って、採用されたタスクログ81の情報が、タスクログDB21に格納される。
また、管理部19は、公開範囲テーブル21Cに、採用されたタスクログ81を公開するための設定情報を記録する。具体的には、管理部19は、図21に示すように、公開範囲テーブル21Cに「公開」の項目を「全体公開」とした行(図21中のA)を追加し、通知されたタスクIDを「タスク公開(タスクID)」の項目に登録する。また、管理部19は、タスクログテーブル21Aから、通知されたタスクIDのタスクログ81の「遂行者(組織ID)」の項目に登録された組織IDを取得し、公開範囲テーブル21Cの「公開元組織(組織ID)」の項目に登録する。
推論容易性算出装置10は、例えば図22に示すコンピュータ40で実現することができる。コンピュータ40はCPU42、メモリ44、不揮発性の記憶部46、入出力インターフェース(I/F)47、及びネットワークI/F48を備えている。CPU42、メモリ44、記憶部46、入出力I/F47、及びネットワークI/F48は、バス49を介して互いに接続されている。
また、コンピュータ40は、入出力I/F47を介してディスプレイ等の表示装置71、及びマウスやキーボード等の入力装置72と接続されている。表示装置71には、図16に示すような表示画面105が表示され、管理者が入力装置72を操作して各種選択情報を入力する。なお、表示画面105の表示、及び選択情報の入力は、ネットワークI/F47を介してネットワークで接続されたパーソナルコンピュータ等で行ってもよい。
記憶部46はHDD(Hard Disk Drive)、SSD(solid state drive)、フラッシュメモリ等によって実現できる。記憶媒体としての記憶部46には、コンピュータ40を推論容易性算出装置10として機能させるための推論容易性算出プログラム50が記憶されている。また、記憶部46は、タスクログDB21を構成する情報が記憶されるタスクログDB記憶領域61、業務構造DB22を構成する情報が記憶される業務構造DB記憶領域62、及び文書DB23を構成する情報が記憶される文書DB記憶領域63を有する。CPU42は、推論容易性算出プログラム50を記憶部46から読み出してメモリ44に展開し、推論容易性算出プログラム50が有するプロセスを順次実行する。また、CPU42は、タスクログDB記憶領域61、業務構造DB記憶領域62、及び文書DB記憶領域63の各々に記憶された情報を読み出して、タスクログDB21、業務構造DB22、及び文書DB23の各々を構成する各テーブルとしてメモリ44に展開する。
推論容易性算出プログラム50は、マスキングプロセス51と、算出プロセス52と、変更プロセス58と、管理プロセス59とを有する。CPU42は、マスキングプロセス51を実行することで、図4に示すマスキング部11として動作する。また、CPU42は、算出プロセス52を実行することで、図4に示す算出部12として動作する。また、CPU42は、変更プロセス58を実行することで、図4に示す変更部18として動作する。また、CPU42は、管理プロセス59を実行することで、図4に示す管理部19として動作する。これにより、推論容易性算出プログラム50を実行したコンピュータ40が、推論容易性算出装置10として機能することになる。
なお、推論容易性算出装置10は、例えば半導体集積回路、より詳しくはASIC(Application Specific Integrated Circuit)等で実現することも可能である。
次に、本実施形態に係る推論容易性算出装置10の作用について説明する。推論容易性算出装置10では、図23に示す推論容易性算出処理が実行される。
図23に示す推論容易性算出処理のステップS11で、マスキング部11が、タスクログDB21から、推論容易性を算出する対象のタスクログ81を取得する。次に、ステップS12で、マスキング部11が、初期のホワイトリストを受け付ける。
次に、ステップS13で、マスキング部11が、取得したタスクログ81から固有表現を抽出し、受け付けた初期のホワイトリストに基づいて、対象のタスクログ81に対してマスキング処理を行う。マスキング部11は、マスキング後のタスクログ81に新たなタスクIDを付与して、タスクログテーブル21Aに追加する。また、マスキング部11は、マスキング後の作業判断83に新たな判断IDを付与して、作業判断テーブル21Bに追加する。
次に、ステップS14で、推移性算出部13が、マスキング前のタスクログ81、及びマスキング後のタスクログ81に基づいて、作業判断83毎に非公開表現及び公開表現を抽出する。そして、推移性算出部13は、抽出した非公開表現に基づいて、例えば(1)式に示すような推移性を算出する。
次に、ステップS15で、特定性算出部14が、上記ステップS14で抽出された作業判断83毎の公開表現の情報を用いて、作業判断83毎に、文書DB23から公開表現を含む文書82を抽出する。そして、特定性算出部14は、抽出した文書82に基づいて、例えば(2)式に示すような特定性を算出する。
次に、ステップS16で、関連性算出部15が、上記ステップS15で抽出された文書82の全ての組み合わせについて、上記ステップS14で抽出された全ての非公開表現に対する両文書82に含まれる非公開表現の被覆率を計算する。そして、関連性算出部15は、文書82の組み合わせ毎に計算した被覆率が予め定めた閾値以上となる文書82の組み合わせを抽出する。また、関連性算出部15は、抽出した文書82の組み合わせを構成する文書の各々を情報源または成果物として参照するタスクログ81のタスクIDを、タスクログDB21から抽出する。そして、関連性算出部15は、抽出した文書82の組み合わせ毎に、業務構造における、両文書82に対応するタスクログ81間の最小パス長を求め、例えば(3)式に示すような関連性を算出する。
次に、ステップS17で、推論容易性算出部16が、上記ステップS14で算出された推移性、上記ステップS15で算出された特定性、及び上記ステップS16で算出された関連性を統合して、推論容易性を算出する。次に、ステップS18で、可読性算出部17が、対象のタスクログ81に含まれる固有表現の総数に対する公開表現の数を可読性として算出する。
次に、ステップS19で、変更部18が、作成可能なホワイトリストの変更候補が存在するか否かを判定する。肯定判定の場合には、処理はステップS20へ移行し、変更部18が、対象のタスクログ81に含まれる固有表現のうち、初期のホワイトリストで非公開表現に設定されている固有表現を公開表現に変更したホワイトリストの変更候補を作成する。または、変更部18が、対象のタスクログ81に含まれる固有表現のうち、初期のホワイトリストで公開表現に設定されている固有表現を取り除いたホワイトリストの変更候補を作成する。
次に、処理はステップS13に戻って、上記ステップS20で作成されたホワイトリストの変更候補に基づいて、上記ステップS13〜S18の処理を繰り返す。この際、ステップS13では、マスキング部11は、ホワイトリストの変更候補に基づいてマスキングしたタスクログ81をタスクログテーブル21A及び作業判断テーブル21Bに追加せず、所定の記憶領域に記憶する。ホワイトリストの変更候補が全て作成済みになると、ステップS19で否定判定されて、処理はステップS21へ移行する。
ステップS21では、変更部18が、管理者が利用可能な表示装置に、例えば図20に示すような表示画面105が表示されるように制御する。変更部18は、表示画面105の変更一覧表示領域106に、初期のホワイトリスト及びホワイトリストの変更候補の各々と、対応する各パターンのタスクログ81に対する推論容易性及び可読性の値との一覧を表示する。また、変更部18は、初期のホワイトリストが選択された状態とする。また、変更部18は、変更内容表示領域107に、初期のホワイトリストを表示する。さらに、変更部18は、結果表示領域108に、初期のホワイトリストに基づいてマスキング処理されたタスクログ81を表示する。
管理者により表示画面105に応じた選択情報が入力されると、ステップS22で、変更部18が、入力された選択情報が、設定ボタン109が選択された選択情報か否かを判定する。否定判定の場合には、処理はステップS23へ移行し、変更部18が、入力された選択情報が、ホワイトリストの変更候補を選択した選択情報か否かを判定する。肯定判定の場合には、処理はステップS24へ移行し、変更部18が、選択されたホワイトリストの変更候補に基づいて、変更内容表示領域107及び結果表示領域108の表示内容を変更して、処理はステップS22に戻る。上記ステップS22で、入力された選択情報が、設定ボタン109が選択された選択情報であると判定された場合には、処理はステップS25へ移行する。
ステップS25では、変更部18が、設定ボタン109が選択された際に結果表示領域108に表示されているタスクログ81を、公開するためのマスキング処理後のタスクログ81として採用する。変更部18は、採用したタスクログ81が初期のホワイトリストに基づくタスクログ81の場合には、管理部19にタスクIDを通知する。また、変更部18は、採用したタスクログ81がホワイトリストの変更候補に基づくいずれかのパターンのタスクログ81の場合には、タスクIDと共に、どのパターンのタスクログ81かを示す情報を管理部19に通知する。そして、管理部19が、変更部18からタスクIDと共に、どのパターンのタスクログ81かを示すパターン情報が通知された場合には、所定の記憶領域からパターン情報が示すパターンのタスクログ81を取得する。そして、タスクログDB21において、通知されたタスクIDに対応する箇所を、取得したタスクログ81の内容で更新する。また、管理部19は、公開範囲テーブル21Cに、採用されたタスクログを公開するための設定情報を記録して、推論容易性算出処理は終了する。
一方、上記ステップS23で否定判定された場合には、キャンセルボタン110が選択されたと判定して、対象のタスクログ81の公開設定を行うことなく、推論容易性算出処理は終了する。
以上説明したように、本実施形態に係る推論容易性算出装置10によれば、業務構造に応じたワークフローシステムに従って遂行されたタスクのタスクログ内の機密情報をマスキング処理する。また、マスキング後のタスクログ内の公開表現に基づいて検索される複数の文書の組み合わせの関連性を、それらの文書を参照するタスクログの業務構造における関連性に基づいて算出する。さらに、算出した文書の組み合わせの関連性を用いて、マスキング後のタスクログの非公開表現の推論容易性を算出する。このため、非公開表現を推論する際の文書の組み合わせも考慮した推論容易性を算出することができる。
例えば、図24のPに示すように、各々独立の「開発業務A」という業務と「保守業務A」という業務があるとする。また、「開発業務A」に対応するタスクログ81Sにおいて参照されている文書82Aと、「保守業務A」に対応するタスクログ81Tにおいて参照されている文書82Bとが存在するとする。ここから、図24のQに示すように、業務構造の変更により、「開発業務A」と「保守業務A」とが「統合業務A」に統合され、「統合業務A」に対応するタスクログ81Uにおいて、文書82A、82Bが参照されているとする。この場合、業務構造がPの場合に比べ、Qの場合の方が、非公開表現を推論する際に、文書82Aと文書82Bとの組み合わせを絞り込み易くなる。すなわち、タスクログ81のマスキング箇所が同じ場合でも、業務構造がPの場合に比べ、Qの場合の方が非公開表現の推論が容易になる。
k−匿名性等の従来の手法では、上記のように業務構造に相違がある場合でも、公開表現から検索される文書82が同じであれば、推論容易性の値は変化しないが、本実施形態によれば、業務構造に応じた指標を算出することができる。
また、本実施形態に係る推論容易性算出装置10では、ホワイトリストを変更した場合の推論容易性、及び変更後のホワイトリストを適用したマスキング後のタスクログを提示する。これにより、管理者がタスクログを公開するか否かを決定する際に、どの程度マスキングした場合に、どの程度情報が推論される危険性があるかを直感的に把握することができ、管理者の決定を支援することができる。
なお、上記実施形態では、推移性、特定性、及び関連性の全てを用いて推論容易性を算出する場合について説明したが、関連性のみを推論容易性として算出してもよい。また、関連性と推移性との組み合わせ、または、関連性と特定性との組み合わせにより、推論容易性を算出してもよい。
また、上記実施形態では、ホワイトリストの変更候補の各々に基づいてマスキングされたタスクログを、タスクログDB21ではなく、所定の記憶領域に記憶する場合について説明したが、これに限定されない。ホワイトリストの変更候補の各々に基づいてマスキングされたタスクログも、初期のホワイトリストに基づいてマスキングされたタスクログと同様、新たなタスクID及び作業判断IDを付与して、タスクログDB21に追加してもよい。この場合、公開するタスクログが採用された際には、採用されなかったタスクログをタスクログDBから削除するとよい。
また、上記では開示の技術に係る推論容易性算出プログラムの一例である推論容易性算出プログラム50が記憶部46に予め記憶(インストール)されている態様を説明したが、これに限定されない。開示の技術に係る画像処理プログラムは、CD−ROM、DVD−ROM、USBメモリ等の記録媒体に記録された形態で提供することも可能である。
以上の実施形態に関し、更に以下の付記を開示する。
(付記1)
コンピュータに、
ワークフローシステムにおいて遂行されたタスクの記録であるタスクログにおいてマスキングされた非公開表現が、前記タスクログ中の公開表現に基づいて検索される複数の公開情報から推論される容易性を示す指標を、前記複数の公開情報の各々に対応するタスクログ間の前記ワークフローシステムにおける関連性を用いて算出する
ことを含む処理を実行させるための推論容易性算出プログラム。
(付記2)
前記ワークフローシステムにおいて、複数の前記タスクは業務構造に対応した構成で配置され、関連するタスクを示すノードを連結したツリー構造で前記業務構造を表した場合に、前記関連性を、前記ツリー構造におけるタスクログに対応したタスクを示すノード間のパス長を用いて表した付記1記載の推論容易性算出プログラム。
(付記3)
前記タスクログは、他のタスクログを参照した複数の参照情報を含み、
前記コンピュータに、全ての参照情報に対する前記非公開表現を含む参照情報の割合をさらに用いて前記容易性を示す指標を算出することを含む処理を実行させる付記1または付記2記載の推論容易性算出プログラム。
(付記4)
前記タスクログは、他のタスクログを参照した複数の参照情報を含み、
前記コンピュータに、前記複数の公開情報に対する前記非公開表現を含む公開情報の割合をさらに用いて前記容易性を示す指標を算出することを含む処理を実行させる付記1〜付記3のいずれか1項記載の推論容易性算出プログラム。
(付記5)
前記コンピュータに、
前記タスクログにおけるマスキング箇所を各々変更したマスキング後のタスクログの候補毎に、前記容易性を示す指標を算出し、
前記候補のいずれかを選択可能な状態で、前記容易性を示す指標と共に候補の一覧を提示する
ことを含む処理をさらに実行させるための付記1〜付記4のいずれか1項記載の推論容易性算出プログラム。
(付記6)
ワークフローシステムにおいて遂行されたタスクの記録であるタスクログにおいてマスキングされた非公開表現が、前記タスクログ中の公開表現に基づいて検索される複数の公開情報から推論される容易性を示す指標を、前記複数の公開情報の各々に対応するタスクログ間の前記ワークフローシステムにおける関連性を用いて算出する算出部
を含む推論容易性算出装置。
(付記7)
前記ワークフローシステムにおいて、複数の前記タスクは業務構造に対応した構成で配置され、関連するタスクを示すノードを連結したツリー構造で前記業務構造を表した場合に、前記関連性を、前記ツリー構造におけるタスクログに対応したタスクを示すノード間のパス長を用いて表した付記6記載の推論容易性算出装置。
(付記8)
前記タスクログは、他のタスクログを参照した複数の参照情報を含み、
前記算出部は、全ての参照情報に対する前記非公開表現を含む参照情報の割合をさらに用いて前記容易性を示す指標を算出する付記6または付記7記載の推論容易性算出装置。
(付記9)
前記タスクログは、他のタスクログを参照した複数の参照情報を含み、
前記算出部は、前記複数の公開情報に対する前記非公開表現を含む公開情報の割合をさらに用いて前記容易性を示す指標を算出する付記6〜付記8のいずれか1項記載の推論容易性算出装置。
(付記10)
前記タスクログにおけるマスキング箇所を各々変更したマスキング後のタスクログの候補毎に、前記容易性を示す指標を算出し、前記候補のいずれかを選択可能な状態で、前記容易性を示す指標と共に候補の一覧を提示する変更部18をさらに含む付記6〜付記9のいずれか1項記載の推論容易性算出装置。
(付記11)
コンピュータに、
ワークフローシステムにおいて遂行されたタスクの記録であるタスクログにおいてマスキングされた非公開表現が、前記タスクログ中の公開表現に基づいて検索される複数の公開情報から推論される容易性を示す指標を、前記複数の公開情報の各々に対応するタスクログ間の前記ワークフローシステムにおける関連性を用いて算出する
ことを含む処理を実行させる推論容易性算出方法。
(付記12)
前記ワークフローシステムにおいて、複数の前記タスクは業務構造に対応した構成で配置され、関連するタスクを示すノードを連結したツリー構造で前記業務構造を表した場合に、前記関連性を、前記ツリー構造におけるタスクログに対応したタスクを示すノード間のパス長を用いて表した付記11記載の推論容易性算出方法。
(付記13)
前記タスクログは、他のタスクログを参照した複数の参照情報を含み、
前記コンピュータに、全ての参照情報に対する前記非公開表現を含む参照情報の割合をさらに用いて前記容易性を示す指標を算出することを含む処理を実行させる付記11または付記12記載の推論容易性算出方法。
(付記14)
前記タスクログは、他のタスクログを参照した複数の参照情報を含み、
前記コンピュータに、前記複数の公開情報に対する前記非公開表現を含む公開情報の割合をさらに用いて前記容易性を示す指標を算出することを含む処理を実行させる付記11〜付記13のいずれか1項記載の推論容易性算出方法。
(付記15)
前記コンピュータに、
前記タスクログにおけるマスキング箇所を各々変更したマスキング後のタスクログの候補毎に、前記容易性を示す指標を算出し、
前記候補のいずれかを選択可能な状態で、前記容易性を示す指標と共に候補の一覧を提示する
ことを含む処理をさらに実行させる付記11〜付記14のいずれか1項記載の推論容易性算出方法。
10 推論容易性算出装置
11 マスキング部
12 算出部
13 推移性算出部
14 特定性算出部
15 関連性算出部
16 推論容易性算出部
17 可読性算出部
18 変更部
19 管理部
21 タスクログDB
22 業務構造DB
23 文書DB
40 コンピュータ
42 CPU
44 メモリ
46 記憶部
50 推論容易性算出プログラム
81 タスクログ
82 文書
83 作業判断

Claims (7)

  1. コンピュータに、
    ワークフローシステムにおいて遂行されたタスクの記録であるタスクログにおいてマスキングされた非公開表現が、前記タスクログ中の公開表現に基づいて検索される複数の公開情報から推論される容易性を示す指標を、前記複数の公開情報の各々に対応するタスクログ間の前記ワークフローシステムにおける関連性を用いて算出する
    ことを含む処理を実行させるための推論容易性算出プログラム。
  2. 前記ワークフローシステムにおいて、複数の前記タスクは業務構造に対応した構成で配置され、関連するタスクを示すノードを連結したツリー構造で前記業務構造を表した場合に、前記関連性を、前記ツリー構造におけるタスクログに対応したタスクを示すノード間のパス長を用いて表した請求項1記載の推論容易性算出プログラム。
  3. 前記タスクログは、他のタスクログを参照した複数の参照情報を含み、
    前記コンピュータに、全ての参照情報に対する前記非公開表現を含む参照情報の割合をさらに用いて前記容易性を示す指標を算出することを含む処理を実行させる請求項1または請求項2記載の推論容易性算出プログラム。
  4. 前記タスクログは、他のタスクログを参照した複数の参照情報を含み、
    前記コンピュータに、前記複数の公開情報に対する前記非公開表現を含む公開情報の割合をさらに用いて前記容易性を示す指標を算出することを含む処理を実行させる請求項1〜請求項3のいずれか1項記載の推論容易性算出プログラム。
  5. 前記コンピュータに、
    前記タスクログにおけるマスキング箇所を各々変更したマスキング後のタスクログの候補毎に、前記容易性を示す指標を算出し、
    前記候補のいずれかを選択可能な状態で、前記容易性を示す指標と共に候補の一覧を提示する
    ことを含む処理をさらに実行させるための請求項1〜請求項4のいずれか1項記載の推論容易性算出プログラム。
  6. ワークフローシステムにおいて遂行されたタスクの記録であるタスクログにおいてマスキングされた非公開表現が、前記タスクログ中の公開表現に基づいて検索される複数の公開情報から推論される容易性を示す指標を、前記複数の公開情報の各々に対応するタスクログ間の前記ワークフローシステムにおける関連性を用いて算出する算出部
    を含む推論容易性算出装置。
  7. コンピュータに、
    ワークフローシステムにおいて遂行されたタスクの記録であるタスクログにおいてマスキングされた非公開表現が、前記タスクログ中の公開表現に基づいて検索される複数の公開情報から推論される容易性を示す指標を、前記複数の公開情報の各々に対応するタスクログ間の前記ワークフローシステムにおける関連性を用いて算出する
    ことを含む処理を実行させる推論容易性算出方法。
JP2014155160A 2014-07-30 2014-07-30 推論容易性算出プログラム、装置、及び方法 Pending JP2016031733A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014155160A JP2016031733A (ja) 2014-07-30 2014-07-30 推論容易性算出プログラム、装置、及び方法
US14/740,671 US20160034706A1 (en) 2014-07-30 2015-06-16 Device and method of analyzing masked task log

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014155160A JP2016031733A (ja) 2014-07-30 2014-07-30 推論容易性算出プログラム、装置、及び方法

Publications (1)

Publication Number Publication Date
JP2016031733A true JP2016031733A (ja) 2016-03-07

Family

ID=55180340

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014155160A Pending JP2016031733A (ja) 2014-07-30 2014-07-30 推論容易性算出プログラム、装置、及び方法

Country Status (2)

Country Link
US (1) US20160034706A1 (ja)
JP (1) JP2016031733A (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9684543B1 (en) * 2016-02-05 2017-06-20 Sas Institute Inc. Distributed data set storage, retrieval and analysis
US10642896B2 (en) 2016-02-05 2020-05-05 Sas Institute Inc. Handling of data sets during execution of task routines of multiple languages
US10795935B2 (en) 2016-02-05 2020-10-06 Sas Institute Inc. Automated generation of job flow definitions
US10650046B2 (en) 2016-02-05 2020-05-12 Sas Institute Inc. Many task computing with distributed file system
US10650045B2 (en) 2016-02-05 2020-05-12 Sas Institute Inc. Staged training of neural networks for improved time series prediction performance
JP6897168B2 (ja) * 2017-03-06 2021-06-30 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム
US11663358B2 (en) * 2017-05-08 2023-05-30 Autodesk, Inc. Perturbation-based techniques for anonymizing datasets
CN109388621B (zh) * 2018-10-12 2021-05-07 厦门市美亚柏科信息股份有限公司 用于解析日志文件的方法、装置以及计算机可读介质
CN114817968B (zh) * 2022-06-29 2022-10-14 深圳红途科技有限公司 无特征数据的路径追溯方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003091533A (ja) * 2001-09-17 2003-03-28 Toshiba Corp データ公開方法、データ公開プログラム、データ公開装置
JP2005505862A (ja) * 2001-10-18 2005-02-24 ハンディソフト カンパニー リミテッド ワークフローマイニングシステム及び方法(SystemandMethodforWorkflowMining)
WO2008136381A1 (ja) * 2007-04-27 2008-11-13 Nec Corporation コンテンツ処理装置、コンテンツ処理方法、並びに、コンテンツ処理プログラム

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3472026B2 (ja) * 1996-03-26 2003-12-02 富士通株式会社 ログ情報採取解析装置
US6321234B1 (en) * 1996-09-18 2001-11-20 Sybase, Inc. Database server system with improved methods for logging transactions
WO2004008284A2 (en) * 2002-07-12 2004-01-22 Checkspert, Inc. System and method for remote supervision and authentication of user activities at communication network workstations
US7512613B2 (en) * 2003-04-16 2009-03-31 The Mathworks, Inc. Non-intrusive data logging
US8086659B2 (en) * 2003-06-25 2011-12-27 Microsoft Corporation Task sequence interface
JP2005324450A (ja) * 2004-05-14 2005-11-24 Canon Inc 画像形成装置および情報処理装置およびジョブ表示制御方法およびコンピュータが読み取り可能なプログラムを格納した記憶媒体およびプログラム
JP4998549B2 (ja) * 2007-02-28 2012-08-15 富士通株式会社 メモリミラー化制御プログラム、メモリミラー化制御方法およびメモリミラー化制御装置
US7877398B2 (en) * 2007-11-19 2011-01-25 International Business Machines Corporation Masking related sensitive data in groups
US9098626B2 (en) * 2008-04-01 2015-08-04 Oracle International Corporation Method and system for log file processing and generating a graphical user interface based thereon
US8601024B2 (en) * 2009-06-16 2013-12-03 Microsoft Corporation Synopsis of a search log that respects user privacy
US9665687B2 (en) * 2010-04-30 2017-05-30 Siemens Healthcare Gmbh Adaptive imaging system workflow and user interface system
CA2784572A1 (en) * 2011-08-05 2013-02-05 National Research Council Of Canada Process mining for anomalous cases
JP2016066124A (ja) * 2014-09-22 2016-04-28 富士通株式会社 スケジューリング方法及び情報処理装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003091533A (ja) * 2001-09-17 2003-03-28 Toshiba Corp データ公開方法、データ公開プログラム、データ公開装置
JP2005505862A (ja) * 2001-10-18 2005-02-24 ハンディソフト カンパニー リミテッド ワークフローマイニングシステム及び方法(SystemandMethodforWorkflowMining)
WO2008136381A1 (ja) * 2007-04-27 2008-11-13 Nec Corporation コンテンツ処理装置、コンテンツ処理方法、並びに、コンテンツ処理プログラム

Also Published As

Publication number Publication date
US20160034706A1 (en) 2016-02-04

Similar Documents

Publication Publication Date Title
JP2016031733A (ja) 推論容易性算出プログラム、装置、及び方法
Westgate revtools: An R package to support article screening for evidence synthesis
AU2019200055B2 (en) Automated secure identification of personal information
US8290955B2 (en) Classification of data in a hierarchical data structure
JP6078437B2 (ja) パーソナル情報匿名化システム
JP2008140119A (ja) 文書管理プログラム、文書管理装置、および文書管理方法
JP2013080375A (ja) 個人情報匿名化装置及び方法
JP2014089606A (ja) 情報処理装置及びその制御方法、プログラム
WO2016063341A1 (ja) 時系列予測装置、及び時系列予測方法
KR20200076845A (ko) 악성코드 분석 시스템 및 그 시스템의 동작 방법
Baumgrass et al. Deriving role engineering artifacts from business processes and scenario models
CN115221337A (zh) 数据编织处理方法、装置、电子设备及可读存储介质
JP2018190107A (ja) 内部取引判定装置、内部取引判定方法および内部取引判定プログラム
Drakoulogkonas et al. A comparative analysis methodology for process mining software tools
JP4899428B2 (ja) 情報共有度分析システム
JP6501932B2 (ja) 内部取引判定装置、内部取引判定方法および内部取引判定プログラム
JP2012043258A (ja) 検索システム、検索装置、検索プログラム、記録媒体及び検索方法
Ates et al. Smart contract: A literature-based analysis and development of a taxonomy framework
Do et al. Uncovering Critical Causes of Highway Work Zone Accidents Using Unsupervised Machine Learning and Social Network Analysis
Carriero et al. Empirical ontology design patterns and shapes from Wikidata
JP6472904B2 (ja) データ参照権限管理装置、データ参照権限管理方法およびデータ参照権限管理プログラム
KR101969531B1 (ko) 데이터 집단 내 계층정보를 자동으로 추출하고 시각화하는 방법
JP7477791B2 (ja) 処理装置、処理方法および処理プログラム
JP6280269B1 (ja) データ参照権限管理装置、データ参照権限管理方法およびデータ参照権限管理プログラム
Grünewald et al. Towards Cross-Provider Analysis of Transparency Information for Data Protection

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170406

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180206

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180731