JP2014089606A - 情報処理装置及びその制御方法、プログラム - Google Patents
情報処理装置及びその制御方法、プログラム Download PDFInfo
- Publication number
- JP2014089606A JP2014089606A JP2012239438A JP2012239438A JP2014089606A JP 2014089606 A JP2014089606 A JP 2014089606A JP 2012239438 A JP2012239438 A JP 2012239438A JP 2012239438 A JP2012239438 A JP 2012239438A JP 2014089606 A JP2014089606 A JP 2014089606A
- Authority
- JP
- Japan
- Prior art keywords
- workflow
- name
- data
- extracted
- file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3346—Query execution using probabilistic model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0633—Workflow analysis
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 データの操作履歴データに基づいて、ワークフローを抽出する。抽出したワークフローを構成するデータの内の主要なデータである主データを推定して、抽出する。抽出した主データにアクセスするためのアクセス経路を表現する名前列を解析して、名前列から目的要素の文字列を推定して抽出する。抽出した目的要素の文字列の繋がりから、ワークフローの名前であるワークフロー名を決定する。
【選択図】 図3
Description
データの操作履歴から類似する操作のパターンをワークフローとして抽出する情報処理装置であって、
データの操作履歴データに基づいて、前記ワークフローを抽出するワークフロー抽出手段と、
前記ワークフロー抽出手段で抽出したワークフローを構成するデータの内の主要なデータである主データを推定して、抽出するデータ抽出手段と、
前記データ抽出手段で抽出した主データにアクセスするためのアクセス経路を表現する名前列を解析して、前記名前列から目的要素の文字列を推定して抽出する目的要素抽出手段と、
前記目的要素抽出手段で抽出した目的要素の文字列の繋がりから、前記ワークフローの名前であるワークフロー名を決定する決定手段と
を有する。
図1は実施形態1のワークフロー名前生成装置の構成例を示すブロック図である。
・ファイルの構造情報(XML構造)
・ファイルの共起頻度情報
・ファイルの属性情報
ファイルクラスタリング処理(ステップS603)では、ファイル間類似度計算処理(ステップS602)で計算したファイル間の類似度を用いて、ファイルをクラスタリングする。クラスタリングの手法としては、階層型と非階層型の大きく2つに分かれるが、ここでは、クラスタの数を予め定める必要のない階層型クラスタリングの手法を用いる。階層型クラスタリングの代表的な手法に、最短距離法、最長距離法、群平均法、ウォード法等があるがどれを用いてもよい。尚、それぞれの手法の説明については本発明の本質ではないため省略する。クラスタリングの結果として、作業におけるファイルの使用され方が似ているものをグループとしてまとめたものをファイルクラスタとして出力する。ここで、ファイルクラスタは、1つ以上のファイルのまとまりであり、類似するファイルが1つもないファイルでも、それ単体でファイルクラスタとする。
m:ワークフロー名候補の番号 (例では、候補は4つなので1から4)
W1:第1項に対する重み (例では、パラメータとして5とする)
r:パスの階層度数 (フォルダツリーの幅が狭い方が高スコア)
α:減衰定数(0<α<1) (例では、0.5とする)
l:対象ファイルからのフォルダの距離 (距離が小さい下位フォルダの方が高スコア)
W2:第2項に対する重み (例では、パラメータとして0.5とする)
F(m):m番目の目的要素の出現度数
W3:第3項に対する重み (例では、パラメータとして1とする)
N:構成単語総数 (例では、5つの構成単語が存在する)
Tn:n番目の構成単語の頻度
図6(b)の例では、以下のように計算される。クラスタを構成するファイル名に目的要素(普通名詞)がないため、4つのフォルダ名をワークフロー名候補としてスコア計算する。各ワークフロー名候補のスコア計算結果は、図7のように計算される。そして、図6(b)の5201「月報」の候補例では、スコア計算は以下のようになる。
・・・計算式2
このようにワークフロー名決定方法のいくつかの例を示しているが、同様な処理の異なる順序、組み合わせでもよい。
実施形態2のワークフロー名前生成装置は、実施形態1と同様に、図1のワークフロー名の名前生成装置が構成例となる。実施形態2の処理フローは、実施形態1と同様である。実施形態1との違いは、ワークフロー名候補のスコア計算方法である。
m:ワークフロー名候補の番号 (例では、候補は4つなので1から4)
C:全体に対する各フォルダツリーのファイルのカバー率 (例では、上がカバー率40%、下が60%)
W0:フォルダツリー構造に対する重み (例では、パラメータとして2とする)
c(m):フォルダツリー内ファイルのカバー率 (カバー率が高いと高スコア)
l:対象ファイルからのフォルダの距離 (下位フォルダの方が高スコア)
M:フォルダ名の総数 (例では、4のフォルダが存在する)
W1:フォルダの距離に対する重み (例では、パラメータとして2とする)
F(m):m番目のフォルダ名(ファイル名)の頻度
W2:構成単語に対する重み (例では、パラメータとして1とする)
N:構成単語総数 (例では、5つの構成単語が存在する)
Tn:n番目の構成単語の頻度
図10(b)の例では、以下のように計算される。クラスタを構成するファイル名に目的要素(普通名詞)がないため、フォルダ名をワークフロー名としてスコア計算する。各ワークフロー名候補のスコア計算結果は、図11のように計算される。決定される「月報」を例として、スコア計算は、以下のようになる。
第1項の構造スコアは、フォルダツリー内のファイル数が10個でフォルダに含まれるファイル数が4個なので、カバー率c(m)は0.4となる。そして、階層距離l=2なので、第1項は2*0.4/2=0.4となる。
Claims (7)
- データの操作履歴から類似する操作のパターンをワークフローとして抽出する情報処理装置であって、
データの操作履歴データに基づいて、前記ワークフローを抽出するワークフロー抽出手段と、
前記ワークフロー抽出手段で抽出したワークフローを構成するデータの内の主要なデータである主データを推定して、抽出するデータ抽出手段と、
前記データ抽出手段で抽出した主データにアクセスするためのアクセス経路を表現する名前列を解析して、前記名前列から目的要素の文字列を推定して抽出する目的要素抽出手段と、
前記目的要素抽出手段で抽出した目的要素の文字列の繋がりから、前記ワークフローの名前であるワークフロー名を決定する決定手段と
を有することを特徴とする情報処理装置。 - 前記目的要素の繋がりの構造と、前記目的要素の頻度と、前記目的要素の構成単語の頻度の1つまたは組み合わせから、前記ワークフロー名の候補の評価値を示すスコアを計算する計算手段を更に備え、
前記決定手段は、前記計算手段で計算されたスコアに基づいて、前記ワークフロー名の候補から、前記ワークフロー名を決定する
ことを特徴とする請求項1に記載の情報処理装置。 - 前記計算手段では、前記目的要素の繋がりの構造の深さと幅とから、スコア計算される
ことを特徴とする請求項2に記載の情報処理装置。 - 前記計算手段では、前記目的要素の繋がりの構造の深さと、前記目的要素の繋がりに含まれる前記主データ全体に対する、対象の目的要素に対応するフォルダに含まれる主データの割合を示すカバー率から、スコア計算される
ことを特徴とする請求項2に記載の情報処理装置。 - 前記決定手段で決定したワークフロー名と、対応するワークフローで推薦する操作の内容を表示装置に出力する出力手段を更に有する
ことを特徴とする請求項1乃至4のいずれか1項に記載の情報処理装置。 - データの操作履歴から類似する操作のパターンをワークフローとして抽出する情報処理装置の制御方法であって、
データの操作履歴データに基づいて、前記ワークフローを抽出するワークフロー抽出工程と、
前記ワークフロー抽出工程で抽出したワークフローを構成するデータの内の主要なデータである主データを推定して、抽出するデータ抽出工程と、
前記データ抽出工程で抽出した主データにアクセスするためのアクセス経路を表現する名前列を解析して、前記名前列から目的要素の文字列を推定して抽出する目的要素抽出工程と、
前記目的要素抽出工程で抽出した目的要素の文字列の繋がりから、前記ワークフローの名前であるワークフロー名を決定する決定工程と
を有することを特徴とする情報処理装置の制御方法。 - データの操作履歴から類似する操作のパターンをワークフローとして抽出する情報処理装置の制御をコンピュータに機能させるためのプログラムであって、
前記コンピュータを、
データの操作履歴データに基づいて、前記ワークフローを抽出するワークフロー抽出手段と、
前記ワークフロー抽出手段で抽出したワークフローを構成するデータの内の主要なデータである主データを推定して、抽出するデータ抽出手段と、
前記データ抽出手段で抽出した主データにアクセスするためのアクセス経路を表現する名前列を解析して、前記名前列から目的要素の文字列を推定して抽出する目的要素抽出手段と、
前記目的要素抽出手段で抽出した目的要素の文字列の繋がりから、前記ワークフローの名前であるワークフロー名を決定する決定手段と
して機能させることを特徴とするプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012239438A JP6008693B2 (ja) | 2012-10-30 | 2012-10-30 | 情報処理装置及びその制御方法、プログラム |
US14/045,245 US9268842B2 (en) | 2012-10-30 | 2013-10-03 | Information processing apparatus, control method for the same, and computer-readable recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012239438A JP6008693B2 (ja) | 2012-10-30 | 2012-10-30 | 情報処理装置及びその制御方法、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014089606A true JP2014089606A (ja) | 2014-05-15 |
JP6008693B2 JP6008693B2 (ja) | 2016-10-19 |
Family
ID=50548391
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012239438A Active JP6008693B2 (ja) | 2012-10-30 | 2012-10-30 | 情報処理装置及びその制御方法、プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9268842B2 (ja) |
JP (1) | JP6008693B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230205736A1 (en) * | 2021-12-24 | 2023-06-29 | Vast Data Ltd. | Finding similarities between files stored in a storage system |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6227891B2 (ja) | 2013-04-30 | 2017-11-08 | 株式会社シマノ | 釣り用リール |
US9787799B2 (en) | 2014-02-27 | 2017-10-10 | Dropbox, Inc. | Systems and methods for managing content items having multiple resolutions |
JP6481463B2 (ja) * | 2015-03-30 | 2019-03-13 | 富士通株式会社 | 管理支援プログラム、方法及び装置 |
US10198355B2 (en) | 2015-10-29 | 2019-02-05 | Dropbox, Inc. | Proving a dynamic digital content cache |
CN110619535B (zh) * | 2018-06-19 | 2023-07-14 | 华为技术有限公司 | 一种数据处理方法及其装置 |
US10983677B2 (en) * | 2018-11-16 | 2021-04-20 | Dropbox, Inc. | Prefetching digital thumbnails from remote servers to client devices based on a dynamic determination of file display criteria |
CN110162695B (zh) * | 2019-04-09 | 2022-04-26 | 中国科学院深圳先进技术研究院 | 一种信息推送的方法及设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005285127A (ja) * | 2004-03-29 | 2005-10-13 | Microsoft Corp | フラット化された階層構造における分かりやすい名前の生成 |
JP2010157183A (ja) * | 2009-01-05 | 2010-07-15 | Fuji Xerox Co Ltd | 情報処理装置及び情報処理プログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4552401B2 (ja) | 2003-08-19 | 2010-09-29 | 富士ゼロックス株式会社 | 文書処理装置および方法 |
JP4737435B2 (ja) | 2006-09-28 | 2011-08-03 | 日本電気株式会社 | ラベル付与システム、ラベリングサービスシステム、ラベル付与方法およびラベル付与プログラム |
US7634467B2 (en) * | 2006-10-31 | 2009-12-15 | Microsoft Corporation | Implicit, specialized search of business objects using unstructured text |
US9489351B2 (en) * | 2013-03-15 | 2016-11-08 | The Dun & Bradstreet Corporation | Enhancement of multi-lingual business indicia through curation and synthesis of transliteration, translation and graphemic insight |
-
2012
- 2012-10-30 JP JP2012239438A patent/JP6008693B2/ja active Active
-
2013
- 2013-10-03 US US14/045,245 patent/US9268842B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005285127A (ja) * | 2004-03-29 | 2005-10-13 | Microsoft Corp | フラット化された階層構造における分かりやすい名前の生成 |
JP2010157183A (ja) * | 2009-01-05 | 2010-07-15 | Fuji Xerox Co Ltd | 情報処理装置及び情報処理プログラム |
Non-Patent Citations (1)
Title |
---|
JPN6016023917; 宋 強, 外4名: '「ファイルレコメンデーションのためのファイル利用履歴に基づくタスク間ワークフロー抽出手法」' 第4回データ工学と情報マネジメントに関するフォーラム論文集(第10回日本データベース学会年次大会) , 20120303, 電子情報通信学会データ工学研究専門委員会 日本デー * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230205736A1 (en) * | 2021-12-24 | 2023-06-29 | Vast Data Ltd. | Finding similarities between files stored in a storage system |
Also Published As
Publication number | Publication date |
---|---|
US20140122505A1 (en) | 2014-05-01 |
US9268842B2 (en) | 2016-02-23 |
JP6008693B2 (ja) | 2016-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6008693B2 (ja) | 情報処理装置及びその制御方法、プログラム | |
US7562088B2 (en) | Structure extraction from unstructured documents | |
JP4796185B2 (ja) | 業務フロー図生成プログラム、業務フロー図生成装置および業務フロー図生成方法 | |
US8285702B2 (en) | Content analysis simulator for improving site findability in information retrieval systems | |
US20160042298A1 (en) | Content discovery and ingestion | |
US20170308792A1 (en) | Knowledge To User Mapping in Knowledge Automation System | |
US20080162455A1 (en) | Determination of document similarity | |
WO2009154153A1 (ja) | 文書検索システム | |
JP2000137601A (ja) | オブジェクト分析設計支援方法 | |
CA2923892A1 (en) | Systems, methods, and software for manuscript recommendations and submissions | |
JP5424798B2 (ja) | メタデータ設定方法及びメタデータ設定システム、並びにプログラム | |
US20160085389A1 (en) | Knowledge automation system thumbnail image generation | |
US20160086499A1 (en) | Knowledge brokering and knowledge campaigns | |
KR101975272B1 (ko) | 협업 의존성 기반 컴포넌트 재사용 추천 시스템 및 방법 | |
Kiziltan et al. | Constraint detection in natural language problem descriptions | |
Amreen et al. | A methodology for measuring FLOSS ecosystems | |
JP7065718B2 (ja) | 判断支援装置および判断支援方法 | |
Burger et al. | Finalist 2: Feature identification, localization, and tracing tool | |
Hübner et al. | Using interaction data for continuous creation of trace links between source code and requirements in issue tracking systems | |
US20160085850A1 (en) | Knowledge brokering and knowledge campaigns | |
CN115221337A (zh) | 数据编织处理方法、装置、电子设备及可读存储介质 | |
JP2012027525A (ja) | ファイル格納補助システムと方法およびプログラム | |
JP2004185346A (ja) | プロジェクト作業支援方法およびシステム | |
JP2009223679A (ja) | 電子文書検索装置、及び電子文書検索プログラム | |
JP4393482B2 (ja) | 情報共有システム及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150908 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160617 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160624 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160729 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160819 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160913 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6008693 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |