JP6008693B2 - 情報処理装置及びその制御方法、プログラム - Google Patents
情報処理装置及びその制御方法、プログラム Download PDFInfo
- Publication number
- JP6008693B2 JP6008693B2 JP2012239438A JP2012239438A JP6008693B2 JP 6008693 B2 JP6008693 B2 JP 6008693B2 JP 2012239438 A JP2012239438 A JP 2012239438A JP 2012239438 A JP2012239438 A JP 2012239438A JP 6008693 B2 JP6008693 B2 JP 6008693B2
- Authority
- JP
- Japan
- Prior art keywords
- workflow
- name
- data
- file
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 56
- 230000010365 information processing Effects 0.000 title claims description 13
- 238000004364 calculation method Methods 0.000 claims description 33
- 238000000605 extraction Methods 0.000 claims description 33
- 239000000470 constituent Substances 0.000 claims description 15
- 238000013075 data extraction Methods 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 8
- 238000002360 preparation method Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 230000003442 weekly effect Effects 0.000 description 3
- 238000002372 labelling Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 101150083764 KCNK9 gene Proteins 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3346—Query execution using probabilistic model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0633—Workflow analysis
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
データの操作履歴から類似する操作のパターンをワークフローとして抽出する情報処理装置であって、
データの操作履歴データに基づいて、前記ワークフローを抽出するワークフロー抽出手段と、
前記ワークフロー抽出手段で抽出したワークフローを構成するデータの内の主要なデータである主データを推定して、抽出するデータ抽出手段と、
前記データ抽出手段で抽出した主データにアクセスするためのアクセス経路を表現する名前列を解析して、前記名前列から目的要素の文字列を推定して抽出する目的要素抽出手段と、
前記目的要素抽出手段で抽出した目的要素の文字列の繋がりから、前記ワークフローの名前であるワークフロー名を決定する決定手段と
を有する。
図1は実施形態1のワークフロー名前生成装置の構成例を示すブロック図である。
・ファイルの構造情報(XML構造)
・ファイルの共起頻度情報
・ファイルの属性情報
ファイルクラスタリング処理(ステップS603)では、ファイル間類似度計算処理(ステップS602)で計算したファイル間の類似度を用いて、ファイルをクラスタリングする。クラスタリングの手法としては、階層型と非階層型の大きく2つに分かれるが、ここでは、クラスタの数を予め定める必要のない階層型クラスタリングの手法を用いる。階層型クラスタリングの代表的な手法に、最短距離法、最長距離法、群平均法、ウォード法等があるがどれを用いてもよい。尚、それぞれの手法の説明については本発明の本質ではないため省略する。クラスタリングの結果として、作業におけるファイルの使用され方が似ているものをグループとしてまとめたものをファイルクラスタとして出力する。ここで、ファイルクラスタは、1つ以上のファイルのまとまりであり、類似するファイルが1つもないファイルでも、それ単体でファイルクラスタとする。
m:ワークフロー名候補の番号 (例では、候補は4つなので1から4)
W1:第1項に対する重み (例では、パラメータとして5とする)
r:パスの階層度数 (フォルダツリーの幅が狭い方が高スコア)
α:減衰定数(0<α<1) (例では、0.5とする)
l:対象ファイルからのフォルダの距離 (距離が小さい下位フォルダの方が高スコア)
W2:第2項に対する重み (例では、パラメータとして0.5とする)
F(m):m番目の目的要素の出現度数
W3:第3項に対する重み (例では、パラメータとして1とする)
N:構成単語総数 (例では、5つの構成単語が存在する)
Tn:n番目の構成単語の頻度
図6(b)の例では、以下のように計算される。クラスタを構成するファイル名に目的要素(普通名詞)がないため、4つのフォルダ名をワークフロー名候補としてスコア計算する。各ワークフロー名候補のスコア計算結果は、図7のように計算される。そして、図6(b)の5201「月報」の候補例では、スコア計算は以下のようになる。
・・・計算式2
このようにワークフロー名決定方法のいくつかの例を示しているが、同様な処理の異なる順序、組み合わせでもよい。
実施形態2のワークフロー名前生成装置は、実施形態1と同様に、図1のワークフロー名の名前生成装置が構成例となる。実施形態2の処理フローは、実施形態1と同様である。実施形態1との違いは、ワークフロー名候補のスコア計算方法である。
m:ワークフロー名候補の番号 (例では、候補は4つなので1から4)
C:全体に対する各フォルダツリーのファイルのカバー率 (例では、上がカバー率40%、下が60%)
W0:フォルダツリー構造に対する重み (例では、パラメータとして2とする)
c(m):フォルダツリー内ファイルのカバー率 (カバー率が高いと高スコア)
l:対象ファイルからのフォルダの距離 (下位フォルダの方が高スコア)
M:フォルダ名の総数 (例では、4のフォルダが存在する)
W1:フォルダの距離に対する重み (例では、パラメータとして2とする)
F(m):m番目のフォルダ名(ファイル名)の頻度
W2:構成単語に対する重み (例では、パラメータとして1とする)
N:構成単語総数 (例では、5つの構成単語が存在する)
Tn:n番目の構成単語の頻度
図10(b)の例では、以下のように計算される。クラスタを構成するファイル名に目的要素(普通名詞)がないため、フォルダ名をワークフロー名としてスコア計算する。各ワークフロー名候補のスコア計算結果は、図11のように計算される。決定される「月報」を例として、スコア計算は、以下のようになる。
第1項の構造スコアは、フォルダツリー内のファイル数が10個でフォルダに含まれるファイル数が4個なので、カバー率c(m)は0.4となる。そして、階層距離l=2なので、第1項は2*0.4/2=0.4となる。
Claims (7)
- データの操作履歴から類似する操作のパターンをワークフローとして抽出する情報処理装置であって、
データの操作履歴データに基づいて、前記ワークフローを抽出するワークフロー抽出手段と、
前記ワークフロー抽出手段で抽出したワークフローを構成するデータの内の主要なデータである主データを推定して、抽出するデータ抽出手段と、
前記データ抽出手段で抽出した主データにアクセスするためのアクセス経路を表現する名前列を解析して、前記名前列から目的要素の文字列を推定して抽出する目的要素抽出手段と、
前記目的要素抽出手段で抽出した目的要素の文字列の繋がりから、前記ワークフローの名前であるワークフロー名を決定する決定手段と
を有することを特徴とする情報処理装置。 - 前記目的要素の繋がりの構造と、前記目的要素が前記目的要素の繋がりに出現する頻度と、前記目的要素の構成単語が前記目的要素の繋がりに出現する頻度の1つまたは組み合わせから、前記ワークフロー名の候補の評価値を示すスコアを計算する計算手段を更に備え、
前記決定手段は、前記計算手段で計算されたスコアに基づいて、前記ワークフロー名の候補から、前記ワークフロー名を決定する
ことを特徴とする請求項1に記載の情報処理装置。 - 前記計算手段では、前記目的要素の繋がりの構造の深さと幅とから、スコア計算される
ことを特徴とする請求項2に記載の情報処理装置。 - 前記計算手段では、前記目的要素の繋がりの構造の深さと、前記目的要素の繋がりに含まれる前記主データ全体に対する、対象の目的要素に対応するフォルダに含まれる主データの割合を示すカバー率から、スコア計算される
ことを特徴とする請求項2に記載の情報処理装置。 - 前記決定手段で決定したワークフロー名と、対応するワークフローで推薦する操作の内容を表示装置に出力する出力手段を更に有する
ことを特徴とする請求項1乃至4のいずれか1項に記載の情報処理装置。 - データの操作履歴から類似する操作のパターンをワークフローとして抽出する情報処理装置の制御方法であって、
データの操作履歴データに基づいて、前記ワークフローを抽出するワークフロー抽出工程と、
前記ワークフロー抽出工程で抽出したワークフローを構成するデータの内の主要なデータである主データを推定して、抽出するデータ抽出工程と、
前記データ抽出工程で抽出した主データにアクセスするためのアクセス経路を表現する名前列を解析して、前記名前列から目的要素の文字列を推定して抽出する目的要素抽出工程と、
前記目的要素抽出工程で抽出した目的要素の文字列の繋がりから、前記ワークフローの名前であるワークフロー名を決定する決定工程と
を有することを特徴とする情報処理装置の制御方法。 - データの操作履歴から類似する操作のパターンをワークフローとして抽出する情報処理装置の制御をコンピュータに機能させるためのプログラムであって、
前記コンピュータを、
データの操作履歴データに基づいて、前記ワークフローを抽出するワークフロー抽出手段と、
前記ワークフロー抽出手段で抽出したワークフローを構成するデータの内の主要なデータである主データを推定して、抽出するデータ抽出手段と、
前記データ抽出手段で抽出した主データにアクセスするためのアクセス経路を表現する名前列を解析して、前記名前列から目的要素の文字列を推定して抽出する目的要素抽出手段と、
前記目的要素抽出手段で抽出した目的要素の文字列の繋がりから、前記ワークフローの名前であるワークフロー名を決定する決定手段と
して機能させることを特徴とするプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012239438A JP6008693B2 (ja) | 2012-10-30 | 2012-10-30 | 情報処理装置及びその制御方法、プログラム |
US14/045,245 US9268842B2 (en) | 2012-10-30 | 2013-10-03 | Information processing apparatus, control method for the same, and computer-readable recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012239438A JP6008693B2 (ja) | 2012-10-30 | 2012-10-30 | 情報処理装置及びその制御方法、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014089606A JP2014089606A (ja) | 2014-05-15 |
JP6008693B2 true JP6008693B2 (ja) | 2016-10-19 |
Family
ID=50548391
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012239438A Expired - Fee Related JP6008693B2 (ja) | 2012-10-30 | 2012-10-30 | 情報処理装置及びその制御方法、プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9268842B2 (ja) |
JP (1) | JP6008693B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102232593B1 (ko) | 2013-04-30 | 2021-03-25 | 가부시키가이샤 시마노 | 낚시용 릴 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9787799B2 (en) | 2014-02-27 | 2017-10-10 | Dropbox, Inc. | Systems and methods for managing content items having multiple resolutions |
JP6481463B2 (ja) * | 2015-03-30 | 2019-03-13 | 富士通株式会社 | 管理支援プログラム、方法及び装置 |
US10198355B2 (en) | 2015-10-29 | 2019-02-05 | Dropbox, Inc. | Proving a dynamic digital content cache |
CN110619535B (zh) * | 2018-06-19 | 2023-07-14 | 华为技术有限公司 | 一种数据处理方法及其装置 |
US10983677B2 (en) * | 2018-11-16 | 2021-04-20 | Dropbox, Inc. | Prefetching digital thumbnails from remote servers to client devices based on a dynamic determination of file display criteria |
CN110162695B (zh) * | 2019-04-09 | 2022-04-26 | 中国科学院深圳先进技术研究院 | 一种信息推送的方法及设备 |
US20230205736A1 (en) * | 2021-12-24 | 2023-06-29 | Vast Data Ltd. | Finding similarities between files stored in a storage system |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4552401B2 (ja) | 2003-08-19 | 2010-09-29 | 富士ゼロックス株式会社 | 文書処理装置および方法 |
US7343378B2 (en) * | 2004-03-29 | 2008-03-11 | Microsoft Corporation | Generation of meaningful names in flattened hierarchical structures |
JP4737435B2 (ja) | 2006-09-28 | 2011-08-03 | 日本電気株式会社 | ラベル付与システム、ラベリングサービスシステム、ラベル付与方法およびラベル付与プログラム |
US7634467B2 (en) * | 2006-10-31 | 2009-12-15 | Microsoft Corporation | Implicit, specialized search of business objects using unstructured text |
JP5218068B2 (ja) * | 2009-01-05 | 2013-06-26 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
RU2644071C2 (ru) * | 2013-03-15 | 2018-02-07 | Дзе Дан Энд Брэдстрит Корпорейшн | Курирование многоязычных коммерческих признаков и синтез транслитерации |
-
2012
- 2012-10-30 JP JP2012239438A patent/JP6008693B2/ja not_active Expired - Fee Related
-
2013
- 2013-10-03 US US14/045,245 patent/US9268842B2/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102232593B1 (ko) | 2013-04-30 | 2021-03-25 | 가부시키가이샤 시마노 | 낚시용 릴 |
Also Published As
Publication number | Publication date |
---|---|
US20140122505A1 (en) | 2014-05-01 |
JP2014089606A (ja) | 2014-05-15 |
US9268842B2 (en) | 2016-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6008693B2 (ja) | 情報処理装置及びその制御方法、プログラム | |
US7562088B2 (en) | Structure extraction from unstructured documents | |
JP4796185B2 (ja) | 業務フロー図生成プログラム、業務フロー図生成装置および業務フロー図生成方法 | |
US8285702B2 (en) | Content analysis simulator for improving site findability in information retrieval systems | |
US20080162455A1 (en) | Determination of document similarity | |
US20170308792A1 (en) | Knowledge To User Mapping in Knowledge Automation System | |
US20160042298A1 (en) | Content discovery and ingestion | |
WO2009154153A1 (ja) | 文書検索システム | |
JP2000137601A (ja) | オブジェクト分析設計支援方法 | |
CA2923892A1 (en) | Systems, methods, and software for manuscript recommendations and submissions | |
KR101975272B1 (ko) | 협업 의존성 기반 컴포넌트 재사용 추천 시스템 및 방법 | |
US20160085389A1 (en) | Knowledge automation system thumbnail image generation | |
Kiziltan et al. | Constraint detection in natural language problem descriptions | |
US20160086499A1 (en) | Knowledge brokering and knowledge campaigns | |
JP7065718B2 (ja) | 判断支援装置および判断支援方法 | |
Amreen et al. | A methodology for measuring floss ecosystems | |
Burger et al. | Finalist 2: Feature identification, localization, and tracing tool | |
JP2005316699A (ja) | コンテンツ公開システム、コンテンツ公開方法、及びコンテンツ公開プログラム | |
Zhang et al. | MEGAnno: Exploratory labeling for NLP in computational notebooks | |
JP2012027525A (ja) | ファイル格納補助システムと方法およびプログラム | |
JP2004185346A (ja) | プロジェクト作業支援方法およびシステム | |
JP2009223679A (ja) | 電子文書検索装置、及び電子文書検索プログラム | |
JP4393482B2 (ja) | 情報共有システム及びプログラム | |
JP2015162170A (ja) | 情報処理装置、及び制御方法 | |
JP2014203392A (ja) | 文書管理装置、文書管理方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150908 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160617 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160624 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160729 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160819 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160913 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6008693 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |