JP2024063414A - Information analysis method, information analysis server, and electronic information management system - Google Patents

Information analysis method, information analysis server, and electronic information management system Download PDF

Info

Publication number
JP2024063414A
JP2024063414A JP2022171341A JP2022171341A JP2024063414A JP 2024063414 A JP2024063414 A JP 2024063414A JP 2022171341 A JP2022171341 A JP 2022171341A JP 2022171341 A JP2022171341 A JP 2022171341A JP 2024063414 A JP2024063414 A JP 2024063414A
Authority
JP
Japan
Prior art keywords
files
file
information
business
information analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022171341A
Other languages
Japanese (ja)
Inventor
浩貴 山本
光司 天野
誠 小野寺
寛 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2022171341A priority Critical patent/JP2024063414A/en
Priority to PCT/JP2023/034694 priority patent/WO2024090090A1/en
Publication of JP2024063414A publication Critical patent/JP2024063414A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0633Workflow analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Databases & Information Systems (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Library & Information Science (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

Figure 2024063414000001

【課題】業務を構成する各工程毎に使用されるファイルを提示することで、業務処理の効率を向上させる。
【解決手段】プロセッサとメモリを有する情報解析サーバが、ネットワークを介して接続された業務端末で使用されたファイルを解析する情報解析サーバであって、前記情報解析サーバが、業務を構成する複数の工程で使用される前記ファイルを前記工程毎に取得して前記工程と前記ファイルと前記ファイルの所在を関連付けて工程文書情報に格納する第1のステップと、前記情報解析サーバが、前記ファイルに含まれる単語を解析して前記単語が類似するファイルを関連するファイルとして関係リンクを生成する第2のステップと、前記情報解析サーバが、前記工程毎に使用される前記ファイルと、前記ファイルの所在と、前記関係リンクをメタ情報に格納する第3のステップと、を含む。
【選択図】図1A

Figure 2024063414000001

The present invention improves the efficiency of business processing by presenting files to be used for each process that constitutes a business.
[Solution] An information analysis server having a processor and memory analyzes files used on a business terminal connected via a network, and includes a first step in which the information analysis server acquires the files used in multiple processes that make up a business for each process, associates the process, the file, and the location of the file, and stores them in process document information; a second step in which the information analysis server analyzes words contained in the files and generates relationship links by treating files with similar words as related files; and a third step in which the information analysis server stores the files used for each process, the location of the files, and the relationship links in meta information.
[Selected Figure] Figure 1A

Description

本発明は、業務の効率化を支援する計算機システムに関する。 The present invention relates to a computer system that supports business efficiency.

業務の効率を向上させるために、業務フローを自動的に構築する技術が知られている。例えば、特許文献1には、業務イベントを収集して業務フローを自動的に構築する際に、業務イベントとは独立して発生する無関係イベントを検出して業務フローから除外する技術が記載されている。 Technology for automatically constructing business flows to improve business efficiency is known. For example, Patent Literature 1 describes a technology for detecting unrelated events that occur independently of business events and excluding them from the business flow when collecting business events and automatically constructing a business flow.

また、業務に使用されるデータを分析する技術としては、テキストマイニングが知られている。例えば、特許文献2には、分析対象テキストから抽出した単語又は属性値を2以上に分類して一覧表示し、利用者から単語又は属性値が指定されると、指定された単語又は属性値に連動して絞り込みを実施して一覧表示を行うことが記載されている。 Text mining is also known as a technique for analyzing data used in business. For example, Patent Document 2 describes a method in which words or attribute values extracted from the text to be analyzed are classified into two or more categories and displayed in a list, and when a word or attribute value is specified by the user, the list is narrowed down in conjunction with the specified word or attribute value.

特開2010-20634号公報JP 2010-20634 A 特開2006-244298号公報JP 2006-244298 A

業務の推進に当たり、業務に使用するファイルや情報、図面などを数多く保有しているものの、それらが種々のフォルダやシステムに散在しているため、業務で必要になったときに探したり、見つからない場合には資料が存在するのに利用されない場合が生じる。 Although there are many files, information, drawings, etc. used in the course of business, they are scattered across various folders and systems, making it difficult to search for them when they are needed for work, and in such cases, materials may not be used even though they exist.

現存するフィルや情報を自動的に構造化しておき、業務の進行に応じて適切なファイルや情報を提供することが望まれている。 It is desirable to automatically structure existing files and information and provide appropriate files and information as work progresses.

そこで本発明は、上記問題点に鑑みてなされたもので、業務を構成する工程毎に使用されるファイルや業務に用いるシステムに帰属する文書やデータなどの情報を提示することで、業務処理の効率を向上させることを目的とする。 The present invention was made in consideration of the above problems, and aims to improve the efficiency of business processing by presenting information such as files used for each process that makes up the business, and documents and data belonging to the systems used in the business.

本発明は、プロセッサとメモリを有する情報解析サーバが、ネットワークを介して接続された業務端末で使用されたファイルを解析する情報解析方法であって、前記情報解析サーバが、業務を構成する複数の工程で使用される前記ファイルを前記工程毎に取得して前記工程と前記ファイルと前記ファイルの所在を関連付けて工程文書情報に格納する第1のステップと、前記情報解析サーバが、前記ファイルに含まれる単語を解析して前記単語が類似するファイルを関連するファイルとして関係リンクを生成する第2のステップと、前記情報解析サーバが、前記工程毎に使用される前記ファイルと、前記ファイルの所在と、前記関係リンクをメタ情報に格納する第3のステップと、を含む。 The present invention is an information analysis method in which an information analysis server having a processor and memory analyzes files used on a business terminal connected via a network, and includes a first step in which the information analysis server acquires the files used in a plurality of processes constituting a business for each of the processes, associates the processes, the files, and the locations of the files, and stores them in process document information; a second step in which the information analysis server analyzes words contained in the files, and generates relationship links by treating files with similar words as related files; and a third step in which the information analysis server stores the files used for each of the processes, the locations of the files, and the relationship links in meta information.

したがって、本発明は、業務を構成する工程毎に必要とするファイル等の情報が提供されるため、ファイル等を探す労力を低減することで業務の効率化を図ることができる。また、これらの情報を部門内、または部門間で共有することにより、業務に対する情報共有の迅速化を図ることができる。さらに熟練者の業務知識を他の職員が参照することができ、技能の伝承を図ることができる。 Therefore, the present invention provides information on files and other items required for each process that constitutes a task, thereby reducing the effort required to search for files and other items, thereby improving the efficiency of the task. Furthermore, by sharing this information within or between departments, it is possible to speed up the sharing of information regarding tasks. Furthermore, other staff members can refer to the task knowledge of experts, which allows for the transfer of skills.

本明細書において開示される主題の、少なくとも一つの実施の詳細は、添付されている図面と以下の記述の中で述べられる。開示される主題のその他の特徴、態様、効果は、以下の開示、図面、請求項により明らかにされる。 Details of at least one implementation of the subject matter disclosed herein are set forth in the accompanying drawings and the description below. Other features, aspects, and advantages of the disclosed subject matter will become apparent from the following disclosure, drawings, and claims.

本発明の実施例1を示し、電子情報管理システムのブロック図である。FIG. 1 is a block diagram of an electronic information management system according to a first embodiment of the present invention. 本発明の実施例1を示し、業務システムのブロック図である。FIG. 1 is a block diagram of a business system according to a first embodiment of the present invention. 本発明の実施例1を示し、電子情報管理システムで行われる処理の概要を示すフローチャートである。4 is a flowchart illustrating an outline of a process performed in the electronic information management system according to the first embodiment of the present invention. 本発明の実施例1を示し、業務フローの記録処理の一例を示す図である。FIG. 1 illustrates an example of a process for recording a business flow according to the first embodiment of the present invention. 本発明の実施例1を示し、業務工程文書テーブルの一例を示す図である。FIG. 11 illustrates an example of a business process document table according to the first embodiment of the present invention. 本発明の実施例1を示し、電子情報管理システムで行われる処理の一例を示すシーケンス図の前半部である。1 is a sequence diagram illustrating an example of processing performed in an electronic information management system according to a first embodiment of the present invention. 本発明の実施例1を示し、電子情報管理システムで行われる処理の一例を示すシーケンス図の中間部である。1 is a middle part of a sequence diagram illustrating an example of processing performed in an electronic information management system according to the first embodiment of the present invention. 本発明の実施例1を示し、電子情報管理システムで行われる処理の一例を示すシーケンス図の後半部である。11 is a second half of a sequence diagram illustrating an example of processing performed in the electronic information management system according to the first embodiment of the present invention. 本発明の実施例1を示し、頻出単語リストの一例を示す図である。FIG. 2 illustrates an example of a frequent word list according to the first embodiment of the present invention. 本発明の実施例1を示し、ファイル関係テーブルの一例を示す図である。FIG. 2 illustrates an example of a file relationship table according to the first embodiment of the present invention. 本発明の実施例1を示し、メタ情報テーブルの一例を示す図である。FIG. 11 illustrates an example of a meta-information table according to the first embodiment of the present invention. 本発明の実施例1を示し、業務と工程及びファイルのメタ情報の関係を示す図である。FIG. 2 illustrates the relationship between a task, a process, and meta information of a file according to the first embodiment of the present invention. 本発明の実施例1を示し、メタ情報の一例を示す図である。FIG. 11 illustrates an example of meta information according to the first embodiment of the present invention. 本発明の実施例1を示し、業務フローの支援画面の一例を示す図である。FIG. 11 illustrates an example of a business flow support screen according to the first embodiment of the present invention. 本発明の実施例2を示し、頻出単語リストと単語の相関関係図による業務フローの支援画面の一例を示す図である。FIG. 11 is a diagram illustrating an example of a business flow support screen based on a frequent word list and a word correlation diagram according to a second embodiment of the present invention.

以下、本発明の実施形態を添付図面に基づいて説明する。 The following describes an embodiment of the present invention with reference to the attached drawings.

図1Aは、本発明の実施例1を示し、電子情報管理システム1のブロック図である。本実施例の電子情報管理システム1は、業務を工程毎に管理して業務端末8で行われる業務処理の内容を記録し、各工程で使用されるファイル(データ又は文書)とファイルの所在を分析し、各工程で必要となるファイルを提示する。なお、本実施例では、フォルダに格納される文書ファイルなどだけではなく、例えば製造設備を制御する制御装置や過去の運転における異常リストや警報リスト、トレンドグラフなどの履歴や、設備管理システムや、製造実行系システムなどのシステム内に蓄えられる各種情報も「ファイル」の一部である。 FIG. 1A shows a first embodiment of the present invention and is a block diagram of an electronic information management system 1. The electronic information management system 1 of this embodiment manages work by process, records the content of work processing performed on the work terminal 8, analyzes the files (data or documents) used at each process and the location of the files, and presents the files required at each process. Note that in this embodiment, not only document files stored in folders, but also various information stored in systems such as control devices that control manufacturing equipment, anomaly lists, alarm lists, and trend graphs from past operations, and equipment management systems and manufacturing execution systems are part of the "files".

<システム構成>
電子情報管理システム1は、業務を実施する業務端末8と、業務で使用するファイルを格納するファイルサーバ7-1~7-nと、業務で使用する業務システム90と、工程毎に使用されるファイルやデータなどの情報を分析してメタ情報を生成し、メタ情報から各工程で使用するデータを提示する情報解析蓄積サーバ2と、各装置を接続するネットワーク9を含む。
<System Configuration>
The electronic information management system 1 includes a business terminal 8 for carrying out business operations, file servers 7-1 to 7-n for storing files used in the business operations, a business system 90 for use in the business operations, an information analysis and storage server 2 that analyzes information such as files and data used in each process to generate meta-information and presents data to be used in each process from the meta-information, and a network 9 connecting each device.

なお、ファイルサーバを個々に特定しない場合には「-」以降を省略した符号「7」を用いる。他の構成要素の符号についても同様である。また、業務で使用するファイルを格納する装置は、ファイルサーバ7に限定されるものではなく、NAS(Network Attached Storage)等のストレージ装置であってもよい。各業務で用いられるファイルは、必ずしも同一ディレクトリ下のフォルダ内に存在している必要はなく、種々のフォルダに散在していてもかまわない。 When file servers are not specified individually, the symbol "7" is used with the "-" and everything after it omitted. The same applies to the symbols of other components. Furthermore, the device that stores files used in business is not limited to the file server 7, but may be a storage device such as NAS (Network Attached Storage). Files used in each business do not necessarily need to be in folders under the same directory, and may be scattered across various folders.

情報解析蓄積サーバ2は、プロセッサ21と、メモリ22と、ストレージ装置23と、ネットワークインタフェース24を含む計算機である。メモリ22には、業務記録部3と、文書解析部4と、ファイル関係抽出部5と、ディレクトリ解析部6と、業務フロー提示部40がプログラムとしてロードされ、プロセッサ21によって実行される。 The information analysis and accumulation server 2 is a computer including a processor 21, a memory 22, a storage device 23, and a network interface 24. A business record unit 3, a document analysis unit 4, a file relationship extraction unit 5, a directory analysis unit 6, and a business flow presentation unit 40 are loaded into the memory 22 as programs and executed by the processor 21.

プロセッサ21は、各機能部のプログラムに従って処理することによって、所定の機能を提供する機能部として稼働する。例えば、プロセッサ21は、文書解析プログラムに従って処理することで文書解析部4として機能する。他のプログラムについても同様である。さらに、プロセッサ21は、各プログラムが実行する複数の処理のそれぞれの機能を提供する機能部としても稼働する。計算機及び計算機システムは、これらの機能部を含む装置及びシステムである。 The processor 21 operates as a functional unit that provides a specific function by processing according to the program of each functional unit. For example, the processor 21 functions as the document analysis unit 4 by processing according to a document analysis program. The same applies to other programs. Furthermore, the processor 21 also operates as a functional unit that provides each function of the multiple processes executed by each program. A computer and a computer system are devices and systems that include these functional units.

業務記録部3は、業務端末8が実施した業務処理の内容と、各工程の業務で使用したファイルを取得して業務工程文書テーブル31に記録する。業務記録部3は、業務を構成する工程を取得して、工程毎に業務端末8で使用されたファイルを記録する。なお、ファイルは業務端末8が使用したデータや文書や、アクセスしたテーブルやURL等を含むことができる。業務工程文書テーブル31の詳細については後述する。なお、業務工程文書テーブル31には、業務に従事する者(オペレータ)が、記録しようとする業務の名前などを予め定めて登録することができる。 The business record unit 3 acquires the contents of the business processing performed by the business terminal 8 and the files used in the business of each process, and records them in the business process document table 31. The business record unit 3 acquires the processes that make up the business, and records the files used on the business terminal 8 for each process. The files can include data and documents used by the business terminal 8, accessed tables and URLs, etc. Details of the business process document table 31 will be described later. The name of the business that the person engaged in the business (operator) wishes to record can be predefined and registered in the business process document table 31.

また、業務記録部3は、業務と工程とファイルのそれぞれについて文書解析部4の出力に基づいてメタ情報を抽出してメタ情報テーブル34に格納する。 The business record unit 3 also extracts meta-information for each business, process, and file based on the output of the document analysis unit 4, and stores the information in the meta-information table 34.

文書解析部4は、工程毎に使用されたファイルやシステムから単語を抽出して、単語の出現頻度を算出し、頻出単語リスト32を生成する。文書解析部4は、例えば、形態素解析等の周知又は公知の技術を用いればよい。 The document analysis unit 4 extracts words from the files and systems used in each process, calculates the frequency of occurrence of the words, and generates a frequent word list 32. The document analysis unit 4 may use, for example, a well-known or publicly known technique such as morphological analysis.

ファイル関係抽出部5は、各工程で使用されたファイルと他のファイルの間で関係のあるファイルを抽出してファイル関係テーブル33を生成する。 The file relationship extraction unit 5 extracts files that are related to the files used in each process and other files, and generates a file relationship table 33.

ディレクトリ解析部6は、業務で使用されたファイルについてファイルの所在を解析して業務工程文書テーブル31に所在を反映させる。なお、ファイルの所在はファイルパス等で構成することができる。 The directory analysis unit 6 analyzes the location of files used in a business operation and reflects the location in the business process document table 31. The location of the file can be configured using a file path, etc.

業務フロー提示部40は、業務工程文書テーブル31とメタ情報テーブル34から業務フローを抽出して、業務を構成する工程毎に使用するファイルと、関連するファイルを出力して、業務端末8の利用者が実施する業務処理を支援する。 The business flow presentation unit 40 extracts the business flow from the business process document table 31 and the meta information table 34, and outputs the files used for each process that constitutes the business and related files to support the business processing performed by the user of the business terminal 8.

ストレージ装置23は、業務工程文書テーブル31と、頻出単語リスト32と、ファイル関係テーブル33と、メタ情報テーブル34と、辞書35を格納する。各情報の詳細については後述する。 The storage device 23 stores a business process document table 31, a frequent word list 32, a file relationship table 33, a meta information table 34, and a dictionary 35. Details of each piece of information will be described later.

ファイルサーバ7は、業務端末8にファイルを提供する計算機である。本実施例のファイルサーバ7は、ディレクトリ構造でファイルを格納し、例えば、フォルダAの配下に複数のフォルダB~Nを設定し、フォルダB~Nにファイルをそれぞれ格納する例を示す。 The file server 7 is a computer that provides files to the business terminal 8. In this embodiment, the file server 7 stores files in a directory structure, and in this example, multiple folders B to N are set under folder A, and files are stored in folders B to N, respectively.

なお、本実施例では、業務端末8がファイルサーバ7のファイルを参照したり業務システム90のデータを利用して業務を実施する例を示す。図1Bは、業務システム90の一例を示す図である。業務システム90は、1以上の業務システム#1(910-1)、業務システム#2(910-2)を含む。 In this embodiment, an example is shown in which the business terminal 8 performs business by referencing files in the file server 7 and using data in the business system 90. FIG. 1B is a diagram showing an example of a business system 90. The business system 90 includes one or more business systems #1 (910-1) and #2 (910-2).

業務システム#1(910-1)は、データベース#1(920-1)と、リスト#1(930-1)を提供し、業務システム#2(910-2)は、データベース#2(920-2)と、リスト#2(930-2)を提供する。 Business system #1 (910-1) provides database #1 (920-1) and list #1 (930-1), and business system #2 (910-2) provides database #2 (920-2) and list #2 (930-2).

<データ>
次に、情報解析蓄積サーバ2が使用するファイルについて説明する。図4は、業務工程文書テーブル31の一例を示す図である。業務工程文書テーブル31は、業務記録部3と、ディレクトリ解析部6によって生成される。
<Data>
Next, a description will be given of files used by the information analysis and accumulation server 2. Fig. 4 is a diagram showing an example of a business process document table 31. The business process document table 31 is generated by the business recording unit 3 and the directory analysis unit 6.

業務工程文書テーブル31は、業務識別子311と、工程識別子312と、ファイル識別子313と、ファイル名314と、ディレクトリ315をひとつのエントリに含む。 The business process document table 31 includes a business identifier 311, a process identifier 312, a file identifier 313, a file name 314, and a directory 315 in one entry.

業務識別子311は、業務を特定する識別子を格納する。本実施例では、業務記録部3が業務識別子311を付与する例を示す。工程識別子312は、工程を特定する識別子を格納する。本実施例では、業務記録部3が工程識別子312を付与する例を示す。 The task identifier 311 stores an identifier that identifies the task. In this embodiment, an example is shown in which the task record unit 3 assigns the task identifier 311. The process identifier 312 stores an identifier that identifies the process. In this embodiment, an example is shown in which the task record unit 3 assigns the process identifier 312.

ファイル識別子313は、ディレクトリ解析部6が付与したファイルの識別子を格納する。ファイル識別子313は、電子情報管理システム1内でユニークな値であり、同一のファイル名で異なるファイルサーバ7や異なるフォルダに格納されているファイルを識別する。なお、ファイル識別子313は、ファイルやデータを特定する識別子で構成すればよく、例えば、ツール名/会社名/プラント名/業務名/工程名/ファイル名のように、広い観点から徐々に詳細化された内容に向かってスラッシュで区切ることにより構造化された識別子等で構成することができる。 The file identifier 313 stores the file identifier assigned by the directory analysis unit 6. The file identifier 313 is a unique value within the electronic information management system 1, and identifies files with the same file name stored on different file servers 7 or in different folders. The file identifier 313 may be configured with an identifier that identifies a file or data, and may be configured with an identifier that is structured by separating the contents with slashes from a broad perspective and moving towards increasingly more detailed contents, such as tool name/company name/plant name/business name/process name/file name.

ファイル名314は、ファイルに付与されている名称を格納する。ディレクトリ315は、ファイルが格納されているファイルサーバとフォルダあるいはURL等、ファイルの所在を格納する。 File name 314 stores the name given to the file. Directory 315 stores the location of the file, such as the file server and folder in which the file is stored, or the URL.

図8は、頻出単語リスト32の一例を示す図である。頻出単語リスト32は、文書解析部4によってファイル毎に生成される。頻出単語リスト32は、順位321と、抽出語322と、品詞/活用323と、頻度324をひとつのエントリに含む。 Figure 8 shows an example of the frequent word list 32. The frequent word list 32 is generated for each file by the document analysis unit 4. The frequent word list 32 includes a rank 321, an extracted word 322, a part of speech/conjugation 323, and a frequency 324 in each entry.

順位321は、出現頻度の順位を格納する。抽出語322は、文書解析部4によってファイルから抽出された単語を格納する。品詞/活用323は、文書解析部4が判定した品詞又は活用を格納する。頻度324は、ファイル内での抽出語の出現頻度を格納する。 Ranking 321 stores the ranking of occurrence frequency. Extracted words 322 store the words extracted from the file by the document analysis unit 4. Part of speech/conjugation 323 stores the part of speech or conjugation determined by the document analysis unit 4. Frequency 324 stores the frequency of occurrence of the extracted words in the file.

頻出単語リスト32は、解析対象のファイルに含まれる単語を出現頻度順にソートすることで、ファイルの特徴を表す単語を提示することができる。本実施例では、後述するように、出現頻度順が所定の上位(例えば、30位)までの単語を用いてファイルの関係を比較する。 The frequent word list 32 can present words that represent the characteristics of a file by sorting the words contained in the file to be analyzed in order of frequency of occurrence. In this embodiment, as described below, the relationships between files are compared using words that appear in a predetermined top order (e.g., the 30th place).

図9は、ファイル関係テーブル33の一例を示す図である。ファイル関係テーブル33は、ファイル関係抽出部5によってファイル毎に生成される。ファイル関係テーブル33は、列331方向のファイル識別子と、行332方向のファイル識別子で2つのファイルの関係を格納する。 Figure 9 is a diagram showing an example of the file relationship table 33. The file relationship table 33 is generated for each file by the file relationship extraction unit 5. The file relationship table 33 stores the relationship between two files using a file identifier in the column 331 direction and a file identifier in the row 332 direction.

2つのファイルの関係は、関係リンクと、業務の一致度合い、工程の一致度合い、ファイルの類似度を含む。関係リンクは、一例として、以下の業務の一致度合い、工程の一致度合い、類似度の値で取り決められたルールに従い決定される。2つのファイルに関係がある場合には丸印が設定され、関係性がない場合には×印が設定される。 The relationship between two files includes a relationship link, the degree of matching of the tasks, the degree of matching of the processes, and the similarity of the files. As an example, the relationship link is determined according to rules set by the following values of the degree of matching of the tasks, the degree of matching of the processes, and the similarity. If the two files are related, a circle is set, and if there is no relationship, an X is set.

業務の一致度合いは、2つのファイルが同一の業務で使用される場合には「一致」が設定され、そうでない場合には「不一致」が格納される。工程の一致度合いは、2つのファイルが同一の工程で使用される場合には「一致」が設定され、そうでない場合には「不一致」が格納される。 The degree of similarity of tasks is set to "match" if two files are used in the same task, and "mismatch" is stored otherwise. The degree of similarity of processes is set to "match" if two files are used in the same process, and "mismatch" is stored otherwise.

ファイルの類似度は、本実施例では、一例として、2つのファイル間で出現頻度順が所定の上位(例えば、30位)までの単語の一致度合い(比率)で示す。なお、単語の一致度合いの他に、単語の意味の類似性を加味して2つのファイルの単語の類似度を算出して比較してもよい。単語の類似度の算出には、例えば、Word2Vec等のソフトウェアを利用することができる。 In this embodiment, the similarity of files is shown as the degree of match (ratio) of words that appear in a certain order of frequency between two files (for example, 30th place). In addition to the degree of match of words, the similarity of the meanings of words may also be taken into account to calculate and compare the similarity of words between two files. Software such as Word2Vec can be used to calculate the similarity of words.

ファイル関係抽出部5が行う関係リンクの判定の一例は、予め設定された条件を満足していれば関係有りと判定し、例えば、2つのファイルの業務が「一致」で、類似度が所定の第1閾値Th1(14%)を超えていれば関係ありと判定することができる。なお、工程が「不一致」の場合でも類似度が所定の第2閾値Th2(49%)を超えていれば2つのファイルは関係有りと判定することができる。なお、第1閾値Th1<第2閾値Th2の関係である。 One example of the relationship link determination performed by the file relationship extraction unit 5 is to determine that there is a relationship if a preset condition is satisfied. For example, if the tasks of the two files are "matching" and the similarity exceeds a predetermined first threshold Th1 (14%), it can be determined that there is a relationship. Note that even if the processes are "mismatching," the two files can be determined to be related if the similarity exceeds a predetermined second threshold Th2 (49%). Note that the relationship is first threshold Th1 < second threshold Th2.

これにより、ファイル内で出現頻度が上位の単語の一致度合いが第2閾値Th2を超えていれば、使用する工程が一致しない場合でも関係リンクを設定することで工程を超えて利用可能なファイルを自動的に抽出することができる。 As a result, if the degree of match of the most frequently occurring words in the file exceeds the second threshold value Th2, it is possible to automatically extract files that can be used across processes by setting a relationship link even if the processes used do not match.

図10は、メタ情報テーブル34の一例を示す図である。メタ情報テーブル34は、業務ID341と、工程ID342と、ファイルID343と、ディレクトリ344と、頻出単語リスト345と、関係リンク346をひとつのエントリに含む。 Figure 10 is a diagram showing an example of meta information table 34. Meta information table 34 includes a task ID 341, a process ID 342, a file ID 343, a directory 344, a frequently used word list 345, and a relationship link 346 in one entry.

業務ID341は、業務を特定する識別子を格納する。業務ID341は、業務工程文書テーブル31の業務識別子311に対応する。工程ID342は、工程を特定する識別子を格納する。工程ID342は、業務工程文書テーブル31の工程識別子312に対応する。なお、業務識別子311と、工程識別子312は、業務1/工程1のようにスラッシュ区切りで表示してもよい。 The task ID 341 stores an identifier that identifies the task. The task ID 341 corresponds to the task identifier 311 in the task process document table 31. The process ID 342 stores an identifier that identifies the process. The process ID 342 corresponds to the process identifier 312 in the task process document table 31. Note that the task identifier 311 and the process identifier 312 may be displayed separated by a slash, such as task 1/process 1.

ファイルID343は、ファイルを特定する識別子を格納する。ファイルID343は、業務工程文書テーブル31のファイル識別子313に対応する。ディレクトリ344は、ファイルの所在を格納する。ディレクトリ344は、業務工程文書テーブル31のディレクトリ315に対応する。 File ID 343 stores an identifier that identifies the file. File ID 343 corresponds to file identifier 313 in business process document table 31. Directory 344 stores the location of the file. Directory 344 corresponds to directory 315 in business process document table 31.

頻出単語リスト345は、ファイル毎に生成された頻出単語リスト32のうち出現頻度が所定の上位(例えば、上位30語)の抽出語322を格納する。関係リンク346は、ファイル関係テーブル33のうち、関係リンクが有りのファイルや工程、業務のペアが格納される。 The frequent word list 345 stores extracted words 322 that appear in a predetermined order of frequency (e.g., the top 30 words) from the frequent word list 32 generated for each file. The relationship link 346 stores pairs of files, processes, and tasks that have relationship links from the file relationship table 33.

メタ情報テーブル34は、業務のメタ情報と、工程のメタ情報と、ファイルのメタ情報をそれぞれ格納することができる。図中1行目の「業務1」では、工程ID342とファイルID343がブランクであることから「業務1」のメタ情報を示す。業務単位のメタ情報は、頻出単語リスト345と関係リンク346で構成される。 The meta information table 34 can store meta information for business tasks, meta information for processes, and meta information for files. In the first row of the figure, "Business Task 1" shows meta information for "Business Task 1" because the process ID 342 and file ID 343 are blank. Meta information for each business task is made up of a frequently used word list 345 and a relationship link 346.

図中2行目の「工程1」では、ファイルID343がブランクで業務ID341が「業務1」であることから「工程1」のメタ情報を示す。工程単位のメタ情報は、業務ID341と頻出単語リスト345及び関係リンク346で構成される。 In the second line of the figure, "Process 1" shows meta information for "Process 1" because the file ID 343 is blank and the task ID 341 is "Task 1." Meta information for each process is made up of the task ID 341, the frequently used word list 345, and the related link 346.

図中3行目の「ファイル1」では、業務ID341と工程ID342がファイルID343に値が設定されていることから「ファイル1」のメタ情報を示す。ファイル単位のメタ情報は、業務ID341と工程ID342とファイルID343とディレクトリ344と頻出単語リスト345及び関係リンク346で構成される。ファイルは、異なる工程や、異なる業務で共通して使用される場合があるため、業務ID341と工程ID342は複数設定されてもよい。 In the third row of the figure, "File 1" shows meta information for "File 1" since values for task ID 341 and process ID 342 are set in file ID 343. Meta information for each file is made up of task ID 341, process ID 342, file ID 343, directory 344, frequent word list 345, and related link 346. Since a file may be commonly used in different processes or different tasks, multiple task IDs 341 and process IDs 342 may be set.

図11は、業務と工程及びファイルのメタ情報の関係を示す図である。図11では、業務単位の業務Aメタ情報3400-1と、工程単位の工程1メタ情報3410-1~工程mメタ情報3410-mと、ファイル単位のファイル11メタ情報3420-11~ファイルmnメタ情報3420-mnの関係を示す。 Figure 11 shows the relationship between tasks, processes, and file meta information. Figure 11 shows the relationship between task A meta information 3400-1 on a task basis, process 1 meta information 3410-1 through process m meta information 3410-m on a process basis, and file 11 meta information 3420-11 through file mn meta information 3420-mn on a file basis.

工程1の工程1メタ情報3410-1は、工程1で使用されたファイル11~1nのファイル11メタ情報3420-11~ファイル1nメタ情報3420-1nを集約(又は結合)した情報である。工程2~mのメタ情報3410-2~3410-mについても同様である。業務Aメタ情報3400-1は、工程1メタ情報3410-1~工程mメタ情報3410-mを集約(又は結合)した情報である。 The process 1 meta information 3410-1 for process 1 is information obtained by aggregating (or combining) the file 11 meta information 3420-11 to file 1n meta information 3420-1n for files 11 to 1n used in process 1. The same is true for the meta information 3410-2 to 3410-m for processes 2 to m. The task A meta information 3400-1 is information obtained by aggregating (or combining) the process 1 meta information 3410-1 to process m meta information 3410-m.

図12は、業務と工程及びファイルのメタ情報の内容を示す図である。図12では、業務Aメタ情報3400-1と、工程1メタ情報3410-1と、ファイル11メタ情報3420-11~ファイル1nメタ情報3420-nの内容を示す。 Figure 12 is a diagram showing the contents of meta information for tasks, processes, and files. Figure 12 shows the contents of task A meta information 3400-1, process 1 meta information 3410-1, and file 11 meta information 3420-11 to file 1n meta information 3420-n.

<処理の概要>
図2は、電子情報管理システム1で行われる処理の概要を示すフローチャートである。この処理は、業務の追加や変更、あるいは定期的等の所定のタイミングで実行される。まず、業務端末8を操作する管理者等により業務フローの記録開始が指示されると、情報解析蓄積サーバ2の業務記録部3が、業務端末8で行われる処理を監視して、使用されるファイルを業務の工程毎に業務工程文書テーブル31へ記録する(S1)。
<Processing Overview>
2 is a flowchart showing an outline of the processing performed in the electronic information management system 1. This processing is performed at a predetermined timing, such as when a task is added or changed, or periodically. First, when an instruction to start recording the task flow is given by an administrator or the like who operates the task terminal 8, the task recording unit 3 of the information analysis and accumulation server 2 monitors the processing performed on the task terminal 8 and records the files used for each task step in the task step document table 31 (S1).

なお、業務の名称又は識別子は、図3で示すように、管理者等が業務端末8から情報解析蓄積サーバ2に予め設定し(S10)、工程の名称又は識別子も管理者等が業務端末8から情報解析蓄積サーバ2に予め設定しておけばよい。 As shown in FIG. 3, the name or identifier of the business can be preset by the administrator or the like in the information analysis and accumulation server 2 from the business terminal 8 (S10), and the name or identifier of the process can also be preset by the administrator or the like in the information analysis and accumulation server 2 from the business terminal 8.

そして、業務を実施するオペレータは業務端末8から工程を指定してファイルのアクセスを行い、業務記録部3は、業務端末8で使用されたファイル名314とディレクトリ315を取得して(図3のS11)、業務の工程毎に業務工程文書テーブル31へ記録する(図3のS12)。また、業務と各工程の識別と業務工程文書テーブル31への記録は、前記従来例等の業務フローの自動生成ツールを用いて自動的に行ってもよい。 The operator who performs the work then accesses the file by specifying a process from the work terminal 8, and the work recorder 3 acquires the file name 314 and directory 315 used on the work terminal 8 (S11 in FIG. 3) and records them in the work process document table 31 for each work process (S12 in FIG. 3). In addition, the identification of the work and each process and the recording in the work process document table 31 may be performed automatically using an automatic work flow generation tool such as the conventional example.

オペレータによる業務が終了すると、業務端末8を操作する管理者等により業務フローの記録終了が指示される。情報解析蓄積サーバ2の業務記録部3は、ディレクトリ解析部6に解析対象の業務についてファイルの読み込みを指令する。ディレクトリ解析部6は、解析対象の業務について業務工程文書テーブル31を参照して各工程識別子312で指定された工程毎にファイルを読み込む(S2)。 When the operator finishes the task, the administrator or the like who operates the task terminal 8 instructs the end of recording the task flow. The task recording unit 3 of the information analysis and accumulation server 2 instructs the directory analysis unit 6 to read files for the task to be analyzed. The directory analysis unit 6 refers to the task process document table 31 for the task to be analyzed and reads files for each process specified by each process identifier 312 (S2).

ディレクトリ解析部6によるファイルの読み込みが完了すると情報解析蓄積サーバ2の文書解析部4が、辞書35を用いて各ファイルを解析して単語を抽出する(S3)。次に、文書解析部4は抽出した単語について出現頻度を算出して頻出単語リスト32をファイル毎に生成する(S4)。 When the directory analysis unit 6 has finished reading the files, the document analysis unit 4 of the information analysis and storage server 2 analyzes each file using the dictionary 35 to extract words (S3). Next, the document analysis unit 4 calculates the frequency of occurrence of the extracted words and generates a frequent word list 32 for each file (S4).

文書解析部4はファイル関係抽出部5を用いて、解析対象の業務の各工程で使用されたファイルの頻出単語リスト32を比較し、ファイル間の類似度を算出し(S5)、業務や工程の一致度合いとファイルの類似度から関係リンクの有無を判定してファイル関係テーブル33を生成する(S6)。 The document analysis unit 4 uses the file relationship extraction unit 5 to compare the frequent word lists 32 of the files used in each process of the business being analyzed, calculate the similarity between the files (S5), and determine whether or not there is a relationship link based on the degree of agreement between the business or process and the similarity of the files to generate a file relationship table 33 (S6).

業務記録部3は、ファイル関係テーブル33の生成が完了すると、業務フローとしての業務工程文書テーブル31と、頻出単語リスト32と、ファイル関係テーブル33からメタ情報テーブル34を生成する(S7)。 When the business recording unit 3 has completed generating the file relationship table 33, it generates a business process document table 31 as a business flow, a frequent word list 32, and a meta information table 34 from the file relationship table 33 (S7).

以上の処理によって生成された業務工程文書テーブル31とメタ情報テーブル34により、情報解析蓄積サーバ2は業務端末8で業務を実施するオペレータに対して、工程毎にどのファイルを使用すればよいか、また、ファイルの所在がどこであるかを提示することができる。 By using the business process document table 31 and meta information table 34 generated by the above process, the information analysis and storage server 2 can present to the operator performing the work on the business terminal 8 which file to use for each process and where the file is located.

さらに、メタ情報テーブル34は、工程毎に関係のあるファイルを関係リンクとして提示することができる。関係リンクを有するファイルは、業務工程文書テーブル31の同一工程では使用されなかった場合でも単語の出現頻度に基づく類似度が第2閾値Th2を超えるファイルであれば、利用価値の高いファイルとして関係リンクを付与しておくことで自動的に提示することができる。 Furthermore, the meta information table 34 can present files related to each process as related links. Even if a file with a related link was not used in the same process in the business process document table 31, if the file has a similarity based on the word occurrence frequency that exceeds the second threshold value Th2, the file can be automatically presented as a highly useful file by adding a related link to it.

このように、情報解析蓄積サーバ2は業務フローにメタ情報テーブル34を組み合わせて提示することで、工程毎に使用するファイルと利用価値の高いファイルを自動的に提供することで、業務の効率を向上させることが可能となる。 In this way, the information analysis and storage server 2 can combine and present the meta information table 34 with the business flow, automatically providing the files to be used in each process and the files with high utility value, thereby improving business efficiency.

<処理の詳細>
図5~図7は、電子情報管理システム1で行われる処理の詳細を示すフローチャートである。この処理は、電子情報管理システム1の管理者等の指令に基づいて開始される。業務端末8を操作する管理者等が業務の名称又は業務の識別子や工程の名称又は工程毎の識別子等で構成される業務の定義を情報解析蓄積サーバ2の業務記録部3に指令する(S21)。業務記録部3は、業務端末8から受け付けた業務の定義をストレージ装置23の業務工程文書テーブル31へ業務情報として記録する(S22)。
<Processing details>
5 to 7 are flow charts showing details of the processing performed in the electronic information management system 1. This processing is started based on a command from an administrator of the electronic information management system 1. The administrator who operates the business terminal 8 commands the business record unit 3 of the information analysis and accumulation server 2 to define a business, which is composed of a business name or a business identifier, a process name or an identifier for each process, etc. (S21). The business record unit 3 records the business definition received from the business terminal 8 in the business process document table 31 of the storage device 23 as business information (S22).

次に、管理者等が業務端末8から業務の記録開始を指令する(S23)。業務記録部3は、オペレータが操作する業務端末8で行われる処理(S26)の内容を記録し(S24)、工程毎のファイルの情報をストレージ装置23の業務工程文書テーブル31へ記録する(S25)。なお、業務記録部3は、業務端末8が行った処理のログをストレージ装置23に格納することができる。 Next, the manager or the like issues a command to start recording the work from the business terminal 8 (S23). The work recording unit 3 records the contents of the process (S26) performed on the business terminal 8 operated by the operator (S24), and records file information for each process in the work process document table 31 of the storage device 23 (S25). The work recording unit 3 can store the log of the process performed by the business terminal 8 in the storage device 23.

業務記録部3は、工程毎に使用するファイルを業務工程文書テーブル31に記録することで業務フローを構築していく(S27)。ファイルサーバ7は、業務端末8からアクセス要求(S28)を受け付けると、指定されたファイルを出力する(S29)。業務記録部3は、業務端末8の処理を監視してアクセス要求のファイル名とディレクトリを業務工程文書テーブル31へ記録する(S30)。 The business record unit 3 builds a business flow by recording the files used for each process in the business process document table 31 (S27). When the file server 7 receives an access request (S28) from the business terminal 8, it outputs the specified file (S29). The business record unit 3 monitors the processing of the business terminal 8 and records the file name and directory of the access request in the business process document table 31 (S30).

業務端末8での業務が終了すると(S31)、業務記録部3は業務端末8で行われた処理の記録を終了する(S32)。なお、上述したように、業務の終了時に管理者等が明示的に記録の終了を業務記録部3へ指令してもよい。 When the business on the business terminal 8 is completed (S31), the business record unit 3 ends recording of the processing performed on the business terminal 8 (S32). As described above, an administrator or the like may explicitly instruct the business record unit 3 to end recording when the business is completed.

業務記録部3は、ディレクトリ解析部6を用いて解析対象の業務で使用したファイルを読み込み、文書解析部4に読み込んだファイルの文書の解析を指令する(S33)。文書解析部4は、辞書35を用いて各ファイルを解析して単語を抽出し、抽出した単語についてファイル内の出現頻度を算出して頻出単語リスト32をファイル毎に生成する(S34)。 The business record unit 3 uses the directory analysis unit 6 to read the files used in the business to be analyzed, and instructs the document analysis unit 4 to analyze the documents in the read files (S33). The document analysis unit 4 uses the dictionary 35 to analyze each file and extract words, calculates the frequency of occurrence of the extracted words within the file, and generates a frequent word list 32 for each file (S34).

次に、文書解析部4は、辞書35を参照して(S35)、抽出した単語の中に辞書35に収録されていない単語があれば新語として出力する(S36)。業務記録部3は、文書解析部4から新語が出力されると、業務端末8に新語を辞書35へ登録するか否かを問い合わせる(S37)。 Next, the document analysis unit 4 refers to the dictionary 35 (S35), and if any of the extracted words are not included in the dictionary 35, it outputs them as new words (S36). When the new word is output from the document analysis unit 4, the business recording unit 3 inquires of the business terminal 8 whether or not to register the new word in the dictionary 35 (S37).

業務端末8では管理者等が新語の登録の可否を判定して(S38)、辞書35に新語を登録するか否かを指令する(S39)。 At the business terminal 8, the administrator or the like determines whether or not the new word can be registered (S38) and issues a command as to whether or not to register the new word in the dictionary 35 (S39).

次に、図6のステップS40では、業務記録部3が今回生成した業務工程文書テーブル31の業務識別子311や工程識別子312について適切であるかを業務端末8に問い合わせる。業務端末8では管理者等が業務工程文書テーブル31を参照して適切であれば業務識別子311や工程識別子312を決定し(S41、S42)、ストレージ装置23の業務工程文書テーブル31に記録する(S43)。なお、適切でない場合には管理者等が修正内容を業務工程文書テーブル31へ記録する。 Next, in step S40 of FIG. 6, the business record unit 3 inquires of the business terminal 8 whether the business identifier 311 and process identifier 312 of the business process document table 31 generated this time are appropriate. In the business terminal 8, the manager or the like refers to the business process document table 31, and if they are appropriate, determines the business identifier 311 and process identifier 312 (S41, S42) and records them in the business process document table 31 of the storage device 23 (S43). If they are not appropriate, the manager or the like records the corrections in the business process document table 31.

業務記録部3は、ディレクトリ解析部6を用いて業務工程文書テーブル31のファイル名314と、ディレクトリ315をファイルサーバ7に照会する(S44)。業務記録部3は、ディレクトリの照会結果をストレージ装置23の業務工程文書テーブル31に記録する(S45、S46)。 The business record unit 3 uses the directory analysis unit 6 to query the file server 7 for the file name 314 and the directory 315 in the business process document table 31 (S44). The business record unit 3 records the directory query result in the business process document table 31 in the storage device 23 (S45, S46).

次に、業務記録部3は業務工程文書テーブル31から業務識別子311、工程識別子312を収集して用語リスト(図示省略)として生成してストレージ装置23へ一時的に記録する(S45、S46)。 Next, the business record unit 3 collects the business identifier 311 and the process identifier 312 from the business process document table 31, generates a term list (not shown), and temporarily records it in the storage device 23 (S45, S46).

業務記録部3は生成した用語リストを文書解析部4で解析させて(S48)、業務工程文書テーブル31のファイル間の関係を比較するための識別子を抽出する。次に、文書解析部4は、抽出した識別子と頻出単語リスト32を読み込んで、業務工程文書テーブル31のファイル間の関係を評価する(S49)。文書解析部4は、ファイル毎に業務の一致度合いと、工程の一致度合いと、頻出単語リスト32の一致度合いに基づく類似度を算出し、上述したように関係リンクの有無をファイルのペア単位で評価する(S50)。 The business record unit 3 has the document analysis unit 4 analyze the generated term list (S48), and extracts identifiers for comparing the relationships between files in the business process document table 31. Next, the document analysis unit 4 reads the extracted identifiers and the frequent word list 32, and evaluates the relationships between files in the business process document table 31 (S49). The document analysis unit 4 calculates the similarity for each file based on the degree of agreement of the business, the degree of agreement of the process, and the degree of agreement of the frequent word list 32, and evaluates the presence or absence of a relationship link for each file pair as described above (S50).

文書解析部4は評価結果を業務記録部3に通知し、業務記録部3はファイル関係抽出部5に評価結果に基づくファイル関係テーブル33の生成を指令する(S51)。ファイル関係抽出部5は、文書解析部4から評価結果を取得してファイル関係テーブル33を生成する。 The document analysis unit 4 notifies the business record unit 3 of the evaluation result, and the business record unit 3 instructs the file relationship extraction unit 5 to generate a file relationship table 33 based on the evaluation result (S51). The file relationship extraction unit 5 obtains the evaluation result from the document analysis unit 4 and generates the file relationship table 33.

次に、図7のステップS52では、業務記録部3がディレクトリ解析部6にファイル識別子313を生成させて、各ファイルのファイル識別子313が適切であるかを業務端末8に問い合わせる。管理者等は業務工程文書テーブル31のファイル名314とディレクトリ315とファイル識別子313を確認し、ファイル識別子313が適切に付与されているかを判定する(S53)。 Next, in step S52 of FIG. 7, the business record unit 3 causes the directory analysis unit 6 to generate file identifiers 313, and queries the business terminal 8 as to whether the file identifiers 313 of each file are appropriate. The manager or the like checks the file names 314, directories 315, and file identifiers 313 in the business process document table 31, and determines whether the file identifiers 313 have been assigned appropriately (S53).

管理者等は、ファイル識別子313が適切であれば業務端末8からファイル識別子313を決定する指令を通知し(S54)、業務記録部3はファイル識別子313を業務工程文書テーブル31に記録する(S55)。なお、適切でない場合には管理者等が修正内容を業務工程文書テーブル31へ記録する。 If the file identifier 313 is appropriate, the manager or the like issues a command to determine the file identifier 313 from the business terminal 8 (S54), and the business record unit 3 records the file identifier 313 in the business process document table 31 (S55). If it is not appropriate, the manager or the like records the corrections in the business process document table 31.

業務記録部3は、業務識別子311と、工程識別子312と、ファイル識別子313と、頻出単語リスト32と、ディレクトリ315を読み込んで、ファイル単位のメタ情報を図12で示したように生成してメタ情報テーブル34に記録する(S56)。 The business record unit 3 reads the business identifier 311, the process identifier 312, the file identifier 313, the frequent word list 32, and the directory 315, and generates file-based meta information as shown in FIG. 12 and records it in the meta information table 34 (S56).

業務記録部3は、業務識別子311と、工程識別子312と、同一工程内のファイル単位のメタ情報を読み込んで、集約(又は結合)して工程単位のメタ情報を図12で示したように生成してメタ情報テーブル34に記録する(S57)。 The business record unit 3 reads the business identifier 311, the process identifier 312, and the meta information for each file within the same process, aggregates (or combines) them to generate meta information for each process as shown in FIG. 12, and records this in the meta information table 34 (S57).

業務記録部3は、業務識別子311と、同一業務内の工程単位のメタ情報を読み込んで、集約(又は結合)して業務単位のメタ情報を図12で示したように生成してメタ情報テーブル34に記録する(S58)。 The business record unit 3 reads the business identifier 311 and meta information for process units within the same business, aggregates (or combines) it to generate meta information for business units as shown in FIG. 12, and records it in the meta information table 34 (S58).

業務記録部3は、生成したメタ情報テーブル34を業務端末8に提示して、適切であるかの判定を依頼する(S59)。業務端末8では、管理者等がメタ情報テーブル34を参照して適切であるかを判定する(S60)。管理者等はメタ情報テーブル34が適切であれば登録(又は決定)の指令を業務端末8から送信する(S61)。業務記録部3は、業務端末8からの指令に基づいてメタ情報テーブル34をストレージ装置23に記録する。なお、適切でない場合には管理者等が修正内容をメタ情報テーブル34へ記録する。 The business record unit 3 presents the generated meta-information table 34 to the business terminal 8 and requests a judgment as to whether it is appropriate (S59). At the business terminal 8, the manager or the like refers to the meta-information table 34 and judges whether it is appropriate (S60). If the meta-information table 34 is appropriate, the manager or the like sends a command to register (or decide) from the business terminal 8 (S61). The business record unit 3 records the meta-information table 34 in the storage device 23 based on the command from the business terminal 8. Note that if it is not appropriate, the manager or the like records the corrections to the meta-information table 34.

以上により、業務工程文書テーブル31と頻出単語リスト32と、ファイル関係テーブル33と、メタ情報テーブル34が生成され、情報解析蓄積サーバ2は業務端末8で業務を実施するオペレータに対して、工程毎に使用するファイルと、工程毎に関連するファイルを提示することが可能となる。 As a result of the above, a business process document table 31, a frequent word list 32, a file relationship table 33, and a meta information table 34 are generated, and the information analysis and storage server 2 is able to present the files used for each process and the files related to each process to the operator performing the work on the business terminal 8.

<業務支援>
図13は、業務フローの支援画面の一例を示す図である。情報解析蓄積サーバ2の業務フロー提示部40は、上述の処理によって生成された業務工程文書テーブル31とメタ情報テーブル34を用いて業務端末8で実施される業務を支援するため、図12の業務フロー提示画面400を業務端末8に出力する。
<Business support>
Fig. 13 is a diagram showing an example of a business flow support screen. The business flow presentation unit 40 of the information analysis and accumulation server 2 outputs the business flow presentation screen 400 of Fig. 12 to the business terminal 8 in order to support the business performed on the business terminal 8 using the business process document table 31 and the meta information table 34 generated by the above-mentioned processing.

業務端末8のディスプレイ(図示省略)に表示される業務フロー提示画面400は、選択された業務の名称を表示する業務表示部410と、指定された工程の名称を表示する工程表示部420と、指定された工程で使用可能なファイルを提示するファイル表示部430と、関係リンクを有するファイルを抽出する関連文書抽出ボタン440と、提示するファイルを編集する編集ボタン450と、編集内容を確定させる確定ボタン460を含む。 The business flow presentation screen 400 displayed on the display (not shown) of the business terminal 8 includes a business display section 410 that displays the name of the selected business, a process display section 420 that displays the name of the specified process, a file display section 430 that displays files that can be used in the specified process, a related document extraction button 440 that extracts files with related links, an edit button 450 that edits the presented files, and a confirm button 460 that confirms the edited contents.

業務表示部410は、図示しない選択画面において選択された業務の名称を表示する。工程表示部420は、業務を構成する工程の名称を表示し、現在選択されている「工程1」が強調表示される。 The task display section 410 displays the name of the task selected on a selection screen (not shown). The process display section 420 displays the names of the processes that make up the task, with the currently selected "Process 1" being highlighted.

ファイル表示部430は、業務工程文書テーブル31のファイル名314と、メタ情報テーブル34の関係リンク346のファイルを表示することができる。業務端末8のオペレータは、ファイル表示部430のファイル名をクリックすることで選択したファイルを開くことができる。 The file display section 430 can display the file names 314 in the business process document table 31 and the files in the relationship links 346 in the meta information table 34. The operator of the business terminal 8 can open the selected file by clicking on the file name in the file display section 430.

関連文書抽出ボタン440をクリックすることで、電子情報管理システム1内のファイルサーバ7に蓄積された文書と、現在選択中の工程で使用されている業務工程文書テーブル31のファイルの関係リンクを再計算して、新たに関係リンクが発生したファイルを抽出することができる。 Clicking the Extract Related Documents button 440 recalculates the relationship links between the documents stored in the file server 7 in the electronic information management system 1 and the files in the business process document table 31 used in the currently selected process, and extracts files for which new relationship links have been generated.

業務端末8で関連文書抽出ボタン440がクリックされると、情報解析蓄積サーバ2は、図2に示したステップS5~S7を実行して、現在選択中の工程で使用されるファイルに関係性を有する新たなファイルを抽出して、ファイル表示部430にNew431のアイコンを表示する。新たに抽出された関係リンクはファイル関係テーブル33とメタ情報テーブル34に追加される。 When the Extract Related Documents button 440 is clicked on the business terminal 8, the information analysis and accumulation server 2 executes steps S5 to S7 shown in FIG. 2 to extract new files that are related to the files used in the currently selected process, and displays the New 431 icon in the file display section 430. The newly extracted relationship link is added to the file relationship table 33 and the meta information table 34.

編集ボタン450をクリックすることでファイル表示部430の内容を編集することができ、確定ボタン460をクリックすることで編集内容を確定して、業務工程文書テーブル31やファイル関係テーブル33やメタ情報テーブル34に反映させることができる。 The contents of the file display section 430 can be edited by clicking the edit button 450, and the edited contents can be confirmed by clicking the confirm button 460 and reflected in the business process document table 31, the file relationship table 33, and the meta information table 34.

情報解析蓄積サーバ2の業務フロー提示部40を利用することで、業務端末8のオペレータは、各工程で必要なファイルの所在を気にすることなく、業務フロー提示画面400のファイル表示部430内のファイルを開くことで業務を正確に実施することができる。 By using the business flow presentation section 40 of the information analysis and accumulation server 2, the operator of the business terminal 8 can accurately carry out business operations by opening files in the file display section 430 of the business flow presentation screen 400 without having to worry about the location of the files required for each process.

これにより、ファイル等を探す労力を低減することで業務の効率化を図ることができる。さらに、関連文書抽出ボタン440を操作することで、各工程で使用するファイルに関連する関係リンクを随時更新することが可能となり、ファイルサーバ7に追加又は更新されたファイルのうち当該工程のファイルと関係性を有するファイルを随時抽出することができる。 This reduces the effort required to search for files, etc., thereby improving work efficiency. Furthermore, by operating the related document extraction button 440, it is possible to update the related links related to the files used in each process at any time, and files that have a relationship with the file of the process from among the files that have been added or updated to the file server 7 can be extracted at any time.

これにより、情報解析蓄積サーバ2によって、新たなファイルを迅速に業務フローに組み込むことが可能となって、業務フローの鮮度を保持して業務の効率を向上させることが可能となる。 This allows the information analysis and storage server 2 to quickly incorporate new files into the business flow, keeping the business flow fresh and improving business efficiency.

以上のような構成によって情報解析蓄積サーバに業務フローや工程、ファイルのメタ情報が蓄積されることにより、情報解析蓄積サーバによって関係性を持たせた情報以外に、業務に従事する者(オペレータ)が業務を実施する際に、業務端末8に別途実装される検索機能を用いて、欲しい情報を手動検索で探す際についても、メタ情報テーブル34が効果を発して、検索対象を超えた結果を導くことが可能となる。このように、オペレータが人為的に業務に関する知見を導入していくことも可能である。 By storing meta-information on business flows, processes, and files in the information analysis and storage server with the above configuration, in addition to the information that has been made relevant by the information analysis and storage server, when a person engaged in business (operator) performs a business operation, using a search function separately implemented in the business terminal 8 to manually search for the desired information, the meta-information table 34 is effective and can lead to results that go beyond the scope of the search. In this way, it is also possible for an operator to artificially introduce knowledge about the business.

図14は、第2の実施例を示し、前記実施例1の図2のステップS6に示したファイル関係抽出において、ファイル間の関係を可視化する解析画面500をファイル関係抽出部5が生成して業務端末8に出力する例を示す。その他の構成については、前記実施例1と同様である。 Figure 14 shows a second embodiment, in which the file relationship extraction unit 5 generates an analysis screen 500 that visualizes the relationships between files in the file relationship extraction shown in step S6 of Figure 2 of the first embodiment, and outputs the analysis screen 500 to the business terminal 8. The other configurations are the same as those of the first embodiment.

本実施例では、文書解析部4がファイル毎に頻出単語リスト32を生成するのに加えて単語の相関関係図を生成し、ファイル関係抽出部5が比較対象の2つのファイルの単語の相関関係図の関連する単語を解析画面500に表示する。 In this embodiment, the document analysis unit 4 generates a word correlation diagram in addition to generating a frequent word list 32 for each file, and the file relationship extraction unit 5 displays related words in the word correlation diagram for the two files being compared on the analysis screen 500.

なお、単語の相関関係図の生成については周知又は公知の技術を適用すればよく、比較対象のファイルで連続する単語を各頂点とし、それらを接続することで、単語の関係性をネットワークにして表示すればよい。 The word correlation diagram can be generated by applying well-known or publicly known technology, where consecutive words in the files being compared are treated as vertices, and by connecting these vertices, the word relationships can be displayed as a network.

解析画面500は、2つのファイルA、Bについて解析対象を表示するファイルA解析結果510-A及びファイルB解析結果510-Bと、2つのファイルの関係リンク情報520の領域を有する。 The analysis screen 500 has areas for file A analysis results 510-A and file B analysis results 510-B, which display the analysis targets for two files A and B, and for relationship link information 520 for the two files.

ファイルA解析結果510-Aの領域には、ファイルAの頻出単語リスト32-Aを表示する領域と、ファイルAの単語の単語の相関関係図530-Aが含まれる。ファイルB解析結果510-Bの領域には、ファイルBの頻出単語リスト32-Bを表示する領域と、ファイルBの単語の単語の相関関係図530-Bが含まれる。 The area for file A analysis results 510-A includes an area for displaying file A's frequent word list 32-A, and a word correlation diagram 530-A for the words in file A. The area for file B analysis results 510-B includes an area for displaying file B's frequent word list 32-B, and a word correlation diagram 530-B for the words in file B.

ファイルA解析結果510-AとファイルB解析結果510-Bの間には、関係リンク情報520が表示される。関係リンク情報520には2つのファイルの単語の類似度と、業務名の一致度合いと、工程名の一致度合いが表示される。 Relationship link information 520 is displayed between the file A analysis results 510-A and the file B analysis results 510-B. The relationship link information 520 displays the degree of similarity between the words in the two files, the degree of agreement between the business names, and the degree of agreement between the process names.

解析画面500では、関係性が有ると判定された2つのファイルの単語の関係を、出現頻度と単語の接続関係で可視化することができる。これにより、業務端末8を利用するオペレータ又は管理者は、出現頻度の高い単語の把握やファイル全体の趣旨を理解することが可能となる。 On the analysis screen 500, the relationship between words in two files that have been determined to be related can be visualized by the frequency of occurrence and the connection between the words. This allows an operator or manager using the business terminal 8 to understand the words that appear frequently and the overall purpose of the files.

さらに、情報解析蓄積サーバによって自動で構築された関係リンクについて、オペレータからの「有用だった」、「違った」のフィードバックを記録することも可能である。これによって業務上、より重要な情報を優先的に表示させることも可能である。例えば、「有用だった」のフィードバックによって関係リンクの点数が上がり、優先的に提示されるようになる。逆に「違った」のフィードバックにより関係リンクの点数が下がり、優先度が下がる。このようなオペレータからのフィードバックによる「優先度」を、メタ情報テーブルに持たせることで実現可能である。この「優先度」は優先的に関係リンクを表示するか否かを決定する指標である。一例として、オペレータからの「有用だった」「違った」といったフィードバックに基づいて、ルールに従い増減する値である。 Furthermore, it is also possible to record feedback from operators such as "it was useful" or "it was different" about the relationship links that were automatically constructed by the information analysis and accumulation server. This makes it possible to prioritize the display of information that is more important for business purposes. For example, feedback such as "it was useful" will increase the score of the relationship link, and it will be presented with priority. Conversely, feedback such as "it was different" will decrease the score of the relationship link, lowering its priority. This can be achieved by having the meta information table hold "priority" based on feedback from operators. This "priority" is an index that determines whether or not to display relationship links with priority. As an example, it is a value that increases or decreases according to rules based on feedback from operators such as "it was useful" or "it was different."

<結び>
上記実施例1、2で説明したように、電子情報管理システム1は、業務を構成する複数の工程で使用されるファイルを工程毎に取得し、各ファイルで出現する単語を解析して類似度が大きいファイルを関連するファイルとして関係リンクを自動的に生成し、ファイル間の関係リンクとファイルの格納場所(所在)を工程に関連付けて自動的にメタ情報テーブル34に蓄積する。これにより、業務を構成する工程毎に必要とするファイルと関係リンクを有するファイルの情報が提供されるため、必要なファイルを探す労力を低減することで業務の効率化を図ることができる。また、関係リンクによって最新のファイルを提供することができ、最新の情報で業務を実施することができる。また、最新のファイルを優先的に表示することもできる。また、電子情報管理システム1は、散在するファイルを探す時間短縮だけではなく、部署内の情報の共有や熟練の技能の伝承を継続することができる。
<Conclusion>
As described in the above first and second embodiments, the electronic information management system 1 acquires files used in a plurality of steps constituting a task for each step, analyzes words appearing in each file, automatically generates a relational link with files having a high similarity as related files, and automatically stores the relational link between files and the storage location (location) of the file in association with the step in the meta information table 34. This provides information on files required for each step constituting a task and files having relational links, thereby reducing the effort required to search for necessary files and improving the efficiency of the task. In addition, the relational link can provide the latest files, allowing tasks to be performed with the latest information. In addition, the latest files can be preferentially displayed. In addition, the electronic information management system 1 not only reduces the time required to search for scattered files, but also allows information to be shared within a department and skilled techniques to be continuously passed on.

上記各実施例の電子情報管理システム1は、以下のような構成とすることができる。 The electronic information management system 1 in each of the above embodiments can be configured as follows:

(1)プロセッサ(21)とメモリ(22)を有する情報解析サーバ(情報解析蓄積サーバ2)が、ネットワーク(9)を介して接続された業務端末(8)で使用されたファイルを解析する情報解析方法であって、前記情報解析サーバが、業務(業務識別子311)を構成する複数の工程(工程識別子312)で使用される前記ファイル(314)を前記工程(312)毎に取得して前記工程(312)と前記ファイル(314)と前記ファイルの所在(ディレクトリ315)を関連付けて工程文書情報(業務工程文書テーブル31)に格納する第1のステップと、前記情報解析サーバ(2)が、前記ファイル(314)に含まれる単語を解析して前記単語が類似するファイルを関連するファイルとして関係リンクを生成する第2のステップと、前記情報解析サーバ(2)が、前記工程(312)毎に使用される前記ファイル(314)と、前記ファイルの所在(315)と、前記関係リンクをメタ情報(メタ情報テーブル34)に格納する第3のステップと、を含むことを特徴とする情報解析方法。 (1) An information analysis method in which an information analysis server (information analysis storage server 2) having a processor (21) and memory (22) analyzes a file used in a business terminal (8) connected via a network (9), the information analysis method including: a first step in which the information analysis server acquires the file (314) used in a plurality of processes (process identifier 312) constituting a business (business identifier 311) for each of the processes (312), associates the process (312), the file (314), and the location (directory 315) of the file, and stores them in process document information (business process document table 31); a second step in which the information analysis server (2) analyzes words contained in the file (314) and generates a relationship link by treating files with similar words as related files; and a third step in which the information analysis server (2) stores the file (314) used for each of the processes (312), the location (315) of the file, and the relationship link in meta information (meta information table 34).

上記構成によれば、情報解析蓄積サーバ2は、業務を構成する工程毎に必要とするファイルの所在(ディレクトリ315)と関係リンクを有するファイルの情報を提供することが可能となり、業務端末8のオペレータは必要なファイルを探す労力を低減することができ、業務の効率化を図ることができる。 With the above configuration, the information analysis and storage server 2 can provide information on the location of files (directory 315) required for each process that constitutes a business and files with related links, reducing the effort required by the operator of the business terminal 8 to search for the necessary files and improving the efficiency of business operations.

(2)上記(1)に記載の情報解析方法であって、前記第2のステップでは、前記単語の出現頻度をファイル毎に算出し、前記出現頻度が所定の上位の単語のうち、ファイル間で一致する単語の比率を類似度として算出し、前記類似度が所定の第1閾値(Th1)を超えていれば関連するファイルと判定して関係リンクを生成することを特徴とする情報解析方法。 (2) The information analysis method described in (1) above, wherein in the second step, the frequency of occurrence of the words is calculated for each file, the ratio of words that match between files among the words with a predetermined high frequency of occurrence is calculated as the similarity, and if the similarity exceeds a predetermined first threshold (Th1), the files are determined to be related and a relationship link is generated.

上記構成によれば、情報解析蓄積サーバ2は、ファイル間で単語の出現頻度が上位の単語を比較して、単語の一致度合いが第1閾値Th1を超えていれば、関係リンクを設定することで各工程で利用可能なファイルを自動的に抽出することができる。 According to the above configuration, the information analysis and accumulation server 2 compares the most frequently occurring words between files, and if the degree of matching between the words exceeds the first threshold value Th1, it can automatically extract files that can be used in each process by setting a relationship link.

(3)請求項2に記載の情報解析方法であって、前記第2のステップでは、前記ファイル(314)が使用される工程(312)がファイル間で一致しない場合でも、前記類似度が前記第1閾値Th1よりも大きい所定の第2閾値Th2を超えていれば関連するファイルと判定して関係リンクを生成することを特徴とする情報解析方法。 (3) The information analysis method according to claim 2, characterized in that in the second step, even if the process (312) in which the file (314) is used does not match between files, if the similarity exceeds a predetermined second threshold Th2 that is greater than the first threshold Th1, the files are determined to be related and a relationship link is generated.

上記構成によれば、情報解析蓄積サーバ2は、ファイル間で単語の出現頻度が上位の単語の一致度合いが第2閾値Th2を超えていれば、ファイルを使用する工程が一致しない場合でも関係リンクを設定することで工程を超えて利用可能なファイルを自動的に抽出することができる。 According to the above configuration, if the degree of matching of the most frequently occurring words between files exceeds the second threshold value Th2, the information analysis and accumulation server 2 can automatically extract files that can be used across processes by setting a relationship link even if the processes using the files do not match.

(4)上記(2)に記載の情報解析方法であって、前記第3のステップでは、前記メタ情報が、ファイル単位で前記関係リンクと前記ファイルの所在(315)と前記単語の出現頻度を格納したファイル単位のメタ情報と、工程毎に前記関係リンクと前記ファイルの所在と前記単語の出現頻度を格納した工程単位のメタ情報を含むことを特徴とする情報解析方法。 (4) The information analysis method described in (2) above, wherein in the third step, the meta information includes file-based meta information storing the related links, the file locations (315), and the frequency of occurrence of the words on a file-by-file basis, and process-based meta information storing the related links, the file locations, and the frequency of occurrence of the words for each process.

上記構成によれば、業務端末8を利用するオペレータは、情報解析蓄積サーバ2のメタ情報テーブル34から工程単位のメタ情報を参照することで、当該工程で利用可能なファイルを関係リンクから取得することができ、関係リンクのファイルの所在はファイル単位のメタ情報から取得することが可能となり、工程内で利用可能なファイルへ容易にアクセスすることができる。 According to the above configuration, an operator using the business terminal 8 can refer to the meta information for each process from the meta information table 34 of the information analysis and storage server 2 to obtain files that can be used in that process from the related links, and the location of the files in the related links can be obtained from the meta information for each file, allowing easy access to files that can be used in the process.

(5)上記(4)に記載の情報解析方法であって、前記第3のステップでは、前記ファイル単位のメタ情報を集約又は結合することで前記工程(312)単位のメタ情報を生成することを特徴とする情報解析方法。 (5) The information analysis method described in (4) above, characterized in that in the third step, meta information for each process (312) is generated by aggregating or combining the meta information for each file.

上記構成によれば、業務端末8は、情報解析蓄積サーバ2が提供する工程単位のメタ情報を参照すれば当該工程内で利用可能なファイルを関係リンクから取得することができる。 According to the above configuration, the business terminal 8 can obtain files that can be used within a process from the related links by referring to the meta information for each process provided by the information analysis and accumulation server 2.

なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に記載したものであり、必ずしも説明した全ての構成を含むものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加、削除、又は置換のいずれもが、単独で、又は組み合わせても適用可能である。 The present invention is not limited to the above-described embodiments, but includes various modified examples. For example, the above-described embodiments are described in detail to clearly explain the present invention, and are not necessarily limited to those including all of the configurations described. It is also possible to replace part of the configuration of one embodiment with the configuration of another embodiment, and it is also possible to add the configuration of another embodiment to the configuration of one embodiment. In addition, the addition, deletion, or replacement of part of the configuration of each embodiment with other configurations can be applied alone or in combination.

また、上記の各構成、機能、処理部、及び処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、及び機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記録装置、又は、ICカード、SDカード、DVD等の記録媒体に置くことができる。 The above configurations, functions, processing units, and processing means may be realized in part or in whole in hardware, for example by designing them as integrated circuits. The above configurations and functions may be realized in software by a processor interpreting and executing a program that realizes each function. Information on the programs, tables, files, etc. that realize each function may be stored in a memory, a recording device such as a hard disk or SSD (Solid State Drive), or a recording medium such as an IC card, SD card, or DVD.

また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。 In addition, the control lines and information lines shown are those considered necessary for the explanation, and not all control lines and information lines on the product are necessarily shown. In reality, it can be assumed that almost all components are interconnected.

1 電子情報管理システム
2 情報解析蓄積サーバ
3 業務記録部
4 文書解析部
5 ファイル関係抽出部
6 ディレクトリ解析部
7 ファイルサーバ
8 業務端末
9 ネットワーク
31 業務工程文書テーブル
32 頻出語リスト
33 ファイル関係テーブル
34 メタ情報テーブル
35 辞書
40 業務フロー提示部
Reference Signs List 1 Electronic information management system 2 Information analysis and storage server 3 Business record section 4 Document analysis section 5 File relationship extraction section 6 Directory analysis section 7 File server 8 Business terminal 9 Network 31 Business process document table 32 Frequent word list 33 File relationship table 34 Meta information table 35 Dictionary 40 Business flow presentation section

Claims (11)

プロセッサとメモリを有する情報解析サーバが、ネットワークを介して接続された業務端末で使用されたファイルを解析する情報解析方法であって、
前記情報解析サーバが、業務を構成する複数の工程で使用される前記ファイルを前記工程毎に取得して前記工程と前記ファイルと前記ファイルの所在を関連付けて工程文書情報に格納する第1のステップと、
前記情報解析サーバが、前記ファイルに含まれる単語を解析して前記単語が類似するファイルを関連するファイルとして関係リンクを生成する第2のステップと、
前記情報解析サーバが、前記工程毎に使用される前記ファイルと、前記ファイルの所在と、前記関係リンクをメタ情報に格納する第3のステップと、
を含むことを特徴とする情報解析方法。
An information analysis method in which an information analysis server having a processor and a memory analyzes a file used in a business terminal connected via a network, comprising:
a first step in which the information analysis server acquires the files used in a plurality of processes constituting a business for each of the processes, associates the processes, the files, and the locations of the files, and stores them in process document information;
a second step in which the information analysis server analyzes words contained in the files and generates a relational link by treating files having similar words as related files;
a third step in which the information analysis server stores the files used in each process, the locations of the files, and the related links in meta information;
2. An information analysis method comprising:
請求項1に記載の情報解析方法であって、
前記第2のステップでは、
前記単語の出現頻度をファイル毎に算出し、前記出現頻度が所定の上位の単語のうち、ファイル間で一致する単語の比率を類似度として算出し、前記類似度が所定の第1閾値を超えていれば関連するファイルと判定して関係リンクを生成することを特徴とする情報解析方法。
2. The information analysis method according to claim 1,
In the second step,
An information analysis method characterized by calculating the frequency of occurrence of the words for each file, calculating the ratio of words that match between files among the words with a predetermined top frequency of occurrence as a similarity, and determining that the files are related if the similarity exceeds a predetermined first threshold and generating a relationship link.
請求項2に記載の情報解析方法であって、
前記第2のステップでは、
前記ファイルが使用される工程がファイル間で一致しない場合でも、前記類似度が前記第1閾値よりも大きい所定の第2閾値を超えていれば関連するファイルと判定して関係リンクを生成することを特徴とする情報解析方法。
3. The information analysis method according to claim 2,
In the second step,
An information analysis method characterized in that even if the processes in which the files are used do not match between the files, if the similarity exceeds a predetermined second threshold that is greater than the first threshold, the files are determined to be related and a relationship link is generated.
請求項2に記載の情報解析方法であって、
前記メタ情報は、
ファイル単位で前記関係リンクと前記ファイルの所在と前記単語の出現頻度を格納したファイル単位のメタ情報と、工程毎に前記関係リンクと前記ファイルの所在と前記単語の出現頻度を格納した工程単位のメタ情報を含むことを特徴とする情報解析方法。
3. The information analysis method according to claim 2,
The meta information includes:
An information analysis method characterized by including meta information on a file basis that stores the related links, the location of the files, and the frequency of occurrence of the words on a file-by-file basis, and meta information on a process basis that stores the related links, the location of the files, and the frequency of occurrence of the words for each process.
請求項4に記載の情報解析方法であって、
前記第3のステップでは、
前記ファイル単位のメタ情報を集約又は結合することで前記工程単位のメタ情報を生成することを特徴とする情報解析方法。
5. The information analysis method according to claim 4,
In the third step,
The information analysis method is characterized in that meta information for each process is generated by aggregating or combining the meta information for each file.
プロセッサとメモリを有する情報解析サーバであって、
業務を構成する工程毎に業務端末で使用されたファイルを取得して前記工程と前記ファイルと前記ファイルの所在を関連付けて工程文書情報に格納する業務記録部と、
前記ファイルに含まれる単語を解析する文書解析部と、
前記単語が類似するファイルを関連するファイルとして関係リンクを生成するファイル関係抽出部と、
を有し、
前記業務記録部は、
前記工程毎に使用される前記ファイルと、前記ファイルの所在と、前記関係リンクをメタ情報に格納することを特徴とする情報解析サーバ。
An information analysis server having a processor and a memory,
a task record unit that acquires files used on the task terminal for each process constituting the task, associates the process, the file, and the location of the file, and stores the associated files in the task document information;
a document analysis unit that analyzes words contained in the file;
a file relationship extraction unit that generates a relationship link by treating the files having similar words as related files;
having
The business record unit includes:
An information analysis server characterized in that the files used for each of the processes, the locations of the files, and the related links are stored in meta information.
請求項6に記載の情報解析サーバであって、
前記文書解析部は、
前記単語の出現頻度をファイル毎に算出し、
前記ファイル関係抽出部は、
前記出現頻度が所定の上位の単語のうち、前記ファイル間で一致する単語の比率を類似度として算出し、前記類似度が所定の第1閾値を超えていれば関連するファイルと判定して関係リンクを生成することを特徴とする情報解析サーバ。
7. The information analysis server according to claim 6,
The document analysis unit
Calculating the frequency of occurrence of the word for each file;
The file relationship extraction unit includes:
An information analysis server that calculates the ratio of words that match between the files among the words with a predetermined top frequency of occurrence as a similarity, and if the similarity exceeds a predetermined first threshold, determines that the files are related and generates a relationship link.
請求項7に記載の情報解析サーバであって、
前記ファイル関係抽出部は、
前記ファイルが使用される工程がファイル間で一致しない場合でも、前記類似度が前記第1閾値よりも大きい所定の第2閾値を超えていれば関連するファイルと判定して関係リンクを生成することを特徴とする情報解析サーバ。
The information analysis server according to claim 7,
The file relationship extraction unit includes:
An information analysis server characterized in that, even if the processes in which the files are used do not match between files, if the similarity exceeds a predetermined second threshold value that is greater than the first threshold value, the files are determined to be related and a relationship link is generated.
請求項7に記載の情報解析サーバであって、
前記メタ情報は、
ファイル単位で前記関係リンクと前記ファイルの所在と前記単語の出現頻度を格納したファイル単位のメタ情報と、工程毎に前記関係リンクと前記ファイルの所在と前記単語の出現頻度を格納した工程単位のメタ情報を含むことを特徴とする情報解析サーバ。
The information analysis server according to claim 7,
The meta information includes:
An information analysis server characterized by including meta information on a file-by-file basis that stores the related links, the location of the files, and the frequency of occurrence of the words on a file-by-file basis, and meta information on a process-by-process basis that stores the related links, the location of the files, and the frequency of occurrence of the words on a process-by-process basis.
請求項9に記載の情報解析サーバであって、
前記業務記録部は、
前記ファイル単位のメタ情報を集約又は結合することで前記工程単位のメタ情報を生成することを特徴とする情報解析サーバ。
The information analysis server according to claim 9,
The business record unit includes:
An information analysis server that generates meta information for each process by aggregating or combining the meta information for each file.
ファイルを格納する第1の計算機と、
前記ファイルを業務で使用する第2の計算機と、
前記第2の計算機が使用した前記ファイルを分析する情報解析サーバと、
前記第1の計算機と前記第2の計算機と前記情報解析サーバを接続するネットワークと、を有する電子情報管理システムであって、
前記情報解析サーバは、
業務を構成する工程毎に前記第2の計算機で使用されたファイルを取得して、前記工程と前記ファイルと前記ファイルの所在を関連付けて工程文書情報に格納する業務記録部と、
前記ファイルに含まれる単語を解析する文書解析部と、
前記単語が類似するファイルを関連するファイルとして関係リンクを生成するファイル関係抽出部と、
を有し、
前記業務記録部は、
前記工程毎に使用される前記ファイルと、前記ファイルの所在と、前記関係リンクをメタ情報に格納することを特徴とする電子情報管理システム。
a first computer for storing a file;
a second computer that uses the file for business purposes;
an information analysis server that analyzes the file used by the second computer;
an electronic information management system having a network connecting the first computer, the second computer, and the information analysis server,
The information analysis server includes:
a task record section that acquires a file used by the second computer for each process constituting a task, and stores the process, the file, and the location of the file in association with each other in task document information;
a document analysis unit that analyzes words contained in the file;
a file relationship extraction unit that generates a relationship link by treating the files having similar words as related files;
having
The business record unit includes:
The electronic information management system is characterized in that the files used in each of the processes, the locations of the files, and the related links are stored in meta information.
JP2022171341A 2022-10-26 2022-10-26 Information analysis method, information analysis server, and electronic information management system Pending JP2024063414A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2022171341A JP2024063414A (en) 2022-10-26 2022-10-26 Information analysis method, information analysis server, and electronic information management system
PCT/JP2023/034694 WO2024090090A1 (en) 2022-10-26 2023-09-25 Information analysis method, information analysis server, and digital information management system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022171341A JP2024063414A (en) 2022-10-26 2022-10-26 Information analysis method, information analysis server, and electronic information management system

Publications (1)

Publication Number Publication Date
JP2024063414A true JP2024063414A (en) 2024-05-13

Family

ID=90830592

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022171341A Pending JP2024063414A (en) 2022-10-26 2022-10-26 Information analysis method, information analysis server, and electronic information management system

Country Status (2)

Country Link
JP (1) JP2024063414A (en)
WO (1) WO2024090090A1 (en)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008140087A (en) * 2006-11-30 2008-06-19 Fuji Xerox Co Ltd Activity support device, program and activity support system
JP2009037529A (en) * 2007-08-03 2009-02-19 Sharp Corp Bookmark generation apparatus and bookmark generation method
JP6533048B2 (en) * 2014-10-29 2019-06-19 株式会社野村総合研究所 Compliance check system and compliance check program

Also Published As

Publication number Publication date
WO2024090090A1 (en) 2024-05-02

Similar Documents

Publication Publication Date Title
JP4756953B2 (en) Information search apparatus and information search method
US6356899B1 (en) Method for interactively creating an information database including preferred information elements, such as preferred-authority, world wide web pages
US5787421A (en) System and method for information retrieval by using keywords associated with a given set of data elements and the frequency of each keyword as determined by the number of data elements attached to each keyword
US5983246A (en) Distributed document classifying system and machine readable storage medium recording a program for document classifying
EP2289007B1 (en) Search results ranking using editing distance and document information
US20160224660A1 (en) Systems and Methods for Distributing Indexer Configurations
US11416278B2 (en) Presenting hypervisor data for a virtual machine with associated operating system data
JP2010039593A (en) Table classification device, table classification method, and table classification program
US20160078073A1 (en) System and method for content storage
KR100877156B1 (en) System and method of access path analysis for dynamic sql before executed
JP2003173280A (en) Apparatus, method and program for generating database
KR20010104873A (en) System for internet site search service using a meta search engine
JP2000181759A (en) Time sequential data retrieval system/method and recording medium storing its program
US20060026282A1 (en) Method and apparatus for supporting a system management
WO2024090090A1 (en) Information analysis method, information analysis server, and digital information management system
JP5885204B2 (en) User operation support method and apparatus
US20210209105A1 (en) Query adaptation for a search service in a content management system
US9135253B2 (en) Simulating accesses for archived content
JPH1139293A (en) Document management method and document retrieval method and device
JP3655495B2 (en) Information retrieval method and apparatus and recording medium on which information retrieval program is recorded
US8122039B2 (en) Apparatus for multimedia integrated retrieval and storage medium storing a multimedia integrated retrieval program
US20140059051A1 (en) Apparatus and system for an integrated research library
JP2000163439A (en) Device and method for electronic file retrieval
JP3725088B2 (en) Knowledge information collecting system and knowledge information collecting method
WO2021065379A1 (en) Information search system