WO2024034179A1

WO2024034179A1 - 計算機システム及び業務プロセスを表す構造化データの生成方法

Info

Publication number: WO2024034179A1
Application number: PCT/JP2023/014180
Authority: WO
Inventors: 絵理照屋; 理竹内; 正太郎我妻
Original assignee: 株式会社日立製作所
Priority date: 2022-08-09
Filing date: 2023-04-06
Publication date: 2024-02-15
Also published as: JP2024024178A

Abstract

計算機システムは、複数の手順からなる業務プロセスが記載された文書からエンティティを抽出し、エンティティのカテゴリを分類する。計算機システムは、一つ以上のエンティティから構成され、一つの手順に対応するエンティティグループを複数生成し、エンティティグループの各々について、エンティティグループに含まれる一つ以上のエンティティのカテゴリに基づいて、エンティティグループに対応する手順を特徴づけるエンティティである主エンティティを特定する。計算機システムは、主エンティティ間の関係性に基づいて、複数の手順の順序を判定する処理を実行し、処理の結果に基づいて複数の手順の順序を決定し、業務プロセスの構造化データとして、順序づけされたエンティティグループに関する情報を生成する。

Description

計算機システム及び業務プロセスを表す構造化データの生成方法

参照による取り込み

　本出願は、２０２２年８月９日に出願された日本特許出願第２０２２－１２６８２１号の優先権を主張し、その内容を参照することにより、本出願に取り込む。

　本発明は、プロセス情報構造化システム、及びプロセス情報構造化方法に関する。

　近年、様々な分野において、複数の手順からなる業務プロセスを、ＡＩを用いて支援、効率化、及び最適化等をしたいというニーズが顕在化している。例えば、産業分野では、装置の操作手順のリコメンド、及び装置の故障に対するプロセスのリコメンドを行うＡＩが実用化され、医療分野では、診断、治療、及び投薬行為の支援を行うＡＩが実用化され、素材分野では、新素材の合成プロセスのリコメンドを行うＡＩが実用化されている。

　ＡＩを用いた業務プロセスの支援等を実現するためには、一般に業務プロセスを情報処理が可能なデータを用意する必要がある。しかし、業務プロセスに関わる情報は、自然言語で記載された文書（装置の保守報告書、医療カルテ、実験報告書など）として蓄積されている場合が多いため、そのままでは情報処理が困難である。したがって、文書に記載された情報を情報処理が可能な構造化データに変換する必要がある。

　図２４Ａ及び図２４Ｂは、業務プロセスの構造化のイメージを記す図である。図２４Ａは保守に係る業務プロセスの構造化のイメージを表し、図２４Ｂは物質製造に係る業務プロセスの構造化のイメージを表す。

　手動で文書から構造化データを生成するためには、莫大な時間と専門知識とが必要である。そのため、自動で文書から構造化データを生成する技術が望まれている。これに対して、特許文献１、非特許文献１、及び非特許文献２に記載の技術が知られている。

　特許文献１には、「語句抽出条件学習部と、語句抽出部と、語句関係抽出条件学習部と、語句関係抽出部と、出力部と、を備える」文書理解支援装置が記載されている。また、「語句抽出条件学習部は、各語句に付与された特徴量に基づく学習により、支援用電子文書から語句を抽出するための語句抽出条件を生成する」こと、「語句抽出部は、語句抽出条件を満たす語句を抽出する」こと、「語句関係抽出条件学習部は、抽出対象語句関係に対する特徴量に基づく学習により、支援用電子文書から関係語句を抽出するための語句関係抽出条件を生成する」こと、「語句関係抽出部は、語句関係抽出条件を満たす語句関係を抽出する」ことが記載されている。

　非特許文献１及び非特許文献２には、料理のレシピが記載された文書から、料理のレシピを構造化したデータを出力する技術が記載されている。非特許文献１及び非特許文献２に記載の技術では、食材及び調理法の係り受け等に関するルールを用いて、料理のレシピを構造化データの生成が行われている。

特開２０１９－７９３２１号公報

料理レシピテキストの構造解析とその応用，言語処理学会第１８回年次大会発表論文集，ｐｐ．８３９－８４２料理テキスト教材における調理手順の構造化，電子情報通信学会論文誌　Ｄ　，Ｖｏｌ．Ｊ８５－Ｄ２，Ｎｏ．１，ｐｐ．７９－８９

　特許文献１の技術では、精度を確保するために大量の学習データが必要となる。そのため、学習データが少ない分野では適用が難しい。また、非特許文献１及び非特許文献２の技術では、緻密なルールを設定する必要がある。

　本発明は、前述の課題に鑑みてなされたものであり、緻密なルールを用いずに、業務プロセスが記載された文書から構造化データを精度よく生成するシステム及び方法を提供することを目的とする。

　本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、少なくとも一つの計算機を備える計算機システムであって、複数の手順からなる業務プロセスが記載された文書の入力を受け付け、前記文書から、前記業務プロセスに関連する表現をエンティティとして抽出し、前記エンティティのカテゴリを分類し、一つ以上の前記エンティティから構成され、一つの前記手順に対応するエンティティグループを複数生成し、前記エンティティグループの各々について、前記エンティティグループに含まれる一つ以上の前記エンティティのカテゴリに基づいて、前記エンティティグループに対応する前記手順を特徴づける前記エンティティである主エンティティを特定し、前記主エンティティ間の関係性に基づいて、前記複数の手順の順序を判定する第１順序判定処理を実行し、前記第１順序判定処理の結果に基づいて、前記複数の手順の順序を決定し、前記業務プロセスの構造化データとして、順序づけされた前記エンティティグループに関する情報を生成し、出力する。

　本発明によれば、緻密なルールを用いずに、業務プロセスが記載された文書から構造化データを精度よく生成することができる。上記した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。

実施例１のシステムの一例を示す図である。実施例１の計算機のハードウェア構成の一例を示す図である。実施例１の文書データベースの一例を示す図である。実施例１の構造化ルールデータベースに格納されるエンティティ／カテゴリ辞書の一例を示す図である。実施例１の構造化ルールデータベースに格納される手順カテゴリ判定ルール情報の一例を示す図である。実施例１の構造化ルールデータベースに格納される主エンティティ判定ルール情報の一例を示す図である。実施例１の構造化ルールデータベースに格納される並列性判定ルール情報の一例を示す図である。実施例１の構造化ルールデータベースに格納される業務プロセス順序判定ルール情報の一例を示す図である。実施例１の構造化ルールデータベースに格納される手順順序判定ルール情報の一例を示す図である。実施例１の構造化ルールデータベースに格納される関係性定義情報の一例を示す図である。実施例１の構造化処理装置が実行する構造化データ生成処理の概要を説明するフローチャートである。実施例１の構造化処理装置が生成する情報の一例を示す図である。実施例１の構造化処理装置が生成する情報の一例を示す図である。実施例１の構造化処理装置が生成する情報の一例を示す図である。実施例１の構造化処理装置が生成する情報の一例を示す図である。実施例１の構造化処理装置が生成する情報の一例を示す図である。実施例１の構造化処理装置が生成する情報の一例を示す図である。実施例１の構造化処理装置が生成する構造化データの一例を示す図である。実施例１のユーザ端末に表示される構造化データの一例を示す図である。実施例１のユーザ端末に表示される構造化データの一例を示す図である。実施例１の構造化処理装置が実行する手順カテゴリ判定処理の一例を説明するフローチャートである。実施例１の構造化処理装置が実行する主エンティティ判定処理の一例を説明するフローチャートである。実施例１の構造化処理装置が実行する並列性判定処理の一例を説明するフローチャートである。実施例１の構造化処理装置が実行する手順順序判定処理の一例を説明するフローチャートである。業務プロセスの構造化のイメージを記す図である。業務プロセスの構造化のイメージを記す図である。

　以下、実施形態について図面を参照しつつ説明する。尚、以下、図面を参照して本発明の実施形態を説明する。以下の記載及び図面は、本発明を説明するための例示であって、説明の明確化のため、適宜、省略及び簡略化がなされている。本発明は、他の種々の形態でも実施することが可能である。特に限定しない限り、各構成要素は単数でも複数でも構わない。

　以下の説明において、同一又は類似の構成について同一の符号を付して重複した説明を省略することがある。また、以下の説明において、符号の前に付した「Ｓ」の文字は処理ステップを意味する。また、以下の説明では、「テーブル」、「情報」等の表現にて各種情報を説明することがあるが、各種情報は、これら以外のデータ構造で表現されていてもよい。

　さらに、以下の説明においては、実験報告書に記載された素材の合成プロセスに関する情報を構造化する例で記載するが、構造化対象は背景技術に記載した様々な分野、対象、ユースケースに関して適用することが可能である。

　図１は、実施例１のシステムの一例を示す図である。図２は、実施例１の計算機２００のハードウェア構成の一例を示す図である。

　図１に示すシステム１０は、構造化処理装置１００及びユーザ端末１０１から構成される。構造化処理装置１００及びユーザ端末１０１は、通信ネットワーク１０２を介して、双方向通信が可能な状態で接続される。通信ネットワーク１０２は、例えば、ＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）、ＷＡＮ（Ｗｉｄｅ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）、インターネット、公衆通信網、専用線等である。尚、ユーザ端末１０１の数は二つ以上でもよい。以下の説明では、システム１０を構造化システム１０とも記載する。

　構造化処理装置１００及びユーザ端末１０１は、例えば、図２に示すような計算機２００から構成される。計算機２００は、演算装置２０１、主記憶装置２０２、補助記憶装置２０３、入力装置２０４、出力装置２０５、及び通信装置２０６を備える。

　演算装置２０１は、主記憶装置２０２に格納されるプログラムを実行する。演算装置２０１は、例えば、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＭＰＵ（Ｍｉｃｒｏ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＦＰＧＡ（Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）、ＡＳＩＣ（Ａｐｐｌｉｃａｔｉｏｎ　Ｓｐｅｃｉｆｉｃ　Ｉｎｔｅｇｒａｔｅｄ　Ｃｉｒｃｕｉｔ）、ＡＩ（Ａｒｔｉｆｉｃｉａｌ　Ｉｎｔｅｌｌｉｇｅｎｃｅ）チップ等である。演算装置２０１がプログラムにしたがって処理を実行することによって、特定の機能を実現する機能部（モジュール）として動作する。以下の説明では、機能部を主語に処理を説明する場合、演算装置２０１が当該機能部を実現するプログラムを実行していることを示す。

　主記憶装置２０２は、演算装置２０１が実行するプログラム及びデータを格納する。主記憶装置２０２は、例えば、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）、及び、ＮＶＲＡＭ（Ｎｏｎ　Ｖｏｌａｔｉｌｅ　ＲＡＭ）等の不揮発性メモリ等である。尚、主記憶装置２０２は、ワークエリアとしても用いられる。

　補助記憶装置２０３は、永続的にデータを格納する。補助記憶装置２０３は、例えば、ＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）及びハードディスクドライブ等である。尚、計算機２００は、補助記憶装置２０３を有していなくてもよい。この場合、プログラム及びデータは、ＣＤ（Ｃｏｍｐａｃｔ　Ｄｉｓｃ）、ＤＶＤ（Ｄｉｇｉｔａｌ　Ｖｅｒｓａｔｉｌｅ　Ｄｉｓｃ）等の光学式記憶装置、ＩＣカード、及びＳＤカード等から取得してもよいし、外部接続されるストレージシステム、及びクラウドシステム上の記憶領域から取得してもよい。補助記憶装置２０３に格納されるプログラム及びデータは、演算装置２０１によって読み出され、主記憶装置２０２にロードされる。

　入力装置２０４は、外部からの入力を受け付けるインタフェースである。入力装置２０４は、例えば、キーボード、マウス、タッチパネル、カードリーダ、ペン入力方式のタブレット、音声入力装置等である。

　出力装置２０５は、処理経過及び処理結果等の各種情報を出力するインタフェースである。出力装置２０５は、例えば、液晶モニタ及びＬＣＤ（Ｌｉｑｕｉｄ　Ｃｒｙｓｔａｌ　Ｄｉｓｐｌａｙ）等の表示装置、音声出力装置、並びにプリンタ等である。

　尚、計算機２００は、入力装置２０４及び出力装置２０５を有していなくてもよい。この場合、計算機２００は、通信装置２０６を介して、情報の入力及び出力を行う。

　通信装置２０６は、他の装置との間で通信する。通信装置２０６、例えば、ＮＩＣ（Ｎｅｔｗｏｒｋ　Ｉｎｔｅｒｆａｃｅ　Ｃａｒｄ）、無線通信モジュール、及びＵＳＢモジュール等である。

　構造化処理装置１００は、業務プロセスが自然言語で記載されたテキストを含む文書データから構造化データを生成する。

　ここで、業務プロセスは複数の手順から構成されるものとする。構造化データは、複数の手順の構造を把握するためデータであり、例えば、Ｊｓｏｎ形式のデータ、ＸＭＬ形式のデータ、ＲＤＦ形式のデータ、及びＧｒａｐｈＭＬ形式のデータ等が考えられる。本発明は、構造化データのデータ形式に限定されない。実施例１の構造化データは、ＧｒａｐｈＭＬ形式のデータであるものとする。

　以下では、業務プロセスが記述された、１つ以上の文又は１つ以上の文章のまとまりを文書と記載する。また、以下では、文書単位で処理が実行されるものとして説明するが、処理の単位は必ずしも限定されない。

　構造化処理装置１００は、情報管理部１１０及び構造化処理部１２０を有し、また、文書データベース１３０、構造化ルールデータベース１４０、処理データベース１５０、構造化データデータベース１６０を保持する。

　文書データベース１３０は、処理対象の文書を格納するデータベースである。構造化ルールデータベース１４０は、構造化処理に用いるルールを格納するデータベースである。処理データベース１５０は、構造化処理の処理結果を格納するデータベースである。構造化データデータベース１６０は、構造化処理によって生成された構造化データを格納するデータベースである。

　情報管理部１１０は、文書、ルール、及び構造化データ等を管理する。構造化処理部１２０は、構造化処理を実行する。尚、情報管理部１１０及び構造化処理部１２０は、オペレーティングシステム、ファイルシステム、リレーショナルデータベース及びＫＶＳ（Ｋｅｙ－Ｖａｌｕｅ　Ｓｔｏｒｅ）等のＮｏＳＱＬを管理するミドルウェア等の一機能として実現してもよい。

　構造化処理部１２０は、構造化処理において、以下のような処理を実行する。

　（１）構造化処理部１２０は、文書に含まれるテキストから、業務プロセスの手順に関連する単語等の表現をエンティティとして抽出し、抽出されたエンティティのカテゴリ（エンティティカテゴリ）を分類する。

　（２）構造化処理部１２０は、一つの手順に関連するエンティティをまとめることによってエンティティグループを生成する。

　（３）構造化処理部１２０は、エンティティグループに含まれるエンティティのエンティティカテゴリに基づいて、エンティティグループに対応する手順のカテゴリ（手順カテゴリ）を分類する。

　（４）構造化処理部１２０は、エンティティグループに含まれるエンティティのうち、エンティティグループに対応する手順の特性を表すエンティティ（主エンティティ）を特定する。

　（５）構造化処理部１２０は、主エンティティ間の関係性に基づいて、業務プロセスに含まれる手順のうち、並列して行われる手順を判定する。

　（６）構造化処理部１２０は、主エンティティ間の関係性、並びに、手続きの順序及び手順カテゴリの間の関係性に基づいて、手順の順序を判定する。

　（７）構造化処理部１２０は、（５）及び（６）の判定結果の整合性を確認し、確認結果を記録する。

　（８）構造化処理部１２０は、（５）及び（６）の判定結果、並びに、整合性の確認結果に基づいて、構造化データを生成する。

　（９）構造化処理部１２０は、構造化データを表示するための表示情報を生成し、ユーザ端末１０１に表示情報を送信する。

　ユーザ端末１０１は、文書及び各種ルール等を登録するための画面を表示する登録部１７０、並びに、構造化データの提示及び修正等を行うための画面を表示する表示部１８０を有する。

　尚、複数の計算機２００から構成される計算機システムを用いて、構造化処理装置１００が有する機能を実現してもよい。また、構造化処理装置１００が有する全て又は一部の機能は、仮想化技術を用いて実現してもよい。例えば、ＳａａＳ（Ｓｏｆｔｗａｒｅ　ａｓ　ａ　Ｓｅｒｖｉｃｅ）、ＰａａＳ（Ｐｌａｔｆｏｒｍ　ａｓ　ａ　Ｓｅｒｖｉｃｅ）、及びＩａａＳ（Ｉｎｆｒａｓｔｒｕｃｔｕｒｅ　ａｓ　ａ　Ｓｅｒｖｉｃｅ）等のクラウドサービスを用いて構造化処理装置１００が有する全て又は一部の機能を実現する方法が考えられる。

　尚、構造化処理装置１００及びユーザ端末１０１は、一つの装置にまとめてもよい。

　図３は、実施例１の文書データベース１３０の一例を示す図である。

　文書データベース１３０は、文書ＩＤ３０１及びテキスト３０２を含むエントリを格納する。一つの文書に対して一つのエントリが存在する。尚、エントリに含まれるフィールドは一例であってこれに限定されない。

　文書ＩＤ３０１は、文書の識別情報を格納するフィールドである。テキスト３０２は、文書に含まれるテキストを格納するフィールドである。尚、テキスト３０２に格納されるテキストのデータ形式は限定されない。

　図４は、実施例１の構造化ルールデータベース１４０に格納されるエンティティ／カテゴリ辞書４００の一例を示す図である。

　エンティティ／カテゴリ辞書４００は、エンティティとして抽出する単語等の表現及びエンティティのカテゴリ（種別）を管理するための情報である。エンティティ／カテゴリ辞書４００は、エンティティ４０１及びカテゴリ４０２を含むエントリを格納する。一つの表現（エンティティ）に対して一つのエントリが存在する。尚、エントリに含まれるフィールドは一例であってこれに限定されない。

　エンティティ４０１は、抽出する表現を格納するフィールドである。カテゴリ４０２は、表現のエンティティカテゴリを格納するフィールドである。

　図５は、実施例１の構造化ルールデータベース１４０に格納される手順カテゴリ判定ルール情報５００の一例を示す図である。

　手順カテゴリ判定ルール情報５００は、エンティティグループに対応する手順の手順カテゴリの判定ルールを管理するための情報である。手順カテゴリ判定ルール情報５００は、ルールＩＤ５０１、カテゴリＩＤ５０２、カテゴリ５０３、及びルール５０４を含むエントリを格納する。一つのルールに対して一つのエントリが存在する。尚、エントリに含まれるフィールドは一例であってこれに限定されない。

　ルールＩＤ５０１は、ルールの識別情報を格納するフィールドである。カテゴリＩＤ５０２は、ルールに合致する手順の手順カテゴリの識別情報を格納するフィールドである。カテゴリ５０３は、ルールに合致する手順の手順カテゴリを格納するフィールドである。ルール５０４は、手順カテゴリの判定ルールを格納するフィールドである。

　ここで、手順カテゴリは手順の種別である。物質製造に係る業務プロセスでは、「準備」、「操作」、及び「計測」等の手順カテゴリが考えられ、また、保守に係る業務プロセスでは、「報告」、「原因確認」、及び「処置」等の手順カテゴリが考えられる。

　手順カテゴリの判定ルールとしては、エンティティグループに含まれるエンティティのエンティティカテゴリを用いるルールが考えられる。例えば、エンティティカテゴリが「物質」であるエンティティを含むエンティティグループの手順カテゴリを「物質」と判定するルールがある。また、エンティティグループに含まれるエンティティのカテゴリの組み合わせに基づいて、手順カテゴリを判定するルールも考えられる。例えば、図２４Ａの保守に係る業務プロセスにおいては、エンティティカテゴリが「アラーム」及び「現象」であるエンティティを含むエンティティグループの手順カテゴリを「報告」と判定するルールがある。尚、前述したルールは一例であってこれに限定されない。

　図５の一番目のエントリには、エンティティグループに含まれる各エントリのエンティティカテゴリを表す変数「ｅｎｔｉｔｙ＿ｃａｔｅｇｏｒｉｅｓ」に「操作」が含まれている場合、手順カテゴリが「操作」であると判定するルールが定義されている。図５の二番目のエントリには、変数「ｅｎｔｉｔｙ＿ｃａｔｅｇｏｒｉｅｓ」に「物質」が含まれている場合、手順カテゴリが「物質」であると判定するルールが定義されてる。

　図６は、実施例１の構造化ルールデータベース１４０に格納される主エンティティ判定ルール情報６００の一例を示す図である。

　主エンティティ判定ルール情報６００は、エンティティグループに含まれるエンティティの中から主エンティティを特定するためのルール（主エンティティ判定ルール）を管理するための情報である。主エンティティ判定ルール情報６００は、ルールＩＤ６０１及びルール６０２を含むエントリを格納する。一つのルールに対して一つのエントリが存在する。尚、エントリに含まれるフィールドは一例であってこれに限定されない。

　ルールＩＤ６０１は、ルールの識別情報を格納するフィールドである。ルール６０２は、主エンティティ判定ルールを格納するフィールドである。

　主エンティティ判定ルールとしては、エンティティカテゴリを用いるルールが考えられる。例えば、エンティティカテゴリが「物質」であるエンティティを主エンティティとして特定するルールである。尚、前述したルールは一例であってこれに限定されない。

　図６の一番目のエントリには、エンティティカテゴリを表す変数「ｅｎｔｉｔｙ＿ｃａｔｅｇｏｒｙ」が「操作」であるエンティティを主エンティティとして特定するルールが定義されている。

　尚、構造化ルールデータベース１４０には、主エンティティを補足する関係にある副エンティティを特定するためのルールを管理するための情報が含まれてもよい。

　図７は、実施例１の構造化ルールデータベース１４０に格納される並列性判定ルール情報７００の一例を示す図である。

　並列性判定ルール情報７００は、二つの手順が並列して行われるか否かを判定するためのルール（並列性判定ルール）を管理するための情報である。並列性判定ルール情報７００は、ルールＩＤ７０１、並列性７０２、及びルール７０３を含むエントリを格納する。一つのルールに対して一つのエントリが存在する。尚、エントリに含まれるフィールドは一例であってこれに限定されない。

　ルールＩＤ７０１は、ルールの識別情報を格納するフィールドである。並列性７０２は、二つの手順が並列して行われるか否かを表す値を格納するフィールドである。ルール７０３は、並列性判定ルールを格納するフィールドである。

　並列性判定ルールとしては、二つのエンティティグループの主エンティティ間を結ぶ文に含まれる語句を用いたルールが考えられる。尚、前述したルールは一例であってこれに限定されない。

　図７の一番目のエントリには、主エンティティＡと主エンティティＢとを結ぶ文に含まれる単語を表す変数「ｗｏｒｄ＿ｂｅｔｗｅｅｎ　ｍａｉｎ＿ｅｎｔｉｔｙＡ＿ａｎｄ＿ｍａｉｎ＿ｅｎｔｉｔｙＢ」に「しかしながら」が含まれている場合、主エンティティＡを含むエンティティグループに対応する手順と、主エンティティＢを含むエンティティグループに対応する手順とは並列して行われると判定するルールが定義されている。図７の二番目のエントリは、変数「ｗｏｒｄ＿ｂｅｔｗｅｅｎ　ｍａｉｎ＿ｅｎｔｉｔｙＡ＿ａｎｄ＿ｍａｉｎ＿ｅｎｔｉｔｙＢ」に「の後に」が含まれている場合、主エンティティＡを含むエンティティグループに対応する手順と、主エンティティＢを含むエンティティグループに対応する手順とは並列して行われないと判定するルールが定義されている。

　図８は、実施例１の構造化ルールデータベース１４０に格納される業務プロセス順序判定ルール情報８００の一例を示す図である。

　業務プロセス順序判定ルール情報８００は、手続カテゴリに基づいて、各手順の順序を判定するためのルール（業務プロセス順序判定ルール）を管理するための情報である。業務プロセス順序判定ルール情報８００は、ルールＩＤ８０１、順序８０２、及びルール８０３を含むエントリを格納する。一つのルールに対して一つのエントリが存在する。尚、エントリに含まれるフィールドは一例であってこれに限定されない。

　ルールＩＤ８０１は、ルールの識別情報を格納するフィールドである。順序８０２は、手順の大まかな順序を表す情報を格納するフィールドである。「始点」は業務プロセス全体の始めの手順であることを示し、「中間」は業務プロセス全体の中間の手順であることを示し、「終点」は業務プロセス全体の終わりの手順であることを示す。ルール８０３は、業務プロセス順序判定ルールを格納するフィールドである。

　業務プロセス順序判定ルールとしては、手続カテゴリのみを用いたルールが考えられる。尚、前述の手順パターンの定義方法は一例であってこれに限定されない。例えば、手続きカテゴリ及び主エンティティの位置を用いたルールでもよい。

　業務プロセスによっては、所定の順序で手順が並べられた構造化データを生成することが一般的な場合がある。例えば、図２４Ａに示す保守に係る業務プロセスでは、一般的に、手順が「報告」、「原因確認」、及び「処置」の順番に並べられる。そこで、予め、構造化データにおける手順の順序を定義しておく。

　図８の一番目のエントリには、手順カテゴリが「物質」であり、かつ、主エンティティがテキストの前半にある場合、当該手続きは、業務プロセス全体の始めの手順であると判定するルールが定義される。図８の二番目のエントリには、手順カテゴリが「操作」である場合、当該手続きは、業務プロセス全体の中間の手順であると判定するルールが定義される。図８の三番目のエントリには、手順カテゴリが「物質」であり、かつ、主エンティティがテキストの後半にある場合、当該手続きは、業務プロセス全体の後半の手順であると判定するルールが定義される。

　図９は、実施例１の構造化ルールデータベース１４０に格納される手順順序判定ルール情報９００の一例を示す図である。

　手順順序判定ルール情報９００は、主エンティティ間の関係性に基づいて、二つの手順間の順序を判定するためのルール（手順順序判定ルール）を管理するための情報である。手順順序判定ルール情報９００は、ルールＩＤ９０１、順序９０２、及びルール９０３を含むエントリを格納する。一つのルールに対して一つのエントリが存在する。尚、エントリに含まれるフィールドは一例であってこれに限定されない。

　ルールＩＤ９０１は、ルールの識別情報を格納するフィールドである。順序９０２は、エンティティ間の順序関係を格納するフィールドである。ルール９０３は、手順順序判定ルールを格納するフィールドである。

　手順順序判定ルールとしては、主エンティティ間を結ぶ文に含まれる語句を用いたルールが考えられる。また、類義語の関係を有するエンティティに基づいたルールであってもよい。例えば、「３番ディスク」及び「ディスク３」が類義語の関連がある場合、「３番ディスク」を含むエンティティグループと「ディスク３」を含むエンティティグループとを出現順に並べるルールが考えられる。尚、類義語の関係以外に、装置構成状態の関連性（同じ装置中のモジュール内にある）、物質の関連性等と用いてもよい。尚、前述したルールは一例であってこれに限定されない。

　図９の一番目のエントリには、主エンティティＡと主エンティティＢとを結ぶ文に含まれる単語を表す変数「ｗｏｒｄ＿ｂｅｔｗｅｅｎ　ｍａｉｎ＿ｅｎｔｉｔｙＡ＿ａｎｄ＿ｍａｉｎ＿ｅｎｔｉｔｙＢ」に「の後に」が含まれている場合、主エンティティＡを含むエンティティグループを、主エンティティＢを含むエンティティグループより前に並べるルールが定義されている。図９の二番目のエントリは、変数「ｗｏｒｄ＿ｂｅｔｗｅｅｎ　ｍａｉｎ＿ｅｎｔｉｔｙＡ＿ａｎｄ＿ｍａｉｎ＿ｅｎｔｉｔｙＢ」に「の前に」が含まれている場合、主エンティティＢを含むエンティティグループを、主エンティティＡを含むエンティティグループより前に並べるルールが定義されている。図９の三番目のエントリには、主エンティティＡの直前の単語を表す変数「ｍａｉｎ＿ｂｅｆｏｒｅ　ｍａｉｎ＿ｅｎｔｉｔｙＡ」に「はじめに」が含まれる場合、主エンティティＡを含むエンティティグループを業務プロセスの最初に並べるルールが定義されている。図９の四番目のエントリには、主エンティティを表す変数「ｍａｉｎ＿ｅｎｔｉｔｙＡ」及び主エンティティＢを表す変数「ｍａｉｎ＿ｅｎｔｉｔｙＢ」に、特定の関係を示す用語が含まれる場合、主エンティティＡを含むエンティティグループを、主エンティティＢを含むエンティティグループより前に並べるルールが定義されている。特定の関係は、後述する関係性定義情報１０００（図１０を参照）に定義されている。

　図１０は、実施例１の構造化ルールデータベース１４０に格納される関係性定義情報１０００の一例を示す図である。

　関係性定義情報１０００は、エンティティ間の特定の関係性（例えば、類似関係）を管理するための情報である。関係性定義情報１０００は、関係性ＩＤ１００１、第１エンティティ１００２、第２エンティティ１００３、及び関係性１００４を含むエントリを格納する。一つのエンティティ間の関係性に対して一つのエントリが存在する。尚、エントリに含まれるフィールドは一例であってこれに限定されない。

　関係性ＩＤ１００１は、関係性の識別情報を格納するフィールドである。第１エンティティ１００２及び第２エンティティ１００３は、エンティティを格納するフィールドである。関係性１００４は、第１エンティティ及び第２エンティティの間の関係性を格納するフィールドである。

　図１１は、実施例１の構造化処理装置１００が実行する構造化データ生成処理の概要を説明するフローチャートである。図１２、図１３、図１４、図１５、図１６、及び図１７は、実施例１の構造化処理装置１００が生成する情報の一例を示す図である。図１８は、実施例１の構造化処理装置１００が生成する構造化データの一例を示す図である。図１９Ａ及び図１９Ｂは、実施例１のユーザ端末１０１に表示される構造化データの一例を示す図である。

　構造化処理装置１００は、実行契機を検出した場合、構造化データ生成処理を開始する。実行契機は、実行指示の受信及び実行タイミングの検出等である。以下の説明では、一つの構造化データの生成対象の文書の識別情報を含む実行指示を受信した場合の処理を一例として説明する。

　構造化処理部１２０は、文書データベース１３０から指定された文書のテキストを取得し、テキスト及びエンティティ／カテゴリ辞書４００を用いてエンティティ抽出処理を実行する（ステップＳ１１００）。構造化処理部１２０は、抽出したエンティティの情報を、エンティティ情報１２００として処理データベース１５０に格納する。

　エンティティ情報１２００は、エンティティＩＤ１２０１、エンティティ１２０２、位置１２０３、及びカテゴリ１２０４を含むエントリを格納する。一つのエンティティに対して一つのエントリが存在する。尚、エントリに含まれるフィールドは一例であってこれに限定されない。

　エンティティＩＤ１２０１は、構造化処理部１２０によって付与されたエンティティの識別情報を格納するフィールドである。エンティティ１２０２は、エンティティとして抽出された表現を格納するフィールドである。位置１２０３は、テキストにおけるエンティティの位置を格納するフィールドである。カテゴリ１２０４は、エンティティカテゴリを格納するフィールドである。

　エンティティ抽出処理では、構造化処理部１２０は、エンティティ／カテゴリ辞書４００に基づいてエンティティを抽出し、抽出結果に基づいてエンティティ情報１２００を生成する。尚、エンティティの抽出方法は、ルールベースの方法に限定されない。機械学習等、既存の固有表現抽出技術を用いることができる。

　次に、構造化処理部１２０は、抽出されたエンティティ及びテキストを用いて、エンティティグループ生成処理を実行する（ステップＳ１２００）。具体的には、以下のような処理が実行される。

　（Ｓ１２００－１）構造化処理部１２０は、テキストに対して文書構造の解析処理を実行し、エンティティの係り受けに関する情報を取得する。構造化処理部１２０は、エンティティの係り受けに関する情報に基づいて、対応関係を有するエンティティのペアを生成する。尚、エンティティのペアは、エンティティの対応関係を学習したモデルを用いて生成してもよい。構造化処理部１２０は、生成したペアの情報をエンティティペア情報１３００として処理データベース１５０に格納する。

　エンティティペア情報１３００は、ペアＩＤ１３０１、エンティティＩＤ１３０２、及びエンティティＩＤ１３０３を含むエントリを格納する。一つのエンティティのペアに対して一つのエントリが存在する。尚、エントリに含まれるフィールドは一例であってこれに限定されない。

　ペアＩＤ１３０１は、エンティティのペアの識別情報を格納するフィールドである。エンティティＩＤ１３０２及びエンティティＩＤ１３０３は、ペアを構成するエンティティの識別情報を格納するフィールドである。

　（Ｓ１２００－２）構造化処理部１２０は、エンティティペア情報１３００を参照し、対応関係によって結びついているエンティティをグルーピングすることによって、エンティティグループを生成する。構造化処理部１２０は、生成したエンティティグループの情報を、エンティティグループ情報１４００として処理データベース１５０に格納する。

　エンティティグループ情報１４００は、エンティティグループＩＤ１４０１、エンティティリスト１４０２、カテゴリ１４０３、及び主エンティティＩＤ１４０４を含むエントリを格納する。一つのエンティティグループに対して一つのエントリが存在する。尚、エントリに含まれるフィールドは一例であってこれに限定されない。

　エンティティグループＩＤ１４０１は、エンティティグループの識別情報を格納するフィールドである。エンティティリスト１４０２は、エンティティグループを構成するエンティティの識別情報のリストを格納するフィールドである。カテゴリ１４０３は、手順カテゴリを格納するフィールドである。主エンティティＩＤ１４０４は、エンティティグループの主エンティティの識別情報を格納するフィールドである。尚、この時点では、各エントリのカテゴリ１４０３及び主エンティティＩＤ１４０４は空欄である。

　以上がエンティティグループ生成処理の説明である。

　次に、構造化処理部１２０は、手順カテゴリ判定ルール情報５００を用いて、手順カテゴリ判定処理を実行する（ステップＳ１３００）。手順カテゴリ判定処理の詳細は図２０を用いて説明する。手順カテゴリ判定処理の結果は、エンティティグループ情報１４００の各エントリのカテゴリ１４０３に反映される。

　次に、構造化処理部１２０は、主エンティティ判定ルール情報６００を用いて、主エンティティ判定処理を実行する（ステップＳ１４００）。主エンティティ判定処理の詳細は図２１を用いて説明する。主エンティティ判定処理の結果は、エンティティグループ情報１４００の各エントリの主エンティティＩＤ１４０４に反映される。

　次に、構造化処理部１２０は、並列性判定ルール情報７００を用いて、並列性判定処理を実行する（ステップＳ１５００）。並列性判定処理の詳細は図２２を用いて説明する。並列性判定処理の結果は、並列性情報１５００として処理データベース１５０に格納される。

　並列性情報１５００は、エンティティ族ＩＤ１５０１及びエンティティグループリスト１５０２を含むエントリを格納する。並列して行われるエンティティグループのグループに対して一つのエントリが存在する。以下の説明では、並列して行われるエンティティグループのグループをエンティティ族と記載する。尚、エントリに含まれるフィールドは一例であってこれに限定されない。

　エンティティ族ＩＤ１５０１は、エンティティ族の識別情報を格納するフィールドである。エンティティグループリスト１５０２は、エンティティ族を構成するエンティティグループの識別情報を格納するフィールドである。

　次に、構造化処理部１２０は、業務プロセス順序判定ルール情報８００、手順順序判定ルール情報９００、及び関係性定義情報１０００を用いて、手順順序判定処理を実行する（ステップＳ１６００）。手順順序判定処理の詳細は図２３を用いて説明する。手順順序判定処理の結果は、手順順序情報１６００として処理データベース１５０に格納される。

　手順順序情報１６００は、順序ペアＩＤ１６０１、エンティティグループＩＤ（前）１６０２、及びエンティティグループＩＤ（後）１６０３を含むエントリを格納する。順序関係を定義する手順に対応するエンティティグループのペアに対して一つのエントリが存在する。尚、エントリに含まれるフィールドは一例であってこれに限定されない。

　実施例１では手順の順序は、ＧｒａｐｈＭＬ形式におけるノード（エンティティグループ）間を接続するエッジの方向として表現される。尚、手順の順序の表現方法に限定されない。

　順序ペアＩＤ１６０１は、順序関係を定義するエンティティグループのペアの識別情報を格納するフィールドである。エンティティグループＩＤ（前）１６０２は、前端のエンティティグループの識別情報を格納するフィールドである。エンティティグループＩＤ（後）１６０３は、後端のエンティティグループの識別情報を格納するフィールドである。

　次に、構造化処理部１２０は、並列性判定ルール情報７００、業務プロセス順序判定ルール情報８００、手順順序判定ルール情報９００、及び関係性定義情報１０００を用いて、整合性確認処理を実行する（ステップＳ１７００）。尚、整合性確認処理は実行されなくてもよい。

　具体的には、構造化処理部１２０は、エンティティ情報１２００、並列性情報１５００、及び手順順序情報１６００に登録されている情報が、並列性判定ルール情報７００、業務プロセス順序判定ルール情報８００、手順順序判定ルール情報９００、及び関係性定義情報１０００を用いて定義されるルールに整合しているか否かを判定する。整合していない情報が存在する場合、構造化処理部１２０は、当該情報を整合性確認情報１７００として処理データベース１５０に格納する。

　整合性確認情報１７００は、確認ＩＤ１７０１、対象１７０２、及びルールＩＤ１７０３を含むエントリを格納する。一つの違反に対して一つのエントリが存在する。尚、エントリに含まれるフィールドは一例であってこれに限定されない。

　確認ＩＤ１７０１は、エントリの識別情報を格納するフィールドである。対象１７０２は、違反の対象を表す識別情報を格納するフィールドである。対象１７０２には、例えば、順序ペア及びエンティティ族の識別情報が格納される。ルールＩＤ１７０３は、対象が違反しているルールの識別情報を格納するフィールドである。

　次に、構造化処理部１２０は、エンティティ情報１２００、エンティティペア情報１３００、エンティティグループ情報１４００、並列性情報１５００、手順順序情報１６００、及び整合性確認情報１７００を用いて構造化データ出力処理を実行する（ステップＳ１８００）。具体的には、構造化処理部１２０は、エンティティグループをノードとするグラフを表すデータを構造化データとして生成し、構造化データデータベース１６０に生成した構造化データを格納する。構造化データは、例えば、図１８のようなＧｒａｐｈＭＬ形式のデータである。尚、並列して実行される手順に対応するエンティティグループは一つのノードにまとめてもよい。

　図１８に示す構造化データは、グラフのノード（エンティティグループ）を定義するエントリ、エンティティグループの主エンティティを定義するエントリ、及びノード間の接続関係を定義するエントリ等を含む。

　ユーザ端末１０１の表示部１８０は、構造化データを用いて、図１９Ａ及び図１９Ｂに示すような画面を表示する。点線のボックスはエンティティグループを表す。エンティティグループには手順カテゴリを表すアイコンが表示される。エンティティを表すボックスには、エンティティカテゴリ及び主エンティティを表すアイコンが表示される。尚、一点鎖線のボックスは、並列して実行される手順（エンティティグループ）を一つにまとめたものである。

　構造化処理部１２０は、エンティティグループ間の単純な順序だけではなく、エンティティグループの並列性も判定し、構造化データを生成する。これによって、並列して行われる手順を含む業務プロセスを精度よく構造化できる。また、構造化処理部１２０は、主エンティティに基づくルール及び手順カテゴリに基づくルールを用いて、手順の順序を判定する。このように、少ないルールを用いて精度よく業務プロセスを構造化することができる。尚、手順カテゴリに基づくルールは必ずしも必要ではない。

　図２０は、実施例１の構造化処理装置１００が実行する手順カテゴリ判定処理の一例を説明するフローチャートである。

　構造化処理部１２０は、エンティティグループを選択する（ステップＳ１３０１）。具体的には、構造化処理部１２０は、エンティティグループ情報１４００から一つのエントリを選択する。

　構造化処理部１２０は、エンティティグループに含まれる各エンティティの情報を取得する（ステップＳ１３０２）。具体的には、構造化処理部１２０は、エントリのエンティティリスト１４０２に登録されている識別情報に基づいて、エンティティ情報１２００からエンティティカテゴリを取得する。

　構造化処理部１２０は、エンティティグループに含まれる各エンティティのエンティティカテゴリ及び手順カテゴリ判定ルール情報５００に基づいて、手順カテゴリを特定する（ステップＳ１３０３）。具体的には、構造化処理部１２０は、各エントリのルール５０４に設定されるルールについて判定を行い、合致したルールに対応するエントリのカテゴリ５０３の値を取得する。

　構造化処理部１２０は、エンティティグループ情報１４００を更新する（ステップＳ１３０４）。具体的には、構造化処理部１２０は、ステップＳ１３０１において選択されたエントリのカテゴリ１４０３に、特定された手順カテゴリを設定する。

　構造化処理部１２０は、エンティティグループ情報１４００の全てのエントリについて処理が完了したか否かを判定する（ステップＳ１３０５）。

　エンティティグループ情報１４００の全てのエントリについて処理が完了していない場合、構造化処理部１２０はＳ１３０１に戻る。エンティティグループ情報１４００の全てのエントリについて処理が完了した場合、構造化処理部１２０は手順カテゴリ判定処理を終了する。

　図２１は、実施例１の構造化処理装置１００が実行する主エンティティ判定処理の一例を説明するフローチャートである。

　構造化処理部１２０は、エンティティグループを選択する（ステップＳ１４０１）。具体的には、構造化処理部１２０は、エンティティグループ情報１４００から一つのエントリを選択する。

　構造化処理部１２０は、エンティティグループに含まれる各エンティティの情報を取得する（ステップＳ１４０２）。具体的には、構造化処理部１２０は、エントリのエンティティリスト１４０２に登録されている識別情報に基づいて、エンティティ情報１２００からエンティティカテゴリを取得する。

　構造化処理部１２０は、エンティティグループに含まれる各エンティティのエンティティカテゴリ及び主エンティティ判定ルール情報６００に基づいて、主エンティティとなるエンティティを特定する（ステップＳ１４０３）。具体的には、構造化処理部１２０は、各エントリのルール６０２に設定されるルールについて判定を行い、ルールに合致するエンティティを特定する。

　構造化処理部１２０は、エンティティグループ情報１４００を更新する（ステップＳ１４０４）。具体的には、構造化処理部１２０は、ステップＳ１４０１において選択されたエントリの主エンティティＩＤ１４０４に、主エンティティとして特定されたエンティティの識別情報を設定する。

　構造化処理部１２０は、エンティティグループ情報１４００の全てのエントリについて処理が完了したか否かを判定する（ステップＳ１４０５）。

　エンティティグループ情報１４００の全てのエントリについて処理が完了していない場合、構造化処理部１２０はステップＳ１４０１に戻る。エンティティグループ情報１４００の全てのエントリについて処理が完了した場合、構造化処理部１２０は主エンティティ判定処理を終了する。

　図２２は、実施例１の構造化処理装置１００が実行する並列性判定処理の一例を説明するフローチャートである。

　構造化処理部１２０は、エンティティグループのペアを生成する（ステップＳ１５０１）。例えば、エンティティグループの主エンティティの位置が近いエンティティグループのペアを生成する方法が考えられる。本発明は、エンティティグループのペアの生成方法に限定されない。

　構造化処理部１２０は、エンティティグループのペアを選択する（ステップＳ１５０２）。

　構造化処理部１２０は、テキスト及びペアを構成するエンティティグループの主エンティティ、並びに、並列性判定ルール情報７００に基づいて、ペアを構成するエンティティグループに対応する二つの手続きが並列して行われるか否かを判定する（ステップＳ１５０３）。例えば、一つのエンティティグループの主エンティティと、他のエンティティグループの主エンティティとを結ぶ文に含まれる単語に基づいて判定が行われる。

　二つの手続きが並列して行われない場合、構造化処理部１２０はステップＳ１５０５に進む。

　二つの手続きが並列して行われる場合、構造化処理部１２０は、並列して実行されることを示すフラグをペアに付与し（ステップＳ１５０４）、その後、ステップＳ１５０５に進む。

　ステップＳ１５０５では、構造化処理部１２０は、全てのエンティティグループのペアについて処理が完了したか否かを判定する（ステップＳ１５０５）。

　全てのエンティティグループのペアについて処理が完了していない場合、構造化処理部１２０はステップＳ１５０２に戻る。

　全てのエンティティグループのペアについて処理が完了した場合、構造化処理部１２０は、フラグが付与されているペアの情報に基づいて、エンティティ族を生成する（ステップＳ１５０６）。具体的には、構造化処理部１２０は、同じエンティティグループを含むペアをマージすることによってエンティティ族を生成する。

　構造化処理部１２０は、エンティティ族に関する情報を並列性情報１５００として生成し（ステップＳ１５０７）、処理データベース１５０に格納する。

　図２３は、実施例１の構造化処理装置１００が実行する手順順序判定処理の一例を説明するフローチャートである。

　構造化処理部１２０は、業務プロセス順序判定ルール情報８００に基づいて、各手順の順序を決定し（ステップＳ１６０１）、処理結果に基づいて手順順序情報１６００を生成する（ステップＳ１６０２）。具体的には、構造化処理部１２０は、業務プロセス順序判定ルール情報８００に基づいて、大まかな手順の順序を決定する。また、構造化処理部１２０は、エンティティグループに含まれる主エンティティの位置等に基づいて、各手順の順序を決定する。

　構造化処理部１２０は、エンティティグループのペアを生成する（ステップＳ１６０３）。例えば、エンティティグループの主エンティティの位置が近いエンティティグループのペアを生成する方法が考えられる。本発明は、エンティティグループのペアの生成方法に限定されない。

　構造化処理部１２０は、エンティティグループのペアを選択する（ステップＳ１６０４）。

　構造化処理部１２０は、手順順序判定ルール情報９００及び関係性定義情報１０００を参照し、エンティティグループのペアに合致するルールが存在するか否かを判定する（ステップＳ１６０５）。

　エンティティグループのペアに合致するルールが存在しない場合、構造化処理部１２０はステップＳ１６０７に進む。

　エンティティグループのペアに合致するルールが存在する場合、構造化処理部１２０は、該当するルールに対応するエントリの順序９０２に基づいて、ペアを構成する二つのエンティティグループに対応する手順間の順序を決定し（ステップＳ１６０６）、その後、ステップＳ１６０７に進む。

　ステップＳ１６０７では、全てのエンティティグループのペアについて処理が完了したか否かを判定する（ステップＳ１６０７）。

　全てのエンティティグループのペアについて処理が完了していない場合、構造化処理部１２０はステップＳ１６０４に戻る。

　全てのエンティティグループのペアについて処理が完了した場合、構造化処理部１２０は、エンティティグループのペアの判定結果に基づいて、手順の順序を決定する（ステップＳ１６０８）。

　構造化処理部１２０は、ステップＳ１６０８の処理結果に基づいて、手順順序情報１６００を更新する（ステップＳ１６０９）。

　尚、構造化処理装置１００は、業務プロセス順序判定ルール情報８００を保持していなくてもよい。この場合、業務プロセス順序判定ルール情報８００を用いた手順の順序の判定は行わないため、手順カテゴリ判定処理を省略することができる。構造化処理装置１００は、手順順序判定ルール情報９００及び関係性定義情報１０００に基づいて、手順の順序を決定すればよい。

　以上で説明したように、実施例１の構造化処理装置１００は、業務プロセスが記載された文書から、精度よく構造化データを生成することができる。手順の順序を判定するためのルールは、主エンティティ間の関係性に基づくルール、並びに、手順の順序及び手順カテゴリ間の関係性に基づくルールのみであるため、ルールの設定に要するコストを抑えることができる。

　尚、手順カテゴリ及び主エンティティの判定はルールを用いなくてもよい。例えば、学習処理によって生成されたモデルを用いて判定する方法でもよい。

　尚、手順の順序の判定はルールを用いなくてもよい。例えば、主エンティティ間の単語を用いた学習処理によって生成されたモデルと、手順の順序及び手順カテゴリの関係性を示すデータを用いた学習処理によって生成されたモデルとを用いて判定する方法でもよい。また、ルールとモデルとを組み合わせて判定する方法でもよい。

　尚、副エンティティを用いるルールを設定してもよい。

　尚、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。また、例えば、上記した実施例は本発明を分かりやすく説明するために構成を詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、各実施例の構成の一部について、他の構成に追加、削除、置換することが可能である。

　また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、本発明は、実施例の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をコンピュータに提供し、そのコンピュータが備えるプロセッサが記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施例の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、ハードディスク、ＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）、光ディスク、光磁気ディスク、ＣＤ－Ｒ、磁気テープ、不揮発性のメモリカード、ＲＯＭなどが用いられる。

　また、本実施例に記載の機能を実現するプログラムコードは、例えば、アセンブラ、Ｃ／Ｃ＋＋、ｐｅｒｌ、Ｓｈｅｌｌ、ＰＨＰ、Ｐｙｔｈｏｎ、Ｊａｖａ等の広範囲のプログラム又はスクリプト言語で実装できる。

　さらに、実施例の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することによって、それをコンピュータのハードディスクやメモリ等の記憶手段又はＣＤ－ＲＷ、ＣＤ－Ｒ等の記憶媒体に格納し、コンピュータが備えるプロセッサが当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしてもよい。

　上述の実施例において、制御線や情報線は、説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。

Claims

　少なくとも一つの計算機を備える計算機システムであって、
　複数の手順からなる業務プロセスが記載された文書の入力を受け付け、
　前記文書から、前記業務プロセスに関連する表現をエンティティとして抽出し、
　前記エンティティのカテゴリを分類し、
　一つ以上の前記エンティティから構成され、一つの前記手順に対応するエンティティグループを複数生成し、
　前記エンティティグループの各々について、前記エンティティグループに含まれる一つ以上の前記エンティティのカテゴリに基づいて、前記エンティティグループに対応する前記手順を特徴づける前記エンティティである主エンティティを特定し、
　前記主エンティティ間の関係性に基づいて、前記複数の手順の順序を判定する第１順序判定処理を実行し、
　前記第１順序判定処理の結果に基づいて、前記複数の手順の順序を決定し、
　前記業務プロセスの構造化データとして、順序づけされた前記エンティティグループに関する情報を生成し、出力することを特徴とする計算機システム。
　請求項１に記載の計算機システムであって、
　前記主エンティティ間の関係性に基づいて、並列して実行される前記手順を特定する並列性判定処理を実行し、
　前記第１順序判定処理の結果及び前記並列性判定処理の結果に基づいて、前記複数の手順の順序を決定することを特徴とする計算機システム。
　請求項２に記載の計算機システムであって、
　前記第１順序判定処理では、前記主エンティティ間を結ぶ文に含まれる文字列及び前記主エンティティ間の類似性の少なくともいずれかに基づいて、二つの前記手順間の順序が判定され、
　前記並列性判定処理では、前記主エンティティ間を結ぶ文に含まれる文字列に基づいて、並列して実行される前記手順が特定されることを特徴とする計算機システム。
　請求項３に記載の計算機システムであって、
　前記エンティティ間を結ぶ文に含まれる文字列、及び、前記エンティティ間の類似性の少なくともいずれかに基づいて、二つの前記手順間の順序を判定するためのルールを管理するための情報と、
　前記主エンティティ間を結ぶ文に含まれる文字列に基づいて、並列して実行される手順であるか否かを判定するためのルールを管理するための情報と、を保持することを特徴とする計算機システム。
　請求項１に記載の計算機システムであって、
　前記エンティティグループの各々について、前記エンティティグループに含まれる一つ以上の前記エンティティのカテゴリに基づいて、前記エンティティグループに対応する前記手順のカテゴリを分類し、
　前記手順の順序及び前記手順のカテゴリの間の関係性に基づいて、前記複数の手順の順序を判定する第２順序判定処理を実行し、
　前記第１順序判定処理及び前記第２順序判定処理に基づいて、前記複数の手順の順序を決定することを特徴とする計算機システム。
　請求項５に記載の計算機システムであって、
　前記業務プロセスにおける前記手順のカテゴリの出現順序を定義したルールを管理するための情報を保持することを特徴とする計算機システム。
　少なくとも一つの計算機を含む計算機システムが実行する、複数の手順からなる業務プロセスを表す構造化データの生成方法であって、
　前記少なくとも一つの計算機が、前記業務プロセスが記載された文書の入力を受け付ける第１のステップと、
　前記少なくとも一つの計算機が、前記文書から、前記業務プロセスに関連する表現をエンティティとして抽出する第２のステップと、
　前記少なくとも一つの計算機が、前記エンティティのカテゴリを分類する第３のステップと、
　前記少なくとも一つの計算機が、一つ以上の前記エンティティから構成され、一つの前記手順に対応するエンティティグループを複数生成する第４のステップと、
　前記少なくとも一つの計算機が、前記エンティティグループの各々について、前記エンティティグループに含まれる一つ以上の前記エンティティのカテゴリに基づいて、前記エンティティグループに対応する前記手順を特徴づける前記エンティティである主エンティティを特定する第５のステップと、
　前記少なくとも一つの計算機が、前記主エンティティ間の関係性に基づいて、前記複数の手順の順序を判定する第１順序判定処理を実行する第６のステップと、
　前記少なくとも一つの計算機が、前記第１順序判定処理の結果に基づいて、前記複数の手順の順序を決定する第７のステップと、
　前記少なくとも一つの計算機が、前記業務プロセスの構造化データとして、順序づけされた前記エンティティグループに関する情報を生成し、出力する第８のステップと、を含むことを特徴とする業務プロセスを表す構造化データの生成方法。
　請求項７に記載の業務プロセスを表す構造化データの生成方法であって、
　前記少なくとも一つの計算機が、前記主エンティティ間の関係性に基づいて、並列して実行される前記手順を特定する並列性判定処理を実行する第９のステップを含み、
　前記第７のステップは、前記少なくとも一つの計算機が、前記第１順序判定処理の結果及び前記並列性判定処理の結果に基づいて、前記複数の手順の順序を決定するステップを含むことを特徴とする業務プロセスを表す構造化データの生成方法。
　請求項８に記載の業務プロセスを表す構造化データの生成方法であって、
　前記第１順序判定処理では、前記主エンティティ間を結ぶ文に含まれる文字列及び前記主エンティティ間の類似性の少なくともいずれかに基づいて、二つの前記手順間の順序が判定され、
　前記並列性判定処理では、前記主エンティティ間を結ぶ文に含まれる文字列に基づいて、並列して実行される前記手順が特定されることを特徴とする業務プロセスを表す構造化データの生成方法。
　請求項９に記載の業務プロセスを表す構造化データの生成方法であって、
　前記計算機システムは、
　前記エンティティ間を結ぶ文に含まれる文字列、及び、前記エンティティ間の類似性の少なくともいずれかに基づいて、二つの前記手順間の順序を判定するためのルールを管理するための情報と、
　前記主エンティティ間を結ぶ文に含まれる文字列に基づいて、並列して実行される手順であるか否かを判定するためのルールを管理するための情報と、
　を保持することを特徴とする業務プロセスを表す構造化データの生成方法。
　請求項７に記載の業務プロセスを表す構造化データの生成方法であって、
　前記少なくとも一つの計算機が、前記エンティティグループの各々について、前記エンティティグループに含まれる一つ以上の前記エンティティのカテゴリに基づいて、前記エンティティグループに対応する前記手順のカテゴリを分類する第１０のステップと、
　前記少なくとも一つの計算機が、前記手順の順序及び前記手順のカテゴリの間の関係性に基づいて、前記複数の手順の順序を判定する第２順序判定処理を実行する第１１のステップと、を含み、
　前記第７のステップは、前記少なくとも一つの計算機が、前記第１順序判定処理及び前記第２順序判定処理に基づいて、前記複数の手順の順序を決定するステップを含むことを特徴とする業務プロセスを表す構造化データの生成方法。
　請求項１１に記載の業務プロセスを表す構造化データの生成方法であって、
　前記計算機システムは、前記業務プロセスにおける前記手順のカテゴリの出現順序を定義したルールを管理するための情報を保持することを特徴とする業務プロセスを表す構造化データの生成方法。