JP7484461B2 - 情報処理装置、情報処理システム、及びプログラム - Google Patents

情報処理装置、情報処理システム、及びプログラム Download PDF

Info

Publication number
JP7484461B2
JP7484461B2 JP2020101633A JP2020101633A JP7484461B2 JP 7484461 B2 JP7484461 B2 JP 7484461B2 JP 2020101633 A JP2020101633 A JP 2020101633A JP 2020101633 A JP2020101633 A JP 2020101633A JP 7484461 B2 JP7484461 B2 JP 7484461B2
Authority
JP
Japan
Prior art keywords
document
case
registered
unregistered
learning model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020101633A
Other languages
English (en)
Other versions
JP2021196746A (ja
Inventor
真太朗 河本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2020101633A priority Critical patent/JP7484461B2/ja
Publication of JP2021196746A publication Critical patent/JP2021196746A/ja
Application granted granted Critical
Publication of JP7484461B2 publication Critical patent/JP7484461B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)
  • Processing Or Creating Images (AREA)

Description

本発明は、情報処理装置、情報処理システム、及びプログラムに関する。
業務で利用される個々の文書をワークフローシステムに登録するためには、多くの情報と多岐にわたる場合分けが必要である。用紙等に出力された文書を読み取ってその文書を分類しながら登録するシステムとして、例えば、特許文献1や特許文献2等が開示されている。
特開2006―163544号公報 特開2006―243832号公報
しかし、一般に、或る種別の文書が1の案件のみに利用されることは稀なので、文書の種別だけを特定してもその文書を適切な案件に登録することはできない。そのため、ユーザは、個々の文献の内容をそれぞれ確認して、その文書が登録されるべき案件を選択しなければならなかった。
本発明は、業務で利用される文書が登録されるべき登録先の案件を探すユーザの手間をなくすこと、を目的とする。
本発明の請求項1に係る情報処理装置は、プロセッサを有し、前記プロセッサは、ワークフローにおいて案件ごとに登録された文書に含まれる項目の値、を取得し、前記文書の種別を特定し、前記値の特徴を用いて、前記文書の種別ごとに、該文書を案件に登録する規則を示す学習モデルを生成し、前記ワークフローに登録されていない未登録文書を受付け、前記未登録文書の種別、及び該未登録文書に含まれる項目の値、を特定し、特定した前記値の特徴を、特定した前記種別に応じた前記学習モデルに入力して、複数の案件の中から、前記未登録文書が登録されるべき案件を示す情報を出力する情報処理装置である。
本発明の請求項2に係る情報処理装置は、請求項1に記載の態様において、前記プロセッサは、前記文書が登録された日時を取得し、前記日時を用いて前記学習モデルを生成し、前記未登録文書を受付けた日時を特定し、特定した前記日時を、前記学習モデルに入力して、前記未登録文書が登録されるべき案件を示す情報を出力する情報処理装置である。
本発明の請求項3に係る情報処理装置は、請求項2に記載の態様において、前記プロセッサは、前記日時、及び前記値の特徴の組合せを用いて、前記学習モデルを生成し、特定した前記日時、及び前記値の特徴の組合せを、前記学習モデルに入力して、前記未登録文書が登録されるべき案件を示す情報を出力する情報処理装置である。
本発明の請求項4に係る情報処理装置は、請求項2又は3に記載の態様において、前記プロセッサは、前記日時の間隔の特徴を用いて、前記学習モデルを生成し、前記複数の案件のそれぞれに最後に文書が登録された日時から、前記未登録文書を登録した場合における文書の登録の間隔を推算し、該間隔を前記学習モデルに入力して該未登録文書が登録されるべき案件を示す情報を出力する情報処理装置である。
本発明の請求項5に係る情報処理装置は、請求項1から4のいずれか1項に記載の態様において、前記プロセッサは、前記項目を示す標識の特徴、及び該項目の配置の特徴の少なくとも一方を用いて、前記種別を特定する情報処理装置である。
本発明の請求項6に係る情報処理装置は、請求項1から5のいずれか1項に記載の態様において、前記プロセッサは、出力した前記情報をユーザに提示し、前記情報を提示した後に、前記ユーザから前記未登録文書を登録する案件の指定を受付け、受付けた前記指定が示す前記案件に、前記未登録文書を登録する情報処理装置である。
本発明の請求項7に係る情報処理システムは、通信可能に接続された複数の情報処理装置を有し、前記複数の情報処理装置のいずれかは、ワークフローにおいて案件ごとに登録された文書に含まれる項目の値、を取得し、前記文書の種別を特定し、前記値の特徴を用いて、前記文書の種別ごとに、該文書を案件に登録する規則を示す学習モデルを生成し、前記ワークフローに登録されていない未登録文書を受付け、前記未登録文書の種別、及び該未登録文書に含まれる項目の値、を特定し、特定した前記値の特徴を、特定した前記種別に応じた前記学習モデルに入力して、複数の案件の中から、前記未登録文書が登録されるべき案件を示す情報を出力する情報処理システムである。
本発明の請求項8に係るプログラムは、プロセッサを有するコンピュータに、ワークフローにおいて案件ごとに登録された文書に含まれる項目の値、を取得するステップと、前記文書の種別を特定するステップと、前記値の特徴を用いて、前記文書の種別ごとに、該文書を案件に登録する規則を示す学習モデルを生成するステップと、前記ワークフローに登録されていない未登録文書を受付けるステップと、前記未登録文書の種別、及び該未登録文書に含まれる項目の値、を特定するステップと、特定した前記値の特徴を、特定した前記種別に応じた前記学習モデルに入力して、複数の案件の中から、前記未登録文書が登録されるべき案件を示す情報を出力するステップと、を実行させるプログラムである。
請求項1、7、8に係る発明によれば、ユーザは、業務で利用される文書が登録される
べき登録先の案件を探す必要がない。
請求項2に係る発明によれば、未登録文書が登録されるべき登録先の案件を示す情報は、日時を用いた学習モデルにより出力される。
請求項3に係る発明によれば、未登録文書が登録されるべき登録先の案件を示す情報は、日時と、文書に含まれる項目の値の特徴と、の組合せを用いた学習モデルにより出力される。
請求項4に係る発明によれば、未登録文書が登録されるべき登録先の案件を示す情報は、文書が登録される間隔を用いた学習モデルにより出力される。
請求項5に係る発明によれば、文書に含まれる項目を示す標識の特徴、及びその項目の配置の特徴の少なくとも一方により、その文書の種別が特定される。
請求項6に係る発明によれば、ユーザは、学習モデルにより出力された案を示す情報が提示された後に、未登録文書を登録する案件を指定することができる。
情報処理システム9の全体構成の例を示す図。 ワークフロー管理装置4の構成の例を示す図。 案件DB421の構成の例を示す図。 文書表4212の構成の例を示す図。 項目表4213の構成の例を示す図。 情報処理装置1の構成の例を示す図。 学習モデルDB121の例を示す図。 特徴DB122の例を示す図。 端末2の構成の例を示す図。 情報処理装置1の機能的構成の例を示す図。 学習モデルを生成する動作の流れの例を示すフロー図。 学習モデルを説明するための概念図。 未登録文書が登録されるべき案件を推定する動作の流れの例を示すフロー図。 推定した案件の候補をユーザに提示する画面の例を示す図。
<実施形態>
<情報処理システムの構成>
図1は、情報処理システム9の全体構成の例を示す図である。図1に示す情報処理システム9は、ワークフローに沿って処理される案件でそれぞれ用いられ、その案件に登録される文書を管理するとともに、ワークフローに登録されていない文書(未登録文書という)が登録されるべき案件を推定して、ユーザに提示するシステムである。情報処理システム9は、図1に示す通り、情報処理装置1、端末2、通信回線3、及びワークフロー管理装置4を有する。
情報処理装置1は、端末2からユーザの指定する未登録文書を受付けて、この未登録文書に登録先となる案件を推定する装置である。情報処理装置1は、例えばコンピュータである。
端末2は、情報処理システム9のユーザがそれぞれ操作する端末装置であり、ワークフローに沿って処理される案件に用いる各種の文書を入力する。例えば、入力する文書が画像で表される場合、端末2は、画像読取装置や、画像処理装置等である。画像読取装置は、例えば、用紙等の物理的な媒体に形成された画像を保持する文書から、その画像を光学的に読取る装置である。画像処理装置は、例えば、上述した画像読取装置を有し、この画像読取装置によって読取った画像に対して変換、形成、送信等の各種の処理を実行する装置である。
なお、案件に用いる文書は、画像で表されるほか、文字等のデータで表されてもよい。この場合、端末2は、媒体に形成された画像を読取る機能を有しなくてもよく、例えば、スマートフォン、パーソナルコンピュータ等であってもよい。
ワークフロー管理装置4は、ワークフローに沿って処理される個々の案件を管理するとともに、その案件ごとに用いられる文書を管理する装置である。ワークフロー管理装置4は、例えば、コンピュータである。
通信回線3は、情報処理装置1、端末2、及びワークフロー管理装置4を通信可能に接続する回線である。通信回線3は、例えばLAN(Local Area Network)のほか、WAN(Wide Area Network)であってもよいし、インターネットであってもよいし、これらの組合せであってもよい。また、通信回線3は、公衆交換通信網(PSTN:Public Switched Telephone Networks)やサービス統合デジタル網(ISDN:Integrated Services Digital Network)等を含むものでもよい。
なお、情報処理システム9における情報処理装置1、端末2、通信回線3、及びワークフロー管理装置4の、それぞれの数は図1に示したものに限られない。例えば、情報処理装置1、及びワークフロー管理装置4は、いずれも互いに通信可能に接続された複数台の装置が機能を分担するクラスタシステムにより構成されてもよい。
<ワークフロー管理装置の構成>
図2は、ワークフロー管理装置4の構成の例を示す図である。図2に示すワークフロー管理装置4は、プロセッサ41、メモリ42、及びインタフェース43を有する。つまり、このワークフロー管理装置4は、メモリとプロセッサとを有する情報処理装置の例である。これらの構成は、例えばバスで、互いに通信可能に接続されている。
プロセッサ41は、メモリ42に記憶されているプログラムを読出して実行することによりワークフロー管理装置4の各部を制御する。プロセッサ41は、例えばCPU(Central Processing Unit)である。
インタフェース43は、有線又は無線により通信回線3を介して、ワークフロー管理装置4を端末2、及び情報処理装置1に通信可能に接続する通信回路である。
メモリ42は、プロセッサ41に読み込まれるオペレーティングシステム、各種のプログラム、データ等を記憶する記憶手段である。メモリ42は、RAM(Random Access Memory)やROM(Read Only Memory)を有する。なお、メモリ42は、ソリッドステートドライブ、ハードディスクドライブ等を有してもよい。また、メモリ42は、案件DB421を記憶する。
図3は、案件DB421の構成の例を示す図である。図3に示す案件DB421は、案件リスト4211、文書表4212、及び項目表4213を有する。案件リスト4211は、個々の案件にそれぞれ割り振られた固有の番号である案件番号と、その案件番号により識別される案件の現在の状態を示す状態情報と、を対応付けて記憶するリストである。状態情報は、例えば、完了や、アーカイブ化、見積段階、社内承認待ち、等の文字列で示されてもよいし、それぞれの状態を識別する識別情報で示されてもよい。
図4は、文書表4212の構成の例を示す図である。文書表4212は、案件DB421の案件リスト4211に列挙された案件番号ごとに1つずつ対応付けて設けられる表である。この文書表4212は、対応する案件番号により示される案件に用いられ、登録される文書についての情報を記憶する表であり、文書ごとに、文書ID、種別ID、種別名、文書名、及び登録場所を対応付けて記憶する。ここで、文書IDは、文書を識別する識別情報である。種別IDは、文書の種別を識別する識別情報である。種別名は、文書の種別の名称である。文書名は、文書の名称である。登録場所は、文書が登録される場所の情報であり、例えば、階層構造を有するファイルシステムにおけるパスやURI(Uniform Resource Identifier)等である。
例えば、図4に示す文書表4212は、図3に示す案件DB421の案件リスト4211に列挙された案件番号のうち、案件番号「1」に対応付けて設けられたものである。この文書表4212は、文書IDとして「D01」、「D02」、「D03」、「D04」等を記憶する。
そして、この文書表4212は、例えば、文書ID「D01」に、種別ID「T11」、種別名「見積書」、文書名「見積書0801」、及び登録場所「見積/」をそれぞれ対応付ける。これは、文書ID「D01」で識別される文書の種別が、種別ID「T11」で識別される種別であり、その種別名が「見積書」であることを意味する。また、これは、この文書の名称(つまり、文書名)が「見積書0801」であることを意味する。そして、これは、この文書が登録されている場所が、例えば、案件番号「1」に関する情報を登録するディレクトリである「1/」の下に設けられたサブディレクトリ「見積/」等であることを意味する。
図5は、項目表4213の構成の例を示す図である。項目表4213は、案件DB421の文書表4212に含まれる文書IDごとに1つずつ対応付けて設けられる表である。この項目表4213は、対応する文書IDで識別される文書に記述されている1以上の項目を記憶する表である。ここで、項目とは、標識と値との組であり、文書は、これら1以上の項目を記述している。
標識は、項目を識別する識別情報であり、それぞれ文字列等の記号で示される。文書に含まれる1以上の項目の標識は、その文書の種別ごとに定められる。
値は、個々の案件に登録された個々の文書で、それぞれ記述される項目の内容を示す情報であり、文字列等の記号で示される。文書に含まれる項目のそれぞれの値は、その文書ごとに定められる。
標識と値とが対応付けて記憶されているため、文書において1つの標識を指定すると、その標識に対応する値が特定される。
例えば、図5に示す項目表4213は、図4に示す文書表4212に列挙された文書IDのうち、文書ID「D01」に対応付けて設けられたものである。この項目表4213は、項目を示す標識として「登録日時」、「取引先」、「主管部門」、「担当者ID」、及び「期限」を有する。これらは、文書ID「D01」で識別される文書の種別を示す種別ID「T11」に固有の標識群である。なお、日時とは、日付、又は時刻、並びにそれらの組合せである。そして、登録日時とは、これを項目として含む文書がワークフロー管理装置4に登録された日時を示す。
例えば、図5に示す項目表4213において、標識「登録日時」に対応付けられた値は「8/1_12:15」である。これは、例えば、文書ID「D01」で識別される文書が、案件番号「1」で識別される案件に、8月1日の12時15分に登録されたことを意味する。これは、文書ID「D01」で識別される文書そのものに固有の値である。したがって、例えば、この文書の登録日時を示す「8/1_12:15」という値の特徴を用いて、この文書が登録されるべき案件を推定する場合、その推定結果は、この文書の種別ではなく、この文書自体に由来するものになる。
なお、標識を示す文字列等は、他にも例えば、「為替レート」、「単価」、「数量」、「担当者名」等が挙げられる。また、項目の値を示す文字列等は、他にも例えば、「100米ドル/円」、「4000円」、「9個」、「富士太郎」等が挙げられる。
<情報処理装置の構成>
図6は、情報処理装置1の構成の例を示す図である。図6に示す情報処理装置1は、プロセッサ11、メモリ12、及びインタフェース13を有する。つまり、この情報処理装置1は、メモリとプロセッサとを有する情報処理装置の例である。これらの構成は、例えばバスで、互いに通信可能に接続されている。
プロセッサ11は、メモリ12に記憶されているプログラムを読出して実行することにより情報処理装置1の各部を制御する。プロセッサ11は、例えばCPUである。
インタフェース13は、有線又は無線により通信回線3を介して、情報処理装置1を端末2及びワークフロー管理装置4に通信可能に接続する通信回路である。
メモリ12は、プロセッサ11に読み込まれるオペレーティングシステム、各種のプログラム、データ等を記憶する記憶手段である。メモリ12は、RAMやROMを有する。なお、メモリ12は、ソリッドステートドライブ、ハードディスクドライブ等を有してもよい。また、メモリ12は、学習モデルDB121、及び特徴DB122を記憶する。
図7は、学習モデルDB121の例を示す図である。図7に示す学習モデルDB121は、文書を案件に登録する際の規則であって、その文書に含まれる項目の値の特徴を用いる規則を示す学習モデルを、その文書の種別ごとに記憶するデータベースである。
図7に示す学習モデルDB121は、種別IDと、学習モデルと、を対応付けて記憶する。種別IDは、上述した案件DB421の文書表4212における種別IDと共通のものであり、文書の種別を識別する識別情報である。学習モデルは、対応する種別IDで識別される種別の文書において、項目の値の特徴から、その文書が登録されるべき案件を推定するためのパラメータや規則等を含む情報である。学習モデルは、線形回帰分析、ロジスティック回帰分析、決定木、ニューラルネットワーク、サポートベクターマシン等を用いたものが挙げられる。
図8は、特徴DB122の例を示す図である。特徴DB122は、文書に含まれる項目の標識、及びその標識を示す記号の配置の、それぞれの特徴と、その文書の種別とを対応付けて記憶するデータベースである。図8に示す特徴DB122は、種別IDと、特徴情報と、を対応付けて記憶する。特徴情報は、標識と配置の少なくとも2種類を含む。標識の特徴情報は、例えば、その標識を示す文字列等の記号そのものや、その記号を表現するフォントの種類、フォントサイズ、前景色、背景色等の、その記号の修飾に関する情報等である。配置の特徴情報は、対応する標識を示す記号がどこに配置されているか等の特徴を示す情報である。具体的な配置の特徴情報の例は、「署名が右下にある」、「単価が左端から40%、上端から30%の位置にある」等である。
<端末の構成>
図9は、端末2の構成の例を示す図である。図9に示す端末2は、プロセッサ21、メモリ22、インタフェース23、操作部24、表示部25、及び画像読取部26を有する。これらの構成は、例えばバスで、互いに通信可能に接続されている。
プロセッサ21は、メモリ22に記憶されているプログラムを読出して実行することにより端末2の各部を制御する。プロセッサ21は、例えばCPUである。
メモリ22は、プロセッサ21に読み込まれるオペレーティングシステム、各種のプログラム、データ等を記憶する記憶手段である。メモリ22は、RAMやROMを有する。なお、メモリ22は、ソリッドステートドライブ、ハードディスクドライブ等を有してもよい。
インタフェース23は、有線又は無線により通信回線3を介して、端末2と情報処理装置1、及びワークフロー管理装置4とを通信可能に接続する通信回路である。
操作部24は、各種の指示をするための操作ボタン、キーボード、タッチパネル、マウス等の操作子を備えており、操作を受付けてその操作内容に応じた信号をプロセッサ21に送る。
表示部25は、液晶ディスプレイ等の表示画面を有しており、プロセッサ21の制御の下、画像を表示する。表示画面の上には、操作部24の透明のタッチパネルが重ねて配置されてもよい。
画像読取部26は、例えば、スキャナ等の光学読取デバイスであり、用紙等の媒体に形成された画像を読取って、その画像を示す画像データを生成する。画像読取部26は、生成した画像データをプロセッサ21に送る。なお、端末2は、画像読取部26を有しなくてもよい。
<情報処理装置の機能的構成>
図10は、情報処理装置1の機能的構成の例を示す図である。情報処理装置1のプロセッサ11は、メモリ12に記憶されたプログラムを実行することにより、取得部111、第1特定部112、生成部113、受付部114、認識部115、第2特定部116、推定部117、提示部118、及び指示部119として機能する。
取得部111は、インタフェース13を介してワークフロー管理装置4から案件DB421に記憶されている各種の情報を取得する。取得部111が取得する情報は、案件それぞれを識別する案件番号、その案件番号で識別される案件に登録された文書の情報、及びその文書に含まれる項目の情報等を含む。
第1特定部112は、取得部111が取得した情報に基づいて、案件ごとに登録された文書の種別を特定する。
生成部113は、取得部111が取得した情報から、ワークフローに沿って処理される案件ごとに登録された文書に含まれる項目の値の特徴を抽出する。そして、生成部113は、抽出したこの特徴を用いて、第1特定部112が特定した文書の種別ごとに、学習モデルを生成する。この学習モデルは、上述した文書を案件に登録する規則を示す。
受付部114は、インタフェース13を介して端末2からユーザの各種の操作を受付ける。例えば、受付部114は、ユーザが指定する未登録文書を受付ける。図10に示す例において、この未登録文書は、用紙等に形成された画像を光学的に読取って生成した画像データによって情報処理装置1に受付けられる。
認識部115は、受付部114が受付けた未登録文書を示す画像データに対して、文字認識処理等の認識処理を実行し、その画像データが示す内容を認識する。認識部115により、未登録文書に含まれる1以上の項目と、それら項目の配置とが認識される。
第2特定部116は、認識部115により認識された未登録文書の内容から、この未登録文書の種別、及び、この未登録文書に含まれる項目の値を特定する。
推定部117は、第2特定部116が特定した項目の値の特徴を、特定した未登録文書の種別に応じた学習モデルに適用して、ワークフロー管理装置4で管理される複数の案件の中から、この未登録文書が登録されるべき案件を推定する。推定部117は、さらに、未登録文書が登録されるべき登録場所を推定してもよい。
提示部118は、例えば、ユーザに推定結果を提示する旨の設定がされている場合に、インタフェース13を介して、推定部117が推定した案件を示す情報を端末2に送り、端末2にその情報を提示するよう指示する。
上述した受付部114は、提示部118が端末2に指示をして、上述した案件をユーザに提示させた後に、このユーザから上述した未登録文書を登録する案件の指定を受付ける。指示部119は、インタフェース13を介してワークフロー管理装置4に対し、受付けたこの指定により示される案件に、上述した未登録文書を登録するよう指示する。また、指示部119は、推定結果を提示しない旨の設定がされている場合に、推定部117が推定した案件のうち、いずれか1つを選択して、選択したその案件に、上述した未登録文書を登録するよう指示する。
<情報処理装置の動作>
情報処理装置1は、学習モデルを生成する動作、及び未登録文書が登録されるべき案件を推定する動作、をそれぞれ行う。以下、各動作の流れをフロー図により説明する。
<学習モデルを生成する動作>
図11は、学習モデルを生成する動作の流れの例を示すフロー図である。情報処理装置1のプロセッサ11は、案件DB421に記憶された案件のうち、未だ注目されていない案件(以下、「未注目の案件」ともいう)の1つに注目する(ステップS101)。
プロセッサ11は、ステップS101で注目した案件(以下、「注目案件」ともいう)に登録された文書の種別を特定し(ステップS102)、その文書に含まれる項目の値を取得する(ステップS103)。この場合、プロセッサ11は、ワークフロー管理装置4において案件DB421に記憶されている各種の情報を取得する。そして、プロセッサ11は、取得したこれらの情報に基づいて、上述した文書の種別を特定し、この文書に含まれる項目の値を取得する。
そして、プロセッサ11は、取得した項目の値の特徴を抽出し(ステップS104)、特定した種別の文書を、この特徴を用いて、案件に登録する際の規則を示す学習モデルを生成する(ステップS105)。
例えば、文書の登録日時の特徴を回帰分析により抽出し、これを用いて学習モデルを生成する場合を考える。図12は、この学習モデルを説明するための概念図である。図12に示す表は、案件番号ごとに、見積書、回答書、及び決済書のそれぞれの登録日時を示した表である。これら登録日時は、それぞれの文書に項目の値として含まれる。
プロセッサ11は、図12に示す通り、見積書、及び回答書の登録日時を、説明変数群Xとして特定し、決済書の登録日時を、目的変数群Yとして特定する。そして、説明変数群Xと目的変数群Yとの関係を回帰分析により求めて、学習モデルを生成する。この学習モデルは、例えば、決済書が登録されていない案件について、見積書、及び回答書のそれぞれの登録日時から、決済書が登録されるはずの日時を推定することに用いられる。
プロセッサ11は、未注目の案件があるか否かを判断する(ステップS106)。未注目の案件がない、と判断する場合、プロセッサ11は、処理を終了する。(ステップS106;NO)、一方、未注目の案件がある、と判断する場合(ステップS106;YES)、プロセッサ11は、処理をステップS101に戻す。
つまり、この「学習モデルを生成する動作」を実行するプロセッサ11は、ワークフローにおいて案件ごとに登録された文書に含まれる項目の値、を取得し、この文書の種別を特定し、値の特徴を用いて、文書の種別ごとに、この文書を案件に登録する規則を示す学習モデルを生成するプロセッサの例である。
特に上述したプロセッサ11は、文書に含まれる項目の値として、その文書の登録日時を用いる。したがって、このプロセッサ11は、文書が登録された日時を取得し、この日時を用いて学習モデルを生成するプロセッサの例である。
<未登録文書が登録されるべき案件を推定する動作>
図13は、未登録文書が登録されるべき案件を推定する動作の流れの例を示すフロー図である。プロセッサ11は、インタフェース13を介して端末2から、未登録文書の指定を受付けたか否かを判断する(ステップS201)。未登録文書の指定を受付けていない、と判断する間(ステップS201;NO)、プロセッサ11は、この判断を続ける。
一方、未登録文書の指定を受付けた、と判断する場合(ステップS201;YES)、プロセッサ11は、受付けたこの指定が示す未登録文書の種別、及び、この未登録文書に含まれる項目の値を特定する(ステップS202)。
この場合、プロセッサ11は、例えば、未登録文書の内容に基づいて、未登録文書の種別を特定する。例えば、プロセッサ11は、この未登録文書に含まれる項目を示す標識の特徴を用いて、未登録文書の種別を特定する。また、例えば、プロセッサ11は、この未登録文書に含まれる項目の配置の特徴を用いて、未登録文書の種別を特定してもよい。また、プロセッサ11は、これら標識、及び、項目の配置のそれぞれの特徴の組合せを用いて、未登録文書の種別を特定してもよい。このプロセッサ11は、未登録文書に含まれる項目を示す標識の特徴、及びこの項目の配置の特徴の少なくとも一方を用いて、未登録文書の種別を特定するプロセッサの例である。
なお、プロセッサ11は、未登録文書の内容以外の情報に基づいて、未登録文書の種別を特定してもよい。未登録文書の内容以外の情報は、例えば、この未登録文書のメタデータや、拡張子等である。
上述した種別、及び項目の値を特定すると、プロセッサ11は、特定したこの項目の値の特徴を抽出し、この特徴を、上述した種別に対応付けて学習モデルDB121に記憶されている学習モデルに適用する。そして、プロセッサ11は、ワークフロー管理装置4で管理される複数の案件の中から、未登録文書が登録されるべき案件を推定する(ステップS203)。
例えば、プロセッサ11は、種別名が「決済書」である未登録文書を受付けると、これを受付けた日時(受付日時ともいう)を特定する。未登録文書は、受付けられた後、決められた処理を経た後に、登録先が推定され、登録されるはずである。したがって、この未登録文書の受付日時は、この未登録文書の登録日時と決められた関係を有する情報であって、この登録日時の予測に用いる情報として特定される。
次に、プロセッサ11は、ワークフロー管理装置4が案件DB421によって管理する案件のうち、種別名「決済書」の文書を登録する予定があり、かつ、この文書を未だ登録していない案件を特定する。
これらの案件を特定すると、プロセッサ11は、これらの案件に、種別名「決済書」の文書が、将来、登録されるはずの日時(つまり、登録日時)を予測する。この予測には、例えば、図12に示す説明変数群Xと目的変数群Yとの関係に基づいて生成された学習モデルが用いられる。そして、プロセッサ11は、予測した登録日時が、上述した未登録文書を受付けた受付日時、又はこの受付日時から予測される登録日時に近い案件を、この未登録文書が登録されるべき案件として推定する。
プロセッサ11は、例えば、推定した案件を提示する旨の設定が、メモリ12に予め記憶されているか否かを判断する(ステップS204)。この設定が記憶されていない、と判断する場合(ステップS204;NO)、プロセッサ11は、処理をステップS207に進める。
一方、この設定が記憶されている、と判断する場合(ステップS204;YES)、プロセッサ11は、推定した案件の候補を、その推定の正確度とともに提示する(ステップS205)。正確度とは、推定の確からしさを示す指標である。例えば、上述した例では、予測した登録日時と、未登録文書を受付けた受付日時の差が小さいほど、正確度は高く評価される。
図14は、推定した案件の候補をユーザに提示する画面の例を示す図である。図14に示す画面には、3つの案件番号が表示される。そして、これら3つの案件番号には、それぞれその案件番号で識別される案件が、受付けた未登録文書の登録先として妥当であるか否かを示す正確度と、その案件に関する情報を示す案件情報と、が対応付けて表示される。案件情報は、例えば、見積先、契約企業等、案件番号で識別される案件に関連した外部組織の名称や、案件の名称等である。情報処理装置1は、端末2にこの画面を表示させて、ユーザに未登録文書の登録先の選択を促す。
図13に示す通り、プロセッサ11は、推定した案件の提示をした後、インタフェース13を介して端末2から、ユーザによる登録先の指定を受付けたか否かを判断する(ステップS206)。登録先の指定を受付けていない、と判断する間(ステップS206;NO)、プロセッサ11は、この判断を続ける。
一方、登録先の指定を受付けた、と判断する場合(ステップS206;YES)、プロセッサ11は、受付けた指定が示す登録先に、上述した未登録文書を登録する(ステップS207)。なお、上述したステップS204において、案件を提示する設定がない、と判断する場合、例えば、推定した案件のうち、最も正確度が高い案件に、上述した未登録文書を登録する。
つまり、この「未登録文書が登録されるべき案件を推定する動作」を実行するプロセッサ11は、ワークフローに登録されていない未登録文書を受付け、この未登録文書の種別、及びこの未登録文書に含まれる項目の値、を特定し、特定した値の特徴を、特定した種別に応じた学習モデルに適用して、複数の案件の中から、未登録文書が登録されるべき案件を推定するプロセッサの例である。
特に上述したプロセッサ11は、文書に含まれる項目の値として、文書を受付けた日時、及び文書が登録された日時を用いている。したがって、このプロセッサ11は、未登録文書を受付けた日時を特定し、特定した日時を、学習モデルに適用して、未登録文書が登録されるべき案件を推定するプロセッサの例である。
なお、プロセッサ11は、学習モデルを生成し、又は適用する際に用いる項目の値の特徴として、登録日時以外のものを用いてもよい。例えば、プロセッサ11は、上述した「取引先」、「主管部門」、「担当者ID」、及び「期限」等、他の標識に対応する項目の値を用いてもよいし、文書を承認する承認者や、文書を作成する作成者、文書の宛先等の値を用いてもよい。
これにより、例えば、「A部長が承認する決済書は、B社を取引先とする、総額が50万円未満の見積書と、その回答書と、が登録された案件に、登録される」等といった規則が導かれ、この規則を示す学習モデルが生成される。そして、この学習モデルに基づいて、未登録文書に含まれる項目のうち、承認者や取引先、取引総額等、日時以外の項目の値に応じて、この未登録文書が登録されるべき案件が推定される。
また、上述したステップS205、及びステップS206を実行するこのプロセッサ11は、推定した案件をユーザに提示し、この案件を提示した後に、ユーザから未登録文書を登録する案件の指定を受付け、受付けた指定が示すその案件に、未登録文書を登録するプロセッサの例である。
この構成によれば、未登録文書が登録されるべき案件の推定が間違っていた場合に、推定された案件ではなく、ユーザが指定した案件に未登録文書が登録される。そして、この登録後の案件DB421から学習モデルが改めて生成されるので、この学習モデルは、ユーザの指定によって、逐次、修正される。つまり、この学習モデルが表現する、文書を案件に登録する規則の精度は、プロセッサ11がユーザの指定を受付けることで、向上する。
以上が本実施形態に係る情報処理システム9の情報処理装置1の動作である。この情報処理システム9において、情報処理装置1は、既に登録された文書に含まれる項目の値の特徴から、その文書の種別ごとに、その文書が案件に登録される際の規則を学習する。そして、この情報処理装置1は学習した規則を用いて、未登録文書に登録先を見つける。したがって、この情報処理システム9のユーザは、業務で利用される文書が登録されるべき登録先の案件を探す手間を省くことができる。
<変形例>
以上が実施形態の説明であるが、この実施形態の内容は以下のように変形し得る。また、以下の変形例は、互いに組合されてもよい。
<1>
上述した実施形態において、情報処理装置1は、CPUで構成されるプロセッサ11を有していたが、情報処理装置1を制御する制御手段は他の構成であってもよい。例えば、情報処理装置1は、CPU以外にも各種のプロセッサ等を有してもよい。
ここでプロセッサとは広義的なプロセッサを指し、汎用的なプロセッサ(例えば上述したCPU等)や、専用のプロセッサ(例えばGPU: Graphics Processing Unit、ASIC: Application Specific Integrated Circuit、FPGA: Field Programmable Gate Array、プログラマブル論理デバイス、等)を含むものである。
<2>
上述した実施形態におけるプロセッサの動作は、1つのプロセッサによって成すのみでなく、物理的に離れた位置に存在する複数のプロセッサが協働して成すものであってもよい。
また、プロセッサの各動作の順序は、上述した実施形態において記載した順序のみに限定されるものではなく、適宜変更されてもよい。
<3>
上述した実施形態において、情報処理装置1は、ワークフロー管理装置4と別の装置であったが、ワークフロー管理装置4の機能を兼ねて実現してもよい。この場合、情報処理装置1のメモリ12は、案件DB421に相当するデータベースを記憶すればよい。
また、情報処理装置1は、端末2の機能を有してもよい。この場合、情報処理装置1は、端末2における操作部24、及び表示部25に相当する構成を有してもよい。
<4>
プロセッサ11は、上述した登録日時の特徴と、それ以外の項目の値の特徴と、の組合せを用いて学習モデルを生成してもよい。この場合、プロセッサ11は、未登録文書を受付けると、この未登録文書の受付日時と、この未登録文書に含まれる上述した外の項目の値の特徴と、の組合せを、学習モデルに適用して、未登録文書が登録されるべき案件を推定すればよい。このプロセッサ11は、文書が登録された日時、及び文書に含まれる値の特徴の組合せを用いて、学習モデルを生成し、未登録文書を受付けた日時と、この未登録文書に含まれるいずれかの項目の値を特定し、特定したこの日時、及び値の特徴の組合せを、生成した学習モデルに適用して、未登録文書が登録されるべき案件を推定するプロセッサの例である。
なお、プロセッサ11は、項目の値のうち、登録日時等の日時そのものを示す値ではなく、日時に関係する値に基づいて、学習モデルを生成し、推定に用いてもよい。例えば、プロセッサ11は、文書の回答期限や提出期限等、日時に関係する値を用いて学習モデルを生成してもよい。なお、この日時に関係する値は、例えば「今週木曜日まで」、「3日以内」、「2020年5月末」等の文字列で示される。
<5>
上述した実施形態において、プロセッサ11は、説明変数群Xとして見積書、及び回答書の登録日時を、目的変数群Yとして決済書の登録日時を、それぞれ用いて学習モデルを生成していたが、登録日時の間隔の特徴を用いて、学習モデルを生成してもよい。プロセッサ11は、例えば、回帰分析を用いて学習モデルを生成する場合、既に登録された文書のそれぞれの登録日時の間隔を、説明変数、及び目的変数とし、最後に文書が登録された登録日時から、次に文書が登録される登録日時までの間隔を予測してもよい。そして、未登録文書を受付けたときに、プロセッサ11は、候補となる案件のそれぞれに、この未登録文書を登録した場合における文書の登録の間隔を推算する。そして、推算した間隔が、予測した間隔と、閾値を超えて近いものを、未登録文書が登録されるべき案件として推定すればよい。なお、登録日時どうしの間隔の計算には、祝祭日を除外する等、社会的な慣習に応じた演算がなされてもよい。
このプロセッサ11は、案件に文書が登録された日時の間隔の特徴を用いて、学習モデルを生成し、複数の案件のそれぞれに最後に文書が登録された日時から、未登録文書を登録した場合における文書の登録の間隔を推算し、この間隔を学習モデルに適用して未登録文書が登録されるべき案件を推定するプロセッサの例である。
この構成によれば、例えば、文書が登録されるタイミングが1週間おき、1ヶ月おき、3日おき等、予め決められた間隔で生じる案件について、その規則を示す学習モデルが生成される。そして、これらの案件のうち、新たな文書(つまり、未登録文書)を登録したと仮定した場合に、上述した間隔が維持されるものが、その文書を登録すべき案件として推定される。
<6>
上述した実施形態で、情報処理システム9は、1つの情報処理装置1を有していたが、通信可能に接続された複数台の情報処理装置1を有し、これらにより機能を分担するクラスタシステムを実現する場合、いずれかの情報処理装置1が有するプロセッサ11が、上述した取得部111、第1特定部112、生成部113、受付部114、認識部115、第2特定部116、推定部117、提示部118、及び指示部119として機能してもよい。
この場合においてこの情報処理システム9は、通信可能に接続された複数の情報処理装置を有し、これら複数の情報処理装置のいずれかは、ワークフローにおいて案件ごとに登録された文書に含まれる項目の値、を取得し、この文書の種別を特定し、取得した値の特徴を用いて、文書の種別ごとに、文書を案件に登録する規則を示す学習モデルを生成し、ワークフローに登録されていない未登録文書を受付け、この未登録文書の種別、及びこの未登録文書に含まれる項目の値、を特定し、特定した値の特徴を、特定した種別に応じた学習モデルに適用して、複数の案件の中から、未登録文書が登録されるべき案件を推定する情報処理システムの例である。
<7>
上述した実施形態において、情報処理装置1のプロセッサ11によって実行されるプログラムは、プロセッサを有するコンピュータに、ワークフローにおいて案件ごとに登録された文書に含まれる項目の値、を取得するステップと、この文書の種別を特定するステップと、取得した値の特徴を用いて、文書の種別ごとに、文書を案件に登録する規則を示す学習モデルを生成するステップと、ワークフローに登録されていない未登録文書を受付けるステップと、この未登録文書の種別、及びこの未登録文書に含まれる項目の値、を特定するステップと、特定した値の特徴を、特定した種別に応じた学習モデルに適用して、複数の案件の中から、未登録文書が登録されるべき案件を推定するステップと、を実行させるプログラムの例である。
このプログラムは、磁気テープ及び磁気ディスク等の磁気記録媒体、光ディスク等の光記録媒体、光磁気記録媒体、半導体メモリ等の、コンピュータ装置が読取り可能な記録媒体に記憶された状態で提供し得る。また、このプログラムは、インターネット等の通信回線経由でダウンロードされてもよい。
1…情報処理装置、11…プロセッサ、111…取得部、112…第1特定部、113…生成部、114…受付部、115…認識部、116…第2特定部、117…推定部、118…提示部、119…指示部、12…メモリ、121…学習モデルDB、122…特徴DB、13…インタフェース、2…端末、21…プロセッサ、22…メモリ、23…インタフェース、24…操作部、25…表示部、26…画像読取部、3…通信回線、4…ワークフロー管理装置、41…プロセッサ、42…メモリ、421…案件DB、4211…案件リスト、4212…文書表、4213…項目表、43…インタフェース、9…情報処理システム。

Claims (8)

  1. プロセッサを有し、前記プロセッサは、
    ワークフローにおいて案件ごとに登録された文書に含まれる項目の値、を取得し、
    前記文書の種別を特定し、
    前記値の特徴を用いて、前記文書の種別ごとに、該文書を案件に登録する規則を示す学習モデルを生成し、
    前記ワークフローに登録されていない未登録文書を受付け、
    前記未登録文書の種別、及び該未登録文書に含まれる項目の値、を特定し、
    特定した前記値の特徴を、特定した前記種別に応じた前記学習モデルに入力して、複数の案件の中から、前記未登録文書が登録されるべき案件を示す情報を出力する
    情報処理装置。
  2. 前記プロセッサは、
    前記文書が登録された日時を取得し、
    前記日時を用いて前記学習モデルを生成し、
    前記未登録文書を受付けた日時を特定し、
    特定した前記日時を、前記学習モデルに入力して、前記未登録文書が登録されるべき案件を示す情報を出力する
    請求項1に記載の情報処理装置。
  3. 前記プロセッサは、
    前記日時、及び前記値の特徴の組合せを用いて、前記学習モデルを生成し、
    特定した前記日時、及び前記値の特徴の組合せを、前記学習モデルに入力して、前記未登録文書が登録されるべき案件を示す情報を出力する
    請求項2に記載の情報処理装置。
  4. 前記プロセッサは、
    前記日時の間隔の特徴を用いて、前記学習モデルを生成し、
    前記複数の案件のそれぞれに最後に文書が登録された日時から、前記未登録文書を登録した場合における文書の登録の間隔を推算し、該間隔を前記学習モデルに入力して該未登録文書が登録されるべき案件を示す情報を出力する
    請求項2又は3に記載の情報処理装置。
  5. 前記プロセッサは、
    前記項目を示す標識の特徴、及び該項目の配置の特徴の少なくとも一方を用いて、前記種別を特定する
    請求項1から4のいずれか1項に記載の情報処理装置。
  6. 前記プロセッサは、
    出力した前記情報をユーザに提示し、
    前記情報を提示した後に、前記ユーザから前記未登録文書を登録する案件の指定を受付け、
    受付けた前記指定が示す前記案件に、前記未登録文書を登録する
    請求項1から5のいずれか1項に記載の情報処理装置。
  7. 通信可能に接続された複数の情報処理装置を有し、前記複数の情報処理装置のいずれかは、
    ワークフローにおいて案件ごとに登録された文書に含まれる項目の値、を取得し、
    前記文書の種別を特定し、
    前記値の特徴を用いて、前記文書の種別ごとに、該文書を案件に登録する規則を示す学習モデルを生成し、
    前記ワークフローに登録されていない未登録文書を受付け、
    前記未登録文書の種別、及び該未登録文書に含まれる項目の値、を特定し、
    特定した前記値の特徴を、特定した前記種別に応じた前記学習モデルに入力して、複数の案件の中から、前記未登録文書が登録されるべき案件を示す情報を出力する
    情報処理システム。
  8. プロセッサを有するコンピュータに、
    ワークフローにおいて案件ごとに登録された文書に含まれる項目の値、を取得するステップと、
    前記文書の種別を特定するステップと、
    前記値の特徴を用いて、前記文書の種別ごとに、該文書を案件に登録する規則を示す学習モデルを生成するステップと、
    前記ワークフローに登録されていない未登録文書を受付けるステップと、
    前記未登録文書の種別、及び該未登録文書に含まれる項目の値、を特定するステップと、
    特定した前記値の特徴を、特定した前記種別に応じた前記学習モデルに入力して、複数の案件の中から、前記未登録文書が登録されるべき案件を示す情報を出力するステップと、
    を実行させるプログラム。
JP2020101633A 2020-06-11 2020-06-11 情報処理装置、情報処理システム、及びプログラム Active JP7484461B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020101633A JP7484461B2 (ja) 2020-06-11 2020-06-11 情報処理装置、情報処理システム、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020101633A JP7484461B2 (ja) 2020-06-11 2020-06-11 情報処理装置、情報処理システム、及びプログラム

Publications (2)

Publication Number Publication Date
JP2021196746A JP2021196746A (ja) 2021-12-27
JP7484461B2 true JP7484461B2 (ja) 2024-05-16

Family

ID=79195547

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020101633A Active JP7484461B2 (ja) 2020-06-11 2020-06-11 情報処理装置、情報処理システム、及びプログラム

Country Status (1)

Country Link
JP (1) JP7484461B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017107455A (ja) 2015-12-10 2017-06-15 キヤノン株式会社 情報処理装置、制御方法、及びプログラム
JP2017134502A (ja) 2016-01-26 2017-08-03 株式会社東芝 ドキュメント管理装置、ドキュメント管理方法及びプログラム
JP2019197459A (ja) 2018-05-11 2019-11-14 株式会社日立製作所 案件振分支援システム、案件振分支援装置、及び案件振分支援方法
JP2019200449A (ja) 2018-05-14 2019-11-21 株式会社日立製作所 案件振分支援システム、案件振分支援装置、及び案件振分支援方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017107455A (ja) 2015-12-10 2017-06-15 キヤノン株式会社 情報処理装置、制御方法、及びプログラム
JP2017134502A (ja) 2016-01-26 2017-08-03 株式会社東芝 ドキュメント管理装置、ドキュメント管理方法及びプログラム
JP2019197459A (ja) 2018-05-11 2019-11-14 株式会社日立製作所 案件振分支援システム、案件振分支援装置、及び案件振分支援方法
JP2019200449A (ja) 2018-05-14 2019-11-21 株式会社日立製作所 案件振分支援システム、案件振分支援装置、及び案件振分支援方法

Also Published As

Publication number Publication date
JP2021196746A (ja) 2021-12-27

Similar Documents

Publication Publication Date Title
US20210224818A1 (en) User Interface and Process Flow for Providing an Intent Suggestion to a User in a Text-Based Conversational Experience with User Feedback
US11783432B1 (en) System for providing access to user interfaces generated using purchase history data
US10366123B1 (en) Template-free extraction of data from documents
US8972428B2 (en) Providing an answer to a question left unanswered in an electronic forum
US8769417B1 (en) Identifying an answer to a question in an electronic forum
US20190108486A1 (en) System and method for intelligent and automatic electronic communication support and routing
US11367117B1 (en) Artificial intelligence system for generating network-accessible recommendations with explanatory metadata
CN1987913A (zh) 以专家系统推荐解决方案的方法和系统
WO2021059848A1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
US20220129491A1 (en) Method for supporting agent and computing device thereof
CN112819504A (zh) 用于定制评论的系统和方法
JP2012198684A (ja) 情報処理装置、帳票種別推定方法および帳票種別推定用プログラム
CN115292473A (zh) 低代码方案中的扩展的选择性推荐和部署
JP7484461B2 (ja) 情報処理装置、情報処理システム、及びプログラム
KR100695467B1 (ko) 웹 사용성 평가 방법 및 이의 평가 시스템
CN112784021A (zh) 用于使用从评论提取的关键字的系统和方法
JP6495511B1 (ja) 電子メール作成装置、方法及びプログラム
US20160260178A1 (en) Commodity management system, information processing apparatus and terminal device for managing commodity
JP5311949B2 (ja) 業務支援システム
US20230134796A1 (en) Named entity recognition system for sentiment labeling
CN112131321A (zh) 用户画像标签的生成方法和装置、计算机设备、存储介质
JP2008123423A (ja) 電文データの監査用保管・検索システム、電文データの監査用保管・検索方法、および電文データの監査用保管・検索プログラム
JP2020091687A (ja) ワークフローモデル生成システム、ワークフローモデル生成プログラム、ワークフローモデル生成方法。
JP2021056962A (ja) ワークフロー支援装置、ワークフロー支援システム及びプログラム
WO2019008394A1 (en) CAPTURE AND EXTRACTION OF DIGITAL INFORMATION

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230316

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240321

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240402

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240415

R150 Certificate of patent or registration of utility model

Ref document number: 7484461

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150