JP2019191665A - 財務諸表読取装置、財務諸表読取方法及びプログラム - Google Patents
財務諸表読取装置、財務諸表読取方法及びプログラム Download PDFInfo
- Publication number
- JP2019191665A JP2019191665A JP2018080210A JP2018080210A JP2019191665A JP 2019191665 A JP2019191665 A JP 2019191665A JP 2018080210 A JP2018080210 A JP 2018080210A JP 2018080210 A JP2018080210 A JP 2018080210A JP 2019191665 A JP2019191665 A JP 2019191665A
- Authority
- JP
- Japan
- Prior art keywords
- document data
- reading
- reading range
- user
- financial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
【課題】クラウドサービスにおいて財務諸表の読み取り結果に対するユーザの修正を収集する。【解決手段】財務諸表読取装置は、読取装置及びユーザ端末と接続される財務諸表読取装置であって、財務諸表を読取装置でスキャンして生成した文書データを取得し、予め記憶部に格納されている、財務諸表の読み取り範囲を学習した学習済みモデルに基づいて文書データから読取範囲を特定する識別部と、文書データと、識別部が特定した読取範囲とをユーザ端末のウェブブラウザに表示させる出力部と、ウェブブラウザ上でユーザが変更した読取範囲を取得し、文書データと関連付けて記憶部に記憶させる修正部とを備える。【選択図】図2
Description
本発明は、財務諸表読取装置、財務諸表読取方法及びプログラムに関する。
従来、財務諸表を、スキャナによりイメージ入力した入力結果を、科目欄・金額欄別の認識処理し、イメージ情報の文字をデジタル化処理手段と、デジタル化認識の文字を文字列と数値を分割し、文字列を勘定科目辞書と突合わせチェックする突合わせ処理手段を備える財務諸表自動入力装置が提案されていた(例えば、特許文献1)。本技術では、誤読文字と判定の文字列を正しい文字列に置換する処理手段と、デジタル化処理手段に、認識処理に際し、画面に表示された読み取り枠パターンから最も類似したパターンの選択により自動的に勘定科目、金額範囲を枠でくくる処理を含む。
従来、スキャンされた財務諸表を入力として、最も類似したパターンの選択により自動的に勘定科目、金額範囲を枠でくくるという技術は提案されていた。しかしながら、読取結果が適切でない場合、ユーザによる修正が必要になる。特にクラウドサービスとして財務諸表の読み取りを行う場合、修正指示の収集が困難であった。
本発明は、クラウドサービスにおいて財務諸表の読み取り結果に対するユーザの修正を収集できるようにすることを目的とする。
本発明に係る財務諸表読取装置は、読取装置及びユーザ端末と接続される財務諸表読取装置であって、財務諸表を読取装置でスキャンして生成した文書データを取得し、予め記憶部に格納されている、財務諸表の読み取り範囲を学習した学習済みモデルに基づいて文書データから読取範囲を特定する識別部と、文書データと、識別部が特定した読取範囲とをユーザ端末のウェブブラウザに表示させる出力部と、ウェブブラウザ上でユーザが変更した読取範囲を取得し、文書データと関連付けて記憶部に記憶させる修正部とを備える。
このようにすれば、スキャンした財務諸表について読取範囲をユーザに提案することができると共に、修正を受け付けることができる。特にユーザ端末に対しクラウド上で機能を提供する場合、ウェブブラウザで操作可能にすることで、専用のソフトウェアのインストールが必要なくなる。
また、読取装置から送信される当該読取装置の識別情報若しくは文書データを送信するユーザの識別情報、又は文書データ中に含まれる文書を区切るページの情報に基づき、文書データの格納場所を決定する保存制御部をさらに備えるようにしてもよい。このようにすれば、財務諸表を読み取る操作により所定の格納場所に文書データを格納することができる。
また、学習済みモデルは、文書データの向きを機械学習した情報をさらに含み、識別部は、ページごとに向きを修正した文書データにおける読取範囲を特定するようにしてもよ
い。このようにすれば、スキャンした財務諸表について書類の向きを自動的に修正することができるため、ユーザは向きを揃えることなく読み込ませることができる。
い。このようにすれば、スキャンした財務諸表について書類の向きを自動的に修正することができるため、ユーザは向きを揃えることなく読み込ませることができる。
また、出力部は、ウェブブラウザにおいて画像データ上に読取範囲を重畳して表示させ、修正部は、ウェブブラウザ上でユーザがドラッグして変形させた読取範囲を取得するようにしてもよい。具体的にはこのような構成を採用することができ、例えばHTML5の機能を利用して実現することができる。
また、予め業種ごとに定められた集約前後の勘定科目に基づき、財務諸表を作成した企業の業種に応じて、読取範囲に記載された勘定科目を集約後の勘定科目に集約して金額を集計する集計処理部をさらに備えるようにしてもよい。このようにすれば、業種によって分類すべき科目が異なる場合にも、適切に財務諸表の分析を適切に行うことができるようになる。
また、修正部は、読取範囲に含まれる項目をOCR(Optical Character Recognition)により認識した文字列が、予め定められた科目辞書に存在しない場合は、文字列と科目辞書に登録された科目との近さを示す所定の指標に基づいて候補の科目を抽出するようにしてもよい。このようにすれば、読取範囲に含まれる科目の認識精度を向上させることができる。
なお、課題を解決するための手段に記載の内容は、本発明の課題や技術的思想を逸脱しない範囲で可能な限り組み合わせることができる。また、課題を解決するための手段の内容は、コンピュータ等の装置若しくは複数の装置を含むシステム、コンピュータが実行する方法、又はコンピュータに実行させるプログラムとして提供することができる。なお、プログラムを保持する記録媒体を提供するようにしてもよい。
クラウドサービスにおいて財務諸表の読み取り結果に対するユーザの修正を収集できる。
以下、図面を参照して本発明を実施するための形態について説明する。
<システム構成>
図1は、本実施形態に係るシステムの構成の一例を示す図である。本実施形態に係るシステムは、例えば金融機関において融資の審査を行うために、財務諸表を管理する。具体的には、例えば金融機関の支店において個別の取引先を担当する担当者が企業の財務諸表を入力し、データをクラウド上で管理すると共に、例えば本社等のユーザがデータを利用する。また、システム1はスキャンされた財務諸表の文書データについて、記載された項
目を識別し、記載された項目を所定のルールに基づき予め定められた科目に集約する。なお、財務諸表とは、貸借対照表、損益計算書、キャッシュフロー計算書、株主資本等変動計算書等を含む。
図1は、本実施形態に係るシステムの構成の一例を示す図である。本実施形態に係るシステムは、例えば金融機関において融資の審査を行うために、財務諸表を管理する。具体的には、例えば金融機関の支店において個別の取引先を担当する担当者が企業の財務諸表を入力し、データをクラウド上で管理すると共に、例えば本社等のユーザがデータを利用する。また、システム1はスキャンされた財務諸表の文書データについて、記載された項
目を識別し、記載された項目を所定のルールに基づき予め定められた科目に集約する。なお、財務諸表とは、貸借対照表、損益計算書、キャッシュフロー計算書、株主資本等変動計算書等を含む。
図1のシステム1は、例えば金融機関の支店に設けられる読取装置2及びファイルサーバ22と、財務諸表を管理するサーバ3と、ユーザ端末4とを備え、これらの構成要素がインターネット等の通信網であるネットワーク5を介して通信可能に接続されている。なお、読取装置2やユーザ端末4等の構成要素は複数存在してもよい。
読取装置2は、スキャナや複合機等である。読取装置2は、担当者の操作に基づいて紙の財務諸表を読み取り、作成する文書データをファイルサーバ22に格納する。
サーバ3は、財務諸表の文書データをファイルサーバ22から取得し、内容を読み取るコンピュータである。例えば、サーバ3は、文書データの向きを修正したり、OCR(Optical Character Recognition)技術を利用して文字列を識別したりする。また、サーバ3は、財務諸表の種別を判定して読取範囲を決定したり、項目を識別して所定の科目に集約し、集計してもよい。なお、財務諸表の種別とは、貸借対照表や損益計算書、キャッシュフロー計算書、株主資本等変動計算書等のような財務諸表を構成する書類の種類をいうものとする。
ユーザ端末4は、例えば、金融機関の支店において財務諸表の読み取り操作を行ったユーザや、金融機関の本店等において企業への融資の審査を行うユーザが使用するコンピュータであり、サーバ3が保持する情報を表示する。また、ユーザ端末4は、サーバ3が保持する情報について校正や承認を行うために、例えば事務センター等に設けられるコンピュータを含むものであってもよい。
ネットワーク5は、インターネットや通信事業者が提供する通信網等を含むネットワークである。
図2は、読取装置2、サーバ3及びユーザ端末4の構成の一例を示すブロック図である。
<読取装置>
読取装置2は、スキャナや複合機等であり、通信I/F(Interface)21と、イメージスキャナ23と、プロセッサ24と、バス又は信号線25とを備えている。また、読取装置2は、通信I/F21を介してファイルサーバ22と接続されている。ファイルサーバ22は、いわゆるNAS(Network-Attached Storage)であってもよく、ネットワーク上の外部記憶装置として機能する。ファイルサーバ22は、例えば支店内のLAN(Local Area Network)に接続され、共有ディスクとして利用されるものであってもよい。
読取装置2は、スキャナや複合機等であり、通信I/F(Interface)21と、イメージスキャナ23と、プロセッサ24と、バス又は信号線25とを備えている。また、読取装置2は、通信I/F21を介してファイルサーバ22と接続されている。ファイルサーバ22は、いわゆるNAS(Network-Attached Storage)であってもよく、ネットワーク上の外部記憶装置として機能する。ファイルサーバ22は、例えば支店内のLAN(Local Area Network)に接続され、共有ディスクとして利用されるものであってもよい。
通信I/F21は、例えばネットワークカードであり、所定のプロトコルに基づき、ネットワーク5を介して他のコンピュータと通信を行う。
イメージスキャナ23は、紙面等の原稿をCCD(Charge-Coupled Device)イメージセンサ等の光学センサで読み取り、デジタルデータに変換する装置である。イメージスキャナ23は、例えば原稿を送るローラを備えたシートフィードスキャナであり、ユーザは複数のページからなる財務諸表の書類をまとめてスキャンさせることができるものとする。
プロセッサ24は、CPU(Central Processing Unit)やマイクロコントローラ等の
演算処理装置であり、プログラムを実行することにより本実施の形態に係る各処理を行う。図2の例では、プロセッサ24内に機能ブロックを示している。プロセッサ24は、例えば、読取制御部241と、通信制御部242とを含む。
演算処理装置であり、プログラムを実行することにより本実施の形態に係る各処理を行う。図2の例では、プロセッサ24内に機能ブロックを示している。プロセッサ24は、例えば、読取制御部241と、通信制御部242とを含む。
読取制御部241は、イメージスキャナ23を駆動させて紙面の原稿をスキャンし、文書データを作成する。通信制御部242は、文書データをファイルサーバ22に格納したり、ネットワーク5を介してサーバ3へ送信したりする。
以上のような構成要素が、バス又は信号線25を介して接続されている。
<サーバ>
サーバ3は、一般的なコンピュータであり、通信I/F(Interface)31と、記憶装置32と、入出力装置33と、プロセッサ34と、バス35とを備えている。
サーバ3は、一般的なコンピュータであり、通信I/F(Interface)31と、記憶装置32と、入出力装置33と、プロセッサ34と、バス35とを備えている。
通信I/F31は、例えば通信モジュールであり、所定のプロトコルに基づき、ネットワーク5を介して他のコンピュータと通信を行う。
記憶装置32は、RAMやROM等の主記憶装置及びHDDやSSD、フラッシュメモリ等の補助記憶装置である。主記憶装置は、プロセッサが読み出したプログラムやデータを一時的に記憶したり、プロセッサの作業領域を確保したりする。補助記憶装置は、プロセッサが実行するプログラムや、他の装置との間で送受信される情報等を記憶する。
入出力装置33は、例えばキーボード、マウス等の入力装置や、モニタ等の出力装置、タッチパネル等のユーザインターフェースである。
プロセッサ34は、CPU等の演算処理装置であり、プログラムを実行することにより本実施の形態に係る各処理を行う。サーバ3においても、プロセッサ34内に機能ブロックを示している。プロセッサ34は、保存制御部341と、認識処理部342と、修正処理部343と、集計処理部344とを含む。
保存制御部341は、通信I/F31を介して受信した文書データを記憶装置32に格納する。このとき、読取装置2の識別情報、読取装置2を使用して文書データを送信するユーザの識別情報、文書データ内に挿入された表紙の情報等に基づき、例えば記憶装置32内における文書データの格納場所(ファイルパス)を決定するようにしてもよい。認識処理部342は、記憶装置32に格納された文書データに対し、文字の自動認識処理(OCR)を行ったり、財務諸表の種別を判断したり、読取範囲を特定したりする。なお、予め財務諸表について書類の向きや、財務諸表の種別、読み取るべき項目等を機械学習させ、学習済みモデルを利用して認識を行うようにしてもよい。修正処理部343は、認識結果を示すウェブページを生成し、通信I/F31を介してユーザ端末4に送信する。また、修正処理部343は、ユーザがウェブブラウザ上で読み取り範囲の修正を行った場合に、修正後の情報を取得し、財務諸表の種別と関連付けて記憶装置32に記憶させる。集計処理部344は、認識処理部342が読み取った項目及び当該項目に対応付けて記載された数値を用いて、予め定められた科目に集約する。
以上のような構成要素が、バス35を介して接続されている。
<ユーザ端末>
ユーザ端末4は、一般的なコンピュータであり、通信I/F41と、記憶装置42と、入出力装置43と、プロセッサ44と、バス45とを備えている。
ユーザ端末4は、一般的なコンピュータであり、通信I/F41と、記憶装置42と、入出力装置43と、プロセッサ44と、バス45とを備えている。
通信I/F41は、例えばネットワークカードであり、所定のプロトコルに基づき、他の装置と通信を行う。
記憶装置42は、RAMやROM等の主記憶装置及びHDDやSSD、フラッシュメモリ等の補助記憶装置である。主記憶装置は、プロセッサが読み出したプログラムやデータを一時的に記憶したり、プロセッサの作業領域を確保したりする。補助記憶装置は、プロセッサが実行するプログラムや、他の装置との間で送受信される情報を記憶する。
入出力装置43は、例えばキーボード、マウス等の入力装置や、モニタ等の出力装置、タッチパネル等のユーザインターフェースである。
プロセッサ44は、CPU等の演算処理装置であり、プログラムを実行することにより本実施の形態に係る各処理を行う。ユーザ端末4についても、プロセッサ44内に機能ブロックを示している。プロセッサ44は、例えば、表示制御部441と、確認処理部442とを含む。
表示制御部441は、サーバ3が保持する情報を表示する。例えば、ディスプレイ等の入出力装置43を介してウェブブラウザで文書データを表示させると共に、長方形等の図形をオーバーレイ表示させることで認識された所定の領域を表示する。また、確認処理部442は、入出力装置43を介してユーザの操作を受け付け、読取結果を修正したり、内容を承認したりする。例えば、ユーザの操作に基づき図形の端をドラッグすることにより、所定の領域を変更させるための指示を受け付け、通信I/F41を介してサーバ3へ修正後の領域を示す情報を送信する。
以上のような構成要素が、バス45を介して接続されている。
<文書読取処理>
図3は、本実施形態に係る財務諸表の読み取り処理の一例を示す処理フロー図である。なお、読取装置2を使用するユーザは、ユーザごとに作成された、本システムを利用するためのアカウントにログインし、スキャンした文書情報と関連付けてユーザの識別情報が保持されるようにしてもよい。
図3は、本実施形態に係る財務諸表の読み取り処理の一例を示す処理フロー図である。なお、読取装置2を使用するユーザは、ユーザごとに作成された、本システムを利用するためのアカウントにログインし、スキャンした文書情報と関連付けてユーザの識別情報が保持されるようにしてもよい。
読取装置2の読取制御部241は、ユーザの操作に応じて紙面の財務諸表の入力を受け、画像として読み取る処理を行う(図3:S1)。本ステップでは、読取制御部241は、イメージスキャナ23を介して財務諸表の書類を光学的に読み取り、PDF(Portable
Document Format)その他の文書データを生成する。また、生成された文書データは、例えばファイルサーバ22又は読取装置2が備えるメモリ(図示せず)に格納されるものとする。財務諸表は、複数のページを連続してスキャンしてもよい。また、たとえばユーザが担当する複数の企業の財務諸表を連続してスキャンしてもよく、各企業の財務諸表の境界に例えば所定の情報を記載した表紙のページを挿入し、サーバ3が情報の境界を識別できるようにしてもよい。例えば、表紙のページには、所定の情報として企業の識別情報、ユーザの識別情報等を、文字や記号、図形等で記載するようにしてもよいし、単に文書間の境界を表す情報を、文字や記号、図形、白紙等で表すようにしてもよい。
Document Format)その他の文書データを生成する。また、生成された文書データは、例えばファイルサーバ22又は読取装置2が備えるメモリ(図示せず)に格納されるものとする。財務諸表は、複数のページを連続してスキャンしてもよい。また、たとえばユーザが担当する複数の企業の財務諸表を連続してスキャンしてもよく、各企業の財務諸表の境界に例えば所定の情報を記載した表紙のページを挿入し、サーバ3が情報の境界を識別できるようにしてもよい。例えば、表紙のページには、所定の情報として企業の識別情報、ユーザの識別情報等を、文字や記号、図形等で記載するようにしてもよいし、単に文書間の境界を表す情報を、文字や記号、図形、白紙等で表すようにしてもよい。
また、読取装置2の通信制御部242は、生成された文書データを、通信I/F21を介してサーバ3へ送信する(S2)。本ステップでは、ファイルサーバ22又は読取装置2のメモリに格納された文書データを所定のプロトコルを利用して送信する。読取装置2は、マルチプロトコルに対応した機器であってもよい。プロトコルは、例えば、HTTPS(HyperText Transfer Protocol Secure)、FTP(File Transfer Protocol)、SMTP(Simple Mail Transfer Protocol)、websocket等を利用する。
一方、サーバ3の保存制御部341は、通信I/F31を介して文書データを受信し(S3)、格納場所を決定する(S4)。本ステップでは、保存制御部341は、送信元である読取装置2のアドレス等のような識別情報、若しくは文書データを送信するユーザの識別情報、又は文書データ中に含まれる文書を区切る表紙等のページに基づいて、記憶装置32における格納場所を示すファイルパスを決定する。なお、表紙等のページに、財務諸表を作成した企業を特定するための識別情報を文字列や二次元コード等の図形により表示しておき、企業ごとにファイルの格納場所を変更すると共に、財務諸表を作成した企業を特定するための識別情報を文書データと紐づけて登録するようにしてもよい。また、保存制御部341は、決定した保存場所に文書データを格納する(S5)。
<読取範囲決定処理>
図4は、本実施の形態に係る読取範囲決定処理の一例を示す処理フロー図である。ユーザ端末4の表示制御部441は、通信I/F31を介して、サーバ3へ文書データ及び読取範囲の送信を要求する(図4:S11)。
図4は、本実施の形態に係る読取範囲決定処理の一例を示す処理フロー図である。ユーザ端末4の表示制御部441は、通信I/F31を介して、サーバ3へ文書データ及び読取範囲の送信を要求する(図4:S11)。
一方、サーバ3の認識処理部342は、通信I/F31を介してユーザ端末4から要求を受信すると(S12)、要求された文書データを記憶装置32から読み出す(S13)。なお、このとき、サーバ3の認識処理部342は、文書データに対してOCR(Optical Character Recognition)を行い、文書データから文字列とその記載された位置を識別する。なお、OCRは図3のS5において自動的に行うようにしてもよい。また、認識処理部342は、文書データのページごとに、文書の向きを修正するようにしてもよい。文書データの向きは、一般的な文書又は財務諸表とその正しい向きとを機械学習して生成した学習済みモデルを記憶装置32に記憶させておき、学習済みモデルを用いて判断することができる。
また、認識処理部342は、読み出した文書データについて、読取範囲を特定する(S14)。本実施形態では、予め財務諸表とその読取範囲を機械学習して生成した学習済みモデルを記憶装置32に記憶させておき、学習済みモデルを用いて判断することができる。機械学習は、例えば、ニューラルネットワークを利用し、文書データの画素又はOCRにより認識した文字等を入力として、財務諸表の種別を示す情報及びその読取範囲を出力させるようにしてもよい。
また、認識処理部342は、文書データとその読取範囲を示すウェブページを生成し、ユーザ端末4へ送信する(S15)。本ステップでは、文書データの画像と、当該画像に重畳(オーバーレイ)して範囲を示す矩形を表示するHTML(Hypertext Markup Language)ファイルを生成する。なお、図形のオーバーレイはたとえばHTML5の機能により実現することができる。
一方、ユーザ端末4の表示制御部441は、通信I/F41を介してウェブページのHTMLファイルを受信し(S16)、文書データ及び読取範囲を入出力装置43に表示させる(S17)。表示制御部441は、ユーザ端末4に予めインストールされたウェブブラウザに文書データ及び読取範囲を表示させるものとする。
図5は、ウェブブラウザに表示される財務諸表の文書データ及び読取範囲の一例を示す図である。図5の例では、ウェブブラウザ431の中にスキャンされた貸借対照表の画像432が表示され、さらに読取結果を示す破線の矩形433が表示されている。
また、ユーザ端末4の確認処理部442は、入出力装置43を介してユーザの操作による読取範囲の修正を受け付け、サーバ3へ送信する(S18)。本ステップでは、例えば
ユーザが読取範囲を示す図形をドラッグすることにより、修正後の範囲を入力する。ウェブブラウザ上での図形のドラッグ操作は、例えばHTML5の機能により実現することができる。
ユーザが読取範囲を示す図形をドラッグすることにより、修正後の範囲を入力する。ウェブブラウザ上での図形のドラッグ操作は、例えばHTML5の機能により実現することができる。
一方、サーバ3の修正処理部343は、通信I/F31を介してユーザ端末4から文書データのページと修正後の読取範囲を示す情報を受信し、例えば文書データのページと対応付けて修正後の読取範囲を示す情報を記憶装置32に格納する(S19)。
このようにして、読取範囲を自動認識してユーザに提示すると共に、必要に応じてユーザから修正を受け付けることができる。なお、ユーザは文書データと紐づけて、財務諸表を作成した企業を特定するための識別情報を登録又は修正するようにしてもよい。
<集計処理>
図6は、本実施形態に係る集計処理の一例を示す処理フロー図である。ユーザ端末4の表示制御部441は、通信I/F41を介してサーバ3へ、集計処理の実行要求を送信する(図6:S21)。本ステップでは、入出力装置43を介してユーザからの操作を受け付け、集計処理の要求を示す情報を送信する。集計は、例えばユーザが指定する1つの財務諸表について行うようにしてもよいし、複数の財務諸表について整合性を確認できるようにしてもよい。
図6は、本実施形態に係る集計処理の一例を示す処理フロー図である。ユーザ端末4の表示制御部441は、通信I/F41を介してサーバ3へ、集計処理の実行要求を送信する(図6:S21)。本ステップでは、入出力装置43を介してユーザからの操作を受け付け、集計処理の要求を示す情報を送信する。集計は、例えばユーザが指定する1つの財務諸表について行うようにしてもよいし、複数の財務諸表について整合性を確認できるようにしてもよい。
一方、サーバ3の集計処理部344は、通信I/F31を介してユーザ端末4から集計の要求を受信すると(S22)、文書データを読み出し(S23)、読取範囲を特定する(S24)。例えば文書データは、ユーザが集計を要求した財務諸表の文書データを読み出す。なお、文書データは、財務諸表を作成した企業を特定するための識別情報と紐づけられていると共に、各企業の業種及び業態を示す情報があらかじめ登録されているものとする。また、読取範囲は、文書データと関連付けて記憶装置32に記憶された読取範囲を用いるものとする。
また、集計処理部344は、文書データから項目の文字列及び当該項目の数値(金額)を読み出す(S25)。本ステップでは、読取範囲に含まれる、OCRにより認識された文字列及び数値を読み出す。
また、集計処理部344は、科目の集約及び数値の集計を行う(S26)。なお、予め財務諸表に記載される項目と、本実施形態に係る集計処理で用いる所定の科目とを関連付けて記憶するデータベースを記憶装置32に格納しておき、本ステップでは所定の科目に集約する。
図7は、所定の科目との対応付けを表すデータベースの一例を示す図である。図7のテーブルでは、業種・業態の属性と、財務諸表の項目(科目)の属性と、集約先の科目の属性とを含む。業種・業態のフィールドには、企業が行う事業や営業の種類を表す業種及び例えば小売業や外食産業における営業形態を特定するための識別情報が登録される。財務諸表の項目のフィールドには、財務諸表に記載される項目の名称が登録される。集約先の科目のフィールドには、あらかじめ定められた集約先の科目の名称が登録される。集約処理部は、財務諸表中に、左のフィールドに登録された名称が存在する場合、右のフィールドに登録された科目に集約して集計を行う。なお、集約先として登録された科目は、財務諸表の分析を適切な詳細度で行うために、予め設定しておくものとする。また、集約前後の科目は、財務諸表を作成した企業の業種及び業態ごとに異なるものであってもよい。例えば、製造業等においては土地に関する勘定科目は固定資産に分類されるが、不動産販売業においては販売用不動産等の科目で表され、棚卸資産として分類される。集約前後の科目を、業種及び業態ごとに設定しておくことで、各企業の業種及び業態を示す情報に応じ
て、財務諸表の分析を適切に行うことができるようになる。なお、業種及び業態の少なくともいずれかを用いるようにしてもよい。
て、財務諸表の分析を適切に行うことができるようになる。なお、業種及び業態の少なくともいずれかを用いるようにしてもよい。
また、集計処理部344は、集計結果を示す情報をユーザ端末4へ送信する(S27)。集計処理部344は、例えば集計結果を示すHTMLファイルを生成して送信する。
一方、ユーザ端末4の表示制御部441は、通信I/F41を介して集計結果を示す情報を受信し(S28)、入出力装置43に表示させる(S29)。
<読取結果の修正>
図4の処理においては、OCRにより認識された勘定科目を表す文字列について、修正を行うようにしてもよい。例えばサーバ3の修正処理部343は、S14において、OCRにより認識された文字列が、図7に示した財務諸表の項目に存在するか判断する。また、財務諸表の項目に存在しない場合、修正処理部343は、S14において、図7の財務諸表の項目から、OCRにより認識された文字列の少なくとも一部が部分的に一致する項目を抽出する。そして、修正処理部343は、S15において、抽出された項目をユーザ端末4へ送信する。
図4の処理においては、OCRにより認識された勘定科目を表す文字列について、修正を行うようにしてもよい。例えばサーバ3の修正処理部343は、S14において、OCRにより認識された文字列が、図7に示した財務諸表の項目に存在するか判断する。また、財務諸表の項目に存在しない場合、修正処理部343は、S14において、図7の財務諸表の項目から、OCRにより認識された文字列の少なくとも一部が部分的に一致する項目を抽出する。そして、修正処理部343は、S15において、抽出された項目をユーザ端末4へ送信する。
図8は、項目の候補を推定する処理の一例を示す処理フロー図である。図8の処理は、例えば、サーバ3の修正処理部343が図4のS14において行う。
なお、財務諸表の科目は、辞書(データベース)において、大区分、中区分、小区分等のようにツリー構造が定義されているものとする。例えば図5の例では、隅付き括弧で囲まれた「流動資産」、「固定資産」等が大区分に相当する。また、各大区分の下に記載された、丸括弧で囲まれた「有形固定資産」、「無形固定資産」、「投資等」等が中区分に相当する。また、大区分又は中区分の下に記載された、括弧で囲まれていない「現金」、「預金」、「建物」、「電話加入権」等が小区分に相当する。なお、小区分及び中区分には、それらが属する大区分が必ず定義されているものとする。
また、図8の推定処理においては、図5に示したような読取結果から、例えば一行において金額を表す数字と対応付けて記載された文字列を1つの項目として順次読み出すものとする。また、推定処理の前提として、予め大項目はOCRにより項目名が確定しているものとする。なお、OCRでは大項目を一意に決定できない場合、対話形式でユーザに大項目を選択させるようにしてもよい。
サーバ3の修正処理部343は、読取結果の文字列を1つ取得する(図8:S31)。例えば、本ステップでは「現_金%預」のようなOCRで読み取られた文字列が取得される。そして、修正処理部343は、読取結果が科目の辞書に登録された項目と一致するか判断する(S32)。本ステップでは、前提として識別された大区分に属する中区分又は小区分に相当する科目から、完全一致する文字列が存在するか判断する。
完全一致する科目が存在する場合(S32:YES)、修正処理部343は当該科目を抽出する(S33)。一方、完全一致する科目が存在しない場合(S32:NO)、修正処理部343は読取結果の文字列から記号を除去する(S34)。本ステップでは、例えば、2バイトの平仮名、片仮名、漢字、英字、及び数字、並びに1バイトの英数字以外の記号を削除する。「現_金%預」という文字列の例では、アンダースコアとパーセント記号が削除され、「現金預」の文字列が残る。
また、修正処理部343は、残った文字列に含まれるいずれかの文字を含む科目を抽出する(S35)。本ステップでは、前提として識別された大区分に属する中区分又は小区
分に相当する科目から、例えば、「現」、「金」又は「預」を含む科目を抽出する。
分に相当する科目から、例えば、「現」、「金」又は「預」を含む科目を抽出する。
その後、修正処理部343は、抽出された科目について、所定の指標値を算出する(S36)。所定の指標値は、例えば抽出された科目とOCRで読み取られた文字列とのレーベンシュタイン(Levenshtein)距離を利用することができる。レーベンシュタイン距離は、1文字の挿入、削除又は置換によって、一方の文字列を他方の文字列に変形するために必要な手順の最小回数で表される。すなわち、部分一致する文字列間の近さを表す指標といえる。
また、修正処理部343は、指標値に従い候補を決定する(S37)。本ステップでは、例えば、レーベンシュタイン距離の昇順に抽出された科目を並べ替え、ユーザ端末に送信すると共に、ユーザの選択を受け付ける。なお、レーベンシュタイン距離がゼロの科目が存在する場合は、認識結果として当該科目を採用するようにしてもよい。以上のような推定処理によれば、所定の指標に基づいて正解である可能性が高い順に候補の科目を出力することができる。
なお、OCRで読み取られた文字列がいずれかの科目と一致する場合であっても、上述したツリー構造と一致しない場合は、エラーを出力するようにしてもよい。例えば、確定した大区分と対応付けられた中区分又は小区分に相当しない科目が出現した場合には、その旨の警告等を出力する。また、例えば横様式の株主資本等変動計算書のように、財務諸表の種類によっては、科目の記載位置の関係から大区分、中区分、小区分を決定し、各区分に相当する辞書から候補の科目を決定するようにしてもよい。なお、ツリー構造の階層は、3段階には限定されない。
一方、ユーザ端末4の確認処理部442は、S17において、抽出された項目を修正候補として入出力装置43に表示する。修正候補は、文書データ全体の中で文字色や背景色、字体を変更して強調表示されるようにしてもよい。また、確認処理部442は、S18において、ユーザから修正候補の承認の入力を受け、又はユーザが入力した修正後の文字列の入力を受け、修正に関する情報をサーバ3へ送信する。
そして、サーバ3の修正処理部343は、S19において、修正に関する情報を受信し、OCRにより認識された文字列に代えて修正後の文字列を記憶装置32に記憶させる。また、図7に示した財務諸表の項目に登録されていない文字列については、ユーザから集約後の科目の入力をさらに受け付け、両者を関連付けて新たに登録するようにしてもよい。なお、図7に示した集約前後の科目のテーブルとは別に、ユーザや企業ごとに優先的に適用する集約前後の科目を表すテーブルを作成するようにしてもよい。読取結果の修正処理によれば、例えばスキャンの過程で文字列の読取りが部分的に困難になってしまったような場合であっても、読み取りの精度を向上させ、適切に修正を受けることができる。
<効果>
本実施形態によれば、スキャンした財務諸表について読取範囲をユーザに提案することができると共に、修正を受け付けることができる。特にユーザ端末に対しクラウド上で機能を提供する場合、ウェブブラウザで操作可能にすることで、専用のソフトウェアのインストールを必要とせず、使用することができる。また、スキャンした財務諸表について書類の向きを自動的に修正することができるため、ユーザは向きを揃えることなく読み込ませることができると共に、財務諸表を読み取る操作により所定の格納場所に文書データを格納することができ、ユーザにとってデータの整理が簡便になる。
本実施形態によれば、スキャンした財務諸表について読取範囲をユーザに提案することができると共に、修正を受け付けることができる。特にユーザ端末に対しクラウド上で機能を提供する場合、ウェブブラウザで操作可能にすることで、専用のソフトウェアのインストールを必要とせず、使用することができる。また、スキャンした財務諸表について書類の向きを自動的に修正することができるため、ユーザは向きを揃えることなく読み込ませることができると共に、財務諸表を読み取る操作により所定の格納場所に文書データを格納することができ、ユーザにとってデータの整理が簡便になる。
<その他>
なお、上述した構成は一例であり、本発明は例示した構成に限定されない。上述した事
項は、本発明の課題や技術的思想を逸脱しない範囲で適宜組み合わせて実施することができる。
なお、上述した構成は一例であり、本発明は例示した構成に限定されない。上述した事
項は、本発明の課題や技術的思想を逸脱しない範囲で適宜組み合わせて実施することができる。
また、本発明は上述の処理を実行するコンピュータプログラムを含む。さらに、当該プログラムを記録した、コンピュータ読み取り可能な記録媒体も、本発明の範疇に属する。当該プログラムが記録された記録媒体については、コンピュータに、この記録媒体のプログラムを読み込ませて実行させることにより、上述の処理が可能となる。
ここで、コンピュータ読み取り可能な記録媒体とは、データやプログラム等の情報を電気的、磁気的、光学的、機械的、または化学的作用によって蓄積し、コンピュータから読み取ることができる記録媒体をいう。このような記録媒体のうちコンピュータから取り外し可能なものとしては、フレキシブルディスク、光磁気ディスク、光ディスク、磁気テープ、メモリカード等がある。また、コンピュータに固定された記録媒体としては、ハードディスクドライブやROM等がある。
1 :システム
2 :読取装置
21 :通信I/F
22 :ファイルサーバ
23 :イメージスキャナ
24 :プロセッサ
241 :読取制御部
242 :通信制御部
25 :信号線
3 :サーバ
31 :通信I/F
32 :記憶装置
33 :入出力装置
34 :プロセッサ
341 :保存制御部
342 :認識処理部
343 :修正処理部
344 :集計処理部
35 :バス
4 :ユーザ端末
41 :通信I/F
42 :記憶装置
43 :入出力装置
44 :プロセッサ
441 :表示制御部
442 :確認処理部
45 :バス
5 :ネットワーク
2 :読取装置
21 :通信I/F
22 :ファイルサーバ
23 :イメージスキャナ
24 :プロセッサ
241 :読取制御部
242 :通信制御部
25 :信号線
3 :サーバ
31 :通信I/F
32 :記憶装置
33 :入出力装置
34 :プロセッサ
341 :保存制御部
342 :認識処理部
343 :修正処理部
344 :集計処理部
35 :バス
4 :ユーザ端末
41 :通信I/F
42 :記憶装置
43 :入出力装置
44 :プロセッサ
441 :表示制御部
442 :確認処理部
45 :バス
5 :ネットワーク
Claims (8)
- 読取装置及びユーザ端末と通信網を介して接続される財務諸表読取装置であって、
財務諸表を前記読取装置でスキャンして生成した文書データを取得し、予め記憶部に格納されている、財務諸表の読み取り範囲を学習した学習済みモデルに基づいて前記文書データから読取範囲を特定する識別部と、
前記文書データと、前記識別部が特定した読取範囲とを前記ユーザ端末のウェブブラウザに表示させる出力部と、
前記ウェブブラウザ上でユーザが変更した読取範囲を取得し、前記文書データと関連付けて記憶部に記憶させる修正部と、
を備える財務諸表読取装置。 - 前記読取装置から送信される当該読取装置の識別情報若しくは前記文書データを送信するユーザの識別情報、又は前記文書データ中に含まれる文書を区切るページの情報に基づき、前記文書データの格納場所を決定する保存制御部
をさらに備える請求項1に記載の財務諸表読取装置。 - 前記学習済みモデルは、文書データの向きを機械学習した情報をさらに含み、
前記識別部は、ページごとに向きを修正した文書データにおける読取範囲を特定する、
請求項1又は2に記載の財務諸表読取装置。 - 前記出力部は、前記ウェブブラウザにおいて前記文書データ上に読取範囲を重畳して表示させ、
前記修正部は、前記ウェブブラウザ上でユーザがドラッグして変形させた前記読取範囲を取得する
請求項1から3のいずれか一項に記載の財務諸表読取装置。 - 予め業種ごとに定められた集約前後の勘定科目に基づき、財務諸表を作成した企業の業種に応じて、前記読取範囲に記載された勘定科目を集約後の勘定科目に集約して金額を集計する集計処理部
をさらに備える請求項1から4のいずれか一項に記載の財務諸表読取装置。 - 前記修正部は、前記読取範囲に含まれる項目をOCR(Optical Character Recognition)により認識した文字列が、予め定められた科目辞書に存在しない場合は、前記文字列と科目辞書に登録された科目との近さを示す所定の指標に基づいて候補の科目を抽出する
請求項1から5のいずれか一項に記載の財務諸表読取装置。 - 財務諸表を読取装置でスキャンして生成した文書データを取得し、予め記憶部に格納されている、財務諸表の読み取り範囲を学習した学習済みモデルに基づいて前記文書データから読取範囲を特定する識別ステップと、
前記文書データと、前記識別ステップにおいてが特定した読取範囲とをユーザ端末のウェブブラウザに表示させる出力ステップと、
前記ウェブブラウザ上でユーザが変更した読取範囲を取得し、前記文書データと関連付けて記憶部に記憶させる修正ステップと、
をコンピュータが実行する財務諸表読取方法。 - 財務諸表を読取装置でスキャンして生成した文書データを取得し、予め記憶部に格納されている、財務諸表の読み取り範囲を学習した学習済みモデルに基づいて前記文書データから読取範囲を特定する識別ステップと、
前記文書データと、前記識別ステップにおいて特定した読取範囲とをユーザ端末のウェ
ブブラウザに表示させる出力ステップと、
前記ウェブブラウザ上でユーザが変更した読取範囲を取得し、前記文書データと関連付けて記憶部に記憶させる修正ステップと、
をコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018080210A JP2019191665A (ja) | 2018-04-18 | 2018-04-18 | 財務諸表読取装置、財務諸表読取方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018080210A JP2019191665A (ja) | 2018-04-18 | 2018-04-18 | 財務諸表読取装置、財務諸表読取方法及びプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020097108A Division JP2020173819A (ja) | 2020-06-03 | 2020-06-03 | 財務諸表読取装置、財務諸表読取方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2019191665A true JP2019191665A (ja) | 2019-10-31 |
Family
ID=68387872
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018080210A Pending JP2019191665A (ja) | 2018-04-18 | 2018-04-18 | 財務諸表読取装置、財務諸表読取方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2019191665A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110909226A (zh) * | 2019-11-28 | 2020-03-24 | 达而观信息科技(上海)有限公司 | 金融类文档信息处理方法、装置、电子设备及存储介质 |
CN114493820A (zh) * | 2022-04-14 | 2022-05-13 | 国网浙江省电力有限公司绍兴供电公司 | 适用于财务数据的关联验证式采集方法、装置及存储介质 |
JP2023522360A (ja) * | 2020-04-24 | 2023-05-30 | アジャイルソーダ インコーポレイテッド | Ocrベース文書分析システム及び方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11219394A (ja) * | 1998-02-02 | 1999-08-10 | Kenji Omori | 財務諸表自動入力装置 |
JP2001043280A (ja) * | 1999-05-21 | 2001-02-16 | Yozaburo Oka | 会計処理方法及び会計処理装置並びに会計処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2016162190A (ja) * | 2015-03-02 | 2016-09-05 | キヤノン株式会社 | 情報処理システム、サーバ装置、制御方法およびプログラム |
-
2018
- 2018-04-18 JP JP2018080210A patent/JP2019191665A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11219394A (ja) * | 1998-02-02 | 1999-08-10 | Kenji Omori | 財務諸表自動入力装置 |
JP2001043280A (ja) * | 1999-05-21 | 2001-02-16 | Yozaburo Oka | 会計処理方法及び会計処理装置並びに会計処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2016162190A (ja) * | 2015-03-02 | 2016-09-05 | キヤノン株式会社 | 情報処理システム、サーバ装置、制御方法およびプログラム |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110909226A (zh) * | 2019-11-28 | 2020-03-24 | 达而观信息科技(上海)有限公司 | 金融类文档信息处理方法、装置、电子设备及存储介质 |
CN110909226B (zh) * | 2019-11-28 | 2023-06-06 | 达而观信息科技(上海)有限公司 | 金融类文档信息处理方法、装置、电子设备及存储介质 |
JP2023522360A (ja) * | 2020-04-24 | 2023-05-30 | アジャイルソーダ インコーポレイテッド | Ocrベース文書分析システム及び方法 |
JP7444495B2 (ja) | 2020-04-24 | 2024-03-06 | アジャイルソーダ インコーポレイテッド | Ocrベース文書分析システム及び方法 |
CN114493820A (zh) * | 2022-04-14 | 2022-05-13 | 国网浙江省电力有限公司绍兴供电公司 | 适用于财务数据的关联验证式采集方法、装置及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10572725B1 (en) | Form image field extraction | |
US9552516B2 (en) | Document information extraction using geometric models | |
US10108942B2 (en) | Check data lift for online accounts | |
US10019535B1 (en) | Template-free extraction of data from documents | |
JP6357621B1 (ja) | 会計処理装置、会計処理システム、会計処理方法及びプログラム | |
JP2018205910A (ja) | 計算機、文書識別方法、及びシステム | |
JP2019086984A (ja) | 計算機及び文書識別方法 | |
JP5385349B2 (ja) | レシート定義データ作成装置およびそのプログラム | |
JP2015146075A (ja) | 会計データ入力支援システム、方法およびプログラム | |
JPWO2019008766A1 (ja) | 証憑処理システムおよび証憑処理プログラム | |
JP2016048444A (ja) | 帳票識別プログラム、帳票識別装置、帳票識別システム、および帳票識別方法 | |
CN112036295B (zh) | 票据图像处理方法、装置、存储介质及电子设备 | |
JP2019191665A (ja) | 財務諸表読取装置、財務諸表読取方法及びプログラム | |
JPWO2019146117A1 (ja) | 仕訳要素解析装置、会計処理装置、仕訳要素解析方法、仕訳要素解析プログラム | |
CN111931771B (zh) | 票据内容识别方法、装置、介质及电子设备 | |
CN112487859A (zh) | 信息处理装置、信息处理方法和计算机可读介质 | |
JP5702342B2 (ja) | レシート定義データ作成装置およびプログラム | |
JP6799981B2 (ja) | 会計処理装置、会計処理方法及び会計処理プログラム | |
CN107168635A (zh) | 信息呈现方法和装置 | |
US20150169510A1 (en) | Method and system of extracting structured data from a document | |
JP2020173819A (ja) | 財務諸表読取装置、財務諸表読取方法及びプログラム | |
JP7379987B2 (ja) | 情報処理装置及びプログラム | |
JP6810303B1 (ja) | データ処理装置、データ処理方法及びデータ処理プログラム | |
TWM626292U (zh) | 業務導向要項鍵值辨識系統 | |
JPH11219394A (ja) | 財務諸表自動入力装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180420 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190702 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190902 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20200303 |