JP2020173819A - 財務諸表読取装置、財務諸表読取方法及びプログラム - Google Patents
財務諸表読取装置、財務諸表読取方法及びプログラム Download PDFInfo
- Publication number
- JP2020173819A JP2020173819A JP2020097108A JP2020097108A JP2020173819A JP 2020173819 A JP2020173819 A JP 2020173819A JP 2020097108 A JP2020097108 A JP 2020097108A JP 2020097108 A JP2020097108 A JP 2020097108A JP 2020173819 A JP2020173819 A JP 2020173819A
- Authority
- JP
- Japan
- Prior art keywords
- document data
- reading
- financial
- reading range
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000012545 processing Methods 0.000 claims abstract description 77
- 238000003860 storage Methods 0.000 claims abstract description 54
- 238000012937 correction Methods 0.000 claims abstract description 43
- 230000002776 aggregation Effects 0.000 claims description 32
- 238000004220 aggregation Methods 0.000 claims description 32
- 238000004891 communication Methods 0.000 claims description 30
- 238000012015 optical character recognition Methods 0.000 claims description 21
- 238000010801 machine learning Methods 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 4
- 230000008569 process Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 13
- 238000012790 confirmation Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000007596 consolidation process Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Abstract
Description
い。このようにすれば、スキャンした財務諸表について書類の向きを自動的に修正することができるため、ユーザは向きを揃えることなく読み込ませることができる。
)により認識した文字列が、予め定められた科目辞書に存在しない場合は、文字列と科目辞書に登録された科目との近さを示す所定の指標に基づいて候補の科目を抽出するようにしてもよい。このようにすれば、読取範囲に含まれる科目の認識精度を向上させることができる。
図1は、本実施形態に係るシステムの構成の一例を示す図である。本実施形態に係るシステムは、例えば金融機関において融資の審査を行うために、財務諸表を管理する。具体的には、例えば金融機関の支店において個別の取引先を担当する担当者が企業の財務諸表を入力し、データをクラウド上で管理すると共に、例えば本社等のユーザがデータを利用する。また、システム1はスキャンされた財務諸表の文書データについて、記載された項
目を識別し、記載された項目を所定のルールに基づき予め定められた科目に集約する。なお、財務諸表とは、貸借対照表、損益計算書、キャッシュフロー計算書、株主資本等変動計算書等を含む。
3は、財務諸表の種別を判定して読取範囲を決定したり、項目を識別して所定の科目に集約し、集計してもよい。なお、財務諸表の種別とは、貸借対照表や損益計算書、キャッシュフロー計算書、株主資本等変動計算書等のような財務諸表を構成する書類の種類をいうものとする。
読取装置2は、スキャナや複合機等であり、通信I/F(Interface)21と、イメー
ジスキャナ23と、プロセッサ24と、バス又は信号線25とを備えている。また、読取装置2は、通信I/F21を介してファイルサーバ22と接続されている。ファイルサーバ22は、いわゆるNAS(Network-Attached Storage)であってもよく、ネットワーク上の外部記憶装置として機能する。ファイルサーバ22は、例えば支店内のLAN(Local Area Network)に接続され、共有ディスクとして利用されるものであってもよい。
センサ等の光学センサで読み取り、デジタルデータに変換する装置である。イメージスキャナ23は、例えば原稿を送るローラを備えたシートフィードスキャナであり、ユーザは複数のページからなる財務諸表の書類をまとめてスキャンさせることができるものとする。
演算処理装置であり、プログラムを実行することにより本実施の形態に係る各処理を行う。図2の例では、プロセッサ24内に機能ブロックを示している。プロセッサ24は、例えば、読取制御部241と、通信制御部242とを含む。
サーバ3は、一般的なコンピュータであり、通信I/F(Interface)31と、記憶装
置32と、入出力装置33と、プロセッサ34と、バス35とを備えている。
ユーザ端末4は、一般的なコンピュータであり、通信I/F41と、記憶装置42と、入出力装置43と、プロセッサ44と、バス45とを備えている。
図3は、本実施形態に係る財務諸表の読み取り処理の一例を示す処理フロー図である。なお、読取装置2を使用するユーザは、ユーザごとに作成された、本システムを利用するためのアカウントにログインし、スキャンした文書情報と関連付けてユーザの識別情報が保持されるようにしてもよい。
Document Format)その他の文書データを生成する。また、生成された文書データは、例えばファイルサーバ22又は読取装置2が備えるメモリ(図示せず)に格納されるものとする。財務諸表は、複数のページを連続してスキャンしてもよい。また、たとえばユーザが担当する複数の企業の財務諸表を連続してスキャンしてもよく、各企業の財務諸表の境界に例えば所定の情報を記載した表紙のページを挿入し、サーバ3が情報の境界を識別できるようにしてもよい。例えば、表紙のページには、所定の情報として企業の識別情報、ユーザの識別情報等を、文字や記号、図形等で記載するようにしてもよいし、単に文書間の境界を表す情報を、文字や記号、図形、白紙等で表すようにしてもよい。
図4は、本実施の形態に係る読取範囲決定処理の一例を示す処理フロー図である。ユーザ端末4の表示制御部441は、通信I/F31を介して、サーバ3へ文書データ及び読取範囲の送信を要求する(図4:S11)。
する。なお、OCRは図3のS5において自動的に行うようにしてもよい。また、認識処理部342は、文書データのページごとに、文書の向きを修正するようにしてもよい。文書データの向きは、一般的な文書又は財務諸表とその正しい向きとを機械学習して生成した学習済みモデルを記憶装置32に記憶させておき、学習済みモデルを用いて判断することができる。
り実現することができる。
ユーザが読取範囲を示す図形をドラッグすることにより、修正後の範囲を入力する。ウェブブラウザ上での図形のドラッグ操作は、例えばHTML5の機能により実現することができる。
図6は、本実施形態に係る集計処理の一例を示す処理フロー図である。ユーザ端末4の表示制御部441は、通信I/F41を介してサーバ3へ、集計処理の実行要求を送信する(図6:S21)。本ステップでは、入出力装置43を介してユーザからの操作を受け付け、集計処理の要求を示す情報を送信する。集計は、例えばユーザが指定する1つの財務諸表について行うようにしてもよいし、複数の財務諸表について整合性を確認できるようにしてもよい。
て、財務諸表の分析を適切に行うことができるようになる。なお、業種及び業態の少なくともいずれかを用いるようにしてもよい。
図4の処理においては、OCRにより認識された勘定科目を表す文字列について、修正を行うようにしてもよい。例えばサーバ3の修正処理部343は、S14において、OCRにより認識された文字列が、図7に示した財務諸表の項目に存在するか判断する。また、財務諸表の項目に存在しない場合、修正処理部343は、S14において、図7の財務諸表の項目から、OCRにより認識された文字列の少なくとも一部が部分的に一致する項目を抽出する。そして、修正処理部343は、S15において、抽出された項目をユーザ端末4へ送信する。
分に相当する科目から、例えば、「現」、「金」又は「預」を含む科目を抽出する。
は、1文字の挿入、削除又は置換によって、一方の文字列を他方の文字列に変形するために必要な手順の最小回数で表される。すなわち、部分一致する文字列間の近さを表す指標といえる。
本実施形態によれば、スキャンした財務諸表について読取範囲をユーザに提案することができると共に、修正を受け付けることができる。特にユーザ端末に対しクラウド上で機能を提供する場合、ウェブブラウザで操作可能にすることで、専用のソフトウェアのインストールを必要とせず、使用することができる。また、スキャンした財務諸表について書類の向きを自動的に修正することができるため、ユーザは向きを揃えることなく読み込ませることができると共に、財務諸表を読み取る操作により所定の格納場所に文書データを格納することができ、ユーザにとってデータの整理が簡便になる。
なお、上述した構成は一例であり、本発明は例示した構成に限定されない。上述した事
項は、本発明の課題や技術的思想を逸脱しない範囲で適宜組み合わせて実施することができる。
2 :読取装置
21 :通信I/F
22 :ファイルサーバ
23 :イメージスキャナ
24 :プロセッサ
241 :読取制御部
242 :通信制御部
25 :信号線
3 :サーバ
31 :通信I/F
32 :記憶装置
33 :入出力装置
34 :プロセッサ
341 :保存制御部
342 :認識処理部
343 :修正処理部
344 :集計処理部
35 :バス
4 :ユーザ端末
41 :通信I/F
42 :記憶装置
43 :入出力装置
44 :プロセッサ
441 :表示制御部
442 :確認処理部
45 :バス
5 :ネットワーク
Claims (8)
- 読取装置及びユーザ端末と通信網を介して接続される財務諸表読取装置であって、
財務諸表を前記読取装置でスキャンして生成した文書データを取得し、予め記憶部に格納されている、財務諸表の読み取り範囲を学習した学習済みモデルに基づいて前記文書データから読取範囲を特定する識別部と、
前記文書データと、前記識別部が特定した読取範囲とを前記ユーザ端末のウェブブラウザに表示させる出力部と、
前記ウェブブラウザ上でユーザが変更した読取範囲を取得し、前記文書データと関連付けて記憶部に記憶させる修正部と、
を備える財務諸表読取装置。 - 前記読取装置から送信される当該読取装置の識別情報若しくは前記文書データを送信するユーザの識別情報、又は前記文書データ中に含まれる文書を区切るページの情報に基づき、前記文書データの格納場所を決定する保存制御部
をさらに備える請求項1に記載の財務諸表読取装置。 - 前記学習済みモデルは、文書データの向きを機械学習した情報をさらに含み、
前記識別部は、ページごとに向きを修正した文書データにおける読取範囲を特定する、
請求項1又は2に記載の財務諸表読取装置。 - 前記出力部は、前記ウェブブラウザにおいて前記文書データ上に読取範囲を重畳して表示させ、
前記修正部は、前記ウェブブラウザ上でユーザがドラッグして変形させた前記読取範囲を取得する
請求項1から3のいずれか一項に記載の財務諸表読取装置。 - 予め業種ごとに定められた集約前後の勘定科目に基づき、財務諸表を作成した企業の業種に応じて、前記読取範囲に記載された勘定科目を集約後の勘定科目に集約して金額を集計する集計処理部
をさらに備える請求項1から4のいずれか一項に記載の財務諸表読取装置。 - 前記修正部は、前記読取範囲に含まれる項目をOCR(Optical Character Recognition)により認識した文字列が、予め定められた科目辞書に存在しない場合は、前記文字列
と科目辞書に登録された科目との近さを示す所定の指標に基づいて候補の科目を抽出する
請求項1から5のいずれか一項に記載の財務諸表読取装置。 - 財務諸表を読取装置でスキャンして生成した文書データを取得し、予め記憶部に格納されている、財務諸表の読み取り範囲を学習した学習済みモデルに基づいて前記文書データから読取範囲を特定する識別ステップと、
前記文書データと、前記識別ステップにおいてが特定した読取範囲とをユーザ端末のウェブブラウザに表示させる出力ステップと、
前記ウェブブラウザ上でユーザが変更した読取範囲を取得し、前記文書データと関連付けて記憶部に記憶させる修正ステップと、
をコンピュータが実行する財務諸表読取方法。 - 財務諸表を読取装置でスキャンして生成した文書データを取得し、予め記憶部に格納されている、財務諸表の読み取り範囲を学習した学習済みモデルに基づいて前記文書データから読取範囲を特定する識別ステップと、
前記文書データと、前記識別ステップにおいて特定した読取範囲とをユーザ端末のウェ
ブブラウザに表示させる出力ステップと、
前記ウェブブラウザ上でユーザが変更した読取範囲を取得し、前記文書データと関連付けて記憶部に記憶させる修正ステップと、
をコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020097108A JP2020173819A (ja) | 2020-06-03 | 2020-06-03 | 財務諸表読取装置、財務諸表読取方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020097108A JP2020173819A (ja) | 2020-06-03 | 2020-06-03 | 財務諸表読取装置、財務諸表読取方法及びプログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018080210A Division JP2019191665A (ja) | 2018-04-18 | 2018-04-18 | 財務諸表読取装置、財務諸表読取方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020173819A true JP2020173819A (ja) | 2020-10-22 |
Family
ID=72831504
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020097108A Pending JP2020173819A (ja) | 2020-06-03 | 2020-06-03 | 財務諸表読取装置、財務諸表読取方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2020173819A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024057589A1 (ja) * | 2022-09-15 | 2024-03-21 | 株式会社LegalOn Technologies | 修正提案方法、修正提案システム、及び修正提案プログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11219394A (ja) * | 1998-02-02 | 1999-08-10 | Kenji Omori | 財務諸表自動入力装置 |
JP2002024743A (ja) * | 2000-07-06 | 2002-01-25 | Oki Electric Ind Co Ltd | 画像読取システムおよび画像読取方法 |
JP2016162190A (ja) * | 2015-03-02 | 2016-09-05 | キヤノン株式会社 | 情報処理システム、サーバ装置、制御方法およびプログラム |
JP2017010069A (ja) * | 2015-06-16 | 2017-01-12 | シャープ株式会社 | 情報処理装置 |
-
2020
- 2020-06-03 JP JP2020097108A patent/JP2020173819A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11219394A (ja) * | 1998-02-02 | 1999-08-10 | Kenji Omori | 財務諸表自動入力装置 |
JP2002024743A (ja) * | 2000-07-06 | 2002-01-25 | Oki Electric Ind Co Ltd | 画像読取システムおよび画像読取方法 |
JP2016162190A (ja) * | 2015-03-02 | 2016-09-05 | キヤノン株式会社 | 情報処理システム、サーバ装置、制御方法およびプログラム |
JP2017010069A (ja) * | 2015-06-16 | 2017-01-12 | シャープ株式会社 | 情報処理装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024057589A1 (ja) * | 2022-09-15 | 2024-03-21 | 株式会社LegalOn Technologies | 修正提案方法、修正提案システム、及び修正提案プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20140064618A1 (en) | Document information extraction using geometric models | |
JP6357621B1 (ja) | 会計処理装置、会計処理システム、会計処理方法及びプログラム | |
US10108942B2 (en) | Check data lift for online accounts | |
JP5385349B2 (ja) | レシート定義データ作成装置およびそのプログラム | |
JP4078009B2 (ja) | 帳票における文字記録領域の検出装置、帳票における文字記録領域の検出方法、記憶媒体及び帳票フォーマット作成装置 | |
JP6535860B1 (ja) | 仕訳要素解析装置、会計処理装置、仕訳要素解析方法、仕訳要素解析プログラム | |
JPWO2019008766A1 (ja) | 証憑処理システムおよび証憑処理プログラム | |
US11403455B2 (en) | Electronic form generation from electronic documents | |
JP2019191665A (ja) | 財務諸表読取装置、財務諸表読取方法及びプログラム | |
US20080270879A1 (en) | Computer-readable medium, document processing apparatus and document processing system | |
JP2014041442A (ja) | レシート定義データ作成装置およびプログラム | |
JP2020173819A (ja) | 財務諸表読取装置、財務諸表読取方法及びプログラム | |
US11256944B2 (en) | Image evaluation and dynamic cropping system | |
JPWO2019146118A1 (ja) | 会計処理装置、会計処理システム、会計処理方法、会計処理プログラム | |
JP7379987B2 (ja) | 情報処理装置及びプログラム | |
JP2021056722A (ja) | 情報処理装置及びプログラム | |
KR101516684B1 (ko) | Ocr을 이용한 문서 변환 서비스 방법 | |
JPH11219394A (ja) | 財務諸表自動入力装置 | |
JP2022029398A (ja) | データ処理装置、データ処理方法及びデータ処理プログラム | |
JP6879034B2 (ja) | プログラム、情報処理装置、及びシステム | |
JP2019135669A (ja) | 仕訳要素解析装置、会計処理装置、仕訳要素解析方法、仕訳要素解析プログラム | |
JP6946596B1 (ja) | データ処理装置、データ処理方法及びプログラム | |
JP2001005886A (ja) | データ処理装置及び記憶媒体 | |
WO2023062798A1 (ja) | 情報処理システム、項目値抽出方法、モデル生成方法及びプログラム | |
JP7480953B2 (ja) | 会計支援装置、会計支援プログラム及び会計支援方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200716 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200716 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211012 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20211210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220214 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220712 |