JP2007280413A - 財務諸表自動入力装置 - Google Patents
財務諸表自動入力装置 Download PDFInfo
- Publication number
- JP2007280413A JP2007280413A JP2007143129A JP2007143129A JP2007280413A JP 2007280413 A JP2007280413 A JP 2007280413A JP 2007143129 A JP2007143129 A JP 2007143129A JP 2007143129 A JP2007143129 A JP 2007143129A JP 2007280413 A JP2007280413 A JP 2007280413A
- Authority
- JP
- Japan
- Prior art keywords
- account
- dictionary
- accounting
- account item
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
【課題】 勘定科目の自動チェックにより修正可能とし、読み取り精度の向上と入力時間短縮を達成する財務諸表自動入力装置を提供する。
【解決手段】 デジタル化処理手段により変換された勘定科目を表す文字列を1行づつ勘定科目辞書8と突合し、同一勘定科目が存在しているか否かをチェックし、同一勘定科目が存在しているときは正確に認識されたと判定し、同一勘定科目が存在しないときは誤読文字置換機能補完プログラムを実行し誤読文字フィールドに勘定科目を表す文字列を入力し置換フィールドから得た結果を勘定科目辞書8に突合させ、同一勘定科目が勘定科目辞書8に存在しているか否かをチェックし、同一勘定科目が存在しているときは勘定科目を表す文字列を誤読辞書9の置換フィールドから得た結果へ置換し、同一勘定科目が存在しないときは誤読文字が含まれたと判定する誤読文字置換手段を備える。
【選択図】 図1
【解決手段】 デジタル化処理手段により変換された勘定科目を表す文字列を1行づつ勘定科目辞書8と突合し、同一勘定科目が存在しているか否かをチェックし、同一勘定科目が存在しているときは正確に認識されたと判定し、同一勘定科目が存在しないときは誤読文字置換機能補完プログラムを実行し誤読文字フィールドに勘定科目を表す文字列を入力し置換フィールドから得た結果を勘定科目辞書8に突合させ、同一勘定科目が勘定科目辞書8に存在しているか否かをチェックし、同一勘定科目が存在しているときは勘定科目を表す文字列を誤読辞書9の置換フィールドから得た結果へ置換し、同一勘定科目が存在しないときは誤読文字が含まれたと判定する誤読文字置換手段を備える。
【選択図】 図1
Description
本発明は、活字文字で印書された財務諸表(貸借対照表、損益計算書、利益処分案、販売費及び一般管理費、製造原価明細書、等)を手作業で入力する事無く、スキャナーを利用しイメージ情報として入力した後、自動的にイメージ情報の文字を認識し、デジタル文字に高精度で置換するための財務諸表自動入力装置に関する。
これまでの財務諸表に関する入力方法は、全ての内容をコンピュータ端末等から手作業で入力する方法と予め予想される勘定科目をコンピュータ端末に表示して数字部のみ入力する方法が主流であった。近年においては、コンピュータの発達と共に一部の企業において、用意された専用入力用紙に財務諸表の金額を集約を考えながら転記し入力する手書きOCR手法も導入されている。又活字文字OCR入力手法は、普及の段階であるが一般的書類、新聞等の汎用読み取り機である。さらに財務諸表自動読み取り装置として利用したときは、入力結果の文字を全て原票とチェックする必要があり、誤読文字も多発し、操作が複雑である等の難点が多く実用的でなかった。又各企業が作成する財務諸表には、様々な勘定科目があり、各金融機関等で各企業の財務内容を診断・分析する時は、統一した代表勘定科目に集約する必要がある。その集約の実態は、集約先科目を都度人間が判断し決定しなければならなかった。集約に時間がかかった。人により集約が異なる事が多く、統一した集約基準を実現出来なかったため同一企業であっても財務内容の診断結果が異なる事が多かった。さらに単機能OCR機である事から、大量な処理には何台も用意する必要性があり、ネットワーク化には特注の通信機器が必要であり、処理スピードが遅い、高額である等から実用的でなかった。
特開平7−28956号公報
特開平9−231320号公報
これらの事から、財務諸表の入力をより正確に、より短時間に、より簡単に、より安いコストで、等の問題点を解決する必要が高まってきている。特に金融機関においては、バブル崩壊以降、大蔵省通達における早期是正処置等も含み、審査基準の徹底、企業実態にあった適切な融資が要求されている。これらの事から従来以上に、各金融機関の財務諸表入力件数が急激に増大している。従って革新的な入力装置の必要性が高まっているが、現状においては未だ実現されてない。これらの問題点を解決するために、活字OCRの基本プログラムを利用し、勘定科目の自動チェック、誤読文字の自動修正、統一した基準による代表勘定科目集約を自動的に行う事、等を実現し、大幅な読み取り精度の向上と簡単な操作で大幅な入力時間短縮を達成する事を具現化するため。さらにクライアントサーバー型の全国的なネットワークシステム(分散処理)にも対応し、大量処理にも柔軟に適応するパソコンシステムとして、この装置を提供出来る。もちろん画期的方法、大幅なコストダウンによる装置の提供でこれまでの問題点を根本的に解決する事を目的とする。
本発明は、これらの課題を解決する手段として当該装置を提供する。この装置は、活字印書された財務諸表(貸借対照表、損益計算書、利益処分案、販売費及び一般管理費、製造原価明細書等)をスキャナーによりイメージ入力し、入力結果を記憶する手段がある。入力されたイメージは、ページ毎に管理され財務諸表の特徴を利用しデジタル文字に置換するプログラムを介してデジタル化する手段と、デジタル化された結果を勘定科目を表す文字列と数値(金額)に所定の方法で分割し、勘定科目が正確に変換されたかを自動チェックするための勘定科目辞書との突合チェック手段がある。さらに突合チェックにおいて勘定科目辞書の中に一致した文字列がない時、誤読文字が含まれる文字列として判定する。さらに、誤読文字を自動的に正しい文字に置換するための手段として、1つには誤読辞書置換機能があり、さらに高精度置換を計る機能として誤読辞書置換機能を補完するためのプログラム対応機能がある。
本発明の財務諸表自動入力装置によれば、(1)活字で印書された財務諸表を最も短時間に、正確に入力できる。(2)コンピュータ操作が得意でない者、未経験の者でも短時間に入力方法を習得できる。(3)勘定科目辞書に登録された代表勘定科目への集約先コード利用により、誰もがいつも一定の基準で集約できるので、各企業の診断を標準化できる。(4)専門的入力を必要としない、低価格な、汎用コンピュータに左右されないクライアントサーバー型システムの実現、等本発明装置の提供により、全国的な各事業所での直接入力が具現化される事から分散処理、ペーパーレス環境の実現、さらに統一標準化に基づく入力化が計られる。(5)短時間に、簡単に、財務諸表のデジタル化が計られることから、金融機関等では、曖昧な診断、人手による診断、専門家による診断、等が排除され、昨今希求されている情報化武装が尚一層強化される。従って、金融機関システムで最も遅れていた業務のコンピュータ化を本発明装置が画期的方法で解決し、情報化を具現化することができる。
再度勘定科目辞書に突合した結果において、なお勘定科目辞書に一致した文字列が存在しないとき、誤読文字が含まれる文字列として赤字表示する。次に誤読文字をより簡単に修正する手段として、認識した結果の勘定科目文字列の中から文字の組み合わせを利用し、勘定科目辞書から自動的に類似勘定科目の候補を抽出し、候補の中から原票に記載の該当勘定科目を選択入力できる簡便法がある。これらの手段により、入力結果を全てチェックし原票と照合する必要もなくなり、かつ原票を見ながらの従前の時間のかかる修正入力作業、等をなくす手段となる。
具体的には、財務諸表の特徴(会計処理の記載方法)は左に勘定科目があり、同一行の右に金額が記載されている。さらに貸借対照表に限れば、財務内容が左に資産の部として縦1列、右に負債の部として縦1列で記載され、各列の各行は左に勘定科目、右に金額が記載される。大・中分類科目(流動資産、固定資産等は、大分類に属し、有形固定資産、無形固定資産等は、中分類に属し、車輌運搬具、工器具備品等は、小分類(明細勘定科目)としている。)は、それと同一行に金額が記載されている時と、金額が同一行に無く、その該当する科目グループの最終行に合計科目名(資産合計等)を記載し、金額が記載される場合がある。又同一行を横に見た場合のパターンは、科目・金額又は決算を2期記載のものであれば科目・金額・金額として記載されている。資産の部、負債の部とも同一パターンである事は、言うまでもない。いずれにしても、その記載方法は会計処理に基づいているので、この特徴を利用する事になる。損益計算書、その他各表についても同様にいくつかのパターンに分類される。各表のデジタル化には、このような特徴を利用し認識する。
特に損益計算書は、部に関係なく縦1列であるが同様な記載となっている。但し損益計算書の場合で1期のみ計上の時でも、科目・金額A・金額Bのパターンがある。このときは、大分類科目、中分類科目の金額が、大・中各分類科目と同一行の金額Bに記載されている場合と同一該当科目グループの最後の明細科目行金額Aの右の金額Bに記載されている場合がある。この様な場合は、プログラムでどの大分類グループ、中分類グループに属するかを決定し該当する大分類、中分類の各科目の合計値としてプログラムが自動認識し所定の欄(該当する大・中区分科目行の金額A)に移動する。さらに各表の認識結果で大・中分類グループ内のどこにも合計金額が記載されてないときは、自動的に合計金額を算出する事ができる。同様に科目・金額A・金額B・金額Cのパターンも同様に処理できる。このパターンでの金額Aは、小区分(明細勘定科目)の金額であり、金額Bは、中区分グループの合計金額であり、金額Cは、大区分グループの合計金額として自動的に判別し所定の処理を実行する。これらは、ほんの一例であるがこれ以外にも各業種・企業ごとの分析から、各パターンに基づく数々の工夫が用意されている。
財務諸表には、会計処理に基づく必須の勘定科目が存在しなければならない。例えば、貸借対照表には資産の部、負債の部があり、資産の部の先頭科目は流動資産であり、資産の部の勘定科目の中には固定資産が無ければならない。損益計算書においても一定の原則があり、全て会計処理に基づく記載方法に準じている。これらの事から認識結果の勘定科目の中で会計処理の記載方法に合致しない事象が発生した場合は、自動的に大区分、中区分を補完する事が出来る。例えば、固定資産の科目が無い場合は、所定の行に「固定資産」科目をプログラムが自動追加し、さらに固定資産の明細科目先頭に「固定XXX」、「固XXX」等が存在した場合は、強制的に「固定資産」科目に修正する。さらに資本金、資本金が連続して2行続くとき最初の資本金を資本金計とする。このようにして、金額の自動バランスチェックを可能とする。等の手段がある。
上記各諸表の認識は、頁ごとに処理し、勘定科目の範囲と金額の範囲とを、それぞれ読み取り認識枠の範囲として線でくくる事で、デジタル文字に置換するプログラムが囲まれたフィールドを科目欄か金額欄かを認識し、所定のプログラムが実行されイメージデータがデジタル化される。この読み取り認識枠は、全て指定することはない。これまでの独自な分析から何種類かの読み取り枠パターンが用意されている。画面に表示された読み取り枠パターンから最も類似したパターンを選択する事で自動的に勘定科目、金額範囲をくくる枠が出来る。各パターンには、科目欄は文字列として、金額欄は数値としてデジタル変換を行うための情報が記憶されており(文字、数値という情報をプログラムに与える事で認識精度をさらに向上できる。)、枠指定のあといちいち文字か、数値かを指示する必要がないよう工夫している。読み取り枠パターンは、企業ごとに若干のずれがあるので微調整が必要となる。一度登録された読み取り枠パターンは、企業ごとに記憶される。各企業の財務諸表は、毎年同様なパターンになる事が多いので次年度の入力時には、前年度枠を自動的に設定できる便利な仕組みが用意されている。従って操作は最も簡単に、より正確に、より短時間に処理を完了する事ができる工夫がなされている。
さらに金額については、各財務諸表ごとのチェックと各大分類グループ、中分類グループ単位のチェック及び各財務諸表間との論理チェックについて会計処理の記載方法を利用したバランスチェック手段がある。バランスチェックにおいては、登録されているパターンを利用し、グループごとの大・中分類それぞれの金額とその属するグループ内の明細科目の金額を合算し会計処理の記載方法にあわせチェックする。アンバランスの時は、金額数値の誤読がある事になるんで赤字表示されたグループについて、バランスがあうまで修正を繰り返し、バランスがあったところで入力は、終了する手段を備えている。
前記の誤読辞書作成方法の具体的手段は、人間が記憶、判読するとき誤り易い文字があると同様に本発明装置も同様な癖がある。従って、そのような事例を事前に文献から収集すると共に、便宜的に本発明による装置を併用して異なる複数企業の財務諸表を大量に入力し、その結果得られた数多い誤読文字を分析する。分析結果から、ある文字がいつも類似する特定な文字に誤読される傾向、すなわち同じ文字に誤読する頻度の高い文字が判明する。例えば入と人、金と全、木と本、工とエ、一とー、1とI、圧と公、聞と開、等の文字を収集する。具体的科目例としては、借入金⇒借人金、借入金⇒借入全である。従って誤読辞書には、借人金を借入金に、借入全を借入金等に置換するパターンを組み込む事で辞書を作成する。具体的に登録する方法は、誤読文字を誤読文字フィールドに、置換したい文字を置換フィールドに組み込む事でよい。さらに認識結果の文字を削除したい場合は、誤読フィールドに対象文字を置換フィールドは空白にする事で可能(例 I. ⇒ 「I.を空白にする時」)である、又どの文字でも強制置換したい時は、そのヵ所に無条件に置換する記号をセットする。例えばその記号を「*」とするとき、借*金⇒借入金とすれば借人金、借ト金等が全て借入金になる。辞書には、この様な事例を可能な限りパターンとして追加する事で、より精度の高い誤読辞書が構築できる手段を備えている。
さらにプログラム上で誤読文字を含んだ文字列を正しい文字に置換する(高精度認識を確保する機能として誤読辞書を補完するプログラム対応機能)手段がある。プログラムで対応する具体的例は、誤読辞書で対応できないとき、あるいは誤読辞書で対応するより効果的であると判断されるものである。例えば、「1.流動資産」、「(流動資産)」、は、「1.」及び「()」等を除き勘定科目のみとするときである。又勘定科目は、一般的に先頭に数字、アルファベット、特殊文字が存在しないが、一部存在する場合がある。この場合は、例えば「JCB」、「VISA」及び「2年ものXXX」等は、勘定科目辞書等から先頭1字がアルファベット、数字の条件で抽出した結果、存在する勘定科目であるが、この様な例外を除き先頭に何文字か数字、アルファベット、特殊文字が存在した時は、先頭の数字、アルファベット、特殊文字を自動的に削除する等はプログラムで対応する手段がとられる。
勘定科目辞書については、様々な業種と大量な企業・財務諸表等から入力・抽出した勘定科目を同一文字列1件にまとめた単語、約8万語(文字列)以上を登録している。さらに会計処理に基づく代表勘定科目に集約するための集約先コード及び認識結果の内容を補完したり、文字列を自動チェックする等のために勘定科目の分類コード情報等を各勘定科目に付加した。よってこの勘定科目辞書を利用し認識結果の勘定科目文字列を辞書に存在するか、しないかを判定する事で従来の人手を介した校正作業を解消出来る。さらに認識結果内容を会計記載方法に基づくプログラムチェックを行い、不備がある事を発見した場合、それを自動的に補完する手段を備えている。
誤読文字を、より簡単に修正するための類似勘定科目を検索する手段は、例えば認識結果が「雷話加入権」の時(オペレターは、原票(電話加入権)と見比ベる事で判断が付く、又プログラムが勘定科目辞書にないと判断した時は、誤読と判定するので赤字表示されている。)、赤字表示されている画面の該当文字列の誤読以外の文字を何文字か指定(ドラッグ)し、該当文字(この例では、「加入」あるいは「加入権」となる。)を含む勘定科目の候補一覧を勘定科目辞書より検索・作成し、ドラッグした勘定科目の下段に画面表示する。さらに簡便な方法としては、認識結果の文字の組み合わせを利用し自動的にプログラムが勘定科目辞書から類似勘定科目を検索している、よって赤字表示されている誤読文字列と同一欄にあるボタンを押すと下段に検索結果の候補が表示される。いずれの場合も正しい文字列(勘定科目の文字列)が存在した場合(この例では、電話加入権)は、ワンタッチで正しい文字列に修正できる機能がある。
財務諸表の読み取り範囲枠パターンは、様々な業種の企業・財務諸表を分析した結果から、(1)科目、金額A、(2)科目、金額A、その他、(3)科目、その他、金額、その他、(4)科目、金額A、金額B、(5)科目、金額A、その他、金額B、その他、(6)科目、その他、金額A、金額B、(7)科目A、金額A、科目B、金額B、(8)科目、金額A、金額B、金額C、(9)科目・その他・金額等の主要なパターンが登録されている。さらに科目は、文字である、金額は、数値であるという情報が組み込まれている。この9個のパターンを中心として、入力原票の記載方法に即したパターンを短時間に、一目で見分けられる様にパターン選択画面を用意し、各パターンを絵で表示しワンタッチで選択すると同時に文字か数値かの情報を自動設定しプログラムに与える手段がある。
さらにデジタル化された勘定科目が勘定科目辞書に存在しない場合で、誤読でないと判定した未登録の勘定科目が存在したときは、簡単に勘定科目辞書に勘定科目情報を追加するための手段がある。具体的な一つの例は、現在登録済みの類似した勘定科目を検索し、類似した勘定科目の情報(大区分コード、中区分コード、小区分コード(科目コード)、集約先コード)を画面に表示し、それを参考にして、そのグループ(大区分、中区分でグループを形成する。)内の所定のヵ所に勘定科目を登録すると共に、勘定科目の情報を登録する方法である。例えば、「現金及び預金」が未登録であった場合、デジタル結果の科目「現金及び預金」の文字列から類似の勘定科目を検索する。ここでは、最も勘定科目辞書に存在し、同一グループになると推定される「現金」の文字列を指定(ドラッグ)し、検索すると「現金」及び「現金の大区分コード、中区分コード、小区分コード、集約先コード」が表示され、容易に「現金及び預金」の勘定科目、大区分コード、中区分コード、小区分コード(科目コード)、集約先コードを決定し入力できる。勘定科目辞書に登録された事で以後発生する同一勘定科目は、所定の手順で正しく処理される。この様な手段を備えている事で正確に、簡単に入力できる手段と学習効果が利用でき、より認識精度の高い装置となるように設計されている。
本発明装置は、これまでのOCR装置と相違し通信回線を利用したネットワークシステムを簡易に、低コストで構築でき、入力された情報をタイムリーに相手側に送信できる。従ってこれまでの常識である、入力センターへの郵便、宅配等を使った送付を不要とし、現地での入力を実現できる。又イメージ情報も送信できることから本部側での、確認、修正、追加、情報の記録等が簡単にでき、ペーパーレス環境を達成し、情報管理の徹底、セキュリティーの向上、分散処理での効率的運用を実現できる。
以下、本発明装置の一実施例を、図面を用いて詳細に説明する。図1は、本発明による財務諸表自動入力装置の実施例の全体構成を示す図である。本装置は、コンピュータ1とそれに接続されるスキャナー2、ディスプレイ(画面)3、キーボード4、フロピーディスク5、ハードディスク6、プリンター7、その他必要な外部装置10、及びプログラムとから構成されている。コンピュータには、ネットワークを構築するための電話回線ケーブル12が接続可能である。もちろん通信装置11を内臓している。特にハードディスク6には、本発明の心臓部である勘定科目辞書8、及び誤読辞書9が記憶されている。
認識しようとする財務諸表の原票(貸借対照表、損益計算書、利益処分案、販売費及び一般管理費、製造原価明細書、等)は、スキャナー2にセットされ、ディスプレイ3(画面)「図4」よりスキャン開始が指示されると、スキャナーが読み取りを開始しイメージ入力が始まる。スキャナーにセットされた原票がなくなるとスキャンは、終了する。スキャンが完了した後、読み取った順に頁ごとのイメージが画面に表示されるので、それと見比べながら画面上に表示されている財務諸表パターン「図3」を選択する。パターンが選択されると自動的にイメージ上に読み取り範囲を示す枠が表示される。この時、枠はおおよその範囲を囲むので手動で読み取り範囲にあわせる微調整が必要となる。枠は、どこからどこまでが勘定科目(漢字)フィールドか、どこからどこまでが金額(数字)フィールドかを指定するものである。その後、記憶されているイメージ情報をデジタル化するために、画面よりデジタル化のL/C解析ボタンを押す。L/C解析ボタンが押された段階でデジタル文字に変換するプログラムが起動し、イメージ情報の文字(枠で囲んだ範囲内)がデジタル化され、その結果がイメージ情報表示に代わって表示される。デジタル化された結果は、選択されたパターンに基づき、縦2から数列に表示され、左から勘定科目列(左詰めで勘定科目文字列を表示)、その右に金額列(右詰めで表示)が数列表示される。原則的に原票の財務諸表に一致した列、行になるのが基本であり、小区分の金額の右に中区分の金額、さらにその右に大区分の金額がある場合は、プログラムが自動的に金額の属する各大、中区分の勘定科目行に金額を移動する等の考慮がされている。
さらに画面にある整合性チェックボタンを押すと所定の勘定科目チェックプログラムが稼動し、デジタル化(認識)された勘定科目文字列を1行づつ勘定科目辞書に突合し、同一勘定科目が勘定科目辞書に存在するかをチェックする。存在しない時のみ、誤読文字を自動修正するための誤読辞書置換機能、誤読辞書置換機能補完プログラムが実行される。その結果を再度勘定科目辞書に突合し同一勘定科目が存在するかをチェックする。それでもなお存在しないとき誤読文字が存在するとし、勘定科目文字列を赤字表示する。赤字表示された勘定科目については、入力原票と見比べ誤読している文字を確認し、修正する。修正する時は、勘定科目を表示してある欄の各行の右隅に表示されているボタンを押すと、その欄にある勘定科目に類似した文字を持つ勘定科目候補が瞬時に表示される。候補は、勘定科目辞書の中より所定の方法によりプログラムが抽出する。その後、再度整合性チェックボタンを押す所までプログラムは戻り、繰り返される。デジタル化された各勘定科目の赤字表示文字列が全てなくなったところで、勘定科目は、正しく登録されたとする。時として、勘定科目辞書の未登録の勘定科目が発生した場合(赤字表示であるがその勘定科目が入力原票に記載の通りである時)は、所定の方法で勘定科目を登録することになる。
次に金額欄のチェックになる。「図4」のデジタル化結果の各金額は、画面に表示された合計チェックボタンを押したところで、所定のプログラムが起動し会計処理に基づくチェックがされる。金額に誤読が存在する時(会計処理の記載方法と同一な方法によるバランスチェックエラーのとき)は、その大区分、中区分グループの中で関連する数値が赤字表示される。赤字表示されたグループの各金額を入力原票と照合し、誤読した金額を見つけ修正する。修正されたところで再度合計チェックボタンを押し、同様にチェックを行う。赤字表示がなくなったところで金額チェックは終了する。その後代表勘定科目に集約するプログラムが所定の方法で起動し、入力された結果が各企業の決算期単位で代表勘定科目に集約され記憶される。さらに記憶された結果は、企業・決算期単位で累積情報として、消去するまで記憶される。この記憶された情報は、企業診断システム等で利用される。特に詳細に説明しないが、代表勘定科目への集約手段は、本発明装置を使用する企業ごとに異なるので、各企業ごとに画面対応で簡単に設定できる工夫がある。
1 コンピュータ
2 スキャナー
3 ディスプレイ
4 キーボード
5 フロピーディスク(FD)
6 ハードディスク
7 プリンター
8 勘定科目辞書
9 誤読辞書
10 その他外部記憶装置
11 内蔵型通信装置
12 電話回線
2 スキャナー
3 ディスプレイ
4 キーボード
5 フロピーディスク(FD)
6 ハードディスク
7 プリンター
8 勘定科目辞書
9 誤読辞書
10 その他外部記憶装置
11 内蔵型通信装置
12 電話回線
Claims (1)
- スキャナーでページ毎に読み取った財務諸表のイメージ情報を記憶手段に入力結果としてページ毎に記憶する財務諸表自動入力装置であって、
前記記憶手段に記憶した入力結果を頁ごとに画面に表示するディスプレイと、
前記ディスプレイの画面に表示されている入力結果の中で勘定科目の範囲を手動で読み取り範囲として線でくくる事で、この線で囲まれたフィールドを科目欄に指定してから、前記画面に表示された解析ボタンを操作しイメージ情報をデジタル文字に置換するプログラムを起動させ、前記科目欄に指定されたイメージ情報を文字に変換するデジタル化処理手段と、
複数の財務諸表から抽出した勘定科目を単語として登録する勘定科目辞書、並びに、誤読頻度の高い誤読文字を誤読文字フィールドに、置換したい文字を置換フィールドにそれぞれ組み込み登録する誤読辞書を記録するハードディスクと、
前記デジタル化処理手段により変換された勘定科目を表す文字列を1行づつ前記勘定科目辞書と突合し、同一勘定科目が前記勘定科目辞書に存在しているか否かをチェックし、同一勘定科目が存在しているときは前記勘定科目を表す文字列が正確に認識されたと判定し、前記勘定科目辞書に同一勘定科目が存在しないときは誤読文字置換機能補完プログラムを実行し前記誤読文字フィールドに前記勘定科目を表す文字列を入力し前記置換フィールドから得た結果を前記勘定科目辞書に突合させ、同一勘定科目が前記勘定科目辞書に存在しているか否かをチェックし、同一勘定科目が存在しているときは前記勘定科目を表す文字列を前記置換フィールドから得た結果へ置換すると共に、同一勘定科目が存在しないときは誤読文字が含まれたと判定する誤読文字置換手段と、
を備えることを特徴とする財務諸表自動入力装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007143129A JP2007280413A (ja) | 2007-05-30 | 2007-05-30 | 財務諸表自動入力装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007143129A JP2007280413A (ja) | 2007-05-30 | 2007-05-30 | 財務諸表自動入力装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006111539A Division JP2006252575A (ja) | 2006-04-14 | 2006-04-14 | 財務諸表自動入力装置及び財務諸表自動入力方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007280413A true JP2007280413A (ja) | 2007-10-25 |
Family
ID=38681720
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007143129A Pending JP2007280413A (ja) | 2007-05-30 | 2007-05-30 | 財務諸表自動入力装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007280413A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015045984A (ja) * | 2013-08-28 | 2015-03-12 | 富士通株式会社 | 情報処理装置、文字認識方法、及びプログラム |
CN108228558A (zh) * | 2016-12-21 | 2018-06-29 | 航天信息股份有限公司 | 一种处理发票中特殊字符以完成抄报清卡的方法和系统 |
CN111241845A (zh) * | 2019-12-31 | 2020-06-05 | 上海犀语科技有限公司 | 一种基于语义匹配方法的财务科目自动识别方法及装置 |
-
2007
- 2007-05-30 JP JP2007143129A patent/JP2007280413A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015045984A (ja) * | 2013-08-28 | 2015-03-12 | 富士通株式会社 | 情報処理装置、文字認識方法、及びプログラム |
CN108228558A (zh) * | 2016-12-21 | 2018-06-29 | 航天信息股份有限公司 | 一种处理发票中特殊字符以完成抄报清卡的方法和系统 |
CN108228558B (zh) * | 2016-12-21 | 2022-01-07 | 航天信息股份有限公司 | 一种处理发票中特殊字符以完成抄报清卡的方法和系统 |
CN111241845A (zh) * | 2019-12-31 | 2020-06-05 | 上海犀语科技有限公司 | 一种基于语义匹配方法的财务科目自动识别方法及装置 |
CN111241845B (zh) * | 2019-12-31 | 2024-01-16 | 上海犀语科技有限公司 | 一种基于语义匹配方法的财务科目自动识别方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6528147B2 (ja) | 会計データ入力支援システム、方法およびプログラム | |
JP6871840B2 (ja) | 計算機及び文書識別方法 | |
US11232300B2 (en) | System and method for automatic detection and verification of optical character recognition data | |
JP6268352B2 (ja) | 会計データ入力システム、方法、およびプログラム | |
JP6307745B2 (ja) | 会計処理システム | |
US20140064618A1 (en) | Document information extraction using geometric models | |
CN110442744A (zh) | 提取图像中目标信息的方法、装置、电子设备及可读介质 | |
US20190294912A1 (en) | Image processing device, image processing method, and image processing program | |
JPH0573598A (ja) | 書類処理方法と書類処理システム | |
WO1997005561A1 (fr) | Processeur de supports et procede de traitement de supports | |
EP1946233A2 (en) | Form data extraction without customization | |
US11715318B2 (en) | Systems and methods for spatial-aware information extraction from electronic source documents | |
JP6529254B2 (ja) | 情報処理装置、情報処理方法、プログラムおよび記憶媒体 | |
JP6507459B2 (ja) | 会計処理システム | |
CN114612905A (zh) | 基于rpa和ai的发票处理方法、装置、设备和介质 | |
JP4356908B2 (ja) | 財務諸表自動入力装置 | |
JP2006252575A (ja) | 財務諸表自動入力装置及び財務諸表自動入力方法 | |
Hamzah et al. | Data capturing: Methods, issues and concern | |
JP2007280413A (ja) | 財務諸表自動入力装置 | |
CN109544134B (zh) | 便捷支付服务方法和系统 | |
JP7021496B2 (ja) | 情報処理装置及びプログラム | |
JP2020140583A (ja) | 辞書作成装置、辞書作成方法及び辞書作成プログラム | |
Alexander et al. | Digitizing hand-written data with automated methods: A pilot project using the 1990 US Census | |
WO2022029874A1 (ja) | データ処理装置、データ処理方法及びデータ処理プログラム | |
JP2018092459A (ja) | 画像分析装置、画像分析方法および画像分析プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071016 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071113 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080108 |