JP2023071067A - 表示データ生成システム - Google Patents

表示データ生成システム Download PDF

Info

Publication number
JP2023071067A
JP2023071067A JP2021183654A JP2021183654A JP2023071067A JP 2023071067 A JP2023071067 A JP 2023071067A JP 2021183654 A JP2021183654 A JP 2021183654A JP 2021183654 A JP2021183654 A JP 2021183654A JP 2023071067 A JP2023071067 A JP 2023071067A
Authority
JP
Japan
Prior art keywords
character
character data
data
display data
generation system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021183654A
Other languages
English (en)
Inventor
書勉 何
Shumian He
文瑞 趙
Wenrui Zhao
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neox Inc
Original Assignee
Neox Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neox Inc filed Critical Neox Inc
Priority to JP2021183654A priority Critical patent/JP2023071067A/ja
Publication of JP2023071067A publication Critical patent/JP2023071067A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

【課題】入力の手間を省き、文字情報を認識して文字データを表示する表示データを生成することができる表示データ生成システムを提供する。【解決手段】表示データ生成システム10は、OCRセレクタ11、携帯端末12を備える。OCRセレクタ11の第1文字データ認識装置22A及び第2文字データ認識装置22Bはそれぞれ、レシートの撮影画像からレシートに描かれた文字を認識して該認識した文字に基づいて文字データを生成する。文字データを抽出するためのテンプレートが設定されると、文字抽出装置24は、第1文字データ認識装置22A及び第2文字データ認識装置22Bのうち、信頼度の高い装置で生成された文字データの中から、設定されたテンプレートに応じて設定された項目に該当する文字データを抽出する。表示データ生成装置25は、抽出された文字データを表示する表示データを生成する。【選択図】図1

Description

本発明は、表示データ生成システムに関する。
従来、医療施設から健康保険組合などの支払い機関に対し、診療報酬を請求するためにレセプト(診療報酬明細書)を作成するコンピューターシステムとして、レセプトコンピュータが知られている(例えば、特許文献1参照)
レセプトコンピュータは、例えば薬局に置かれて使用され、病院で処方された紙の処方箋の情報等が患者毎に記憶される。レセプトコンピュータには、二次元コード読取装置が設けられており、紙の処方箋に記載された処方箋の情報を示す二次元コードを、二次元コード読取装置で二次元コードを読み取ることで、読み取った処方箋の情報がレセプトコンピュータに記憶される。
特開2018-32381
しかしながら、処方箋に二次元コードが記載されていない処方箋の場合、紙の処方箋の情報をレセプトコンピュータに手動で入力することで、文字情報をデータ化しているため、入力に手間がかかっていた。処方箋に限らず、紙に印刷等された文字情報をデータ化するには、文字情報を手動で入力する必要があり、手間がかかっていた。
さらに、文字情報を自動で読み取りデータ化する場合にも、文字情報が印刷された対象によって、読み取る文字情報が異なり、読み取り性能が低くなるという問題がある。
本発明の目的は、かかる従来技術の課題に鑑み、入力の手間を省き、文字情報を認識して文字データを表示する表示データを生成することができる表示データ生成システムを提供することにある。
[1]本発明の表示データ生成システムは、文字を認識して該認識した文字に基づいて文字データを生成する文字データ認識装置と、
前記文字データ認識装置で生成された文字データの中から、所定のテンプレートに応じて設定された項目に該当する文字データを抽出する文字抽出装置と、
前記文字抽出装置で抽出された文字データを表示する表示データを生成する生成装置と、
を備えることを特徴とする。
本発明によれば、認識した文字に基づいて、所定のテンプレートに応じて設定された項目に該当する文字データを抽出し、該抽出された文字データを表示する表示データを生成することができる。こにれより、入力の手間を省き、容易に文字情報をデータ化することができる。さらに、例えば、所定のテンプレート以外のテンプレートに応じて設定された項目に該当する文字データは抽出する必要がなく、文字データ抽出に係るデータ処理量を削減することができる。
[2]前記所定のテンプレートを設定するテンプレート設定装置を備え、
前記文字抽出装置は、前記テンプレート設定装置で設定された前記所定のテンプレートに応じて設定された項目に該当する文字データを抽出することが好ましい。
上記構成によれば、所望する所定のテンプレートに応じて設定された項目に該当する文字データを容易に抽出することができる。
[3]前記文字抽出装置で抽出する文字データを設定する抽出文字設定装置を備え、
前記文字抽出装置は、前記抽出文字設定装置で設定された文字データを抽出することが好ましい。
上記構成によれば、所望する文字データを容易に抽出することができる。
[4]前記文字データ認識装置は複数設けられ、
前記複数の文字データ認識装置のそれぞれで生成された文字データの信頼度を判定する判定装置を備え、
前記文字抽出装置は、前記判定装置での判定結果に基づいて、前記複数の文字データ認識装置のそれぞれで生成された文字データの中から、抽出に用いる文字データを選択して、選択した文字データの中から文字データを抽出することが好ましい。
上記構成によれば、複数の文字データ認識装置の中から、文字データ抽出の信頼度の高い文字データ認識装置を用いて、文字データを抽出することができ、文字データ抽出性能を向上することができる。
本発明の一実施形態に係る表示データ生成システムの構成の概略を示す概略図。 レシートを示す説明図。 携帯端末のカメラでレシートを撮影している状態を示す図。 表示データを生成する場合の処理の流れを示すフロチャート。
以下、図面を用いて本発明の実施形態を説明する。
まず、図1を参照して、本発明の一実施形態に係る表示データ生成システム10の構成の概略を説明する。
表示データ生成システム10は、販売店等から提供された紙のレシート(図2参照)を認識して該レシートに応じた表示データを生成するものであり、OCR(Optical Character Recognition、光学的文字認識)セレクタ11と、携帯端末12と、を備える。
OCRセレクタ11は、CPU等から構成されてOCRセレクタ11を統括的に制御するOCR制御部21と、文字データ認識装置22と、判定装置23と、文字抽出装置24と、表示データ生成装置25と、外部と通信可能なOCR通信部26と、例えばROM(Read Only Memory),RAM(Random Access Memory)、HDD(Hard Disk Drive)等の記憶装置により構成されたOCR記憶部27と、を備える。
文字データ認識装置22は、レシートの撮影画像からレシートに描かれた文字を認識して該認識した文字に基づいて文字データを生成するもので、第1文字データ認識装置22Aと第2文字データ認識装置22Bとを備える。
OCR記憶部27には、撮影画像に記載された文字を認識するOCRを稼働させるためのOCRプログラム等の各種プログラムが記憶されており、第1文字データ認識装置22A及び第2文字データ認識装置22Bは、各種プログラムを読み込んで、各種データ処理を行う。
判定装置23は、第1文字データ認識装置22A及び第2文字データ認識装置22Bのそれぞれで生成された文字データの信頼度を判定する。
OCR記憶部27には、第1文字データ認識装置22A及び第2文字データ認識装置22Bのそれぞれで生成された文字データの信頼度を判定する判定プログラム等の各種プログラムが記憶されており、判定装置23は、各種プログラムを読み込んで、文字データの信頼度を判定する。例えば、生成された文字データと、予め辞書機能として記憶された文字との一致率を、信頼度として判定する。
文字抽出装置24は、第1文字データ認識装置22A及び第2文字データ認識装置22Bで生成された文字データの中から、所定のテンプレートに応じて設定された項目に該当する文字データを抽出する。この際、文字抽出装置24は、判定装置23での判定結果に基づいて、第1文字データ認識装置22A及び第2文字データ認識装置22Bで生成された文字データの中から、抽出に用いる文字データを選択して、選択した文字データの中から、所定のテンプレートに応じて設定された項目に該当する文字データを抽出する。
OCR記憶部27には、複数の所定のテンプレートの情報や、文字データ認識装置22で生成された文字データの中から、所定のテンプレートに応じて設定された項目に該当する文字データを抽出するための文字データ抽出プログラム等が記憶されており、文字抽出装置24は、文字データ抽出プログラムを読み込んで、文字データを抽出する。
複数の所定のテンプレートのそれぞれは、テンプレートの種類(例えば、レシート)に応じて項目(商品名、価格、個数等)が設定されている。
表示データ生成装置25は、文字抽出装置24で抽出された文字データを表示する表示データを生成する。
OCR記憶部27には、文字抽出装置24で抽出された文字データを表示する表示データを生成するための表示データ生成プログラム等が記憶されており、表示データ生成装置25は、表示データ生成プログラムを読み込んで、表示データを生成する。
携帯端末12は、例えばスマートフォンから構成され、カメラ31と、タッチパネル32と、CPU等から構成されて携帯端末12を統括的に制御する携帯制御部33と、外部と通信可能な携帯通信部34と、携帯記憶部35と、を備え、OCRセレクタ11と通信可能となっている。
携帯記憶部35は、例えばROM等の記憶装置により構成されている。なお、OCRセレクタ11と携帯端末12との通信は、無線、有線いずれでもよい。
携帯端末12には、表示データ生成モードが設けられ、この表示データ生成モードに移行すると、詳しくは後述する表示データ生成が実行される。
[表示データ生成]
次に、図4のフロチャートを用いて、表示データ生成システム10を用いてレシートを認識して、該レシートに応じた表示データを生成する場合の流れを説明する。
先ず、ユーザは、携帯端末12のタッチパネル32を操作して、携帯端末12を表示データ生成モードに移行させる。この表示データ生成モードへの移行は、携帯端末12の携帯制御部33により行われる。
次に、紙のレシートを、携帯端末12のカメラ31で撮影(図2参照)する(写真の文字の下の〇をタッチ)。携帯制御部33は、レシートの撮影画像データを携帯記憶部35に記憶し、且つ、OCRセレクタ11に送信する(STEP1)。
OCRセレクタ11は、OCR通信部26でレシートの撮影画像データを受信すると、OCR制御部21で受信したレシートの撮影画像データに対して圧縮、ノイズ除去等の処理を施した(STEP2)後、レシートの撮影画像データを第1文字データ認識装置22A及び第2文字データ認識装置22Bに送る。
第1文字データ認識装置22A及び第2文字データ認識装置22Bはそれぞれ、レシートの撮影画像からレシートに描かれた文字を認識して該認識した文字に基づいて文字データを生成する(STEP3)。
判定装置23は、第1文字データ認識装置22A及び第2文字データ認識装置22Bのそれぞれで生成された文字データの信頼度を判定する(STEP4)。本実施形態では、判定装置23は、各種プログラムを読み込んで、生成された文字データと、予め辞書機能として記憶された文字との一致率を、信頼度として判定する。
OCR制御部21は、第1文字データ認識装置22A及び第2文字データ認識装置22Bのそれぞれで生成された文字データと、信頼度の情報とを、携帯端末12に送信する。
携帯端末12の携帯制御部33は、受信した文字データ及び信頼度の情報を、タッチパネル32に表示する(STEP5)。ユーザは、このタッチパネル32に表示された文字データ及び信頼度の情報を確認した後、タッチパネル32を操作して、複数のテンプレートの中から、文字データを抽出するためのテンプレートを設定する(STEP6)。
携帯端末12の携帯制御部33は、設定されたテンプレートの情報を、OCRセレクタ11に送信する。
OCR制御部21は、受信したテンプレートの情報に応じた読取辞書項目を表示パネル(図示せず)に表示する(STEP7)。オペレータは、表示パネルに表示された読取辞書項目を確認して、項目の追加及び削除等を行う。
文字抽出装置24は、第1文字データ認識装置22A及び第2文字データ認識装置22Bのうち、信頼度の高い装置で生成された文字データの中から、設定されたテンプレートに応じて設定された項目に該当する文字データを抽出する(STEP8)。
本実施形態では、レシートテンプレートがテンプレートとして設定され、このレシートテンプレートに応じて設定された項目として、店舗名、店舗住所、店舗電話番号、日付、商品名、個数、金額、合計金額が設定されている。なお、設定された項目(文字)を抽出できなかった場合には、その項目は空欄とする。
本実施形態では、文字抽出装置24は、周知の機械学習(教師あり学習:学習データとして入力とその正しい出力が与えられ、ある入力を受けると正しい出力ができるよう学習させるアルゴリズム)を繰り返し行うことで、文字の抽出能力や、文脈の識別能力を向上している。
例えば、予め辞書機能として、複数の店舗名及び商品名の情報(例えば、XYZストア、○○ドリンク、□□スナック等)が、キーワードとしてOCR記憶部27内の辞書に記憶され、文字抽出装置24は、辞書に記憶された複数の店舗名及び商品名と一致する店舗名及び商品名の文字データを抽出する。また、予め辞書機能として、商品名の一部(例えば、ショップ、ストア、パン、弁当等)がキーワードとして記憶され、辞書に記憶された商品名の一部(ショップ、パン、弁当)を含む文字(例えば、「ABCショップ」、「△△パン」や「××弁当」)を、商品名の文字データとして抽出する。
また、上記辞書機能で記憶する情報(キーワード)は、例えばオペレータにより適宜変更可能である。これにより、抽出したい文字(情報)を変更することができる。
予め設定された「パン」の文字を識別した場合には、レシートにおいて抽出した「パン」の文字を含む「△△パン」を商品名の文字データとして抽出し、この抽出した文字の右横に記載された文字「250」を、金額として識別する。
表示データ生成装置25は、文字抽出装置24で抽出された文字データを表示する表示データを生成し、表示パネルに表示する(STEP9)。
OCR制御部21は、生成された表示データを、携帯端末12に送信する。
携帯端末12の携帯制御部33は、受信した表示データを、タッチパネル32に表示する。ユーザは、このタッチパネル32に表示された表示データを確認した後、タッチパネル32を操作して、追加/修正したい項目を枠で選択する(STEP10)。例えば、レシートでは、店舗名が「ABCショップ」となっているのに対し、生成された表示データでは、店舗名が「ABショップ」となっている場合がある。これは、レシートの「C」の文字が薄くなっている場合等に発生する。この場合には、表示データの「ABショップ」を枠で選択する。
ユーザは、表示データの「ABショップ」を枠で選択した後、タッチパネル32を操作して、正しいデータとして「ABCショップ」を入力(修正)する(STEP11)。
携帯端末12の携帯制御部33は、入力されたデータの情報を、OCRセレクタ11に送信する。
OCR制御部21は、受信したデータに基づいて、読取項目辞書を拡張する(STEP12)。本実施形態では、読取項目辞書で、店舗名の「ABCショップ」が追加される。これにより、文字データの抽出(読取)設定が自動で適用される(STEP13)。
このように、認識した文字に基づいて、所定のテンプレートに応じて設定された項目に該当する文字データを抽出し、該抽出された文字データを表示する表示データを生成することができる。こにれより、入力の手間を省き、容易に文字情報をデータ化することができる。さらに、例えば、所定のテンプレート以外のテンプレートに応じて設定された項目に該当する文字データは抽出する必要がなく、文字データ抽出に係るデータ処理量を削減することができる。
また、所定のテンプレートを設定可能であるので、所望するテンプレートに応じて設定された項目に該当する文字データを抽出することができる。
さらに、文字抽出装置24で抽出する文字データを設定可能(辞書機能の拡張)であるので、所望する文字データを容易に抽出することができる。
また、第1文字データ認識装置22A及び第2文字データ認識装置22Bを設け、各装置22A及び22Bで生成された文字データの信頼度を判定し、文字抽出装置24は、信頼度の高い文字データ認識装置で生成された文字データの中から文字データを抽出するので、文字データ抽出性能を向上することができる。
以上、本発明を、その好適な実施形態について説明したが、当業者であれば容易に理解できるように、本発明はこのような実施形態により限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更可能である。
例えば、上記実施形では、文字データ認識装置を2個設けているが、文字データ認識装置の数は適宜変更可能であり、1個や3個以上でもよい。
上記実施形では、レシートの文字を認識及び抽出してレシートの表示データを生成しているが、表示データを生成する対象はレシートに限定されず、例えば、処方箋、保険証、不動産情報等の文字データを表示する表示データを生成するようにしてもよい。この場合、表示データを生成する対象に応じたテンプレートを設け、対応したテンプレートを選択して文字データを抽出することが好ましい。
10…表示データ生成システム、11…OCRセレクタ、12…携帯端末、21…OCR制御部、22…文字データ認識装置、22A…第1文字データ認識装置、22B…第2文字データ認識装置、23…判定装置、24…文字抽出装置、25…表示データ生成装置

Claims (4)

  1. 文字を認識して該認識した文字に基づいて文字データを生成する文字データ認識装置と、
    前記文字データ認識装置で生成された文字データの中から、所定のテンプレートに応じて設定された項目に該当する文字データを抽出する文字抽出装置と、
    前記文字抽出装置で抽出された文字データを表示する表示データを生成する生成装置と、
    を備えることを特徴とする表示データ生成システム。
  2. 請求項1に記載の表示データ生成システムにおいて、
    前記所定のテンプレートを設定するテンプレート設定装置を備え、
    前記文字抽出装置は、前記テンプレート設定装置で設定された前記所定のテンプレートに応じて設定された項目に該当する文字データを抽出することを特徴とする表示データ生成システム。
  3. 請求項1又は2に記載の表示データ生成システムにおいて、
    前記文字抽出装置で抽出する文字データを設定する抽出文字設定装置を備え、
    前記文字抽出装置は、前記抽出文字設定装置で設定された文字データを抽出することを特徴とする表示データ生成システム。
  4. 請求項1~3のいずれか1項に記載の表示データ生成システムにおいて、
    前記文字データ認識装置は複数設けられ、
    前記複数の文字データ認識装置のそれぞれで生成された文字データの信頼度を判定する判定装置を備え、
    前記文字抽出装置は、前記判定装置での判定結果に基づいて、前記複数の文字データ認識装置のそれぞれで生成された文字データの中から、抽出に用いる文字データを選択して、選択した文字データの中から文字データを抽出することを特徴とする表示データ生成システム。
JP2021183654A 2021-11-10 2021-11-10 表示データ生成システム Pending JP2023071067A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021183654A JP2023071067A (ja) 2021-11-10 2021-11-10 表示データ生成システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021183654A JP2023071067A (ja) 2021-11-10 2021-11-10 表示データ生成システム

Publications (1)

Publication Number Publication Date
JP2023071067A true JP2023071067A (ja) 2023-05-22

Family

ID=86395246

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021183654A Pending JP2023071067A (ja) 2021-11-10 2021-11-10 表示データ生成システム

Country Status (1)

Country Link
JP (1) JP2023071067A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021033743A (ja) * 2019-08-27 2021-03-01 株式会社日立製作所 情報処理装置、文書識別方法、及び情報処理システム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021033743A (ja) * 2019-08-27 2021-03-01 株式会社日立製作所 情報処理装置、文書識別方法、及び情報処理システム

Similar Documents

Publication Publication Date Title
US8989497B2 (en) Handwritten character input device, remote device, and electronic information terminal
WO2014022809A1 (en) Automated scanning
JP7338230B2 (ja) 情報処理装置、及び情報処理プログラム
JP2012216042A (ja) 商品販売データ処理装置および電子レシート管理システム
WO2024088291A1 (zh) 表单填充方法、装置、电子设备及介质
JP2023071067A (ja) 表示データ生成システム
JP6676121B2 (ja) データ入力装置及びデータ入力プログラム
JP5243228B2 (ja) 文字認識装置、文字認識装置の確認画面生成方法
JP6190549B1 (ja) 文書処理システム
JP3326073B2 (ja) 振込処理システム及びデータ修正装置
JP7333759B2 (ja) 画像データ生成システム、画像データ生成方法及びコンピュータプログラム
JP2019185353A (ja) 段ボール用受注管理システム
JP2021144289A (ja) 情報処理装置、情報処理システム及び情報処理方法
JP7222766B2 (ja) 印刷物を介したメタ情報伝達システム、印刷制御装置、印刷物読取装置、印刷物に対するメタ情報付与方法および印刷物からのメタ情報取得方法
JP7251102B2 (ja) 表示装置、読取装置、情報読取システム、情報読取方法、およびプログラム
JPH106602A (ja) 申請書発行装置
JP6686098B2 (ja) サーバ装置、プログラム、電子レシートシステムおよび付帯情報出力方法
JP2928042B2 (ja) 携帯形fax・ocr端末装置を用いた情報伝送方式
JP2018136709A (ja) データ入力装置、データ入力プログラム及びデータ入力システム
JP2022187606A (ja) 処方箋二次元コード生成システム
JP2022187605A (ja) 薬剤検出システム
JP6351785B2 (ja) 商品販売データ処理装置とその制御プログラム、ならびに電子レシート管理システム
JPH11272794A (ja) レシートデータ処理装置
JP6316913B1 (ja) Fax受注システムおよびプログラム
JP2002230465A (ja) 帳票読取装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220906

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230711

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20240109