CN115943449A - 数据生成设备、数据生成方法及数据生成程序 - Google Patents

数据生成设备、数据生成方法及数据生成程序 Download PDF

Info

Publication number
CN115943449A
CN115943449A CN202080103234.2A CN202080103234A CN115943449A CN 115943449 A CN115943449 A CN 115943449A CN 202080103234 A CN202080103234 A CN 202080103234A CN 115943449 A CN115943449 A CN 115943449A
Authority
CN
China
Prior art keywords
serial number
image
unit
character
data generation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080103234.2A
Other languages
English (en)
Inventor
亀井圣美
吉村和久
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Frontech Ltd
Original Assignee
Fujitsu Frontech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Frontech Ltd filed Critical Fujitsu Frontech Ltd
Publication of CN115943449A publication Critical patent/CN115943449A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/147Determination of region of interest
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07DHANDLING OF COINS OR VALUABLE PAPERS, e.g. TESTING, SORTING BY DENOMINATIONS, COUNTING, DISPENSING, CHANGING OR DEPOSITING
    • G07D7/00Testing specially adapted to determine the identity or genuineness of valuable papers or for segregating those which are unacceptable, e.g. banknotes that are alien to a currency
    • G07D7/004Testing specially adapted to determine the identity or genuineness of valuable papers or for segregating those which are unacceptable, e.g. banknotes that are alien to a currency using digital security elements, e.g. information coded on a magnetic thread or strip
    • G07D7/0047Testing specially adapted to determine the identity or genuineness of valuable papers or for segregating those which are unacceptable, e.g. banknotes that are alien to a currency using digital security elements, e.g. information coded on a magnetic thread or strip using checkcodes, e.g. coded numbers derived from serial number and denomination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/166Normalisation of pattern dimensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07DHANDLING OF COINS OR VALUABLE PAPERS, e.g. TESTING, SORTING BY DENOMINATIONS, COUNTING, DISPENSING, CHANGING OR DEPOSITING
    • G07D7/00Testing specially adapted to determine the identity or genuineness of valuable papers or for segregating those which are unacceptable, e.g. banknotes that are alien to a currency
    • G07D7/004Testing specially adapted to determine the identity or genuineness of valuable papers or for segregating those which are unacceptable, e.g. banknotes that are alien to a currency using digital security elements, e.g. information coded on a magnetic thread or strip
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07DHANDLING OF COINS OR VALUABLE PAPERS, e.g. TESTING, SORTING BY DENOMINATIONS, COUNTING, DISPENSING, CHANGING OR DEPOSITING
    • G07D7/00Testing specially adapted to determine the identity or genuineness of valuable papers or for segregating those which are unacceptable, e.g. banknotes that are alien to a currency
    • G07D7/06Testing specially adapted to determine the identity or genuineness of valuable papers or for segregating those which are unacceptable, e.g. banknotes that are alien to a currency using wave or particle radiation
    • G07D7/12Visible light, infrared or ultraviolet radiation
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07DHANDLING OF COINS OR VALUABLE PAPERS, e.g. TESTING, SORTING BY DENOMINATIONS, COUNTING, DISPENSING, CHANGING OR DEPOSITING
    • G07D7/00Testing specially adapted to determine the identity or genuineness of valuable papers or for segregating those which are unacceptable, e.g. banknotes that are alien to a currency
    • G07D7/20Testing patterns thereon
    • G07D7/202Testing patterns thereon using pattern matching
    • G07D7/206Matching template patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/24Indexing scheme for image data processing or generation, in general involving graphical user interfaces [GUIs]
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07DHANDLING OF COINS OR VALUABLE PAPERS, e.g. TESTING, SORTING BY DENOMINATIONS, COUNTING, DISPENSING, CHANGING OR DEPOSITING
    • G07D2207/00Paper-money testing devices

Landscapes

  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Toxicology (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Character Input (AREA)
  • Image Processing (AREA)

Abstract

根据本发明实施方式的数据生成设备具有分离单元、字符图像获取单元、背景图像获取单元、预处理单元、合辑单元和输出单元。分离单元将包括序列号的钞票的原始图像分离成序列号区域和背景区域。字符图像获取单元识别分离出的序列号区域中所包括的每个字符,并获取每个识别出的字符的字符图像。背景图像获取单元通过在分离出的背景区域中补充序列号区域,来获取背景图像。预处理单元通过组合所获取的字符图像,来生成序列号图像。合辑单元将生成的序列号图像编辑到所获取的背景图像中与序列号图像相对应的位置处。输出单元输出其中由预处理单元组合的序列号与由合辑单元编辑的图像相关联的图像数据。

Description

数据生成设备、数据生成方法及数据生成程序
技术领域
本发明的实施方式涉及数据生成设备、数据生成方法及数据生成程序。
背景技术
传统上,在开发用于识别印在纸币上的字符的纸币识别设备时,需要准备大量纸币的多条样本数据,以获得用于检查识别准确度并确认防伪效果等的环境。
作为用于生成如上述纸币的多条样本数据的传统技术,模板文件布置在可见图像数据和不可见图像数据的所有像素上,同时应用模板文件的布置规则。此外,已知用于生成对模板文件的每个像素应用了α图像数据的像素密度的灰度级特征的印制图案部的数据。
引用列表
专利文献
专利文献1:日本特开2018-192729号公报
专利文献2:日本特开2018-163554号公报
发明内容
技术问题
然而,如上所述的传统技术是准备与印制图案相关的样本数据。因此,如果要准备与具有不同序列号的大量纸币相关的多条样本数据,则需要针对每个序列号准备一条样本数据并将正确答案的序列号与准备的每条样本数据相关联的操作,因此需要大量的工时,这是一个问题。
根据一个方面,一个目的在于提供能够支持纸币识别设备的开发操作的数据生成设备、数据生成方法及数据生成程序。
技术方案
根据构思,一种数据生成设备包括分离单元、字符图像获取单元、背景图像获取单元、预处理单元、合并单元和输出单元。分离单元从包括序列号的纸币的原始图像中分离出序列号区域和背景区域。字符图像获取单元识别分离出的序列号区域中所包括的每个字符,并获取每个识别出的字符的字符图像。背景图像获取单元通过在分离出的背景区域中补充序列号区域,来获取背景图像。预处理单元通过组合所获取的字符图像,来生成序列号图像。合并单元将生成的序列号图像合并到所获取的背景图像中与序列号图像相对应的位置处。输出单元输出其中由预处理单元组合的序列号与由合并单元生成的合并图像相关联的图像数据。
技术效果
可以支持纸币识别设备的开发操作。
附图说明
图1是例示了根据实施方式的数据生成设备的功能配置示例的框图。
图2是例示了根据实施方式的数据生成设备所执行的操作示例的流程图。
图3是用于说明从原始图像数据获取背景图像数据和字符图像数据的说明图。
图4是用于说明确认画面中的修改的说明图。
图5是例示了根据实施方式的数据生成设备所生成的操作示例的流程图。
图6是用于说明从原始图像数据生成的生成图像数据的说明图。
图7是用于说明计算机的配置示例的说明图。
具体实施方式
以下将参照附图描述根据实施方式的数据生成设备、数据生成方法和数据生成程序。在实施方式中,具有相同功能的组件由相同的附图标记指代,并且将省略重复说明。此外,以下实施方式中描述的数据生成设备、数据生成方法及数据生成程序是以示例方式而例示的,而并不限制实施方式。另外,以下的各个实施方式只要没有冲突就可以适当地组合。
图1是例示了根据实施方式的数据生成设备的功能配置示例的框图。如图1所示,数据生成设备1包括获取单元10、分离单元11、背景图像获取单元12、字符图像获取单元13、确认处理单元14、储存单元15、序列号设置单元16、预处理单元17、合并单元18和输出单元19。例如,可以应用个人计算机(PC)作为数据生成设备1。
获取单元10获取与包括序列号的纸币相关的原始图像数据2。具体而言,原始图像数据2是通过扫描仪等读取纸币的全部或一部分中的包含为了区分各个纸币而印制的序列号的区域而获得的图像数据。此外,假设本实施方式中的“纸币”包括政府发行的政府钞票、银行发行的钞票、私人公司等发行的代金券等。
例如,获取单元10通过从诸如半导体存储器之类的储存介质读取或者通过例如经由通信单元(参见图7)与外部装置进行通信,获取由扫描仪等预先读取的原始图像数据2。随后,获取单元10将所获取的原始图像数据2输出到分离单元11。
分离单元11是针对由获取单元10获取的原始图像数据2,从包括序列号的纸币的原始图像中分离出序列号区域和背景区域的处理单元。
具体而言,分离单元11基于纸币原始图像中的预先设置为包括序列号的区域的坐标,采用序列号区域作为感兴趣区域(ROI)。此外,分离单元11可以采用通过使用公知的图像识别技术从纸币的原始图像中识别出的序列号区域作为感兴趣区域。随后,分离单元11从原始图像提取感兴趣区域(序列号区域),并且将所提取的序列号区域和除序列号区域之外的背景区域分离。然后,分离单元11向字符图像获取单元13输出与序列号区域相关的图像数据,并且向背景图像获取单元12输出与背景区域相关的图像数据。
背景图像获取单元12是通过在由分离单元11分离出的背景区域中补充分离出的序列号区域而生成背景图像的处理单元。具体来说,背景图像获取单元12针对与背景区域相关的并且由分离单元11输出的图像数据,通过使用公知的图像补充技术,从提取出的感兴趣区域(序列号区域)的相邻像素起补充序列号区域的像素。
随后,背景图像获取单元12将补充了序列号区域的背景图像数据3存储在储存单元15中。此外,背景图像获取单元12在将背景图像数据3存储在储存单元15中时,向背景图像数据3添加关于序列号区域的位置、尺寸等的信息,作为元数据。
字符图像获取单元13是识别由分离单元11分离出的序列号区域中所包括的每个字符并获取每个识别出的字符的字符图像的处理单元。具体而言,字符图像获取单元13对与序列号区域相关并且由分离单元11输出的图像数据执行公知的字符识别处理,并识别序列号区域中包括的每个字符(例如,诸如A至Z以及0至1的字母数字字符、诸如平假名的日文字符)。随后,字符图像获取单元13采用每个识别出的字符的字符图像作为字符图像数据4,并将字符图像数据4存储在储存单元15中。
例如,如果从序列号区域识别出的单个字符是“A”,则字符图像获取单元13将被识别为“A”的字符图像存储在具有与“A”相对应的文件名“A.dat”的字符图像数据4中。
确认处理单元14是显示用于由字符图像获取单元13识别出的每个字符的字符图像的确认画面,并基于在确认画面中从用户接收到的修改指示来修改与识别出的字符相对应的字符图像的处理单元。
具体来说,确认处理单元14读取由字符图像获取单元13识别出并存储在储存单元15中的每个单个字符的字符图像数据4,并且将读取的字符图像显示在诸如显示器之类的确认画面上。利用确认画面,用户能够确认字符图像获取单元13是否正确地识别出字符图像。随后,确认处理单元14从用户接收用于指定确认画面中的字符图像的修改指示。
例如,假设需要识别为“C”的字符图像已经被识别为“A”的字符图像,并且“C”的字符图像被包括在具有与“A”相对应的文件名“A.dat”的字符图像数据4中。在这种情况下,除了“A”的字符图像之外,确认画面还包括“C”的字符图像。在这种情况下,用户选择“C”的字符图像,并且例如通过在确认画面上的图形用户界面(GUI)上的操作来输入用于指定“C”的修改指示。确认处理单元14基于如上所述接收到的修改指示,修改与识别出的字符相对应的字符图像。例如,确认处理单元14基于如上所述的修改指示,将具有“A.dat”的字符图像数据4中所包括的字符图像“C”移动到具有“C.dat”的字符图像数据4。
储存单元15例如是诸如半导体存储器之类的储存装置,并且在其内存储诸如背景图像数据3、字符图像数据4、以及生成图像数据5之类的各种数据。
序列号设置单元16是将要生成的纸币的图像数据(生成图像数据5)的序列号的处理单元。具体而言,序列号设置单元16基于与序列号的生成相关的预定规则(例如,序列号的位数、字母和数字的组合规则等)设置随机生成的序列号。此外,序列号设置单元16可以设置由用户预先指定的序列号。序列号设置单元16将设置的序列号通知预处理单元17和输出单元19。
预处理单元17是基于由序列号设置单元16进行的设置,通过组合从原始图像数据2中包括的序列号获取的各个字符的字符图像,来生成序列号图像的处理单元。具体而言,预处理单元17针对由序列号设置单元16设置的序列号的每个字符,从储存单元15读取与序列号相对应的字符图像数据4。此外,如果字符图像数据4包括多个相同的字符图像,则预处理单元17可以选择并读取任意字符图像或者选择并读取满足预定条件(例如,分辨率)的字符图像。
随后,预处理单元17通过以与序列号相同的次序重新排列针对序列号的各个字符而读取的字符图像,来生成序列号图像。这里,预处理单元17可以通过放大或缩小尺寸,对各个字符的字符图像进行尺寸调整以满足预定条件(例如,字符的尺寸或分辨率)。尺寸调整的条件可以由用户预先设置,或者可以设置为匹配所有字符的平均尺寸,使得当字符以与序列号相同的次序重新排列时所有字符具有相同尺寸。此外,当用户预先设置尺寸调整的条件时,可以直接设置放大率、缩小率等,或者可以设置预定范围内的任意值。
合并单元18是将由预处理单元17生成的序列号图像合并到从原始图像数据2获取的背景图像中与序列号区域相对应的位置处的处理单元。具体来说,合并单元18从储存单元15中读取背景图像数据3,并将由预处理单元17生成的序列号图像合并到背景图像数据3的与由元数据指示的序列号区域相对应的位置处。因此,合并单元18生成包括由序列号设置单元16设置的序列号的纸币的图像作为生成图像数据5。
这里,当将序列号图像合并到背景图像中与序列号区域相对应的位置处时,合并单元18可以将序列号图像合并到从与序列号区域相对应的位置处偏离预定量的位置处。位置偏离可以由用户预先设置,或者可以从用户设置的预定宽度的偏离量当中随机地选择偏离量。
此外,合并单元18可以将生成图像数据5中的合并图像调整至预定浓度。要调整的浓度可以由用户直接设置或者可以在预定范围内任意设置。
输出单元19是输出生成图像数据5的处理单元,在该生成图像数据5中由序列号设置单元16设置并且由预处理单元17组合的序列号与由合并单元18生成的合并图像关联。具体而言,输出单元19将由序列号设置单元16设置的序列号与由合并单元18生成的生成图像数据5关联,并且输出生成图像数据5。
可以通过例如将序列号包括在生成图像数据5的元数据中并将序列号添加到生成图像数据5中,或者通过使用其中每行中布置有生成图像数据5和序列号的表数据(阵列数据)来执行如上所述的序列号的关联。输出单元19将如上所述地关联起来的生成图像数据5存储在储存单元15中。利用该构造,用户能够从储存单元15读取与序列号相关联的生成图像数据5,并使用生成图像数据5来开发纸币识别设备等。
图2是例示了根据本实施方式的数据生成设备1执行的操作示例的流程图。具体来说,图2是例示了从原始图像数据2获取背景图像数据3和字符图像数据4的处理示例的流程图。
如图2所示,如果处理开始,则获取单元10从原始图像数据2获取与包括序列号的纸币相关的原始图像(S10)。随后,分离单元11从所获取的原始图像分离作为感兴趣区域(ROI)的序列的区域(S11),并且提取序列号区域(S12)。
图3是用于说明从原始图像数据2获取背景图像数据3和字符图像数据4的说明图。如图3所示,分离单元11提取原始图像数据2中与序列号相对应的感兴趣区域R1,并且将背景区域2a和序列号区域2b分离。
随后,字符图像获取单元13通过公知的字符识别处理来识别分离出的序列号区域2b中所包含的每个字符,并且提取每个字符的字符图像(S13)。
此外,与字符图像获取单元13执行的处理并行地,背景图像获取单元12在分离出的背景区域2a中补充与分离出的序列号区域2b相对应的部分(S14)。随后,背景图像获取单元12将补充后的背景图像作为背景图像数据3存储在储存单元15中(S15)。
在步骤S13之后,字符图像获取单元13针对每个提取出的字符(字符图像)执行循环处理(S16至S19)。具体而言,字符图像获取单元13对提取出的字符图像执行字符识别(S17),并且将与识别出的字符相对应的字符图像数据4中的字符图像存储在储存单元15中(S18)。因此,例如,如图3所示,包括“1.dat”和“A.dat”的字符图像数据4存储在储存单元15中,“1.dat”包含被识别为字符“1”的字符图像,“A.dat”包含被识别为字符“A”的字符图像。
随后,确认处理单元14显示由字符图像获取单元13识别出的每个字符的字符图像的确认画面(S20)。然后,确认处理单元14确定用户是否进行修改(S21),并且如果不进行修改(S21:否),则处理进行到S23。如果进行修改(S21:是),则确认处理单元14基于从用户接收到的修改指示来修改与识别出的字符相对应的字符图像(S22),并且处理返回到S20。
图4是用于说明确认画面中的修改的说明图。在图4中,字符图像数据4a包括被识别为“A”的单字符图像40a和41a。在此,假设单字符图像41a是被误识别为“A”的字符图像,并且是需要被识别为“C”的字符图像。类似地,字符图像数据4b包括被识别为“C”的单字符图像40b和41b。这里,假设单字符图像41b是被误识别为“C”的字符图像并且是需要被识别为“A”的字符图像。
如图4所示,例如针对字符“A”,确认处理单元14读取字符图像数据4a中包含的字符图像(40a和41a),并且在确认画面50上显示字符图像。因此,用户能够容易地确认针对字符“A”是否正确地识别出字符图像。这里,包含需要被识别为“C”的单字符图像41a;因此,例如,用户选择单字符图像41a并通过输入字符来指定单字符图像41a是“C”。确认处理单元14基于修改指示将单字符图像41a移动到用于“C”的字符图像数据4b。
类似地,例如针对字符“C”,读取字符图像数据4b中包含的字符图像(40b和41b)并将其显示在确认画面50上。因此,用户能够容易地确认针对字符“C”是否正确地识别出字符图像。这里,包含需要被识别为“A”的单字符图像41b;因此,用户选择单字符图像41b,并且例如通过输入字符来指定单字符图像41b是“A”。确认处理单元14基于修改指示将单字符图像41b移动到用于“A”的字符图像数据4a。
返回参照图2,在S23,获取单元10确定是否满足预定终止条件并且是否要终止处理(S23)。如果处理将不终止(S23:否),则获取单元10将处理返回到S10。如果处理将终止(S23:是),则获取单元10终止处理。
终止条件可以是是否完成了对预先准备的所有条的原始图像数据2的处理,或者是否完成了对预定数量条的原始图像数据2的处理。此外,例如,终止条件可以是是否获得了诸如包括A至Z和0至1的字母数字字符以及包括平假名的日文字符之类的所有类型的字符的字符图像数据4。
图5是例示了根据实施方式的数据生成设备执行的操作示例的流程图。具体来说,图5是例示了生成所述生成图像数据5的处理的一个示例的流程图。
如图5所示,如果处理开始,则序列号设置单元16例如基于与序列号的生成相关的规则来随机地设置序列号(S30)。
随后,预处理单元17从背景图像数据3获取背景图像,并且从字符图像数据4获取与由序列号设置单元16设置的序列号相关的字符图像(S31)。预处理单元17向合并单元18输出所获取的背景图像。然后,预处理单元17对所获取的每个字符的字符图像进行尺寸调整(S32)。随后,预处理单元17通过以与序列号相同的次序重新排列尺寸调整后的字符图像来生成序列号图像,并且将该序列号图像输出到合并单元18。
然后,合并单元18将由预处理单元17生成的序列号图像合并在背景图像中与序列号区域相对应的位置处(S33),并且改变合并图像的浓度(S34)。
随后,输出单元19将由序列号设置单元16设置的序列号与改变了浓度并且由合并单元18生成的图像(生成图像数据5)相关联(S35),并将关联的生成图像数据5存储在储存单元15中(S36)。
然后,序列号设置单元16确定是否满足预定终止条件并是否要终止处理(S37)。如果处理不终止(S37:否),则序列号设置单元16将处理返回到S30。如果处理将终止(S37:是),则序列号设置单元16终止处理。
终止条件可以是是否生成了如用户等预先设置的预定数量条(例如,1000条)的生成图像数据5,或者是否生成了由用户预先指定的序列号的生成图像数据5。
图6是用于说明从原始图像数据2生成的生成图像数据5的说明图。如图6所示,通过如图2所示的在S10至S23的处理(S1),数据生成设备1能够从原始图像数据2获取原始图像数据2的序列号中所包含的各字符的字符图像数据4和背景图像数据3。此外,数据生成设备1能够通过基于从原始图像数据2获取的字符图像数据4和背景图像数据3重复如图5所示的在S30至S37的处理(S2),获取每条被添加了序列号(正确答案)的多条生成图像数据5。
因此,用户能够省略将作为正确答案的序列号与针对每个序列号的纸币样本数据相关联的操作,并且能够容易地获得用于检查纸币识别设备的识别准确度并确认防伪效果的环境。
此外,每条生成图像数据5是其中序列号的位置相对于原始图像数据2偏离的图像数据(情况Cl)或者其中随机地重新排列序列号的图像数据(情况C2)。因此,可以准备与各种类型的纸币相关的数据(序列号偏离或者序列号被随机重新排列),以检查纸币识别设备的识别准确度。
如上所述,数据生成设备1包括分离单元11、字符图像获取单元13、背景图像获取单元12、预处理单元17、合并单元18和输出单元19。分离单元11针对获取的原始图像数据2,将包括序列号的纸币的原始图像中的序列号区域2b和背景区域2a分离。字符图像获取单元13识别分离出的序列号区域2b中所包含的每个字符,并且获取每个识别出的字符的字符图像。背景图像获取单元12通过在分离出的背景区域2a中补充序列号区域2b来获取背景图像。预处理单元17通过组合所获取的字符图像来生成序列号图像。合并单元18将生成的序列号图像合并到所获取的背景图像中与序列号区域2b相对应的位置处。输出单元19输出生成图像数据5,在该生成图像数据5中由预处理单元17组合的序列号与由合并单元18生成的合并图像相关联。
因此,用户能够容易地获得与序列号相关联的纸币的图像数据(生成图像数据5)。例如,用户能够省略将作为正确答案的序列号与针对每个序列号的纸币样本数据相关联以获得用于检查纸币识别设备的识别准确度并确认防伪效果的环境的操作。以此方式,数据生成设备1能够支持纸币识别设备的开发操作。
此外,数据生成设备1还包括确认处理单元14,该确认处理单元14针对每个识别出的字符的字符图像显示确认画面50,并且基于在确认画面50中从用户接收到的修改指示,修改与识别出的字符相对应的字符图像。利用该构造,数据生成设备1能够检查从原始图像中识别出并获得的字符图像是否被正确地识别,并且如果字符被错误地识别,则数据生成设备1能够执行修改以获得正确的内容。
此外,预处理单元17通过任意地组合所获取的字符图像来生成任意序列号图像。利用该构造,用户能够容易地获得与任意序列号相关联的纸币的图像数据(生成图像数据5)。
此外,预处理单元17和合并单元18重复多次处理,并且生成其中合并有任意序列号图像的多个图像。输出单元19针对每个所生成图像来输出与任意组合的序列号相关联的生成图像数据5。利用该构造,用户能够容易地获得各自与任意序列号相关联的多个纸币的图像数据(生成图像数据5)。
此外,预处理单元17对所获取的字符图像进行尺寸调整并且将尺寸调整后的字符图像组合。利用该构造,用户能够容易地获得包含通过尺寸调整而调整了字符尺寸的序列号的纸币图像数据(生成图像数据5)。
此外,合并单元18将合并图像的浓度调整到预定浓度。利用该构造,用户能够容易地获得浓度被调整到预定浓度并且表示与序列号相关联的纸币的图像数据(生成图像数据5)。
此外,合并单元18将生成的序列号图像合并到从与序列号区域2b相对应的位置偏离预定量的位置处。利用此构造,用户能够容易地获得其中序列号的位置偏离并且表示与序列号相关联的纸币的图像数据(生成图像数据5)。
此外,可以生成其中用计算机可执行的语言撰写由以上实施方式中描述的数据生成设备1执行的处理的数据生成程序(在下文中,称为程序)。例如,可以生成其中用计算机可执行的语言撰写由数据生成设备1所执行的处理的程序。在这种情况下,通过使计算机执行程序,可以实现与上述实施方式相同的效果。此外,可以将程序记录在计算机可读取记录介质中,并且使计算机读取并执行记录在记录介质中的程序,以实现与上述实施方式的处理相同的处理。下面作为一个示例将描述执行实现与数据生成设备1的功能相同的功能的程序的计算机的配置的示例。
图7是用于说明计算机的配置示例的说明图。如图7所示,计算机1000包括操作单元1100、显示器1200和通信单元1300。此外,计算机1000包括中央处理单元(CPU)1500、只读存储器(ROM)1600、硬盘驱动器(HDD)1700和随机存取存储器(RAM)1800。如上所述的所有单元经由总线1400彼此连接。
HDD 1700在其内预先存储有实现与如上所述的实施方式的获取单元10、分离单元11、背景图像获取单元12、字符图像获取单元13、确认处理单元14、序列号设置单元16、预处理单元17、合并单元18和输出单元19的功能相同的功能的程序1700a。程序1700a可以与获取单元10、分离单元11、背景图像获取单元12、字符图像获取单元13、确认处理单元14、序列号设置单元16、预处理单元17、合并单元18和输出单元19的各个组件类似地、适当集成或分解。换句话说,对于存储在HDD 1700中的每条数据,不需要总是将所有条数据存储在HDD1700中,而是将处理所需的数据存储在HDD 1700中就足够了。
此外,CPU 1500从HDD 1700读取程序1700a并将程序1700a加载到RAM 1800上。因此,程序1700a起到处理1800a的作用。处理1800a将从HDD 1700读取的各种类型的数据适当地加载到RAM 1800中分配给处理1800a的区域上,并且基于加载的各种类型的数据执行各种处理。具体而言,处理1800a针对经由通信单元1300输入的原始图像数据2,执行与获取单元10、分离单元11、背景图像获取单元12、字符图像获取单元13、确认处理单元14、序列号设置单元16、预处理单元17、合并单元18和输出单元19的处理相同的处理。此外,HDD 1700实现与储存单元15的功能相同的功能,并在其内存储生成的背景图像数据3、生成的字符图像数据4和生成图像数据5。
此外,如上所述的程序1700a不需要从一开始就一直存储在HDD 1700或ROM1600中。例如,程序1700a可以存储在插入到计算机1000中的便携式物理介质中,诸如软盘(即,FD)、紧凑光盘-ROM(CD-ROM)、数字通用盘(DVD)、磁光盘或集成电路(IC)卡。此外,计算机1000可以从便携式物理介质获取程序1700a并执行程序1700a。此外,程序1700a可以存储在经由公共线路、因特网、局域网(LAN)、广域网(WAN)等连接到计算机1000的不同计算机、服务器设备等中,并且计算机1000可以获取并执行程序1700a。此外,如果在如上所述的实施方式的每个处理中,处理在处理的中间被终止,则可以在不终止处理1800a的情况下执行不同的处理。
附图标记列表
1数据生成设备
2 原始图像数据
2a 背景区域
2b 序列号区域
3 背景图像数据
4、4a、4b字符图像数据
5 生成图像数据
10 获取单元
11 分离单元
12 背景图像获取单元
13 字符图像获取单元
14 确认处理单元
15 储存单元
16 序列号设置单元
17 预处理单元
18 合并单元
19 输出单元
40a、40b、41a、41b单字符图像
50 确认画面
51 光标
1000 计算机
1100 操作单元
1200 显示器
1300 通信单元
1400 总线
1500CPU
1600ROM
1700HDD
1700a程序
1800RAM
1800a处理
C1、C2情况
R1感兴趣区域

Claims (9)

1.一种数据生成设备,该数据生成设备包括:
分离单元,该分离单元从包括序列号的纸币的原始图像中分离出序列号区域和背景区域;
字符图像获取单元,该字符图像获取单元识别分离出的序列号区域中所包括的每个字符,并获取所识别出的字符中的每一个的字符图像;
背景图像获取单元,该背景图像获取单元通过在分离出的背景区域中补充所述序列号区域来获取背景图像;
预处理单元,该预处理单元通过组合所获取的字符图像,来生成序列号图像;
合并单元,该合并单元将所生成的序列号图像合并到所获取的背景图像中与所述序列号图像相对应的位置处;以及
输出单元,该输出单元输出由所述预处理单元组合的序列号与由所述合并单元生成的合并图像相关联的图像数据。
2.根据权利要求1所述的数据生成设备,该数据生成设备还包括:
确认处理单元,该确认处理单元针对所识别出的字符中的每一个的字符图像显示确认画面,并基于在所述确认画面中从用户接收到的修改指示,来修改与所识别出的字符相对应的字符图像。
3.根据权利要求1所述的数据生成设备,其中,所述预处理单元通过任意地组合所获取的字符图像,来生成任意的序列号图像。
4.根据权利要求3所述的数据生成设备,其中,
所述预处理单元和所述合并单元重复处理多次并生成合并有任意的序列号图像的多个图像,并且
所述输出单元针对每个所生成的图像输出与任意组合的序列号相关联的图像数据。
5.根据权利要求1所述的数据生成设备,其中,所述预处理单元对所获取的字符图像进行尺寸调整,并将尺寸调整后的字符图像组合。
6.根据权利要求1所述的数据生成设备,其中,所述合并单元将所述合并图像的浓度调整到预定浓度。
7.根据权利要求1所述的数据生成设备,其中,所述合并单元将所生成的序列号图像合并到从与所述序列号区域相对应的位置偏离预定量的位置处。
8.一种计算机实现的数据生成方法,该数据生成方法包括以下步骤:
从包括序列号的纸币的原始图像中分离出序列号区域和背景区域;
识别分离出的序列号区域中所包括的每个字符;
获取所识别出的字符中的每一个的字符图像;
通过在分离出的背景区域中补充所述序列号区域,来获取背景图像;
通过组合所获取的字符图像,来生成序列号图像;
将所生成的序列号图像合并到所获取的背景图像中与所述序列号图像相对应的位置处;以及
输出所组合的序列号与合并图像相关联的图像数据。
9.一种使计算机执行处理的数据生成程序,该处理包括以下操作:
从包括序列号的纸币的原始图像中分离出序列号区域和背景区域;
识别分离出的序列号区域中所包括的每个字符;
获取所识别出的字符中的每一个的字符图像;
通过在分离出的背景区域中补充所述序列号区域,来获取背景图像;
通过组合所获取的字符图像,来生成序列号图像;
将所生成的序列号图像合并到所获取的背景图像中与所述序列号图像相对应的位置处;以及
输出所组合的序列号与合并图像相关联的图像数据。
CN202080103234.2A 2020-08-31 2020-08-31 数据生成设备、数据生成方法及数据生成程序 Pending CN115943449A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/032826 WO2022044311A1 (ja) 2020-08-31 2020-08-31 データ生成装置、データ生成方法およびデータ生成プログラム

Publications (1)

Publication Number Publication Date
CN115943449A true CN115943449A (zh) 2023-04-07

Family

ID=80354913

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080103234.2A Pending CN115943449A (zh) 2020-08-31 2020-08-31 数据生成设备、数据生成方法及数据生成程序

Country Status (5)

Country Link
US (1) US20230186711A1 (zh)
EP (1) EP4207114A4 (zh)
JP (1) JP7304495B2 (zh)
CN (1) CN115943449A (zh)
WO (1) WO2022044311A1 (zh)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MC2491A1 (fr) * 1999-06-21 1999-11-22 Stringa Luigi Reconnaissance automatique de caractères sur fond structuré par combinaison des modèles du fond et des caractères
JP2012174132A (ja) * 2011-02-23 2012-09-10 Glory Ltd 紙葉類管理方法及び紙葉類管理システム
US9977957B2 (en) * 2013-02-28 2018-05-22 Glory Ltd. Method and system for identifying characters on a valuable medium
JP7011146B2 (ja) 2017-03-27 2022-01-26 富士通株式会社 画像処理装置、画像処理方法、画像処理プログラム、及び教師データ生成方法
JP6948028B2 (ja) 2017-05-19 2021-10-13 独立行政法人 国立印刷局 偽造防止印刷物作成方法及び偽造防止印刷物作成用プログラム
CN110956170A (zh) * 2019-09-30 2020-04-03 京东数字科技控股有限公司 生成护照机读码样本的方法、装置、设备及存储介质
CN111414906B (zh) * 2020-03-05 2024-05-24 北京交通大学 纸质票据图片的数据合成与文本识别方法

Also Published As

Publication number Publication date
JP7304495B2 (ja) 2023-07-06
US20230186711A1 (en) 2023-06-15
WO2022044311A1 (ja) 2022-03-03
EP4207114A4 (en) 2023-10-18
JPWO2022044311A1 (zh) 2022-03-03
EP4207114A1 (en) 2023-07-05

Similar Documents

Publication Publication Date Title
EP0490687B1 (en) Method and apparatus for image processing
US20040139391A1 (en) Integration of handwritten annotations into an electronic original
CN110008944A (zh) 基于模板匹配的ocr识别方法及装置、存储介质
US8379027B2 (en) Rendering engine test system
WO2009103023A2 (en) Music score deconstruction
US8522138B2 (en) Content analysis apparatus and method
JP2005173730A (ja) 帳票ocrプログラム、方法及び装置
KR100905857B1 (ko) 정보 처리 장치 및 정보 처리 장치의 제어 방법
WO2017143973A1 (zh) 文本识别模型建立方法和装置
CN116451659A (zh) 电子文件的批注处理方法、装置、电子设备及存储介质
CN115943449A (zh) 数据生成设备、数据生成方法及数据生成程序
KR20210077251A (ko) 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치 및 그 동작 방법
Baloun et al. ChronSeg: Novel Dataset for Segmentation of Handwritten Historical Chronicles.
CN111986015B (zh) 提取财务信息用于记账的方法和系统
CN115083024A (zh) 基于区域划分的签名识别方法、装置、介质及设备
US11508139B2 (en) Information processing apparatus and non-transitory computer readable medium
KR20210060808A (ko) 문서에 적용되어 있는 글꼴이 지원되는 글꼴인지 확인이 가능한 문서 편집 장치 및 그 동작 방법
Ojumah et al. A database for handwritten yoruba characters
KR102375566B1 (ko) 종이로 인쇄된 진료비 영수증을 전자 문서화 처리하는 전자 장치 및 그 동작 방법
US20180210865A1 (en) Information processing apparatus
WO2023042270A1 (ja) 文字認識プログラム、文字認識システム、及び文字認識方法
JP7497620B2 (ja) 文書データ生成装置、画像形成装置、及び文書データ生成プログラム
KR102352726B1 (ko) 종이로 인쇄된 진료비 영수증을 전자 문서로 변환할 수 있는 전자 장치 및 그 동작 방법
US20240062567A1 (en) Learning Image Generation Apparatus, Learning Image Generation Method, And Non-Transitory Computer-Readable Recording Medium
US20210303843A1 (en) Information processing apparatus

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination