CN101325642B - 信息处理装置及其方法 - Google Patents

信息处理装置及其方法 Download PDF

Info

Publication number
CN101325642B
CN101325642B CN2008101110836A CN200810111083A CN101325642B CN 101325642 B CN101325642 B CN 101325642B CN 2008101110836 A CN2008101110836 A CN 2008101110836A CN 200810111083 A CN200810111083 A CN 200810111083A CN 101325642 B CN101325642 B CN 101325642B
Authority
CN
China
Prior art keywords
information
embedding
mentioned
character
bit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008101110836A
Other languages
English (en)
Other versions
CN101325642A (zh
Inventor
吕玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of CN101325642A publication Critical patent/CN101325642A/zh
Application granted granted Critical
Publication of CN101325642B publication Critical patent/CN101325642B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3872Repositioning or masking

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)
  • Document Processing Apparatus (AREA)

Abstract

一种信息处理装置及其方法,对文档中的各字符嵌入n比特(n为2以上的整数)的信息,该信息处理装置的特征在于,具备:文档输入部,其输入由字符构成的文档;嵌入信息输入部,其输入应该嵌入到文档的嵌入信息;同步信息输入部,其输入由预先设定的比特模式构成的同步信息,其中,该比特模式由多个比特构成;合成部,其将构成所输入的嵌入信息的比特和构成上述同步信息的比特进行合成来生成合成嵌入信息;嵌入部,其对由文档输入部输入的文档中的各字符嵌入由合成部生成的合成嵌入信息,输出嵌入后的文档;以及文档输出部,其中嵌入部对各字符嵌入至少1比特的同步信息。

Description

信息处理装置及其方法
技术领域
本发明涉及一种对文档嵌入信息的技术及提取所嵌入的信息的信息处理装置及其方法。
背景技术
在以字符为单位嵌入水印信息的情况下,在嵌入前需要以一个字符为单位提取外接矩形。但是,例如有时会产生将由偏旁构成的字符分别作为两个字符而提取的提取错误。在这种情况下,如果在产生提取错误的状态下直接嵌入水印信息,在重新提取所嵌入的水印信息时,会导致水印信息偏移。例如,图1A表示本来应该作为外接矩形而提取的字符,设为对该字符嵌入了图1B那样的水印信息。但是,如图1C所示,在提取出外接矩形的情况下,从提取了外接矩形的各个字符提取信息。因此,结果是提取出图1D所示那样的水印信息。在日本专利公开公报特开2004-247883号(文献1)中公开了一种对各字符依次嵌入水印信息和同步信息的技术。
但是,在文献1公开的技术中,不能确定外接矩形提取错误的位置,因此需要对外接矩形多次嵌入水印信息。另外,从产生提取错误的外接矩形起后面的水印信息会全部偏移,因此无法进行参照。
发明内容
因此,本发明的目的在于,检测由于外接矩形的提取错误而引起的嵌入信息的偏移。
本发明提供一种信息处理装置,该信息处理装置对文档中的各字符嵌入n比特(n为2以上的整数)的信息,其特征在于,具备:文档输入单元,其输入由字符构成的文档;嵌入信息输入单元,其输入应该嵌入到上述文档中的嵌入信息;同步信息输入单元,其输入由预先设定的比特模式构成的同步信息,其中,该比特模式由多个比特构成;合成单元,其通过合成构成所输入的嵌入信息的比特与构成上述同步信息的比特来生成合成嵌入信息;以及嵌入单元,其对由上述文档输入单元输入的文档中的各字符嵌入由该合成单元生成的合成嵌入信息,输出嵌入后的文档,上述嵌入单元对各字符嵌入至少1比特的同步信息。
另外,本发明提供一种信息处理装置,该信息处理装置对文档图像中的各字符嵌入n比特(n为2以上的整数)的信息,从将该n比特中的至少1比特作为同步信息而嵌入的文档图像中提取信息,其特征在于,具备:文档图像输入单元,其输入文档图像;合成嵌入信息提取单元,其求出所输入的文档图像中的各字符的外接矩形,提取嵌入在该外接矩形内的字符中的合成嵌入信息;分离单元,其从由该合成嵌入信息提取单元提取出的合成嵌入信息分离为同步信息和嵌入信息;同步信息输入单元,其输入同步信息;以及更正单元,其对由上述分离单元分离的同步信息和由上述同步信息输入单元输入的同步信息进行比较,由此判断上述合成嵌入信息提取单元的提取错误,在判断为存在提取错误的情况下,更正上述合成嵌入信息,使得由上述分离单元分离的同步信息与由上述同步信息输入单元输入的同步信息一致。
另外,本发明提供一种信息处理方法,该信息处理方法对文档中的各字符嵌入n比特(n为2以上的整数)的信息,其特征在于,具备:文档输入过程,输入由字符构成的文档;嵌入信息输入过程,输入应该嵌入到上述文档中的嵌入信息;同步信息输入过程,输入由预先设定的比特模式构成的同步信息,其中,该比特模式由多个比特构成;合成过程,通过合成构成所输入的嵌入信息的比特与构成上述同步信息的比特来生成合成嵌入信息;以及嵌入过程,对由上述文档输入过程输入的文档中的各字符嵌入由该合成过程生成的合成嵌入信息,输出嵌入后的文档,上述嵌入过程对各字符嵌入至少1比特的同步信息。
另外,本发明提供一种信息处理方法,该信息处理方法对文档图像中的各字符嵌入n比特(n为2以上的整数)的信息,从将该n比特中的至少1比特作为同步信息而进行嵌入的文档图像中提取信息,其特征在于,具备:文档图像输入过程,输入文档图像;合成嵌入信息提取过程,求出所输入的文档图像中的各字符的外接矩形,提取嵌入在该外接矩形内的字符中合成嵌入的信息;分离过程,从由该合成嵌入信息提取过程提取的合成嵌入信息分离为同步信息和嵌入信息;同步信息输入过程,输入同步信息;以及更正过程,对由上述分离过程分离的同步信息和由上述同步信息输入过程输入的同步信息进行比较,由此判断上述合成嵌入信息提取过程的提取错误,在判断为存在提取错误的情况下,更正上述合成嵌入信息,使得由上述分离过程分离的同步信息与由上述同步信息输入过程输入的同步信息一致。
根据本发明,能够检测由于外接矩形的提取错误而引起的嵌入信息的偏移。
根据下面(参考附图)的示例说明实施例,本发明的其它特征将显而易见。
附图说明
包含在说明书中并构成说明书的一部分的附图示出本发明的实施例,与说明书一起解释本发明的结构。
图1A至图1D是现有的外接矩形提取处理的说明图。
图2是表示第二实施方式所涉及的信息处理装置(提取处理)的动作过程的流程图。
图3是表示第二实施方式所涉及的步骤S1801的详细动作过程的流程图。
图4是本发明的一个实施方式所涉及的信息处理装置(嵌入处理)的概略结构图。
图5是本发明的一个实施方式所涉及的信息处理装置(提取处理)的概略结构图。
图6是本发明的一个实施方式所涉及的信息处理装置的电气结构图。
图7是表示第一实施方式所涉及的信息处理装置(嵌入处理)的动作过程的流程图。
图8是用于举出具体示例来说明合成部406中的合成处理的图。
图9是用于说明嵌入部407中的合成嵌入信息的嵌入处理的图。
图10是表示第一实施方式所涉及的信息处理装置(提取处理)的动作过程的流程图。
图11是用于举出具体示例来说明合成嵌入信息提取部503中的合成嵌入信息的提取处理的图。
图12是周期7的伪噪声序列的自相关函数的说明图。
图13是用于举出具体示例来说明控制部507中同步错误更正处理的图。
图14是表示第一实施方式所涉及的信息处理装置(提取处理)的动作过程的流程图。
图15是表示第一实施方式的变形例1所涉及的步骤S705的详细动作过程的流程图。
图16A至图16D是第一实施方式的变形例1所涉及的外接矩形错误的说明图。
图17是第一实施方式的变形例1所涉及的外接矩形错误的说明图。
具体实施方式
首先,参照附图来详细说明信息处理装置的整体结构。
[整体结构]
图4是本发明的一个实施方式所涉及的信息处理装置(嵌入处理)的概略结构图。本信息处理装置求出文档中的各字符的外接矩形并对该外接矩形所示的区域内的每个字符嵌入信息。此外,在此设为对一个字符嵌入n比特(n为2以上的整数)的信息。
首先,对由字符构成的文档400进行光学读取,作为文档图像数据输入到文档输入部401之后,在文档解析部402中进行文档400中的外接矩形(字符区域)的提取。接着,对嵌入信息输入部404输入应该嵌入到文档400中的嵌入信息403。其后,对同步信息输入部405输入由预先设定的比特模式构成的同步信息,其中,该比特模式由多个比特构成。其后,在合成部406中将构成所输入的嵌入信息403的n-1比特和同步信息的1比特交替排列来进行合成,由此生成合成嵌入信息。
接着,在嵌入部407中,将由合成部406生成的合成嵌入信息嵌入到由文档输入部401输入的文档400中的字符中,从文档输出部408输出嵌入后的文档409。
此外,嵌入部407具备存储用于对一个字符嵌入n比特的2n个嵌入图案的存储部。另外,嵌入部407具备掩模部,该掩模部按照由合成部406生成的合成嵌入信息中的n比特的值,选择存储在存储部中的嵌入图案的任一个,对嵌入对象的字符的外接矩形内的字符图像进行掩模。
另外,在本实施方式中具备对从嵌入信息输入部404输入的嵌入信息403附加错误更正信息的错误更正信息附加部(未图示)。合成部406将从嵌入信息输入部404的错误更正信息附加部输出的错误更正信息的附加结果和由同步信息输入部405输入的同步信息进行合成。
图5是本发明的一个实施方式所涉及的信息处理装置(提取信息)的概略结构图。本信息处理装置输入文档图像,求出文档图像中的各字符的外接矩形,并提取嵌入到该外接矩形内的字符中的信息。
首先,从文档图像输入部501输入文档图像500。接着,在文档解析部502中求出由文档图像输入部501输入的文档图像500中的各字符的外接矩形,在合成嵌入信息提取部503中提取嵌入到该外接矩形的区域内的字符中的信息。接着,在分离部504中将由合成嵌入信息提取部503提取的合成嵌入信息分离为同步信息和嵌入信息。在此,从合成嵌入信息中交替分离构成嵌入信息的n-1比特和同步信息的1比特。或者,也可以先从合成嵌入信息中提取同步信息,将排除了同步信息后的信息设为嵌入到文档图像500中的嵌入信息。
在同步信息输入部506中输入由预先设定的比特模式构成的同步信息,其中,该比特模式由存储在存储部505中的多个比特构成。错误更正部507通过对由合成嵌入信息提取部503提取的同步信息和由同步信息输入部506输入的同步信息进行比较来判断合成嵌入信息提取部503的提取错误。在此,在判断为存在提取错误的情况下,更正合成嵌入信息,使得由合成嵌入信息提取部503提取的同步信息与由同步信息输入部506输入的同步信息一致。此外,作为合成嵌入信息的更正处理可以举出比特插入、比特删除、以及比特反转等。嵌入信息输出部508输出通过错误更正部507处理后的嵌入信息。
图6是本发明的一个实施方式所涉及的信息处理装置的电气结构图。此外,当实现本发明的信息处理装置时,不一定使用图5所示的所有的功能。
计算机601是通常普及的个人计算机、嵌入系统等通用的信息处理装置。计算机601可以输入从扫描仪617等图像输入装置读取的图像,并进行编辑、保管。另外,也可以从打印机616打印通过图像输入装置得到的图像。此外,根据来自鼠标613、键盘614、触摸面板619等的输入操作来进行来自用户的指示。各模块在计算机601的内部通过总线607连接,因此可以传送各种数据。
CPU 602能够控制计算机601内部的各模块的动作,或者执行存储在内部的程序。主存储装置(由RAM构成)603是为了在CPU 602中进行的处理而临时保存程序、处理对象的图像数据的装置。硬盘(HDD)604是能够预先保存传送到主存储装置603等的程序、图像数据、或者保存处理后的图像数据的装置。
扫描仪接口615与读取原稿、胶片等并生成图像数据的扫描仪617连接,是能够输入通过扫描仪617得到的图像数据的接口。打印机接口608与打印图像数据的打印机616相接,是能够对打印机616发送打印的图像数据的接口。
CD驱动器609是能够读入或写出存储在作为外部存储介质之一的CD(CD-R/CD-RW)中的数据的装置。FDD驱动器611与CD驱动器609同样,是能够读入来自FDD的数据、对FDD写出数据的装置。DVD驱动器610与FDD驱动器611同样,是能够读入来自DVD的数据、对DVD写出数据的装置。此外,在CD、FDD、DVD等中存储有程序的情况下,将这些程序安装到HDD604中,根据需要传送到主存储装置603。
输入接口612是用于接受来自鼠标613、键盘614的输入指示而连接的接口。触摸面板接口618是用于接受来自触摸面板619的输入指示而连接的接口。另外,监视器606是能够显示嵌入信息的提取处理结果、处理过程的显示装置。并且,视频控制器605是用于对监视器606发送显示数据的装置。
此外,本发明可以应用到由多个设备(例如,主计算机、接口设备、读出器、打印机等)构成的系统中,也可以应用到由一个设备构成的MFP中。
在上述结构中,由CPU 602等执行载入到主存储装置603中的程序,由此作为信息处理装置而发挥功能。
接着,在各实施方式中具体说明在具备上述的结构的信息处理装置中进行的各处理。
<第一实施方式>
图7是表示第一实施方式所涉及的信息处理装置的动作过程的流程图,图8是用于举出具体示例来说明合成部406中的嵌入信息生成处理的图。
首先,通过扫描仪617等文档输入部401对文档解析部402输入成为嵌入信息的嵌入对象的文档400(步骤S701)。文档400也可以是将打印材料从扫描仪617等输入并将其位图化而得到的内容。另外,也可以是通过图像处理软件等对各种电子数据进行转换并位图化而得到的内容。此外,各种电子数据被保存在与图6的硬盘604、CD驱动器609、DVD驱动器610、FDD驱动器611等连接的各存储介质中。
接着,在文档解析部402中进行输入到文档输入部401的文档400的外接矩形(字符区域)的提取(步骤S702)。此外,字符的外接矩形本来是指示进行字符识别的区域的信息,但是在向文档嵌入信息的技术或者提取所嵌入的信息的技术中,表示成为嵌入操作对象的字符区域。具体地说,将文档图像的各像素值对垂直坐标轴进行投影,搜索空白部分(没有有效像素的部分),对行进行辨别,并进行行分割。其后,以行为单位将文档400对水平坐标轴进行投影,搜索空白部分并以字符为单位进行分割。由此,可以在外接矩形内切出各字符。
接着,从键盘614等嵌入信息输入部404输入应该嵌入到文档400中的嵌入信息403(步骤S703)。也可以从预先存储在存储装置中的信息中选择嵌入信息403。
接着,根据由嵌入信息输入部404输入的嵌入信息生成错误更正代码(步骤S704)。例如,如图8所示,根据嵌入信息801生成错误更正代码802。
接着,在合成部406中生成对嵌入信息并列附加同步信息的合成嵌入信息(步骤S705)。例如,如图8所示,合成嵌入信息805是对嵌入信息801并列嵌入同步信息803而成的信息。在对一个字符嵌入2比特的信息的情况下,嵌入信息的一个块(例如,图8的804)由1比特的嵌入信息和1比特的同步信息构成。在对一个字符嵌入n比特(n>1)的信息的情况下,嵌入信息的一个块由n-1比特的嵌入信息和1比特的同步信息构成。由此,能够依次对每个字符嵌入1比特同步信息。
此外,同步信息只要是周期为N(N>1)的任意的代码即可。在本实施方式中,作为同步信息而嵌入伪噪声序列。图8所示的同步信息803表示周期为7的伪噪声序列。
接着,读入一个在步骤S702中提取出的外接矩形(步骤S706),通过嵌入部407对该外接矩形内的字符嵌入合成嵌入信息(步骤S707)。对所读入的外接矩形嵌入图8所示的一个块的合成嵌入信息。
图9是嵌入部407中的合成嵌入信息的嵌入处理的说明图。本处理中使用4种不同的嵌入图案(在此是点阵图)来对字符嵌入合成嵌入信息。例如,对字符嵌入合成嵌入信息“00”(以2进制数表示)时,用点阵图0(图9所示的900)构成字符(图9所示的910)。对字符嵌入合成嵌入信息“01”时,由点阵图1(图9所示的901)构成字符(图9所示的911)。对字符嵌入合成嵌入信息“10”时,由点阵图2(图9所示的902)构成字符(图9所示的912)。对字符嵌入合成嵌入信息“11”,由点阵图3(图9所示的903)构成字符(图9所示的913)。另外,当不对字符的轮廓嵌入点阵图时,容易识别字符本身,因此优选。此外,只要点阵图具有相同的浓度、彼此的相互相关较低即可,也可以不是图9示出的图案。在此,示出了使用了点阵图的示例,但是,只要是对一个字符嵌入n比特(n为2以上的整数)的嵌入方式即可,也可以不是点阵图。例如,也可以使字符的浓淡多级变化、或者使用色彩、图案、花纹。
接着,判断关注外接矩形是否为文档400中的最终的外接矩形(步骤S708)。在步骤S708中判断为该关注外接矩形不是最终的外接矩形的情况下,返回步骤S706,读入下一个外接矩形。另一方面,在步骤S708中判断为是最终的外接矩形的情况下,生成嵌入了合成嵌入信息后的文档409(步骤S709)。如图4所示,从文档输出部408输出嵌入了该信息的文档409。此外,能够通过打印机中的打印、作为图像数据而存储到存储装置等中、或者从网络等向其它终端等进行发送等各种方式来进行文档输出部408中的输出。
图10是表示第一实施方式所涉及的信息处理装置(提取处理)的动作过程的流程图,图11是用于举出具体示例来说明合成嵌入信息提取部503中的合成嵌入信息提取处理的图。
首先,通过文档图像输入部501对文档解析部502输入文档图像(步骤S1001),从文档图像提取外接矩形之后,进行字符切出(步骤S1002)。该处理是与进行嵌入处理的信息处理装置的文档解析部402相同的处理。
接着,提取对每个字符嵌入的合成嵌入信息(步骤S1003)。能够通过在合成嵌入信息提取部503中检测对外接矩形嵌入的嵌入图案(点阵图)来提取合成嵌入信息。在本实施方式中,从一个外接矩形提取2比特的信息。例如,在图11中,从字符串“ABC…”提取合成嵌入信息1101,从字符“A”提取了合成嵌入信息“10”,由此可知嵌入信息为“1”。接着,在分离部504中,从提取出的合成嵌入信息中取出同步信息(步骤S1004)。例如,如图11所示,取出同步信息1102。这是依次从合成嵌入信息的各块取出1比特并排列而成的信息。
接着,在错误更正部507中对由分离部504分离的同步信息和由同步信息输入部506输入的同步信息进行比较,由此检测错误位置(步骤S1005)。例如,如图11所示,在输入后的同步信息为“0110100…”、分离后的同步信息为“01100100…”的情况下,通过两者的比较可知提取信息中的第三个和第四个产生了错误。
此外,在本实施方式中,以伪噪声序列(PN序列)来表现同步信息,因此也可以通过提取同步信息的相互相关来检测同步错误位置。伪噪声序列是具有Paa(k)=1(k=0),-1/n(0<k<n)的自相关函数的序列。图12是周期7的伪噪声序列的自相关函数的说明图。在使用该自相关函数的情况下,在同步信息中没有产生错误的情况下,求出的相互相关值成为1或-1/7,而在同步信息中产生错误的情况下,相互相关值成为1或-1/7以外的值,因此,能够容易地发现错误位置。
在步骤S1005中,在检测出同步错误的情况下,进入步骤S1006。在错误更正部507中,更正检测出的错误位置的同步信息。此外,在同步错误更正的种类中,存在比特的插入、删除、反转。对分离得到的同步信息进行更正,使得所输入的同步信息和分离得到的同步信息一致。结果是在将字符的偏旁分离并提取外接矩形的情况下,删除错误位置的比特。另外,在将字符与字符结合并提取外接矩形的情况下,插入比特。
图13是用于举出具体示例来说明错误更正部507中的同步错误更正处理的图。设字符为“ABC”,嵌入信息为“S”,同步信息为“X”。其中,字符“B”在外接矩形的提取中被识别为两个字符,虽然不是分离的字符,但是在此设为在外接矩形的提取中作为两个字符来进行提取。在1301中,在检测出同步错误位置1302的情况下,进行同步错误更正(图13所示的1303)。在此,产生了1比特插入错误,因此删除错误位置的1比特的同步信息。接着,通过同步错误更正来更正嵌入信息的位置(图13所示的1304)。根据这种同步错误更正处理来更正嵌入信息的同步错误。
在步骤S1006中,当同步错误更正结束时,返回步骤S1005,检测下一个同步错误位置。另一方面,在步骤S1005中,在没有检测出同步错误位置的情况下,对由分离部504分离的嵌入信息进行错误更正(步骤S1007)。通过错误更正部507执行该处理,根据错误更正代码进行更正。接着,在嵌入信息输出部508中,输出嵌入信息(步骤S1008),结束处理。
此外,也可以使用通常的GMD(Generalized MinimumDistance decoding:广义最小距离译码)法,按照接收到的各码元的可靠度来使用,由此提高译码的可靠性。该可靠度基于以下想法:以往判断为存在提取错误的位置是容易产生提取错误的部位。对提取出的嵌入信息分别附加可靠度(例如,R=1),根据该可靠度R来对嵌入信息进行错误更正。也可以在对嵌入信息位进行了同步错误更正的情况下,将可靠度R设定为较低。例如,设更正后的可靠度为R(n),更正前的可靠度为R(n-1),如R(n)=R(n-1)*0.8所示,在对嵌入信息进行了错误更正的情况下,可以将可靠度设定为更正前的80%。另外,在字符的字体较小的情况下,字符面积较小,嵌入信息的提取率恶化,因此也可以将嵌入信息的可靠度和字符面积联动。另外,也可以将从字符提取出的点阵图的类似度和嵌入信息的可靠度联动。
此外,在检测出同步错误的情况下,也可以对字符解析部502通知错误位置,重新进行矩形提取。在此,利用图14所示的流程图来进行说明。在步骤S1005中,在检测出同步错误的情况下,也可以对字符解析部502通知错误位置,再次进行外接矩形的提取。此外,省略与上述的处理相同的从步骤S1001至步骤S1004的说明。在步骤S1005中,在检测出同步错误位置的情况下,返回步骤S1002。接着,利用错误位置的位置信息来更正外接矩形(步骤S1002),再次提取更正位置的合成嵌入信息(步骤S1003)。由此,在产生字符切出错误的情况下,也能够正确地提取嵌入信息。
此外,在本实施方式中,示出了在一个字符中嵌入构成嵌入信息403的n-1比特和构成同步信息的1比特的示例,但是不限于此。例如,也可以在一个字符中嵌入2比特的同步信息。也就是说,只要在一个字符中嵌入至少1比特同步信息即可。并且,在生成合成嵌入信息的方法中也示出了将构成同步信息的1比特合成在构成嵌入信息的n-1比特的后面的示例,但是不限于此。例如,也可以是嵌入信息的前面、嵌入信息之间,只要能够共用提取侧和同步信息的位置即可。
<第一实施方式-变形例1>
在本变形例中进一步进行研究,使得能够根据字符大小来选择嵌入的同步信息。此外,除嵌入信息嵌入处理的步骤S705以外都与第一实施方式相同,因此省略说明。
本变形例所涉及的信息处理装置(嵌入处理)的结构除了在共同结构中说明的结构(图4)以外,还具备比特模式存储部,其存储第一周期的比特模式和比第一周期长的第二周期的比特模式。另外,具备检测部,其检测嵌入对象的字符的外接矩形的大小。还具备选择部,该选择部在由检测部检测出的外接矩形的面积大于预先设定的阈值的情况下选择第一周期的比特模式,在外接矩形的面积小于预先设定的阈值的情况下选择第二周期的比特模式。比特模式输入部输入由选择部选择的比特模式。
在此,详细说明同步信息的选择方法。图15是表示第一实施方式的变形例1的步骤S705的详细动作过程的流程图,图16及图17是第一实施方式的变形例1所涉及的外接矩形错误的说明图。
首先,算出一个字符的外接矩形面积(步骤S705a)。该外接矩形面积可以从在步骤S702中算出的外接矩形信息算出。此外,当算出外接矩形的面积时,可以仅从文档图像的最初字符算出外接矩形面积,也可以算出整个文档图像的外接矩形面积的平均。另外,可以仅提取各段落的最初字符来算出外接矩形面积的平均,也可以从在文档图像中随机选择的字符来算出外接矩形面积。
接着,比较所算出的外接矩形面积是否大于任意的阈值M。此外,用户能够预先任意决定阈值M。在外接矩形面积大于阈值M的情况下,选择周期较短(第一周期)的同步信息(步骤S705c)。例如,可以利用周期为2的同步信息“0101…”。这是由于在外接矩形的面积较大的情况下仅产生了将偏旁分离为两个的矩形提取错误(图16C所示的字符“静”)。用周期较短的同步信息也能够容易地发现这种矩形提取错误。
另一方面,在外接矩形的面积小于阈值M的情况下,选择周期比第一周期长(第二周期)的同步信息(步骤S705d)。如图17所示,这是由于在外接矩形的面积较小的情况下容易产生跨越多个字符的矩形提取错误。接着,将所选择的同步信息附加到嵌入信息中(步骤S705e)。
此外,通过执行步骤S705a,能够在提取嵌入信息时容易地判断所嵌入的同步信息的种类。
<第二实施方式>
在本实施方式中进一步进行研究,使得能够容易地判断所输入的文档图像是否是嵌入了嵌入信息的文档图像。在本实施方式中,在嵌入信息提取处理中,仅对第一实施方式追加了部分处理,因此对共用的部分附加共用的附图标记,省略说明。
图2是表示第二实施方式所涉及的信息处理装置(提取处理)的动作过程的流程图,图3是表示第二实施方式所涉及的步骤S1801的详细动作过程的流程图。
首先,读取文档图像(步骤S1001),提取所读取的文档图像的外接矩形(步骤S1002)。接着,算出所提取的同步信息与所嵌入的同步信息之间的相互相关值(步骤S1801),判断是否存在正确的相互相关值(步骤S1802)。在步骤S1802中判断为存在正确的相互相关值的情况下,判断为在该文档图像中嵌入了嵌入信息,用与第一实施方式相同的过程提取嵌入信息。另一方面,在步骤S1802中判断为没有正确的相互相关值的情况下,判断为在该文档图像中没有嵌入嵌入信息,结束嵌入信息提取处理。此外,在本实施方式中,在判断为至少一个位置的相互相关值正确的情况下,判断为在文档图像中嵌入有嵌入信息。
在此,使用图3来说明步骤S1801的相互相关值的算出过程。首先,取出连续的外接矩形(步骤S1801a)。此外,取出的外接矩形的数量设为例如最小同步信息的周期的两倍。另外,也可以从文档图像的任意位置取出外接矩形。
接着,从取出的外接矩形提取同步信息(步骤S1801b),算出所提取的同步信息与所嵌入的同步信息之间的相互相关值(步骤S1801c)。此外,在嵌入了嵌入信息的文档图像中嵌入有伪噪声序列,因此正确情况下的相互相关值为1或-1/N。
<其它实施方式>
对装置提供记录有实现上述实施方式的功能的软件的程序代码的记录介质(或存储介质),该装置的计算机读取并执行保存在记录介质内的程序代码,由此也可以实现本发明的目的。此外,在计算机中包含CPU、MPU。在这种情况下,从记录介质读出的程序代码(计算机程序)本身就可以实现上述实施方式的功能,记录了该程序代码的记录介质(计算机可读存储介质)构成本发明。
另外,包含如下情况:根据计算机读出的程序代码的指示,在计算机中运行的操作系统(OS)等执行一部分或全部实际处理,由此实现上述实施方式的功能。
还包含如下情况:将从记录介质读出的程序代码写入插入到计算机中的功能扩展卡、连接在计算机上的功能扩展单元所具备的存储器中,其后,根据程序代码的指示,在该功能扩展卡、功能扩展单元中所具备的CPU等执行一部分或全部实际处理,由此实现上述的实施方式的功能。
在将本发明应用到上述记录介质的情况下,在该记录介质中保存与上述说明的流程图对应的程序代码。
此外,在上述的实施方式中,在合成嵌入信息中附加了错误更正代码,但是,在本发明中不一定附加错误更正代码。
参考具体实施例说明了本发明,但是,本发明不局限于已经公开的具体实施例。所附权利要求书的范围符合最宽的解释,以包含所有这类修改、等同结构和功能。

Claims (8)

1.一种信息处理装置,对文档中的各字符嵌入n比特的信息,其中n为2以上的整数,其特征在于,具备:
文档输入单元,其输入由字符构成的文档;
嵌入信息输入单元,其输入要嵌入到上述文档中的嵌入信息;
同步信息输入单元,其输入由预先设定的比特模式构成的同步信息,其中,该比特模式由多个比特构成;
合成单元,其将构成所输入的嵌入信息的比特和构成上述同步信息的比特进行合成来生成合成嵌入信息;以及
嵌入单元,其对由上述文档输入单元输入的文档中的各字符嵌入由该合成单元生成的合成嵌入信息,输出嵌入后的文档,上述嵌入单元对各字符嵌入至少1比特的同步信息。
2.根据权利要求1所述的信息处理装置,其特征在于,
上述嵌入单元具有:
存储单元,其存储2n个嵌入图案;以及
掩模单元,其按照由上述合成单元生成的上述合成嵌入信息中的n比特的值,选择存储在上述存储单元中的嵌入图案中的任一个,对嵌入对象的字符的外接矩形内的字符图像进行掩模。
3.根据权利要求1所述的信息处理装置,其特征在于,还具备:
比特模式存储单元,其存储第一周期的比特模式和比该第一周期长的第二周期的比特模式;
检测单元,其检测嵌入对象的字符的外接矩形的大小;
选择单元,其在该检测单元检测出的外接矩形的面积大于预先设定的阈值的情况下选择上述第一周期的比特模式,在上述外接矩形的面积为上述预先设定的阈值以下的情况下选择上述第二周期的比特模式;以及
比特模式输入单元,其输入由上述选择单元选择的比特模式。
4.根据权利要求1所述的信息处理装置,其特征在于,
还具备错误更正信息附加单元,该错误更正信息附加单元对由上述嵌入信息输入单元输入的上述嵌入信息附加错误更正信息,
上述合成单元将由上述错误更正信息附加单元附加上述错误更正信息的附加结果和由上述同步信息输入单元输入的同步信息进行合成。
5.一种信息处理装置,从对文档图像中的各字符嵌入n比特的信息、该n比特中至少1比特被作为同步信息而嵌入的文档图像中提取信息,其中n为2以上的整数,其特征在于,具备:
文档图像输入单元,其输入文档图像;
合成嵌入信息提取单元,其求出所输入的文档图像中的各字符的外接矩形,提取嵌入到该外接矩形内的字符的合成嵌入信息;
分离单元,其将由该合成嵌入信息提取单元提取的合成嵌入信息分离为同步信息和嵌入信息;
同步信息输入单元,其输入同步信息;以及
更正单元,其对由上述分离单元分离得到的同步信息和由上述同步信息输入单元输入的同步信息进行比较,由此判断上述合成嵌入信息提取单元的提取错误,在判断为存在提取错误的情况下,更正上述合成嵌入信息,使得由上述分离单元分离得到的同步信息与由上述同步信息输入单元输入的同步信息一致。
6.根据权利要求5所述的信息处理装置,其特征在于,
由上述同步信息输入单元输入的同步信息是伪噪声序列。
7.一种信息处理方法,对文档中的各字符中嵌入n比特的信息,其中n为2以上的整数,该信息处理方法的特征在于,具备:
文档输入过程,输入由字符构成的文档;
嵌入信息输入过程,输入应该嵌入到上述文档的嵌入信息;
同步信息输入过程,输入由预先设定的比特模式构成的同步信息,其中,该比特模式由多个比特构成;
合成过程,将构成所输入的嵌入信息的比特和构成上述同步信息的比特进行合成来生成合成嵌入信息;以及
嵌入过程,对由上述文档输入过程输入的文档中的各字符嵌入由该合成过程生成的合成嵌入信息,输出嵌入后的文档,
上述嵌入过程对各字符嵌入至少1比特的同步信息。
8.一种信息处理方法,从对文档图像中的各字符嵌入n比特的信息、该n比特中的至少1比特被作为同步信息而嵌入的文档图像中提取信息,其中n为2以上的整数,该信息处理方法特征在于,具备:
文档图像输入过程,输入文档图像;
合成嵌入信息提取过程,求出所输入的文档图像中的各字符的外接矩形,提取嵌入到该外接矩形内的字符中的合成嵌入信息;
分离过程,将由该合成嵌入信息提取过程提取的合成嵌入信息分离为同步信息和嵌入信息;
同步信息输入过程,输入同步信息;以及
更正过程,对由上述分离过程分离得到的同步信息和由上述同步信息输入过程输入的同步信息进行比较,由此判断上述合成嵌入信息提取过程的提取错误,在判断为存在提取错误的情况下,更正上述合成嵌入信息,使得由上述分离过程分离得到的同步信息与由上述同步信息输入过程输入的同步信息一致。
CN2008101110836A 2007-06-15 2008-06-13 信息处理装置及其方法 Expired - Fee Related CN101325642B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2007159492A JP4871793B2 (ja) 2007-06-15 2007-06-15 情報処理装置及びその方法
JP2007159492 2007-06-15
JP2007-159492 2007-06-15

Publications (2)

Publication Number Publication Date
CN101325642A CN101325642A (zh) 2008-12-17
CN101325642B true CN101325642B (zh) 2010-08-25

Family

ID=40188950

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008101110836A Expired - Fee Related CN101325642B (zh) 2007-06-15 2008-06-13 信息处理装置及其方法

Country Status (3)

Country Link
JP (1) JP4871793B2 (zh)
KR (1) KR100938539B1 (zh)
CN (1) CN101325642B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102081736B (zh) * 2009-11-27 2014-11-26 株式会社理光 从可移植电子文档中提取字符外接矩形的设备和方法
JP5906788B2 (ja) * 2012-02-17 2016-04-20 オムロン株式会社 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1584929A (zh) * 2004-06-10 2005-02-23 上海交通大学 基于图像连通性的自适应同步水印方法
CN1738353A (zh) * 2005-08-16 2006-02-22 北京交通大学 一种抵抗旋转伸缩和位移攻击的数字水印技术

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004247883A (ja) 2003-02-12 2004-09-02 Canon Inc 画像処理方法
JP4232676B2 (ja) 2004-04-05 2009-03-04 沖電気工業株式会社 情報検出装置,画像処理システム,および情報検出方法
JP2006050551A (ja) 2004-06-30 2006-02-16 Canon Inc 画像処理装置及びその方法、並びにプログラム及び記憶媒体
JP4324058B2 (ja) * 2004-08-31 2009-09-02 キヤノン株式会社 画像処理装置及びその方法
JP4532331B2 (ja) * 2004-12-08 2010-08-25 株式会社リコー 情報埋め込み装置、情報抽出装置、情報埋め込み方法、情報抽出方法、情報埋め込みプログラム、及び情報抽出プログラム
JP4310288B2 (ja) * 2005-04-12 2009-08-05 キヤノン株式会社 画像処理装置及びその方法、プログラム並びに記憶媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1584929A (zh) * 2004-06-10 2005-02-23 上海交通大学 基于图像连通性的自适应同步水印方法
CN1738353A (zh) * 2005-08-16 2006-02-22 北京交通大学 一种抵抗旋转伸缩和位移攻击的数字水印技术

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JP特开2004-247883A 2004.09.02
JP特开2005-295458A 2005.10.20
JP特开2006-050551A 2006.02.16

Also Published As

Publication number Publication date
JP4871793B2 (ja) 2012-02-08
KR100938539B1 (ko) 2010-01-25
KR20080110532A (ko) 2008-12-18
JP2008312063A (ja) 2008-12-25
CN101325642A (zh) 2008-12-17

Similar Documents

Publication Publication Date Title
US5765176A (en) Performing document image management tasks using an iconic image having embedded encoded information
US5761686A (en) Embedding encoded information in an iconic version of a text image
US8391607B2 (en) Image processor and computer readable medium
US7481374B2 (en) System and method for placement and retrieval of embedded information within a document
JP2000099257A5 (zh)
CN103995816B (zh) 信息处理设备和信息处理方法
TW200407796A (en) Character recognition apparatus and method
US9171218B2 (en) Image processing apparatus, image processing method, and computer readable medium that recognize overlapping elements in handwritten input
CN101201936B (zh) 信息处理装置以及信息处理装置的控制方法
JP2004180277A (ja) 電子透かし埋め込み方法、電子透かし抽出方法、それらの装置及びプログラム並びに記憶媒体
JP2011070558A (ja) 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
CN101833747A (zh) 一种生成基于数字水印的安全字库的方法及系统
CN101325642B (zh) 信息处理装置及其方法
US7596270B2 (en) Method of shuffling text in an Asian document image
CN1896997B (zh) 字符串检索装置
JP2013254321A (ja) 画像処理装置、画像処理方法及びプログラム
JP4916950B2 (ja) 動画像比較装置、動画像比較方法、及び動画像比較プログラム
JP2009198816A (ja) 情報隠蔽システム、装置及び方法
US8649055B2 (en) Image processing apparatus and computer readable medium
JP6926279B1 (ja) 学習装置、認識装置、学習方法、認識方法、プログラム、及び再帰型ニューラルネットワーク
JP4516629B2 (ja) パターン検出プログラム、パターン検出方法およびパターン検出装置
JP2007304890A (ja) 2次元コードの読取り方法、及び、電子文書作成装置
KR20100067316A (ko) 문서식별자의 삽입방법 및 그의 해독방법
JP2004247883A (ja) 画像処理方法
JP2010020421A (ja) 文字認識装置、文字認識方法、コンピュータプログラム、記憶媒体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100825

Termination date: 20190613