CN110012190B - 图像处理装置 - Google Patents
图像处理装置 Download PDFInfo
- Publication number
- CN110012190B CN110012190B CN201811493374.6A CN201811493374A CN110012190B CN 110012190 B CN110012190 B CN 110012190B CN 201811493374 A CN201811493374 A CN 201811493374A CN 110012190 B CN110012190 B CN 110012190B
- Authority
- CN
- China
- Prior art keywords
- text
- file
- image
- document
- regions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012545 processing Methods 0.000 title claims abstract description 38
- 230000006870 function Effects 0.000 claims abstract description 15
- 238000013519 translation Methods 0.000 claims abstract description 13
- 238000004891 communication Methods 0.000 claims description 18
- 239000000284 extract Substances 0.000 claims description 17
- 238000000034 method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000009432 framing Methods 0.000 description 7
- 238000012546 transfer Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/03—Arrangements for converting the position or the displacement of a member into a coded form
- G06F3/041—Digitisers, e.g. for touch screens or touch pads, characterised by the transducing means
- G06F3/0412—Digitisers structurally integrated in a display
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/0482—Interaction with lists of selectable items, e.g. menus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/12—Digital output to print unit, e.g. line printer, chain printer
- G06F3/1201—Dedicated interfaces to print systems
- G06F3/1223—Dedicated interfaces to print systems specifically adapted to use a particular technique
- G06F3/1237—Print job management
- G06F3/1244—Job translation or job parsing, e.g. page banding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/12—Digital output to print unit, e.g. line printer, chain printer
- G06F3/1201—Dedicated interfaces to print systems
- G06F3/1223—Dedicated interfaces to print systems specifically adapted to use a particular technique
- G06F3/1237—Print job management
- G06F3/125—Page layout or assigning input pages onto output media, e.g. imposition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K15/00—Arrangements for producing a permanent visual presentation of the output data, e.g. computer output printers
- G06K15/02—Arrangements for producing a permanent visual presentation of the output data, e.g. computer output printers using printers
- G06K15/18—Conditioning data for presenting it to the physical printing elements
- G06K15/1835—Transforming generic data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/418—Document matching, e.g. of document images
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00132—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture in a digital photofinishing system, i.e. a system where digital photographic images undergo typical photofinishing processing, e.g. printing ordering
- H04N1/00185—Image output
- H04N1/00188—Printing, e.g. prints or reprints
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/0035—User-machine interface; Control console
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/0035—User-machine interface; Control console
- H04N1/00498—Multi-lingual facilities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00795—Reading arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/51—Translation evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0077—Types of the still picture apparatus
- H04N2201/0094—Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Processing Or Creating Images (AREA)
Abstract
在图像处理装置中,带有控制单元的功能,其具备检索部,用于检索具有不同种类语言的文本的第一文件和第二文件;翻译部,用于将第二文件的文本翻译为与其相应的第一文件的文本相同的语言种类,并创建所述的第二文件的翻译文本;比较部,用于将第一文件的文本与第二文件的翻译文本进行比较,检测出第一文件的文本与第二文件的文本之间的差异;输出部,在将通过比较部检测出的差异记录在第一文件的文本或者第二文件的文本的状态下,创建第一文件的文本和第二文件的文本组合在一起的图像,并执行输出创建的图像的处理操作。通过上述的图像处理装置,能够比较彼此不同种类语言的文本,检测出各个文本内容之间的差异,并使这种差异可清晰地输出。
Description
技术领域
本发明涉及一种具有文本翻译功能的图像处理装置,特别地,涉及用于比较由不同种类的语言组成的各个文本的技术。
背景技术
例如,已知的技术是,通过机器翻译编辑翻译文本来创建翻译文本时,检测和呈现原始句子中可能没有翻译的单词。
此外,众所周知的技术是,除了打印图像之外,如果上述的图像中包含的字符等存在例如语法错误的情况下,检测出上述的错误,并将上述的错误附加到输出图像并指出来。
并且,已知一种对多个翻译结果中所包括的单词或者单词串的对应关系进行对照、比较和组合的技术。
发明内容(Summary)
在此,如果将一个文本翻译成与上述的文本不同的语言,并且将各个语言的文本存储在各个文件中,则使用不同语言的各个用户就可以通过选择适宜的文件来阅读实质上相同内容的文本。
但是,如果各个文件的任何文本进行了更新但其他文件的文本尚未更新,则各个文件的文本将不同,并且各个文件的文本内容将不会保持一致。在这种情况下,就希望能够检测出上述的差异。
然而,一般而言,还没有用于比较不同种类语言的文本并检测出两种文本之间的差异的技术。
本发明是鉴于上述的情况作出的,其目的在于比较不同种类语言的文本,检测出各个文本内容之间的差异,并使这种差异可清晰地输出。
本发明的一方面所涉及的图像处理装置,具备控制单元功能,其包括检索部,其含有处理器,所述检索部用于通过上述的处理器执行控制程序,检索具有不同种类语言的文本的第一文件和第二文件;翻译部,用于将所述的第二文件的文本翻译为与相应所述的第一文件的文本相同的语言种类,并创建所述的第二文件的翻译文本;比较部,用于将所述的第一文件的文本与所述的第二文件的翻译文本进行比较,并根据所述的比较结果检测出所述的第一文件的文本与所述的第二文件的文本之间的差异;输出部,在将通过所述的比较部检测出的所述的差异记录在所述的第一文件的文本或者所述的第二文件的文本的状态下,创建所述的第一文件的文本和所述的第二文件的文本组合在一起的图像,并执行输出所述的创建图像的处理操作。
通过本发明,能够比较不同种类语言的文本,检测出各个文本内容之间的差异,并使这种差异可清晰地输出。
附图说明
图1所示的是,表示适用于本发明的图像处理装置的一个实施方式的图像形成装置的剖视图。
图2所示的是,表示本实施方式的图像形成装置的主要内部结构的框图。
图3所示的是,存储在第一文件中的原始图像和存储在第二文件中的原始图像的一个例子示意图。
图4所示的是,存储在第一文件中的原始图像和存储在第二文件中的原始图像的其他例子示意图。
图5A所示的是,第一文件的各个日文文本和第二文件的各个英文文本交替组合的状态的示意图。
图5B所示的是,第一文件的各个日文文本和第二文件的各个英文文本交替组合的状态的其他例子的示意图。
图6所示的是,存储在第一文件中的原始图像和存储在第二文件中的原始图像的其他例子示意图。
图7所示的是,存储在第一文件中的原始图像和存储在第二文件中的原始图像的另一个其他例子示意图。
图8A所示的是,检索第一文件以及第二文件,并检测出第一文件的文本与第二文件的文本之间的差异并输出的处理过程的流程示意图。
图8B所示的是,示出了图8A之后的处理过程的流程示意图。
图9所示的是,显示在显示部上的语言组合模式的选择界面的示意图。
图10所示的是,显示在显示部上的语言组合模式的设置界面的示意图。
图11所示的是,显示在显示部上的语言组合模式的设置界面的其他例子示意图。
图12所示的是,仅显示第一文件的各个日文文本和第二文件的各个英文文本中的记录着差异的文本的图像的示意图。
具体实施方式
接下来,将参照说明书附图对本发明的一个实施方式进行说明。
图1所示的是,表示适用于本发明的图像处理装置的一个实施方式的图像形成装置的剖视图。图像形成装置10例如是具有诸如复印功能、打印功能、扫描功能和传真功能之类的多种功能的MFP(多功能复合机)。所述图像形成装置10包括图像读取部11和图像形成部12。
所述图像读取部11具有用于光学地读取文档图像的扫描仪,并将从上述的扫描仪的图像传感器输出的模拟信号转换为数字信号,并产生表示文档图像的图像数据。
所述图像形成部12,其用于将图像读取部11所产生的图像数据或者从外部接收来的图像数据所表示的图像打印在记录纸上,具有品红色的图像形成单元3M、青色的图像形成单元3C、黄色的图像形成单元3Y以及黑色的图像形成单元3Bk。在各个图像形成单元3M、3C、3Y以及3Bk的任何一个上,通过均匀地对感光鼓4的表面充电,使所述感光鼓4的表面曝光,在感光鼓4的表面上形成静电潜像,将感光鼓4的表面上的静电潜像显影成调色剂图像,并将感光鼓4的表面上的调色剂图像转印到中间转印带5上。通过上述的方式,在中间转印带5上形成彩色调色剂图像(图像)。上述的彩色调色剂图像被二次转印到在中间转印带5和二次转印辊6之间的夹持区域N中的从供纸部7通过传送路径8传送来的记录纸P上。
之后,通过定影装置15对记录纸P进行加热和加压,通过热压定影来固定记录纸P上的调色剂图像,并且记录纸P通过排出辊对16被排出到排出托盘17上。
图2所示的是,表示图像形成装置10的主要内部结构的功能性示意框图。如图2所示的所述图像形成装置10具备控制单元31、显示部32、操作部34、触摸面板35、网络通信部36、传真通信部37、存储部38、图像存储器39、图像读取部11以及图像形成部12等。这些组件能够通过总线相互发送/接收数据或者信号。
所述显示部32诸如由液晶显示器(LCD:液晶显示器)或者有机EL(OLED:有机发光二极管)显示器之类的组成。
所述操作部34包括例如用于在显示部32上显示的GUI中移动焦点的箭头键、用于对GUI执行确认操作的确定键、以及开始键等。操作部34起到输入用户指令的操作部的作用。
所述触摸面板35覆盖在显示部32的屏幕上。触摸面板35是诸如所谓的电阻膜型或者电容型之类的触摸面板,通过同时检测到用户的手指等对于触摸面板35的接触(触摸)以及上述的接触的位置,对显示部32的界面上的GUI等输入用户的指示。因此,触摸面板35起到通过用户对于显示部32的界面的操作来输入用户指令的操作部的作用。
所述网络通信部36通过网络向其他的终端设备(图中未示出)发送和接收各种数据。传真通信部37通过网络向另一图像形成装置或者传真装置(图中未示出)等发送和接收图像数据。网络通信部36起到经由网络与终端设备进行通信的通信部的作用。
所述存储部38由大容量的SSD(固态驱动器)或者HDD(硬盘驱动器)等组成,并存储各种数据和程序。
所述图像存储器39临时存储表示由图像读取部11读取的文档图像的图像数据、由控制部41从存储部38读取的图像数据、以及由网络通信部36接收到的图像数据等。
所述控制单元31包括处理器、RAM(随机存取存储器)、以及ROM(只读存储器)等。处理器是CPU(中央处理单元)、MPU、或者ASIC之类。控制单元31包括控制部41、显示控制部42、通信控制部43、检索部44、布局分析部45、翻译部46、比较部47以及输出部48,上述的结构组成,通过由上述的处理器执行存储在上述的ROM或者存储部38中的程序来发挥作用,或者分别由硬件电路构成。
所述控制部41执行图像形成装置10的整体操作控制。显示控制部42控制显示部32以及在显示部32上显示上述的GUI或者各种信息等。通信控制部43具有控制网络通信部36和传真通信部37的通信操作的作用。
所述检索部44从存储部38中检索出由操作部34或者触摸面板35的操作所指定的文件或者与上述的指定的文件相关联的另一文件,并读取出上述的文件。另外,检索部44通过通信控制部43和网络通信部36从网络上的存储器中搜索并获取这些文件。网络上的存储器由服务器、工作站、或者PC等提供。
所述布局分析部45对由图像存储器39中的图像数据所表示的文档图像执行布局分析等操作,以确定上述的文档图像中的文本区域、图像区域、或者表格区域等。此外,布局分析部45从文本区域中提取出字符文本。
存储有用于模式匹配的多个字符模式的字符数据库(DB)存储在存储部38中。布局分析部45通过字符识别(OCR)技术,从文本区域将文本区域中包括的各个图像从文本区域转换为字符文本。此外,由于在字符数据库(DB)中为多种语言分别地登记各个字符模式,因此布局分析部45基于转换的字符文本,来判断上述的字符文本所表示的字符的语言类型。在下文中,将包括在文档图像中的文本区域转换为字符文本而获得的字符文本组被称为文本。
对于作为比较对象的彼此不同种类语言所构成的两个文本,翻译部46将一个文本翻译成与另一个文本相同的语言,并创建翻译文本。
所述比较部47将任意文本与作为上述的文本的比较对象的翻译文本进行比较,并基于上述的比较结果检测出各个文本之间的差异。
所述输出部48用于执行输出由比较部47检测到的各个文本的差异的处理操作。输出部48执行通过图像形成部12在记录纸上形成各个文本之间的差异(例如,显示上述的差异的图像),或者通过通信控制部43和网络通信部36发送到网络上的终端设备等等的控制操作。
在具有这种结构的图像形成装置10中,例如,当用户通过操作操作部34或者触摸面板35选择复印功能,并指示执行复印作业时,控制部41通过图像读取部11读取文档图像,将表示文档图像的图像数据暂时存储在图像存储器39中,并将上述的图像数据从图像存储器39输入到图像形成部12中,并且通过图像形成部12在记录纸上打印文档图像。
另外,在用户操作操作部34或者触摸面板35以选择预先设定的语言组合模式之后,指示检索具有包括彼此不同种类语言的文本的各个文档图像的第一文件和第二文件。值得一提的是,假定在这个时点用户根据自己的判断掌握第一文件和第二文件中所使用的语言。
根据上述的指示,所述检索部44从存储部38或者网络上的存储器检索第一文件和第二文件,并将其存储在图像存储器39中。随后,布局分析部45在从第一文件的文档图像中提取文本(任意文本)的同时,从第二文件的文档图像中提取文本(要比较的文本)。
所述翻译部46将第二文件的文本翻译成与第一文件的文本相同类型的语言,并创建与第二文件相关的翻译文本。比较部47将第一文件的文本与第二文件的翻译文本进行比较,并基于上述的比较结果检测出第一文件的文本与第二文件的文本之间的差异。
所述输出部48在上述的检测到的差异被写入第一文件的文本或者第二文件的文本的状态下,例如,将上述的各个文本一起输出。
例如,所述检索部44从存储部38中读取出如图3所示的包括文档图像G1的第一文件和包括文档图像G2的第二文件,或者从网络上的存储器获取后,存储在图像存储器39中。
所述布局分析部45对图像存储器39中的第一文件的文档图像G1执行布局分析等操作,以确定各个文本区域X1和各个图像区域Z1等。分别地对于各个文本区域X1,布局分析部45通过上述的字符文本转换,从文本区域X1中提取由多个字符文本组成的文本T1。
然后,所述布局分析部45对图像存储器39中的第二文件的文档图像G2执行布局分析等操作,以确定各个文本区域X2和各个图像区域Z2等,并且分别地对于各个文本区域X2,通过上述的字符文本转换从文本区域X2中提取由多个字符文本组成的文本T2。
此外,基于第一文件的文档图像G1中的各个文本区域X1的位置和第二文件的文档图像G2中的各个文本区域X2的位置,布局分析部45判断各个文本区域X1的文本T1和各个文本区域X2的文本T2之间的对应关系,即,各个文本区域X1的文本T1中的哪一个和各个文本区域X2的文本T2中的哪一个是比较对象的关系。
通过所述布局分析部45的分析,分析了例如,如图3所示,第一文件的文档图像G1包括多个日文文本区域X1和多个图像区域Z1,并且第二文件的文档图像G2包括多个英文文本区域X2和多个图像区域Z2。
在上述的示例中,示出了文档图像G1中的日文的各个文本T1和文档图像G2中的英文的各个文本T2,但是不能直接比较日文和英文。为此,翻译部46基于布局分析部45的分析结果,将第二文件的英文的各个文本T2翻译成与第一文件的各个文本T1相同的语言日文,对于第二文件的英文的各个文本T2,分别创建相应的翻译文本。
然后,所述比较部47分别针对第一文件的各个文本T1,比较文本T1和对应于上述的文本T1的文本T2翻译的翻译文本,基于上述的比较结果检测出文本T1和文本T2之间的差异。例如,比较部47从对应于上述的文本T1的第二文件的文本T2的翻译文本中提取出未在第一文件的文本T1中记载的单词,并从第二文件的文本T2中提取出对应于上述的提取的单词的单词,并将上述的提取出的单词作为差异进行检测。或者,比较部47从第一文件的文本T1中提取出对应于第二文件的文本T2的翻译文本中未记载的单词,并将上述的提取出的单词作为差异进行检测。
例如,如图3所示,在所述输出部48并排地横向排列文档图像G1和文档图像G2之后,对文档图像G1中的日文文本T1写入上述的差异,或者将对文档图像G2中的英文文本T2写入上述的差异,并创建图像。例如,输出部48以在文本T1或者文本T2中使作为差异检测到的单词添加下划线或者框架,或者以不同于其他单词的颜色显示上述的单词等的不同形式来创建图像。
此时,如图3所示,当在文档图像G1和文档图像G2中包括多个图像区域时,输出部48优选通过上述的方式将所述的文档图像G1和文档图像G2组合,并创建图像。通过上述的方式,可以在不损坏文档图像G1和文档图像G2的外观的情况下创建图像。
此外,当包括在文档图像G1和文档图像G2中的图像区域的数量小时,所述输出部48不创建将文档图像G1和文档图像G2组合的图像,而是从文档图像G1中仅仅提取出日文的各个文本T1,并从文档图像G2中仅仅提取出英文的各个文本T2,将各个文本T1和各个文本T2组合,并在文本T1或者文本T2中的至少一个中,使作为差异检测到的单词添加下划线或者框架,或者还可以以不同于其他单词的颜色显示上述的单词等的不同形式来创建图像。通过上述的方式,使得各个文本T1和各个文本T2之间的比较变得比文档图像G1和文档图像G2共同存在时更加容易。
图4所示的是,第一文件的文档图像和第二文件的文档图像的其他示例。假设在第一文件的文档图像G1中,包括表格区域H1、日文的多个文本区域X1以及一个图像区域Z1,并且在第二文件的文档图像G2中,包括表格区域H2、英文的多个文本区域X2,以及一个图像区域Z2。
同样,所述检索部44检索第一文件和第二文件并将它们存储在图像存储器39中。布局分析部45对第一文件的文档图像G1执行布局分析等操作,以确定表格区域H1、各个文本区域X1和图像区域Z1,并且还对第二文件的文档图像G2执行布局分析等操作,以确定表格区域H2、各个文本区域X2和图像区域Z2,从相应的文本区域X1、X2中分别提取各个文本T1以及各个文本T2,并确定各个文本区域X1的文本T1与各个文本区域X2的文本T2之间的对应关系。
所述翻译部46将第二文件的各个文本T2翻译成与第一文件的各个文本T1相同类型的日文,并创建相应的翻译文本。比较部47分別针对第一文件的各个文本T1,比较文本T1和对应于上述的文本T1的文本T2翻译的翻译文本,基于上述的比较结果检测出文本T1和文本T2之间的差异。输出部48并排地横向排列文档图像G1和文档图像G2并组合,在日文的文本T1或者英文的文本T2中的至少一个中,使作为差异检测到的单词添加下划线或者框架,或者以不同的颜色显示来创建图像。
此外,代替在图4所示的第一文件的文档图像G1以及第二文件的文档图像G2的组合的情况,还可以是图5A所示的在第一文件的日文的各个文本T1和第二文件的英文的各个文本T2相互交替地组合。在图5A中,在各个日文文本T1中,文本T1和与上述的文本T1相对应的英文文本T2呈上下并排布置。此外,输出部48在日文的文本T1或者英文的文本T2中的至少一个中,使作为差异检测到的单词添加下划线或者框架,或者以不同的颜色显示来创建图像。在这种情况下,输出部48使用文档图像G1或者文档图像G2中的任意一个的表格区域以及图像区域,将上述的第一文件的日文的各个文本T1和第二文件的英文的各个文本T2相互交替地组合并创建图像。
图6所示的是,第一文件的文档图像和第二文件的文档图像的其他示例。在图6中示例的是,所述输出部48并排地横向排列第一文件的文档图像G1和第二文件的文档图像G2并组合,并且在日文的各个文本T1或者英文的各个文本T2中的至少一个中,使作为差异检测到的单词添加下划线或者框架,或者以不同的颜色显示来创建图像。
由于上述的文档图像G1以及文档图像G2中所包括的图像区域的数量小,输出部48也可以不组合文档图像G1和文档图像G2,而是提取出文档图像G1中的各个文本T1和文档图像G2中的各个文本T2后组合,以便省略显示图像区域的图像的创建。
图7所示的是,对于第一文件的文档图像以及第二文件的文档图像的另一个其他例子。在图7中示例的是,所述输出部48并排地横向排列第一文件的文档图像G1和第二文件的文档图像G2并组合从而创建图像。在上述的例子当中,第一文件的文档图像G1包括由二个显示栏R组成的表格区域H1,各个显示栏R包括多个日文的文本区域X1以及一个图像区域Z1。同样地,第二文件的文档图像G2包括由二个显示栏R组成的表格区域H2,并且各个显示栏R包括多个英文的文本区域X2以及一个图像区域Z2。在本示例中,输出部48在日文的各个文本T1或者英文的各个文本T2中的至少一个中,使作为差异检测到的单词添加下划线或者框架,或者以不同的颜色显示来创建图像。
在此,所述输出部48也可以不并排地横向排列上述的文档图像G1和文档图像G2并组合,而是提取出文档图像G1中的各个文本T1和文档图像G2中的各个文本T2后组合,以便省略显示在各个显示栏R中的图像区域中的图像的创建。
接下来,将参照图8A和图8B所示的流程图等,描述用于如上所述的、检索第一文件和第二文件,以及检测和输出第一文件的文本和第二文件的文本之间的差异的处理过程。
首先,当用户操作操作部34以及触摸面板35,输入如图9所示的语言组合模式的设置界面D1的显示指示时,根据上述的显示指示,控制部41通过显示控制部42将上述的设置界面D1显示在显示部32上。在上述的语言组合模式的设置界面D1中,显示有用于指示语言组合模式的开/关的复选框CH11、CH12、返回键BK以及下一个键NX。在用户操作操作部34或者触摸面板35,当选择用于指示打开语言组合模式的复选框CH11,并指示下一个键NX时,控制部41接收语言组合模式(即步骤S101)。
所述控制部41在接收到语言组合模式时,显示控制部42使得设置界面D1被隐藏,取而代之的是,在显示部32上显示如图10所示的语言组合模式的设置界面D2(即步骤S102)。在上述的语言组合模式的设置界面D2中,显示有用于指示分别存储有不同种类的语言的两个文本的第一文件和第二文件的有无的各个复选框CH21和CH22,用于分别指示存储在第一文件和第二文件中的文档图像中的文本区域、图像区域、表格区域的有无的各个复选框CH23、CH24、CH25,用于指示语言组合模式的适用范围(例如,文档图像的页数)的各个复选框CH26、CH27,用于指示是否通知第一文件的文本与第二文件的文本之间的差异的复选框CH28、返回键BK以及下一个键NX。
图10所示例的是,作为语言组合模式的设置界面D2和默认设置,用户操作与第一文件以及第二文件二者都有相对应的复选框CH21,操作分别与存储在第一文件和第二文件中的文档图像中的文本区域、图像区域、表格区域都有的相对应的各个复选框CH23、CH24、CH25,操作指示语言组合模式的适用范围为全部范围的复选框CH26,操作与通知第一文件的文本与第二文件的文本之间的差异相对应的复选框CH28,显示代表上述的操作的各个位置的复选的图像。用户通过操作操作部34或者触摸面板35,操作任意的复选框,输入上述的与各个复选框相对应的各个指示,并由控制部41接收。
然后,当用户通过操作操作部34或者触摸面板35指定下一个键NX时,控制部41基于语言组合模式的设置界面D2上的设置,输入执行语言组合模式的指示,控制部41接收上述的执行指示。
接下来,用户操作操作部34或者触摸面板35,输入含有彼此不同种类的语言的文本的第一文件的名称以及第二文件的名称,指定第一文件以及第二文件,检索部44从存储部38中检索第一文件以及第二文件(即步骤S103)。或者,用户操作操作部34或者触摸面板35,输入第一文件的名称,指定第一文件,检索部44从存储部38中检索第一文件,进一步地,基于第一文件的名称等从存储部38中检索与上述的第一文件相关联的第二文件。值得一提的是,还可以是显示控制部42在显示部32上显示预先存储在存储部38中的多个文件的列表,用户操作操作部34或者触摸面板35,在上述的列表中,可指定选择的第一文件以及第二文件,或者第一文件,控制部41接收上述的指定。
此时,检索部44若不能够从存储部38中检索到第一文件以及第二文件,或者仅仅从存储部38检索读取第一文件(即步骤S103为“否”),则从网络上的存储器检索第一文件以及第二文件,或者基于第一文件的名称等从网络上的存储器检索与上述的第一文件相关联的第二文件(即步骤S104、步骤S105)。然后,在检索部44不能够访问存储器(即步骤S104“否”),或者不能够从存储器中检索到第一文件和第二文件中的情况(在步骤S103中仅仅从存储部38中检索读取出第一文件时,不能够从存储器检索到第二文件的情况)下(即步骤S105“否”),显示控制部42就在显示部32上显示语言组合模式的结束通知的信息(即步骤S106),图8A以及图8B的处理操作就结束了。
另外,在检索部44能够进入存储器(即步骤S104为“是”),能够从存储器38检索到第一文件以及第二文件的情况(在步骤S103中仅仅从存储部38中检索读取出第一文件时,能够从存储器检索到第二文件的情况)(即步骤S105为“是”)下,显示控制部42在显示部32上显示第一文件以及第二文件(在步骤S103中仅仅从存储部38中检索读取出第一文件时,仅显示第二文件)(即步骤S107)。此时,用户如果不执行通过操作部34等的用于选择第一文件以及第二文件(在步骤S103中仅仅从存储部38中检索读取出第一文件时,仅选择第二文件)的操作(即步骤S108为“否”),显示控制部42就在显示部32上显示语言组合模式的结束通知的信息(即步骤S106),图8A以及图8B的处理操作就结束了。
此外,用户操作操作部34或者触摸面板35,选择第一文件以及第二文件(在步骤S103中仅仅从存储部38中检索读取出第一文件时,仅选择第二文件),控制部41接收上述的选择后(即步骤S108为“是”),检索部44同时获取从存储器检索到的第一文件以及第二文件(在步骤S103中仅仅从存储部38中检索读取出第一文件时,仅选择第二文件)。
因此,当检索部44通过在存储部38中检索读取出第一文件以及第二文件(即步骤S103为“是”),或者用户操作操作部34或者触摸面板35,同时选择第一文件以及第二文件(在步骤S103中仅仅从存储部38中检索读取出第一文件时选择第二文件),并由控制部41接收上述的选择操作时(即步骤S108为“是”),就同时获取了第一文件以及第二文件(在步骤S103中仅仅从存储部38中检索读取出第一文件时仅获取第二文件)。
此外,在用户通过操作部34等对上述的设置界面D2进行操作,输入上述的语言组合模式所适用的范围时,控制部41接收上述的范围的指定操作。检索部44根据上述的指示所表示的适用范围,从存储部38内的第一文件中读取出上述的适用范围所对应的页数的文档图像,并存储在图像存储器39中的同时,还从存储部38内的第二文件中读取出上述的适用范围所对应的页数的文档图像,并存储在图像存储器39中(即步骤S109)。
接下来,布局分析部45分别针对图像存储器39中的第一文件的文档图像以及第二文件的文档图像,执行对文档图像进行布局分析等的操作,依次判断上述的文档图像中的文本区域、图像区域以及表格区域等,通过上述的字符文本转换从各个文本区域中分别提取文本,并且判断上述的各个提取的文本所示的字符的语言(即步骤S110)。此外,布局分析部45基于第一文件的文档图像中的各个文本区域的位置和第二文件的文档图像中的各个文本区域的位置,判断第一文件的各个文本区域的文本与第二文件的各个文本区域的文本之间的对应关系。
翻译部46将第二文件的各个文本翻译为与第一文件的各个文本相同的语言类型,并分别创建与第二文件的各个文本所对应的翻译文本,并将上述的翻译文本与第二文件的各个文本相对应地存储在存储部38中(即步骤S111)。
比较部47基于上述的对应关系,在第二文件中识别与第一文件的各个文本相对应的各个文本,并将第一文件的各个文本和与第一文件的各个文本相对应的各个第二文件的文本的翻译文本进行比较(即步骤S112)。比较部47基于上述的比较结果,依次判断第一文件的文本与第二文件的文本之间有无差异(即步骤S113)。
当存在差异时(即步骤S113为“有”),比较部47将上述的差异记录于存储在存储部38中的上述的第一文件的各个文本、或者第二文件的各个文本中的任何一个中,并将上述的各个文本进行相对应(即步骤S114)。例如,比较部47从翻译文本中提取出第一文件的文本中没有记载的单词,从第二文件的文本中获得与上述的提取出来的单词相对应的单词并作为差异,将上述的获得的单词记录在第二文件的文本中,并将上述的第一文件的文本与第二文件的文本相对应起来。或者,比较部47从第一文件的文本中获得翻译文本中没有记载的单词并作为差异,将上述的获得的单词记录在第一文件的文本中,并将上述的第一文件的文本与上述的第二文件的文本相对应起来。
此外,如果第一文件的文本与第二文件的文本之间没有差异(即步骤S113为“无”),比较部47就不记录差异,并将存储在上述的存储部38中的第一文件的文本与第二文件的文本相互对应起来(即步骤S115)。
然后,比较部47判断在第一文件的各个文本中是否还存在有未与翻译文本进行比较的文本(即步骤S116),如果确定为还存在(即步骤S116为“是”),就重新返回步骤S112至步骤S116的处理操作,将尚没有进行比较的第一文件的各个文本和与其相对应的翻译文本进行比较。另一方面,当比较部47确定为不存在时(即步骤S116为“否”),结束步骤S112至步骤S116的处理操作,进入到步骤S117。
在完成从步骤S112到步骤S116的处理操作后,控制部41参考存储在存储部38中的第一文件的各个文本以及分别与上述的各个文本相对应的第二文件的各个文本,并且检测在步骤S114中获得的作为第一文件的文本和与其相对应的第二文件的文本的差异的单词数量。然后,控制部41确定单词的数量是否在预先设定的判定值Q以下(Q=0或者整数,假设在本实施方式中为0)(即步骤S117)。当控制部41确定单词的数量在判定值Q以下时(即步骤S117为“是”),显示控制部42在显示部32中显示表示第一文件的各个文本与第二文件的各个文本相互一致的信息(即步骤S118)。输出部48将第一文件的各个文本和第二文件的各个文本组合后创建图像,并执行输出上述的图像的处理操作(即步骤S119)。
此外,当控制部41确定单词的数量超过判定值Q时(即步骤S117为“否”),显示控制部42在显示部32中显示表示第一文件的各个文本与第二文件的各个文本相互不一致的信息(即步骤S120)。输出部48分别针对各个作为差异的单词,在将上述的单词记录在第一文件的文本或者第二文件的文本中的状态下,将第一文件的各个文本和第二文件的各个文本组合后创建图像,并执行输出上述的图像的处理操作(即步骤S121)。
值得一提的是,在上述的步骤S117中,当单词的数量的预先设定的判定值Q不是上述的0,例如,设成是5之类的整数值,控制部41执行上述的判定操作后,差异仅仅在上述的整数值所表示的数值以下的情况下,视为第一文件的各个文本与第二文件的各个文本相互一致,显示控制部42可在显示部32上显示上述的信息。即使将不同语言组成的文章的其中一方翻译并转换成相同的语言类型,转换后的文章的内容也可能与未转换的文章不完全一致。因此,通过以上述的这种方式改变判定值Q,就可以将用于判断第一文件的各个文本与第二文件的各个文本相一致的标准调整到用户所需的级别。
通过输出部48的处理操作,第一文件的各个文本以及第二文件的各个文本的输出形式如图3至图7所示。例如,输出部48判定第一文件的文档图像中的图像区域的数量或者第二文件的文档图像中的图像区域的数量是否在预先设定的设定值(例如,为3)以下。当输出部48确定为各个图像区域的数量超过设定值时,如图3所示从图像存储器39中读取出第一文件的文档图像以及第二文件的文档图像并组合,从存储部38中依次读取出作为差异的单词,在上述的各个文档图像的文本中使作为上述的差异的单词添加下划线或者框架,又或者将上述的单词以与其他单词不同的颜色显示来创建图像。
此外,当输出部48判定第一文件的文档图像中的图像区域的数量或者第二文件的文档图像中的图像区域的数量在设定值以下时,在从第一文件的文档图像中提取出日文的各个文本的同时,从第二文件的文档图像中提取出英文的各个文本,并将第一文件的各个文本与第二文件的各个文本进行组合,从存储部38中依次读取出作为差异的单词,并在上述的各个文本中使作为上述的差异的单词添加下划线或者框架,又或者将上述的单词以与其他单词不同的颜色显示来创建图像。
另外,输出部48如图4所示,从图像存储器39中读取出第一文件的文档图像以及第二文件的文档图像并组合,从存储部38中依次读取出作为差异的单词,在上述的各个文档图像的文本中使作为上述的差异的单词添加下划线或者框架,又或者将上述的单词以与其他单词不同的颜色显示来创建图像。或者,如图5A所示在各个第一文件的文本中,输出部48将第一文件的文本和与上述的文本相对应的第二文件的文本呈上下并排布置,从存储部38中依次读取出作为差异的单词,并在上述的各个文本中使作为上述的差异的单词添加下划线或者框架,又或者将上述的单词以与其他单词不同的颜色显示来创建图像。
此外,输出部48还可以如图6所示将第一文件的文档图像以及第二文件的文档图像横向排列,在第一文件的文本或者第二文件的文本中使作为差异的单词添加下划线或者框架,又或者以不同的颜色显示来创建图像。
另外,输出部48还可以将如图7所示的第一文件的文档图像中的各个表格区域以及第二文件的文档图像的各个表格区域横向排列,在第一文件的文本或者第二文件的文本中使作为差异的单词添加下划线或者框架,又或者以不同的颜色显示来创建图像。
在上述的实施方式中,将第二文件的文本翻译为与第一文件的文本相同的语言类型,并创建翻译文本,并将第一文件的文本与上述的第二文件的翻译文本进行比较,基于上述的比较结果来检测出第一文件的文本与第二文件的文本之间的差异。通过上述的方式,由于可以通过将彼此不同语言类型的文本进行比较,检测出各个文本内容之间的差异,因此就可以容易地确定语言类型不同的各个文本之间的差异。通过本实施方式,例如,在仅仅更新其中一个文本的情况下,使得是否将更新的内容反映在两个文本中的确认操作变得容易。此外,用户可以通过目视识别由上述的方式检测出的差异,确认相对于各个文本中的其中一个,另一个文本的翻译准确度。
此外,通过本实施方式,由于输出部48将各个文本进行组合,创建在各个文本的任一个中清楚地记载了上述的各个文本之间的差异的图像后并输出,用户可以通过目视识别输出的上述的图像,容易地比较两个文本。
另外,通过本实施方式,在第一文件的文档图像中的各个图像区域的数量或者第二文件的文档图像中的各个图像区域的数量超过设定值的情况下,由于输出部48将文档图像G1以及文档图像G2进行组合并创建图像,且通过不记录图像区域,就能够减少文档图像G1以及文档图像G2的外观发生改变的情况。此外,由于在上述的各个图像区域的数值在设定值以下的情况下,输出部48不将文档图像G1和文档图像G2进行组合,而是提取出文档图像G1中的日文的各个文本T1和文档图像G2中的英文的各个文本T2并组合,因此,只有在通过不记录图像区域从而不改变文档图像G1以及文档图像G2的外观的情况下,不记录图像区域,用户可以容易地识别各个文本T1和各个文本T2之间的差异。
值得指出的是,在上述的实施方式中,虽然翻译部46是对于第二文件创建翻译文本,但是还可以直接使用第二文件的文本,将第一文件的文本进行翻译后创建翻译文本,并将第一文件以及第二文件进行比较。
此外,在上述的实施方式中,虽然布局分析部45从第一文件以及第二文件中的各个文档图像中确定文本区域,从确定的文本区域中提取出文本,并将上述的提取出的第一文件以及第二文件的文本作为彼此的比较对象,但是还可以不经过布局分析部45的处理操作,第一文件以及第二文件具有原始的各个文本数据,将上述的文本数据部分作为比较对象的文本,比较部47执行上述的比较操作。
此外,作为第一文件的文本以及第二文件的文本,还可以适用各种语言。
另外,输出部48计算差异的数值,在上述的差异的数值在预先设定的阈值以下的情况下,针对各个差异,在将差异记录在第一文件的文本或者第二文件的文本中的状态下,还可以将上述的各个文本组合并创建图像,在差异的数值超过阈值的情况下,如图12所示,分别针对各个差异,将差异记录在第一文件的文本或者第二文件的文本中,仅仅创建记录有差异的文本所代表的图像。在上述的情况下,在差异的数值多的时候,用户仅仅识别记录有差异的文本,用户就可以容易地识别差异。
此外,还可以是,在差异记录在相互对应的第一文件的文本以及第二文件的文本中的任何一个中的情况下,输出部48将上述的各个文本组合并创建图像,在相互对应的第一文件的文本以及第二文件的文本中的任何一个都没有记载差异的情况下,省略上述的各个文本的图像的创建操作。
另外,用户还可以任意地设置第一文件的文本以及第二文件的文本的组合方向。例如,在图11所示的语言组合模式的设置界面D3中,显示有用于设置组合方向为上下方向或者左右方向中的任何一个的两个复选框CH31、CH32,用户通过操作操作部34或者触摸面板35,来操作上述的任意一个复选框。然后,输出部48根据操作的复选框,接收第一文件的文本以及第二文件的文本的组合方向,根据上述的接收到的组合方向,将组合方向设置为上下方向或者左右方向中的任何一个。在将第一文件的文本以及第二文件的文本的组合方向设置为左右方向的情况下,如图5A所示,输出部48在左右方向上组合第一文件的文本以及第二文件的文本后创建图像并输出。另一方面,在将第一文件的文本以及第二文件的文本的组合方向设置为上下方向的情况下,如图5B所示,输出部48在上下方向上组合第一文件的文本以及第二文件的文本后创建图像并输出。
更进一步地,在语言组合模式的设置界面D2中,还可以设置第一文件的文本以及第二文件的文本的组合的顺序。
此外,在第一文件的文本以及第二文件的文本的组合方向设置为左右方向的状态下,第一文件的文本以及第二文件的文本中的至少任一个在左右方向的长度超过预先设定的规定长度的情况下,输出部48还可以将各个文本的组合方向变更为上下方向。在这种情况下,在各个文本的至少一个在左右方向的长度过长,使得在左右方向上组合各个文本变得困难的时候,由于将各个文本的组合方向变更为上下方向,因此还能够保持各个文本的组合。
值得指出的是,使用图1至图12进行说明的上述的实施方式的结构和机理,仅仅是本发明的一个例子,并不旨在将本发明限制于所述的结构和处理。
Claims (9)
1.一种图像处理装置,其特征在于,具备控制单元功能,其包括:
检索部,其含有处理器,所述检索部用于通过上述的处理器执行控制程序,检索第一文件和第二文件,所述的第一文件具有第一语言的第一文本,所述的第二文件具有第二文本,所述的第二文本以与所述的第一语言不同的第二语言表示所述的第一文本所表示的内容;
布局分析部,用于对所述的第一文件所表示的文档图像以及所述的第二文件所表示的文档图像执行布局分析,以确定各个文本区域以及各个图像区域,在从所述的第一文件所表示的文档图像的所述的各个文本区域中提取所述的第一文本的同时,从所述的第二文件所表示的文档图像的所述的各个文本区域中提取所述的第二文本,并基于所述的第一文件所表示的所述的文档图像中的所述的各个文本区域的位置和所述的第二文件所表示的所述的文档图像中的所述的各个文本区域的位置,判断所述的第一文本和作为该第一文本的比较对象的所述的第二文本的之间的对应关系;
翻译部,用于将所述的第二文件的所述的第二文本翻译为所述的第一语言,并创建所述的第二文件的翻译文本;
比较部,用于基于所述的对应关系,将所述的第一文件的所述的第一文本与和该第一文本对应的所述的第二文件的所述的第二文本的所述的翻译文本进行比较,并根据所述的比较结果检测出所述的第一文件的所述的第一文本与所述的第二文件的所述的第二文本之间的差异;
输出部,在将通过所述的比较部检测出的所述的差异记录在所述的第一文件的所述的第一文本或者所述的第二文件的所述的第二文本的状态下,创建所述的第一文件的所述的第一文本和所述的第二文件的所述的第二文本组合在一起的图像,并执行输出所述的创建图像的处理操作;
所述的比较部从所述的第一文本中提取出未在所述的翻译文本中记载的单词,并将提取出的所述的单词作为所述的差异进行检测。
2.一种根据权利要求1所述的图像处理装置,其特征在于,
在所述的第一文件以及所述的第二文件中,分别包含有包括文本区域和图像区域的文档图像,
所述的输出部在将所述的差异记录在所述的第一文件的所述的文本区域中所包含的所述的第一文本中或者所述的第二文件的所述的文本区域所包含的所述的第二文本中的状态下,创建所述的第一文件的所述的文档图像和所述的第二文件的所述的文档图像组合在一起的图像,并执行输出创建的所述的图像的处理操作。
3.一种根据权利要求1所述的图像处理装置,其特征在于,
在所述的第一文件以及所述的第二文件中,分别包含有包括文本区域和图像区域的文档图像,
所述的输出部在将所述的差异记录在所述的第一文件的所述的文本区域中所包含的所述的第一文本中或者所述的第二文件的所述的文本区域所包含的所述的第二文本中的状态下,创建所述的第一文件的所述的文本区域和所述的第二文件的所述的文本区域组合在一起的图像,并执行输出创建的所述的图像的处理操作。
4.一种根据权利要求1所述的图像处理装置,其特征在于,
在所述的第一文件以及所述的第二文件中,分别包含有包括至少一个文本区域和多个图像区域的文档图像,
在所述的第一文件的所述的文档图像中的所述的图像区域或者所述的第二文件的所述的文档图像中的所述的图像区域的数目在预先设置的设定值以下的情况下,所述的输出部在将所述的差异记录在所述的第一文件的所述的文本区域中所包含的所述的第一文本中或者所述的第二文件的所述的文本区域所包含的所述的第二文本中的状态下,创建所述的第一文件的所述的文本区域所包含的所述的第一文本以及所述的第二文件的所述的文本区域所包含的所述的第二文本组合在一起的图像,并执行输出创建的所述的图像的处理操作,
在所述的第一文件的所述的文档图像中的所述的图像区域或者所述的第二文件的所述的文档图像中的所述的图像区域的数目超过预先设置的所述的设定值的情况下,在将所述的差异记录在所述的第一文件的所述的文本区域中所包含的所述的第一文本中或者所述的第二文件的所述的文本区域所包含的所述的第二文本中的状态下,创建所述的第一文件的所述的文档图像和所述的第二文件的所述的文档图像组合在一起的图像,并执行输出创建的所述的图像的处理操作。
5.一种根据权利要求1或权利要求2所述的图像处理装置,其特征在于,
还具备供用户操作的操作部,用于指定所述的第一文件的所述的第一文本以及所述的第二文件的所述的第二文本的组合方向为上下方向或者左右方向中的任何一个,
根据通过所述操作部指定的上下方向或者左右方向中的任何一个,所述的输出部在创建所述的第一文件的所述的第一文本以及所述的第二文件的所述的第二文本组合在一起的图像的过程中,设置所述的第一文件的所述的第一文本以及所述的第二文件的所述的第二文本的组合方向。
6.一种根据权利要求5所述的图像处理装置,其特征在于,
在所述的第一文件的所述的第一文本以及所述的第二文件的所述的第二文本的组合方向设置为左右方向的情况下,当所述的第一文件的所述的第一文本以及所述的第二文件的所述的第二文本中的至少一个在左右方向的长度超过预先设定的规定长度时,所述的输出部将所述的组合方向变更为上下方向。
7.一种根据权利要求6所述的图像处理装置,其特征在于,
所述的输出部在所述的第一文件的所述的第一文本以及所述的第二文件的所述的第二文本的组合方向设置为左右方向的情况下,将所述的第一文件的所述的第一文本以及所述的第二文件的所述的第二文本在左右方向上进行组合并创建图像,在所述的第一文件的所述的第一文本以及所述的第二文件的所述的第二文本的组合方向设置为上下方向的情况下,将所述的第一文件的所述的第一文本以及所述的第二文件的所述的第二文本在上下方向上进行组合并创建图像。
8.一种根据权利要求1或权利要求2所述的图像处理装置,其特征在于,
还具备用于在记录纸上形成图像的图像形成部,
所述的输出部使所述的图像形成部在记录纸上形成所创建的所述图像。
9.一种根据权利要求1或权利要求2所述的图像处理装置,其特征在于,
还具备通过网络与终端设备进行通信的通信部,
所述的输出部使所述的通信部通过网络将所创建的所述图像发送至所述的终端设备。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017241114A JP6885319B2 (ja) | 2017-12-15 | 2017-12-15 | 画像処理装置 |
JP2017-241114 | 2017-12-15 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110012190A CN110012190A (zh) | 2019-07-12 |
CN110012190B true CN110012190B (zh) | 2021-05-11 |
Family
ID=66816118
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811493374.6A Expired - Fee Related CN110012190B (zh) | 2017-12-15 | 2018-12-07 | 图像处理装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10902223B2 (zh) |
JP (1) | JP6885319B2 (zh) |
CN (1) | CN110012190B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6885318B2 (ja) * | 2017-12-15 | 2021-06-16 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
CN112183122A (zh) * | 2020-10-22 | 2021-01-05 | 腾讯科技(深圳)有限公司 | 文字识别方法和装置、存储介质及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101036138A (zh) * | 2004-08-31 | 2007-09-12 | 技术头脑有限公司 | 从第一语言到第二语言的自动翻译和/或处理集成电路处理单元中功能的方法以及用于执行该方法的装置 |
CN101361064A (zh) * | 2005-12-16 | 2009-02-04 | Emil有限公司 | 文本编辑装置和方法 |
CN104115141A (zh) * | 2011-11-25 | 2014-10-22 | 谷歌公司 | 在应用本地化中提供翻译辅助 |
CN104636740A (zh) * | 2013-11-08 | 2015-05-20 | 株式会社理光 | 图像处理系统和图像处理方法 |
JP5909123B2 (ja) * | 2012-03-21 | 2016-04-26 | 株式会社東芝 | 機械翻訳装置、機械翻訳方法およびプログラム |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6981225B1 (en) * | 2000-01-31 | 2005-12-27 | Intel Corporation | Indicating the differences between Internet web pages |
US6519557B1 (en) * | 2000-06-06 | 2003-02-11 | International Business Machines Corporation | Software and method for recognizing similarity of documents written in different languages based on a quantitative measure of similarity |
JP2004199483A (ja) | 2002-12-19 | 2004-07-15 | Fuji Xerox Co Ltd | 画像出力装置 |
US20080168151A1 (en) * | 2005-06-22 | 2008-07-10 | Tele Atlas North America, Inc. | System and method for automatically executing corresponding operations using peer groups |
US7813918B2 (en) * | 2005-08-03 | 2010-10-12 | Language Weaver, Inc. | Identifying documents which form translated pairs, within a document collection |
TW200910875A (en) * | 2007-08-29 | 2009-03-01 | Inventec Appliances Corp | Method and system for instantly translating text within an image |
JP2010176543A (ja) * | 2009-01-30 | 2010-08-12 | Toshiba Corp | 翻訳装置、方法、及びプログラム |
CN102053991B (zh) * | 2009-10-30 | 2014-07-02 | 国际商业机器公司 | 用于多语言文档检索的方法及系统 |
JP2012118883A (ja) | 2010-12-02 | 2012-06-21 | Nec Corp | 翻訳装置、翻訳システム、翻訳方法および翻訳プログラム |
US8856674B2 (en) * | 2011-09-28 | 2014-10-07 | Blackberry Limited | Electronic device and method for character deletion |
US8892596B1 (en) * | 2012-08-08 | 2014-11-18 | Google Inc. | Identifying related documents based on links in documents |
JP6056489B2 (ja) | 2013-01-15 | 2017-01-11 | 富士通株式会社 | 翻訳支援プログラム、方法、および装置 |
JP2014194668A (ja) * | 2013-03-28 | 2014-10-09 | Fujitsu Ltd | 翻訳支援装置、翻訳支援システムおよび翻訳支援プログラム |
US20150199339A1 (en) * | 2014-01-14 | 2015-07-16 | Xerox Corporation | Semantic refining of cross-lingual information retrieval results |
US9788153B1 (en) * | 2014-03-28 | 2017-10-10 | Symantec Corporation | Techniques for mobile geofencing |
JP6122814B2 (ja) * | 2014-07-17 | 2017-04-26 | 富士フイルム株式会社 | 情報処理装置、プログラム、及びデジタル検版方法 |
EA201891955A1 (ru) * | 2016-02-29 | 2019-03-29 | Смарт Лэмп, Инк. Д/Б/А Лэмпикс | Способ и устройство для обеспечения пользовательских интерфейсов с компьютеризированными системами и взаимодействия с виртуальным окружением |
US9710703B1 (en) * | 2016-07-15 | 2017-07-18 | StradVision, Inc. | Method and apparatus for detecting texts included in a specific image |
US10460192B2 (en) * | 2016-10-21 | 2019-10-29 | Xerox Corporation | Method and system for optical character recognition (OCR) of multi-language content |
JP6885318B2 (ja) * | 2017-12-15 | 2021-06-16 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
-
2017
- 2017-12-15 JP JP2017241114A patent/JP6885319B2/ja active Active
-
2018
- 2018-12-07 CN CN201811493374.6A patent/CN110012190B/zh not_active Expired - Fee Related
- 2018-12-11 US US16/216,313 patent/US10902223B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101036138A (zh) * | 2004-08-31 | 2007-09-12 | 技术头脑有限公司 | 从第一语言到第二语言的自动翻译和/或处理集成电路处理单元中功能的方法以及用于执行该方法的装置 |
CN101361064A (zh) * | 2005-12-16 | 2009-02-04 | Emil有限公司 | 文本编辑装置和方法 |
CN104115141A (zh) * | 2011-11-25 | 2014-10-22 | 谷歌公司 | 在应用本地化中提供翻译辅助 |
JP5909123B2 (ja) * | 2012-03-21 | 2016-04-26 | 株式会社東芝 | 機械翻訳装置、機械翻訳方法およびプログラム |
CN104636740A (zh) * | 2013-11-08 | 2015-05-20 | 株式会社理光 | 图像处理系统和图像处理方法 |
Also Published As
Publication number | Publication date |
---|---|
US10902223B2 (en) | 2021-01-26 |
JP6885319B2 (ja) | 2021-06-16 |
JP2019109629A (ja) | 2019-07-04 |
US20190188266A1 (en) | 2019-06-20 |
CN110012190A (zh) | 2019-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8726178B2 (en) | Device, method, and computer program product for information retrieval | |
US7797150B2 (en) | Translation system using a translation database, translation using a translation database, method using a translation database, and program for translation using a translation database | |
JP6885318B2 (ja) | 画像処理装置 | |
JP2019109628A5 (zh) | ||
US9411450B2 (en) | Display input device, image forming apparatus, and control method of display input device | |
US10755092B2 (en) | Image forming apparatus that gives color respectively different from one another to text area for each of various kinds of languages or selectively deletes text area for each of various kinds of language | |
CN110012190B (zh) | 图像处理装置 | |
JP2019109629A5 (zh) | ||
US11297199B2 (en) | Image processing apparatus that generates cover page from source image | |
US11064094B2 (en) | Image forming apparatus for forming image represented by image data on recording paper sheet | |
CN111580758A (zh) | 图像形成装置 | |
JP7363188B2 (ja) | 画像読取装置及び画像形成装置 | |
EP3547036A1 (en) | Image forming device | |
WO2021033603A1 (ja) | 画像読取装置 | |
US11849086B2 (en) | Image processing apparatus capable of extracting portion of document image specified by preset index and subjecting character string in extracted portion to processing associated with index | |
JP2020086536A (ja) | 電子機器及び画像形成装置 | |
JP7419942B2 (ja) | 画像処理装置及び画像形成装置 | |
CN115297215B (zh) | 图像处理装置以及图像形成装置 | |
JP6624027B2 (ja) | 画像処理装置及び画像形成装置 | |
JP2024124216A (ja) | 原稿頁順編集装置 | |
JP6705430B2 (ja) | 画像形成装置 | |
JP2020134964A (ja) | 画像処理装置及び画像処理方法 | |
JP6274121B2 (ja) | 画像形成装置 | |
JP2021166333A (ja) | ドキュメント結合方法、画像形成システム、及び画像形成装置 | |
JP2017163472A (ja) | 電子機器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210511 |
|
CF01 | Termination of patent right due to non-payment of annual fee |