CN101178725A - 用于信息检索的设备、方法和计算机程序产品 - Google Patents
用于信息检索的设备、方法和计算机程序产品 Download PDFInfo
- Publication number
- CN101178725A CN101178725A CNA2007101695258A CN200710169525A CN101178725A CN 101178725 A CN101178725 A CN 101178725A CN A2007101695258 A CNA2007101695258 A CN A2007101695258A CN 200710169525 A CN200710169525 A CN 200710169525A CN 101178725 A CN101178725 A CN 101178725A
- Authority
- CN
- China
- Prior art keywords
- information
- screen
- subregion
- unit
- retrieval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
一种信息检索设备,包括:区域划分单元,将输入信息按每种信息属性划分为多个子区域;提取单元,从每个子区域中的输入信息提取检索关键字;显示控制单元,将子区域中的输入信息显示在第一屏幕上,接收用于指定要被移动到显示单元上的第二屏幕的第一屏幕上显示的任一子区域的指令;以及,检索单元,基于与移动到第二屏幕的子区域对应的检索关键字经由网络检索信息。显示控制单元将检索到的信息显示在第二屏幕上。
Description
相关申请的交叉引用
本申请主张2006年11月10日提出的日本在先文件2006-305835和2007年10月9日提出的日本在先文件2007-262885的优先权,并参考引入其整体内容。
技术领域
本发明涉及一种用于检索网络上的信息的技术。
背景技术
各种技术可用于检索期望的文件。在一种这样的技术中,将文件注册为个人计算机(PC)中的数据库,在用户经由键盘输入字符串时,从该数据库检索与关键字相关的数字数据。
例如,日本专利申请公开第2000-231568号中揭示了一种文件检索设备,该文件检索设备获得与被检索的文件分开管理的多个目录信息,并将获得的目录信息显示在显示屏幕上。在用户选择显示的目录信息中的一条目录信息时,文件检索设备从所选的目录信息中提取字符串作为关键字,并从被检索的文件中检索与提取的关键字有关的数字文件。
如上所述,日本专利申请公开第2000-231568号中揭示的文件检索设备仅可以处理数字文件。然而,现实世界中存在的大多信息不是数字信息,而是基于纸张的信息,例如报纸和杂志。换句话说,日本专利申请公开第2000-231568号中揭示的文件检索设备不能处理现实世界中存在的大多数信息。
发明内容
本发明的目的是至少部分地解决传统技术中的问题。
依据本发明的一方面,提供一种信息检索设备,该信息检索设备连接到网络,包括:显示单元,包括显示从输入单元接收到的输入信息的第一屏幕,以及,显示检索结果的第二屏幕,第一屏幕和第二屏幕能从用户接收操作输入;区域划分单元,将输入信息按每种信息属性划分为多个子区域;提取单元,从每个子区域中的输入信息提取检索关键字;显示控制单元,将子区域中的输入信息显示在第一屏幕上,接收用于指定要被移动到第二屏幕的、第一屏幕上显示的任一子区域的指令;以及,检索单元,基于与移动到第二屏幕的子区域对应的检索关键字经由网络检索信息,其中,显示控制单元将检索到的信息显示在第二屏幕上。
依据本发明的另一方面,提供一种从网络检索信息的方法,该方法包括:在显示单元上显示其上显示了从输入单元接收的输入信息的第一屏幕,并显示其上显示了检索的结果的第二屏幕,第一屏幕和第二屏幕能从用户接收操作输入;按每种信息属性将输入信息划分为多个子区域;从每个子区域的输入信息提取检索关键字;提供控制来在第一屏幕上显示输入信息,并接收用于指定要移动到第二屏幕的、第一屏幕上显示的任一子区域的指令;以及,基于与要移动到第二屏幕的子区域对应的检索关键字经由网络检索信息,其中,提供控制包括将检索到的信息显示在第二屏幕上。
依据本发明再一方面,提供一种包含计算机程序的计算机程序产品,其在计算机上执行时执行上述的方法。
在连同附图一起考虑时,通过阅读以下的本发明目前的实施例的详细描述,将更好地理解本发明的上述的和其他的目的、特征、优点以及技术上和产业上的意义。
附图说明
图1为包含了依据本发明第一实施例的文件检索设备的图像形成装置的框图;
图2为图1中所示的区域划分单元的框图;
图3为图2中所示的属性分析单元的框图;
图4为图3中所示的字符辨别单元的框图;
图5为图1中所示的关键字提取单元的框图;
图6为图1中所示的操作显示单元的示意图;
图7为图6中所示的操作显示单元的监视器的示例的示意图;
图8为用于解释由依据第一实施例的文件检索设备执行的文件检索处理的流程图;
图9为连接到图1中所示的文件检索设备中包含的输入/输出单元的其他输入设备的框图;
图10为包含了依据第一实施例的文件检索设备的图像形成装置的外观图;
图11为包含了依据本发明第二实施例的文件检索设备的图像形成装置的框图;
图12为用于解释图11中显示的监视器上显示的内容的示意图;
图13为包含了依据本发明第三实施例的文件检索设备的图像形成装置的框图;
图14为包含了依据本发明第四实施例的文件检索设备的图像形成装置的框图;
图15A为用于解释在监视器上显示的内容的示意图,该监视器包含在依据本发明第五实施例的文件检索设备中;
图15B为关键字手写输入屏幕的示例的示意图;
图16为用于解释在监视器上显示的内容的示意图,该监视器包含在依据本发明第五实施例的变形的文件检索设备中;
图17为包含了依据本发明第六实施例的文件检索设备的图像形成装置的框图;
图18为用于解释在图17中所示的监视器上显示的内容的示意图;
图19为包含了依据本发明第七实施例的文件检索设备的图像形成装置的框图;
图20为用于解释在图19中所示的监视器上显示的内容的示意图;
图21为包含了依据本发明第八实施例的文件检索设备的图像形成装置的框图;
图22为用于解释在图21中所示的监视器上显示的内容的示意图;
图23为用于解释在监视器上显示的内容的示意图,该监视器包含在依据本发明第八实施例的变形的文件检索设备中;
图24为作为依据本发明第九实施例的文件检索设备的个人计算机(PC)的框图;
图25为用于解释由依据第九实施例的PC执行的文件检索处理的流程图;
图26为作为依据本发明第十实施例的文件检索设备的移动电话的示意图;
图27为图像形成装置的硬件配置的框图,该图像形成装置包含依据第一实施例的文件检索设备;以及
图28为依据第九实施例的PC的硬件配置的框图。
具体实施方式
以下参考附图详细说明本发明的示意性实施例。
依据本发明第一实施例的文件检索(retrieval)设备包含在图像形成装置中。当通过图像形成装置中包含的扫描器扫描文件时,文件检索设备自动地从扫描的文件数据中读取文本数据,并从文本数据中提取关键词。文件检索设备经由网络从连接到文件检索设备的其他数据库设备检索与提取的关键词有关的文件数据,并将检索到的文件数据显示在监视器上。以此方式,仅仅通过扫描文件,包含了文件检索设备的图形形成装置可以容易地从网络上的数据库设备检索与扫描的文件数据的内容有关的文件数据,从而用户不需要执行任何繁琐的键盘操作。以下详细说明包含了依据第一实施例的文件检索设备的图像形成装置。
图1为包含了依据第一实施例的文件检索设备10的图像形成装置的框图。图像形成装置包括扫描器1、图像处理单元2、图像输出单元3以及文件检索设备10。图像形成装置经由网络4连接到数据库设备5。
文件检索设备10包括区域划分单元11、关键字提取单元12、检索单元13、显示控制单元14、操作显示单元15以及输入/输出单元16。图像处理单元2相对于扫描器1获取的文件图像,执行图像转换处理,例如数字转换或者伽马转换,从而生成例如位图图像。图像处理单元2将处理后的文件图像发送到输入/输出单元16。
输入/输出单元16将文件图像发送到区域划分单元11。区域划分单元11将文件图像划分为包含图像数据的图像区域、以及包含非图像数据的数据的非图像区域。区域划分单元11分析包含在图像区域中的图像数据,并从图像数据中提取出文件组件。文件组件可以是文本、例如为照片的图形图像、图表或标题。文件组件通常占据文件的主要部分。
区域划分单元11也分析每个文件组件的属性,并将图像区域按照每种属性划分为多个子区域。属性可以是文本、图表、图形图像或其他。
图2为区域划分单元11的详细框图。区域划分单元11包括区域识别单元11a和属性分析单元11b。区域识别单元11a在扫描的文件数据中识别子区域的类型以及子区域存在的地方。如果区域属性为文本,则子区域对应于每个段落,如果区域属性为图表,则子区域对应于每个图表,如果区域属性为图形图像,则子区域对应于每个图形图像。
区域识别单元11a基于是否有浓度的变化、是否有边缘或是否有半色调区域等识别子区域。例如,在检测到基于浓度的差异确定为字符的一系列的部分时,区域识别单元11a将这些部分识别为文本区域。在检测到一区域中一系列的半色调像素时,区域识别单元11a将该区域识别为图形图像子区域。类似的,当在一区域中检测到边缘部分、以及色彩密度的显著差异时,区域识别单元11a将该区域识别为图表子区域。对于其他的子区域,区域识别单元11a将子区域识别为包含了文本、图形和图表的组合的子区域,或识别为不是包含了该组合的子区域的子区域,并且,通过使用该共同的区域识别方法识别每个子区域。
属性分析单元11b分析由区域识别单元11a识别的每个子区域的属性,也就是,分析该子区域是否包含了文本图像、图形图像、半色调图像、图表图像或者其他图像中的任一图像。其结果是,按照每种数据属性分析每个识别的区域,也就是,按照每种数据属性将文件数据划分为子区域。按照每种数据属性划分的子区域的元素被视为文件组件。
图3为属性分析单元11b的框图。属性分析单元11b包括布局分析单元11b1和字符辨别单元11b2。布局分析单元11b1基于由区域识别单元11a提取的文件组件分析文件数据的布局。布局分析单元11b1以将共同逻辑应用于检测到的信息(例如边缘、半色调、和像素位置)的方式执行布局分析,从而分析子区域的布局。
图4为字符辨别单元11b2的框图。字符辨别单元11b2包括字符剪辑单元11b21、样条矢量转换(spline-vector converting)单元11b22、以及光学字符读取(optical character reading,OCR)单元11b23。
字符辨别单元11b2执行关于数据属性被属性分析单元11b分析为文本数据的文件组件的字符辨别,并将文本元素转化为机器可处理的格式。
字符剪辑单元11b21通过检测色彩密度差异来剪切字符。字符剪辑单元11b21精确地剪切字符,从而可以精确地执行字符分析。
样条矢量转换单元11b22将线性样条函数(linear spline function)应用于剪辑的字符。通过应用线性样条函数,可以使得剪辑的字符的轮廓变得平滑。
OCR单元11b23关于由样条矢量转换单元11b22对其应用了线性样条函数的字符,执行光学字符辨别。也就是,OCR单元11b23从字符图像提取文本数据。
以此方式,字符辨别单元11b2将字符图像转化为机器可处理的格式的文本数据。关键字提取单元12从可以精确且快速地提取关键字的这个文本数据中提取关键字。另外,可以通过使用任何可用的算法执行字符辨别。
如图1所示,操作显示单元15包括:操作单元15a,其可以从用户接收输入,例如数据或指令;以及,监视器15b,其上显示用户输入的信息和检索结果。
显示控制单元14控制监视器15b上显示何种内容、在监视器15b上的何处显示内容以及如何在监视器15b上显示内容。例如,显示控制单元14控制文件数据在监视器15b上的显示,该文件数据由区域划分单元11按各种属性划分为子区域。区域划分单元11可以用于按用户经由操作单元15a设置的属性将文本数据划分为子区域。当用户在查看显示的图像后发现由区域划分单元11分析为文本图像的该显示的图像实际上是图形图像时,用户可以通过操作操作显示单元15将该显示的图像的属性从文本数据改变为图形图像。在接收到来自用户的用于改变数据属性的指令,区域划分单元11将该显示的图像的数据属性改变为图形图像数据。
有时,用户可以注意到字符的读出错误。在注意到读出错误时,用户输入指令来修正该读出错误。在接收到这样的指令时,字符辨别单元11b2基于该指令修正文本数据。以此方式,用户可以改变作为子区域的文件组件的数据属性,并修正字符的读出错误。
图5为关键字提取单元12的框图。关键字提取单元12包括关键字字典12a。作为关键字的字存储在关键字字典12a中。
关键字提取单元12通过应用语形学分析按每种词素划分包含在文本子区域中的字符串。关键字提取单元12确定按每种词素的每个字符串是否与关键字字典12a中存储的任一关键字匹配。如果字符串与关键字匹配,则关键字提取单元12将匹配的字符串作为候选关键字提取。关键字提取单元12可以配置成通过应用算法(该算法基于例如通过布局分析和出现频率获得的条件)来限缩候选的关键字,从而确定关键字。
检索单元13将关键字提取单元12提取的关键字和基于该关键字的搜索命令经由输入/输出单元16发送到与网络4连接的Web上的数据库设备5。
在接收到该关键字和搜索命令时,数据库设备5基于该关键字搜索信息,并将搜索中检索到的信息以超文本链接标示语言(HTML)的形式经由网络4发送到文件检索设备10。文件检索设备10经由输入/输出单元16接收该信息。
在接收到HTML文件形式的信息时,显示控制单元14将接收到的信息显示在监视器15b上。显示控制单元14将该信息显示在带有Web浏览器的监视器15b上,从而用户可以观看带有浏览器的监视器15b上的信息,就像是利用个人计算机(PC)的网页搜索一样。
图6为操作显示单元15的示意图。用户可以通过按下或接触按键或数字键盘将指令输入到操作单元15a。监视器15b在其上显示扫描器1扫描的图像、设置项目以及检索结果。监视器15b接收用于设置的触摸输入、或者用户手指的拖放(drag-and-drop)操作。
如图6所示,在监视器15b上并列地显示了两个不同的图像,一个在左边,另一个在右边。扫描器1扫描的文件图像显示在整个显示屏幕601左侧的屏幕610上。从数据库设备5接收的信息显示在整个显示屏幕601右侧的屏幕630上。
在屏幕610上,文件图像由区域划分单元11按每种数据属性划分为子区域,并由显示控制单元14显示在监视器15b上。例如,子区域611、612包括图形图像,而子区域613包括文本数据。
关键字提取单元12从包含了文本数据的每个子区域提取关键字,检索单元13使数据库设备5搜索与提取的关键字有关的信息。在图6所示的示例中,从屏幕610上的文本数据子区域提取“森林”、“纸张”、“纸浆”和“原料”作为关键字。
图7为监视器15b上显示的内容的放大图。由扫描器1扫描的图像显示在监视器15b的整个显示屏幕701左侧的屏幕710上。屏幕710上显示的图像由区域划分单元11按每种数据属性划分为子区域。例如,子区域711包含图形图像,而子区域712包含文本数据。
如图7所示,显示控制单元14以每个子区域由一框包围的方式控制图像显示在屏幕710上。可选择的,显示控制单元14可以以每个子区域闪烁或阴影化的方式控制图像显示在屏幕710上。只要可以清楚地区分每个子区域,则可以采用任一显示方式。
另外,最好是,显示控制单元14控制显示图像,在图像中,由关键字提取单元12提取的每个关键字通过以框、闪烁或阴影化包围而加亮,从而,用户可以容易地辨别提取的关键字。
文件检索设备10可以以在扫描器1扫描文件完成时检索单元13开始检索的方式配置。文件检索设备10可以配置来选择是否显示扫描的图像。在大多数情况下,用户拥有要经受扫描的原始文件,因此,如果将扫描的图像隐藏并主要地显示检索到的信息则对于用户而言是视觉上友好的。
检索到的信息显示在整个显示屏幕701右侧的屏幕730上。在图像仅由扫描器1扫描时,没有检索到任何信息,从而,没有图像显示在屏幕730上,也就是,仅仅显示其为检索屏幕。
对于开始扫描的操作输入,用户以手指接触指定的文本子区域,例如子区域712,并将子区域712拖放到屏幕730中。从而开始检索与子区域712的关键字有关的信息。
即使选择了多个文本子区域,例如子区域712和713,也可以以与上述相同的方式,将子区域712和713拖放到屏幕730中,从而开始检索与子区域712和713的关键字有关的信息。以此方式,可以连续地执行子区域的选择和关键字的提取,从而可以提高操作效率。
操作显示单元15接收具体标准(specification)来从监视器15b上显示的子区域中选择要经受检索的子区域,并接收指令来释放所选的子区域的标准。最好是,显示控制单元14以与其他子区域不同的方式显示所选的子区域。以此方式,用户可以选择要指定的子区域,并且关键字从所选的子区域中被提取。从而,由于通过选择子区域限缩了关键字,因此可以精确地提高检索性能。
在此情况下,最好是,操作显示单元15接收通过人手指或铁笔的触摸输入或通过鼠标的输入而输入的操作指令。
如果没有指定子区域,则关键字提取单元12从整个扫描的文本数据(即所有文本子区域)提取关键字。以此方式,可以自动地检索与整个扫描的文件数据有关的信息。
在检索单元13接收到由数据库设备5基于关键字搜索到的信息时,显示控制单元14利用浏览器将检索到的信息显示在屏幕730上。
图8为用于说明由文件检索设备10执行的文件检索处理的流程图。输入/输出单元16检测输入/输出单元16是否已接收到来自扫描器1的扫描数据(步骤S101)。在接收到来自扫描器1的扫描数据时(步骤S101,是),输入/输出单元16将接收到的数据输出到区域划分单元11。
区域划分单元11识别扫描数据例如位图图像的区域(步骤S102)。区域划分单元11对包含在识别的区域中的数据的属性进行分析。也就是,区域划分单元11分析包含在识别的区域中的数据是文本、图形图像、图表或其他(例如文本、图形图像和图表的组合)中任意一种,来按每种数据属性将该数据划分为子区域(步骤S103)。
特别的,区域划分单元11指定包含文本数据的任一子区域来提取关键字(步骤S104)。
显示控制单元14确定输入信息是否被设置成要显示在监视器15b上(步骤S105)。如果输入信息没有被设置成要显示在监视器15b上(步骤S105,否),显示控制单元14则不将输入信息显示在监视器15b上,并且关键字提取单元12从输入信息的整个区域中提取关键字(步骤S109)。
另一方面,如果输入信息被设置成要显示在监视器15b上(步骤S105,是),显示控制单元14则将输入信息显示在监视器15b上(步骤S106),例如在图7所示的屏幕710上。
操作显示单元15检测操作显示单元15是否接收了子区域的任一标准(步骤S107)。如果检测到操作显示单元15没有接收到子区域的任何标准(步骤S107,否),关键字提取单元12则从所有输入信息提取关键字(步骤S109)。
另一方面,如果检测到操作显示单元15接收到子区域的标准(步骤S107,是),关键字提取单元12则从指定的子区域提取关键字(步骤S108)。此时,用户可以通过以其手指接触子区域来指定子区域,并且,将该子区域拖放到检索屏幕来开始检索。
检索单元13在Web上检索与提取的关键字有关的信息。具体的,检索单元13将提取的关键字和搜索命令发送到数据库设备5,并使数据库设备5搜索与提取的关键字有关的信息。在接收到提取的关键字和搜索命令时,数据库设备5搜索与提取的关键字有关的信息,并将搜索到的信息经由网络4发送到文件检索设备10(步骤S110)。
当输入/输出单元16接收到来自数据库设备5的Web搜索的结果时(步骤S111,是),显示控制单元14将接收到的信息作为搜索结果显示在监视器15b的检索屏幕上,例如图7所示的屏幕730(步骤S112)。
以此方式,利用单个应用软件,文件检索设备10可以执行由扫描器1扫描的文件数据的区域划分,文本数据的分析,关键字的提取,数据的Web搜索,以及检索结果的显示。
由扫描器1扫描的文件数据和检索到的信息并列地显示在操作显示单元15的监视器15b上,这样的显示使得用户更容易将原始文件与基于该文件在Web上自动搜索到的检索信息进行比较。
在检索单元13重新执行信息检索时,最好是,显示控制单元14在检索屏幕上更新显示最新检索到的信息。
也可以不将文件图像显示在监视器15b上。换句话说,如果用户想仅观看检索到的信息,则不显示扫描数据屏幕,从而用户可以以全屏方式观看检索到的信息。
以此方式,包含了文件检索设备10的图像形成装置可以仅通过扫描文件而无需任何繁琐的键盘操作,容易地从网络上的数据库设备检索与扫描的文件的内容有关的信息。进一步,包含了文件检索设备10的图像形成装置可以以简单的操作从网络设备检索与电子媒体形式的扫描文件有关的信息。
如上所述,依据第一实施例,按属性将输入信息划分为多个子区域,并且,以构成输入信息的每个子区域为单位提取检索字。子区域显示在左侧的屏幕(第一屏幕)上,并且,通过用户将第一屏幕上的任一子区域移动到右侧的检索屏幕(第二屏幕)。基于移动到检索屏幕的子区域的检索字经由网络检索文件,并将检索到的文件显示在第二屏幕上。因此,用户可以容易地检索文件,并可再次使用所显示的检索到的文件。
图9为用于说明连接到输入/输出单元16的各种输入设备的框图。电荷耦合器件(CCD)摄像机(camera)1a连接到输入/输出单元16,从而输入/输出单元16可以从CCD摄像机1a接收目标的图形图像。在输入/输出单元16接收由CCD摄像机1a拍摄的图形图像时,区域划分单元11将该图形图像划分为子区域。可以从网络检索到与从每个图形图像子区域提取的关键字有关的信息。
手写输入板1b连接到输入/输出单元16,从而输入/输出单元16可以接收用户使用手写输入板1b手写的文本,作为文本数据。当输入/输出单元16接收到使用手写输入板1b输入的手写文本数据时,区域划分单元11将手写的文本数据划分为子区域。从通过应用OCR辨别为文本的每个文本子区域提取关键字。可以从网络检索与提取的关键字有关的信息。而且,可以利用手写输入板1b输入关键字或者修改文本数据。
卡读取/写入器1c连接到输入/输出单元16。卡读取/写入器1c从记录媒体读出数据,或向记录媒体写入数据,该记录媒体例如为,光盘(CD)、数字化视频光盘(DVD)、紧凑闪存(compact flash,CF)卡,以及安全数字(SD)存储卡。当输入/输出单元16接收到记录媒体中存储的、由卡读取/写入器读出的数据时,区域划分单元11将该数据划分为子区域。可以从网络检索到与从每个子区域提取的关键字有关的信息。
第一实施例涉及从输入设备接收信息。相同或类似的技术可以应用在将信息输出到输入设备时。也就是,输入/输出单元16可以配置来通过卡读取/写入器1c的帮助在记录媒体(例如CD、DVD、CF和SD存储器)上写入数据。
可选的,输入/输出单元16可以配置成经由网络4接收信息,并经由网络4发送检索到的信息。而且,输入/输出单元16可以配置成经由图像输出单元3输出检索到的信息,来将检索到的信息打印在记录纸张上。
最好是,关键字字典12a对其中存储的每个关键字的点击数(hit count)进行计数,从而可以将关键字与点击数关联地存储。从而,可以以使用频率的形式排列关键字,因此可以更快地提取关键字。
最好是,将关键字以按种类分类地方式存储在关键字字典12a中,从而可以高速地执行基于关键字的信息检索。
在每次关键字提取单元12执行关键字提取时,最好将满足预定点击数和预定文法条件的字符串登记在关键字字典12a中。这是因为,新的关键字是伴随时间或伴随经受检索的文件的类型的增加而出现的,同样,关键字的出现频率也随着时间改变。
此外,最好是,关键字提取单元12从每个文本子区域将出现频率超过一阈值的字提取出来,作为关键字。如果字具有较低的出现频率,则最大的可能是,不把该字作为关键字。
操作显示单元15可以配置成接收用于设置要提取的关键字的数量的输入。通过控制关键字的数量,可以限缩或放宽检索的范围。
如果关键字的设定数量大于文本子区域中包含的字的数量,则最好是,关键字提取单元12将所有的字提取作为一关键字。例如,如果文件主要包含照片和图表,则其可以仅是标题,即,包含在该文件中的文本数据是标题。在此情况下,将所有检测到的字选择作为关键字。
图10为包含了文件检索设备10的图像形成装置的外部透视图。以下参考图10说明图像形成装置执行的图像形成操作。该图像形成操作是一种已知的技术,因此以下简单的说明该图像形成操作。
假设图像形成装置为数字复印机100。数字复印机100包括打包器(package)110、大容量托盘(large capacity tray,LCT)111、文件处理器(finisher)112、文件自动进给器(auto document feeder,ADF)113、操作单元114以及纸张进给单元115。LCT 111中拥有大容量的记录纸张。文件处理器112对复印的记录纸张进行拣选(sort)、穿孔以及分类(staple)。ADF 113和操作单元114安装在打包器110的上面。要扫描的文件放在ADF 113上。操作单元114从用户接收设置指令,例如用于扫描模式的设置、用于复印缩放比例的设置、用于托盘的设置以及用于要由文件处理器12执行的后处理的设置,并在其上对用户显示消息。操作单元114可以作为操作显示单元15工作。
纸张进给单元115布置在打包器110的较低部位。文件处理器112包括纸张排出托盘117。数字复印机100包含许多机构,例如曝光系统,显影系统、定影系统以及纸张排出系统,从而实现复印机的功能。
在将文件放在ADF113上并且用户按下操作单元114的“复印开始”键时,文件被进给到在ADF 113下的曝光玻璃(图未示)上,并且被照明系统(图未示)和光学成像系统(图未示)扫描。在正常的图像形成操作的情况下,可以将各种处理(例如,修正)应用于扫描的图像数据,并且,写入系统中的激光二极管基于图像数据发出光束,从而在感光器(图未示)上形成静电潜像。
在包含了文件检索设备10的数字复印机100中,区域划分单元11、关键字提取单元12、检索单元13和显示控制单元14分别执行上述针对扫描的图像数据说明的各种操作,检索到的信息显示在监视器15b上。
然后,执行电子照相处理。基于用户输入到操作单元114的指令,将扫描的图像数据或检索到的信息打印在通过纸张进给单元115或纸张进给单元116进给的记录纸张上,通过文件处理器112将后处理(例如,拣选、穿孔或分类)应用于打印后的纸张,然后排出到纸张排出托盘117上。
图11为包含了依据本发明第二实施例的文件检索设备20的图像形成装置的框图。文件检索设备20和文件检索设备10之间的差异在于,文件检索设备20包括显示控制单元24,而不是显示控制单元14,并且进一步包括统一资源定位符(URL)访问单元27。图11中所示的与图1所示的相同的部分采用相同的附图标记表示,并省略这些部分的描述。URL访问单元27从检索单元13获得的检索到的信息提取URL,并访问提取的URL来下载可用于具有URL的站点的信息。显示控制单元24将URL访问单元27下载的信息显示在带有浏览器的监视器15b上。
图12为在图11的监视器15b上显示的内容的放大图。具体的,通过点击检索屏幕上显示的URL获得的下载信息被显示在监视器15b上。基于提取的关键字从Web站点检索的大部分信息包含URL。检索到的信息显示在监视器15b右侧的屏幕1210上。例如,当用户双击屏幕1210上显示的URL 1211时,监视器15b接受对于URL 1211的操作输入。URL访问单元27访问经由输入/输出单元16接收的URL来将上载到具有URL 1211的站点的信息下载下来,显示控制单元24将下载的信息显示在带有浏览器的监视器15b左侧的屏幕1220上。
对于显示在检索到的信息的页边上的URL,以与URL 1211情况相同的方式,在用户双击在URL上时,上载到具有该URL的站点的信息被下载显示在屏幕1220上。
以此方式,URL访问单元27经由网络4检索包含在检索到的信息中的、可用于包含URL的站点的信息,从而可以检索更详细的信息。
图13为包含了依据本发明第三实施例的文件检索设备30的图像形成装置的框图。文件检索设备30和文件检索设备10之间的差异在于,文件检索设备30包括检索单元33、显示控制单元34和操作显示单元35,分别代替检索单元13、显示控制单元14和操作显示单元15。图13所示的与图1所示的相同的部分以相同的附图标记表示,并省略这些部分的描述。操作显示单元35包括操作单元35a和监视器35a。操作单元35a从用户接收操作输入,用于指定多个关键字的组合。检索单元33创建搜索命令来使数据库设备5检索与接收到的关键字的组合有关的信息,并将创建的与该关键字相关的搜索命令发送到数据库设备5。因此,如果需要,用户可以设置检索的范围,也就是可以设置来放宽、限缩或者限定在放宽的范围内,因此,可以依据用户的设置检索信息。
操作单元35a接收操作输入,该操作输入用于相对于显示的关键词指定AND搜索、OR搜索或AND搜索与OR搜索的组合中的任何一个。检索单元33创建搜索命令来指定搜索的范围,从而,可以更精确地检索信息。
可选择地,操作单元35a可以配置来接收用于指定多个子区域的操作输入,以及用于指定指定的子区域的组合的操作输入。例如,如果将AND搜索应用于图7所示的文本子区域712和713,则检索单元33基于从字符图像区域712和713提取的命令关键字执行信息检索。另一方面,如果将OR搜索应用于文本子区域712和713,则检索单元33基于从文本子区域712和713提取的任一关键字执行信息检索。以此方式,可以基于从子区域的组合提取的关键字的组合检索信息,从而可以以子区域为单位来限缩关键字,或者,可以放宽信息检索的范围。因此,可以通过灵活地限缩关键字来检索信息。
在设置了子区域的组合时,检索单元33通过基于从子区域的组合提取的关键字的组合发出搜索命令来执行信息检索。此时,用户不需要设置关键字。用户仅指定子区域的组合。因此,用户可以减少操作输入的次数。
操作显示单元35可以配置来接收用于选择关键字短语(key phrase)的输入。在某些情况下,关键字短语自身是基本的关键字。因此,在操作显示单元35配置来接收用于指定关键字短语的输入时,可以更精确地检索信息。在此情况下,检索单元13基于该关键字短语执行信息检索。作为以关键字短语进行信息检索的方法的示例是:确定多个关键字的顺序,并且以将AND搜索应用于排序后的关键字的方式来检索信息。
在经由监视器15b指定了位于图形图像子区域附近的文本子区域时,从指定的文本子区域提取关键词,并且基于与图形图像相关的关键字来检索信息。因此,可以检索与图形图像相关的关键字有关的信息。
例如,在用户以其手指拖拉要通过图7所示的图形图像子区域711的多个子区域并将子区域放入检索屏幕时,从文本子区域提取与图形图像子区域711有关的关键字,并基于该关键字检索信息。
在此示例中,图形图像子区域711的图形图像可以和与其相关的检索到的信息并列地显示在检索屏幕上,从而,可以以相关的方式显示检索到的信息和图形图像。
图14为包含了依据本发明第四实施例的文件检索设备40的图像形成装置的框图。文件检索设备40和文件检索设备10之间的差异在于,文件检索设备40包括显示控制单元44而不是显示控制单元14,并且另外包括一致性(identity)确定单元47。图13所示的与图1中所示的相同的部分采用相同的附图标记表示,并省略这些部分的描述。一致性确定单元47确定扫描器1扫描的图像数据是否与从数据库设备5接收的检索到的信息相同。如果图像数据与检索到的信息相同,则显示控制单元44以不同于检索到的信息与图像数据不同时的显示格式,将与图像数据相同的检索到的信息显示在监视器15b上。
一致性确定单元47将扫描的图像数据中的预定数量的字符串与接收到的HTML格式的字符串进行比较。通过将扫描的图像数据的字符代码与检索到的信息进行比较,可以容易地确定扫描的图像数据是否与检索到的信息的内容匹配。具体的,可以通过将预定数量的字符串(该预定数量的字符串包围扫描的图像数据中的提取的关键字)和与该关键字有关的检索到的信息进行比较的方式,确定扫描的图像数据是否与检索到的信息匹配。
例如,在从Web上的电子数据检索到与扫描器1扫描的报纸文章对应的电子数据时,将检索到的电子数据显示在监视器15b上。换句话说,在从Web上的电子数据检索到电子数据(此电子数据具有与扫描的报纸文章相同的内容)时,将检索到的电子数据显示在监视器15b上,因此,实际上可以将模拟信息转化为数字信息。
在依据第四实施例的文件检索设备40的变形例中,数据库设备5确定检索到的信息是否与接收到的包含了关键字的文件数据匹配,并在检索到的信息与文本数据匹配时将检索到的信息发送到文件检索设备40。显示控制单元44可以配置来将检索到的信息连同表示检索到的信息与扫描的文件数据匹配的信息一起,显示在监视器15b上。顺便提一句,在采用这样的配置时,不必在文件检索设备40中提供一致性确定单元47。
依据第四实施例的变形例,检索单元13将关键字连同包围该关键字的预定数量的字符串一起发送到数据库设备5。在接收到该关键字和字符串时,数据库设备5将接收到的包含了该关键字的字符串和与该关键字有关的检索到的信息进行比较,从而,数据库设备5可以确定检索到的信息是否与包含了接收到的字符串的文件数据匹配。如果检索到的信息与文件数据匹配,则数据库设备5将检索到的信息连同表示检索到的信息与文件数据匹配的信息一起发送。
例如,在从Web上的电子数据检索到与扫描器1扫描的报纸文章对应的电子数据时,将检索到的电子数据显示在监视器15b上。换句话说,从Web上的电子数据检索到具有与扫描的报纸文章相同内容的电子数据。在此情况下,文件检索设备40可以排除一致性确定单元47。
以下说明依据本发明第五实施例的文件检索设备。依据第五实施例的文件检索设备具有与图14所示的文件检索设备40相同的配置。在依据第五实施例的文件检索设备中,显示控制单元44控制多个关键字以开关按钮(togglebutton)(窗口小部件,widget)的形式显示在工具栏上。用户通过经由操作显示单元15选择任一显示的开关按钮来指定关键字。检索单元13基于与所选开关按钮对应的关键字来执行信息检索。开关按钮为用于指定关键字的屏幕元素。
图15A为包含了依据本发明第五实施例的文件检索设备的监视器15b上显示的内容的放大图。显示控制单元44在监视器15b左侧的屏幕1510上显示划分为子区域的扫描数据,也以包含在屏幕1510中的工具栏1520上的开关按钮的形式显示由关键字提取单元12从子区域提取的关键字1521至1524。例如,在用户通过触摸输入指定关键字1521至1524中的任何一个时,检索单元13基于指定的关键字执行信息检索,并且,显示控制单元44将检索到的与该关键字有关的信息显示在监视器15b右侧的屏幕1530上。
用户可以通过选择多个开关按钮来指定多个关键字,并且,AND搜索和OR搜索应用于关键字来检索信息。
而且,如果用户重新输入关键字,则可以另外将用于指定该输入的关键字的开关按钮显示在工具栏1520上。其结果是,用户可以如期望地输入关键字。
此外,如果手写输入板1b可用,一旦辨别了用户的手写字,则可以将该手写字用作新的关键字。
具体的,在用户按下用于指定手写输入的特定按钮时,显示控制单元44在监视器15b上显示如图15B所示的关键字手写输入。用户利用手写输入板1b将字手写在关键字手写输入屏幕的手写区上,作为额外的关键字。依据第五实施例的文件检索设备进一步包括手写字辨别单元,从而,手写字辨别单元辨别用户手写的字,并将辨别的字作为关键字输出显示在字辨别结果区上。如果显示的字辨别的结果是正确的,则用户利用手写输入板1b按下关键字输入屏幕上的“OK”按钮。其结果是,在工具栏1520上另外地显示开关按钮,该开关按钮用于作为关键字的辨别字。
另一方面,如果显示的字辨别的结果是错误的,则用户利用手写输入板1b按下关键字手写输入屏幕上的“CANCEL”按钮。其结果是,手写输入区上显示的手写字被清除。用户需要再次手写该字。
图16为监视器15b上显示的内容的放大图,该监视器15b包含在依据第五实施例的变形例的文件检索设备中。在此变形例中,显示控制单元44将检索到的信息以开关按钮的形式显示在监视器15b上。在用户点击开关按钮时,可以以全屏方式在监视器15b上显示与检索到的与开关按钮对应的信息。
如图16所示,在监视器15b右侧的屏幕1610上显示了多条检索到的信息。在监视器15b左侧的屏幕1620上显示的开关按钮1621至1624分别对应于屏幕1610上显示的检索到的信息。例如,在用户点击开关按钮1621时,与开关按钮1621对应的报纸文章显示在开关按钮1621至1624区之下的屏幕1620上。
依据第五实施例的变形例的文件检索设备以开关按钮的形式显示检索到的信息的列表,从而,用户可以容易地确认该列表。此外,与所选开关按钮对应的检索到的信息可以与检索到的信息的详细信息并列地显示。此时,扫描的文件图像或开关按钮的列表可以明显地消失,对监视器15b隐藏。
此外,显示控制单元44可以配置来以开关按钮的形式显示检索单元13检索到的信息的URL。在采用这样的配置时,如果用户点击开关按钮形式的URL中的任何一个,则依据第五实施例的变形例的文件检索设备可以访问该URL来下载信息。
此外,显示控制单元44可以仅以开关按钮的形式表示用户拖放到监视器15b左侧中的检索到的信息,也就是,仅仅由用户确定为必要信息的信息才能以开关按钮方式简单地表示。
图17为包含了依据本发明第六实施例的文件检索设备60的图像形成装置的框图。文件检索设备60与文件检索设备10之间的差异在于,文件检索设备60包括输入/输出单元66(而不是输入/输出单元16)以及显示控制单元64(而不是显示控制单元14),并且另外包括存储单元67。图17中所示的与图1中相同的部分以相同的附图标记表示,并且省略这些部分的描述。输入/输出单元66将检索单元13检索到的信息中包含的URL发送到其他的网络附加信息处理设备,例如PC6。PC6经由网络4连接到文件检索设备60,从而,PC6可以自动接收包含在接收到的信息中的URL,并共享网络4上的信息。
如上所述,包含在依据第五实施例的文件检索设备中的显示控制单元44以开关按钮形式显示检索单元13检索到的信息中的URL。依据第六实施例,输入/输出单元66将开关按钮形式的URL发送到PC6。其结果是,经由网络4连接到文件检索设备60的PC6可以共享网络4上的包含在检索到的信息中的URL。可以在经由操作单元15a接收到操作输入时发送该URL,或者,在将该URL添加到工具栏时自动发送该URL。
存储单元67将检索到的信息存储于其中。输入/输出单元66将存储单元67中存储的检索到的信息发送到PC6。从而,经由网络4连接到文件检索设备60的PC6可以自动地接收检索到的信息,并共享网络4上的信息。
PC6可以以开关按钮形式在监视器上显示接收到的信息或共享的信息,例如开关按钮、与开关按钮对应的信息以及检索到的信息。此外,可以通过用户的拖放操作将显示的开关按钮插入到PC6中开放的应用中。其结果是,可以在连接到网络4的信息处理设备中共享地且自由地使用检索到的信息。
图18为包含在文件检索设备60中的监视器15b上显示的内容的放大图。显示控制单元64将检索到的信息显示在监视器15b右侧的屏幕1810上,并以窗口小部件栏(widget bar)形式将与检索到的信息分别对应的开关按钮1821至1824显示在监视器15b左侧的屏幕1820上。
输入/输出单元66将开关按钮1821至1824以及与开关按钮1821至1824对应的检索到的信息发送到PC6。从而,经由网络4连接到文件检索设备60的PC6可以自动地接收开关按钮和与开关按钮对应的检索到的信息,并通过在网络上揭露检索到的信息而共享检索到的信息。
在从输入/输出单元66接收到开关按钮和检索到的信息时,PC6以图18所示的方式以窗口小部件栏形式显示开关按钮,从而,PC6的用户可以自由地使用共享的检索到的信息。
图19为包含了依据本发明第七实施例的文件检索设备的图像形成装置的框图。文件检索设备70与文件检索设备10的差异在于,文件检索设备70包括输入/输出单元76(而不是输入/输出单元16)和显示控制单元74(而不是显示控制单元14),并且另外包括编辑单元和电子邮件创建单元78。与图1所示的相同的部分以相同的附图标记表示,并省略这些部分的描述。在操作显示单元15接收到用于在监视器15b上编辑检索到的信息的操作输入时,编辑单元编辑检索到的信息。显示控制单元74将编辑单元编辑的检索到的信息显示在监视器15b上。电子邮件创建单元78创建电子邮件信息,该电子邮件信息包含了编辑单元编辑的检索到的信息的内容。
输入/输出单元76输出由编辑单元编辑并且由显示控制单元74显示在监视器15b上的检索到的信息。以此方式,可以编辑显示的检索到的信息,并可以将编辑后的检索到的信息用于其他目的。例如,电子邮件创建单元78创建电子邮件消息,该电子邮件消息包含了编辑后的检索到的信息的内容。创建的电子邮件消息通过输入/输出单元76发出。
图20为监视器15b上显示的内容的放大图,在监视器15b上显示了电子邮件消息,该电子邮件消息包含了编辑后的检索到的信息的内容。如图20所示,检索到的信息显示在监视器15b左侧的屏幕2010上。屏幕2010上的检索到的信息包括图形子区域2011和文本子区域2012。电子邮件创建屏幕2020布置在监视器15b右侧。电子邮件创建屏幕2020包括电子邮件消息区域2021和附件箱(attachment box)2022。在将图形子区域2011拖放到附件箱2022中并将文本子区域2012拖放到电子邮件消息区域2021中时,电子邮件创建单元78创建与文本子区域2012的内容相同的电子邮件消息,带有与图形子区域2011相同图形图像的附件。
另外,可以以可扩展标记语言(XML)格式、HTML格式、文本格式等中任何一种格式创建电子邮件消息。图形图像可以直接附贴到电子邮件消息。此外,电子邮件创建单元78可以创建转化成了多用途的网际邮件扩充协议(MIME)消息的电子邮件消息。
以此方式,在依据第七实施例的文件检索设备70中,利用单个应用软件,可以由扫描器1扫描文件,自动地从扫描的文件数据提取关键字来检索Web上与提取的关键字有关的信息,检索到的信息显示在监视器15b上,并且用户可以发送其中编辑了检索到的信息的电子邮件。从而,文件检索设备70可以提高用户友好度。
图21为包含了依据本发明第八实施例的文件检索设备80的图像形成装置的框图。文件检索设备80与文件检索设备10的差异在于,文件检索设备80包括输入/输出单元86(而不是输入/输出单元16),显示控制单元84(而不是显示控制单元14)以及检索单元83(而不是检索单元13),并且另外包括图像特征提取单元87。与图1所示的相同的部分采用相同的附图标记表示,并省略这些部分的描述。图像特征提取单元87提取在构成扫描的文件数据的每个子区域中包含的数据的特征。检索单元83经由网络4将提取的特征、以及用于检索与提取的特征有关的信息的指令发送到数据库设备85。在接收到该指令时,数据库设备85搜索与提取的特征有关的信息,并将搜索到的信息经由网络4发送到文件检索设备80。在接收到该信息时,显示控制单元84将检索到的信息作为检索结果显示在监视器15b上。
图像特征提取单元87从一图形子区域中包含的图像数据提取图像特征,例如,图案特征、色彩特征以及对比度特征,其中,该图形子区域的属性已由区域划分单元11分析为图形图像,或,图像特征提取单元87从与该图形图像有关的文本数据提取特征。
图像特征提取单元87提取的图像特征被用作由矢量值表示的检索关键字。检索单元83将该矢量值作为图像数据的图像特征经由网络4发送到数据库设备85。
数据库设备85选择存储的图像数据中的一个,该图像数据的矢量值具有到一矢量空间中接收到的矢量值的最短距离,该矢量空间具有图像检索功能,并且,数据库设备85将所选的图像数据发送到文件检索设备80,作为检索到的图像数据。这种图像检索方法对于本领域普通技术人员而言是公知的,因此省略其详细描述。
图22为监视器15b上显示的内容的放大图,其中,文件检索设备80检索到的图像数据显示在监视器15b上。区域划分单元11分析一文件图像,该文件图像由扫描器1扫描并显示在监视器15b左侧的屏幕2210上,并且区域划分单元11识别了该文件图像包含图形图像2211和2212。图像特征提取单元87从图形图像2211和2212提取图像特征,也就是,计算图形图像2211和2212的矢量值。
利用该图像检索功能,数据库设备85选择存储的图像数据中的一个,该图像数据的矢量值具有到要经受检索的接收到的矢量值的最短距离,并且,数据库设备85将选择的图像数据作为检索到的图像数据发送到文件检索设备80。在从数据库设备85接收到检索到的图像数据时,显示控制单元84将检索到的图像数据显示在监视器15b右侧的屏幕2220上。
以此方式,在依据第八实施例的文件检索设备80中,从由扫描器1扫描的文件图像自动地提取图像特征,并基于该图像特征检索网络上的图形图像,检索到的图形图像被下载显示在监视器15b上。因此,包含文件检索设备80可以仅通过扫描一图形来检索网络上的相关图形图像。
如图22所示,最好是,显示控制单元84将检索单元83检索到的图形图像与扫描器1扫描的图形图像并列地显示在监视器15b上。相比检索文本数据的情况,图形图像数据可以基于不确定的元素(例如图像特征)而检索到,从而,可以便于用户观看与扫描的图像数据并列的检索到的图形图像。
依据第八实施例的变形例的文件检索设备可以通过使用多种搜索方法检索信息。依据第八实施例的变形例的文件检索设备具有与文件检索设备80相同的配置,从而,以下参考图22说明依据第八实施例的变形例的文件检索设备的操作。
在检索文本数据的情况下,检索单元83基于提取的关键字检索文本数据。在检索图形数据的情况下,检索单元83基于由图像特征提取单元87从一图形提取的图像特征来检索图形数据。此外,在检索文件数据的情况下,检索单元83发送搜索命令,用于限制要被检索的文件数据的范围。
例如,文件数据的范围可以限制在报纸文章、杂志文章或者可用于Web上公开的信息。在接收到搜索命令时,数据库设备85在搜索命令指示的范围内搜索文件数据。另一方面,在检索图形数据的情况下,通过使用如第八实施例中说明的图形数据检索方法来检索图形数据。
图23为监视器15b上显示的内容的放大图,其中,由依据第八实施例的文件检索设备检索到的信息显示在监视器15b上。由扫描器1扫描的文件图像显示在监视器15b左侧的屏幕2310上。屏幕2310上显示的任一子区域被用户拖放在监视器15b右侧的检索屏幕2320中。
在任一子区域被用户拖放到Web搜索屏幕2321中时,如果Web上存在与子区域中包含的数据有关的任何数据,则该有关的数据被检索并显示在Web搜索屏幕2321上。在任一子区域被用户拖放到新闻搜索屏幕2322中时,如果存在与子区域中包含的数据有关的任何新闻文章时,该新闻文章数据被检索并显示在新闻搜索屏幕2322上。在任一子区域被用户拖放到图形图像搜索屏幕2323中时,如果存在与子区域中包含的数据有关的任何图形图像时,该图形图像数据被检索并显示在图形图像搜索屏幕2323上。
在操作显示单元15接收到这样的多个拖放操作输入来分别拖放多个子区域到不同的搜索屏幕中时,检索单元83依据与拖放了子区域的搜索屏幕对应的搜索方法来检索信息。
在此情况下,检索到的文本数据和图形数据可以被并列地显示。即使文本数据和图形数据的属性彼此不同,但文本数据和图形数据的内容彼此相同。所以,具有相同主题的文本数据和图形数据并列显示在监视器15b上,从而提高用户友好度。
依据本发明第九实施例的文件检索设备90被应用于PC(此后称为PC90)。例如,打印机驱动器被安装在PC90上,并且要打印出的数据被显示在PC90的监视器上。PC90从用户接收一输入,用于例如采用鼠标或者指示器来选择监视器上显示的数据的任一子区域。在接收到用户的输入时,PC90从所选子区域中包含的数据提取关键字来在网络上检索与提取的关键字有关的信息,并将检索到的信息显示在监视器上。
图24为依据第九实施例的PC90的框图。PC90包括作为输入/输出(I/O)接口的输入/输出单元96、键盘95a1、鼠标95a2、监视器95b、硬盘驱动器(HDD)7以及图像输出单元3。图像输出单元3将图像输出到打印机8,并同时用作能连接到其他输入设备的接口。在此情况下,图像输出单元3连接到打印机8。与图1中用于第一实施例相同的部分采用相同的附图标记表示,并省略这些部分的描述。
PC90进一步包括区域划分单元91、关键字提取单元92、检索单元93以及显示控制单元94。包含在PC90中的中央处理单元(CPU)(图未示)从HDD7读取文件检索程序,并在随机存取存储器(RAM)(图未示)上展开该文件检索程序来执行该文件检索程序。
输入/输出单元96输出以页面描述语言(page description language,PDL)描述的数据。将以PDL描述的数据按各种数据属性(例如,文本、图表、诸如位图图像的图形图像等)分类。从而,通过读出以PDL描述的数据,区域划分单元91可以获得该数据的数据属性。区域划分单元91按每种数据属性将数据图像划分为子区域。
作为以PDL描述的数据的示例,在接收到以下数据时,
72 72 moveto
/Times-Bolditalic 24 selectfont
(Taro Yamada)
show
showpage
依据PDL描述,显示控制单元94读出表示Times-Bold斜体字体的上述字符串,该Times-Bold斜体字体的大小为24点(point)且在位置(72,72)上被选择,并显示“Taro Yamada”。
作为以PDL描述的数据的另一示例,在接收到以下数据时,
newpath
144 72 moveto
144 432 lineto
stroke
showpage
依据PDL描述,显示控制单元94读出上述字符串,上述字符串表示直线从位置(144,72)绘制到位置(144,432)。
如上所述,在PC 90执行区域划分处理时,PC90不必执行构成图像数据的每个子区域的属性分析的字符辨别,该字符辨别由依据第一至第八实施例的文件检索设备执行。通过读出以PDL描述的数据,相比依据第一至第八实施例的文件检索设备,PC90可以容易地执行区域划分处理。
以PDL描述的数据被读出,并且被按每种数据属性划分为子区域,然后由显示控制单元94显示在监视器95b上。用户可以采用键盘95a1或鼠标95a2,或通过经由监视器95b的触摸输入,选择监视器95b上显示的任一子区域。用户也可以经由监视器95b输入指令。
以第一实施例中说明的相同的方式,关键字提取单元92提取关键字,并且检索单元93将提取的关键字和搜索命令经由网络4发送到作为数据库服务器的数据库设备5。在从数据库设备5接收到与该关键字有关的信息时,显示控制单元94将检索到的信息显示在监视器95b上。而且,以上述实施例中说明的相同的方式,并列地显示以PDL描述的输入数据和检索到的信息。
当在监视器95b上显示检索到的信息时,如果图像输出单元3经由键盘95a1等从用户接收到打印输出命令,则图像输出单元3运行驱动器程序使打印机打印输出检索到的信息。这也可以创建并发送包含了检索到的信息的内容的电子邮件信息。
图25为用于说明PC90执行的文件检索处理的流程图。区域划分单元91接收以PDL描述的信息,并基于PDL描述读出数据属性和信息的子区域(步骤S201)。区域划分单元91按依据PDL描述读取的每种数据属性将信息分为子区域(步骤S202)。随后的步骤与图8所示的用于第一实施例的步骤S104相同,并省略步骤S104的描述。
以此方式,在依据第九实施例的PC90中,在接收到以PDL描述的数据时,基于PDL描述读出数据的数据属性,将数据按每种数据属性划分为子区域,从包含在数据属性为文本的每个子区域中的数据提取关键字,并检索与提取的关键字有关的信息。因此,如果输入文件为PDL形式,则PC90可以容易地从网络上的许多数据库设备检索与该文件的内容有关的信息,而无需任何繁琐的键盘操作。依据第九实施例,PC可以以简单的操作检索与电子媒体形式的内容有关的信息。
依据第九实施例的PC90可以配置来处理以不是PDL的语言描述的数据。只要可以通过应用软件读出数据属性和数据的子区域,PC90就可以应付任何其他语言描述的数据。
依据本发明第十实施例的移动电话包括CCD摄像机和监视器。从CCD摄像机摄取的图形图像提取关键字来在网络上检索与提取的关键字有关的信息。检索到的信息显示在监视器上。
图26为依据第十实施例的移动电话的框图。移动电话150包括CCD摄像机151、图像处理单元152、区域划分单元161、关键字提取单元162、检索单元163、显示控制单元164、监视器165b、操作单元165a、输入/输出单元166、以及天线153。
图像处理单元152处理CCD摄像机151摄取的图形图像,例如对该图形图像进行数字转换或者伽马转换。例如,图像处理单元152将该图形图转换为作为图像数据的位图图像,并经由输入/输出单元166将图像数据输出到区域划分单元161。
以与依据第一至第九实施例的区域划分单元相同的方式,区域划分单元161将接收到的数据划分为包含文本图像的文本子区域和包含不是文本图像的图像的子区域。关键字提取单元162以与依据第一至第九实施例的关键字提取单元相同的方式提取关键字。检索单元163检索与基于第一至第九实施例的检索单元相同的方式提取的关键字有关的信息。显示控制单元164以与依据第一至第九实施例的显示控制单元相同的方式将检索到的信息显示在监视器165b上。
输入/输出单元166经由天线153接收/转发网络上的信息。此外,输入/输出单元166经由耳机(图未示)输出语音信息,经由扬声器电话(图未示)收集语音信息,并且也通过应用例如为代码激励线性预测(code excited linearprediction,CELP)的语音转换经由天线153在通信线路上建立通信。
如上所述,在依据第十实施例的移动电话150中,由CCD摄像机151摄取图像,从该图像提取关键字来检索与提取的关键字有关的信息,并将检索到的信息显示在监视器165b上。
检索单元163可以配置成包括图像特征提取功能,从而,经由网络4连接到移动电话150的数据库设备5可以基于CCD摄像机151摄取的图像特征来搜索网络上的任何相关的图形图像。检索到的图形图像显示在监视器165b上。
图27为用于说明包含了依据本发明第一实施例的文件检索设备10的图像形成装置的硬件配置的框图。图像形成装置为多功能产品(multifunctionproduct,MFP),该多功能产品包括多种功能,例如传真机和扫描器。如图27所示,在该MFP中,控制器2710经由周边元件扩展接口(PCI)总线连接到引擎单元1260。控制器2710用于控制来自FCU接口(I/F)1230或操作单元2720的输入,从而控制整个MFP、图像显示、图像处理、文件检索等。引擎单元1260(例如,图像处理引擎)能连接到PCI总线,并相对于检索到的图像数据执行图像处理,例如,误差扩散或伽马转换。
控制器2710包括CPU2711、北桥(NB)1213、系统存储器(MEM-P)1212、南桥(SB)1214、本地存储器(MEM-C)1217、特定用途集成电路(ASIC)1216以及HDD1218。NB1213经由加速图形接口(AGP)总线1215连接到ASIC 1216。MEM-P 1212包括只读存储器(ROM)1212a和随机访问存储器(RAM)1212b。
CPU 2711控制整个MFP,并且包括构成NB 1213的芯片组、MEM-P 1212以及SB 1214。CPU 2711经由该芯片组连接到其他设备。
NB 1213为用于将CPU 2711连接到MEM-P 1212、SB 1214和AGP总线1215的桥。NB 1213包括存储器控制器,该存储器控制器用于控制对MEM-P1212、主PCI以及AGP目标(target)的读/写。
MEM-P 1212为用于存储程序和数据的系统存储器,同时也展开程序和数据。ROM 1212a为用于存储程序和数据的只读存储器。RAM 1212b为用于展开程序或数据的可写/读的存储器,同时也在图像处理时绘制图像。
SB 1214为将NB 1213连接到PCI设备和外围设备的桥。SB 1214经由PCI总线连接到NB 1213。FCU I/F 1230等连接到PCI总线。
ASIC 1216为用于处理多媒体信息的集成电路(IC),也就是,包括用于处理多媒体信息的硬件元件。ASIC 1216同样用作将AGP总线1215连接到PCI总线、将HDD 1218连接到MEM-C 1217的桥。
通用串行总线(USB)1240和电子和电气工程师协会(IEEE)1394 I/F 1250经由PCI总线连接到ASIC 1216,PCI总线处在PCI目标、主AGP、形成ASIC1216的核心的判优器(ARB)、用于控制MEME-C 1217的存储器控制器、多个以硬件逻辑旋转图像数据的直接存储器访问控制器(direct memory accesscontroller,DMAC)以及引擎单元1260之间。
MEM-C 1217为用作发送图像缓存器或代码缓存器的本地存储器。HDD1218为存储器,其中存储了图像数据、程序、字体数据、窗体。
AGP总线1215是用于为高速图形处理而制造的图形加速器卡的总线接口。图形加速器卡通过以高的吞吐量直接访问MEM-P 1212来获得高速图形处理。
连接到ASIC 1216的操作单元(触摸板)2720从用户接收操作输入,并将与接收到的操作输入有关的信息发送到ASIC 1216。
由依据第一实施例的MFP执行的文件检索程序预先存储在ROM或类似存储装置中。
可选择的,要由依据第一实施例的MFP执行的文件检索程序可以以可安装且可执行的文件的形式存储于计算机可读媒体,例如,光盘只读存储器(CD-ROM)、软盘(FD)、可记录光盘(CD-R)和数字化视频光盘(DVD)。
此外,要由依据第一实施例的MFP执行的文件检索程序可以存储在连接到例如为互联网的网络的计算机上,并经由该网络下载到MFP。而且,要由依据第一实施例的MFP执行的图像显示程序和图像形成程序可以经由例如为互联网的网络提供或发布。
要由依据第一实施例的MFP执行的文件检索程序由包括上述单元(例如,区域划分单元11、关键字提取单元12、检索单元13、显示控制单元14等)的多个模块组成。对于实际的硬件,CPU(处理器)从ROM读出文件检索程序并执行文件检索程序,因此将上述单元载入主存储单元上,从而在主存储单元上创建这些单元,例如区域划分单元11、关键字提取单元12、检索单元13以及显示控制单元14。
图28为用于说明依据第九实施例的PC 90的硬件配置的框图。如图28所示,PC 90具有公共的硬件配置,包括控制单元(例如,CPU 2301)、存储单元(例如,ROM 2302和RAM 2303)、外部存储单元(例如,HDD和CD驱动器)、显示单元2305(例如,监视器)、输入单元2306(例如,键盘和鼠标)、通信I/F 2307、以及用于将上述单元彼此连接的总线2308。
要由依据第九实施例的PC 90执行的文件检索程序以可安装且可执行的文件的形式存储于计算机可读媒体,例如,CD-ROM、FD、CD-R和DVD。
此外,要由PC 90执行的文件检索程序可以存储在连接到例如为互联网的网络的计算机上,并经由网络下载到PC 90。而且,要由PC 90执行的文件检索程序可以经由例如为互联网的网络提供或发布。此外,要由PC 90执行的文件检索程序可以预先存储在ROM或者类似存储装置中。
此外,要由PC 90执行的文件检索程序由包含上述单元(例如,区域划分单元11、关键字提取单元12、检索单元13、显示控制单元14等)的多个模块组成。对于实际的硬件,CPU(处理器)2301从存储单元读出文件检索程序并执行文件检索程序,因此将上述单元载入主存储单元上,从而在主存储单元上创建这些单元,例如区域划分单元11、关键字提取单元12、检索单元13以及显示控制单元14。
以此方式,如本发明的实施例,如上说明了图像形成装置、PC和移动电话的情况。上述实施例和变形例仅为用于说明本发明的示例,本发明并不陷于上面说明的实施例和变形例。
如上所述,依据本发明的用于信息检索的设备、方法以及计算机程序产品用于文件检索,尤其是在从非数字信息检索数字信息时。
尽管已相对于用于完整清楚揭露的特定实施例描述了本发明,但并不因此限制所附的权利要求,而是仅构架来具体化对于本领域普通技术人员而言明显落入这里阐明的基本教导中的所有变更和可选的架构。
Claims (16)
1.一种信息检索设备,其连接到网络,所述信息检索设备包括:
显示单元,包括显示从输入单元接收到的输入信息的第一屏幕,以及显示检索结果的第二屏幕,第一屏幕和第二屏幕能从用户接收操作输入;
区域划分单元,将输入信息按每种信息属性划分为多个子区域;
提取单元,从每个子区域中的输入信息提取检索关键字;
显示控制单元,将子区域中的输入信息显示在第一屏幕上,并接收用于指定要被移动到第二屏幕的第一屏幕上显示的任一子区域的指令;以及,
检索单元,基于与移动到第二屏幕的子区域对应的检索关键字通过网络检索信息,其中,
显示控制单元将检索到的信息显示在第二屏幕上。
2.如权利要求1所述的信息检索设备,其中,
子区域包括文本子区域和非文本子区域,文本子区域包括文本图像,非文本子区域包括不是文本图像的图像,
提取单元从包括在文本子区域中的文本图像提取关键字,作为检索关键字,以及,
检索单元,在文本子区域被移动到第二屏幕时,基于从包括在文本子区域中的文本图像提取的关键字通过网络检索信息。
3.如权利要求2所述的信息检索设备,其中,除了子区域中的输入信息外,显示控制单元还将指定提取单元所提取的关键字的指令显示在第一屏幕上。
4.如权利要求3所述的信息检索设备,其中,在用户通过第一屏幕选择所述指令时,检索单元基于该指令中指定的关键字通过网络检索信息。
5.如权利要求3所述的信息检索设备,其中,
在由提取单元从多个文本子区域中包括的文本图像提取多个关键字时,除了划分为子区域的输入信息外,显示控制单元还将分别指定该关键字的多个指令显示在第一屏幕上;以及,
在用户通过第一屏幕选择指令时,检索单元通过将逻辑AND或逻辑OR应用于指令中指定的关键字来经由网络检索信息。
6.如权利要求3所述的信息检索设备,其中,在接收到用户输入的新的关键字时,除了用于指定提取单元提取的关键字和划分为子区域的输入信息之外,显示控制单元还将用于指定该新的关键字的指令显示在第一屏幕上。
7.如权利要求6所述的信息检索设备,进一步包括字符辨别单元,该字符辨别单元辨别包括在图像中的字符,其中,
显示控制单元接收用户的新关键字手写输入;以及,
字符辨别单元辨别手写关键字,并输出字辨别结果作为新的关键字。
8.如权利要求1所述的信息检索设备,其中,
区域划分单元将输入信息划分为包括图形图像的图形子区域,以及包括不是图形图像的图像的非图形子区域,
提取单元提取图形子区域中包括的图形图像的图像特征,作为检索关键字,以及,
在图形子区域被移动到第二屏幕时,检索单元基于提取单元所提取的图像特征通过网络检索信息。
9.如权利要求1所述的信息检索设备,其中,
显示控制单元接收与第一屏幕上显示的任一子区域相关的选择或选择的释放,并以不同于未选择的子区域的方式将所选的子区域显示在显示单元上,以及,
提取单元从所选子区域中包括的信息提取检索关键字。
10.如权利要求1所述的信息检索设备,其中,
检索单元通过使用多种检索方法检索信息,
显示单元在其上显示检索方法,
显示控制单元接收用于将所选子区域分别移动到显示单元上显示的任一检索方法的输入,以及,
检索单元通过使用子区域分别移动到的检索方法来检索信息。
11.如权利要求1所述的信息检索设备,其中,显示控制单元接收用于指定要移动到第二屏幕的、第一屏幕上显示的任一子区域的触摸输入。
12.如权利要求1所述的信息检索设备,其中,显示控制单元接收拖放操作输入,该拖放操作输入用于通过指示设备指定要移动到第二屏幕的、第一屏幕上显示的任一子区域。
13.如权利要求1所述的信息检索设备,其中,所述输入信息是作为输入单元的图像形成装置所扫描的文件图像有关的信息。
14.如权利要求1所述的信息检索设备,其中,所述输入信息是作为输入单元的成像设备摄取的图形图像有关的信息。
15.一种从网络检索信息的方法,所述方法包括:
在显示单元上显示第一屏幕和第二屏幕,第一屏幕上显示从输入单元接收的输入信息,第二屏幕上显示检索的结果,第一屏幕和第二屏幕能从用户接收操作输入;
按每种信息属性将输入信息划分为多个子区域;
从每个子区域的输入信息提取检索关键字;
提供控制以在第一屏幕上显示子区域中的输入信息,并接收用于指定第一屏幕上显示的、要移动到第二屏幕的任一子区域的指令;以及,
根据与要移动到第二屏幕的子区域对应的检索关键字通过网络检索信息,其中,
提供包括将检索到的信息显示在第二屏幕上的控制。
16.一种包含计算机程序的计算机程序产品,计算机程序在计算机上执行时使计算机执行:
在显示单元上显示第一屏幕和第二屏幕,第一屏幕上显示从输入单元接收的输入信息,第二屏幕上显示检索的结果,第一屏幕和第二屏幕能从用户接收操作输入;
按每种信息属性将输入信息划分为多个子区域;
从每个子区域的输入信息提取检索关键字;
提供控制以在第一屏幕上显示子区域中的输入信息,并接收用于指定第一屏幕上显示的、要移动到第二屏幕的任一子区域的指令;以及,
根据与要移动到第二屏幕的子区域对应的检索关键字通过网络检索信息,其中,
提供包括将检索到的信息显示在第二屏幕上的控制。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006305835 | 2006-11-10 | ||
JP2006-305835 | 2006-11-10 | ||
JP2006305835 | 2006-11-10 | ||
JP2007262885 | 2007-10-09 | ||
JP2007-262885 | 2007-10-09 | ||
JP2007262885A JP5223284B2 (ja) | 2006-11-10 | 2007-10-09 | 情報検索装置、方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101178725A true CN101178725A (zh) | 2008-05-14 |
CN101178725B CN101178725B (zh) | 2011-08-17 |
Family
ID=39404980
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007101695258A Expired - Fee Related CN101178725B (zh) | 2006-11-10 | 2007-11-09 | 用于信息检索的设备和方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5223284B2 (zh) |
CN (1) | CN101178725B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102081647A (zh) * | 2009-12-01 | 2011-06-01 | 三星电子株式会社 | 显示弹出式广告的方法和设备 |
CN102193903A (zh) * | 2010-03-15 | 2011-09-21 | 索尼公司 | 信息处理装置、信息处理方法以及程序 |
CN102369724A (zh) * | 2009-02-18 | 2012-03-07 | 谷歌公司 | 自动捕获信息,例如使用文档感知设备捕获信息 |
CN103020084A (zh) * | 2011-09-23 | 2013-04-03 | 联想(北京)有限公司 | 一种数据显示方法、装置及电子设备 |
CN103092972A (zh) * | 2013-01-24 | 2013-05-08 | 华为技术有限公司 | 基于线索对象的搜索方法及装置 |
CN108520254A (zh) * | 2018-03-01 | 2018-09-11 | 腾讯科技(深圳)有限公司 | 一种基于格式化图像的文本检测方法、装置以及相关设备 |
CN110178111A (zh) * | 2017-11-13 | 2019-08-27 | 华为技术有限公司 | 一种终端的图像处理方法及装置 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010055259A (ja) * | 2008-08-27 | 2010-03-11 | Konica Minolta Business Technologies Inc | 画像処理装置、画像処理プログラム及び画像処理方法 |
US8055638B2 (en) * | 2008-12-11 | 2011-11-08 | Microsoft Corporation | Providing recent history with search results |
JP2010218322A (ja) * | 2009-03-18 | 2010-09-30 | Nec Corp | 携帯通信端末及びそれに用いる通信先情報取得方法並びにそのプログラム |
WO2011039848A1 (ja) * | 2009-09-29 | 2011-04-07 | 株式会社 東芝 | 関心領域抽出装置及びプログラム |
JP5355345B2 (ja) * | 2009-10-21 | 2013-11-27 | 富士フイルム株式会社 | ドキュメント閲覧システム及びその制御方法 |
JP5484113B2 (ja) * | 2010-02-12 | 2014-05-07 | 日本電信電話株式会社 | 文書画像関連情報提供装置、及び文書画像関連情報取得システム |
US8930360B2 (en) * | 2010-05-28 | 2015-01-06 | Yahoo! Inc. | System and method for online handwriting recognition in web queries |
JP4712118B1 (ja) * | 2010-08-12 | 2011-06-29 | ヤフー株式会社 | 携帯端末、アプリケーション選択方法及びプログラム |
EP2829962A3 (en) | 2013-07-24 | 2015-05-27 | Kyocera Document Solutions Inc. | Retrieval device for retrieving data specific information used for identifying data of data group |
JP6196101B2 (ja) | 2013-09-02 | 2017-09-13 | 株式会社東芝 | 情報処理装置、方法およびプログラム |
US9886461B1 (en) | 2014-07-11 | 2018-02-06 | Google Llc | Indexing mobile onscreen content |
US10970646B2 (en) | 2015-10-01 | 2021-04-06 | Google Llc | Action suggestions for user-selected content |
US10055390B2 (en) * | 2015-11-18 | 2018-08-21 | Google Llc | Simulated hyperlinks on a mobile device based on user intent and a centered selection of text |
CN110678858B (zh) * | 2017-06-01 | 2021-07-09 | 互动解决方案公司 | 检索用资料信息存储装置 |
JP7491107B2 (ja) | 2020-07-14 | 2024-05-28 | 株式会社リコー | 情報処理装置、情報処理方法、情報処理プログラム、情報処理システム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1329323A (zh) * | 2001-07-31 | 2002-01-02 | 郭根龙 | 证件自动扫描识别与管理方法及其系统 |
JP2003050817A (ja) * | 2001-08-07 | 2003-02-21 | Canon Inc | 情報処理装置及びその方法 |
JP4349183B2 (ja) * | 2004-04-01 | 2009-10-21 | 富士ゼロックス株式会社 | 画像処理装置および画像処理方法 |
JP2006018630A (ja) * | 2004-07-02 | 2006-01-19 | Canon Inc | データ検索方法及び装置、プログラム、コンピュータ可読メモリ |
JP2006146628A (ja) * | 2004-11-22 | 2006-06-08 | Hitachi Ltd | 内容画像による文書検索方法および装置 |
-
2007
- 2007-10-09 JP JP2007262885A patent/JP5223284B2/ja not_active Expired - Fee Related
- 2007-11-09 CN CN2007101695258A patent/CN101178725B/zh not_active Expired - Fee Related
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105930311A (zh) * | 2009-02-18 | 2016-09-07 | 谷歌公司 | 执行与再现文档关联的动作的方法、移动设备和可读介质 |
CN102369724A (zh) * | 2009-02-18 | 2012-03-07 | 谷歌公司 | 自动捕获信息,例如使用文档感知设备捕获信息 |
US9113076B2 (en) | 2009-02-18 | 2015-08-18 | Google Inc. | Automatically capturing information such as capturing information using a document-aware device |
CN102081647A (zh) * | 2009-12-01 | 2011-06-01 | 三星电子株式会社 | 显示弹出式广告的方法和设备 |
CN104915101B (zh) * | 2009-12-01 | 2018-11-30 | 三星电子株式会社 | 显示弹出式广告的方法和设备 |
CN104915101A (zh) * | 2009-12-01 | 2015-09-16 | 三星电子株式会社 | 显示弹出式广告的方法和设备 |
US9262051B2 (en) | 2009-12-01 | 2016-02-16 | Samsung Electronics Co., Ltd. | Method and apparatus for displaying pop-up |
CN102193903A (zh) * | 2010-03-15 | 2011-09-21 | 索尼公司 | 信息处理装置、信息处理方法以及程序 |
CN103020084A (zh) * | 2011-09-23 | 2013-04-03 | 联想(北京)有限公司 | 一种数据显示方法、装置及电子设备 |
CN103092972A (zh) * | 2013-01-24 | 2013-05-08 | 华为技术有限公司 | 基于线索对象的搜索方法及装置 |
CN110178111A (zh) * | 2017-11-13 | 2019-08-27 | 华为技术有限公司 | 一种终端的图像处理方法及装置 |
CN110178111B (zh) * | 2017-11-13 | 2021-05-18 | 华为技术有限公司 | 一种终端的图像处理方法及装置 |
CN108520254A (zh) * | 2018-03-01 | 2018-09-11 | 腾讯科技(深圳)有限公司 | 一种基于格式化图像的文本检测方法、装置以及相关设备 |
Also Published As
Publication number | Publication date |
---|---|
JP2008140377A (ja) | 2008-06-19 |
JP5223284B2 (ja) | 2013-06-26 |
CN101178725B (zh) | 2011-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101178725A (zh) | 用于信息检索的设备、方法和计算机程序产品 | |
US8726178B2 (en) | Device, method, and computer program product for information retrieval | |
JP4405831B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
JP4371965B2 (ja) | 画像処理装置、画像処理方法 | |
US9060085B2 (en) | Image forming apparatus, electronic mail delivery server, and information processing apparatus | |
US7797150B2 (en) | Translation system using a translation database, translation using a translation database, method using a translation database, and program for translation using a translation database | |
US8482808B2 (en) | Image processing apparatus and method for displaying a preview of scanned document data | |
US8634100B2 (en) | Image forming apparatus for detecting index data of document data, and control method and program product for the same | |
JP2007286864A (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
US7610274B2 (en) | Method, apparatus, and program for retrieving data | |
JP2007042106A (ja) | 文書処理方法、文書処理メディア、文書管理方法、文書処理システム及び文書管理システム | |
JP2007317034A (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
JP4533273B2 (ja) | 画像処理装置及び画像処理方法、プログラム | |
JP4920928B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
US8144988B2 (en) | Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program | |
US11243670B2 (en) | Information processing system, information processing apparatus, information processing method and non-transitory computer readable medium | |
JP7532085B2 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
US20150169510A1 (en) | Method and system of extracting structured data from a document | |
JP2008040753A (ja) | 画像処理装置、方法、プログラムおよび記録媒体 | |
JP4811133B2 (ja) | 画像形成装置及び画像処理装置 | |
JP2008070777A (ja) | 画像形成装置及び画像形成システム | |
JP2010092383A (ja) | 電子文書ファイル検索装置、電子文書ファイル検索方法及びコンピュータプログラム | |
US8194982B2 (en) | Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program | |
JP6601143B2 (ja) | 印刷装置 | |
JP2008257543A (ja) | 画像処理システム及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110817 Termination date: 20171109 |