CN1236457A - 结构化文档创建装置和结构化文档创建方法 - Google Patents

结构化文档创建装置和结构化文档创建方法 Download PDF

Info

Publication number
CN1236457A
CN1236457A CN98801115A CN98801115A CN1236457A CN 1236457 A CN1236457 A CN 1236457A CN 98801115 A CN98801115 A CN 98801115A CN 98801115 A CN98801115 A CN 98801115A CN 1236457 A CN1236457 A CN 1236457A
Authority
CN
China
Prior art keywords
symbol
data
original copy
page
view data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN98801115A
Other languages
English (en)
Other versions
CN1161702C (zh
Inventor
坂东达夫
加藤周
奥富浩司
丰田清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic System Solutions Japan Co Ltd
Original Assignee
Matsushita Graphic Communication Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Graphic Communication Systems Inc filed Critical Matsushita Graphic Communication Systems Inc
Publication of CN1236457A publication Critical patent/CN1236457A/zh
Application granted granted Critical
Publication of CN1161702C publication Critical patent/CN1161702C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • G06F16/94Hypermedia

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Document Processing Apparatus (AREA)
  • Computer And Data Communications (AREA)

Abstract

扫描器部分扫描至少包括一个符号的多个文档,以转换成图像数据。符号识别部分从图像数据中识别出符号。接着,表创建部分创建链接表,其中把包括在一页内的符号对应于具有相同形状符号的其它页。文档创建部分利用链接表,根据HTML创建HTML文档。当单击屏幕上的HTML文档一页上的符号时,可以获得其它的入口。

Description

结构化文档创建装置和结构化文档创建方法
技术领域
本发明涉及一种结构化文档创建装置,用于创建结构化文档以把原始的即纸件信息处理成电子文档,还涉及一种构造化文档创建方法。本发明还涉及一种具有语音数据的文档创建装置,创建附加有语音数据的文档,还涉及一种具有语音数据的文档创建方法。
背景技术
随着近年来网络技术(以互联网Internet为典型)的发展,可以很容易地从网络上取得信息。尤其是通过基于互联网上使用的HTML(超文本标识语言)描述的结构化,可操作性极佳的浏览器(检索信息的应用软件)变得普及。因此,在个人计算机上,已使用了各种系统,在这些系统中不仅可以构造文档信息,而且可以构造语音和活动视频图像,并存储在输入装置中。在这种情况下,构造化意味着形成链路结构或者分层结构。
然而,存在着难以构造的信息,例如图像数据。在大多数情况下,这种信息被处理成一个批文件。构造这种内部图像需要大量的时间。
传统上,为了构造纸上描述的现存文档,必须通过例如光学字符识别(OCR)装置把文档转换成字符,或者必须从键盘上输入。这需要人力操作。现存的文档可以通过扫描仪来成象。然而,这难以把图像分割成要构造的一些部分。
近年来,例如个人计算机等已成为普及的信息终端,它们具有创建附加有语音数据的文件,以把语音数据链接到该文档上的功能(下文称为具有语音数据的文档)。
下面参照图1描述创建具有语音数据的文档的传统过程的流程图。
图1的流程图示出了创建具有语音数据的传统过程的流程。
首先,利用键盘的输入操作创建应附加语音数据的文档,或者利用诸如扫描仪等扫描装置扫描文档。然后,把该文档显示在屏幕上(S101)。
接着,把屏幕显示改变为语音符号表,利用鼠标点击操作选择连接到语音数据的语音符号(S102)。
可以使用事先在系统中输入的语音数据。或者可以使用由话筒新输入的语音数据。
接着,把屏幕显示再次改变成目标图像,利用鼠标拖动显示的语音符号的图标,把语音符号粘贴到屏幕上的文档(S103)。
如果有要增加的其它语音符号,则重复S102至103的操作(S104)。
当把所有语音符号都粘贴到目标图像上后,就完成了具有语音数据的文档,文档创建操作结束。
然而,在传统的创建具有语音数据的文档的装置中,操作者必须对应于要增加的语音符号的数量重复S102至S103的操作多次。因此,如果有大量的语音符号,则完成具有语音数据的文档要花费大量的时间。
发明内容
考虑到上述问题,创作了本发明,本发明的第一个目的在于易于把文档构造成图像数据。
本发明的第二目的在于即使有在大量的语音符号,也可以容易地在短时间内创建具有语音数据的文档。
本发明提供一种结构化文档创建装置,它包含:
输入部分,通过扫描包括至少一个符号的原稿获得输入图像数据;
符号识别部分,识别包括在图像数据中的符号;
表创建部分,创建把特定数据对应于该符号的表;
文档创建部分,创建以HTML描述的结构化文档,在该文档中,根据所述表,把符号链接到特定数据上。
在本发明中,表创建部分使包括在某一原稿的图像数据内的符号对应于至少包括一个符号的其它原稿的图像数据,其它原稿的图像数据中包括的至少一个符号具有一个与包括在与多个原稿相连的某一原稿的图像数据中的符号相同的元素。
而且,本发明的结构化文档创建装置还可以包含:
符号删除部分,删除包括在图像数据中的至少一个符号,以便输出;以及
打印部分,打印符号删除部分的输出。
而且,本发明的结构化文档创建部分还可以包含:
符号替代部分,用事先存储的其它符号替代符号识别部分识别出的符号,以对应于符号识别部分识别出的符号。
而且,在本发明的结构化文档创建装置中,文档创建部分可以创建这样的结构化文档,其中,使具有特定含义的符号与特定含义的处理彼此链接,并且,在符号被激活时进行处理之后就获得对链接到该符号的特定数据的入口。
而且,在本发明中,符号识别部分在图像文件的预定区域内识别符号。
利用上述结构的发明,符号识别部分从扫描包括符号的原稿获得的图像识别符号。表创造部分创建把特定数据对应于符号的表。文档创建部分创建以HTML描述的结构化文档,其中根据上表把符号链接到特定数据。在结构化文档中,当单击符号时,可以获得到链接的特定数据的入口。特定数据包括例如原稿的图像数据。在这种情况下,当单击某一原稿的符号时,就可以获得到其它原稿的图像数据的入口(跳转),并可以显示该图像数据。这可以容易地把具有印章形成的符号的现存文档转换成结构化文档。
而且,本发明的结构化文档创建装置包含:
输入部分,输入扫描原稿获得的图像数据;
符号增加部分,向图像数据至少增加一个符号;
表创建部分,创建把特定数据对应于符号的表;以及
文档创建部分,创建以HTML描述的结构化文档,其中根据该表把符号链接到特定数据上。
利用上述结构的发明,字符增加部分把符号增加到用扫描原稿获得的图像数据。表创建部分创建把特定数据对应于该符号的表。文档创建以HTML描述的结构化文档,其中根据该表把符号链接到特定数据上。这可以容易地把现存文档转换成结构化文档。
本发明的结构化文档创建装置还可以包含显示部分,显示输入图像数据。利用这种结构,可以一边利用显示部分确认图像数据的内容,一边增加符号。
而且,本发明提供一种通信装置,包含:
输入部分,输入扫描至少包括一个符号的原稿获得的图像数据;
符号识别部分,识别包括在图像数据内的符号;
表创建部分,创建把特定数据对应于符号的表;
文档创建部分,创建以HTML描述的结构化文档,其中根据该表把符号链接到特定数据上;以及
传输部分,传输该结构化文档。
而且,本发明提供一种通信装置,包含:
输入部分,输入扫描原稿获得的图像数据;
符号增加部分,向图像数据至少增加一个符号;
表创建部分,创建把特定数据对应于符号的表;
文档创建部分,创建以HTML描述的结构化文档,其中根据该表把符号链接到特定数据上;
传输部分,传输结构化文档。
而且,本发明提供一种结构化文档创建方法,包含下列步骤:
识别通过扫描至少包括一个符号的原稿获得的图像数据内包括的至少一个符号;
创建把特定数据对应于符号的表;以及
创建以HTML描述的结构化文档,其中根据该表把符号链接到特定数据上。
而且,本发明提供一种创建具有语音数据的文档的装置,包含:
输入部分,输入扫描原稿获得的具有至少一个语音符号的输入图像数据;
识别部分,从图像数据识别语音符号;
语音存储部分,存储语音数据;以及
表创建部分,创建把识别出的语音符号对应于存储的语音数据的表。
利用上述发明,可以从事先加入了语音符号的原稿中创建具有语音数据的文档。因此,即使有大量的语音符号,也可以在短时间内容易地增加所有语时符号。
在本发明中,表创建部分可以使不同的语音符号对应于每种语音数据。利用这种结构,用户可以从语音符号的形状可视地确定语音数据的种类。
而且,本发明提供一种创建具有语音数据的文档的方法,包含下列步骤:
扫描具有至少一个语音符号的原稿;以及
从扫描的文档识别语音符号,其中,当识别出的符号和语音数据彼此链接,并且选择了屏幕上的语音符号时,创建具有要再现的语音数据的文档。
附图概述
图1是创建具有语音数据的文档的传统的过程的流程图;
图2是本发明第一至第三实施例共用的装置的框图;
图3A至3E是本发明第一至第三实施例共用的文档样本的视图;
图4是根据本发明第一实施例的创建符号表和链接表的操作的流程图;
图5续图4的流程图;
图6是根据本发明第一实施例在识别符号形状时所用的符号表的视图;
图7是根据本发明第一实施例在识别符号颜色时所用的符号表的视图;
图8A至8E是根据本发明第一实施例对应于文档的每页的链接表的视图;
图9是根据本发明第一实施例的用符号链接的各页之间的关系视图;
图10是根据本发明第一实施例的HTML创建处理操作的流程图;
图11续图10的流程图;
图12A至12C是根据本发明第一实施例的相对于原稿的第一页构成的每个文件的视图;
图13A至13C是根据本发明第一实施例的相对于原稿的第二页构成的每个文件的视图;
图14A至14C是本发明第一实施例的相对于原稿的第三页构成的每个文件的视图;
图15A至15C是本发明第一实施例的相对于原稿的第四页构成的每个文件的视图;
图16A至16C是本发明第一实施例的相对于原稿的第五页构成的每个文件的视图;
图17是根据本发明第一实施例的显示具有印章的符号的方法的视图;
图18是根据本发明第一实施例的显示具有颜色的符号的方法的视图;
图19是根据本发明第一实施例的替代符号的方法的视图;
图20是根据本发明第一实施例的在屏幕上增加符号的方法的视图;
图21是根据本发明第一实施例的增加了特定含义的符号的视图;
图22是根据本发明第一实施例的符号特定区域的视图;
图23是根据本发明第二实施例的整体结构化文档创建装置的操作流程图;
图24是根据本发明第二实施例的符号识别处理过程的流程图;
图25是根据本发明第二实施例的符号识别处理时原稿的示意图;
图26是图25的放大图;
图27A至27D是根据本发明第二实施例管理原稿的每页的表的视图;
图28至30是根据本发明第二实施例的HTML文件产生过程的流程图;
图31和32是本发明第二实施例要产生的HTML文件的视图;
图33是本发明第二实施例要产生的HTML的分层结构的示意图;
图34是根据本发明第三实施例在不打印符号时结构化文档创建装置的操作流程图;
图35是根据本发明第四实施例的获得增加了符号的图像数据与在同页上没有增加符号的图像数据之间差异,以必定能检测到符号的操作的流程图;
图36是根据本发明第五实施例的创建具有语音数据的文档的装置的结构框图;
图37是根据本发明第五实施例的符号表存储部分中的符号表的视图;
图38是根据本发明第五实施例的链接表存储部分内的链接表的视图;
图39是根据本发明第五实施例的增加了语音符号的原稿的视图;
图40是根据本发明第五实施例的具有语音数据的文档创建处理的流程图。
本发明的实施方式
下面参照附图具体描述本发明的实施例。
(第一实施例)
图2是根据本发明第一至第四实施例的结构化文档创建装置的框图。控制部分1控制整个装置。控制部分1进行后述的符号识别、链接表创建和结构化文档的创建。
通信控制部分2连接到电话线上等,控制传真通信和与计算机网络(例如互联网)的通信。控制板3具有触摸键和显示板,显示数据的输入、输入数据和输出数据。
扫描仪4扫描原稿,输出图像数据。图像数据输入到控制部分1,进行诸如符号识别等处理。
打印机5打印接收到的数据和由扫描仪4扫描得到的数据。
符号存储部分7存储接收到的传真数据和从扫描仪4输入的数据中显示的符号。
链接表存储部分8存储这样的表,描述原稿的图像数据每页上显示的符号、其位置和链接到该符号上的页。
图3A至3E是本发明第一至第三实施例共用的原稿的样本视图。原稿有五页,,第一页用作内容表。符号(记号)○、●、★为表中每项作描述,即“互联网”、“用法”、“目录”。在第二页上,描述了标题“互联网”、其符号○互联网的解释和“内部网”的显示及其符号◆。在第三页上,描述了标题“用法”、其符号●及其解释。第四页的其式基本上与第三页相同。在第五页上,描述了标题“内部网”及其符号◆和其解释。因此,把相同的符号分别增加到显示标题的页上和显示标题内容的页上。
下面解释本发明的第一实施例。图4和5是符号表创建操作和链接表创建操作的流程图。扫描仪4扫描图3A至图3E所示的五页原稿(S1),并把图像数据以GIF文件形式存储在图像存储部分6内(S2)。应当注意,GIF文件形式是大小适用于通信的图像文件格式。
接着,在S3,在符号元素中识别形状。图6示出了符号表。符号表存储在符号存储部分7中。
符号元素广泛地包括形状、颜色、大小和线条的种类以及被涂符号的种类以及亮暗或亮度。
图7示出了识别颜色的情况,颜色是符号的另一个元素。在利用颜色识别符号的情况下,符号用符号的颜色、点数和大小来表现。可以识别颜色和形状,以使它们通过组合彼此相关。
在S4,确定是否把识别出的符号输入到符号表中。如果识别出的符号没有输入行号表,则在S5中输入该符号。如果识别出的符号已输入到符号表中,则操作进入到图5的S8。
在S6,识别符号的位置。有多种显示符号位置的方法。在第一实施例中,用符号和半径的中心坐标来表示符号的位置,这是在沿中心坐标画出一个其大小足以在其内放置符号的圆时使用。
在S7,把识别出的符号位置存储在链接表中。链接表是显示符号和该符号链接的页的数据的表。图8A至8E示出了原稿的每一页和对应于每页的链接表。图8A至8E按序示出了第一至第五页。
在图8A中,81表示存储在文件IMAGE00.GIF内的原稿的第一页的图像数据。原稿的图像数据存储在每页的一个文件中。IMAGE00.GIF至IMAGE04.GIF是第一至第五页的文件名。链接表82被创建成对应于每页的图像数据81,并存储在链接表存储部分8内。在链接表82中,提供了这些栏,即,页、符号、地址、区域和链接目标。在符号第一次出现在一页上的情况下从第一页开始依次计算,把出现符号的一页存储在页栏中。在第一页的情况下,由于有三个符号第一次出现,把第一页存储在页栏内,把这三个符号存储在符号栏中。地址栏指示符号的中心坐标,区域栏指示把该符号围在环绕符号的中心坐标的圆的半径。在链接目标栏,存储出现了相同符号的页的文件名。
在第二页的链接表中,第一次出现的数据符号◆存储在第二页上。而且,在其内还存储了符号○的数据。符号○(后述)是一个加到第二至第五页的图像数据中用于返回到第一页的符号。在地址目标栏中,存储了第一页的文件名。在第三至第五页上,由于没有第一次的符号,则仅存储返回符号。换句话说,第三至第五页具有相同的数据。因此,在第一页的链接表上,已存储了除了链接目标处的数据。
在图5所示的S8,确定存储在链接表存储部分8内的链接表82中是否有符号。对于第一页,由于没有前页,并且在链接表82中没有符号,所以操作进入到S13。
对于第二页,符号○出现在图8A所示的第一页的链接表82中。因此,在S9,把第二页的图像数据的文件名IMAGE01.GIF存储在链接目标栏中。
对于第三至第四页,在图8A所示的第一页的链接表82中出现了符号●、★。因此,在S9,在链接目标栏中分别存储了第三和第四页的图像数据的文件名IMAGE02.GIF、IMAGE03.GIF。
对于第五页,在图8B所示的第一页的链接表82中出现了符号◆。因此,在S9,在链接目标栏中存储了第五页的图像数据的文件名IMAGE04.GIF。
在S10,为了在第二页及以后各页上返回到第一页,把返回符号“○”加到图像数据的预定位置上。然后,在S11,在自链接表82中存储返回符号○的信息。即,把返回符号○的中心坐标存储在地址栏中,把半径数据存储在区域栏中。在S12,把文件名IMAGE00.GIF存储在链接目标栏中。应当注意,把返回符号○增加到图像数据中的处理是在后述的HTML创建处理时进行的。然后,结束符号表的创建和链接表的创建。
在S13,确定是否还有下页。如果有下页,则操作返回到S1。如果没有下页,在S14,利用创建数据以HTML形式创建链接到原稿每页的结构化文档。
图9是符号链接的各页之间的关系图。第二至第四页93至95由第一页上显示的符号○ 92a、●92b、★92c链接到第一页上。而第五页96由第二页92上显示的符号◆92d链接到第二页93上。而且,在第二至第五页上设置了返回符号○97,以返回到第一页91。这激活了浏览器上第一页91上显示的符号○92a、●92b、★92c,相应于各个符号,可以获得到第二至第四页93至96的文件的入口。在这种情况下,“入口”意味着跳至链接目标。而,“链接目标”广义地包括诸如链接到该符号的程序文件、文档文件、文本文件以及活动视频图像文件等数据。而且,“激活”如下指示。具体地说,在浏览器上指定符号,并且单击指定的符号,以下载链接目标。然后,显示下载的链接目标的内容,并执行问题。
相似地,单击第二页93的符号◆92d可以获得第五页96的文件的入口。单击第二至第五页93至96各页的返回符号○97,将执行返回到第一页91的操作。
图10和11是进行图5所示的HTML创建处理的操作的流程图。在HTML中,有一个诸如可单击映射图的程序。可单击图就是在图像的各个部分设置可链接区,以能获得从一个图像至多个文件的入口。它可以如下显示:
<A HREF=“MAP FILE NAME.MAP”>
<IMG SRC=“IMAGE FILE NAME.GIF ISMAP”…(1)
在这种情况下,在如图8A至8E所示扫描仪4扫描原稿时为每页创建“IMAGEFILE.GIF”。然而,仍没有增加返回符号○97。而,“MAP FILE.MAP”是符号位置和对应于该符号的页的HTML文件,符号位置存储在图8A至8E所示的每页的链接表中。即,“MAP FILE.MAP”是指示公式(1)所示的结构化文档的文件,把扩展名.HTM或者(HTML)加到该文件中。在该实施例中,MAP FILE.MAP设置成FILE00.MAP至FILE04.MAP,HTML文件设置成HOME00.HTM至HOME04.HTM。应当注意,已把IMAGE FILE.GIF创建成IMAGE00.GIF至IMAGE04.GIF。
图9至10是为每页创建HOMEN.HTM的流程图。N是表示数字00至04的值,它们被加到每页的各个文件中。首先,把初始值设置N=0,并创建第一页的HOME00.HTM(S20)。步骤示出了HOME文件的标准。然后,如果每个FILEN.MAP和IMAGEN.GIF的标题名和N的值被替代,则就完成了每页的HOME.HTM文件。在步骤S21所示的标准结构化文档是一个简单的程序,它用HTML表示了标题名和公式(1)。即,<HTML>和<HTML>分别放置在两头,<HEAD>描述成显示标题。然后,把标题名夹在<TITLE>与<TITLE>之间。接着,把公式(1)夹在<BODY>与<BODY>之间。
由OCR装置识别扫描原稿第一页获得的图像数据以便设置为一个文件名。在这种情况下,标题的名称设置成“互联网传真”(S22)。把FILEN.MAP和IMAGEN.MAP中每个文件的N设置成00(S23)。用文件名即HOME00.HTM存储如此完成的文件(S24)。具体地说,图12A所示的HOME00.HTM为以这种方式创建的文件。
在图11中,在步骤S25显示的第一页的符号指示了每个符号的坐标、半径和链接到每个符号的页的HOME.HTM的位置。更具体地说,记号X和Y是符号的坐标,Z是包围该符号的圆的半径。而,HTTP是超文本传输协议(hypertext transfer protocol)的缩写,与之连续的文件是WWW服务器文件。而且SITE-NAME显示了传输后述的完成文件的WWW服务器的站名。即,把HOME.HTM文件存储在该站点上。进行每个符号的X、Y和Z以及N=00的替换(S26)。这些替换是相对于第一页的三个符号进行的(S27)。图2B所示的FILE00.MAP是以这种方式创建的文件。而图12C所示的IMAGE00.GIF是扫描仪4扫描第一页获得的图像数据。完成图12A至12C所示的三个文件将使第一页的结构化文档完成。
在第二至第五页的情况下,把返回到第一页的返回符号“○”加到存储在每页的IMAGE.GIF文件中的图像数据中(S28)。图13C所示的IMAGE01.GIF显示了把返回符号“○”加到图像数据中的状态。返回符号“○”的中心坐标用(a5,b5)表示,具有包围返回符号“○”的半径的圆用虚线表示。也示出的内部网的符号◆以及坐标(a4,b4)和半径C1。显示了应当返回的返回符号“○”的文件名HOME00.HTM。增加了显示步骤S29。这样就完成了第二页情况下的FILE01.MAP,以该名称存储该文件(S280)。图13B示出了FILE01.MAP。图13A至图13C这三个文件的完成就完成了第二页的结构化文档。如果结束了第二页,则设置N=2,操作进入到第三页(S281)进行相似的处理,直到第五页。图14A至14C示出了第三页的结构化文档,图15A至图15C示出了第四页的结构化文档。而图16A至16C示出了第五页的结构化文档。把如此创建的每页的三个文件,即HOMEN.HTM、FILEN.MAP、IMAGEN.GIF传输给WWW服务器(S283)。
下面解释符号增加方法。
图17示出了利用印章103把符号102按压到原稿101的每页上的情况。在这种情况下,可以把过一固定时间后会消失的墨水用作印章墨水,以防止原稿变脏。不用印章103,也可以粘贴显示该符号的印记。然后,在扫描仪扫描之后剥离该印记。
图18示出了把颜色用作符号的情况。在该图中,也示出了印章的形状。然而,在用如图7所解释的颜色标识符号的情况下,仅使用了符号的颜色、点数和大小。在这种情况下,也可以使用过一固定时间后会消失墨水。
图19示出了用在装置内建立的另一种符号104代替印章103按压到原稿101上的符号102。当要替换符号104时,最好利用诸如动物、植物、星、心符号等对用户来说熟悉的和已知的符号。这是因为使用这些符号可以使用户的操作容易,减少误操作。
图20示出了把原稿扫描成图像数据而不对其增加符号的情况,它由显示器111显示,并且把符号113加到屏幕112上。这个例子不需要向原稿增加符号,所以可以防止原稿变脏。
图21示出了识别事先存储的具有特定含义的符号的情况。例如把表示诸如所谓的“秘”的保密符号123按压到页122上,以保密来对待。然后,把口令请求处理链接到符号123上,以创建结构化文件。当用户单击前一页121的符号123时,首先要求输入口令。仅当用户输入的口令与存储的口令一致时,才可以获得到包含有保密符号123的页的入口。
图22示出了在文档131中事先设置形成符号132的区域(符号设置区域)133的情况。具体地说,用印章134把符号按压到符号设置区域133上。然后,由控制部分1从原稿的特定区域取出符号132,可以仅识别取出的符号132。因此,与从文档131的整个表面取出符号132的情况相比,符号识别的正确性和速度得以改善。
(第二实施例)
第二实施例将具体解释用颜色识别符号的例子。
图23是根据第二实施例的整个结构化文档创建装置的工作流程图。
在S2301中,操作者指定操作,利用图2所示的控制板3根据HTML创建主页。在S2302,操作者输入主页的标题
在S2303,扫描仪4扫描图2所示的原稿。
在S2304,图2所示的控制部分1以JPEG形式存储扫描获得的原稿。具体地说,把在S2302中输入的标题用作文件名。即,把当前页号加入到标题中,并进一步向其增加扩展名jpg,把它存储成文件名。
在步骤S2305,确定是否有下一页。如果有下一页,则在步骤S2306把页数n增1,操作返回到S103,并扫描下一页。如果没有下页,则操作进入到步骤S2307。
在S2307,控制部分1识别包括在JPEG文件中的符号。关于符号的识别,是对每页进行识别符号的中心坐标、半径和颜色信息。这些识别结果被以页为单位列成表,并存储。
在S2308中,控制部分1对在S2307创建的表进行排布。在这种情况下,根据颜色信息从表中删除没有颜色信息的弧立符号。如果有三个或更多个相同的符号,则进行出错显示。
在S2309中,控制部分1进行HTML文件产生处理。在这种情况下,自动产生以HTML创建主页的文件。
在S2310,存储产生的HTML文件。具体地说,把页号加到在S2303输入的标题中,并进一步增加扩展名htm,并存储。换句话说,文件名具有标题+页号.htm的形式。
在S2311中,确定是否有下页。如果有下页,在步骤S2312使m增1,并再次进行HTML产生处理。如果没有下页,则把在S2313中产生的HTML文件传输给服务器。
下面,将参照图24至26具体解释图23所示的符号识别处理S2307。
首先,在S2401,开始符号识别流程。
在S2402,识别基准点的颜色。例如,如图25所示,对位于原稿201的左上侧的点202进行取样,平均取样的结果,以确定基准点的颜色。根据基准点的颜色检测与基准点不同的颜色。应当注意,要处理的图像数据是JPEG数据,它被分成YcbCr的彩色空间,并经过压缩。利用YcbCr的彩色空间可以省略转换处理,所以可以高效地进行处理。而且,通常,可以进行与人类相似的识别,而不是RGB。
在S2403,扫描预定的宽度。如图25所示,以预定宽度W进行一行(L)的扫描。在S2404,检测在该扫描线L上是否有不同的颜色。如果没有检测到不同的颜色,则操作进入到S2405,线L下移一厘米,再次扫描其预定的宽度W。
为了区分颜色,把黑暗部分的颜色,即从黑到白范围的部分识别成相同的颜色,根据灰度识别后续的颜色部分,即亮部。这可以使识别与人类相仿。
在S2404,如果检测到不同的颜色,即在符号203上进行扫描,则操作进入到S2406。在S2406,计算图26所示的每个颜色边界部分204和205的坐标。在S2407,计算两点的坐标之间中间点206的坐标。
在S2408,根据中间点的坐标,计算圆符号203的中心O的坐标。具体地说,搜索X坐标固定而颜色随Y坐标变化的坐标。然后,根据搜索到的坐标计算中心坐标。
在S2409,根据在S2408计算得到的中心坐标计算半径R。
在S2410,取样符号203的一些部分。在这种情况下,取得具有YcrCb的颜色信息,从每点检查其分布的差异。在S2411,计算颜色信息的平均值。在S2412,根据计算得到的平均值确定颜色信息。
在S2413,对每页把符号坐标、半径、颜色信息进行列表,并如图27A至27D所示进行输入。
上述步骤解释了一页的处理过程。在S2414,确定是否有下一页。如果有下一页,则操作返回到S2403。如果没有下一页,则结束操作。因此,对所有页原稿进行符号识别,创建每页的管理表。
图28至30是图23所示的HTML文件产生处理S2309的流程图。
在S2801至S2803,按序产生图31所示的HTML文件的第一至第三行。
在S2804,利用在原稿扫描时输入的标题和页码输出标题名称。在S2805,在标题名后输出</TTTLE>。
在S2806至S2808,按序产生图31所示的HTML文件的第四至第六行。
在S2809,输出在原稿扫描时存储的JPG文件的文件名。在S2810,输出第六行的余下部分。然后,在S2811,输出m页的标题。
在图29所示的S2812至S2813,产生第六和第七行。在S2814,输出对应于第七线的标题的标题。准确地说,输出m页的标题。在S2815,输出第七行的余下部分。
在S2816,在第八行上输出在主页上设置的要单击的范围的标记。在S2817,根据图27A至27D所示的表,输出符号位置信息的中心坐标和半径,作为上述标记的t自变量X、Y、R。
在S2818,输出后接上述自变量的标记“HREF=”。在S2819,利用这些表搜索链接目标,以输出链接目标。在这种情况下,进行搜索,以检测在哪页上出现具有相同颜色信息的表。在S2820,把一扩展名htm增加到对应于搜索页的标题中,输出增加了扩展名htm的标题。在S2821,关闭第八行,产生链接目标。
在S2822,确定在目标表,即m页的表中是否有其它符号。如果有其它符号,则操作返回到S2816,重复处理S2816至S2821。
在图30所示的S2823至S2825中,输出产产生图31所示的HTML文件的第九至第十一行。在S2826中,输出显示下页链接目标的信息。在S2827中,输出显示下页的信息。在S2828和S2829中,输出和产生第十二和第十三行。如此产生HTML文件。
图32示出了没有链接目标的HTML文件的内容。图31的HTML文件与图32的HTML文件之间的差异是第十一行。提供图32的HTML文件的第十一行,以返回到第一页。
利用如此产生的HTML文件,如图33所示把原稿分层构成。具体地说,包含在第一页331中的第一符号332和第二符号333具有彼此不同的颜色,并分别链接到第二页334和第四页335上。因此,当单击第一页331的第一符号332时,可以获得到第二页334的入口,显示第二页。同样,当单击第二符号333时,可以获得到第四页333的入口。而且,第二页334中包含的第三符号336连接到第三页337上。因此,当单击第二页334的第三符号336时,可以获得到第三页337的入口,显示第三页337。
如上所述,根据第二实施例的结构化文档创建方法,可以容易地把利用每个具有不同颜色的符号在纸件原稿上描述的现存文件转换成HTML文件。
(第三实施例)
下面,将解释本发明的第三实施例。第三实施例解释了这样的情况,从具有图2的图像存储部分6中存储的符号的图像数据中删除符号并打印。存储在图像存储部分6中的图像数据是由扫描仪4扫描获得的数据,或者是通信部分2通过传真通信接收到的数据。
图34是第三实施例操作时的流程图。由图像存储部分6扫描要打印的图像数据的第一页(S40)。接着,取出符号的坐标点(S41),删除符号存在区的数据(S42)。删除之后,打印该页(S43)。然后,检查是否有下一页(S44)。如果有下一页,则重复步骤S40至S43的操作,直至最后一页。因此,可以获得不增加符号的原稿打印件。
(第四实施例)
下面解释本发明的第四实施例。第四实施例解释了必定能确定符号的方法,即使由于符号与原稿字符和图像部分重叠而难以确定该符号的情况。在第三实施例中,把图像数据以不增加符号的状态存储在图像存储部分6中。例如,如图20所解释的,在屏幕上显示图像数据,向其增加符号。此后,识别该符号,并确认位置,开始结构化文档创建过程。
图35是第四实施例的操作流程(S50)。扫描仪4扫描或者传真接收而获得图像数据。把输入数据存储在图像存储部分6中(S51)。读取存储的图像数据,把符号以上述方法加到其上(S52)。然后,再次输入图像数据(S53),进行位映射(S54)。另一方面,从图像存储部分6读取没有增加符号的图像数据,以进行位映射(S55)。取得已增加了符号的位映射图像数据与没有增加符号的位映射图像之间的差异,以便必定能仅取出该符号(S56)。识别取出的符号和坐标(S57),开始结构化文档创建过程(S58)。根据本实施例,即使符号与原稿字符和图像部分重叠,也可以准确地识别出该符号。
上述第一至第四实施例解释了图像数据链接到符号的情况。然而也可以使用下面的方法。具体地说,可以用OCR装置识别包括在对应于该符号的标题原稿中的字符和文档。然后,把相关页进行列表,使之对应于该符号,并用HTML描述,从而使它可以创建结构化文档。
(第五实施例)
下面解释本发明的第五实施例。第五实施例涉及用语音码创建文档的文档创建装置及其方法。
图36是根据本实施例的创建具有语音数据的文档的文档创建装置的结构。
如图36所示,创建具有语音数据的文档的文档创建装置包含CPU(中央处理单元)401、输入部分402、扫描仪403、OCR部分404和图像数据存储部分405。CPU401控制每个电路。输入部分402包括键盘和鼠标,用户用它们可以输入各种指令。扫描仪403把文档扫描成图像数据。OCR部分404根据扫描得到的图像数据识别字符。图像数据存储部分405存储扫描仪403扫描得到的图像数据。上述结构的文档创建装置取得具有事先增加一语音符号的原稿,以可以根据原稿创建具有语音数据的文档。
创建具有语音数据的文档创建装置还包含输入语音数据的语音输入部分406和存储语音输入部分406输入的语音数据的语音数据存储部分407。可以取得要增加到图像中的语音数据,并存储在语音数据存储部分407中。
输入语音数据的方法包括利用话筒的输入方法和从附加一电话装置输入语音数据的方法。应当注意,语音数据以文件格式存储。如果事先把语音数据的文件名的扩展名确定成“WAV”,则可以容易地进行以后的处理和管理。
创建具有语音数据的文档的文档创建装置还包含存储语音符号的符号表存储部分408。可以把对应于语音数据的语音符号存储在符号表中。
图37是符号表存储部分408中的符号表。如图37所示,把各个语音符号的形状和连接到其的语音数据的文件名输入到符号表中,以使它们彼此对应。应当注意,不是用形状而是用不同的颜色来表述语音符号。在把新语音符号输入到符号表的情况下,把新语音符号与对应于该新语音符号的文件名一起输入到符号表存储部分408中。
对每个要输入的各种语音数据用不同的文件名输入语音符号。例如,乐器的语音数据文件名设置成MUSIC,歌曲语音数据的文件名设置成SONG,解说词语音数据的文件名设置成VOICE。把各种语音数据的具有不同形状的语音符号对应于文件名,这样可以根据屏幕上的语音符号识别各种相应的语音数据。
创建具有语音数据的文档的文档创建装置还包含语音符号识别部分409、链接表创建部分410和链接表存储部分411。语音符号识别部分409识别每页原稿上显示的语音符号。链接表创建部分410创建链接表,把语音符号链接到每页原稿的位置上和语音数据上。链接表存储部分411存储创建的链接表。然后使输入图像数据与语音数据彼此链接,从而可以创建具有语音数据的文档。
图38是链接表存储部分411中的链接表的视图。如图38所示,把每个语音符号的形状、链接图像数据的文件名、图像数据中每个语音符号的位置以及链接语音数据的文件名输入到链接表中,使它们彼此对应。在本实施例中,由符号的中心坐标和具有符号可以进入的尺寸的圆的半径表示语音符号的位置。然而,可以用其它参数来表示语音符号的位置。
创建具有语音数据的文档的文档创建装置还包含显示装置412、通信控制部分413、打印部分414和语音数据输出部分415。显示装置412在屏幕上显示图像。通信控制部分413连接到网络上,并控制网络通信,例如传真通信、互联网等。打印部分414打印接收信息和扫描仪402扫描获得的图像数据。语音数据输出部分415再现语音数据。上述结构的文档创建装置可以提供各种处理,例如从其它信息装置接收或向其发送具有语音数据的创建文档,输出和再现具有语音数据的创建文档。而且,利用鼠标在屏幕单击每个语音符号再现相应的语音数据,以便除了可视服务之外可以再提供有声服务。这可以改善可操作性。
在传输创建的图像数据的情况下,把增加的语音数据和链接表与图像数据一起作为附加文件传输。这也可以再现传输目标上的语音数据。
下面将解释利用第五实施例的创建具有语音数据的文档的文档创建装置创建具有语音数据的文档的处理。
首先,在创建具有语音数据的文档的预条件时,利用印章向原稿的必要部分增加语音符号。图39是根据第五实施例增加了语音符号的原稿的例子的视图。如图39所示,利用印章441和442可以容易地把相同数量的语音符号加到原稿443和444上。此时,根据要输入的语音数据的种类,例如,乐器、歌曲、解说词等,改变语音符号的形状。作为向原稿增加语音符号的方法,有一种利用印记粘贴的方法,而不是利用印章的方法。
下面参照图40解释第五实施例中具有语音数据的文档的创建过程的流程。图40是根据第五实施例的具有语音数据的文档的创建过程的流程图。
首先,由扫描仪3扫描增加语音符号的原稿(S501)。
把被扫描的原稿按序存储在图像数据存储部分405内,作为图像数据(S502)。扫描的图象数据分成多个区域,原稿中的文档是OCR部分404识别出的字符,并取出作为图像。
接着,语音符号识别部分409识别存储的图像数据是否具有与符号表存储部分408内输入的语音符号相同形状的语音符号(S503)。如果没有识别到与符号表存储部分408内输入的语音符号相同形状的语音符号,则把扫描的图像数据看作是没有语音数据的一般图像数据,结束该处理。
如果识别出语音符号,则在链接表创建部分410中把该语音符号与每页原稿的位置以及链接语音数据文件的名称一起写入到链接表中(S504)。
如果识别到多个语音符号,则对所有语音符号创建链接表。(S505)。
可以用上面解释的处理过程来创建具有语音数据的文档。而且,如果把语音符号事先粘贴到原稿上,并进行扫描,则用户不必再进行其它操作。
在屏幕上显示具有语音数据的创建文件,用鼠标单击语音符号,从而再现诸如对应于乐器、歌曲和解说词等的语音数据。
让具有语音数据的创造文档经过各种处理,例如从其它信息装置接收或向其发送,利用通信控制部分413、打印部分414和语音数据输出部分415输出和再现。
如上所述,本发明可以提供一种能在短时间内容易地创建具有语音数据的文档的装置,即使有大量的语音符号存在,也可以提供一种使用这种装置的方法。
上述第一至第五实施例把具有文档创建功能的传真装置作为例子。然而,本发明并不限于这种例子。即,本发明可以应用于连接有外部扫描仪的个人计算机和互联网终端。
工业应用性
因此,根据本发明的结构化文档创建装置可用于传真装置,尤其适合于把已有的文档转换成结构化文档。

Claims (29)

1、结构化文档创造装置,包含:
输入部分,输入由扫描至少包括一个符号的原稿所获得的图像数据;
符号识别部分,识别包括在图像数据中的符号;
表创建部分,创建使特定数据对应于所述符号的表;以及
文档创建部分,创建以HTML描述的结构化文档,其中根据所述表把所述符号链接到所述特定数据上。
2、如权利要求1所述的装置,其特征在于,所述表创建部分把包括在某一原稿的图像数据中的符号对应于至少包括一个符号的其它原稿的图像数据,其它原稿的图像数据中包括的至少一个符号具有一个与包括在与多个原稿相连的某一原稿的图像数据中的符号相同的元素。
3、如权利要求1所述的装置,其特征在于,所述符号识别部分识别符号的颜色。
4、如权利要求3所述的装置,其特征在于,所述符号识别部分利用颜色空间YcbCR识别符号的颜色。
5、如权利要求3或4所述的装置,其特征在于,所述符号识别部分检测与原稿颜色不同的颜色,并识别被检测到的颜色。
6、如权利要求1所述的装置,其特征在于,所述符号识别部分识别符号的形状。
7、如权利要求1所述的装置,其特征在于,还包含:
符号删除部分,删除包括在图像数据中的至少一个符号,以输出;以及
打印部分,打印所述符号删除部分的输出。
8、如权利要求1所述的装置,其特征在于,还包含符号替代部分,用事先存储的另一符号替代符号识别部分识别出的符号,以对应于符号识别部分识别出的符号。
9、如权利要求1所述的装置,其特征在于,所述文档创建部分创建结构化文件,其中把具有特定含义的符号和所述特定含义的处理彼此链接,并且,在激活所述符号时进行了所述处理之后,获得到与所述符号链接的特定数据的入口。
10、如权利要求1所述的装置,其特征在于,所述符号识别部分在图像文件的预定区域内识别符号。
11、如权利要求1所述的装置,其特征在于,通过在原稿上按压印章形成符号。
12、如权利要求11所述的装置,其特征在于,在印章中使用经过一固定时间就消失的印章液体。
13、如权利要求1所述的装置,其特征在于,通过把显示符号的印记粘贴至原稿上形成符号。
14、一种结构化文档创建装置,包含:
输入部分,输入扫描原稿获得的图像数据;
符号增加部分,向所述图像数据至少增加一个符号;
表创建部分,创建使表内的特定数据对应于所述符号的表;以及
文档创建部分,创建以HTML描述的结构化文档,其中根据所述表把所述符号链接到所述特定数据上。
15、如权利要求14所述的装置,其特征在于,还包含显示部分,显示输入图像数据。
16、一种通信装置,包含:
输入部分,通过扫描至少包括一个符号的原稿输入图像数据;
符号识别部分,识别包括在所述图像数据中的所述符号;
表创建部分,创建特定的数据对应于所述符号的表;
文档创建部分,创建以HTML描述的结构化文档,其中根据所述表把所述符号链接到所述特定数据上;以及
传送部分,传送所述结构化文档。
17、一种通信装置,包含:
输入部分,输入扫描原稿获得的图像数据;
符号增加部分,向所述图像数据至少增加一个符号;
表创建部分,创建特定数据对应于所述符号的表;
文档创建部分,创建以HTML描述的结构化文档,其中根据所述表把所述符号链接到所述特定数据上;以及
传送部分,传送所述结构化文档。
18、一种结构化文档创建方法,包含下列步骤:
识别通过扫描一至少一个符号的原稿获得的图像数据中包括的至少一个符号;
创建特定数据对应于所述符号的表;以及
创建以HTML描述的结构化文档,其中根据所述表把所述符号链接到所述特定数据上。
19、如权利要求18所述的方法,其特征在于,扫描多个原稿,把包括在某一原稿的图像数据中的符号对应于至少包括一个符号的其它原稿的图像数据,其它原稿的图像数据中包括的至少一个符号具有一个与包括在某个原稿的图像数据中的符号相同的元素。
20、如权利要求18所述的方法,其特征在于,在所述符号识别步骤中识别符号颜色。
21、如权利要求18所述的方法,其特征在于,在所述符号识别步骤中识别符号的形状。
22、如权利要求18的方法,其特征在于,结构化文档以这样的方式创建,符号具有特定的含义,所述符号链接到所述特定含义的处理上,从而在所述符号被激活时进行所述处理之后获得到与所述符号链接的特定数据的入口。
23、如权利要求18所述的方法,其特征在于,通过在原稿上按压印章形成符号。
24、如权利要求18所述的方法,其特征在于,在印章中使用经过一固定时间就消失的印章液体。
25、如权利要求18所述的方法,其特征在于,通过把显示符号的印记粘贴至原稿上形成符号。
26、一种结构化文档创建方法,包含下列步骤:
向扫描原稿获得的图像数据增加至少一个符号;
创建特定数据对应于所述符号的表;以及
创建以HTML描述的结构化文档,其中根据所述表把所述符号链接到所述特定数据上。
27、一种创建具有语音数据的文档的装置,包含:
输入部分,输入扫描至少具有一个语音符号的原稿获得的图像数据;
识别部分,从所述图像数据识别所述语音符号;
语音存储部分,存储语音数据;以及
表创建部分,创建使识别出的语音符号对应于所述存储语音数据的表。
28、如权利要求27所述的装置,其特征在于,表创建部分使不同的语音符号对应于每种语音数据。
29、一种创建具有语音数据的文档的方法,包含下列步骤:
扫描具有至少一个语音符号的原稿;
从扫描文档中识别语音符号;以及
把识别出的语音符号与语音数据相关,产生具有语音数据的文档,其中当选择屏幕上的语音符号时,再现该语音数据。
30、如权利要求29所述的方法,其特征在于,利用具有语音符号形状的印章把语音符号加到原稿上。
CNB988011158A 1997-08-07 1998-03-27 结构化文档创建装置和结构化文档创建方法 Expired - Fee Related CN1161702C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP227098/1997 1997-08-07
JP227098/97 1997-08-07
JP9227098A JPH1153168A (ja) 1997-08-07 1997-08-07 音声情報付文書作成装置及びこれを用いた方法

Publications (2)

Publication Number Publication Date
CN1236457A true CN1236457A (zh) 1999-11-24
CN1161702C CN1161702C (zh) 2004-08-11

Family

ID=16855467

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB988011158A Expired - Fee Related CN1161702C (zh) 1997-08-07 1998-03-27 结构化文档创建装置和结构化文档创建方法

Country Status (8)

Country Link
US (1) US6332039B1 (zh)
EP (1) EP0939376B1 (zh)
JP (1) JPH1153168A (zh)
KR (1) KR100340354B1 (zh)
CN (1) CN1161702C (zh)
CA (1) CA2266630C (zh)
DE (1) DE69832585T2 (zh)
WO (1) WO1999008207A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101330554B (zh) * 2007-06-22 2010-10-27 佳能株式会社 图像处理设备和方法

Families Citing this family (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3265198B2 (ja) * 1996-09-20 2002-03-11 松下電送システム株式会社 構造化文書作成装置、構造化文書作成方法、通信装置、および通信方法
IE980959A1 (en) * 1998-03-31 1999-10-20 Datapage Ireland Ltd Document Production
US6987506B1 (en) * 1999-05-25 2006-01-17 Silverbrook Research Pty Ltd Method and system for navigating a directory
US6735335B1 (en) * 2000-05-30 2004-05-11 Microsoft Corporation Method and apparatus for discriminating between documents in batch scanned document files
US7006711B2 (en) 2000-06-21 2006-02-28 Microsoft Corporation Transform table for ink sizing and compression
US7397949B2 (en) 2000-06-21 2008-07-08 Microsoft Corporation Serial storage of ink and its properties
US6816615B2 (en) * 2000-11-10 2004-11-09 Microsoft Corporation Implicit page breaks for digitally represented handwriting
US6707473B2 (en) 2001-08-01 2004-03-16 Microsoft Corporation Dynamic rendering of ink strokes with transparency
US7392287B2 (en) 2001-03-27 2008-06-24 Hemisphere Ii Investment Lp Method and apparatus for sharing information using a handheld device
US7346229B2 (en) 2001-06-27 2008-03-18 Microsoft Corporation Transform table for ink sizing and compression
US7168038B2 (en) 2001-08-01 2007-01-23 Microsoft Corporation System and method for scaling and repositioning drawings
US20030115284A1 (en) * 2001-12-18 2003-06-19 Henry Steven G. Method and apparatus for accessing network data associated with a document
US20050102322A1 (en) * 2003-11-06 2005-05-12 International Business Machines Corporation Creation of knowledge and content for a learning content management system
FR2875241B1 (fr) 2004-09-16 2010-07-30 Biomerieux Sa Procede de detection de streptococcus agalactiae en utilisant l'activite esterase
US8521737B2 (en) 2004-10-01 2013-08-27 Ricoh Co., Ltd. Method and system for multi-tier image matching in a mixed media environment
US7812986B2 (en) * 2005-08-23 2010-10-12 Ricoh Co. Ltd. System and methods for use of voice mail and email in a mixed media environment
US7970171B2 (en) 2007-01-18 2011-06-28 Ricoh Co., Ltd. Synthetic image and video generation from ground truth data
US8176054B2 (en) 2007-07-12 2012-05-08 Ricoh Co. Ltd Retrieving electronic documents by converting them to synthetic text
US9384619B2 (en) 2006-07-31 2016-07-05 Ricoh Co., Ltd. Searching media content for objects specified using identifiers
US7669148B2 (en) 2005-08-23 2010-02-23 Ricoh Co., Ltd. System and methods for portable device for mixed media system
US7587412B2 (en) * 2005-08-23 2009-09-08 Ricoh Company, Ltd. Mixed media reality brokerage network and methods of use
US8156115B1 (en) 2007-07-11 2012-04-10 Ricoh Co. Ltd. Document-based networking with mixed media reality
US7551780B2 (en) 2005-08-23 2009-06-23 Ricoh Co., Ltd. System and method for using individualized mixed document
US7885955B2 (en) * 2005-08-23 2011-02-08 Ricoh Co. Ltd. Shared document annotation
US8335789B2 (en) 2004-10-01 2012-12-18 Ricoh Co., Ltd. Method and system for document fingerprint matching in a mixed media environment
US8510283B2 (en) 2006-07-31 2013-08-13 Ricoh Co., Ltd. Automatic adaption of an image recognition system to image capture devices
US7672543B2 (en) * 2005-08-23 2010-03-02 Ricoh Co., Ltd. Triggering applications based on a captured text in a mixed media environment
US8856108B2 (en) 2006-07-31 2014-10-07 Ricoh Co., Ltd. Combining results of image retrieval processes
US8156427B2 (en) 2005-08-23 2012-04-10 Ricoh Co. Ltd. User interface for mixed media reality
US8184155B2 (en) 2007-07-11 2012-05-22 Ricoh Co. Ltd. Recognition and tracking using invisible junctions
US8868555B2 (en) 2006-07-31 2014-10-21 Ricoh Co., Ltd. Computation of a recongnizability score (quality predictor) for image retrieval
US9405751B2 (en) * 2005-08-23 2016-08-02 Ricoh Co., Ltd. Database for mixed media document system
US8332401B2 (en) 2004-10-01 2012-12-11 Ricoh Co., Ltd Method and system for position-based image matching in a mixed media environment
US8600989B2 (en) * 2004-10-01 2013-12-03 Ricoh Co., Ltd. Method and system for image matching in a mixed media environment
US9171202B2 (en) * 2005-08-23 2015-10-27 Ricoh Co., Ltd. Data organization and access for mixed media document system
US8156116B2 (en) 2006-07-31 2012-04-10 Ricoh Co., Ltd Dynamic presentation of targeted information in a mixed media reality recognition system
US7917554B2 (en) 2005-08-23 2011-03-29 Ricoh Co. Ltd. Visibly-perceptible hot spots in documents
US9530050B1 (en) 2007-07-11 2016-12-27 Ricoh Co., Ltd. Document annotation sharing
US8385589B2 (en) 2008-05-15 2013-02-26 Berna Erol Web-based content detection in images, extraction and recognition
US8369655B2 (en) 2006-07-31 2013-02-05 Ricoh Co., Ltd. Mixed media reality recognition using multiple specialized indexes
US8276088B2 (en) 2007-07-11 2012-09-25 Ricoh Co., Ltd. User interface for three-dimensional navigation
US8838591B2 (en) 2005-08-23 2014-09-16 Ricoh Co., Ltd. Embedding hot spots in electronic documents
US7991778B2 (en) 2005-08-23 2011-08-02 Ricoh Co., Ltd. Triggering actions with captured input in a mixed media environment
US8144921B2 (en) 2007-07-11 2012-03-27 Ricoh Co., Ltd. Information retrieval using invisible junctions and geometric constraints
US7702673B2 (en) 2004-10-01 2010-04-20 Ricoh Co., Ltd. System and methods for creation and use of a mixed media environment
US8086038B2 (en) 2007-07-11 2011-12-27 Ricoh Co., Ltd. Invisible junction features for patch recognition
US8825682B2 (en) 2006-07-31 2014-09-02 Ricoh Co., Ltd. Architecture for mixed media reality retrieval of locations and registration of images
US8005831B2 (en) 2005-08-23 2011-08-23 Ricoh Co., Ltd. System and methods for creation and use of a mixed media environment with geographic location information
US9373029B2 (en) 2007-07-11 2016-06-21 Ricoh Co., Ltd. Invisible junction feature recognition for document security or annotation
US7639387B2 (en) * 2005-08-23 2009-12-29 Ricoh Co., Ltd. Authoring tools using a mixed media environment
US8195659B2 (en) 2005-08-23 2012-06-05 Ricoh Co. Ltd. Integration and use of mixed media documents
US8949287B2 (en) 2005-08-23 2015-02-03 Ricoh Co., Ltd. Embedding hot spots in imaged documents
US7920759B2 (en) 2005-08-23 2011-04-05 Ricoh Co. Ltd. Triggering applications for distributed action execution and use of mixed media recognition as a control input
US7769772B2 (en) 2005-08-23 2010-08-03 Ricoh Co., Ltd. Mixed media reality brokerage network with layout-independent recognition
JP4655824B2 (ja) * 2005-08-24 2011-03-23 富士ゼロックス株式会社 画像認識装置、画像認識方法および画像認識プログラム
JP2007281673A (ja) * 2006-04-04 2007-10-25 Fuji Xerox Co Ltd 情報処理装置および情報処理プログラム
US9063952B2 (en) 2006-07-31 2015-06-23 Ricoh Co., Ltd. Mixed media reality recognition with image tracking
US8489987B2 (en) 2006-07-31 2013-07-16 Ricoh Co., Ltd. Monitoring and analyzing creation and usage of visual content using image and hotspot interaction
US8676810B2 (en) 2006-07-31 2014-03-18 Ricoh Co., Ltd. Multiple index mixed media reality recognition using unequal priority indexes
US8201076B2 (en) 2006-07-31 2012-06-12 Ricoh Co., Ltd. Capturing symbolic information from documents upon printing
US9020966B2 (en) 2006-07-31 2015-04-28 Ricoh Co., Ltd. Client device for interacting with a mixed media reality recognition system
US9176984B2 (en) 2006-07-31 2015-11-03 Ricoh Co., Ltd Mixed media reality retrieval of differentially-weighted links
US8073263B2 (en) 2006-07-31 2011-12-06 Ricoh Co., Ltd. Multi-classifier selection and monitoring for MMR-based image recognition
US8385660B2 (en) 2009-06-24 2013-02-26 Ricoh Co., Ltd. Mixed media reality indexing and retrieval for repeated content
US9058331B2 (en) 2011-07-27 2015-06-16 Ricoh Co., Ltd. Generating a conversation in a social network based on visual search results
KR101373681B1 (ko) * 2012-11-09 2014-04-17 주식회사 꿈네트웍스 질문간 관계 설정 시스템
US20160103913A1 (en) * 2014-10-10 2016-04-14 OnPage.org GmbH Method and system for calculating a degree of linkage for webpages

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6162168A (ja) 1984-09-03 1986-03-31 Nippon Telegr & Teleph Corp <Ntt> 音声入出力手段を有する文書処理装置
US5044802A (en) * 1988-08-31 1991-09-03 Canon Kabushiki Kaisha Printing apparatus having an eraser for erasing a printed character
US5181162A (en) 1989-12-06 1993-01-19 Eastman Kodak Company Document management and production system
US6076733A (en) * 1993-11-24 2000-06-20 Metrologic Instruments, Inc. Web-based system and method for enabling a viewer to access and display HTML-encoded documents located on the world wide web (WWW) by reading URL-encoded bar code symbols printed on a web-based information resource guide
JPH04321183A (ja) 1991-04-20 1992-11-11 Ricoh Co Ltd ファイリング装置の文書登録方法
JP2800603B2 (ja) 1992-12-01 1998-09-21 三菱電機株式会社 アイコンを用いた情報処理装置
JP2720924B2 (ja) * 1993-09-21 1998-03-04 富士ゼロックス株式会社 画像信号の符号化装置
US5572625A (en) 1993-10-22 1996-11-05 Cornell Research Foundation, Inc. Method for generating audio renderings of digitized works having highly technical content
JPH07262207A (ja) 1994-03-25 1995-10-13 Kengo Konishi イメージデータファイリング方法,イメージデータ登録方法,イメージデータ検索方法及びその装置
JPH07271818A (ja) 1994-03-31 1995-10-20 Toshiba Corp ハイパーメディアシステム
US5675507A (en) * 1995-04-28 1997-10-07 Bobo, Ii; Charles R. Message storage and delivery system
US5838906A (en) * 1994-10-17 1998-11-17 The Regents Of The University Of California Distributed hypermedia method for automatically invoking external application providing interaction and display of embedded objects within a hypermedia document
JPH08204947A (ja) 1995-01-24 1996-08-09 Canon Inc 画像ファイリング装置および画像ファイリング方法
JP3160177B2 (ja) 1995-03-06 2001-04-23 松下電器産業株式会社 ファクシミリ型電子メール装置
US5870552A (en) * 1995-03-28 1999-02-09 America Online, Inc. Method and apparatus for publishing hypermedia documents over wide area networks
US5708825A (en) * 1995-05-26 1998-01-13 Iconovex Corporation Automatic summary page creation and hyperlink generation
US5781914A (en) 1995-06-30 1998-07-14 Ricoh Company, Ltd. Converting documents, with links to other electronic information, between hardcopy and electronic formats
JPH0950443A (ja) 1995-08-09 1997-02-18 Sony Corp 相互検索可能な複数の記録媒体
JP3604483B2 (ja) 1995-12-02 2004-12-22 株式会社リコー 文書情報管理システムおよび文書情報管理方法
JP4053100B2 (ja) * 1995-09-21 2008-02-27 株式会社リコー 文書情報管理システムおよび文書情報管理方法
US5963966A (en) * 1995-11-08 1999-10-05 Cybernet Systems Corporation Automated capture of technical documents for electronic review and distribution
JPH09146719A (ja) * 1995-11-24 1997-06-06 Toshiba Corp 情報印刷装置および情報印刷方法
EP0867003A2 (en) 1995-12-12 1998-09-30 The Board of Trustees for the University of Illinois Method of and system for transmitting and/or retrieving real-time video and audio information over performance-limited transmission systems
US5692073A (en) * 1996-05-03 1997-11-25 Xerox Corporation Formless forms and paper web using a reference-based mark extraction technique
US5724595A (en) * 1996-06-19 1998-03-03 Sun Microsystems, Inc. Simple method for creating hypertext links
US5911145A (en) * 1996-07-29 1999-06-08 Rae Technology, Inc. Hierarchical structure editor for web sites
US5757468A (en) * 1996-08-29 1998-05-26 Eastman Kodak Co Method and apparatus for producing photographic prints with sound indicia thereon

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101330554B (zh) * 2007-06-22 2010-10-27 佳能株式会社 图像处理设备和方法
US8125689B2 (en) 2007-06-22 2012-02-28 Canon Kabushiki Kaisha Image processing apparatus and method for associating a plurality of pieces of content data

Also Published As

Publication number Publication date
CN1161702C (zh) 2004-08-11
EP0939376A4 (en) 2001-07-04
CA2266630A1 (en) 1999-02-18
EP0939376A1 (en) 1999-09-01
DE69832585T2 (de) 2006-06-14
EP0939376B1 (en) 2005-11-30
JPH1153168A (ja) 1999-02-26
DE69832585D1 (de) 2006-01-05
CA2266630C (en) 2003-01-21
WO1999008207A1 (fr) 1999-02-18
KR100340354B1 (ko) 2002-06-12
KR20000068715A (ko) 2000-11-25
US6332039B1 (en) 2001-12-18

Similar Documents

Publication Publication Date Title
CN1161702C (zh) 结构化文档创建装置和结构化文档创建方法
CN1132108C (zh) 数据通信设备和方法
CN1287310C (zh) 组成多媒体文件的方法和装置
CN1314226C (zh) 多媒体文件共享方法和装置
CN1182473C (zh) 与可连接多个设备的一个网络相连接的数据处理设备
CN1240023C (zh) 可与计算机网络连接的图像处理设备的控制方法
CN1273888C (zh) 成像装置、信息处理装置、程序执行方法及程序生成方法
CN100351835C (zh) 信息处理设备及用于信息处理设备的方法
CN1719862A (zh) 图像处理系统和图像处理方法
CN1484171A (zh) 操作屏幕显示装置、方法及包含显示操作屏幕的程序的记录媒体
CN101039366A (zh) 扫描解决方案系统
CN1913573A (zh) 用于图像检索的图像处理设备及其控制方法
CN1533149A (zh) 图像处理系统
CN101038534A (zh) 信息处理设备及其控制方法
CN101042706A (zh) 文档搜索设备、文档管理系统、文档搜索系统和方法
CN1578348A (zh) 信息处理装置、信息处理方法及软件产品
CN1126358C (zh) 数字复合机
CN1520040A (zh) 字符串处理装置、字符串处理方法和成像装置
CN1486469A (zh) 一种用于提供实时标记分析的聊天服务的方法和系统
CN1574830A (zh) 具备电子公告板功能的服务器装置
CN1244057C (zh) 内容服务器装置和内容提供方法
CN1261878C (zh) 信息提供系统和其中使用的信息提供服务器装置
CN1573733A (zh) 文档管理装置以及文档管理方法、记录介质以及程序
CN1532733A (zh) 服务检索装置、服务检索方法及文件处理系统
CN1536453A (zh) 为使图像输出设置容易的成像装置和成像方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20040811

Termination date: 20140327