CN114467123A - 用于光学字符识别的电子设备、方法和非暂时性存储介质 - Google Patents

用于光学字符识别的电子设备、方法和非暂时性存储介质 Download PDF

Info

Publication number
CN114467123A
CN114467123A CN202080069048.1A CN202080069048A CN114467123A CN 114467123 A CN114467123 A CN 114467123A CN 202080069048 A CN202080069048 A CN 202080069048A CN 114467123 A CN114467123 A CN 114467123A
Authority
CN
China
Prior art keywords
electronic device
content
information
word
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080069048.1A
Other languages
English (en)
Inventor
李大镛
金熙中
李多琼
张玄东
卓熙亣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020190174553A external-priority patent/KR20210043408A/ko
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN114467123A publication Critical patent/CN114467123A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • G06V30/1423Image acquisition using hand-held instruments; Constructional details of the instruments the instrument generating sequences of position coordinates corresponding to handwriting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/144Image acquisition using a slot moved over the image; using discrete sensing elements at predetermined points; using automatic curve following means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

根据实施例,提供了一种用于光学字符识别(OCR)的电子设备和该电子设备的操作方法。用于光学字符识别的电子设备包括:存储器;以及处理器,与所述存储器电连接,其中所述处理器被配置为:在所述存储器中存储至少一个内容和与所述至少一个内容单独对应的至少一个词位表,获得由电子笔在打印文档上扫描的至少一个字符的图像,从所述至少一个内容中标识与所述图像相对应的内容,从所述至少一个词位表中标识与所标识的内容相对应的词位表,并且基于所标识的词位表和所标识的内容的原始数据,获得通过对所述图像执行光学字符识别而识别的结果信息。其他各种实施例也是可能的。

Description

用于光学字符识别的电子设备、方法和非暂时性存储介质
技术领域
本公开的实施例涉及一种用于光学字符识别的电子设备、方法和非暂时性存储介质。
背景技术
光学字符识别(OCR)是使用光来读取文本的技术,具体是通过将光照射到手写或印刷的文本、符号或标记上,将反射光转换为电信号,并经由电信号读取文字。
仅限于诸如扫描仪等大型设备使用的光学字符识别正将其应用扩展到诸如相机、移动设备、平板电脑或智能笔(电子笔)等小型设备。
发明内容
技术问题
然而,传统的光学字符识别技术存在识别率低的问题。对于经由动态扫描获取数字文本数据的智能笔而言,识别不良的问题会更加严重。
传统的光学字符识别技术应用有限,这是因为它扫描和读取模拟图像并将其保存为数字数据。
以上信息仅作为背景信息提出,以帮助对本公开的理解。关于以上任何内容是否可能适用于本公开的现有技术尚未做出确定,也没有做出断言。
技术方案
根据各种实施例,可以提供一种用于具有增强的识别率的光学字符识别的电子设备、方法和非暂时性存储介质。
根据各种实施例,一种用于光学字符识别的电子设备包括:存储器;以及处理器,与存储器电连接。处理器被配置为:在存储器中存储至少一个内容和与至少一个内容单独对应的至少一个词位表,获得由电子笔在打印文档上扫描的至少一个字符的图像,从至少一个内容中标识与图像相对应的内容,从至少一个词位表中标识与所标识的内容相对应的词位表,并且基于所标识的词位表和所标识的内容的原始数据,获得通过对图像执行光学字符识别而识别的结果信息。
根据各种实施例,一种通过电子设备进行光学字符识别(OCR)的方法包括:在电子设备的存储器中存储至少一个内容和与至少一个内容单独对应的至少一个词位表;获得由电子笔在打印文档上扫描的至少一个字符的图像;从至少一个内容中标识与图像相对应的内容,从至少一个词位表中标识与所标识的内容相对应的词位表,并且基于所标识的词位表和所标识的内容的原始数据,获得通过对图像执行光学字符识别而识别的结果信息。
根据各种实施例,提供了一种存储指令的非暂时性存储介质,指令由处理器执行以使得处理器能够:在存储器中存储至少一个内容和与至少一个内容单独对应的至少一个词位表;获得由电子笔在打印文档上扫描的至少一个字符的图像;从至少一个内容中标识与图像相对应的内容,从至少一个词位表中标识与所标识的内容相对应的词位表,并且基于所标识的词位表和所标识的内容的原始数据,获得通过对图像执行光学字符识别而识别的结果信息。
根据各种实施例,一种电子设备包括:外壳的第一组件;笔尖,形成在第一组件的端部处;外壳的第二组件,被配置为从第一组件的端部可拆卸;以及光学字符识别模块,安装在第一组件内部。第二组件包含墨水并且被配置为当第二组件耦接到第一组件的端部以覆盖笔尖时使笔尖充满墨水。光学字符识别模块被配置为从打印文档的至少一部分扫描至少一个字符以进行光学字符识别。打印文档的至少一部分在与笔尖接触时被墨水着色。
根据以下详细描述,本公开的其他方面、优点和显着特征对于本领域技术人员将变得显而易见,该详细描述结合附图公开了本公开的示例性实施例。
在进行下面的详细描述之前,对整个本专利文档中使用的某些词和短语进行定义可能是有利的:术语“包括”和“包含”以及它们的派生词意味着包括但不限于;术语“或”是开放式的,意味着和/或;短语“与...相关联”和“与其相关”及其派生词可以意味着包括、包括在内、与...互连、包含、包含在内、连接到或与...连接、耦接到或与...耦接、与...可通信,与...协作、交错、并列、与...接近、受约束于或与...密切相关、具有、具有...属性等;并且术语“控制器”意味着控制至少一个操作的任何设备、系统或其部件,这样的设备可以用硬件、固件或软件或至少两者的某种组合来实现。应注意,与任何特定控制器相关联的功能可以是集中式的或分布式的,无论是本地的还是远程的。
此外,以下描述的各种功能可以由一个或多个计算机程序来实现或支持,每个计算机程序由计算机可读程序代码形成并嵌入在计算机可读介质中。术语“应用”和“程序”指代一个或多个计算机程序、软件部件、指令集、过程、功能、对象、类、实例、相关数据、或其适于在合适的计算机可读程序代码中实现的部分。短语“计算机可读程序代码”包括任何类型的计算机代码,包括源代码、目标代码和可执行代码。短语“计算机可读介质”包括能够被计算机访问的任何类型的介质,例如只读存储器(ROM)、随机存取存储器(RAM)、硬盘驱动器、光盘(CD)、数字视频光盘(DVD)或任何其他类型的存储器。“非暂时性”计算机可读介质不包括传输暂时性电或其他信号的有线、无线、光或其他通信链路。非暂时性计算机可读介质包括能够永久存储数据的介质和能够存储并随后覆写数据的介质,例如可重写光盘或可擦除存储设备。
在整个本专利文档中提供了某些词和短语的定义,本领域普通技术人员应理解,在许多(如果不是大多数)情况下,这样的定义适用于这样定义的词以及短语的先前和未来使用。
发明的有益效果
从上述描述中显而易见地,根据实施例,在电子设备和电子设备的操作方法中,将与打印文档相对应的内容和与该内容相对应生成的词位表进行映射和预存储。如果从打印的文档中扫描到至少一个字符,则基于预存储的原始数据和词位表,获得通过对扫描的至少一个字符的图像进行光学字符识别而得到的信息。因此,能够为扫描的至少一个字符以及打印文档的各种附加信息提供增强的识别率。
附图说明
为了更完整地理解本公开及其优点,现在结合附图参考以下描述,其中相同的附图标记表示相同的部件。
当结合附图考虑时,通过参考以下详细描述,将容易获得对本公开及其许多伴随方面的更完整理解,这是因为其变得更好理解,在附图中:
图1是示出了根据实施例的网络环境的视图;
图2是示出了根据实施例的第一电子设备、第二电子设备以及服务器的示例配置的视图;
图3是示出了根据实施例的服务器的示例配置的视图;
图4A、图4B和图4C是示出了根据实施例的第二电子设备的特定示例配置的视图;
图5是示出了根据实施例的第二电子设备扫描字符的示例的视图;
图6是示出了根据实施例的服务器的示例操作过程的视图;
图7是示出了根据实施例的服务器的示例操作过程的视图;
图8是示出了根据实施例的第二电子设备扫描字符的示例的视图;
图9A、图9B、图9C、图9D、图9E、图9F和图9G是示出了根据实施例的服务器的示例操作过程的视图;
图10是示出了根据实施例的用于在第一电子设备、第二电子设备和服务器之间进行光学字符识别的示例操作过程的视图;
图11是示出了根据实施例的第一电子设备上显示的示例屏幕的视图;
图12A和图12B是示出了根据实施例的第一电子设备上显示的示例屏幕的视图;
图13是示出了根据实施例的用于在第一电子设备、第二电子设备和服务器之间进行光学字符识别的示例操作过程的视图;
图14是示出了根据实施例的用于在第一电子设备、第二电子设备和服务器之间进行光学字符识别的示例操作过程的视图;
图15A、图15B和图15C是示出了根据实施例的第一电子设备上显示的示例屏幕的视图;
图16A和图16B是示出了根据实施例的第一电子设备上显示的示例屏幕的视图;
图17A和图17B是示出了根据实施例的第一电子设备上显示的示例屏幕的视图;以及
图18是示出了根据实施例的第一电子设备上显示的示例屏幕的视图。
在整个附图中,相同的附图标记应理解为指代相同的组件、部件和结构。
具体实施方式
下面讨论的图1至图18以及在本专利文档中用于描述本公开的原理的各种实施例仅作为示意,不应以任何方式解释为限制本公开的范围。本领域技术人员将理解本公开的原理可以在任何适合布置的系统或设备中实现。
根据各种实施例的电子设备可以是各种类型的电子设备中的一种。电子设备可以包括例如便携式通信设备(例如智能电话)、计算机设备、便携式多媒体设备、便携式医疗设备、相机、可穿戴设备或家用电器。根据本公开的实施例,电子设备不限于上述那些。
应当理解,本公开的各种实施例和其中使用的术语并非旨在将本文阐述的技术特征限制于特定实施例,而是包括对应实施例的各种改变、等同物或备选。关于附图的描述,相似的附图标记可以用来指代相似或相关的元件。应当理解,与项目相对应的名词的单数形式可以包括一个或多个事物,除非相关上下文另有明确指示。如本文所用,诸如“A或B”、“A和B中的至少一个”、“A或B中的至少一个”、“A、B或C”、“A、B和C中的至少一个”以及“A、B或C中的至少一个”等短语中的每一个可以包括在对应的一个短语中一起列举的项目的所有可能组合。如本文所用,诸如“第一”和“第二”或“第一个”和“第二个”等术语可以用于简单地将对应的组件与另一组件区分开来,而不在其他方面(例如,重要性或顺序)限制组件。应当理解,如果元件(例如,第一元件)被称为(无论有或没有术语“操作地”或“通信地”)“耦接到”、“连接到”另一元件(例如,第二元件)或与另一元件“耦接”、“连接”,意味着该元件可以直接(例如,有线地)、无线地或经由第三元件与另一元件耦接。
如本文所用,术语“模块”可以包括以硬件、软件或固件实现的单元,并且可以与其他术语(例如,“逻辑”、“逻辑块”、“组件”或“电路”)互换使用。模块可以是单个集成组件,或者是其最小单元或组件,适于执行一个或多个功能。例如,根据实施例,模块可以以专用集成电路(ASIC)的形式实现。
如本文所述的各种实施例可以被实现为软件(例如,程序140),包括机器(例如,电子设备101)可读的存储介质(例如,内部存储器136或外部存储器138)中存储的一个或多个指令。例如,机器(例如,电子设备101)的处理器(例如,处理器120)可以调用存储介质中存储的一个或多个指令中的至少一个,并使用或不使用处理器控制下的更多其他组件,执行一个或多个指令中的至少一个。这允许机器被操作以根据调用的至少一个指令执行至少一个功能。一个或多个指令可以包括编译器生成的代码或解译器可执行的代码。机器可读存储介质可以以非暂时性存储介质的形式提供。术语“非暂时性”仅意味着存储介质是有形设备,而不包括信号(例如,电磁波),但该术语不区分数据半永久存储在存储介质中的情况以及数据临时存储在存储介质中的情况。
根据实施例,根据本公开的各种实施例的方法可以包括并提供在计算机程序产品中。计算机程序产品可以作为商品在买卖双方之间进行交易。计算机程序产品可以以机器可读存储介质(例如,光盘只读存储器(CD-ROM))的形式,或者经由应用商店(例如,PlayStoreTM),或者在两个用户设备(例如,智能手机)之间直接发布。如果在线发布,则至少部分计算机程序产品可以临时生成或至少临时存储在机器可读存储介质,例如存储在制造商服务器的存储器、应用商店的服务器或中继服务器。
根据各种实施例,上述部件中的每个部件(例如,模块或程序)可以包括单个实体或多个实体。根据各种实施例,可以省略上述部件中的一个或多个,或者可以添加一个或多个其他部件。备选地或附加地,多个部件(例如,模块或程序)可以集成到单个部件中。在这样的情况下,根据各种实施例,集成部件仍然可以以与在集成之前由多个部件中的对应一个部件执行的相同或相似方式执行多个部件中的每个部件的一个或多个功能。根据各种实施例,由模块、程序或另一部件执行的操作可以顺序地、并行地、重复地或启发式地执行,或者操作中的一个或多个可以以不同的顺序执行或省略,或者可以添加一个或多个多其他操作。
图1是示出了根据各种实施例的网络环境100中的电子设备101的框图。参照图1,网络环境100中的电子设备101可以经由第一网络198(例如,短距离无线通信网络)与电子设备102通信,或者经由第二网络199(例如,远距离无线通信网络)与电子设备104或服务器108通信。根据实施例,电子设备101可以经由服务器108与电子设备104通信。根据实施例,电子设备101可以包括处理器120、存储器130、输入设备150、声音输出设备155、显示设备160、音频模块170、传感器模块176、接口177、触觉模块179、相机模块180、电力管理模块188、电池189、通信模块190、用户标识模块(SIM)196或天线模块197。在一些实施例中,可以从电子设备101中省略部件中的至少一个(例如,显示设备160或相机模块180),或者可以在电子设备101中添加一个或多个其他部件。在一些实施例中,一些部件可以实现为单个集成电路。例如,传感器模块176(例如,指纹传感器、虹膜传感器或照度传感器)可以被实现为嵌入在显示设备160(例如,显示器)中。
处理器120可以执行例如软件(例如程序140)以控制与处理器120耦接的电子设备101的至少一个其他部件(例如硬件或软件部件),并且可以执行各种数据处理或计算。根据实施例,作为数据处理或计算的至少一部分,处理器120可以将从另一部件(例如,传感器模块176或通信模块190)接收的命令或数据加载到易失性存储器132中,处理易失性存储器132中存储的命令或数据,并将得到的数据存储在非易失性存储器134中。根据实施例,处理器120可以包括主处理器121(例如,中央处理单元(CPU)或应用处理器(AP)),以及可独立于或结合主处理器121操作的辅处理器123(例如,图形处理单元(GPU)、图像信号处理器(ISP)、传感器集线器处理器或通信处理器(CP))。附加地或备选地,辅处理器123可以适于消耗比主处理器121更少的功率,或者特定于指定的功能。辅处理器123可以与主处理器121分离或作为主处理器121的一部分来实现。
辅处理器123可以在主处理器121处于非活动(例如,睡眠)状态时代替主处理器121,或者在主处理器121处于活动状态(例如,执行应用)时与主处理器121一起,控制与电子设备101的部件之中的至少一个部件(例如,显示设备160、传感器模块176或通信模块190)相关的功能或状态中的至少一些。根据实施例,辅处理器123(例如,图像信号处理器或通信处理器)可以被实现为功能上与辅处理器123相关的另一部件(例如,相机模块180或通信模块190)的一部分。
存储器130可以存储电子设备101的至少一个部件(例如,处理器120或传感器模块176)使用的各种数据。各种数据可以包括,例如,软件(例如,程序140)以及与其相关的命令的输入数据或输出数据。存储器130可以包括易失性存储器132或非易失性存储器134。
程序140可以作为软件存储在存储器130中,并且可以包括例如操作系统(OS)142、中间件144、或应用146。
输入设备150可以从电子设备101的外部(例如,用户)接收要由电子设备101的其他部件(例如,处理器120)使用的命令或数据。输入设备150可以包括例如麦克风、鼠标、键盘或数字笔(例如,触控笔)。
声音输出设备155可以将声音信号输出到电子设备101的外部。声音输出设备155可以包括例如扬声器或听筒。扬声器可以用于一般用途,例如播放多媒体或播放录音,而听筒可以用于来电呼叫。根据实施例,接收器可以被实现为与扬声器分离或作为扬声器的部件。
显示设备160可以视觉地向电子设备101的外部(例如,用户)提供信息。显示设备160可以包括例如显示器、全息图设备或投影仪和用于控制显示器、全息图设备和投影仪中对应一个的控制电路。根据实施例,显示设备160可以包括适于检测触摸的触摸电路,或适于测量由触摸引起的力的强度的传感器电路(例如,压力传感器)。
音频模块170可以将声音转换为电信号,反之亦然。根据实施例,音频模块170可以经由输入设备150获得声音,或者经由声音输出设备155或与电子设备101直接(例如,有线地)或无线耦接的外部电子设备(例如,电子设备102)的耳机输出声音。
传感器模块176可以检测电子设备101的操作状态(例如,功率或温度)或电子设备101外部的环境状态(例如,用户的状态),然后生成电信号或与检测到的状态相对应的数据值。根据实施例,传感器模块176可以包括例如手势传感器、陀螺仪传感器、气压传感器、磁传感器、加速度传感器、抓握传感器、接近传感器、颜色传感器、红外传感器(IR)传感器、生物特征传感器、温度传感器、湿度传感器或照度传感器。
接口177可以支持一种或多种指定协议,用于电子设备101与外部电子设备(例如,电子设备102)直接(例如,有线地)或无线地耦接。根据实施例,接口177可以包括例如高清多媒体接口(HDMI)、通用串行总线(USB)接口、安全数字(SD)卡接口或音频接口。
连接端子178可以包括连接器,电子设备101可以经由该连接器与外部电子设备(例如,电子设备102)物理连接。根据实施例,连接端子178可以包括例如HDMI连接器、USB连接器、SD卡连接器或音频连接器(例如,耳机连接器)。
触觉模块179可以将电信号转换成机械刺激(例如,振动或运动)或电刺激,用户可以经由他的触觉或动觉来识别它们。根据实施例,触觉模块179可以包括例如电机、压电元件或电刺激器。
相机模块180可以捕捉静止图像或运动图像。根据实施例,相机模块180可以包括一个或多个镜头、图像传感器、图像信号处理器或闪光灯。
电力管理模块188可以管理供给电子设备101的电力。根据一个实施例,电力管理模块188可以实现为例如电力管理集成电路(PMIC)的至少一部分。
电池189可以向电子设备101的至少一个部件供电。根据实施例,电池189可以包括例如不可充电的主电池、可充电的二次电池或燃料电池。
通信模块190可以支持在电子设备101和外部电子设备(例如,电子设备102、电子设备104或服务器108)之间建立直接(例如,有线)通信信道或无线通信信道,以及经由建立的通信信道执行通信。通信模块190可以包括可独立于处理器120(例如,应用处理器(AP))操作并且支持直接(例如,有线)通信或无线通信的一个或多个通信处理器。根据实施例,通信模块190可以包括无线通信模块192(例如,蜂窝通信模块、短距离无线通信模块或全球导航卫星系统(GNSS)通信模块)或有线通信模块194(例如,局域网(LAN)通信模块或电力线通信(PLC)模块)。这些通信模块中对应的一个可以经由第一网络198(例如,诸如蓝牙TM、无线保真(Wi-Fi)直连或红外数据协会(IrDA)等短距离通信网络)或第二网络199(例如,诸如蜂窝网络、互联网或计算机网络(例如,LAN或广域网(WAN)等远距离通信网络)与外部电子设备通信。这些各种类型的通信模块可以被实现为单个部件(例如,单个芯片),或者可以被实现为彼此分离的多个部件(例如,多个芯片)。无线通信模块192可以使用用户标识模块196中存储的用户信息(例如,国际移动用户标识(IMSI))来标识和认证通信网络(例如,第一网络198或第二网络199)中的电子设备10。
天线模块197可以向外部(例如,外部电子设备)发送或从外部(例如,外部电子设备)接收信号或电力。根据实施例,天线模块197可以包括一个天线,该天线包括由形成在基板(例如,印刷电路板(PCB))上的导体或导电图案形成的辐射器。根据实施例,天线模块197可以包括一个或多个天线。在这种情况下,可以通过例如通信模块190从多个天线中选择适合于在通信网络(例如,第一网络198或第二网络199)中使用的通信方案的至少一个天线。然后可以经由所选择的至少一个天线在通信模块190和外部电子设备之间发送或接收信号或电力。根据实施例,除辐射器之外的其他组件(例如,射频集成电路(RFIC))可以进一步形成为天线模块197的组件。
上述部件中的至少一些可以相互耦接并经由外围设备间通信方案(例如,总线、通用输入和输出(GPIO)、串行外围接口(SPI)或移动工业处理器接口(MIPI)彼此之间传输信号(例如,命令或数据)。
根据实施例,可以经由与第二网络199耦接的服务器108在电子设备101和外部电子设备104之间发送或接收指令或数据。电子设备102和电子设备104中的每一个可以是与电子设备101具有相同类型或不同类型的设备。根据实施例,要在电子设备101处执行的所有或一些操作可以在外部电子设备102、104或108中的一个或多个处执行。例如,如果电子设备101应自动执行功能或服务,或者响应于来自用户或另一设备的请求,则代替执行该功能或服务或除了执行该功能或服务以外,电子设备101可以请求一个或多个外部电子设备执行该功能或服务的至少一部分。接收请求的一个或多个外部电子设备可以执行所请求的功能或服务的至少一部分,或者与请求相关的附加功能或附加服务,并将执行的结果传送给电子设备101。电子设备101可以提供该结果(无论是否进一步处理该结果)作为对该请求的答复的至少一部分。为此,例如,可以使用云计算、分布式计算或客户端-服务器计算技术。
图2是示出了根据实施例的第一电子设备、第二电子设备和服务器的示例配置的视图。图3是示出了根据实施例的服务器的示例配置的视图。
参照图1和图2,根据实施例,可以经由第一电子设备101、第二电子设备102(例如,电子笔)和服务器108(例如,第三电子设备)之间的通信来配置用于光学字符识别的网络环境。
根据实施例,当第二电子设备102在打印文档(例如,打印在一张纸或布上的文本)上扫描至少一个字符(例如,字符串)时,第一电子设备101的处理器120可以通过通信模块190从第二电子设备102接收扫描的至少一个字符的图像数据。处理器120可以基于接收到的图像数据获得要读取的图像直到字符扫描完成为止,并控制将要读取的图像通过通信模块190发送到服务器108。通信模块190可以经由例如第一通信方案(例如,诸如蓝牙、Wi-Fi直连或红外数据协会(IrDA)等短距离通信)与第二电子设备102执行通信,并且可以经由例如第二通信方案(例如,诸如蜂窝网络、互联网或计算机网络(例如,局域网(LAN)或广域网(WAN)等远距离通信网络)与服务器108执行通信。通信模块190可以通过其他通信方案与第二电子设备102和/或服务器108执行通信。
根据实施例,第一电子设备101的处理器120可以将对象配置为能够基于与从服务器108接收的内容相关的信息来选择可以从服务器108提供的至少一个内容,并且控制显示器160显示包括配置对象的屏幕(例如,第一屏幕)。当选择第一屏幕上显示的对象中的至少一个时,处理器120可以标识与所选择的至少一个对象单独对应的至少一个内容,并且通过通信模块190将与标识的至少一个内容相关的信息发送到服务器108。处理器120可以接收在服务器108中通过光学字符识别而获得的结果信息,并控制显示器160显示接收到的结果信息。
根据实施例,第一电子设备101的处理器120可以获得至少一个内容的原始数据和与至少一个内容单独对应的至少一个词位表,基于获得的原始数据和至少一个词位表,使用光学字符识别算法(例如,应用、功能或程序)读取第二电子设备扫描的至少一个字符的图像,并从读取的图像中获得通过光学字符识别得到的信息。在标识出通过光学字符识别得到的信息之后,处理器120可以基于与标识的内容相对应的词位表将从图像中读取的至少一个词与标识的内容的原始数据进行比较,并且可以校正该至少一个词。处理器120可以获得通过光学字符识别得到的信息,该信息包括校正的至少一个词。这里,通过光学字符识别得到的信息可以示出比读取图像的结果更高的字符识别率。处理器120可以控制显示器160显示获得的结果信息。作为另一示例,处理器120可以将获得的结果信息发送到另一外部电子设备。
根据实施例,第一电子设备101的处理器120可以获得标识的内容的附加信息并且控制显示器160将获得的附加信息与获得的结果信息一起显示。这里,附加信息可以包括以下项中的至少一项:内容的标题、关于内容的作者/出版者信息、内容的副标题、内容的页面、指示包括光学字符识别结果信息在内的部分的信息(例如,包括光学字符识别结果信息的副标题或章节)、与结果信息相关的映射图像、与结果信息相关的图像(或与结果信息相关的图像的特定部分)、结果信息相关的描述文档、与结果信息相关的音频(或结果信息相关音频的特定部分)、其他用户的类似结果信息、内容的文档源信息(url或文件路径)、用于编辑结果信息的对象或相关文档的信息。
根据实施例,当第二电子设备102切换到用于词搜索的模式(例如,第二模式)并扫描打印文档上的至少一个字符时,处理器120将针对扫描的至少一个字符的词搜索请求发送到服务器108,从响应于该请求的服务器108获得与扫描的至少一个字符相对应的至少一个词的搜索信息,并控制显示器160显示获得的搜索信息。
根据实施例,当在提供通过光学字符识别得到的信息之后,第二电子设备102在打印文档的与结果信息相对应的位置重新扫描至少一个字符时,处理器120可以标识与扫描的至少一个字符相对应的至少一个词,并且将包括标识的至少一个词在内的词搜索请求的消息发送到服务器108。处理器120可以获得服务器108根据词搜索请求获得的搜索信息。根据另一实施例,处理器120可以使用针对在第一电子设备101上执行的词搜索的应用(例如,字典应用、程序或功能)从存储器130中存储的字典数据中获得与扫描的至少一个字符相对应的至少一个词的搜索信息。
根据实施例,处理器120可以控制显示器160显示获得的搜索信息和通过光学字符识别得到的信息。当选择在显示器的屏幕(例如第一屏幕)上显示的特定对象(针对词列表的对象)时,处理器120可以控制显示器160显示先前搜索的词的历史信息。
根据实施例,第一电子设备101的存储器130可以存储从第二电子设备102接收到的图像数据,并且可以存储从服务器108接收到的通过光学字符识别得到的信息。根据实施例,存储器130可以存储与从服务器108接收到的至少一个内容相关的信息,并且存储针对基于与该至少一个内容相关的信息而配置的第一屏幕的组成。根据实施例,存储器130可以存储从服务器108提供的至少一个内容的原始数据以及与该至少一个内容单独对应的至少一个词位表。
根据实施例,第一电子设备101的显示器160可以显示用于选择或搜索至少一个内容的第一屏幕和包括通过光学字符识别得到的信息的屏幕(例如,第二屏幕)。
参照图2,根据实施例,第二电子设备102(例如,电子笔)可以使用光学字符识别功能扫描打印文档上的至少一个字符(例如,字符串),并通过第一通信方案(例如,蓝牙通信)将扫描的至少一个字符的图像数据发送到第一电子设备101。第二电子设备102可以选择性地执行用于光学字符识别的模式(例如,第一模式)或用于对打印文档上扫描的至少一个字符进行词搜索的模式(例如,第二模式)。
参照图2,根据实施例,服务器108(例如,第三电子设备)可以包括处理器201、通信模块203和存储器205。
根据实施例,作为执行光学字符识别之前的预处理操作,服务器108(例如,第三电子设备)的处理器201可以在存储器205中存储至少一个内容,该内容包括字符串和与至少一个内容单独对应的至少一个协议。
参照图3,处理器201可以对至少一个内容301的原始数据进行分析,标识经分析的原始数据中包括的词的位置,并基于标识的位置,生成与至少一个内容301中的每一个相对应的词位表303。处理器201可以使用标识信息(文档id)将生成的至少一个词位表303与至少一个内容301映射并将结果存储在存储器205中。这里,可以将至少一个内容与包括标识信息(文档id)和文件路径信息(文件路径)的内容相关信息305一起存储。每个词位表可以包括与以下项相关的信息307:用于标识映射内容的标识信息(文档id)、映射内容的原始数据中包括的词、以及包括每个词的位置信息的词位表。根据实施例,在从第一电子设备101或外部电子设备接收到上传至少一个内容的请求时,处理器201可以根据请求生成与至少一个内容单独对应的至少一个词位表。
根据实施例,处理器201可以从第一电子设备101获得第二电子设备102扫描的至少一个字符的图像,标识存储器205中存储的内容之中与该图像相对应的内容,并且从存储器205中获得标识的内容的原始数据和与标识的内容相对应的词位表。这里,标识的内容可以是在扫描打印图像之前由用户从至少一个内容中选择的内容,或者是在请求上传与打印图像相对应的内容时上传的内容。
根据实施例,处理器201可以基于获得的词位表和原始数据,从扫描的至少一个字符的图像中获得通过光学字符识别得到的结果信息,并控制通信模块203将获得的结果信息发送到第一电子设备101或外部电子设备。处理器201可以基于与标识的内容相对应的词位表,将从扫描的至少一个字符的图像中读取的至少一个词与标识的内容的原始数据进行比较,对该至少一个词进行校正,并获得通过光学字符识别得到的信息,该信息包括校正的至少一个词。
根据实施例,处理器201可以获得标识的内容的附加信息。附加信息可以包括以下至少一项:包括光学字符识别结果的原始数据的页面、原始数据的作者、原始数据的标题或指示包括光学字符识别结果的部分的信息。
根据实施例,在经由第一电子设备101接收到对第二电子设备102扫描的至少一个字符的搜索请求时,处理器201可以标识扫描的至少一个字符的至少一个词,并且提供标识的词的搜索信息。这里,搜索信息可以包括标识的词的详情(例如,字典含义)、同义词、反义词、示例或来源中的至少一项。
根据实施例,当第二电子设备102在搜索模式状态下从第一电子设备101接收到对扫描的至少一个字符的词搜索请求时,处理器201可以获得从扫描的至少一个字符的图像中读取的至少一个词的搜索信息,并将获得的搜索信息提供给第一电子设备101。
根据实施例,当在提供了通过光学字符识别得到的信息之后,在打印文档的与结果信息相对应的位置重新扫描至少一个字符时,处理器201可以从第一电子设备101接收搜索与扫描的至少一个字符相对应的至少一个词的请求。处理器201可以根据搜索请求向第一电子设备101提供至少一个词的搜索信息。
根据实施例,服务器108的处理器201(可以是硬件模块或软件模块(例如,应用程序))可以是硬件部件(功能)或软件部件(程序),并且包括以下至少一项:各种传感器、数据测量模块、输入/输出接口、用于管理服务器108的状态或环境的模块或包括在服务器108中的通信模块。根据实施例,处理器201可以包括例如:硬件模块、软件模块、固件模块或其中两种或更多种的组合。根据本公开的实施例,处理器201可以不包括这些部件中的至少一些,或者可以包括除了这些部件之外的用于执行图像处理操作的其他部件。
根据实施例,服务器108的通信模块203可以经由网络与第一电子设备101连接,并且通信模块203可以从第一电子设备101或外部电子设备(未示出)接收请求上传的至少一个内容,并发送由第一电子没备101或外部电子设备(未示出)请求下载的至少一个内容。通信模块203可以将由处理器201通过光学字符识别得到的信息发送到第一电子设备101。通信模块203可以经由第二通信方案与第一电子设备101通信。
以上已经结合图2的第一电子设备101和服务器108描述了第一电子设备101和服务器108的主要部件。然而,根据各种实施例,图2中所示的部件不是必要的部件,并且电子设备101和服务器108中的每一个都可以用比所示部件更多或更少的部件来实现。以上结合图2描述的第一电子设备101和服务器108中的每一个的位置可以根据实施例而改变。
图4A、图4B和图4C是示出了根据实施例的第二电子设备的特定示例配置的视图。图5是示出了根据实施例的第二电子设备扫描字符的示例的视图。
参照图4A和图4B,根据实施例,第二电子设备102可以包括第一组件410和可拆卸地设置到第一组件410的第二组件420。第二电子设备102可以包括形成在第一组件410的端部处的笔尖401、光学字符识别模块403、处理器405、通信模块407和设置在第一组件410内部的电池409。第二电子设备可以包括其他各种部件。根据实施例,处理器405和通信模块407的至少一部分可以形成在印刷电路板上或芯片中。处理器405、通信模块407、光学字符识别模块403和电池409可以相互电连接。
根据实施例,第二电子设备102的笔尖401可以从第一组件410的侧表面突出。根据实施例,当安装第二组件420以在第一组件410的笔尖401所在的侧表面处覆盖笔尖401时,可以填充第二部分423中包含的墨水。如图5所示,当笔尖401接触到打印文档501的要扫描的位置时,在文档501中用填充墨水打印的扫描区域511可以被着色。根据另一实施例,第二电子设备102的笔尖401可以被配置为不突出。根据另一实施例,第二电子设备102的笔尖401可以被配置为可替换的。
根据实施例,第二电子设备102的光学字符识别模块403(作为外壳的第一组件410的主体)可以包括以下至少一项:滤光器(例如,IR滤光器)411、第一传感器(例如,线传感器)413、第二传感器(例如,压力传感器)415、按钮(例如,模式切换开关)417、第三传感器(例如,霍尔传感器)419、以及光源(未示出)。第一组件410还可以包括任何其他部件。
例如,作为IR滤光器的滤光器411可以过滤从光源生成的预定强度的光。从光源生成的光可以是例如发光二极管(LED)、有机发光二极管(OLED)或激光束,但不限于此。
第一传感器413可以检测通过滤光器411接收到的光信号,基于检测到的光信号沿每行扫描打印文档上的至少一个字符(例如,字符串),并获得每个像素的图像数据。可以在第二电子设备102开启时运行第一传感器413。
第二传感器415可以检测用于标识至少一个字符扫描的开始和结束的信号。当笔尖401与打印文档接触并被按压时,第二传感器415可以检测从笔尖401传送的压力。例如,在检测到压力的预设阈值或更大的压力时,第二传感器415可以将信号传送到第二电子设备102的处理器405,并且当释放压力时,例如,在检测到小于预设阈值的压力时,可以不向第二电子设备102的处理器405传送信号。因此在接收到信号时,第二电子设备102的处理器405可以标识字符扫描的开始和保持,并且除非接收到信号,否则可以标识字符扫描的终止。可以在第二电子设备102开启时运行第二传感器415。
按钮417可以设置在第二电子设备102的第一组件410的外壳的外表面上,并且可以根据按钮输入将切换信号传送到第二电子设备102的处理器405,以切换到用于光学字符识别的模式(例如,第一模式)或用于词搜索的模式(例如,第二模式)。
当第二组件420附着到第一组件410的一个侧表面/从第一组件410的一个侧表面拆卸时,第三传感器419可以检测到信号,并且在检测到信号时,将信号传送到第二电子设备102的电池409和处理器405。因此,在从第三传感器419接收到信号时,第二电子设备102的处理器405可以开启第二电子设备102,并且在从第三传感器419接收到信号时,关闭第二电子没备102。
根据实施例,可以将第二电子设备102的第二组件420划分为第一部分421和第二部分423,第一部分421被配置为沿着第一组件410的长度方向可拆卸地耦接到第一组件410的任一端部,第二部分423可以充满墨水。可以根据墨水颜色设置多个第二部分423。根据另一实施例,第二电子设备102的第二组件420可以包括第一部分421,而没有可填充墨水的第二部分423。
根据实施例,在检测到来自第三传感器419的信号时,第二电子设备102的处理器405可以控制开启第二电子设备102并控制通过通信模块(未示出)将从第一传感器413输出的图像数据发送到第一电子设备101。例如,处理器405可以在每个预设时间间隔将图像数据发送到第一电子设备101。根据实施例,第二电子设备102的处理器405可以包括光学字符识别算法(程序或功能),使用光学字符识别算法(或程序或功能)在每个预设时间间隔内基于从第一传感器413输出的图像数据,获得字符图像,并且对获得的字符图像按像素进行分析,识别出至少一个字符。处理器405可以将识别的至少一个字符的图像发送到第一电子设备101。
根据实施例,在接收到来自按钮417的切换信号时,第二电子设备102的处理器405可以根据按钮输入切换到用于光学字符识别的模式(例如,第一模式)或用于进行词搜索的模式(例如,第二种模式)。处理器405可以生成每个模式的不同频率的信号或者向第一电子设备101发送用于标识每个模式的模式标识信息。在接收到不同频率的信号或模式标识信息时,第一电子设备101可以标识在第二电子设备102上执行的操作模式,并根据标识的操作模式(例如,第一模式或第二模式)执行操作。例如,在第一模式下,第一电子设备101可以执行光学字符识别以提高光学字符识别率,并且显示并存储获得的结果信息,在第二模式下,第一电子设备101可以对识别的至少一个字符进行词搜索,并且显示并存储获得的搜索信息。
根据实施例,第二电子设备102的处理器405可以获得用于标识第二组件420中的墨水颜色的标识信息,并且基于获得的标识信息标识填充墨水的颜色。例如,第二电子设备102的处理器405可以与第二组件420电连接,并且接收与被配置为对第二组件420中包括的墨水的颜色加以指示的标识信息有关的信息。作为另一示例,第二电子设备102的处理器405可以基于预设颜色信息和通过标识形成在第二组件420上的特定符号或标记而标识的信息,通过耦接第二组件420来标识填充墨水的颜色。作为另一示例,第二电子设备102还可以包括能够检测颜色的部件(例如传感器),并且可以经由可检测颜色的部件(例如传感器)标识在打印文档上输出的墨水的颜色。根据实施例,第二电子设备102的处理器405在发送扫描的图像数据时,可以将用于标识获得的墨水颜色的标识信息发送到第一电子设备101。
根据实施例,第二电子设备102的可以是硬件模块或软件模块(例如,应用程序)的处理器405可以是硬件部件(功能)或软件部件(程序),并且包括以下至少一项:各种传感器、数据测量模块、输入/输出接口、用于管理第二电子设备102的状态或环境的模块、或第二电子设备102中包括的通信模块。根据实施例,第二电子设备102的处理器405可以包括例如硬件模块、软件模块、固件模块或者其中两个或更多个的组合。根据本公开的实施例,第二电子设备102的处理器405可以不包括这些部件中的至少一些,或者除了这些部件之外还可以包括用于执行图像处理操作的其他部件。
根据实施例,第二电子设备102的通信模块407可以经由第一通信方案(例如,短距离通信(例如,蓝牙或蓝牙低功耗(BLE))与第一电子设备101通信。根据实施例,第二电子设备102的通信模块407可以使用电磁辐射(EMR)输入方案向第一电子设备101发送/从第一电子设备101接收用于用户界面的信号。根据另一实施例,当用户按压或触摸设置在外壳表面上的按钮417以切换操作模式时,第二电子设备102的通信模块407可以发送每个操作模式的不同频率的信号。
根据实施例,第二电子设备102的电池409可以存储用于第二电子设备102的整体操作的电力并且可以是可充电的或不可充电的。例如,电池409可以包括双电层电容器(EDLC)。
参照图4C,根据实施例,第二电子设备102还可以包括以上结合图4A和图4B描述的第二电子设备102的部件以及第三组件430。第三组件430可以配置在第一组件410的另一侧(例如,笔尖401的沿外壳的纵方向形成的相对侧表面)。第三组件430可以包括从第一组件410的另一端部突出的电介质尖端(未示出)和与第一组件410内部的电介质尖端电连接以产生电磁场的线圈单元(未示出)。第三组件430可以与处理器405电连接。第三组件430可以在外部显示器(例如,第一电子设备101的显示器160)的触摸面板上生成电磁场信号。根据实施例,当通过读取并获得在打印文档上扫描的至少一个字符而得到的结果信息显示在外部显示器(例如,第一电子设备101的显示器160)上时,第二电子设备102可以经由第三组件430在显示器(例如,第一电子设备101的显示器160)的触摸面板上输入与结果信息相关的附加信息(例如,备忘录、图片、图像、视频或URL中的至少一个)。
根据实施例,第二电子设备102还可以包括输出振动、光、气味或声音中的至少一种的部件。
以上已经结合图4A、图4B和图4C的第二电子设备102描述了第二电子设备102的主要部件。然而,根据各种实施例,图4A、图4B和图4C中所示的部件不是必要的部件,并且第二电子设备102可以用比所示部件更多或更少的部件来实现。以上结合图4A、图4B和图4C描述的第二电子设备102的主要部件的位置可以根据各种实施例而变化。
根据实施例,用于光学字符识别的电子设备(例如,图1和图2的第一电子设备101或图1和图2的服务器108)包括存储器和与存储器电连接的处理器。处理器被配置为在存储器中存储包括字符串的至少一个内容以及与至少一个内容单独对应的至少一个词位表,获得由电子笔在打印文档上扫描的至少一个字符的图像,从至少一个内容中标识与图像相对应的内容,从至少一个词位表中标识与标识的内容相对应的词位表,并基于标识的词位表和标识的内容的原始数据,获得通过对图像进行光学字符识别而得到的信息。
根据实施例,处理器可以被配置为响应于上传至少一个内容,生成与至少一个内容单独对应的至少一个词位表。至少一个词位表中的每一个包括对应内容的标识信息、对应内容的原始数据中包括的词、以及每个词的位置信息。
根据实施例,处理器可以被配置为在从图像获得光学字符识别结果信息时,基于标识的词位表和原始数据对从图像读取的一个或多个词之中的至少一个词进行校正;并且获得结果信息,该结果信息包括原始数据的部分或与其中至少一个词已被校正的一个或多个词相对应的结果数据。原始数据的部分可以对应于包括结果数据的句子。电子笔扫描的至少一个字符的图像可以对应于打印文档的至少一部分,打印文档的该至少一部分由于形成在电子笔的第一组件中且填充了电子笔的第二组件中包含的墨水的笔尖与打印文档接触而被墨水着色。
根据实施例,处理器可以被配置为提供包括与包括字符串的内容单独对应的对象的屏幕,响应于从对象中选择至少一个对象,基于与所选择的至少一个对象有关的信息获得与所选择的至少一个对象相对应的至少一个内容,并获得与所获得的至少一个内容单独对应的至少一个词位表。处理器可以被配置为从外部设备获得至少一个内容和至少一个词位表。
根据实施例,处理器可以被配置为提供标识的内容的附加信息,并且响应于词搜索请求,提供从图像中读取的至少一个词的搜索信息。
根据实施例,用于光学字符识别的电子设备(例如,图1和图2的第一电子设备101或图1和图2的服务器108)还可以包括与处理器电连接并被配置为显示光学字符识别结果信息的显示器。根据实施例,处理器可以被配置为将结果信息存储在存储器中,将通过摘录(scrap)存储器中存储的结果信息的至少一部分或至少一个内容而获得的摘录信息配置为与至少一个其他用户共享,并且控制显示器显示至少一个其他用户输入的与摘录信息相关联的信息,或者显示至少一个其他用户共享的与存储器中存储的结果信息相关联的摘录信息。
根据实施例,处理器可以被配置为:在提供通过光学字符识别得到的信息之后,响应于在打印文档的与结果信息相对应的位置扫描至少一个词,提供扫描的至少一个词的搜索信息。
根据实施例,处理器可以被配置为在获得通过光学字符识别得到的信息时,在从图像中读取的至少一个字符中标识词,基于词位表获得原始数据中与标识的词相对应的词的位置信息,通过将标识的词与一个或多个原始数据中的置于位置信息中包括的位置中的数据进行比较,获得指示印刷错误数量的比较值,选择所获得的最小比较值的位置,并基于置于所选位置中的数据对词进行校正。
根据实施例,电子设备(例如,图1的第二电子设备102、图2的第二电子设备102、图4A和图4B的第二电子设备102、或图4C的第二电子设备102)可以包括:外壳的第一组件;笔尖,形成在第一组件的端部、外壳的第二组件,被配置为从第一组件的端部可拆卸;以及光学字符识别模块,安装在第一组件内部。第二组件可以包含墨水,并且可以被配置为当第二组件耦接到第一组件的端部以覆盖笔尖时用墨水充满笔尖。光学字符识别模块可以被配置为从打印文档的至少一部分扫描至少一个字符以进行光学字符识别。打印文档的至少一部分在与笔尖接触时可以被墨水着色。
根据实施例,电子设备还可以包括第三组件,第三组件被配置在第一组件的另一端部以在外部显示器的触摸面板上生成电磁场信号。第三组件可以包括向第一组件的另一端部突出的电介质尖端、以及与第一组件内部的电介质尖端电连接并被配置为生成电磁场信号的线圈单元。笔尖可以是可替换的,并且被配置为在不释放墨水的情况下扫描至少一个字符。
以下参考附图详细描述在上述服务器(例如,图1和图2的服务器108)或第一电子设备(例如,图1和图2的第一电子设备101)上的操作过程。
图6是示出了根据实施例的服务器的示例操作过程的视图。
根据实施例,结合图6描述的服务器(例如,图1和图2的服务器108)的操作过程可以同样由第一电子设备(例如,图1和图2的电子设备101)执行。
参照图6,在操作601中,根据实施例,服务器可以存储至少一个内容,将该至少一个内容映射到与该至少一个内容单独对应的至少一个词位表,并存储它们。根据实施例,当从第一电子设备(例如,图1和图2的电子设备101或其他外部电子设备(未示出))上传内容时,服务器108可以生成与上传的内容相对应的词位表,使用关于上传内容的标识信息将生成的词位表与上传的内容相映射,并存储映射后的内容和词位表。根据另一实施例,当第一电子设备执行操作601时,第一电子设备可以从服务器108获得至少一个内容以及与该至少一个内容单独对应的至少一个词位表,并且存储它们。
在操作603中,服务器可以获得第二电子设备(例如,图2、图4A、图4B或图4C的第二电子设备102)从打印文档(例如,图5的打印文档501)扫描的至少一个字符(例如,字符串)的图像。根据实施例,服务器可以读取扫描的至少一个字符的图像,并使用光学字符识别算法(程序或功能)来识别图像中的至少一个字符。根据另一实施例,服务器可以获得由第一电子设备或其他外部电子设备通过使用光学字符识别算法(应用、程序或功能)读取扫描的至少一个字符的图像而获得的结果数据。在第一电子设备或其他外部电子设备上执行的光学字符识别算法可以是轻量级算法,读取的结果数据可以是低识别率(含错误)数据。
在操作605,服务器可以标识与获得的图像相对应的内容(例如,第一内容)。标识的内容可以是与经由第一电子设备上显示的屏幕而选择的内容或打印文档相对应地请求上传的内容。根据实施例,服务器可以直接从第二电子设备或通过与第二电子设备通信的电子设备(例如,第一电子设备)获得与标识的内容相关的信息,并且可以基于获得的内容相关信息来标识与图像相对应的内容。
在操作607中,服务器可以获得标识的内容的原始数据和与标识的内容相对应的词位表。根据实施例,服务器可以导出存储器(例如,图2的存储器205)中存储的词位表和原始数据。根据另一实施例,当第一电子设备执行操作601时,第一电子设备可以导出从服务器108获得并存储在存储器(例如,图1和图2的存储器130)中的词位表和原始数据。
在操作609中,服务器可以基于获得的原始数据和词位表获得通过对图像进行光学字符识别而识别的结果信息。通过光学字符识别而识别的结果信息可以包括结果数据,在该结果数据中,从图像中读取的至少一个字符(或字符串)中包括的至少一个词被校正。结果数据可以是与使用光学字符识别算法(程序或功能)初步识别的至少一个字符(或结果数据)相比具有提高的识别率的最终结果数据。
根据实施例,在操作609中,服务器可以逐词分离从图像中读取的至少一个字符(或字符串),标识词,并基于获得的词位表,获得关于原始数据的与标识的词相对应的词的位置的信息。服务器可以通过将标识的词与一个或多个原始数据中的置于位置信息中包括的位置中的数据进行比较来选择印刷错误最少的位置,并且基于置于所选位置的数据来校正词。服务器可以获得包括校正的词的最终结果数据作为光学字符识别结果信息。根据实施例,当从图像中读取的字符是词的字符串时,服务器可以顺序地将标识的词中的每一个与原始数据中包括的相同或相似的词进行比较。在与原始数据比较时,服务器可以基于获得的词位表中包括的位置信息,标识每个词中印刷错误最少的位置。当按每个词标识的印刷错误最少的位置在顺序上是连续的时,服务器可以基于置于这些位置中的数据(原始数据的一部分)对一些词进行校正。
由于以上结合图6描述的服务器的操作过程可以同样由第一电子设备(例如图1和图2的电子设备101)执行,在此不再详细描述第一电子设备的操作过程。
图7是示出了根据实施例的服务器的示例操作过程的视图。
以上结合图7描述的词位表可以在图6的操作601中由服务器生成。
参照图7,根据实施例,服务器(例如,图2的服务器108)可以分析至少一个内容(以下以第一内容710为例)的原始数据,并标识经分析的第一内容710的原始数据中包括的词的至少一个位置。这里,可以基于通过从原始数据的起始点(起始位置0)对词顺序计数而标识的数量来指定至少一个位置。根据实施例,服务器可以从起始位置0顺序地为原始数据中的所有词指定位置。根据另一实施例,除了例如文章、韩语命题和/或符号以外,服务器可以从在原始数据中分析的词中选择特定词,并指定所选词的位置。
根据实施例,由于词的位置是从起始点(起始位置0)顺序指定的,因此服务器可以将词与原始数据区分开来,并基于按每个词标识的至少一个位置生成与第一内容710相对应的词位表720。服务器可以将包括按每个词标识的位置在内的位置信息(例如,721、723、725、727,…)与词(例如,global、agitation、system、in、…)以及第一内容标识信息(例如,文档ID)相映射,在词之间进行区分,并构造词位表720。词位表720可以包括标识信息(文档ID)、词信息和位置信息。标识信息可以配置为整数形式,词信息可以是字符串形式,位置信息可以是列表形式。
图8是示出了根据实施例的第二电子设备的字符扫描示例的视图。图9A至图9G是示出了根据实施例的服务器的示例操作过程的视图。
参照图8,根据实施例,第二电子设备102(例如,图2、图4A、图4B或图4C的第二电子设备102)可以扫描打印文档801上的至少一个字符(例如,字符串)。例如,第二电子设备102可以从打印文档801中扫描特定字符串803,并将特定字符串803的图像数据发送到第一电子设备(例如,图1和图2的第一电子设备101)。第一电子设备(或服务器(例如,图1和图2的服务器108))可以基于接收到的图像数据获得要读取的图像805。当打印文档801的特定字符串803例如是“agitation system end”时,通过第二电子设备102的字符串扫描获得的要读取的图像805可能被错误标识为“agitation system end”。
参照图9A和图9B,服务器(例如,图1和图2的服务器108)(或第一电子设备(例如,图1和图2的第一电子设备101))可以标识与图8所示的打印文档801相对应的内容(在下文中,以第一内容为例进行描述),并且基于关于第一内容的位置信息921,获得标识的第一内容的原始数据910以及与第一内容相对应的第一词位表920。服务器可以读取图8所示的图像805,并且将图像805中包括的字符(例如字符串)(agitation system end)逐字拆分。服务器可以标识字符段(例如,agitation、system、end)并且可以获得与在第一词位表920中标识的字符段单独对应的词。例如,服务器可以获得与标识的字符段最接近的词。服务器可以获得映射到从第一词位表920中获得的每个词的位置信息。服务器可以基于获得的位置信息将字符段(例如,agitation、system、end)与原始数据910顺序进行比较,并获得原始数据910中与该字符段最相似的数据(“agitation system and”)。服务器可以基于获得的数据对从图像805中读取的部分字符(字符段)进行校正。服务器可以获得与校正的字符相对应的结果数据(或最终结果数据)作为光学字符识别所识别的结果信息。在将字符段与原始数据进行比较时,服务器可以从原始数据910中第一句的起始点(0)901到最后一句的结束点(未示出)逐句地顺序比较字符段。当在多个句子中标识出与字符段最相似的词时,服务器可以选择从多个标识的句子中最前面的句子中标识的最相似的短语。例如,服务器可以选择包括了在多个句子中标识的最相似词之中的位置信息的值最小的词在内的短语,作为从图像805中读取的字符要被校正的短语。
参照图9A,服务器可以从第一词位表920中获得字符段(例如,agitation、system、end)之中与第一字符段(agitation)相似的第一词(agitation)、与第二字符段(system)相似的第二词(system)、以及与第三字符段(end)相似的第三词(and)和第四词(end)。服务器可以标识单独映射到获得的第一词(agitation)、第二词(system)、第三词(and)和第四词(end)的多个位置信息921、923、925和927。例如,服务器可以使用映射到原始数据910的第一句(例如,第一句)中的第一词(agitation)的位置信息921,标识与第一词(agitation)相对应的每个位置(例如,2、39和82)。服务器可以使用映射到原始数据910的第一句(例如,第一句)中的第二词(system)的位置信息923,标识与第二词(system)相对应的每个位置(例如,3、40和83)。服务器可以使用映射到原始数据910的第一句(例如,第一句)中的第三词(and)的位置信息925,标识与第三词(and)相对应的每个位置(例如,13、32、57和84)。服务器可以使用映射到原始数据910的第一句(例如,第一句)中的第四词(end)的位置信息927,标识与第四词(end)相对应的位置(例如,71)。
参照9B和图9C,由于三个词对应于读取图像805中包括的字符(例如,agitationsystem end)的字符段,因此服务器可以在原始数据中搜索包括这三个词的短语以比较字符段。例如,服务器可以在与第一词(agitation)相对应地标识出的每个位置(例如,2、39和82位置)中标识在第一词(agitation)之后的两个词。服务器可以将标识的短语(例如,903、905和907)与图像805中包括的字符(例如,agitation system end)进行比较,标识由于印刷错误而被错误识别的字符的数量。例如,服务器可以将在第一词(agitation)的第一位置(2位置)中标识的短语903(例如,“agitation system in”)与图像805中包括的字符(例如,agitation system end)进行比较,获得对由于印刷错误而错误识别的字符数量加以指示的比较值(例如,编辑距离)。作为比较的结果,服务器可以获得3作为短语903(例如,“agitation system in”)的比较值。例如,服务器可以将在第一词(agitation)的第二位置(39位置)中标识的短语905(例如,“agitation system market”)与图像805中包括的字符(例如,agitation system end)进行比较,获得比较值。作为比较的结果,服务器可以获得6作为短语905(例如,“agitation system market”)的比较值。例如,服务器可以将在第一词(agitation)的第三位置(82位置)中标识的短语907(例如,“agitation system and”)与图像805中包括的字符(例如agitation system end)进行比较,获得比较值。作为比较的结果,服务器可以获得1作为短语907(例如,“agitation system and”)的比较值。
参照图9B和图9D,服务器可以将第一字符段(agitation)与原始数据进行比较,然后将原始数据与字符段(例如,agitation、system、end)中的第二字符段(system)进行比较。例如,服务器可以标识短语(例如,903、905和907),该短语包括对应于与第二字符段(system)相似的第二词(system)所标识出的每个位置(例如,3、40、和83位置)中在第二词(system)之前的一个词以及在第二词(system)之后的一个词。服务器可以将标识的短语(例如,903、905和907)与图像805中包括的字符进行比较,从而标识由于印刷错误而被错误识别的字符的数量。例如,服务器可以将在第二词(system)的每个位置(3、40和83位置)中标识的短语(例如,903、905和907)与图像805中包括的字符(例如,agitation system end)进行比较,获得如图9D所示的比较值。例如,服务器可以将在第二词(system)的第一位置(3位置)中标识的短语903(例如,“agitation system in”)与图像805中包括的字符(例如,agitation system end)进行比较,获得比较值。作为比较的结果,服务器可以获得3作为短语903(例如,“agitation system in”)的比较值。例如,服务器可以将在第二词(system)的第二位置(40位置)中标识的短语905(例如,“agitation system market”)与图像805中包括的字符(例如,agitation system end)进行比较,获得比较值。作为比较的结果,服务器可以获得6作为短语905(例如,“agitation system market”)的比较值(例如,编辑距离)。例如,服务器可以将在第二词(system)的第三位置(83位置)中标识的短语907(例如,“agitation system and”)与图像805中包括的字符(例如,agitation system end)进行比较,获得比较值。作为比较的结果,服务器可以获得1作为短语907(例如,“agitationsystem and”)的比较值(例如,编辑距离)。
参照图9E和图9F,服务器可以将第二字符段(system)与原始数据进行比较,然后将原始数据与字符段(例如,agitation、system、end)中的第三字符段(end)进行比较。例如,服务器可以标识短语(例如,909),该短语包括对应于与第三字符段(end)相似的第四词(end)所标识出的每个位置(例如,3、40和83位置)中的第四词(end)之前的两个词。服务器可以通过将标识的短语909与图像805中包括的字符进行比较来标识印刷错误的数量。例如,服务器可以将在第四词(end)的位置(71位置)中标识的短语909与图像805中包括的字符(“agitation system end”)进行比较,并获得比较值。作为比较的结果,服务器可以获得15作为短语909(例如,“turned many end”)的比较值(例如,编辑距离),如图9F所示。
参照图9G,如以上结合图9A至图9F所描述的,服务器可以通过将字符段(例如,agitation、system、end)与直到原始数据的最后一句进行比较来获得比较结果(短语),选择具有比较结果中最小比较值(例如,1)的短语907(例如,“agitation system end″),用所选短语907对从图像805读取的字符进行校正,并且获得校正的字符作为最终结果数据。例如,服务器可以将通过对图像805进行光学字符识别得到的数据替换为所选短语907的数据,获得最终的结果数据。当多个句子包括具有最小比较值的短语时,服务器可以从多个句子中选择其第一词(例如,agitation)位于最前面(例如,具有最小值的位置)的句子。当所选择句子包括具有最小比较值的多个短语时,服务器可以在多个短语中选择包括所选句子中位于最前面(例如,具有最小值的位置)的第一词(例如,agitation)在内的短语。服务器可以将获得的最终结果数据作为结果信息发送或显示给另一设备(例如,第一电子设备)。根据实施例,服务器可以将包括与最终结果数据相对应的短语在内的整个句子作为结果信息,显示或发送给其他设备(例如,第一电子设备)。由于以上结合图9A至图9G描述的操作过程可以同样由第一电子设备(例如图1和图2的电子设备101)执行,因此不再详细描述第一电子设备的操作过程。
图10是示出了根据实施例的用于第一电子设备、第二电子设备和服务器之间的光学字符识别的示例操作过程的视图。图11是示出了根据实施例的第一电子设备上显示的示例屏幕的视图。图12A和图12B是示出了根据实施例的第一电子设备上显示的示例屏幕的视图。
参照图10,根据实施例,在操作1001中,作为执行光学字符识别之前的预处理操作,服务器108(例如,图1和图2的服务器108)可以存储由第一电子设备101(图1和图2的电子设备101)或其他外部电子设备将书本、纸件或其他文档转换成数字数据并上传数字数据而得到的内容。在存储了所述内容中的至少一个内容之后,服务器108可以生成与至少一个内容单独对应的至少一个词位表,将生成的至少一个词位表与至少一个内容映射,并将它们存储在存储器中(例如,图2的存储器205),如以上结合图7所描述的。
在操作1003中,服务器108可以将与存储器(例如,图2的存储器205)中存储的内容中的至少一个内容相关的信息发送到第一电子设备101。
在操作1005中,第一电子设备101可以在被配置为搜索或选择内容的屏幕(下文中,以第一屏幕为例进行描述)上显示接收到的与至少一个内容相关的信息。如图11所示,第一电子设备101可以在显示器160上显示第一屏幕1101。第一屏幕1101可以被划分为第一区域1110和第二区域1120。第一区域可以包括用于搜索内容的第一部分(例如,搜索框)1111和显示用于选择内容的对象的第二部分1113。第二区域1120可以是用于显示与用户发现或选择的内容相关的信息的区域。第一电子设备101可以在第一屏幕1101的第二部分1113上显示至少一个对象,该对象可以用作基于从服务器108接收的与至少一个内容相关的信息而配置的用户界面。
上述操作1001至1005可以是在执行光学字符识别之前的预处理操作,然后可以执行用于光学字符识别的操作。
在操作1007中,第二电子设备102可以扫描打印文档上的至少一个字符。在操作1009,第二电子设备102可以将扫描的至少一个字符的图像数据发送到第一电子设备101。根据实施例,第二电子设备102可以将扫描的至少一个字符的图像数据或读取图像直接发送到服务器108。
在操作1011中,第一电子设备101可以接收第二电子设备102扫描的至少一个字符的图像数据,并且可以基于接收到的图像数据获得要读取的图像。根据实施例,第一电子设备101可以从第二电子设备102接收在每个预定时间间隔(或由线传感器逐行)扫描的图像数据,直到扫描终止为止。在接收到至少一个字符从扫描开始点到扫描结束点的所有图像数据时,第一电子设备101可以基于接收到的图像数据,生成扫描的至少一个字符的图像(例如,图8的图像805),并且可以直接读取生成的图像,或将生成的图像发送到服务器108以允许服务器108读取该图像。扫描的至少一个字符可以是单个词,也可以是多词的字符串。根据实施例,第一电子设备101可以从第二电子设备102接收指示操作模式是用于光学字符识别的模式的信号,并且标识第二电子设备102的操作模式。
在操作1013中,当选择了用于选择第一屏幕1101上显示的至少一个内容的对象之一时,第一电子没备101可以标识由所选对象指示的第一内容。在操作1015中,第一电子设备101可以将与标识的第一内容相关的信息(例如,标识信息)和图像发送到服务器108。根据另一个实施例,可以在对打印的文档执行字符扫描之前,在操作1005之后执行操作1013。
在操作1017中,服务器108可以读取从第一电子设备101接收的图像并获得结果数据。结果数据可以包括由于按照原样读取最初扫描的至少一个字符而导致的印刷错误。根据另一实施例,服务器108可以从第一电子设备或其他外部电子设备获得通过使用光学字符识别算法(程序或功能)读取扫描的至少一个字符的图像而产生的数据。在这种情况下,服务器108可以省略操作1017。在第一电子设备或其他外部电子设备上执行的光学字符识别算法可以是轻量级算法,并且读取的结果数据可以是低识别率(包含错误)数据。
在操作1019中,服务器108可以基于接收到的第一内容相关信息标识第一内容,并获得标识的第一内容的原始数据和与第一内容相对应的第一词位表。
在操作1021中,服务器108可以基于获得的原始数据和词位表从图像中获得通过光学字符识别得到的信息。可以如在以上结合图9A至图9G描述的操作过程中获得通过光学字符识别得到的信息,而不再对其进行详细的描述。光学字符识别结果信息可以包括其中从图像读取的至少一个字符(或字符串)中包括的至少一个词被校正的结果数据。与使用光学字符识别算法(程序或功能)的初步识别结果数据相比,校正的结果数据可以是具有提高的识别率的最终结果数据。如在操作1019和操作1021中,服务器108可以执行光学字符识别以校正结果数据,从而提高结果数据的识别率。
在操作1023中,服务器108可以将获得的光学字符识别结果信息发送到第一电子设备101。
在操作1025中,第一电子设备101可以显示接收到的光学字符识别结果信息。第一电子设备101可以在显示器1601上显示第二屏幕1201,如图12A和图12B所示。第二屏幕1201可以被配置为显示通过光学字符识别在从第一屏幕1101选择或发现的第一内容上得到的结果信息1221或1223以及第一内容相关附加信息(例如,标题1213、作者/出版商信息1215、副标题、页面、结果信息相关的映射图像、文档源信息(统一资源定位符(URL)或文件路径)、用于编辑结果信息或与相关文文档有关的信息的对象)。此外,第二屏幕1201可以被配置为包括与第一内容相关的其他信息并且可以被配置为各种形式。例如,如图12A所示,第一电子设备101可以在第二屏幕1201的第一区域1211上显示通过校正从扫描图像中读取的至少一个字符而得到的数据(例如,图9G的“agitation system and”)作为光学字符识别结果信息。作为另一示例,如图12B所示,第一电子设备101可以在第二屏幕1201的第一区域1211上显示包括通过校正从图像中读取的至少一个字符而得到的数据(例如,图9G的“agitationsystem and”)在内的句子1223作为光学字符识别结果信息。作为另一示例,当用户选择如图12A所示的第二屏幕1201的第一区域1211上显示的结果数据(例如,图9G的“agitationsystem and”)时,第一电子设备101可以获得包括结果数据(例如,图9G的“agitationsystem and”)的句子1223,并如图12B所示在第一区域1211上显示获得的句子1223。
根据实施例,第一电子设备101可以以各种方式编辑如图12A和图12B所示的结果信息1221或1223,并将编辑结果与结果信息分开存储。
根据实施例,第一电子设备101可以在存储器(例如,图1的存储器130)中单独地存储如图12A和图12B所示的结果信息1221或1223、结果信息1221或1223的至少一部分、或编辑结果,作为用于与至少一个其他用户共享的摘录信息。
根据实施例,第一电子设备101可以标识在第二电子设备102扫描打印文档上的字符串时高亮显示的颜色,并以标识的颜色显示结果数据。第一电子设备101可以有区别地编辑每个标识的颜色的词或字符串。例如,在从第二电子设备102接收到扫描图像数据时,第一电子设备101可以从第二电子设备102接收与填充墨水的颜色相关的信息,并且标识在扫描图像数据上高亮显示的颜色。作为另一示例,第一电子没备101可以使用相机或颜色传感器来标识打印文档上高亮显示的颜色。根据实施例,第一电子设备101可以将接收到的结果信息与通过先前扫描所得到的在先结果信息一起显示,并且可以编辑多个结果信息。
图13是示出了根据实施例的用于第一电子设备、第二电子设备和服务器之间的光学字符识别的示例操作过程的视图。
参照图13,根据实施例,在操作1301中,服务器108(例如,图1和图2的服务器108)可以从第一电子设备101(图1和图2的电子设备101)或其他外部电子设备接收上传特定内容的请求(以下,以第一内容为例进行描述),作为执行光学字符识别之前的预处理操作。在操作1303中,服务器108可以上传请求上传的第一内容,并存储上传的第一内容的原始数据和第一内容相关信息(例如,标识信息、文件路径信息和/或附加信息)。在操作1305中,服务器108可以生成与上传的第一内容相对应的第一词位表,如以上结合图7所描述的。在操作1307中,服务器108可以将生成的第一词位表与第一内容相映射并将它们存储在存储器(例如,图2的存储器205)中。
在操作1309中,第二电子设备102可以扫描打印文档上与第一内容相对应的至少一个字符。在操作1311中,第二电子设备102可以将扫描的至少一个字符的图像数据发送到第一电子设备101。根据实施例,第二电子设备102可以将扫描的至少一个字符的图像数据或读取的图像直接发送到服务器108。
在操作1313中,第一电子设备101可以接收第二电子设备102扫描的至少一个字符的图像数据,并且可以基于接收到的图像数据获得要读取的图像。在操作1315中,第一电子设备101可以将图像发送到服务器108。根据实施例,第一电子设备101可以从第二电子设备102接收在每个预定时间间隔(或由线传感器逐行)扫描的图像数据,直到扫描终止为止。在接收到至少一个字符从扫描开始点到扫描结束点的所有图像数据时,第一电子设备101可以基于接收到的图像数据生成扫描的至少一个字符的图像(例如,图8的图像805),并且可以直接读取生成的图像或将生成的图像发送到服务器108以允许服务器108读取该图像。扫描的至少一个字符可以是单个词,也可以是多词的字符串。根据实施例,第一电子设备101可以从第二电子设备102接收指示操作模式是用于光学字符识别的模式的信号,并且标识第二电子设备102的操作模式。
在操作1317中,服务器108可以读取从第一电子设备101接收的图像并获得结果数据。结果数据可以包括由于按照原样读取最初扫描的至少一个字符而导致的印刷错误。根据另一实施例,服务器108可以从第一电子设备101或其他外部电子设备获得通过使用光学字符识别算法(程序或功能)读取扫描的至少一个字符的图像而得到的结果数据。在这种情况下,服务器108可以省略操作1317。在第一电子设备101或其他外部电子设备上执行的光学字符识别算法可以是轻量级算法,并且读取的结果数据可以是低识别率(包含错误)的数据。
在操作1319中,服务器108可以基于接收到的第一内容相关信息标识第一内容,并且获得标识的第一内容的原始数据和与第一内容相对应的第一词位表。
在操作1321中,服务器108可以基于获得的原始数据和词位表获得通过对图像进行光学字符识别而得到的信息。可以如以上结合图9A至图9G描述的操作过程来获得通过光学字符识别而得到的信息,而不再进行详细的描述。光学字符识别结果信息可以包括其中从图像读取的至少一个字符(或字符串)中包括的至少一个词被校正的结果数据。与使用光学字符识别算法(程序或功能)的初步识别结果数据相比,上述结果数据可以是具有提高的识别率的最终结果数据。如在操作1319和1321中,服务器108可以执行光学字符识别以校正结果数据,从而提高结果数据的识别率。
在操作1323中,服务器108可以将获得的光学字符识别结果信息发送到第一电子设备101。
在操作1325中,第一电子设备101可以显示接收到的光学字符识别结果信息。第一电子设备101可以在显示器1601上显示第二屏幕1201,如图12A和图12B所示。第二屏幕1201可以被配置为显示接收到的第一内容的结果信息1221或1223以及第一内容相关附加信息。这里,第一内容相关附加信息可以包括以下至少一项:标题1213、作者/出版者信息1235、副标题、页面、对包括光学字符识别结果的部分加以指示的信息(例如,包括光学字符识别结果信息的副标题或章节)、与结果信息相关的映射图像、与结果信息相关的图像(或与结果信息相关的图像的特定部分)、与结果信息相关的描述文档、与结果信息相关的音频(或与结果信息相关的音频的特定部分)、其他用户的类似结果信息、内容的文档源信息(url或文件路径)、用于编辑结果信息或相关文档的信息的对象。根据实施例,第一电子设备101可以将接收到的结果信息与通过在先扫描而得到的在先结果信息一起显示,并且可以编辑多个结果信息。
图14是示出了根据实施例的用于第一电子设备、第二电子设备和服务器之间的光学字符识别的示例操作过程的视图。
参照图14,根据实施例,服务器108(例如,图1和图2的服务器108)可以存储由第一电子设备101(图1和图2的电子设备101)或其他外部电子设备将书本、纸件或其他文档转换成数字数据而得到的内容)并上传数字数据,作为执行光学字符识别之前的预处理操作。在存储所述内容中的至少一个内容时,服务器108可以生成与至少一个内容单独对应的至少一个词位表,将生成的至少一个词位表与至少一个内容相映射,并将它们预先存储在存储器(例如,图2的存储器205)中,如以上结合图7所描述的。
在操作1401中,服务器108可以从第一电子设备接收用于请求至少一个内容的消息。在操作1403中,服务器108可以从存储器(例如,图2的存储器205)中获得所请求的至少一个内容的原始数据以及与至少一个内容中的每一个相对应的词位表。在操作1405中,服务器108可以将获得的至少一个原始数据和至少一个词位表发送到第一电子设备101。
在操作1407中,第一电子设备101可以将接收到的至少一个原始数据和至少一个词位表存储在存储器(例如,图1和2的存储器130)中。
在操作1409中,第二电子设备102可以扫描打印文档上的至少一个字符。在操作1411中,第二电子设备102可以将扫描的至少一个字符的图像数据发送到第一电子设备101。根据实施例,第二电子设备102可以将扫描的至少一个字符的图像数据或读取的图像直接发送到服务器108。
在操作1413中,第一电子设备101可以接收第二电子设备102扫描的至少一个字符的图像数据,并且可以基于接收到的图像数据获得要读取的图像。根据实施例,第一电子设备101可以从第二电子设备102接收在每个预定时间间隔(或由线传感器逐行)扫描的图像数据,直到扫描终止为止。在接收到至少一个字符从扫描开始点到扫描结束点的所有图像数据时,第一电子设备101可以基于接收到的图像数据生成扫描的至少一个字符的图像(例如,图8的图像805),并且可以直接读取生成的图像。扫描到的至少一个字符可以是单个词,也可以是多词的字符串。根据实施例,第一电子设备101可以从第二电子设备接收指示操作模式是用于光学字符识别的模式的信号,并且标识第二电子设备的操作模式。在操作1413中,第一电子设备101可以读取图像并获得结果数据。结果数据可以包括由于按照原样读取最初扫描的至少一个字符而导致的印刷错误。根据另一实施例,服务器108可以从第一电子设备或其他外部电子设备获得通过使用光学字符识别算法(程序或功能)读取扫描的至少一个字符的图像而得到的数据。在这种情况下,服务器108可以省略操作1403和1405。在第一电子设备或其他外部电子设备上执行的光学字符识别算法可以是轻量级算法,并且读取的结果数据可以是低识别率(包含错误)数据。
在操作1415中,第一电子设备101可以标识与图像相对应的第一内容。例如,第一电子设备101可以标识出从如图11所示的第一屏幕1101中选择的至少一个内容或请求搜索的内容是第一内容。作为另一示例,第一电子设备101可以执行用于光学字符识别的应用(程序或功能),然后标识出经由该应用请求上传的内容是第一内容。
在操作1417中,第一电子设备101可以从存储器(例如,图1和2的存储器130)获得第一内容的原始数据和与第一内容相对应的第一词位表。
在操作1419中,第一电子设备101可以基于获得的原始数据和词位表,获得通过对图像进行光学字符识别而得到的信息。可以如以上结合图9A至图9G描述的操作过程来获得通过光学字符识别得到的信息,而不再进行详细的描述。光学字符识别结果信息可以包括其中从图像中读取的至少一个字符(或字符串)中包括的至少一个词被校正的结果数据。与使用光学字符识别算法(程序或功能)的初步识别结果数据相比,校正的结果数据可以是具有提高的识别率的最终结果数据。如在操作1019和1021中,服务器108可以执行光学字符识别以校正结果数据,从而提高结果数据的识别率。
在操作1421中,第一电子设备101可以显示获得的光学字符识别结果信息。第一电子设备101可以在如图12A和图12B所示的显示器1601上显示第二屏幕1201。第二屏幕1201可以被配置为显示接收到的从第一屏幕1101选择或发现的第一内容的结果信息1221或1223以及第一内容相关附加信息。这里,第一内容相关附加信息可以包括以下至少一项:标题1213、作者/出版者信息1235、副标题、页面、对包括光学字符识别结果的部分加以指示的信息(例如,包括光学字符识别结果信息的副标题或章节)、与结果信息相关的映射图像、与结果信息相关的图像(或与结果信息相关的图像的特定部分)、与结果信息相关的描述文档、与结果信息相关的音频(或与结果信息相关的音频的特定部分)、其他用户的类似结果信息、内容的文档源信息(url或文件路径)、用于编辑结果信息或相关文档的信息的对象。根据实施例,第一电子设备101可以将接收到的结果信息与通过在先扫描得到的在先结果信息一起显示,并且可以编辑多个结果信息。
图15A、图15B和图15C是示出了根据实施例的第一电子设备上显示的示例屏幕的视图。
参照图15A、图15B和图15C,根据实施例,第一电子设备(例如,图1和图2的第一电子设备101)可以在第二电子设备102进行词搜索模式(例如,第二模式)下获得第二电子设备102从打印文档1501扫描的字符1503的图像,读取获得的图像,并执行词搜索,以获得关于与扫描的字符1503相对应的词的详细信息。第一电子设备可以从第二电子设备102接收根据操作模式切换的信号,并标识第二电子设备102的操作模式。第一电子设备可以通过字典应用程序或搜索应用程序搜索与读取的字符相对应的词。第一电子设备可以在执行词搜索时获得搜索信息,并将获得的搜索信息显示在搜索结果屏幕1520上。根据实施例,第一电子设备可以将图像或从图像读取的数据发送到服务器,并且从服务器接收搜索信息。根据另一实施例,第一电子设备可以从存储器(例如,图1和图2的存储器130)中存储的字典数据库中获得关于与扫描的字符1503相对应的词的搜索信息。
根据实施例,当在提供光学字符识别结果信息之后,第二电子设备102在与结果信息相对应的打印文档1501的位置重新扫描字符时,第一电子设备可以标识与扫描的字符相对应的至少一个词,并且可以将针对包括标识的至少一个词在内的词搜索请求的消息发送到服务器108,或者从存储器(例如图1和图2的存储器130)或外部设备的字典数据库中直接搜索标识的至少一个词。在获得搜索信息时,第一电子设备可以在搜索结果屏幕1520上显示获得的搜索信息。例如,第一电子设备可以将显示光学字符识别结果信息的第二屏幕1510与显示获得的搜索信息的搜索结果屏幕1520一起显示。
根据实施例,在选择显示屏幕(例如,第二屏幕1510)上显示的特定对象(词列表的对象)时,第一电子设备可以在第二屏幕1510或其他单独的屏幕1530上显示先前搜索的词的历史信息1531。
图16A和图16B是示出了根据实施例的第一电子设备上显示的示例屏幕的视图。
根据实施例,第一电子设备(例如,图1和图2的第一电子设备101)可以与至少一个其他用户共享通过摘录如以上结合图10、图13和图14所述获得的结果信息而获得的摘录信息,和/或通过摘录经由应用提供的至少一个内容而获得的摘录信息。这里,通过摘录结果信息而获得的摘录信息是以下信息:存储在存储器(例如,图1和图2的存储器130)中、并且从经由对从打印文档扫描的字符串进行光学字符识别而获得的多个结果信息之中单独收集的必要信息,其中所述字符串对应于由第二电子设备(例如,图2、图4A、图4B或图4C的第二电子没备102)经由所述应用提供的内容。
参照图16A,根据实施例,当用户发现或选择的内容(例如,对′书本A′的研究)1601是从如以上结合图11所述的第一屏幕1101选择的时,第一电子设备(例如,图1和图2的第一电子设备101)可以在显示器160上显示第三屏幕1610,该第三屏幕1610用于与至少一个其他用户共享与所选内容1601有关的信息。根据实施例,第一电子设备可以对与在打印文档上扫描的所选内容1601相对应的至少一个字符的图像执行光学字符识别,从而获得结果信息1603。第一电子设备可以在第三屏幕1610上显示获得的结果信息1603和包括结果信息1603的内容1601的至少一部分。第一电子设备可以在第三屏幕1610上显示用于添加文本、链接、图片或视频中的至少一个的按钮1613。根据实施例,响应于对第三屏幕1610上显示的按钮1611的选择,第一电子设备可以在显示器160上显示用于选择访问内容1601的其他用户(例如,用户A、用户B、用户C和用户D)中的至少一个的第四屏幕1620。第一电子设备可以在第四屏幕1620上显示单独指示访问内容1601的其他用户(例如,用户A、用户B、用户C和用户D)的对象1621、和指示与每个其他用户(例如,用户A、用户B、用户C和用户D)相对应的“一起阅读”的对象1623。例如,第一电子设备可以标识出用户选择了与其他用户(例如,用户A、用户B、用户C和用户D)之中的第一用户(用户A)和第二用户(用户B)单独对应的对象1623。
参照图16B,根据实施例,第一电子设备(例如,图1和图2的第一电子设备101)可以响应于用户在第四屏幕1620上选择了与其他用户(例如,用户A、用户B、用户C和用户D)之中的第一用户(用户A)和第二用户(用户B)单独对应的对象1623,与第一用户(用户A)和第二用户(用户B)共享第四屏幕1620上显示的获得的结果信息1603和/或从所选内容1601的至少一部分摘录的摘录信息。响应于标识出选择了与第一用户(用户A)和第二用户(用户B)单独对应的对象1623,第一电子设备可以在显示器160上显示第五屏幕1630,该第五屏幕1630显示第一用户(用户A)和第二用户(用户B)中的每一个的与内容1601有关的摘录信息。
参照图16B,第一电子设备可以标识输入信息,该输入信息对应于以回复形式输入到由用户、第一用户(用户A)或第二用户(用户B)中的至少一个共享的摘录信息(例如,摘录信息1631或1633)的意见。第一电子设备可以在第五屏幕1630上显示标识的输入信息,该标识的输入信息与由第一用户(用户A)或第二用户(用户B)中的至少一个共享的摘录信息相关。根据实施例,第一电子设备可以在至少一个社交媒体账户上与其他用户共享由第一用户(用户A)或第二用户(用户B)中的至少一个共享的摘录信息(例如,摘录信息1631或1633)。
图17A和图17B是示出了根据实施例的第一电子设备上显示的示例屏幕的视图。
参照图17A,根据实施例,第一电子设备(例如,图1和图2的第一电子设备101)可以在显示器上显示第六屏幕1710,该第六屏幕1710用于搜索由至少一个其他用户(例如,用户A、用户C、用户D或用户E中的至少一个)共享的与经由应用提供的至少一个内容相关的摘录信息1713和1715。根据实施例,第一电子设备可以在第六屏幕1710上显示用于搜索由其他用户共享的摘录信息的搜索框1701,并且可以在第六屏幕1710上显示基于经由搜索框1701键入的输入信息(例如,主题标签或用户名)发现的摘录信息1713和1715。例如,摘录信息可以是用于标识每个其他用户的实时知识学习状态(例如,见解(insight)状态)的信息。
参照图17A,根据实施例,当用户在如以上结合图11所描述的第一屏幕1101上搜索或选择内容时,第一电子设备可以在第六屏幕1710上显示由其他用户共享的与所选内容(例如,书本A)有关的摘录信息。第一电子设备可以在第六屏幕1710上显示与为每个其他用户(例如,用户A、用户C、用户D和用户E中的至少一个)单独选择的内容相关的摘录信息1713。
参照图17B,例如,当在第六屏幕1710上选择第一用户(用户A)时,第一电子设备可以在第七屏幕1720上显示由所选第一用户(用户A)共享的摘录信息的至少一部分(例如,文本11721和文本21723)。第一电子设备可以在第七屏幕1720上显示用于添加文本、链接、图片或视频中的至少一个的按钮1725。
图18是示出了根据实施例的第一电子设备上显示的示例屏幕的视图。
参照图18,根据实施例,第一电子设备(例如,图1和图2的第一电子设备101)可以将附加信息(例如,备忘录(MEMO)、图片、图像、视频或URL中的至少一个)添加到如以上结合图10、图13和图14所描述的通过读取扫描的至少一个字符的图像而获得的结果信息1811。例如,第一电子设备可以接收与由第二电子设备102的第三组件(例如,图4C的第三组件430)在显示器160的触摸面板上创建或选择的附加信息(例如,备忘录1813)相对应的输入信息,并在第二屏幕1201上与结果信息1811相关地显示接收到的输入信息。
根据实施例,第一电子设备可以将第二电子设备从打印文档扫描的字符1503添加到第三组件(例如,图4C的第三组件430),如以上结合图15A、图15B和图15C所述。根据另一实施例,可以使用除了第二电子设备之外的输入接口来输入附加信息。
根据实施例,第一电子设备可以将由另一用户输入的附加信息(例如,备忘录、图片、图像、视频或URL中的至少一个)添加到通过读取第二电子设备从打印文档扫描的字符1503(如以上结合图15A、图15B和图15C所描述的)或扫描的至少一个字符(如以上结合图10、图13和图14所描述的)的图像而获得的结果信息1811。
根据实施例,第一电子设备可以提供通过使用自动导出(例如,Word、PDF或PPT)或阅读(例如,音频书本)功能中的至少一个读取打印文档上扫描的至少一个字符而获得的结果信息。例如,第一电子设备可以在如图18所示的第一屏幕1201上显示指示自动导出或阅读功能的对象。
根据实施例,第一电子设备(例如,图1和图2的第一电子设备101)可以按源或页面来存储属于一组(例如,阅读或学校)的用户在课堂、研究或辩论中使用的内容的引用,并将由第二电子设备从打印文档扫描的词存储在例如词列表中。第一电子设备可以与其他用户共享内容的引用或词列表中存储的词,并可以搜索由其他用户共享的内容的引用或词列表中存储的词。
根据实施例,第一电子设备(例如,图1和图2的第一电子设备101)可以收集和存储属于该组(例如,阅读会议或学校)的用户从打印文档摘录的所有信息,并将摘录的信息反映到与打印文档相对应的内容并加以显示。例如,第一电子设备可以将按组的用户所区分的摘录信息反映到与打印文档相对应的内容并加以显示。
根据实施例,当用户从如以上结合图11所描述的第一屏幕1101选择内容时,第一电子设备(例如,图1和图2的第一电子设备101)可以提供与所选内容相关的附加信息(例如,从其他文档或其他应用提供的内容)。
根据实施例,第一电子设备(例如,图1和图2的第一电子设备101)可以与和远程课程(例如,互联网辅导)相关的应用互操作地在例如互联网上向另一用户发送通过读取扫描的至少一个字符的图像而获得的结果信息(如以上结合图10、图13和图14所描述的)或由第二电子设备从打印文档扫描的至少一个字符(如以上结合图15A、图15B和图15C所描述的)。第一电子设备可以接收、存储和显示由其他用户从打印字符扫描的字符或通过读取扫描字符的图像而获得的结果信息。这里,从其他用户接收到的字符或结果信息可以显示在与基于互联网的远程课程被回放的屏幕上显示的打印文档相对应的内容上。
根据实施例,一种通过电子设备进行光学字符识别(OCR)的方法包括:在电子设备的存储器中存储至少一个内容和与至少一个内容单独对应的至少一个词位表;获得由电子笔在打印文档上扫描的至少一个字符的图像;从至少一个内容中标识与图像相对应的内容,从至少一个词位表中标识与标识的内容相对应的词位表,并且基于标识的词位表和标识的内容的原始数据,获得通过对图像执行光学字符识别而识别的结果信息。
根据实施例,该方法还可以包括:响应于上传至少一个内容,生成与至少一个内容单独对应的至少一个词位表。至少一个词位表中的每一个包括对应内容的标识信息、对应内容的原始数据中包括的词、以及每个词的位置信息。
根据实施例,获得通过对图像进行光学字符识别而得到的结果信息包括:基于标识的词位表和原始数据,对从图像中读取的一个或多个词中的至少一个词进行校正,并且获得结果信息,结果信息包括原始数据的部分或与其中至少一个词已被校正的一个或多个词相对应的结果数据。原始数据的部分对应于包括结果数据的句子。由电子笔扫描的至少一个字符的图像对应于打印文档的至少一部分,打印文档的至少一部分通过将形成在电子笔的第一组件中的笔尖接触打印文档而被电子笔的第二组件中包含的墨水着色。
根据实施例,该方法还可以包括:在电子设备的显示器上显示屏幕,屏幕包括与包括字符串在内的内容单独对应的对象;响应于从对象中选择至少一个对象,基于与所选择的至少一个对象相关的信息获得与所选择的至少一个对象相对应的至少一个内容;并且获得与所获得的至少一个内容单独对应的至少一个词位表。该方法还包括:从外部设备获得至少一个内容和至少一个词位表。
根据实施例,该方法还可以包括:当选择屏幕上显示的特定对象(词列表的对象)时,提供先前搜索的词的历史信息。
根据实施例,该方法还可以包括:在电子设备的显示器上显示通过光学字符识别得到的结果信息,将结果信息存储在存储器中,将通过摘录存储器中存储的结果信息的至少部分而获得的摘录信息或至少一个内容配置为与至少一个其他用户共享,并且在显示器上显示至少一个其他用户输入的与摘录信息相关联的信息,或者在显示器上显示至少一个其他用户共享的与存储器中存储的结果信息相关联的摘录信息。
根据实施例,该方法还可以包括:提供标识的内容的附加信息,并且响应于词搜索请求,提供从图像中读取的至少一个词的搜索信息。
根据实施例,该方法还可以包括:响应于在提供结果信息之后在打印文档的与结果信息相对应的位置扫描至少一个词,提供扫描的至少一个词的搜索信息。
根据实施例,获得通过光学字符识别得到的信息可以包括:标识与从图像中读取的至少一个字符相对应的至少一个词;基于至少一个词位表,获得原始数据中的与标识的至少一个词相对应的至少一个词的位置信息;通过将标识的至少一个词与一个或多个原始数据中的置于位置信息中包括的位置的数据进行比较,获得指示印刷错误的数量的比较值;选择与获得的比较值的最小比较值相对应的位置;并且基于置于所选位置的数据,校正至少一个词。
根据实施例,提供了一种存储指令的非暂时性存储介质,指令由处理器执行以使得处理器能够执行以下操作:在存储器中存储至少一个内容和与至少一个内容单独对应的至少一个词位表;获得由电子笔在打印文档上扫描的至少一个字符的图像;从至少一个内容中标识与图像相对应的内容,从至少一个词位表中标识与标识的内容相对应的词位表,并且基于标识的词位表和标识的内容的原始数据,获得通过对图像执行光学字符识别而识别的结果信息。
尽管已经通过各种实施例描述了本公开,但是可以向本领域技术人员建议各种改变和修改。本公开旨在涵盖落入所附权利要求的范围内的这种变化和修改。

Claims (15)

1.一种用于光学字符识别的电子设备,包括:
存储器;以及
处理器,与所述存储器电连接,
其中所述处理器被配置为:
在所述存储器中存储至少一个内容和与所述至少一个内容单独对应的至少一个词位表,
获得由电子笔在打印文档上扫描的至少一个字符的图像,
从所述至少一个内容中标识与所述图像相对应的内容,
从所述至少一个词位表中标识与所标识的内容相对应的词位表,并且
基于所标识的词位表和所标识的内容的原始数据,获得通过对所述图像进行光学字符识别而识别的结果信息。
2.根据权利要求1所述的电子设备,其中,所述处理器还被配置为:响应于上传所述至少一个内容,生成与所述至少一个内容单独对应的所述至少一个词位表,其中,所述至少一个词位表中的每一个包括对应内容的标识信息、所述对应内容的原始数据中包括的词、以及每个词的位置信息,
基于所标识的词位表和所述原始数据,对从所述图像中读取的一个或多个词中的至少一个词进行校正,并且
获得结果信息,所述结果信息包括所述原始数据的部分或与其中所述至少一个词已被校正的一个或多个词相对应的结果数据,
其中所述原始数据的所述部分对应于包括所述结果数据的句子,以及
其中,由所述电子笔扫描的所述至少一个字符的所述图像对应于所述打印文档的至少一部分,所述打印文档的所述至少一部分通过将形成在所述电子笔的第一组件中的笔尖接触所述打印文档而被所述电子笔的第二组件中包含的墨水着色。
3.根据权利要求1所述的电子设备,其中,所述处理器还被配置为:
控制所述电子设备的显示器显示屏幕,所述屏幕包括与包括字符串的内容单独对应的对象;
响应于从所述对象中选择至少一个对象,基于与所选择的至少一个对象相关的信息获得与所选择的至少一个对象相对应的至少一个内容;并且
获得与所获得的至少一个内容单独对应的至少一个词位表。
4.根据权利要求1所述的电子设备,还包括:显示器,与所述处理器电连接并被配置为显示光学字符识别的结果信息,
其中所述处理器还被配置为:
将所述结果信息存储在所述存储器中,
将通过摘录存储在所述存储器中的结果信息的至少部分而获得的摘录信息或所述至少一个内容配置为与至少一个其他用户共享,并且
控制所述显示器显示由所述至少一个其他用户输入的与所述摘录信息相关联的信息,或者显示由所述至少一个其他用户共享的与存储在所述存储器中的所述结果信息相关联的摘录信息。
5.根据权利要求1所述的电子设备,其中,所述处理器还被配置为:
提供所标识的内容的附加信息,
响应于词搜索请求,提供从所述图像中读取的至少一个词的搜索信息,并且响应于在提供所述结果信息之后在所述打印文档的与所述结果信息相对应的位置扫描至少一个词,提供所扫描的至少一个词的搜索信息。
6.根据权利要求1所述的电子设备,其中,所述处理器还被配置为在获得通过对所述图像进行光学字符识别而识别的所述结果信息时:
从所述图像中读取的至少一个字符中标识至少一个词;
基于所述词位表,获得原始数据中的与所标识的至少一个词相对应的至少一个词的位置信息;
通过将所标识的至少一个词与一个或多个原始数据中的置于所述位置信息中包括的位置中的数据进行比较,获得指示印刷错误的数量的比较值;
选择与所获得的比较值的最小比较值相对应的位置;并且
基于置于所选择的位置中的数据,校正所述至少一个词。
7.一种由电子设备进行光学字符识别OCR的方法,所述方法包括:
在所述电子设备的存储器中存储至少一个内容和与所述至少一个内容单独对应的至少一个词位表;
获得由电子笔在打印文档上扫描的至少一个字符的图像;
从所述至少一个内容中标识与所述图像相对应的内容;
从所述至少一个词位表中标识与所标识的内容相对应的词位表;并且
基于所标识的词位表和所标识的内容的原始数据,获得通过对所述图像执行光学字符识别而识别的结果信息。
8.根据权利要求7所述的方法,还包括:响应于上传所述至少一个内容,生成与所述至少一个内容单独对应的所述至少一个词位表,
其中,所述至少一个词位表中的每一个包括对应内容的标识信息、所述对应内容的原始数据中包括的词、以及每个词的位置信息,
其中,获得通过对所述图像执行光学字符识别而得到的结果信息包括:
基于所标识的词位表和所述原始数据,对从所述图像中读取的一个或多个词中的至少一个词进行校正,并且
获得所述结果信息,所述结果信息包括所述原始数据的部分或与其中所述至少一个词已被校正的一个或多个词相对应的结果数据,
其中,所述原始数据的所述部分对应于包括所述结果数据的句子,以及
其中,由所述电子笔扫描的所述至少一个字符的所述图像对应于所述打印文档的至少一部分,所述打印文档的所述至少一部分通过将形成在所述电子笔的第一组件中的笔尖接触所述打印文档而被所述电子笔的第二组件中包含的墨水着色。
9.根据权利要求7所述的方法,还包括:
在所述电子设备的显示器上显示屏幕,所述屏幕包括与包括字符串的内容单独对应的对象;
响应于从所述对象中选择至少一个对象,基于与所选择的至少一个对象相关的信息获得与所选择的至少一个对象相对应的至少一个内容;并且
获得与所获得的至少一个内容单独对应的至少一个词位表,并且响应于选择所述屏幕上显示的特定对象,提供先前搜索的词的历史信息。
10.根据权利要求7所述的方法,还包括:
在所述电子设备的显示器上显示所述光学字符识别的结果信息;
将所述结果信息存储在所述存储器中;
将通过摘录存储在所述存储器中的结果信息的至少部分而获得的摘录信息或所述至少一个内容配置为与至少一个其他用户共享;并且
在所述显示器上显示由所述至少一个其他用户输入的与所述摘录信息相关联的信息,或者在所述显示器上显示由所述至少一个其他用户共享的与存储在所述存储器中的所述结果信息相关联的摘录信息。
11.根据权利要求7所述的方法,还包括:
提供所标识的内容的附加信息;
响应于词搜索请求,提供从所述图像中读取的至少一个词的搜索信息;并且
响应于在提供所述结果信息之后在所述打印文档的与所述结果信息相对应的位置扫描至少一个词,提供所扫描的至少一个词的搜索信息。
12.根据权利要求7所述的方法,其中,获得通过对所述图像执行光学字符识别而识别的所述结果信息包括:
标识与从所述图像中读取的至少一个字符相对应的至少一个词;
基于所述词位表,获得原始数据中的与所标识的至少一个词相对应的至少一个词的位置信息;
通过将所标识的至少一个词与一个或多个原始数据中的置于所述位置信息中包括的位置中的数据进行比较,获得指示印刷错误的数量的比较值;
选择与所获得的比较值的最小比较值相对应的位置;并且
基于置于所选择的位置中的数据,校正所述至少一个词。
13.一种存储指令的非暂时性存储介质,所述指令由处理器执行以使得所述处理器能够:
在存储器中存储至少一个内容和与所述至少一个内容单独对应的至少一个词位表;
获得由电子笔在打印文档上扫描的至少一个字符的图像;
从所述至少一个内容中标识与所述图像相对应的内容;
从所述至少一个词位表中标识与所标识的内容相对应的词位表;并且
基于所标识的词位表和所标识的内容的原始数据,获得通过对所述图像执行光学字符识别而识别的结果信息。
14.一种电子设备,包括:
外壳的第一组件;
笔尖,形成在所述第一组件的端部处;
所述外壳的第二组件,被配置为从所述第一组件的所述端部可拆卸;以及
光学字符识别模块,安装在所述第一组件内部,
其中,所述第二组件包含墨水并且被配置为当所述第二组件耦接到所述第一组件的所述端部以覆盖所述笔尖时使所述笔尖充满墨水,
其中,所述光学字符识别模块被配置为从打印文档的至少一部分扫描至少一个字符以进行光学字符识别,并且
其中,所述打印文档的所述至少一部分在与所述笔尖接触时被墨水着色。
15.根据权利要求14所述的电子设备,还包括:
第三组件,被配置在所述第一组件的另一端部处,以在外部显示器的触摸面板上生成电磁场信号,
其中,所述第三组件包括:
电介质尖端,向所述第一组件的所述另一端部突出,以及
线圈单元,与所述第一组件内部的所述电介质尖端电连接并被配置为生成电磁场信号,以及
其中,所述笔尖是可替换的并且被配置为在不释放墨水的情况下扫描至少一个字符。
CN202080069048.1A 2019-10-11 2020-10-08 用于光学字符识别的电子设备、方法和非暂时性存储介质 Pending CN114467123A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
KR20190126250 2019-10-11
KR10-2019-0126250 2019-10-11
KR10-2019-0174553 2019-12-24
KR1020190174553A KR20210043408A (ko) 2019-10-11 2019-12-24 광학적 문자 판독을 위한 전자 장치, 방법 및 비일시적 저장 매체
PCT/KR2020/013737 WO2021071285A1 (en) 2019-10-11 2020-10-08 Electronic device, method and non-transitory storage medium for optical character recognition

Publications (1)

Publication Number Publication Date
CN114467123A true CN114467123A (zh) 2022-05-10

Family

ID=75384015

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080069048.1A Pending CN114467123A (zh) 2019-10-11 2020-10-08 用于光学字符识别的电子设备、方法和非暂时性存储介质

Country Status (4)

Country Link
US (1) US11380082B2 (zh)
EP (1) EP4018369A4 (zh)
CN (1) CN114467123A (zh)
WO (1) WO2021071285A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113408438A (zh) * 2021-06-23 2021-09-17 北京字节跳动网络技术有限公司 电子设备的控制方法、装置、终端和存储介质
CN113269153B (zh) * 2021-06-26 2024-03-19 中国电子系统技术有限公司 一种表格识别方法以及装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5889897A (en) 1997-04-08 1999-03-30 International Patent Holdings Ltd. Methodology for OCR error checking through text image regeneration
US6832717B1 (en) * 1999-05-25 2004-12-21 Silverbrook Research Pty Ltd Computer system interface surface
AUPQ363299A0 (en) * 1999-10-25 1999-11-18 Silverbrook Research Pty Ltd Paper based information inter face
JP2004185312A (ja) 2002-12-03 2004-07-02 Canon Inc 文書管理装置
US9165478B2 (en) * 2003-04-18 2015-10-20 International Business Machines Corporation System and method to enable blind people to have access to information printed on a physical document
US7812860B2 (en) * 2004-04-01 2010-10-12 Exbiblio B.V. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
JP2006163969A (ja) 2004-12-09 2006-06-22 Dainippon Printing Co Ltd サーバ、電子ペン、電子ペン用帳票及びプログラム
JP2007257308A (ja) 2006-03-23 2007-10-04 Canon Inc 文書管理装置、文書管理システム、及びその制御方法、プログラム、記憶媒体
US8548317B2 (en) 2007-03-28 2013-10-01 Anoto Ab Different aspects of electronic pens
US8265382B2 (en) 2007-05-29 2012-09-11 Livescribe, Inc. Electronic annotation of documents with preexisting content
WO2009005492A1 (en) * 2007-06-29 2009-01-08 United States Postal Service Systems and methods for validating an address
KR100892367B1 (ko) 2007-07-05 2009-04-10 한국과학기술원 디지털 탁본 장치 및 방법
US7810730B2 (en) 2008-04-03 2010-10-12 Livescribe, Inc. Decoupled applications for printed materials
KR101463537B1 (ko) 2012-12-14 2014-11-19 성균관대학교산학협력단 원본 비교 장치 및 방법, 및 원본 복원 장치 및 방법
KR102368847B1 (ko) * 2017-04-28 2022-03-02 삼성전자주식회사 객체에 대응하는 콘텐트를 출력하기 위한 방법 및 그 전자 장치

Also Published As

Publication number Publication date
WO2021071285A1 (en) 2021-04-15
US11380082B2 (en) 2022-07-05
EP4018369A4 (en) 2022-10-12
US20210110192A1 (en) 2021-04-15
EP4018369A1 (en) 2022-06-29

Similar Documents

Publication Publication Date Title
US11528370B2 (en) Electronic device for providing various functions through application using a camera and operating method thereof
US20190065476A1 (en) Method and apparatus for translating text displayed on display
US12039791B2 (en) Image processing method, and electronic device supporting same
CN114467123A (zh) 用于光学字符识别的电子设备、方法和非暂时性存储介质
US11194881B2 (en) Electronic device and method for displaying web content in augmented reality mode
KR102710369B1 (ko) 다이나믹 레이아웃 메시지를 위한 전자 장치 및 컴퓨터 판독가능 매체
US11829597B2 (en) Electronic device and method for processing handwriting input thereof
KR102554551B1 (ko) 전자펜 및 전자펜의 사용자 인증 방법
CN203338371U (zh) 一种多功能扫描笔
US20200264750A1 (en) Method for displaying visual object regarding contents and electronic device thereof
US20210064864A1 (en) Electronic device and method for recognizing characters
US12008221B2 (en) Method for providing tag, and electronic device for supporting same
US12046058B2 (en) Electronic device for converting handwriting to text and method therefor
US9442576B2 (en) Method and system for combining paper-driven and software-driven design processes
KR20210043408A (ko) 광학적 문자 판독을 위한 전자 장치, 방법 및 비일시적 저장 매체
JP6822261B2 (ja) 情報処理装置、プログラムおよび情報処理方法
KR20220017308A (ko) 오디오 재생 및 화면 표시 방법 및 그 장치
KR20210132349A (ko) 전자 장치 및 전자 장치의 동작 방법
CN110865723A (zh) 阅读笔及阅读方法
KR20200049435A (ko) 문자 인식에 기반한 서비스 제공 방법 및 장치
KR20230051021A (ko) 학습을 보조하기 위한 방법 및 장치
KR20210158270A (ko) 전자 장치 및 전자 장치에서 신조어 기반 문장 변환 방법
KR20230011021A (ko) 콘텐트를 제공하는 장치 및 그 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination