CN111050017A - 图文拍照设备 - Google Patents

图文拍照设备 Download PDF

Info

Publication number
CN111050017A
CN111050017A CN201910811259.7A CN201910811259A CN111050017A CN 111050017 A CN111050017 A CN 111050017A CN 201910811259 A CN201910811259 A CN 201910811259A CN 111050017 A CN111050017 A CN 111050017A
Authority
CN
China
Prior art keywords
information
gas
image
text
camera
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910811259.7A
Other languages
English (en)
Inventor
陈旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority claimed from CN201410027696.7A external-priority patent/CN103763453B/zh
Publication of CN111050017A publication Critical patent/CN111050017A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/06Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/06Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
    • G09B5/065Combinations of audio and video presentations, e.g. videotapes, videodiscs, television systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K17/00Methods or arrangements for effecting co-operative working between equipments covered by two or more of main groups G06K1/00 - G06K15/00, e.g. automatic card files incorporating conveying and reading operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/12Details of acquisition arrangements; Constructional details thereof
    • G06V10/14Optical characteristics of the device performing the acquisition or on the illumination arrangements
    • G06V10/147Details of sensors, e.g. sensor lenses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition

Abstract

本发明公开了图文拍照设备,包括平板状外壳或者扁平立方体外壳,包括摄像头模块在竖立外壳的大面的上部向下拍照。本发明实施例可实现特别方式的平板设备对图文的拍照。

Description

图文拍照设备
技术领域
本发明涉及电子技术领域,尤其涉及智能设备领域。
背景技术
目前的平板智能设备都是针对普通拍照,没有考虑一些专用领域比如图文拍照领域对拍照的特别需求。
发明内容
本发明的目的是提供图文拍照设备。
本发明的目的是通过以下技术方案实现的:
图文拍照设备包括:
平板状外壳或者扁平立方体外壳,包括摄像头模块在竖立外壳的大面的上部向下拍照。
图文拍照设备包括:
工作时所述图文拍照设备在图书前方竖立而摄像头模块在竖立外壳的朝向图书这边的那个大面的上部向下朝向图书拍照,
和/或,
摄像头模块向下拍照的方向相对于平板状外壳或者扁平立方体外壳的竖立大面是向外倾斜的,
和/或,
摄像头模块设置于需要采集图像信息的区域的位置包括:所述区域的边缘上方和/或斜上方,
和/或,
摄像头模块包括的摄像头在竖立外壳的大面的上部的中部或者以竖立外壳的大面的上部的垂直中线左右对称。
图文拍照设备包括:
摄像头模块包括:至少一个可活动式摄像头所述可活动式摄像头的拍照角度和/或位置是可调整的,和/或,固定式摄像头所述固定式摄像头包括一个或多个镜头。
图文拍照设备包括:
所述可活动式摄像头的拍照角度和/或位置是可调整的,且所述可活动式摄像头基于预定的控制方式或接收的控制信息控制其活动以对被拍摄对象进行多角度和/或多位置的多点图像拍摄,
和/或,
若所述固定式摄像头包括多个镜头,则基于预定的控制方式或接收的控制信息控制各个镜头采集图文内容信息。
图文拍照设备包括:
对图文内容信息拍照和/或识别,所述图文内容信息包括:印刷品的图片或文字内容信息,和/或,手或手持物体在印刷品上进行的阅读指示操作信息而所述阅读指示操作信息包括通过手或手持物体在印刷品上进行的指点和/或单击和/或双击和/或滑动和/或翻页,
和/或,
通过识别图书封面的图像信息或封面图像信息中的文字或标签确定图书名称,和/或,通过识别图书内页的图像信息或图书内页的图像信息中的文字或数字页码确定当前阅读的页码。
图文拍照设备包括:
显示单元,显示包括设定的内容信息和/或拍照识别过程中获得的图像和文字信息和/或外部获得的内容信息,
和/或,
存储单元,包括存储拍照识别过程中获得的图像和/或文字信息和/或保存外部获得的内容信息;
和/或,
通信单元,用于和计算机通信,
和/或,
音频单元,包括:音频输入单元用于获取音频信息,和/或,发出当前阅读页的或印刷品当前阅读位置的或阅读操作指示的或书目信息或页码信息的文字内容信息对应的音频信息,
和/或,
互动处理模块,用于获取用户的互动操作控制信息,并根据所述互动操作控制信息执行预定的互动操作,且所述互动操作控制信息包括肢体动作、操作物体的动作、语音信息、屏幕输入或操作按键中的至少一项,
和/或,
印刷品包括图书,图书包括翻开的图书。
平板状外壳或者扁平立方体外壳,有两个大的平面即为主平面,其余四个环绕面只能算侧面或侧边,摄像头模块就是在大平面上,工作时外壳竖立而摄像头模块在大面的上部向下拍照,本发明图文拍照设备在拍照图文后一般要进行图文识别因此本发明实际也可称为图文拍照识别设备。
由上述本发明提供的技术方案可以看出,
本发明实施例提供的图文拍照设备由于采用了独特的摄像头布置方案,完成目前普通平板智能设备不能完成的功能,可以竖立在图书前从图书不影响阅读的角度或位置能图像采集并识别,不影响用户的阅读,与目前的需要用手拿着平板智能设备在图书上方向下拍照是不同的,目前的平板智能设备摄像头垂直于平板,若需要对图文拍照,则需要用手拿着平板智能设备在图书上方向下拍照,导致一些应用无法实现。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的图文拍照设备的示意图一;
图2为本发明实施例提供的图文拍照设备的示意图二;
图3为本发明实施例提供的图文拍照设备的示意图三。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
下面对本发明实施例作进一步地详细描述。
本发明实施例提供了图文拍照设备,包括平板状外壳或者扁平立方体外壳,有两个大的平面即为主平面,其余四个环绕面只能算侧面或侧边,摄像头模块就是在大平面上,工作时外壳竖立而摄像头模块在大面的上部向下拍照。
图文拍照设备包括:
平板状外壳或者扁平立方体外壳,包括摄像头模块在竖立外壳的大面的上部向下拍照。
图文拍照设备包括:
工作时所述图文拍照设备在图书前方竖立而摄像头模块在竖立外壳的朝向图书这边的那个大面的上部向下朝向图书拍照,
和/或,
摄像头模块向下拍照的方向相对于平板状外壳或者扁平立方体外壳的竖立大面是向外倾斜的,
和/或,
摄像头模块设置于需要采集图像信息的区域的位置包括:所述区域的边缘上方和/或斜上方,
和/或,
摄像头模块包括的摄像头在竖立外壳的大面的上部的中部或者以竖立外壳的大面的上部的垂直中线左右对称。
图文拍照设备包括:
摄像头模块包括:至少一个可活动式摄像头所述可活动式摄像头的拍照角度和/或位置是可调整的,和/或,固定式摄像头所述固定式摄像头包括一个或多个镜头。
图文拍照设备包括:
所述可活动式摄像头的拍照角度和/或位置是可调整的,且所述可活动式摄像头基于预定的控制方式或接收的控制信息控制其活动以对被拍摄对象进行多角度和/或多位置的多点图像拍摄,
和/或,
若所述固定式摄像头包括多个镜头,则基于预定的控制方式或接收的控制信息控制各个镜头采集图文内容信息。
图文拍照设备包括:
对图文内容信息拍照和/或识别,所述图文内容信息包括:印刷品的图片或文字内容信息,和/或,对印刷品进行阅读操作的指示信息而所述对印刷品进行阅读操作的指示信息包括通过手或手持物体在印刷品上进行的指点和/或单击和/或双击和/或滑动和/或翻页,
和/或,
通过识别图书封面的图像信息或封面图像信息中的文字或标签确定图书名称,和/或,通过识别图书内页的图像信息或图书内页的图像信息中的文字或数字页码确定当前阅读的页码。
图文拍照设备包括:
显示单元,显示包括设定的内容信息和/或拍照识别过程中获得的图像和文字信息和/或外部获得的内容信息,
和/或,
存储单元,包括存储拍照识别过程中获得的图像和/或文字信息和/或保存外部获得的内容信息;
和/或,
通信单元,用于和计算机通信,
和/或,
音频单元,包括:音频输入单元用于获取音频信息,和/或,发出当前阅读页的或印刷品当前阅读位置的或阅读操作指示的或书目信息或页码信息的文字内容信息对应的音频信息,
和/或,
互动处理模块,用于获取用户的互动操作控制信息,并根据所述互动操作控制信息执行预定的互动操作,且所述互动操作控制信息包括肢体动作、操作物体的动作、语音信息、屏幕输入或操作按键中的至少一项,
和/或,
印刷品包括图书,图书包括翻开的图书。
本发明实施例可以包括:多点图像信息采集单元和图像信息识别单元,所述多点图像信息采集单元将采集的图像信息传递给所述图像信息识别单元,所述图像信息识别单元根据所述图像信息识别出图文内容信息,且所述多点图像信息采集单元采用拍照方式获得所述图像信息,即所述多点图像信息采集单元通过其包含的摄像头拍摄获得所述图像信息。
进一步的,为实现针对被拍摄对象的多角度和/或多位置的多点图像拍摄,相应的多点图像信息采集单元可以采用以下任一结构实现:
(1)所述多点图像信息采集单元可以包括至少一个可活动式摄像头,所述可活动式摄像头基于预定的控制方式或接收的控制信息控制其活动以对被拍摄对象进行多角度和/或多位置的多点图像拍摄。例如,根据反馈自动控制(如根据拍摄图像识别后的反馈做自动调整),比如当手指示处超出范围了或部分文字超出范围了或页码超出范围了,则自动调整可活动式摄像头的角度和/或位置,这样产品在工作过程中无需或少需人工干预,或者,根据用户输入的控制信息(如用户执行的特定肢体动作或用户通过操作按键输入的预定控制信息等)控制所述摄像头转动或移动,或者,也可以根据预先设定的时间间隔自动控制所述摄像头旋转或移动,以进行针对被拍摄对象的多角度和/或多位置的多点拍摄。
具体地,所述可活动式摄像头包括可旋转式摄像头和/或可移动式摄像头,即所述可活动式摄像头可旋转或可移动或可移动可旋转;或者,所述可活动式摄像头包括一个或多个可活动式镜头;若所述可活动式摄像头包含多个,则多个可活动式摄像头包含的每个摄像头用于采集全部或部分场景的图文内容信息;所述可活动式摄像头可以设置于需要采集所述图像信息的区域的位置包括:所述区域的边缘上方和/或斜上方和/或正上方。
(2)所述多点图像信息采集单元包括多个摄像头,即二个或三个或四个或四个以上摄像头,所述多个摄像头用于完成多角度和/或多位置的多点图像拍摄,且每个摄像头为固定式摄像头或可活动式摄像头,所述可活动式摄像头为基于预定的控制方式或基于接收的控制信息或手动控制其活动以对被拍摄对象进行多角度和/或多位置的多点图像拍摄。例如,根据反馈自动控制(如根据拍摄图像识别后的反馈做自动调整),比如当手指示处超出范围了或部分文字超出范围了或页码超出范围了,则自动调整可活动式摄像头的角度和/或位置,这样产品在工作过程中无需或少需人工干预,或者,根据用户输入的控制信息(如用户执行的特肢体定动作或用户通过操作按键输入的预定控制信息等)控制所述摄像头转动或移动,或者,也可以根据预先设定的时间间隔自动控制所述摄像头旋转或移动,以进行针对被拍摄对象的多角度和/或多位置的多点拍摄。
具体地,所述固定式摄像头包括一个或多个镜头,且若所述固定式摄像头包括多个镜头,则基于预定的控制方式或接收的控制信息控制各个镜头采集所述图文内容信息,且所述预定的控制方式包括控制多个摄像头中的全部摄像头或部分摄像头进行多角度和/或多位置的多点图像拍摄;
所述多个摄像头包含的每个摄像头用于采集全部或部分场景的图文内容信息;
在该方案(2)中,所述摄像头可以设置于需要采集所述图像信息的区域的位置包括:所述区域的边缘上方和/或斜上方和/或正上方。
也就是说,在该图文采集识别装置中,相应的多点图像信息采集单元可以包含多个摄像头,相应的多个摄像头可以是以固定或可活动的方式设置于被拍摄对象所在区域的边缘上方和/或斜上方和/或正上方,例如,可以设置于图书的边缘上方和/或斜上方和/或正上方,当阅读者在阅读时设置的位置需要不影响阅读者阅读图书即可。同时,由于采用了多个摄像头,大大减小了对每个摄像头所需要的拍摄覆盖,增大了整体覆盖,从而保证对识别所需要的拍摄覆盖,多个摄像头可以各自拍摄进行各自的识别工作,也可将拍摄结果综合后以供识别。
(3)所述多点图像信息采集单元包括一个固定式摄像头,所述固定式摄像头包括多个镜头,且基于预定的控制方式或接收的控制信息控制所述多个镜头包含的各个镜头采集所述图文内容信息,从而可以通过所述多个镜头实现对被拍摄对象进行多角度和/或多位置的多点图像拍摄,且所述预定的控制方式包括控制多个镜头中的全部镜头或部分镜头进行多角度和/或多位置的多点图像拍摄。例如,根据反馈自动控制(如根据拍摄图像识别后的反馈做自动调整),比如当手指示处超出范围了或部分文字超出范围了或页码超出范围了,则自动调整可活动式摄像头的角度和/或位置,这样产品在工作过程中无需或少需人工干预,或者,根据用户输入的控制信息(如用户执行的肢体定动作或用户通过操作按键输入的预定控制信息等)控制所述各个镜头对被拍摄对象的多角度和/或多位置进行拍摄,或者,也可以根据预先设定的各个镜头采集被拍摄对象的多角度和/或多位置的图像信息的方式自动控制所述各个镜头进行拍摄(比如,可以设定各个镜头为依次拍摄被拍摄对象获得相应的图像信息,也可以设定各个镜头同时拍摄被拍摄对象获得相应的图像信息,或者,也可以设定部分镜头拍摄被拍摄对象获得相应的图像信息,等等)。
具体地,在该方案(3)中,所述固定式摄像头可以设置于需要采集所述图像信息的区域的位置包括:所述区域的边缘上方和/或斜上方和/或正上方。
固定摄像头通常有固定的视野,但多个摄像头可形成全面的覆盖,而可活动式摄像头在某一角度位置时有固定的视野,但其通过活动改变视野,因此也能形成全面的覆盖,在具体实施中,如果固定摄像头松动了,并不能视为可活动式摄像头,同样,即使摄像头是可以活动的,但如果其工作过程中并不是靠活动来获得所需的特别效果,比如全面的覆盖等,则实际上仍属于固定摄像头方案。比如,若将可以活动的摄像头事先调整到合适的角度位置等,但实际使用中并不需要进行活动,或活动对特别的效果比如全面的覆盖等作用很小,则实际上仍属于固定摄像头方案。
本发明实施例提供的图文采集识别装置中,所述图文内容信息具体可以但不限于包括:印刷品的图片或文字内容信息,和/或,空间静物的图片信息,和/或,肢体动作信息,和/或,对印刷品进行阅读操作的指示信息,和/或,操作物体的动作信息;即所述图文内容信息可以为印刷品的图片或文字内容信息、空间静物的图片信息、肢体动作信息、对印刷品进行阅读操作的指示信息以及操作物体的动作信息中的至少一项。
也就是说,相应的图像信息识别单元可以根据采集到的图像信息识别出印刷品中的图片或文字信息,或者,也可以识别出空间静物的图片(如根据采集到的空间静物的图像信息确定相应的空间静物的对应图片或文字说明等内容信息),或者,也可以识别出用户执行的手势动作等肢体动作信息(如识别预定的肢体动作所对应的执行指令含义等),或者,也可以识别出用户操作物体的动作信息,或者,也可以识别出用户对印刷品进行阅读时的阅读操作指示,等等。进一步地,对印刷品进行阅读操作的指示信息可以通过肢体动作信息或操作物体的动作信息实现,即可以将特定的肢体动作或操作物体的动作作为某种阅读操作的指示信息;也就是说,所述对印刷品进行阅读操作的指示信息可以包括:通过手或手持物体在印刷品上进行的阅读指示操作信息,如确定指点某处进行阅读的指示或确定需要阅读内容的指示或确定是否需要阅读的指示等,比如手在印刷品上指点、单击、 双击、滑动、翻页等。
本发明实施例提供的一种图文采集识别装置由于采用了独特的摄像头布置方案,使得在图像信息采集过程中可以灵活地获得需要采集被拍摄对象的多点图像信息,即采集被拍摄对应的不同角度和/或不同位置的图像信息,从而可以使得采集到的图像信息能够真实准确地反应被拍摄对象的实际情况,进而使得后续的图文识别处理过程中可以准确识别出相应的图文内容信息,如准确地识别出印刷品中的文字或图片信息,或者,识别出用户的肢体动作的含义,或者,识别出用户操作物体执行的动作的含义,或者,识别出用户通过肢体动作或操作物体对图书等印刷品的阅读操作的含义,或者,识别出用户指示的文字或图片等等。
在本发明实施例提供的图文采集识别装置中,为便于用户基于该装置实现针对印刷品的有声阅读,在该装置中还可以包括音频单元,所述多点图像信息采集单元将采集的图书中当前阅读页或印刷品当前阅读位置或阅读操作指示位置或包含书目信息或包含页码信息的图像信息传递给所述图像信息识别单元,所述图像信息识别单元识别出根据所述当前阅读页或印刷品当前阅读位置或阅读操作指示位置或包含书目信息或包含页码信息的图像信息识别出该当前阅读页或印刷品当前阅读位置或阅读操作指示位置或书目信息或页码信息的文字内容信息对应的音频信息并通知所述音频单元,所述音频单元将所述对应的音频信息以音频形式输出,从而可以实现针对印刷品中文字内容的有声朗读,便于不方便直观对图书进行阅读的人群获得普通图书中的内容信息。
在通过所述音频单元对印刷品进行有声阅读操作过程中,所述多点图像信息采集单元还包含阅读位置信息采集模块,用于通过摄像头采集用户阅读操作位置(即用户指定的印刷品当前阅读位置)的文字图像信息,且所述图像信息识别单元识别所述用户阅读操作位置的文字图像信息包含的文字内容,并将识别确定的所述文字内容对应的音频信息或所述文字内容转换获得的音频信息通知所述音频单元。其中,所述文字内容对应的音频信息可以为该部分文字内容的朗读音频信息,也可以为该文字内容对应的其他音频信息,如对该文字内容的解释说明等音频信息。
相应的文字识别目前已经逐渐进入实用阶段,相应的识别处理过程可以包括:首先对拍照的图像预处理,该预处理主要包括二值化、噪声去除、倾斜较正等处理,然后进行文字特征抽取,包括对文字影像细线化后,取得字的笔划端点、交叉点之数量及位置,或以笔划段为特征,配合比对方法进行比对,从而识别文字。由于文字识别技术已经为现有技术,故在此不再对其进行详细说明。
在该图文采集识别装置中,由于可以准确进行图文内容信息的识别,因而可以针对普通图书进行图文识别处理,并结合相应的发声功能实现针对普通图书的辅助阅读发声处理,从而为人们提供一种可以对普通图书进行辅助发声的辅助阅读发声设备,这就使得儿童、盲人、老年人等不方便对图书直接进行阅读的人群可以借助该图文采集识别装置进行辅助阅读,极大地方便了这部分人群对普通图书的阅读操作。而且,识别过程的准确性还可以保证图书阅读过程能够顺畅地进行,进一步保证了阅读用户具有较佳的阅读体验。
在本发明实施例提供的图文采集识别装置中,为便于保存识别出的图文内容信息,在该装置中还可以包括存储单元,用于保存所述图像信息识别单元识别出的所述图文内容信息,以方便后续对所述图文内容信息的调用。
在本发明实施例提供的图文采集识别装置中,所述多点图像信息采集单元还可以采集的包含有图书的书目信息的图像信息并传递给所述图像信息识别单元,所述图像信息识别单元根据所述包含有图书的书目信息的图像信息识别出图书名称。进一步地,还可以通过音频或显示的方式输出所述图书名称,例如,可以通过所述音频单元朗读出图书名称,或通过显示屏显示出图书名称。
进一步地,所述多点图像信息采集单元可以通过所述摄像头采集图书封皮的图像信息作为包含所述图书的书目信息的图像信息,所述图像信息识别单元则可以通过识别所述图书封皮(包含封面、封底等)的图像信息中的文字确定图书名称,或者,也可以通过识别所述图书封皮的图像信息确定图书名称,或者,还可以通过识别所述图书封皮的图像信息中的标签确定图书名称,相应的标签包括特制的标签或编码,或者也可以包括ISBN条码(国际标准书号,International Standard Book Number)等目前已经存在的标签或编码。
由于每本书的封面和封底图像均各不相同,故可以通过拍摄到的图像信息进行对比识别,或提取特征对比从而识别出具体为哪一本图书,从而确定相应的图书名称。而且,为便于识别,还可以在图书中设置相应的便于识别的标签,使得根据该标签可以确定当前图书的具体图书名称,相应的标签可以为印制于图书上的标签,也可以为粘贴于图书上的标签,且相应的标签上可以为图片或编码或文字等内容信息。由于具体的图像识别技术已经为现有技术,故在此不再对其进行详细说明。
在本发明实施例提供的图文采集识别装置中,所述多点图像信息采集单元还可以采集的包含有页码信息的图像信息并传递给所述图像信息识别单元,所述图像信息识别单元根据所述包含有页码信息的图像信息识别出页码。进一步地,还可以通过音频或显示的方式输出所述图书名称,例如,可以通过所述音频单元朗读出页码,或通过显示屏显示出页码。
所述页码信息采集模块通过识别所述图书内页的图像信息确定当前阅读的页码,或者,通过识别所述图书内页的图像信息中的文字或数字页码确定当前阅读的页码。
该图文采集识别装置还可以包括显示单元,用于显示设定的内容信息和/或采集识别过程中获得的图像和文字信息和/或外部获得的内容信息,例如,可以显示当前图书阅读的页码或图书名称等信息,或者,显示针对图书的解释说明信息(如作者介绍等),或者,显示所述图像信息识别单元识别出的用户的操作指令,或者,播放用于对图书进行解释的视频信息,等等。
具体地,该图文采集识别装置还可以包括以下任一项或多项单元:
音频输入单元,用于获取音频信息。相应的获取后的音频信息可以通过存储单元进行保存。
存储单元,包括存储音频信息和/或保存采集识别过程中获得的图像和/或文字信息和/或保存外部获得的内容信息,保存的语音信息可以在需要时通过音频单元进行播放,例如,通过音频输入单元和该存储单元及音频单元的配合,可以校正语言学习过程中用户的发音是否准确等。
通信单元,用于与计算机之间进行通信。
再者,为加强用户与该图文采集识别装置之间的互动处理,提升用户使用该图文采集识别装置的体验,在该装置中还可以包括互动处理模块,用于获取用户的互动操作控制信息,并根据所述互动操作控制信息执行预定的互动操作,且所述互动操作控制信息包括肢体动作、操作物体的动作、语音信息、屏幕输入或操作按键中的至少一项;在互动处理过程中,图文采集识别装置还可以通过所述音频单元向用户播放特定提示声音信息,或者也可以通过所述显示单元向用户显示特定的内容信息,且用户可以根据相应的提示声音信息或显示的特定的内容信息向图文采集识别装置传递相应的互动操作控制信息,以便于与图文采集识别装置进行互动。具体地,相应的互动操作控制信息可以包括在印刷品上进行的阅读操作指示信息等,以通过肢体动作进行互动操作为例,对于阅读普通图书的用户可以通过手或手持物体的动作与图文采集识别装置之间互动以对阅读方式或阅读内容进行互动控制等,如通过预定手势控制重新阅读一次当前位置的内容等。通过该互动处理模块可以识别阅读用户的肢体动作或操作物体动作,以便于该装置可以与阅读用户之间进行互动,从而提升阅读用户的阅读体验,使得图书成为有声媒体和互动媒体。
在本发明实施例中,通过相应的多点图像采集近距离就可以对所需采集对象的覆盖且不失真。具体地,相应的活动摄像头或多个摄像头会有多个焦距,这样就能使所采集对象所有部分都处于最佳焦距,以保证各部分的图像均清晰。
由于采用了多摄像头或可活动式摄像头(如可转头式摄像头)的结构,对于弯曲表面(比如图书中部的大弯曲面)总能有合适的拍摄角度和位置,因此能有效地对其进行拍摄识别,相应的拍摄角度无论正上方还是侧面斜面都能对拍摄对象有效拍摄,各部分都在良好焦距内而获得清晰图像和良好的分辨率。而且,相应的多点图像采集使得对摄像头分辨率要求较低,或者说以同样分辨率的摄像头对所拍摄物进行拍摄可以达到更高的分辨率(更有利于识别)。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (7)

1.图文拍照设备,其特征在于包括:
平板状外壳或者扁平立方体外壳,包括摄像头模块在竖立外壳的大面的上部向下拍照。
2.根据权利要求1所述的图文拍照设备,其特征在于包括:
工作时所述图文拍照设备在图书前方竖立而摄像头模块在竖立外壳的朝向图书这边的那个大面的上部向下朝向图书拍照,
和/或,
摄像头模块向下拍照的方向相对于平板状外壳或者扁平立方体外壳的竖立大面是向外倾斜的,
和/或,
摄像头模块设置于需要采集图像信息的区域的位置包括:所述区域的边缘上方和/或斜上方,
和/或,
摄像头模块包括的摄像头在竖立外壳的大面的上部的中部或者以竖立外壳的大面的上部的垂直中线左右对称。
3.根据权利要求1所述的图文拍照设备,其特征在于包括:
摄像头模块包括:至少一个可活动式摄像头所述可活动式摄像头的拍照角度和/或位置是可调整的,和/或,固定式摄像头所述固定式摄像头包括一个或多个镜头。
4.根据权利要求3所述的图文拍照设备,其特征在于包括:
所述可活动式摄像头的拍照角度和/或位置是可调整的,且所述可活动式摄像头基于预定的控制方式或接收的控制信息控制其活动以对被拍摄对象进行多角度和/或多位置的多点图像拍摄,
和/或,
若所述固定式摄像头包括多个镜头,则基于预定的控制方式或接收的控制信息控制各个镜头采集图文内容信息。
5.根据权利要求1至4任一项所述的图文拍照设备,其特征在于包括:
对图文内容信息拍照和/或识别,所述图文内容信息包括:印刷品的图片或文字内容信息,和/或,手或手持物体在印刷品上进行的阅读指示操作信息而所述阅读指示操作信息包括通过手或手持物体在印刷品上进行的指点和/或单击和/或双击和/或滑动和/或翻页,
和/或,
通过识别图书封面的图像信息或封面图像信息中的文字或标签确定图书名称,和/或,通过识别图书内页的图像信息或图书内页的图像信息中的文字或数字页码确定当前阅读的页码。
6.根据权利要求1至4任一项所述的图文拍照设备,其特征在于包括:
显示单元,显示包括设定的内容信息和/或拍照识别过程中获得的图像和文字信息和/或外部获得的内容信息,
和/或,
存储单元,包括存储拍照识别过程中获得的图像和/或文字信息和/或保存外部获得的内容信息;
和/或,
通信单元,用于和计算机通信,
和/或,
音频输入单元,用于获取音频信息,
和/或,
互动处理模块,用于获取用户的互动操作控制信息,并根据所述互动操作控制信息执行预定的互动操作,且所述互动操作控制信息包括肢体动作、操作物体的动作、语音信息、屏幕输入或操作按键中的至少一项。
7.根据权利要求5所述的图文拍照设备,其特征在于包括:
显示单元,显示包括设定的内容信息和/或拍照识别过程中获得的图像和文字信息和/或外部获得的内容信息,
和/或,
存储单元,包括存储拍照识别过程中获得的图像和/或文字信息和/或保存外部获得的内容信息;
和/或,
通信单元,用于和计算机通信,
和/或,
音频单元,包括:音频输入单元用于获取音频信息,和/或,发出当前阅读页的或印刷品当前阅读位置的或阅读操作指示的或书目信息或页码信息的文字内容信息对应的音频信息,
和/或,
互动处理模块,用于获取用户的互动操作控制信息,并根据所述互动操作控制信息执行预定的互动操作,且所述互动操作控制信息包括肢体动作、操作物体的动作、语音信息、屏幕输入或操作按键中的至少一项,
和/或,
印刷品包括图书,图书包括翻开的图书。
CN201910811259.7A 2013-01-25 2014-01-21 图文拍照设备 Pending CN111050017A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201310028174 2013-01-25
CN2013100281744 2013-01-25
CN201410027696.7A CN103763453B (zh) 2013-01-25 2014-01-21 一种图文采集识别装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201410027696.7A Division CN103763453B (zh) 2013-01-25 2014-01-21 一种图文采集识别装置

Publications (1)

Publication Number Publication Date
CN111050017A true CN111050017A (zh) 2020-04-21

Family

ID=61237713

Family Applications (5)

Application Number Title Priority Date Filing Date
CN201910811259.7A Pending CN111050017A (zh) 2013-01-25 2014-01-21 图文拍照设备
CN201711303666.4A Withdrawn CN107967824A (zh) 2013-01-25 2014-01-21 一种图文指点拍照识别装置
CN201710960784.6A Withdrawn CN107742446A (zh) 2013-01-25 2014-01-21 图书阅读器
CN201811229624.5A Pending CN109300343A (zh) 2013-01-25 2014-01-21 一种图文识别装置
CN201910811258.2A Pending CN111429767A (zh) 2013-01-25 2014-01-21 一种图文拍照识别设备

Family Applications After (4)

Application Number Title Priority Date Filing Date
CN201711303666.4A Withdrawn CN107967824A (zh) 2013-01-25 2014-01-21 一种图文指点拍照识别装置
CN201710960784.6A Withdrawn CN107742446A (zh) 2013-01-25 2014-01-21 图书阅读器
CN201811229624.5A Pending CN109300343A (zh) 2013-01-25 2014-01-21 一种图文识别装置
CN201910811258.2A Pending CN111429767A (zh) 2013-01-25 2014-01-21 一种图文拍照识别设备

Country Status (1)

Country Link
CN (5) CN111050017A (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109003476A (zh) * 2018-07-18 2018-12-14 深圳市本牛科技有限责任公司 一种手指点读系统及其操作方法以及采用该系统的装置
JP7293585B2 (ja) * 2018-07-24 2023-06-20 凸版印刷株式会社 ページ押さえ装置、印刷体利用支援システム、及びページ押さえ方法
WO2020034519A1 (zh) * 2018-08-17 2020-02-20 中国图书进出口(集团)大连有限公司 空间化有声阅读系统及方法
CN109256123A (zh) * 2018-09-06 2019-01-22 徐喜成 一种辅助老年人阅读文字以及防走失实时交互阅读系统
CN109254663B (zh) * 2018-09-07 2021-04-09 许昌特博特科技有限公司 一种儿童图书辅助阅读机器人的使用方法
CN109725732B (zh) * 2019-01-23 2022-03-25 广东小天才科技有限公司 一种知识点的查询方法及家教设备
CN111583734A (zh) * 2019-02-19 2020-08-25 阿里巴巴集团控股有限公司 点读方法及点读笔
CN110211433A (zh) * 2019-05-24 2019-09-06 潘巧娃 一种智能图书
CN110135404A (zh) * 2019-06-21 2019-08-16 西南石油大学 一种智能阅读机器人的阅读系统
CN110489005B (zh) * 2019-06-28 2022-12-27 浙江工业大学 具有触摸定位功能的二维点显器及其二维触点驱动方法
CN110460642B (zh) * 2019-07-16 2022-04-15 上海掌门科技有限公司 一种管理阅读模式的方法与设备
TWI717199B (zh) * 2020-01-21 2021-01-21 台灣骨王生技股份有限公司 醫療手術用控制系統及方法
CN111723811A (zh) * 2020-05-20 2020-09-29 上海积跬教育科技有限公司 文字识别及处理的方法、装置、介质以及电子设备
CN111639635B (zh) * 2020-05-26 2024-02-27 广东小天才科技有限公司 一种拍摄图片的处理方法及装置、电子设备、存储介质
CN112132127A (zh) * 2020-08-10 2020-12-25 北京网梯科技发展有限公司 点读中实现图书自动切换的方法及装置
CN114299524A (zh) * 2021-11-18 2022-04-08 珠海读书郎软件科技有限公司 基于页面图像的页码识别方法、存储介质和计算机设备
CN116052671B (zh) * 2022-11-21 2023-07-28 深圳市东象设计有限公司 一种智能翻译机及翻译方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020149681A1 (en) * 2001-03-28 2002-10-17 Kahn Richard Oliver Automatic image capture
CN201097383Y (zh) * 2007-01-12 2008-08-06 林良锐 听书机
CN101572020A (zh) * 2008-04-29 2009-11-04 纽里博株式会社 多媒体输出装置和方法、以及利用照相机的教育设备
CN101833663A (zh) * 2010-04-21 2010-09-15 北方工业大学 一种双目电子阅读器
CN102136201A (zh) * 2010-01-21 2011-07-27 深圳市华普电子技术有限公司 摄像式点读机
CN102169540A (zh) * 2011-03-28 2011-08-31 汉王科技股份有限公司 基于拍摄仪的点读定位方法和装置
CN102622593A (zh) * 2012-02-10 2012-08-01 北方工业大学 一种文本识别方法及系统
CN202548498U (zh) * 2012-05-03 2012-11-21 合硕科技股份有限公司 可自动追踪对焦的球形镜头装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08161423A (ja) * 1994-12-06 1996-06-21 Dainippon Printing Co Ltd 照明装置および文字読取装置
JP2000123110A (ja) * 1998-10-15 2000-04-28 Kobayashi Kirokushi Co Ltd Ocrテストシート
CN1202459C (zh) * 2001-08-08 2005-05-18 台均实业有限公司 多页可翻页手写板
CN2535693Y (zh) * 2002-01-04 2003-02-12 陈大修 排油烟机的免触式按键功能面板装置
TWI235324B (en) * 2002-07-02 2005-07-01 Giga Byte Tech Co Ltd Motion capture device at virtual position
CN2736874Y (zh) * 2003-12-08 2005-10-26 合肥文语科技发展有限公司 智能有声书
CN2881828Y (zh) * 2005-06-24 2007-03-21 赵舜培 儿童伴读装置
CN201083990Y (zh) * 2007-10-25 2008-07-09 余启联 书包智能管理器
CN201285603Y (zh) * 2008-10-24 2009-08-05 北京农业职业学院 电子放大有声阅读器装置
CN201348829Y (zh) * 2008-12-31 2009-11-18 崔伟 导读机
CN201540655U (zh) * 2009-05-13 2010-08-04 崔伟 发音书
CN201535956U (zh) * 2009-07-24 2010-07-28 王昊 光学定位点读机
CN201918037U (zh) * 2010-11-29 2011-08-03 北方工业大学 台式助视阅读器
CN102842034B (zh) * 2012-07-10 2015-09-16 重庆大学 一种激光扫描与自动识别雕刻字符的装置及识别方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020149681A1 (en) * 2001-03-28 2002-10-17 Kahn Richard Oliver Automatic image capture
CN201097383Y (zh) * 2007-01-12 2008-08-06 林良锐 听书机
CN101572020A (zh) * 2008-04-29 2009-11-04 纽里博株式会社 多媒体输出装置和方法、以及利用照相机的教育设备
CN102136201A (zh) * 2010-01-21 2011-07-27 深圳市华普电子技术有限公司 摄像式点读机
CN101833663A (zh) * 2010-04-21 2010-09-15 北方工业大学 一种双目电子阅读器
CN102169540A (zh) * 2011-03-28 2011-08-31 汉王科技股份有限公司 基于拍摄仪的点读定位方法和装置
CN102622593A (zh) * 2012-02-10 2012-08-01 北方工业大学 一种文本识别方法及系统
CN202548498U (zh) * 2012-05-03 2012-11-21 合硕科技股份有限公司 可自动追踪对焦的球形镜头装置

Also Published As

Publication number Publication date
CN109300343A (zh) 2019-02-01
CN107742446A (zh) 2018-02-27
CN111429767A (zh) 2020-07-17
CN107967824A (zh) 2018-04-27

Similar Documents

Publication Publication Date Title
CN111050017A (zh) 图文拍照设备
CN204046697U (zh) 一种图文采集识别装置
US8538087B2 (en) Aiding device for reading a printed text
US8154644B2 (en) System and method for manipulation of a digital image
CN109448453B (zh) 基于图像识别追踪技术的点读问答方法与系统
US20090110245A1 (en) System and method for rendering and selecting a discrete portion of a digital image for manipulation
US9591149B2 (en) Generation of a combined image of a presentation surface
CN109376612B (zh) 一种基于手势协助定位学习的方法和系统
CN107731020B (zh) 多媒体播放方法、装置、存储介质及电子设备
CN104835361B (zh) 一种电子词典
CN110473436A (zh) 一种阅读辅助学习设备
CN110096987B (zh) 一种基于双路3dcnn模型的哑语动作识别方法
CN111539408A (zh) 基于拍照识物的智能点读方案
US8964128B1 (en) Image data processing method and apparatus
Saleous et al. Read2Me: A cloud-based reading aid for the visually impaired
CN108287900A (zh) 一种手持拍照设备的搜题方法、系统及手持拍照设备
CN110971924B (zh) 一种直播过程中美颜的方法、设备、存储介质及系统
CN109948600A (zh) 一种智能文字识别笔及文字识别系统
CN112506398B (zh) 图文显示方法及用于其的装置、计算机可读介质
CN110069206A (zh) 一种获取题目图片的方法及装置
CN101937256B (zh) 外接镜头装置以及架设外接镜头的方法
CN111639635B (zh) 一种拍摄图片的处理方法及装置、电子设备、存储介质
CN116048254A (zh) 应用于智能设备的内容识别方法、智能设备、智能笔
CN114449323A (zh) 视频生成方法和电子设备
Disfani Making Printed Documents Accessible for people with visual impairments

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200421

RJ01 Rejection of invention patent application after publication