CN111259135A - 文本的显示方法、提词器及提词系统 - Google Patents

文本的显示方法、提词器及提词系统 Download PDF

Info

Publication number
CN111259135A
CN111259135A CN201910824563.5A CN201910824563A CN111259135A CN 111259135 A CN111259135 A CN 111259135A CN 201910824563 A CN201910824563 A CN 201910824563A CN 111259135 A CN111259135 A CN 111259135A
Authority
CN
China
Prior art keywords
text
page
currently displayed
characters
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910824563.5A
Other languages
English (en)
Inventor
张志扬
苏进
于勇
徐晔
李琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiaer Medical Technology Co ltd
Original Assignee
Beijing Jiaer Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiaer Medical Technology Co ltd filed Critical Beijing Jiaer Medical Technology Co ltd
Priority to CN201910824563.5A priority Critical patent/CN111259135A/zh
Publication of CN111259135A publication Critical patent/CN111259135A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明涉及电子设备领域,公开了一种文本的显示方法、提词器及提词系统,该文本的显示方法包括:获取各页文本及各页文本的显示顺序;按照所述各页文本的显示顺序,在用于显示所述各页文本的显示设备中,从首页文本开始,判断当前显示的文本是否满足预设的翻页条件,其中,所述翻页条件包括指定对象阅读该当前显示的文本而产生的待识别音源与该当前显示的文本相匹配;以及在当前显示的文本满足所述翻页条件时,控制所述显示设备显示当前显示的文本的下一页文本。该文本的显示方法可实现自动翻页,使得演讲者的准备降至极低。

Description

文本的显示方法、提词器及提词系统
技术领域
本发明涉及电子设备领域,具体地涉及文本的显示方法、提词器及提词系统。
背景技术
现有的提词器在使用时,会将一个高亮度的显示设备所显示的文本反射到摄像机镜头前一块呈45度角的专用镀膜玻璃上,通过反射玻璃把文本反射出来,使得指定对象(可以为演讲者)能面对摄像机来看文本。现有技术的具体结构为通过三角架将提词器、显示设备及摄像机支撑于指定对象的前方,从而产生了指定对象始终面向观众的亲切感。
现阶段的提词器虽然可以实现文本的提示,但是,需要人工来进行翻页,而人工在进行翻页过程中常常会造成翻页时机的不准确(提前过长时间翻页或一直忘记翻页)的情况发生,严重影响了指定对象的演讲过程。
发明内容
本发明的目的是提供一种文本的显示方法、提词器及提词系统,该文本的显示方法可实现自动翻页,使得演讲者的演讲准备降至极低。
为了实现上述目的,本发明一方面提供一种文本的显示方法,该文本的显示方法包括:获取各页文本及各页文本的显示顺序;按照所述各页文本的显示顺序,在用于显示所述各页文本的显示设备中,从首页文本开始,判断当前显示的文本是否满足预设的翻页条件,其中,所述翻页条件包括指定对象阅读该当前显示的文本而产生的待识别音源与该当前显示的文本相匹配;以及在当前显示的文本满足所述翻页条件时,控制所述显示设备显示当前显示的文本的下一页文本。
本发明另一方面还提供一种提词器,该提词器包括:文本分析模块,用于获取各页文本及各页文本的显示顺序;以及控制模块,用于按照所述各页文本的显示顺序,在用于显示所述各页文本的显示设备中,从首页文本开始,判断当前显示的文本是否满足预设的翻页条件,若是,则控制所述显示设备显示当前显示的文本的下一页文本,其中,所述翻页条件包括指定对象阅读该当前显示的文本而产生的待识别音源与该当前显示的文本相匹配。
另外,本发明还提供一种提词系统,该提词系统包括:根据上述的提词器,其中,所述提词器中的显示设备被配置采用增强现实显示技术进行所述各页文本的显示;增强现实技术眼镜,能够置于使用者的眼睛的前方,用于与所述增强现实技术设备相适配,使得使用者能够查看到所述显示设备所显示的各页文本。
另外,本发明还提供一种机器可读存储介质,该机器可读存储介质上存储有指令,该指令用于使得机器执行上述的文本的显示方法。
通过上述技术方案,首先通过获取各页文本及其显示顺序使得显示设备可以按照显示顺序正常显示所述各页文本,并且根据预设的翻页条件来确定显示设备的翻页时间,该翻译条件为指定对象在阅读当前显示文本与该当前显示的文本相匹配,从而可以根据指定对象阅读当前所显示的文本的语速、节奏自动执行翻页,大大地提高演讲的流畅性,且该显示设备的显示方式及自动翻页的方式可以降低指定对象准备和执行演讲的难度。
附图说明
附图是用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明实施例,但并不构成对本发明实施例的限制。在附图中:
图1是说明本发明的一种文本的显示方法的流程图;
图2是图1中获取各页文本及各页文本的显示顺序的方法的流程图;
图3是图1中判断当前显示的文本是否满足预设的翻页条件的方法的流程图;以及
图4是说明本发明的一种提词器的模块连接框图。
附图标记说明
10 文本分析模块 11 文本获取子模块
12 顺序确定子模块 20 控制模块
21 音源获取子模块 22 语音识别子模块
23 翻页确定子模块
具体实施方式
以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
现阶段,在使用提词器时,需要人工来执行翻页,但是,人工在执行翻页过程中需要翻页人员保持高度集中的注意力,一旦出现翻页时机的不准确(包括是提前翻页又或是延后翻页),将严重影响使用者对于显示设备中各页文本的观看。现阶段并没有解决上述问题的技术方案。
基于此,需要设计一种可以自动翻页的文本显示的方法。下面结合实施例一和实施例二来具体说明。
实施例一
图1是实施例一的一种文本的显示方法的流程图,该流程图中具体描述了如何将文本进行显示。在本实施例中,为了便于理解,指定对象可以是演讲者,所显示的文本可以为演讲稿。
如图1所示,本发明提供一种文本的显示方法,该文本的显示方法包括:
S110,获取各页文本及各页文本的显示顺序。
其中,首先需要说明的是,获取各页文本及各页文本的显示顺序中的文本是预先可以获得的,即在演讲者演讲之前需要将该文本(即演讲稿)准备好,并以电子文档的形式进行保存,当然也可以是纸质文档,在该文本为纸质文档时,可以通过文字识别模块进行文字的识别,文字识别模块为较为常规的模块,其输入为纸质文档,输出为纸质文档中的文字。
具体的,图2为获取各页文本及各页文本的显示顺序的方法的流程图,其中包括了下述的具体步骤。
S111,获取待显示的文本的文本文字字数和/或文本文字段落。
其中,所述待显示的文本即为即将演讲的演讲稿,并通过现有的自动识别技术自动识别演讲稿的文字字数和/或文字的段落,在此可以根据演讲者的选择进行获取,其中所获取的文本文字字数和/或文本文字段落是用于后期的显示中使用的,获取的文本的内容不同,其最终获取的各页文本及各页文本的显示顺序也不同。
S112,确定各页文本的文本文字字数及各页文本的显示顺序。
对于该步骤S112,在一个优选的实施例中,如图2所示,可以基于预设的每页文本文字字数阈值及待显示的文本的文本文字字数来进行确定。
其中,当上述自行选择所获得的演讲的演讲稿的内容是文本文字字数,那么基于该文本文字字数及每页文本文字字数阈值来进行判断。以每页文本文字字数的阈值来对文本文字字数来进行划分,其中每页文本文字字数的阈值表明该页可最多显示该字数文本,多余的文本通过换页来进行显示,对每页执行上述的步骤,最终可以得到各页文本的文本文字字数及各页文本的显示顺序。
对于该步骤S112,在另一个优选的实施例中,如图2所示,可以基于预设的每页文本文字段落阈值及待显示的文本的文本文字段落,来进行确定。
其中,该步骤主要在上述使用者自行选择所获得的演讲的演讲稿的内容是文本文字段落时,基于每页文本文字段落阈值来对文本文字字数来进行划分,即每页仅仅可以显示预设段落的文字。超过的段落将自动划分至下一页来显示,其中,在该方式中,每页的结束一定是一个自然段,该方式适用于段落较多的情况下。
除此之外,本发明实施例实际还可以通过每页文本文字段落阈值及每页文本文字字数的阈值两者来综合考虑每页显示的情况,综合考虑的情况,为综合上述两种情况来进行考虑,在此不再赘述。
通过上述的实时方式,可以实现演讲稿的自动分页显示,其中,演讲者可以自行选择分页规则,其中,分页规则可以是按照字数来分页或是按照段落来分页,无论哪种分页方式,演讲者都可以根据自身需要来自行选择,该方式可以提高演讲者的体验感。
S120,按照所述各页文本的显示顺序,在用于显示所述各页文本的显示设备中,从首页文本开始,判断当前显示的文本是否满足预设的翻页条件,其中,所述翻页条件包括指定对象阅读该当前显示的文本而产生的待识别音源与该当前显示的文本相匹配。
图3是判断当前显示的文本是否满足预设的翻页条件的方法的流程图,其具体包括了下述的具体步骤。
S121,获取指定对象阅读该当前显示的文本而产生的待识别音源。
其中,获取待识别音源的方式可以通过拾音设备直接获取,其中拾音设备可以是麦克风,优选地,其为远场拾音麦克风或背景降噪处理的麦克风阵列,通过打开拾音设备,在演讲者进行演讲时,采集演讲者阅读该当前显示的文本的待识别音源,将该待识别音源实时进行识别,其识别方式主要为下述的步骤。
S122,识别出所述待识别音源中的文本,并获取所述待识别音源中的文本的文字和/或文字字数。
其中,可优选通过语音识别系统来识别待识别音源,该语音识别系统可以是现有的语音识别软件,其可以是讯飞提出的“讯飞听见软件”,该软件可以识别音频中的文字,通过上述的已知的语音识别系统可以识别出所采集的待识别音源中的文本的文字和/或文字字数,并可将音源转换成word或者是TXT文字。其中语音识别系统的输入为待识别音源,输出为待识别音源中的文本的文字和/或文字字数。其所采集的文本的文字和/或文字字数用于后续的匹配判断过程。另外,所识别的文字可以通过所述显示设备执行显示。
S123,在所述待识别音源中的文本的文字和/或文字字数与该当前显示的文本的文字和/或文字字数相匹配的情况下,确定该当前显示的文本满足预设的翻页条件。
其中,在该步骤中,待识别音源中的文本的文字和/或文字字数与该当前显示的文本的文字和/或文字字数相匹配包括了以下情况中的一种或多种:
A,所述待识别音源中的文本的文字字数与该当前显示的文本的文字字数相同。
B,所述待识别音源中的文本的文字与该当前显示的文本的文字相同。
C,所述待识别音源中的文本的文字及文字字数所占该当前显示的文本的文字及文字字数的比例均达到预设比例。
D,所述待识别音源中的文本的文字包含该当前显示的文本的所有文字。
其中,上述A,B,C,D的判断方式根据自行需要进行选择,其中选择可以通过预设按键供演讲者来选择,也可以通过提供的功能界面来实现选择。另外,所选择的方式需要与所获取的所述当前显示的文本相对应,在提供选择时即只提供与所获取的所述当前显示的文本相对应的选择界面或选择按键。
通过上述的实施方式,可以自动判断是否执行翻页,其中,利用所采集的阅读当前显示的文本的待识别音源,识别出该待识别音源中的文本文字和/或文字字数,将该文本文字和/或文字字数与当前显示的文本的文本文字和/或文字字数相比对,根据上述的比对结果(具体比较过程参见上述A-D的过程)实现了翻页的判断。
S130,在当前显示的文本满足所述翻页条件时,控制所述显示设备显示当前显示的文本的下一页文本。
其中,上述S130实际为根据预设的翻页条件,执行控制所述显示设备的翻页,翻页顺序按照上述已经获得的显示顺序。
通过上述的实施例一,可以实现通过获取各页文本的显示顺序来预先设定翻页的方向,并且根据预设的翻页条件来控制显示设备的翻页,其中,翻页条件可以选择设定。采用本实施例的方案,当演讲者阅读当前文本达到翻页条件(翻页调节如上所述可以自行设定)时,实行翻页操作,其中,自动翻页的方式可以自适应演讲者的语速、节奏,不需要人工来进行翻页,大大提高演讲的流畅性,另一方面,智能切换方式降低了演讲的难度。。
实施例二
图4为实施例二的模块框图,该模块框图表示了提词器的各模块组成及个模块之间的连接关系。
如图4所示,本发明提供一种提词器,该提词器包括:文本分析模块10,用于获取各页文本及各页文本的显示顺序;以及控制模块20,用于按照所述各页文本的显示顺序,在用于显示所述各页文本的显示设备中,从首页文本开始,判断当前显示的文本是否满足预设的翻页条件,若是,则控制所述显示设备显示当前显示的文本的下一页文本,其中,所述翻页条件包括指定对象阅读该当前显示的文本而产生的待识别音源与该当前显示的文本相匹配。
其中,所述显示设备包括增强现实技术设备;并且,该显示系统还可以包括增强现实技术眼镜,用于能够与所述增强现实技术设备相适配以查看所述增强现实技术设备显示的各页文本。
通过上述的实施方式,用户戴上该增强现实技术眼镜,可以直接查看到与其相适配的显示设备上显示的文字,最终可以实现查看各页文本的内容,从而提高了用户的体验。
优选地,所述文本分析模块10还用于获取所述当前显示的文本的文字和/或当前显示的文本的文字字数;并且,所述控制模块20包括:音源获取子模块21,用于获取指定对象阅读该当前显示的文本而产生的待识别音源;语音识别子模块22,用于识别出所述待识别音源中的文本,并获取所述待识别音源中的文本的文字和/或文字字数;以及翻页确定子模块23,用于在所述待识别音源中的文字和/或文字字数与该当前显示的文字和/或文字字数相匹配的情况下,确定该当前显示的文本满足预设的翻页条件。
优选地,所述待识别音源中的文字和/或文字字数与该当前显示的文字和/或文字字数相匹配的情况包括以下至少之一者:所述待识别音源中的文本的文字字数与该当前显示的文本的文字字数相同;所述待识别音源中的文本的文字与该当前显示的文本的文字相同;所述待识别音源中的文本的文字及文字字数所占该当前显示的文本的文字及文字字数的比例均达到预设比例;所述待识别音源中的文本的文字包含该当前显示的文本的所有文字。
优选地,所述文本分析模块10包括:文本获取子模块11,用于获取待显示的文本的文本文字字数和/或文本文字段落;顺序确定子模块12,用于基于预设的每页文本文字字数阈值及待显示的文本的文本文字字数,确定各页文本的文本文字字数及各页文本的显示顺序;和/或用于基于预设的每页文本文字段落阈值及待显示的文本的文本文字段落,确定各页文本的文本文字段落及各页文本的显示顺序。
本实施例二中的提词器相对于现有技术具有与上述文本的显示方法相同的有益效果,在此不再赘述。
实施例三
实施例三为一种提词系统。
所述提词系统可以包括:提词器,其中,所述提词器中的显示设备被配置采用增强现实显示技术显示所述各页文本。
其中,本实施例三中的提词器的主要用于控制显示设备实现各页文本的显示,且实施例三中的提词器也可以提供给演讲者来使用,并能根据演讲者的演讲速度、内容等数据实现自动翻页,本实施例三中的提词器结构可与实施例二中的提词器相同。
另外,为了使得演讲者可以看清显示设备采用增强现实显示技术显示的所述各页文本,特别设计了可以架设于演讲者眼睛前方的增强现实技术眼镜,演讲者戴上该增强现实技术眼镜后能够看到所述显示设备所显示的各页文本。通过本发明的上述实施例,可以实现提词的作用,并能给出更好的显示各页文本,增加演讲者体验,更便于演讲者的使用。
其中,所述提词器和所述增强现实技术眼镜需要相配合才能观看到显示设备上显示的当前显示文本。
本发明实施例中,所述提词器及提词系统可以包括处理器和存储器,文本分析模块10、控制模块20等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来满足演讲者根据阅读该当前显示的文本的情况来控制显示设备的翻页。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例还提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现文本的显示方法,如实施例一的文本显示方法。
本发明实施例还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行文本的显示方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种文本的显示方法,其特征在于,该文本的显示方法包括:
获取各页文本及各页文本的显示顺序;
按照所述各页文本的显示顺序,在用于显示所述各页文本的显示设备中,从首页文本开始,判断当前显示的文本是否满足预设的翻页条件,其中,所述翻页条件包括指定对象阅读该当前显示的文本而产生的待识别音源与该当前显示的文本相匹配;以及
在当前显示的文本满足所述翻页条件时,控制所述显示设备显示当前显示的文本的下一页文本。
2.根据权利要求1所述的显示方法,其特征在于,该显示方法还包括:
获取所述当前显示的文本的文字和/或当前显示的文本的文字字数;
并且,所述判断当前显示的文本是否满足预设的翻页条件包括:
获取指定对象阅读该当前显示的文本而产生的待识别音源;
识别出所述待识别音源中的文本,并获取所述待识别音源中的文本的文字和/或文字字数;以及
在所述待识别音源中的文本的文字和/或文字字数与该当前显示的文本的文字和/或文字字数相匹配的情况下,确定该当前显示的文本满足预设的翻页条件。
3.根据权利要求2所述的显示方法,其特征在于,所述待识别音源中的文本的文字和/或文字字数与该当前显示的文本的文字和/或文字字数相匹配包括以下至少之一者:
所述待识别音源中的文本的文字字数与该当前显示的文本的文字字数相同;
所述待识别音源中的文本的文字与该当前显示的文本的文字相同;
所述待识别音源中的文本的文字及文字字数所占该当前显示的文本的文字及文字字数的比例均达到预设比例;
所述待识别音源中的文本的文字包含该当前显示的文本的所有文字。
4.根据权利要求1-3中任意一项所述的显示方法,其特征在于,所述获取各页文本及各页文本的显示顺序包括:
获取待显示的文本的文本文字字数和/或文本文字段落;
基于预设的每页文本文字字数阈值及待显示的文本的文本文字字数,确定各页文本的文本文字字数及各页文本的显示顺序;和/或
基于预设的每页文本文字段落阈值及待显示的文本的文本文字段落,确定各页文本的文本文字段落及各页文本的显示顺序。
5.一种提词器,其特征在于,该提词器包括:
文本分析模块,用于获取各页文本及各页文本的显示顺序;以及
控制模块,用于按照所述各页文本的显示顺序,在用于显示所述各页文本的显示设备中,从首页文本开始,判断当前显示的文本是否满足预设的翻页条件,若是,则控制所述显示设备显示当前显示的文本的下一页文本,其中,所述翻页条件包括指定对象阅读该当前显示的文本而产生的待识别音源与该当前显示的文本相匹配。
6.根据权利要求5所述的提词器,其特征在于,所述文本分析模块还用于获取所述当前显示的文本的文字和/或当前显示的文本的文字字数;
并且,所述控制模块包括:
音源获取子模块,用于获取指定对象阅读该当前显示的文本而产生的待识别音源;
语音识别子模块,用于识别出所述待识别音源中的文本,并获取所述待识别音源中的文本的文字和/或文字字数;以及
翻页确定子模块,用于在所述待识别音源中的文字和/或文字字数与该当前显示的文字和/或文字字数相匹配的情况下,确定该当前显示的文本满足预设的翻页条件,并控制所述显示设备显示当前显示的文本的下一页文本。
7.根据权利要求6所述的提词器,其特征在于,所述待识别音源中的文字和/或文字字数与该当前显示的文字和/或文字字数相匹配的情况包括以下至少之一者:
所述待识别音源中的文本的文字字数与该当前显示的文本的文字字数相同;
所述待识别音源中的文本的文字与该当前显示的文本的文字相同;
所述待识别音源中的文本的文字及文字字数所占该当前显示的文本的文字及文字字数的比例均达到预设比例;
所述待识别音源中的文本的文字包含该当前显示的文本的所有文字。
8.根据权利要求5-7中任意一项所述的提词器,其特征在于,所述文本分析模块包括:
文本获取子模块,用于获取待显示的文本的文本文字字数和/或文本文字段落;
顺序确定子模块,用于基于预设的每页文本文字字数阈值及待显示的文本的文本文字字数,确定各页文本的文本文字字数及各页文本的显示顺序;和/或用于基于预设的每页文本文字段落阈值及待显示的文本的文本文字段落,确定各页文本的文本文字段落及各页文本的显示顺序。
9.一种提词系统,其特征在于,该提词系统包括:
根据权利要求5-8中任意一项所述的提词器,其中,所述提词器中的显示设备被配置采用增强现实显示技术显示所述各页文本;以及
增强现实技术眼镜,能够置于指定对象的眼睛的前方,用于与所述增强现实技术设备相适配,使得所述指定对象能够查看到所述显示设备所显示的各页文本。
10.一种机器可读存储介质,该机器可读存储介质上存储有指令,该指令用于使得机器执行权利要求1-4中任一项所述的文本的显示方法。
CN201910824563.5A 2019-09-02 2019-09-02 文本的显示方法、提词器及提词系统 Pending CN111259135A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910824563.5A CN111259135A (zh) 2019-09-02 2019-09-02 文本的显示方法、提词器及提词系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910824563.5A CN111259135A (zh) 2019-09-02 2019-09-02 文本的显示方法、提词器及提词系统

Publications (1)

Publication Number Publication Date
CN111259135A true CN111259135A (zh) 2020-06-09

Family

ID=70944974

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910824563.5A Pending CN111259135A (zh) 2019-09-02 2019-09-02 文本的显示方法、提词器及提词系统

Country Status (1)

Country Link
CN (1) CN111259135A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022110063A1 (zh) * 2020-11-27 2022-06-02 京东方科技集团股份有限公司 一种提词系统及操作方法
CN114690891A (zh) * 2020-12-31 2022-07-01 Oppo广东移动通信有限公司 一种内容显示方法、装置及计算机可读存储介质
CN114999475A (zh) * 2022-05-20 2022-09-02 苏州萝卜电子科技有限公司 智能提词方法及装置
WO2023030121A1 (zh) * 2021-08-31 2023-03-09 北京字跳网络技术有限公司 数据处理方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1503160A (zh) * 2002-11-20 2004-06-09 英业达股份有限公司 计算机可执行的电子书阅读界面的自动排版方法
CN102036051A (zh) * 2010-12-20 2011-04-27 华为终端有限公司 实现视频会议中提词的方法以及装置
CN105142498A (zh) * 2013-03-15 2015-12-09 感知技术有限公司 增强光学和感知数字护目镜
CN109446351A (zh) * 2018-09-19 2019-03-08 北京文香信息技术有限公司 一种控制ppt自动翻页的方法
CN110164442A (zh) * 2019-06-21 2019-08-23 上海乂学教育科技有限公司 基于语音识别的声控提词器系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1503160A (zh) * 2002-11-20 2004-06-09 英业达股份有限公司 计算机可执行的电子书阅读界面的自动排版方法
CN102036051A (zh) * 2010-12-20 2011-04-27 华为终端有限公司 实现视频会议中提词的方法以及装置
CN105142498A (zh) * 2013-03-15 2015-12-09 感知技术有限公司 增强光学和感知数字护目镜
CN109446351A (zh) * 2018-09-19 2019-03-08 北京文香信息技术有限公司 一种控制ppt自动翻页的方法
CN110164442A (zh) * 2019-06-21 2019-08-23 上海乂学教育科技有限公司 基于语音识别的声控提词器系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022110063A1 (zh) * 2020-11-27 2022-06-02 京东方科技集团股份有限公司 一种提词系统及操作方法
CN114690891A (zh) * 2020-12-31 2022-07-01 Oppo广东移动通信有限公司 一种内容显示方法、装置及计算机可读存储介质
WO2023030121A1 (zh) * 2021-08-31 2023-03-09 北京字跳网络技术有限公司 数据处理方法、装置、电子设备及存储介质
CN114999475A (zh) * 2022-05-20 2022-09-02 苏州萝卜电子科技有限公司 智能提词方法及装置

Similar Documents

Publication Publication Date Title
CN111259135A (zh) 文本的显示方法、提词器及提词系统
CN107369462B (zh) 电子书语音播放方法、装置及终端设备
US9667860B2 (en) Photo composition and position guidance in a camera or augmented reality system
US10581625B1 (en) Automatically altering the audio of an object during video conferences
CN110473525B (zh) 获取语音训练样本的方法和装置
US11972759B2 (en) Audio mistranscription mitigation
US20160275952A1 (en) Communicating metadata that identifies a current speaker
CN108419141B (zh) 一种字幕位置调整的方法、装置、存储介质及电子设备
CN105843572B (zh) 一种信息处理方法及可形变的电子设备
US11122198B2 (en) Adjusting image capture parameters via machine learning
CN104683852B (zh) 处理广播信息的方法和设备
CN111416986B (zh) 一种码率确定方法、装置、存储介质及电子设备
CN105960801B (zh) 增强视频会议
US20190155617A1 (en) Automated setting customization using real-time user data
CN111292734A (zh) 一种语音交互方法和装置
US11474773B2 (en) Automatic adjustment of muted response setting
CN111079423A (zh) 一种听写报读音频的生成方法、电子设备及存储介质
CN111382241A (zh) 会话场景切换方法及装置
US20170322766A1 (en) Method and electronic unit for adjusting playback speed of media files
CN112837674B (zh) 语音识别方法、装置及相关系统和设备
US10984800B2 (en) Personal assistant device responses based on group presence
EP3503090A1 (en) Speech processing device and method
CN106157969B (zh) 一种语音识别结果的筛选方法及装置
Murphy et al. Adaptive time windows for real-time crowd captioning
CN112837688A (zh) 语音转写方法、装置、相关系统及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200609