CN115629894B - 演讲提示方法及相关装置 - Google Patents
演讲提示方法及相关装置 Download PDFInfo
- Publication number
- CN115629894B CN115629894B CN202211646038.7A CN202211646038A CN115629894B CN 115629894 B CN115629894 B CN 115629894B CN 202211646038 A CN202211646038 A CN 202211646038A CN 115629894 B CN115629894 B CN 115629894B
- Authority
- CN
- China
- Prior art keywords
- speech
- detection period
- content
- prompt
- earphone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000001514 detection method Methods 0.000 claims abstract description 242
- 238000012545 processing Methods 0.000 claims abstract description 26
- 230000015654 memory Effects 0.000 claims description 24
- 238000004891 communication Methods 0.000 claims description 20
- 238000004088 simulation Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 230000000737 periodic effect Effects 0.000 claims 5
- 230000009286 beneficial effect Effects 0.000 abstract 1
- 230000003993 interaction Effects 0.000 description 26
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 230000008859 change Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 235000019800 disodium phosphate Nutrition 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/54—Interprogram communication
- G06F9/542—Event management; Broadcasting; Multicasting; Notifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/54—Interprogram communication
- G06F9/546—Message passing systems or structures, e.g. queues
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/10—Earpieces; Attachments therefor ; Earphones; Monophonic headphones
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请实施例公开了一种演讲提示方法及相关装置,所述方法包括:确定演讲者待讲解的演讲稿,并创建对应的演讲提示检测周期序列,演讲提示检测周期序列包括多个演讲提示检测周期和与每个演讲提示检测周期对应的最大允许停顿时长;在多个演讲提示检测周期中的每个演讲提示检测周期执行如下操作:在当前处理的周期的最大允许停顿时长的时间约束范围内,检测是否接收到来自耳机的用户实际演讲语句;若接收到,则解析用户实际演讲语句得到语义文本,并比对语义文本和与当前处理的周期对应的演讲提示内容是否相同;若不相同或者若未接收到,则向耳机发送演讲提示消息。本申请有利于提高演讲者演讲内容的准确性,进而提高演讲者的演讲质量和观众感官。
Description
技术领域
本申请涉及互联网产业的一般数据处理技术领域,具体涉及一种演讲提示方法及相关装置。
背景技术
演讲者在演讲过程中可能会出现忘词或者偏离主题等问题,相关技术中都是采用提词器显示演讲稿来提示演讲者,然而使用提词器会让演讲者时常盯着提词器的位置,容易影响演讲者的演讲质量、以及观众感官。
发明内容
本申请实施例提供了一种演讲提示方法及相关装置,以期通过耳机向演讲者进行提示,并提高演讲者演讲内容的准确性。
第一方面,本申请实施例提供了一种演讲提示方法,应用于演讲提示系统中的服务器,所述演讲提示系统包括所述服务器、终端设备、以及耳机,所述耳机和所述终端设备均与所述服务器通信连接,所述方法包括:
确定演讲者待讲解的演讲稿;
根据所述演讲稿的文本内容创建演讲提示检测周期序列,所述演讲提示检测周期序列包括多个演讲提示检测周期和与每个演讲提示检测周期对应的最大允许停顿时长,所述多个演讲提示检测周期为与所述文本内容的多个原始语句一一对应的演讲提示检测周期,单个演讲提示检测周期的时长与对应的原始语句的长度呈正关联关系;
在所述多个演讲提示检测周期中的每个演讲提示检测周期执行如下操作:
在当前处理的演讲提示检测周期的最大允许停顿时长的时间约束范围内,检测是否接收到来自所述耳机的用户实际演讲语句,所述用户实际演讲语句为采集到的演讲者输出的语句;
若是,则解析所述用户实际演讲语句,得到语义文本,并比对所述语义文本的内容和与当前处理的演讲提示检测周期对应的演讲提示内容是否相同,所述演讲提示内容为在当前处理的演讲提示检测周期内演讲者应当讲述的内容;
若相同,则继续检测在下一个处理的演讲提示检测周期的最大允许停顿时长的时间约束范围内,是否接收到来自所述耳机的用户实际演讲语句;
若不相同,则向所述耳机发送演讲提示消息,所述演讲提示消息用于指示所述耳机播放与当前处理的演讲提示检测周期对应的所述演讲提示内容;
若否,则向所述耳机发送所述演讲提示消息。
第二方面,本申请实施例提供了一种演讲提示装置,应用于演讲提示系统中的服务器,所述演讲提示系统包括所述服务器、终端设备、以及耳机,所述耳机和所述终端设备均与所述服务器通信连接,所述装置包括:
确定单元,用于确定演讲者待讲解的演讲稿;
创建单元,用于根据所述演讲稿的文本内容创建演讲提示检测周期序列,所述演讲提示检测周期序列包括多个演讲提示检测周期和与每个演讲提示检测周期对应的最大允许停顿时长,所述多个演讲提示检测周期为与所述文本内容的多个原始语句一一对应的演讲提示检测周期,单个演讲提示检测周期的时长与对应的原始语句的长度呈正关联关系;
处理单元,用于在所述多个演讲提示检测周期中的每个演讲提示检测周期执行如下操作:
在当前处理的演讲提示检测周期的最大允许停顿时长的时间约束范围内,检测是否接收到来自所述耳机的用户实际演讲语句,所述用户实际演讲语句为采集到的演讲者输出的语句;
若是,则解析所述用户实际演讲语句,得到语义文本,并比对所述语义文本的内容和与当前处理的演讲提示检测周期对应的演讲提示内容是否相同,所述演讲提示内容为在当前处理的演讲提示检测周期内演讲者应当讲述的内容;
若相同,则继续检测在下一个处理的演讲提示检测周期的最大允许停顿时长的时间约束范围内,是否接收到来自所述耳机的用户实际演讲语句;
若不相同,则向所述耳机发送演讲提示消息,所述演讲提示消息用于指示所述耳机播放与当前处理的演讲提示检测周期对应的所述演讲提示内容;
若否,则向所述耳机发送所述演讲提示消息。
第三方面,本申请实施例提供了一种服务器,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行本申请实施例第一方面中的步骤的指令。
第四方面,本申请实施例提供了一种计算机存储介质,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如本实施例第一方面中所描述的部分或全部步骤。
可以看出,本实施例中,服务器先确定演讲者待讲解的演讲稿;然后根据演讲稿的文本内容创建演讲提示检测周期序列,演讲提示检测周期序列包括多个演讲提示检测周期和与每个演讲提示检测周期对应的最大允许停顿时长,多个演讲提示检测周期为与文本内容的多个原始语句一一对应的演讲提示检测周期,单个演讲提示检测周期的时长与对应的原始语句的长度呈正关联关系;之后再在多个演讲提示检测周期中的每个演讲提示检测周期执行如下操作:在当前处理的演讲提示检测周期的最大允许停顿时长的时间约束范围内,检测是否接收到来自耳机的用户实际演讲语句,用户实际演讲语句为采集到的演讲者输出的语句;若接收到,则解析用户实际演讲语句,得到语义文本,并比对语义文本的内容和与当前处理的演讲提示检测周期对应的演讲提示内容是否相同,演讲提示内容为在当前处理的演讲提示检测周期内演讲者应当讲述的内容;若相同,则继续检测在下一个处理的演讲提示检测周期的最大允许停顿时长的时间约束范围内,是否接收到来自耳机的用户实际演讲语句;若不相同,则向耳机发送演讲提示消息,演讲提示消息用于指示耳机播放与当前处理的演讲提示检测周期对应的演讲提示内容;若未接收到,则向耳机发送演讲提示消息。可见,本申请中,演讲提示系统能够更具针对性地对演讲者的演讲情况适配合适的数据处理方式,并能够提高在单个演讲提示检测周期内的数据处理环节中对用户实际演讲语句进行识别的准确度,从而提高演讲者的现场演讲内容与预设置的待演讲的演讲稿的内容匹配的准确度,进而更精确地通过耳机向演讲者进行提示,如此可以增强演讲者的演讲质量和观众体验感。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是本申请实施例提供的一种演讲提示系统的架构示意图;
图1b是本申请实施例提供的一种服务器的组成示例图;
图2是本申请实施例提供的一种演讲提示方法的流程示意图;
图3a是本申请实施例提供的演讲提示系统中终端设备的一种界面显示图;
图3b是本申请实施例提供的演讲提示系统中终端设备的另一种界面显示图;
图3c是本申请实施例提供的演讲提示系统中终端设备的再一种界面显示图;
图3d是本申请实施例提供的演讲提示系统中终端设备的又一种界面显示图;
图4a是本申请实施例提供的一种演讲提示装置的功能单元组成框图;
图4b是本申请实施例提供的另一种演讲提示装置的功能单元组成框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面结合附图对本申请实施例进行说明。
本申请的技术方案可以应用于如图1a所示的演讲提示系统,该演讲提示系统包括服务器100、终端设备200、以及耳机300,耳机和终端设备均与服务器通信连接。
本申请中的电子设备的组成结构可以如图1b所示,电子设备可以为服务器、终端设备、或者耳机,电子设备可以包括处理器110、存储器120、通信接口130以及一个或多个程序121,其中,所述一个或多个程序121被存储在上述存储器120中,且被配置由上述处理器110执行,所述一个或多个程序121包括用于执行上述方法实施例中任一步骤的指令。
其中,通信接口130用于支持服务器100与其他设备的通信。处理器110例如可以是中央处理器(CentralProcessingUnit,CPU),通用处理器,数字信号处理器(DigitalSignalProcessor,DSP),专用集成电路(Application-SpecificIntegratedCircuit,ASIC),现场可编程门阵列(FieldProgrammableGateArray,FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请实施例公开内容所描述的各种示例性的逻辑方框,单元和电路。所述处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等等。
存储器120可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-onlymemory,ROM)、可编程只读存储器(programmableROM,PROM)、可擦除可编程只读存储器(erasablePROM,EPROM)、电可擦除可编程只读存储器(electricallyEPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(randomaccessmemory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的随机存取存储器(randomaccessmemory,RAM)可用,例如静态随机存取存储器(staticRAM,SRAM)、动态随机存取存储器(DRAM)、同步动态随机存取存储器(synchronousDRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(doubledatarateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(enhancedSDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlinkDRAM,SLDRAM)和直接内存总线随机存取存储器(directrambusRAM,DRRAM)。
具体实现中,所述处理器110用于执行下述方法实施例中由服务器100、终端设备200、或者耳机300执行的任一步骤,且在执行诸如发送等数据传输时,可选择的调用所述通信接口130来完成相应操作。
需要注意的是,上述电子设备的结构示意图仅为示例,具体包含的器件可以更多或更少,此处不做唯一限定。
请参阅图2,图2是本申请实施例提供的一种演讲提示方法的流程示意图,该方法可以应用在如图1a所示的演讲提示系统中的服务器100,如图2所示,该演讲提示方法包括:
S210,确定演讲者待讲解的演讲稿。
其中,演讲稿是由演讲者本人或者其他工作人员(以下统称为用户)通过终端设备上传至服务器的内容,该演讲稿记录了演讲者将要进行演讲的文本内容。
具体实现中,服务器可以向终端设备提供应用服务,终端设备可以通过该应用服务上传上述演讲稿至服务器。参见图3a,终端设备使用该应用服务时,终端设备可以显示如图3a所示的界面显示图,使用该终端设备的用户可以针对图3a中的“上传演讲稿”组件执行选取操作,从而从终端设备的存储空间内选取待上传的演讲稿,然后再在对图3a中的“确认”组件执行选取操作后,将选取的待上传的演讲稿上传至服务器。
S220,根据所述演讲稿的文本内容创建演讲提示检测周期序列,所述演讲提示检测周期序列包括多个演讲提示检测周期和与每个演讲提示检测周期对应的最大允许停顿时长,所述多个演讲提示检测周期为与所述文本内容的多个原始语句一一对应的演讲提示检测周期,单个演讲提示检测周期的时长与对应的原始语句的长度呈正关联关系。
其中,演讲稿的文本内容包括多个原始语句。 每个原始语句对应文本内容中的一句话。原始语句的长度可以理解为原始语句中的文字个数。
其中,最大允许停顿时长用于表征相邻两个原始语句之间的间隔时长。
具体实现中,每个演讲提示检测周期对应的最大允许停顿时长通常位于演讲提示检测周期序列中该演讲提示检测周期之前。示例性的,若相邻两个演讲提示检测周期分别为第一周期和第二周期,两者分别对应的最大允许停顿时长为第一时长和第二时长,该相邻两个演讲提示检测周期和与其对应的最大允许停顿时长在演讲提示检测周期序列中的排列顺序可以为:第一时长、第一周期、第二时长、第二周期。或者,每个演讲提示检测周期序列对应的最大允许停顿时长可以位于演讲提示检测周期序列中该演讲提示检测周期序列之后。示例性的,若相邻两个演讲提示检测周期分别为第一周期和第二周期,两者分别对应的最大允许停顿时长为第一时长和第二时长,该相邻两个演讲提示检测周期和与其对应的最大允许停顿时长在演讲提示检测周期序列中的排列顺序可以为:第一周期、第一时长、第二周期、第二时长。
在所述多个演讲提示检测周期中的每个演讲提示检测周期执行如下操作(即步骤S230至S270所执行的操作)。
S230,在当前处理的演讲提示检测周期的最大允许停顿时长的时间约束范围内,检测是否接收到来自所述耳机的用户实际演讲语句,所述用户实际演讲语句为采集到的演讲者输出的语句。
具体实现中,演讲者在演讲过程中,可以佩戴耳机,以使耳机能够采集到演讲者输出的语句,并将该语句传输至服务器。具体地,耳机可以在演讲者讲述完一句话之后再将该句话传输至服务器,以便于服务器执行步骤S240,并提高步骤S240中比对的结果的准确性。或者,耳机可以对演讲者讲述的内容进行实时传输,从而提高提示的及时性。
S240,若接收到,则解析所述用户实际演讲语句,得到语义文本,并比对所述语义文本的内容和与当前处理的演讲提示检测周期对应的演讲提示内容是否相同,所述演讲提示内容为在当前处理的演讲提示检测周期内演讲者应当讲述的内容。
其中,演讲提示内容可以为当前处理的演讲提示检测周期对应的原始语句的内容。
具体实现中,服务器解析用户实际演讲语句得到的语义文本的内容可以是用户实际演讲语句的文字翻译内容,或者可以是用户实际演讲语句的语义内容,服务器在比对语义文本的内容和与当前处理的演讲提示检测周期对应的演讲提示内容是否相同时,可以比对语义文本和提示内容的文字内容是否相同,以提高比对结果的准确性。或者,可以比对语义文本和提示内容的语义内容是否相同,以提高实用性。
S250,若相同,则继续检测在下一个处理的演讲提示检测周期的最大允许停顿时长的时间约束范围内,是否接收到来自所述耳机的用户实际演讲语句。
具体实现中,若解析用户实际演讲语句得到的语义文本和当前处理的演讲提示检测周期对应的演讲提示内容相同,则可以判定演讲者在当前处理的演讲提示检测周期内讲述的内容准确,此时,服务器无需向耳机发送演讲提示消息,可以继续对演讲者的演讲过程进行监测,即可以继续对下一个待处理的演讲提示检测周期执行步骤S230至S270。
S260,若不相同,则向所述耳机发送演讲提示消息,所述演讲提示消息用于指示所述耳机播放与当前处理的演讲提示检测周期对应的所述演讲提示内容。
具体实现中,若服务器解析用户实际演讲语句得到的语义文本和当前处理的演讲提示检测周期对应的演讲提示内容不相同,则可以判定演讲者讲述内容出现错误,此时服务器可以向耳机发送演讲提示消息,以指示耳机播放演讲提示内容,从而提示演讲者以使演讲者继续完成演讲。
S270,若未接收到,则向所述耳机发送所述演讲提示消息。
具体实现中,若在当前处理的演讲提示检测周期的最大允许停顿时长的时间约束范围内,服务器未接收到来自耳机的用户实时演讲语句,则可以判定用户出现了忘词的情况,此时服务器可以向耳机发送演讲提示消息,以指示耳机播放演讲提示内容,从而提示演讲者以使演讲者继续完成演讲。
在执行上述步骤S230至S270时,服务器若向耳机发送了演讲提示消息,则可以在演讲提示检测周期序列中增添一个提示周期和与该提示周期对应的最大允许停顿时长,该提示周期位于当前处理的演讲提示检测周期和下一个待处理的演讲提示检测周期之间。在演讲提示消息发送后监测过程中,若在添加的提示周期的最大允许停顿时长的时间约束范围内未接收到新的用户实时演讲语句,则再向耳机发送上述演讲提示消息。若在添加的提示周期的最大允许停顿时长的时间约束范围内接收到了新的用户实时演讲语句,则将解析该新的用户实时演讲语句得到的语义文本和当前处理的演讲提示检测周期对应的提示内容进行比对,若相同,则继续对下一个待处理的演讲提示检测周期执行步骤S230至S270。若不相同,但是与下一个待处理的演讲提示检测周期对应的提示内容相同,则继续对下一个待处理的演讲提示检测周期的后一个演讲提示检测周期执行步骤S230至S270。若新的用户实时演讲语句对应的语义文本和当前处理的演讲提示检测周期对应的提示内容不相同,且与下一个待处理的演讲提示检测周期对应的提示内容也不相同,服务器则可向耳机再次发送上述演讲提示消息,该演讲提示消息用于指示耳机播放与当前处理的演讲提示检测周期对应的演讲提示内容。
可以看出,本实施例中,服务器先确定演讲者待讲解的演讲稿;然后根据演讲稿的文本内容创建演讲提示检测周期序列,演讲提示检测周期序列包括多个演讲提示检测周期和与每个演讲提示检测周期对应的最大允许停顿时长,多个演讲提示检测周期为与文本内容的多个原始语句一一对应的演讲提示检测周期,单个演讲提示检测周期的时长与对应的原始语句的长度呈正关联关系;之后再在多个演讲提示检测周期中的每个演讲提示检测周期执行如下操作:在当前处理的演讲提示检测周期的最大允许停顿时长的时间约束范围内,检测是否接收到来自耳机的用户实际演讲语句,用户实际演讲语句为采集到的演讲者输出的语句;若接收到,则解析用户实际演讲语句,得到语义文本,并比对语义文本的内容和与当前处理的演讲提示检测周期对应的演讲提示内容是否相同,演讲提示内容为在当前处理的演讲提示检测周期内演讲者应当讲述的内容;若相同,则继续检测在下一个处理的演讲提示检测周期的最大允许停顿时长的时间约束范围内,是否接收到来自耳机的用户实际演讲语句;若不相同,则向耳机发送演讲提示消息,演讲提示消息用于指示耳机播放与当前处理的演讲提示检测周期对应的演讲提示内容;若未接收到,则向耳机发送演讲提示消息。可见,本申请中,演讲提示系统能够更具针对性地对演讲者的演讲情况适配合适的数据处理方式,并能够提高在单个演讲提示检测周期内的数据处理环节中对用户实际演讲语句进行识别的准确度,从而提高演讲者的现场演讲内容与预设置的待演讲的演讲稿的内容匹配的准确度,进而更精确地通过耳机向演讲者进行提示,如此可以增强演讲者的演讲质量和观众体验感。
在一个可能的示例中,所述文本内容包括多个段落内容,多个所述段落内容中的每个所述段落内容包括至少一个所述原始语句;所述根据所述演讲稿的文本内容创建演讲提示检测周期序列,包括:根据所述文本内容,确定多个所述演讲提示检测周期;接收来自终端设备的配置信息,所述配置信息包括用户针对所述段落内容中的第一个所述原始语句的预设互动情况的内容,所述预设互动情况包括观众掌声、交流互动、文本演示;根据所述配置信息,为所述段落内容中的第一个所述原始语句对应的所述演讲提示检测周期配置对应的最大允许停顿时长。
其中,针对段落内容中的第一个所述原始语句的预设互动情况是指在该段落内容开始前的预设互动情况。
具体实现中,服务器可以预存有语句长度和周期时长的对应关系。当服务器确定演讲稿的文本内容后,可以先根据文本内容中原始语句的个数划分为对应个数个演讲提示检测周期。然后再根据语句长度和周期时长的对应关系、以及每个演讲提示检测周期的语句长度确定每个演讲提示检测周期的时长。具体地,一个字可以对应一个第一预设时长,语句长度为语句中的字数个数,语句长度和周期时长的对应关系为:周期时长等于语句中字数的个数个第一预设时长之和。示例性的,若一个字对应的第一预设时长为1秒,演讲提示检测周期对应原始语句的字数为5个,那么演讲提示检测周期的时长为5s。
具体实现中,用户可以通过终端设备设置针对段落内容的配置内容,并将携带该配置内容的配置信息发送至服务器,从而使服务器能够根据该配置内容配置与段落内容中的第一个原始语句对应的演讲提示检测周期所对应的最大允许停顿时长。具体地,终端设备可以通过如图3c所示的界面显示图执行针对段落内容中的第一个原始语句的预设互动情况的确认操作。示例性的,当需要添加针对段落内容中的第一个原始语句的互动情况时,可以通过长按、点触等方式选中该原始语句,以在终端设备的显示界面中弹出选择框,用户可以选取选择框提供的任意一个选项作为该原始语句的预设互动情况,并将携带该预设互动情况的配置信息发送至服务器,服务器可以匹配与该预设互动情况对应的第二预设时长作为与该原始语句对应的演讲提示检测周期所对应的最大允许停顿时长。
可见,在本示例中,服务器可以根据终端设备上传的配置信息,为所述段落内容中的第一个原始语句对应的演讲提示检测周期配置对应的最大允许停顿时长,如此可以增强服务器配置最大允许停顿时长的灵活性,并可使创建的演讲提示检测周期序列更符合实际演讲场景。
在一个可能的示例中,所述根据所述演讲稿的文本内容创建演讲提示检测周期序列,还包括:若所述段落内容包括多个所述原始语句,将所述段落内容中除第一个所述原始语句外的所有所述原始语句对应的所述演讲提示检测周期所对应的最大允许停顿时长配置为预设数值。
具体实现中,预设数值可以为服务器预存的第三预设时长。当服务器根据演讲稿的文本内容确定多个演讲提示检测周期,可以确定多个演讲提示检测周期中未对应段落内容中第一个原始语句的演讲提示检测周期,并将这些演讲提示检测周期对应的最大允许停顿时长配置为该第三预设时长。
可见,在本示例中,服务器通过预先存储第三预设时长,可以在接收到演讲稿后为段落内容中除第一个原始语句外的所有原始语句配置最大允许停顿时长配置,如此,可以提高段落内容中除第一个原始语句外的原始语句对应的最大允许停顿时长的配置效率,提高最大允许停顿时长设置的便捷性。
在一个可能的示例中,所述根据所述演讲稿的文本内容创建演讲提示检测周期序列,包括:获取演讲模拟音频数据;解析所述演讲模拟音频数据,得到解析结果,所述解析结果包括文本信息和与所述文本信息中各个语句对应的模拟停顿时长;比对所述文本信息和所述文本内容,并根据与所述文本信息中各个语句对应的所述模拟停顿时长,为各个所述演讲提示检测周期配置对应的所述模拟停顿时长,所述演讲提示检测周期配置的所述模拟停顿时长为所述演讲提示检测周期的最大允许停顿时长。
其中,模拟音频数据为演讲者进行模拟演讲训练所录制的音频数据,该模拟音频数据包括演讲者模仿实际场景演讲时所讲述的内容。
具体实现中,服务器解析模拟音频数据得到解析结果后,会根据文本信息中各个语句的语句内容在演讲稿的文本内容中匹配对应的原始语句,并将与文本信息的语句对应的模拟停顿时长确定为该原始语句对应的演讲提示检测周期所对应的最大允许停顿时长。
示例性的,用户在上传演讲稿之后,终端设备的显示界面会更新为图3b,若用户使用服务器预存的参数配置与各个演讲提示检测周期对应的最大允许停顿时长,则可点击“跳过”按钮,此时,服务器会采用上述实施例所述方式进行配置。若用户要根据模拟音频配置与各个演讲提示检测周期对应的最大允许停顿时长,终端设备则可参见图3b的内容上传模拟音频数据。具体地,服务器提供的应用服务提供了两种模拟音频上传方式,一种为预先存储的音频,另一种为实时录制上传。示例性的,参见图3b,若要上传预先存储的音频,则可点击“上传音频”按钮,以从终端设备的存储空间内选取与演讲稿对应的模拟音频,并在选择完成后确认上传。若要实时录制上传,则可点击“开始录制”按钮,以录制模拟音频数据,并在录制完成后确认上传。
可见,在本示例中,服务器还可以通过模拟音频数据的解析结果确定演讲提示检测周期的最大允许时长可以进一步提高最大允许停顿时长设置的灵活性,并且,如此配置的最大允许停顿时长更符合演讲者的讲述习惯,服务器能够更精准的检测到演讲中出现的问题,并向耳机发送演讲提示消息。
在一个可能的示例中,所述解析结果还包括与所述文本信息中各个语句对应的语句讲解时长;所述根据所述演讲稿的文本内容创建演讲提示检测周期序列,还包括:比对所述文本信息和所述文本内容,并根据与所述文本信息中各个语句对应的所述语句讲解时长,创建多个所述演讲提示检测周期。
其中,语句讲解时长是指模拟音频数据中演讲者讲述文本信息中各个语句所耗费的时长。
具体实现中,演讲提示检测周期的时长也可以根据模拟音频数据进行设置。具体地,服务器解析模拟音频数据得到解析结果后,可以根据文本信息中各个语句的语句内容在演讲稿的文本内容中匹配对应的原始语句,并将与文本信息的语句对应的语句讲解时长确定为该原始语句对应的演讲提示检测周期的时长。
可见,在本示例中,服务器还可以通过模拟音频数据的解析结果确定演讲提示检测周期的时长提高了演讲提示检测周期序列创建的灵活性。并且,如此配置的演讲提示检测周期的时长更符合演讲者的讲述习惯,服务器能够更精准的检测到演讲中出现的问题,并向耳机发送演讲提示消息。
在一个可能的示例中,所述根据所述演讲稿的文本内容创建演讲提示检测周期序列,还包括:接收来自终端设备的第一调整信息;根据所述第一调整信息,更新任一所述原始语句对应的最大允许停顿时长对应的时长数值。
其中,第一调整信息用于表征有针对特定原始语句对应的最大允许停顿时长的调整内容。
具体实现中,服务器提供的服务应用至少可以提供“调整最大允许停顿时长”的功能。参见图3d,具体地,终端设备可以在进入“停顿时长调整状态”后,通过点击、长按等方式选中演讲文稿中某个特定原始语句,以触发启动针对该特定原始语句的最大允许停顿时长的调节组件,用户可以通过该调节组件更改该特定原始语句的最大允许停顿时长,确认更改完成后终端设备可以将包括调整内容的第一调整信息发送至服务器,服务器则可以根据该第一调整信息更新演讲稿的文本内容中原始语句的最大允许停顿时长对应的时长数值。
具体实现中,服务器提供的服务应用还可以提供“调整预设互动情况”的功能,终端设备可在进入“互动情况调整状态”后,通过如图3c所示的界面针对性调整任一特定原始语句预设互动情况,预设互动情况的配置方式可参见上述实施例,在此不再进一步叙述。服务器可以将“停顿时长调整状态”和“互动情况调整状态”中的任一界面作为调整初始界面,用户可以任意切换状态以调整预设互动情况和最大允许停顿时长。
可见,在本示例中,服务器可以通过来自终端设备的第一调整信息调整演讲稿的文本内容中原始语句的最大允许停顿时长的时长数值,提高了最大允许停顿时长设置的灵活性,并能够更好的满足用户需求。
在一个可能的示例中,所述根据所述演讲稿的文本内容创建演讲提示检测周期序列,还包括:接收来自终端设备的第二调整信息;根据所述第二调整信息,更新任一所述演讲提示检测周期对应的时长数值。
其中,第二调整信息用于表征针对特定演讲提示检测周期的时长的调整内容。
具体实现中,服务器提供的服务应用至少可以提供“调整演讲提示检测周期的时长”的功能。参见图3d,具体地,终端设备可以在进入“周期时长调整状态”后,通过点击、长按等方式选中演讲文稿中某个特定原始语句,以触发启动针对该特定原始语句对应的演讲提示检测周期的时长的调节组件,用户可以通过该调节组件更改该演讲提示检测周期的时长,确认更改完成后终端设备可以将包括调整内容的第二调整信息发送至服务器,服务器则可以根据该第一调整信息更新演讲稿的文本内容中原始语句对应的演讲提示检测周期的时长。
具体实现中,服务器提供的服务应用还可以提供“调整预设互动情况”和“调整最大允许停顿时长”两个功能中的至少其中之一。例如,终端设备可在进入“互动情况调整状态”后,通过如图3c所示的界面针对性调整特定原始语句预设互动情况,预设互动情况的配置方式可参见上述实施例,在此不再进一步叙述。又例如吗,终端设备可以在进入“停顿时长调整状态”后,通过如图3d所示的界面针对性调整特定原始语句对应的最大允许停顿时长的时长数值,此时,如图3d中所示调节组件为针对选中的原始语句的最大允许停顿时长的调节组件。服务器可以将“停顿时长调整状态”、“周期时长调整状态”、以及“互动情况调整状态”中的任一界面作为调整初始界面,用户可以任意切换状态以调整预设互动情况、最大允许停顿时长、以及演讲提示检测周期的时长。具体地,当用户上传演讲稿(或上传演讲稿和模拟音频数据)后,终端设备的显示界面即可更新为调整初始界面。
可见,在本示例中,服务器可以通过来自终端设备的第一调整信息调整演讲稿的文本内容中原始语句的最大允许停顿时长的时长数值,提高了最大允许停顿时长设置的灵活性,并能够更好的满足用户需求。
本申请可以根据上述方法示例对服务器进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
图4a是本申请实施例提供的一种演讲提示装置的功能单元组成框图。该演讲提示装置40可以应用在如图1a所示的演讲提示系统中的服务器100上,该演讲提示系统包括服务器、终端设备、以及耳机,耳机和终端设备均与服务器通信连接,该演讲提示装置40包括:
确定单元410,用于确定演讲者待讲解的演讲稿;
创建单元420,用于根据所述演讲稿的文本内容创建演讲提示检测周期序列,所述演讲提示检测周期序列包括多个演讲提示检测周期和与每个演讲提示检测周期对应的最大允许停顿时长,所述多个演讲提示检测周期为与所述文本内容的多个原始语句一一对应的演讲提示检测周期,单个演讲提示检测周期的时长与对应的原始语句的长度呈正关联关系;
处理单元430,用于在所述多个演讲提示检测周期中的每个演讲提示检测周期执行如下操作:
在当前处理的演讲提示检测周期的最大允许停顿时长的时间约束范围内,检测是否接收到来自所述耳机的用户实际演讲语句,所述用户实际演讲语句为采集到的演讲者输出的语句;
若是,则解析所述用户实际演讲语句,得到语义文本,并比对所述语义文本的内容和与当前处理的演讲提示检测周期对应的演讲提示内容是否相同,所述演讲提示内容为在当前处理的演讲提示检测周期内演讲者应当讲述的内容;
若相同,则继续检测在下一个处理的演讲提示检测周期的最大允许停顿时长的时间约束范围内,是否接收到来自所述耳机的用户实际演讲语句;
若不相同,则向所述耳机发送演讲提示消息,所述演讲提示消息用于指示所述耳机播放与当前处理的演讲提示检测周期对应的所述演讲提示内容;
若否,则向所述耳机发送所述演讲提示消息。
在一个可能的示例中,所述文本内容包括多个段落内容,多个所述段落内容中的每个所述段落内容包括至少一个所述原始语句;所述创建单元具体用于:根据所述文本内容,确定多个所述演讲提示检测周期;接收来自终端设备的配置信息,所述配置信息包括用户针对所述段落内容中的第一个所述原始语句的预设互动情况的内容,所述预设互动情况包括观众掌声、交流互动、文本演示;根据所述配置信息,为所述段落内容中的第一个所述原始语句对应的所述演讲提示检测周期配置对应的最大允许停顿时长。
在一个可能的示例中,所述创建单元具体还用于:若所述段落内容包括多个所述原始语句,将所述段落内容中除第一个所述原始语句外的所有所述原始语句对应的所述演讲提示检测周期所对应的最大允许停顿时长配置为预设数值。
在一个可能的示例中,所述创建单元具体用于:获取演讲模拟音频数据;解析所述演讲模拟音频数据,得到解析结果,所述解析结果包括文本信息和与所述文本信息中各个语句对应的模拟停顿时长;比对所述文本信息和所述文本内容,并根据与所述文本信息中各个语句对应的所述模拟停顿时长,为各个所述演讲提示检测周期配置对应的所述模拟停顿时长,所述演讲提示检测周期配置的所述模拟停顿时长为所述演讲提示检测周期的最大允许停顿时长。
在一个可能的示例中,所述解析结果还包括与所述文本信息中各个语句对应的语句讲解时长;所述创建单元具体还用于:比对所述文本信息和所述文本内容,并根据与所述文本信息中各个语句对应的所述语句讲解时长,创建多个所述演讲提示检测周期。
在一个可能的示例中,所述创建单元具体用于:接收来自终端设备的第一调整信息;根据所述第一调整信息,更新任一所述原始语句对应的最大允许停顿时长对应的时长数值。
在一个可能的示例中,所述创建单元具体还用于:接收来自终端设备的第二调整信息;根据所述第二调整信息,更新任一所述演讲提示检测周期对应的时长数值。
在采用集成的单元的情况下,本申请实施例提供的演讲提示装置的功能单元组成框图如图4b所示。在图4b中,演讲提示装置50包括:处理模块520和通信模块510。处理模块520用于对演讲提示装置的动作进行控制管理,例如,确定单元410、创建单元420、处理单元430执行的步骤,和/或用于执行本文所描述的技术的其它过程。通信模块510用于支持演讲提示装置50与其他设备之间的交互。如图4b所示,演讲提示装置50还可以包括存储模块530,存储模块530用于存储演讲提示装置50的程序代码和数据。
其中,处理模块520可以是处理器或控制器,例如可以是中央处理器(CentralProcessingUnit,CPU),通用处理器,数字信号处理器(DigitalSignalProcessor,DSP),ASIC,FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请实施例公开内容所描述的各种示例性的逻辑方框,模块和电路。所述处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等等。通信模块510可以是收发器、RF电路或通信接口等。存储模块530可以是存储器。
其中,上述方法实施例涉及的各场景的所有相关内容均可以援引到对应功能模块的功能描述,在此不再赘述。上述演讲提示装置均可执行上述图2所示的演讲提示方法中服务器所执行的步骤。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤,上述计算机包括服务器。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-OnlyMemory,简称:ROM)、随机存取器(英文:RandomAccessMemory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (5)
1.一种演讲提示方法,其特征在于,应用于演讲提示系统中的服务器,所述演讲提示系统包括所述服务器、终端设备、以及耳机,所述耳机和所述终端设备均与所述服务器通信连接,所述方法包括:
确定演讲者待讲解的演讲稿;
根据所述演讲稿的文本内容创建演讲提示检测周期序列,所述演讲提示检测周期序列包括多个演讲提示检测周期和与每个演讲提示检测周期对应的最大允许停顿时长,所述多个演讲提示检测周期为与所述文本内容的多个原始语句一一对应的演讲提示检测周期,单个演讲提示检测周期的时长与对应的原始语句的长度呈正关联关系;
在所述多个演讲提示检测周期中的每个演讲提示检测周期执行如下周期检测操作:
在当前处理的演讲提示检测周期的最大允许停顿时长的时间约束范围内,检测是否接收到来自所述耳机的用户实际演讲语句,所述用户实际演讲语句为采集到的演讲者输出的语句;
若是,则解析所述用户实际演讲语句,得到语义文本,并比对所述语义文本的内容和与当前处理的演讲提示检测周期对应的演讲提示内容是否相同,所述演讲提示内容为在当前处理的演讲提示检测周期内演讲者应当讲述的内容;
若相同,则继续检测在下一个处理的演讲提示检测周期的最大允许停顿时长的时间约束范围内,是否接收到来自所述耳机的用户实际演讲语句;
若不相同,则向所述耳机发送演讲提示消息,所述演讲提示消息用于指示所述耳机播放与当前处理的演讲提示检测周期对应的所述演讲提示内容;
若否,则向所述耳机发送所述演讲提示消息;
在向耳机发送所述演讲提示消息的情况下,在所述演讲提示检测周期序列中增设拟设演讲提示检测周期和与所述拟设演讲提示检测周期对应的拟设最大允许停顿时长,所述拟设演讲提示检测周期和所述拟设最大允许停顿时长在所述演讲提示检测周期序列中位于当前处理的演讲提示检测周期和下一个处理的演讲提示检测周期之间;
对所述拟设演讲提示检测周期执行所述周期检测操作;在对所述拟设演讲提示检测周期执行所述周期检测操作的过程中,在与新获取的用户实际演讲语句对应的语义文本的内容和与所述拟设演讲提示检测周期对应的演讲提示内容不相同时,比对所述与新获取的用户实际演讲语句对应的语义文本的内容和与下一个处理的演讲提示检测周期对应的演讲提示内容;若相同,则继续检测在下一个处理的演讲提示检测周期的后一个演讲提示检测周期的最大允许停顿时长的时间约束范围内,是否接收到来自所述耳机的用户实际演讲语句;若不相同,则向所述耳机发送所述演讲提示消息;
其中,所述根据所述演讲稿的文本内容创建演讲提示检测周期序列,包括:获取演讲模拟音频数据;解析所述演讲模拟音频数据,得到解析结果,所述解析结果包括文本信息、与所述文本信息中各个语句对应的语句讲解时长、以及与所述文本信息中各个语句对应的模拟停顿时长;比对所述文本信息和所述文本内容,并根据与所述文本信息中各个语句对应的所述语句讲解时长,创建多个所述演讲提示检测周期;比对所述文本信息和所述文本内容,并根据与所述文本信息中各个语句对应的所述模拟停顿时长,为各个所述演讲提示检测周期配置对应的所述模拟停顿时长,所述演讲提示检测周期配置的所述模拟停顿时长为所述演讲提示检测周期的最大允许停顿时长;
其中,所述根据所述演讲稿的文本内容创建演讲提示检测周期序列,还包括:接收来自终端设备的第二调整信息;根据所述第二调整信息,更新任一所述演讲提示检测周期对应的时长数值。
2.根据权利要求1所述的方法,其特征在于,所述根据所述演讲稿的文本内容创建演讲提示检测周期序列,还包括:
接收来自终端设备的第一调整信息;
根据所述第一调整信息,更新任一所述原始语句对应的最大允许停顿时长对应的时长数值。
3.一种演讲提示装置,其特征在于,应用于演讲提示系统中的服务器,所述演讲提示系统包括所述服务器、终端设备、以及耳机,所述耳机和所述终端设备均与所述服务器通信连接,所述装置包括:
确定单元,用于确定演讲者待讲解的演讲稿;
创建单元,用于根据所述演讲稿的文本内容创建演讲提示检测周期序列,所述演讲提示检测周期序列包括多个演讲提示检测周期和与每个演讲提示检测周期对应的最大允许停顿时长,所述多个演讲提示检测周期为与所述文本内容的多个原始语句一一对应的演讲提示检测周期,单个演讲提示检测周期的时长与对应的原始语句的长度呈正关联关系;
所述创建单元还用于获取演讲模拟音频数据;解析所述演讲模拟音频数据,得到解析结果,所述解析结果包括文本信息、与所述文本信息中各个语句对应的语句讲解时长、以及与所述文本信息中各个语句对应的模拟停顿时长;比对所述文本信息和所述文本内容,并根据与所述文本信息中各个语句对应的所述语句讲解时长,创建多个所述演讲提示检测周期;比对所述文本信息和所述文本内容,并根据与所述文本信息中各个语句对应的所述模拟停顿时长,为各个所述演讲提示检测周期配置对应的所述模拟停顿时长,所述演讲提示检测周期配置的所述模拟停顿时长为所述演讲提示检测周期的最大允许停顿时长;
所述创建单元还用于接收来自终端设备的第二调整信息;根据所述第二调整信息,更新任一所述演讲提示检测周期对应的时长数值;
处理单元,用于在所述多个演讲提示检测周期中的每个演讲提示检测周期执行如下周期检测操作:
在当前处理的演讲提示检测周期的最大允许停顿时长的时间约束范围内,检测是否接收到来自所述耳机的用户实际演讲语句,所述用户实际演讲语句为采集到的演讲者输出的语句;
若是,则解析所述用户实际演讲语句,得到语义文本,并比对所述语义文本的内容和与当前处理的演讲提示检测周期对应的演讲提示内容是否相同,所述演讲提示内容为在当前处理的演讲提示检测周期内演讲者应当讲述的内容;
若相同,则继续检测在下一个处理的演讲提示检测周期的最大允许停顿时长的时间约束范围内,是否接收到来自所述耳机的用户实际演讲语句;
若不相同,则向所述耳机发送演讲提示消息,所述演讲提示消息用于指示所述耳机播放与当前处理的演讲提示检测周期对应的所述演讲提示内容;
若否,则向所述耳机发送所述演讲提示消息;
在向耳机发送所述演讲提示消息的情况下,在所述演讲提示检测周期序列中增设拟设演讲提示检测周期和与所述拟设演讲提示检测周期对应的拟设最大允许停顿时长,所述拟设演讲提示检测周期和所述拟设最大允许停顿时长在所述演讲提示检测周期序列中位于当前处理的演讲提示检测周期和下一个处理的演讲提示检测周期之间;
对所述拟设演讲提示检测周期执行所述周期检测操作;在对所述拟设演讲提示检测周期执行所述周期检测操作的过程中,在与新获取的用户实际演讲语句对应的语义文本的内容和与所述拟设演讲提示检测周期对应的演讲提示内容不相同时,比对所述与新获取的用户实际演讲语句对应的语义文本的内容和与下一个处理的演讲提示检测周期对应的演讲提示内容;若相同,则继续检测在下一个处理的演讲提示检测周期的后一个演讲提示检测周期的最大允许停顿时长的时间约束范围内,是否接收到来自所述耳机的用户实际演讲语句;若不相同,则向所述耳机发送所述演讲提示消息。
4.一种服务器,其特征在于,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1和2任一项所述的方法中的步骤的指令。
5.一种计算机可读存储介质,其特征在于,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1和2任一项所述的方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211646038.7A CN115629894B (zh) | 2022-12-21 | 2022-12-21 | 演讲提示方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211646038.7A CN115629894B (zh) | 2022-12-21 | 2022-12-21 | 演讲提示方法及相关装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115629894A CN115629894A (zh) | 2023-01-20 |
CN115629894B true CN115629894B (zh) | 2023-04-07 |
Family
ID=84910133
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211646038.7A Active CN115629894B (zh) | 2022-12-21 | 2022-12-21 | 演讲提示方法及相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115629894B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6947892B1 (en) * | 1999-08-18 | 2005-09-20 | Siemens Aktiengesellschaft | Method and arrangement for speech recognition |
WO2007129004A1 (en) * | 2006-04-12 | 2007-11-15 | Sysmedia Ltd | Speech driven prompt system |
CN106910504A (zh) * | 2015-12-22 | 2017-06-30 | 北京君正集成电路股份有限公司 | 一种基于语音识别的演讲提示方法及装置 |
CN109410945A (zh) * | 2018-12-22 | 2019-03-01 | 广州市视云信息科技有限公司 | 可信息提示的视频会议方法与系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101316418A (zh) * | 2008-06-27 | 2008-12-03 | 飞图科技(北京)有限公司 | 一种用于手机的帮助演讲者按时完成演讲的方法 |
CN107071150A (zh) * | 2017-03-15 | 2017-08-18 | 深圳市金立通信设备有限公司 | 一种多媒体数据提醒方法及终端 |
CN112232127A (zh) * | 2020-09-14 | 2021-01-15 | 辽宁对外经贸学院 | 一种智能演讲训练系统及方法 |
CN113257246B (zh) * | 2021-04-19 | 2023-03-14 | 歌尔股份有限公司 | 提示方法、装置、设备、系统及存储介质 |
-
2022
- 2022-12-21 CN CN202211646038.7A patent/CN115629894B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6947892B1 (en) * | 1999-08-18 | 2005-09-20 | Siemens Aktiengesellschaft | Method and arrangement for speech recognition |
WO2007129004A1 (en) * | 2006-04-12 | 2007-11-15 | Sysmedia Ltd | Speech driven prompt system |
CN106910504A (zh) * | 2015-12-22 | 2017-06-30 | 北京君正集成电路股份有限公司 | 一种基于语音识别的演讲提示方法及装置 |
CN109410945A (zh) * | 2018-12-22 | 2019-03-01 | 广州市视云信息科技有限公司 | 可信息提示的视频会议方法与系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115629894A (zh) | 2023-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7108799B2 (ja) | ヒューマンマシン対話方法及び電子デバイス | |
CN107766482B (zh) | 信息推送及发送方法、装置、电子设备、存储介质 | |
WO2020233034A1 (zh) | 一种页面功能测试方法及相关装置 | |
US11450311B2 (en) | System and methods for accent and dialect modification | |
US9448993B1 (en) | System and method of recording utterances using unmanaged crowds for natural language processing | |
WO2018227761A1 (zh) | 一种教学录播数据修正装置 | |
CN110473525B (zh) | 获取语音训练样本的方法和装置 | |
US10839788B2 (en) | Systems and methods for selecting accent and dialect based on context | |
CN109614030A (zh) | 课件制作、回顾方法、装置、系统、设备和存储介质 | |
US20090094029A1 (en) | Managing Audio in a Multi-Source Audio Environment | |
EP2955713A1 (en) | Synchronous audio playback method, apparatus and system | |
US10613825B2 (en) | Providing electronic text recommendations to a user based on what is discussed during a meeting | |
CN110289015B (zh) | 一种音频处理方法、装置、服务器、存储介质及系统 | |
JP6746923B2 (ja) | 情報処理システム、情報処理装置、情報処理方法および情報処理プログラム | |
US11151981B2 (en) | Audio quality of speech in sound systems | |
WO2020014890A1 (zh) | 基于口音的语音识别处理方法、电子设备和存储介质 | |
US20230259253A1 (en) | Video generation | |
CN115629894B (zh) | 演讲提示方法及相关装置 | |
WO2023241360A1 (zh) | 在线课堂的语音交互方法、装置、设备及存储介质 | |
CN112420015A (zh) | 一种音频合成方法、装置、设备及计算机可读存储介质 | |
JP2022547418A (ja) | 全二重による音声対話の方法 | |
CN113630309B (zh) | 机器人会话系统、方法、装置、计算机设备和存储介质 | |
CN113689854B (zh) | 语音会话方法、装置、计算机设备和存储介质 | |
CN111081088A (zh) | 一种听写字词收录方法及电子设备 | |
CN116013286A (zh) | 一种英语阅读能力的智能评测方法、系统、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |