CN108511001B - 语音监控方法及装置、存储介质、终端 - Google Patents
语音监控方法及装置、存储介质、终端 Download PDFInfo
- Publication number
- CN108511001B CN108511001B CN201810311243.5A CN201810311243A CN108511001B CN 108511001 B CN108511001 B CN 108511001B CN 201810311243 A CN201810311243 A CN 201810311243A CN 108511001 B CN108511001 B CN 108511001B
- Authority
- CN
- China
- Prior art keywords
- prompt
- result
- key point
- announced
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 36
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000012806 monitoring device Methods 0.000 claims 6
- 230000000694 effects Effects 0.000 description 11
- 230000008439 repair process Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Machine Translation (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
一种语音监控方法及装置、存储介质、终端,语音监控方法包括:确定待宣讲内容的提示要点;获取用户在宣讲所述待宣讲内容时的语音数据,并对所述语音数据进行语音识别,以得到识别结果;将所述识别结果与所述提示要点进行比对,以得到比对结果;根据所述比对结果向所述用户进行提示。本发明技术方案可以实现对用户语音的监控,保证宣讲内容被宣讲的准确性。
Description
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种语音监控方法及装置、存储介质、终端。
背景技术
现有技术中,用户在公众场合进行宣讲,以达到宣传和传播宣讲的内容的目的。在一些应用场景中,宣讲的内容比较重要,例如安全规范。在这种情况下,需要宣讲人准确且完整地完成宣讲。宣讲人如果遗漏安全点,将容易导致出现安全隐患。
但是,现有技术中缺乏有效的手段保证宣讲人能够准确且完整地完成宣讲。
发明内容
本发明解决的技术问题是如何实现对用户语音的监控,保证宣讲内容被宣讲的准确性。
为解决上述技术问题,本发明实施例提供一种语音监控方法,语音监控方法包括:确定待宣讲内容的提示要点;获取用户在宣讲所述待宣讲内容时的语音数据,并对所述语音数据进行语音识别,以得到识别结果;将所述识别结果与所述提示要点进行比对,以得到比对结果;根据所述比对结果向所述用户进行提示。
可选的,所述确定待宣讲内容的提示要点包括:依次获取所述待宣讲内容的多个提示要点,每次获取一个提示要点;将所述识别结果与所述提示要点进行比对包括:将所述识别结果与当前获取的提示要点进行比对。
可选的,所述确定待宣讲内容的提示要点包括:获取所述待宣讲内容中按序排列的多个提示要点;对所述语音数据进行语音识别时,得到的是按序排列的多个识别结果;所述将所述识别结果与所述提示要点进行比对包括:
按照排列顺序,将所述多个提示要点中的每一个分别与对应的识别结果进行比对。
可选的,所述根据所述比对结果向所述用户进行提示包括:当至少一个提示要点与对应的识别结果不一致时,根据不一致的提示要点对所述待宣讲内容进行标记并呈现给用户。
可选的,所述将所述识别结果与所述提示要点进行比对包括:将所述识别结果中的词语与所述提示要点中的词语进行比对。
可选的,所述根据所述比对结果向所述用户进行提示包括:如果所述比对结果表示所述识别结果与所述提示要点一致,则继续获取提示要点;如果所述比对结果表示所述识别结果与所述提示要点不一致,则向所述用户提示错误。
可选的,所述将所述识别结果与所述提示要点进行比对包括:计算所述识别结果与所述提示要点的语义相似度,并加入所述比对结果。
可选的,所述将所述识别结果与所述提示要点进行比对还包括:判断所述识别结果中是否完全包括所述提示要点,以确定所述语音数据的完整性结果并加入所述比对结果。
可选的,所述根据所述比对结果向所述用户进行提示包括:如果所述比对结果中所述语义相似度阈值达到预设阈值,且所述完整性结果表示识别结果中包括所述提示要点,则继续获取提示要点;如果所述比对结果中所述语义相似度阈值未达到预设阈值,和/或所述完整性结果表示识别结果中未完全包括所述提示要点,则向所述用户提示错误。
为解决上述技术问题,本发明实施例还公开了一种语音监控装置,语音监控装置包括:提示要点确定模块,适于确定待宣讲内容的提示要点;语音数据获取模块,适于获取用户在宣讲所述待宣讲内容时的语音数据,并对所述语音数据进行语音识别,以得到识别结果;比对模块,适于将所述识别结果与所述提示要点进行比对,以得到比对结果;提示模块,适于根据所述比对结果向所述用户进行提示。
可选的,所述提示要点确定模块包括:第一获取单元,适于依次获取所述待宣讲内容的多个提示要点,每次获取一个提示要点;所述比对模块包括:第一比对单元,适于将所述识别结果与当前获取的提示要点进行比对。
可选的,所述提示要点确定模块包括:第二获取单元,适于获取所述待宣讲内容中按序排列的多个提示要点;对所述语音数据进行语音识别时,得到的是按序排列的多个识别结果;所述比对模块包括:第二比对单元,适于按照排列顺序,将所述多个提示要点中的每一个分别与对应的识别结果进行比对。
可选的,所述提示模块包括:标记单元,适于当至少一个提示要点与对应的识别结果不一致时,根据不一致的提示要点对所述待宣讲内容进行标记并呈现给用户。
可选的,所述比对模块包括:按词比对单元,适于按将所述识别结果中的词语与所述提示要点中的词语进行比对。
可选的,所述提示模块包括:第一获取单元,适于在所述比对结果表示所述识别结果与所述提示要点一致时,继续获取提示要点;第一错误提示单元,适于在所述比对结果表示所述识别结果与所述提示要点不一致时,向所述用户提示错误。
可选的,所述比对模块包括:语义计算单元,适于计算所述识别结果与所述提示要点的语义相似度,并加入所述比对结果。
可选的,所述比对模块还包括:完整性判断单元,适于判断所述识别结果中是否完全包括所述提示要点,以确定所述语音数据的完整性结果并加入所述比对结果。
可选的,所述提示模块包括:第二获取单元,适于在所述比对结果中所述语义相似度阈值达到预设阈值,且所述完整性结果表示识别结果中包括所述提示要点时,继续获取提示要点;第一错误提示单元,适于在所述比对结果中所述语义相似度阈值未达到预设阈值,和/或所述完整性结果表示识别结果中未完全包括所述提示要点时,向所述用户提示错误。
本发明实施例还公开了一种存储介质,其上存储有计算机指令,所述计算机指令运行时执行所述语音监控方法的步骤。
本发明实施例还公开了一种终端,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行所述语音监控方法的步骤。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
本发明技术方案确定待宣讲内容的提示要点;获取用户在宣讲所述待宣讲内容时的语音数据,并对所述语音数据进行语音识别,以得到识别结果;将所述识别结果与所述提示要点进行比对,以得到比对结果;根据所述比对结果向所述用户进行提示。本发明技术方案中,待宣讲内容的提示要点可以准确且完整的表示所述待宣讲内容;通过获取的用户语音数据的识别结果与提示要点进行比对,比对结果可以表示语音数据相对于待宣讲内容的准确性和完整性,从而可以提示用户,保证了用户对待宣讲内容的宣讲准确性。此外,上述各个步骤之间的延时较小,可以实现对用户语音的实时监控,进一步保证了用户对待宣讲内容的宣讲效果。
进一步,判断所述识别结果中是否完全包括所述提示要点,以确定所述语音数据的完整性结果并加入所述比对结果。本发明技术方案中,除了对语音数据的识别结果与提示要点之间语义相似度的监控之外,还对识别结果中对提示要点的完整性进行监控,从而能够提示用户准确且完整的完成对待宣讲内容的宣讲,进一步保证了用户对待宣讲内容的宣讲效果。
附图说明
图1是本发明实施例一种语音监控方法的流程图;
图2是本发明实施例另一种语音监控方法的流程图;
图3是本发明实施例又一种语音监控方法的流程图;
图4是本发明实施例一种语音监控装置的结构示意图。
具体实施方式
如背景技术中所述,现有技术中缺乏有效的手段保证宣讲人能够准确且完整地完成宣讲。
本发明技术方案中,待宣讲内容的提示要点可以准确且完整的表示所述待宣讲内容;通过获取的用户语音数据的识别结果与提示要点进行比对,比对结果可以表示语音数据相对于待宣讲内容的准确性和完整性,从而可以提示用户;保证了用户对待宣讲内容的宣讲准确性。此外,上述各个步骤之间的延时较小,可以实现对用户语音的实时监控,进一步保证了用户对待宣讲内容的宣讲效果。
为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
图1是本发明实施例一种语音监控方法的流程图。
图1所示的语音监控方法可以包括以下步骤:
步骤S101:确定待宣讲内容的提示要点;
步骤S102:获取用户在宣讲所述待宣讲内容时的语音数据,并对所述语音数据进行语音识别,以得到识别结果;
步骤S103:将所述识别结果与所述提示要点进行比对,以得到比对结果;
步骤S104:根据所述比对结果向所述用户进行提示。
在步骤S101的具体实施中,每一待宣讲内容具备一个或多个提示要点。提示要点可以预先存储在终端设备中。当用户利用该终端设备显示待宣讲内容时,可以从该终端设备中调取待宣讲内容的提示要点。或者,提示要点也可以在宣讲时,根据待宣讲内容进行提取,例如对符合预设格式的语句、词语进行提取,或者对符合预设语义的语句、词语进行提取,以得到提示要点。
具体而言,提示要点可以准确且完整的表示所述待宣讲内容。例如,所述提示要点为待宣讲内容的所有关键词。可以通过对待宣讲内容进行关键词提取得到该待宣讲内容的提示要点。
需要说明的是,对待宣讲内容进行关键词选取的原则可以根据实际的应用场景及其需求进行配置,此处不做限制。
具体地,待宣讲内容与其提示要点可以是一一对应的。例如,待宣讲内容的标识与其提示要点的标识具备对应关系。由此,在用户确定待宣讲内容后,可以确定其提示要点。进一步地,在后续步骤中确定提示要点与识别结果不一致时,可以根据不一致的提示要点确定要提示的待宣讲内容。
在步骤S102的具体实施中,当用户开始宣讲所述待宣讲内容后,获取用户的语音数据。并对语音数据进行语义识别,识别得到的识别结果可以是文本格式。
具体而言,可以逐句获取并识别所述语音数据。
本领域技术人员可以理解的是,可以采用任意可实施的现有技术实现对语音数据的识别,本发明实施例对此不做限制。
进而在步骤S103中,可以将识别结果与提示要点进行比对。具体地,由于语音数据是逐句获取并识别的,因此比对结果可以表征每句语音与其对应的提示要点的匹配性。
具体地,所述比对结果可以表示识别结果与提示要点是否一致。
在步骤S104的具体实施中,可以根据不同的比对结果向用户进行不同的提示。当比对结果表示识别结果与提示要点一致时,可以向用户提示正确信息;或者不提示信息,直接获取下一语音数据。当比对结果表示识别结果与提示要点不一致时,向用户提示错误。如果后续的语音数据的识别结果与所述提示要点仍然不一致,则将继续向用户提示错误。直至获取到的语音数据的识别结果与该提示要点一致。
本发明实施例中,待宣讲内容的提示要点可以准确且完整的表示所述待宣讲内容;通过获取的用户语音数据的识别结果与提示要点进行比对,比对结果可以表示语音数据相对于待宣讲内容的准确性和完整性,从而可以提示用户;保证了用户对待宣讲内容的宣讲准确性。此外,上述各个步骤之间的延时较小,可以实现对用户语音的实时监控,进一步保证了用户对待宣讲内容的宣讲效果。
本发明一个具体实施例中,请参照图2,语音监控方法可以包括以下步骤:步骤S201:依次获取所述待宣讲内容的多个提示要点,每次获取一个提示要点。
步骤S202:获取用户在宣讲所述待宣讲内容时的语音数据,并对所述语音数据进行语音识别,以得到识别结果。
步骤S203:将所述识别结果与当前获取的提示要点进行比对。
步骤S204:根据所述比对结果向所述用户进行提示。
本实施例中,在待宣讲内容具备多个提示要点且多个提示要点具备顺序时,可以按照顺序依次获取待宣讲内容的多个提示要点。
由于每次仅获取一个提示要点,因此在将识别结果与提示要点进行比对时,是将识别结果与当前获取的提示要点进行比对。
例如,待宣讲内容为维修变压器,其提示要点包括5个步骤:步骤1、步骤2、步骤3、步骤4和步骤5;先获取步骤1,将步骤1与语音数据的识别结果进行比对;再获取步骤2,将步骤2与语音数据的识别结果进行比对;以此类推,最后获取步骤5,将步骤5与语音数据的识别结果进行比对。此外,语音数据可以是实时获取的,与每一步骤进行比对的语音数据的识别结果是不同的。
本发明一个具体实施例中,请参照图3,语音监控方法可以包括以下步骤:
步骤S301:获取所述待宣讲内容中按序排列的多个提示要点;
步骤S302:获取用户在宣讲所述待宣讲内容时的语音数据,并对所述语音数据进行语音识别,以得到按序排列的多个识别结果;
步骤S303:按照排列顺序,将所述多个提示要点中的每一个分别与对应的识别结果进行比对;
步骤S304:根据所述比对结果向所述用户进行提示。
本实施例中,在待宣讲内容具备多个提示要点且多个提示要点具备顺序时,可以一并获取多个提示要点。
由于对语音数据进行语音识别后,得到的是按序排列(具体而言,按照时间顺序排列,从旧到新)的多个识别结果,因此在步骤S303中,可以按照排列顺序,对每一提示要点与识别结果进行比对。
本实施例中,可以在得到语音数据的多个识别结果后,执行步骤S303;也可以是每得到一个语音数据的识别结果,执行一次步骤S303。
例如,待宣讲内容为维修变压器,其提示要点包括5个步骤:步骤1、步骤2、步骤3、步骤4和步骤5;一并获取上述5个步骤,将步骤1与先获取到的语音数据的识别结果进行比对;将步骤2与再次获取到的语音数据的识别结果进行比对;以此类推,将步骤5与最后获取到的语音数据的识别结果进行比对。
本发明一个优选实施例中,图1所示步骤S104可以包括以下步骤:当至少一个提示要点与对应的识别结果不一致时,根据不一致的提示要点对所述待宣讲内容进行标记并呈现给用户。
本实施例中,如果存在提示要点与对应的识别结果不一致的情况,则需要将不一致的提示要点对应的待宣讲内容进行标记并呈现给用户,以吸引用户的注意,能够使出错的待宣讲内容及时被发现并更正,保证宣讲效果。
具体地,对待宣讲内容进行标记的方式可以是以下一种或多种:可以将该待宣讲内容进行高亮显示,也可以改变该待宣讲内容的文字颜色,还可以在该待宣讲内容下面增加下划线等。
更具体地,如前所述,提示要点与待宣讲内容的不同内容部分是对应的。由此,如果提示要点与其对应的识别结果不一致,则可以根据不一致的提示要点确定待标记的待宣讲内容,再对该待宣讲内容进行标记。例如提示要点1对应章节1,提示要点2对应章节2,在出现提示要点2与识别结果不一致时,可以将章节2的内容进行标记并呈现给用户。
本发明另一个优选实施例中,图1所示步骤S104可以包括以下步骤:如果所述比对结果表示所述识别结果与所述提示要点一致,则继续获取提示要点;如果所述比对结果表示所述识别结果与所述提示要点不一致,则向所述用户提示错误。
本实施例中,如果比对结果表示所述识别结果与所述提示要点一致,则表示用户对该提示要点对应的待宣讲内容的宣讲是正确的。在这种情况下,可以继续获取提示要点,以用于比对。具体地,还可以在终端的显示节点显示通过、正确、对号等信息,以使用户获知其宣讲正确,可以继续宣讲。
如果比对结果表示所述识别结果与所述提示要点不一致,则表示用户对该提示要点对应的待宣讲内容的宣讲是错误的。在这种情况下,需要提示用户错误,以使用户更正错误,保证对待宣讲内容的宣讲是正确的,从而保证宣讲的效果。
本发明一个具体实施例中,图1所示步骤S103可以包括以下步骤:将所述识别结果中的词语与所述提示要点中的词语进行比对。
本实施例中,识别结果可以包括多个词语,提示要点也可以包括多个词语。在将识别结果与提示要点进行比对时,可以是将识别结果中的词语与提示要点中的词语进行比对。在识别结果中的词语与提示要点中的词语一致且顺序一致时,才表示识别结果与提示要点一致;也可以是识别结果中的词语与提示要点中的词语一致,表示识别结果与提示要点一致。
之所以对词语的顺序进行比对,是因为词语的顺序会影响句子的语义。识别结果中的词语与提示要点中的词语一致且顺序一致时,才能表示用户对待宣讲内容的宣讲是正确的。
本发明另一个具体实施例中,图1所示步骤S103可以包括以下步骤:计算所述识别结果与所述提示要点的语义相似度,并加入所述比对结果。判断所述识别结果中是否完全包括所述提示要点,以确定所述语音数据的完整性结果并加入所述比对结果。
本实施例中,在采用语义相似度衡量识别结果与提示要点的一致性时,语义相似度的大小可以表征识别结果与提示要点的一致性。
可以理解的是,计算语义相似度可以采用任意可实施的方式,本发明实施例对此不做限制。
进一步地,为了更准确地衡量识别结果与提示要点的一致性,还可以判断所述识别结果中是否完全包括所述提示要点。只有在识别结果中完全包括所述提示要点的情况下,识别结果与提示要点之间具备一致性。
本发明实施例中,除了对语音数据的识别结果与提示要点之间语义相似度的监控之外,还对识别结果中对提示要点的完整性进行监控;从而能够提示用户准确且完整的完成对待宣讲内容的宣讲,进一步保证了用户对待宣讲内容的宣讲效果。
进一步地,图1所示步骤S104可以包括以下步骤:如果所述比对结果中所述语义相似度阈值达到预设阈值,且所述完整性结果表示识别结果中包括所述提示要点,则继续获取提示要点;如果所述比对结果中所述语义相似度阈值未达到预设阈值,和/或所述完整性结果表示识别结果中未完全包括所述提示要点,则向所述用户提示错误。
具体实施中,通过设置预设阈值,并将语义相似度与预设阈值进行比较;同时,结合完整性结果共同确定对用户的提示内容。
语义相似度阈值达到预设阈值时,表示识别结果与提示要点在语义上是相近的;完整性结果表示识别结果中包括所述提示要点,表示识别结果是完整的。在这种情况下,表示用户对待宣讲内容的宣讲是正确的,可以继续获取提示要点,以进行下一次的比对。
反之,语义相似度阈值未达到预设阈值时,表示识别结果与提示要点在语义上相差较远;和/或完整性结果表示识别结果中为完全包括所述提示要点,表示识别结果是不完整的。在这种情况下,表示用户对待宣讲内容的宣讲正确性较低,需要对用户提示错误。提示错误的具体方式可参照前述实施例,此处不再赘述。
在本发明一个具体应用场景中,待宣讲内容可以是安全宣讲规范,对用户宣讲正确性的要求较高。
预先得到提示要点。提示要点可以是通过自然语言理解算法,将安全宣讲规范拆分为若干步骤。通过抽取每个步骤的关键语义要素,构成每个步骤的评分标准,也即形成提示要点。
获取提示要点,并将每个步骤通过服务器推送到安全宣讲员的终端设备上;在安全宣讲员在宣讲过程中采用语音识别技术,将语音实时转换为文本,在后台和提示要点进行语义对比。判断比对结果是否正确和完整,如果文本符合评分标准,则继续进行下一个步骤的宣讲;如果文本不符合评分标准,则在终端设备上高亮提示其中错误或者不完整的内容,直至后续的比对结果完全正确和完整。
如图4所示,语音监控装置40可以包括提示要点确定模块401、语音数据获取模块402、比对模块403和提示模块404。
其中,提示要点确定模块401适于确定待宣讲内容的提示要点;语音数据获取模块402适于获取用户在宣讲所述待宣讲内容时的语音数据,并对所述语音数据进行语音识别,以得到识别结果;比对模块403适于将所述识别结果与所述提示要点进行比对,以得到比对结果;提示模块404适于根据所述比对结果向所述用户进行提示。
每一待宣讲内容具备提示要点。提示要点可以预先存储在终端设备中。当用户利用该终端设备显示待宣讲内容时,可以从该终端设备中调取待宣讲内容的提示要点。
当用户开始宣讲所述待宣讲内容后,获取用户的语音数据。并对语音数据进行语义识别,识别得到的识别结果可以是文本格式。
由于语音数据是逐句获取并识别的,因此比对结果可以表征指每句语音与其对应的提示要点的匹配性。
具体地,所述比对结果可以表示识别结果与提示要点是否一致。
可以根据不同的比对结果向用户进行不同的提示。当比对结果表示识别结果与提示要点一致时,可以向用户提示正确信息;或者不提示信息,直接获取下一语音数据。当比对结果表示识别结果与提示要点不一致时,向用户提示错误。如果后续的语音数据的识别结果与所述提示要点仍然不一致,则将继续向用户提示错误。直至获取到的语音数据的识别结果与该提示要点一致。
本发明实施例中,待宣讲内容的提示要点可以准确且完整的表示所述待宣讲内容;通过获取的用户语音数据的识别结果与提示要点进行比对,比对结果可以表示语音数据相对于待宣讲内容的准确性和完整性,从而可以提示用户;保证了用户对待宣讲内容的宣讲准确性。此外,上述各个步骤之间的延时较小,可以实现对用户语音的实时监控,进一步保证了用户对待宣讲内容的宣讲效果。
本发明一个具体实施例中,提示要点确定模块401可以包括第一获取单元(图未示),适于依次获取所述待宣讲内容的多个提示要点,每次获取一个提示要点。
比对模块403可以包括第一比对单元(图未示),适于将所述识别结果与当前获取的提示要点进行比对。
本实施例中,在待宣讲内容具备多个提示要点且多个提示要点具备顺序时,可以按照顺序依次获取待宣讲内容的多个提示要点。
由于每次仅获取一个提示要点,因此在将识别结果与提示要点进行比对时,是将识别结果与当前获取的提示要点进行比对。
本发明另一个具体实施例中,提示要点确定模块401可以包括第二获取单元(图未示),适于获取所述待宣讲内容中按序排列的多个提示要点;对所述语音数据进行语音识别时,得到的是按序排列的多个识别结果。
比对模块403可以包括第二比对单元(图未示),适于按照排列顺序,将所述多个提示要点中的每一个分别与对应的识别结果进行比对。
本实施例中,在待宣讲内容具备多个提示要点且多个提示要点具备顺序时,可以一并获取多个提示要点。
由于对语音数据进行语音识别后,得到的是按序排列的多个识别结果,因此在步骤S303中,可以按照排列顺序,对每一提示要点与识别结果进行比对。
本发明一个优选实施例中,提示模块404可以包括标记单元(图未示),适于当至少一个提示要点与对应的识别结果不一致时,根据不一致的提示要点对所述待宣讲内容进行标记并呈现给用户。
本实施例中,如果存在提示要点与对应的识别结果不一致的情况,则需要将不一致的提示要点对应的待宣讲内容进行标记并呈现给用户,以吸引用户的注意,能够使出错的待宣讲内容及时被发现并更正,保证宣讲效果。
具体地,对待宣讲内容进行标记的方式可以是以下一种或多种:可以将该待宣讲内容进行高亮显示,也可以改变该待宣讲内容的文字颜色,还可以在该待宣讲内容下面增加下划线等。
更具体地,如前所述,提示要点与待宣讲内容的不同内容部分是对应的。由此,如果提示要点与其对应的识别结果不一致,则可以根据不一致的提示要点确定待标记的待宣讲内容,再对该待宣讲内容进行标记。例如提示要点1对应章节1,提示要点2对应章节2,在出现提示要点2与识别结果不一致时,可以将章节2的内容进行标记并呈现给用户。
本发明另一个优选实施例中,提示模块404可以包括第一获取单元(图未示),适于在所述比对结果表示所述识别结果与所述提示要点一致时,继续获取提示要点;第一错误提示单元(图未示),适于在所述比对结果表示所述识别结果与所述提示要点不一致时,向所述用户提示错误。
本实施例中,如果比对结果表示所述识别结果与所述提示要点一致,则表示用户对该提示要点对应的待宣讲内容的宣讲是正确的。在这种情况下,可以继续获取提示要点,以用于比对。具体地,还可以在终端的显示节点显示通过、正确、对号等信息,以使用户获知其宣讲正确,可以继续宣讲。
如果比对结果表示所述识别结果与所述提示要点不一致,则表示用户对该提示要点对应的待宣讲内容的宣讲是错误的。在这种情况下,需要提示用户错误,以使用户更正错误,保证对待宣讲内容的宣讲是正确的,从而保证宣讲的效果。
本发明一个具体实施例中,比对模块403可以包括按词比对单元(图未示),适于按将所述识别结果中的词语与所述提示要点中的词语进行比对。
本实施例中,识别结果可以包括多个词语,提示要点也可以包括多个词语。在将识别结果与提示要点进行比对时,可以是将识别结果中的词语与提示要点中的词语进行比对。在识别结果中的词语与提示要点中的词语一致且顺序一致时,才表示识别结果与提示要点一致;也可以是识别结果中的词语与提示要点中的词语一致,表示识别结果与提示要点一致。
之所以对词语的顺序进行比对,是因为词语的顺序会影响句子的语义。识别结果中的词语与提示要点中的词语一致且顺序一致时,才能表示用户对待宣讲内容的宣讲是正确的。
本发明另一个具体实施例中,比对模块403可以包括语义计算单元(图未示),适于计算所述识别结果与所述提示要点的语义相似度,并加入所述比对结果。
进一步地,比对模块403还可以包括完整性判断单元(图未示),适于判断所述识别结果中是否完全包括所述提示要点,以确定所述语音数据的完整性结果并加入所述比对结果
本发明又一个优选实施例中,提示模块404可以包括第二获取单元(图未示),适于在所述比对结果中所述语义相似度阈值达到预设阈值,且所述完整性结果表示识别结果中包括所述提示要点时,继续获取提示要点;
第一错误提示单元(图未示),适于在所述比对结果中所述语义相似度阈值未达到预设阈值,和/或所述完整性结果表示识别结果中未完全包括所述提示要点时,向所述用户提示错误。
本实施例中,在采用语义相似度衡量识别结果与提示要点的一致性时,语义相似度的大小可以表征识别结果与提示要点的一致性。
可以理解的是,计算语义相似度可以采用任意可实施的方式,本发明实施例对此不做限制。
进一步地,为了更准确地衡量识别结果与提示要点的一致性,还可以判断所述识别结果中是否完全包括所述提示要点。只有在识别结果中完全包括所述提示要点的情况下,识别结果与提示要点之间具备一致性。
本发明实施例中,除了对语音数据的识别结果与提示要点之间语义相似度的监控之外,还对识别结果中对提示要点的完整性进行监控;从而能够提示用户准确且完整的完成对待宣讲内容的宣讲,进一步保证了用户对待宣讲内容的宣讲效果。
关于所述语音监控装置40的工作原理、工作方式的更多内容,可以参照图1至图2中的相关描述,这里不再赘述。
本发明实施例还公开了一种存储介质,其上存储有计算机指令,所述计算机指令运行时可以执行图1、图2或图3中所示的语音监控方法的步骤。所述存储介质可以包括ROM、RAM、磁盘或光盘等。所述存储介质还可以包括非挥发性存储器(non-volatile)或者非瞬态(non-transitory)存储器等。
本发明实施例还公开了一种终端,所述终端可以包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令。所述处理器运行所述计算机指令时可以执行图1、图2或图3中所示的语音监控方法的步骤。所述终端包括但不限于手机、计算机、平板电脑等终端设备。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。
Claims (14)
1.一种语音监控方法,其特征在于,包括:
确定待宣讲内容的提示要点;
获取用户在宣讲所述待宣讲内容时的语音数据,并对所述语音数据进行语音识别,以得到识别结果;
将所述识别结果与所述提示要点进行比对,以得到比对结果;
根据所述比对结果向所述用户进行提示;
所述将所述识别结果与所述提示要点进行比对包括:
计算所述识别结果与所述提示要点的语义相似度,并加入所述比对结果;
判断所述识别结果中是否完全包括所述提示要点,以确定所述语音数据的完整性结果并加入所述比对结果;
所述根据所述比对结果向所述用户进行提示包括:
如果所述比对结果中所述语义相似度阈值达到预设阈值,且所述完整性结果表示识别结果中包括所述提示要点,则继续获取提示要点;
如果所述比对结果中所述语义相似度阈值未达到预设阈值,和/或所述完整性结果表示识别结果中未完全包括所述提示要点,则向所述用户提示错误。
2.根据权利要求1所述的语音监控方法,其特征在于,所述确定待宣讲内容的提示要点包括:
依次获取所述待宣讲内容的多个提示要点,每次获取一个提示要点;
将所述识别结果与所述提示要点进行比对包括:
将所述识别结果与当前获取的提示要点进行比对。
3.根据权利要求1所述的语音监控方法,其特征在于,所述确定待宣讲内容的提示要点包括:
获取所述待宣讲内容中按序排列的多个提示要点;对所述语音数据进行语音识别时,得到的是按序排列的多个识别结果;
所述将所述识别结果与所述提示要点进行比对包括:
按照排列顺序,将所述多个提示要点中的每一个分别与对应的识别结果进行比对。
4.根据权利要求1所述的语音监控方法,其特征在于,所述根据所述比对结果向所述用户进行提示包括:
当至少一个提示要点与对应的识别结果不一致时,根据不一致的提示要点对所述待宣讲内容进行标记并呈现给用户。
5.根据权利要求1所述的语音监控方法,其特征在于,所述将所述识别结果与所述提示要点进行比对包括:
将所述识别结果中的词语与所述提示要点中的词语进行比对。
6.根据权利要求1所述的语音监控方法,其特征在于,所述根据所述比对结果向所述用户进行提示包括:
如果所述比对结果表示所述识别结果与所述提示要点一致,则继续获取提示要点;
如果所述比对结果表示所述识别结果与所述提示要点不一致,则向所述用户提示错误。
7.一种语音监控装置,其特征在于,包括:
提示要点确定模块,适于确定待宣讲内容的提示要点;
语音数据获取模块,适于获取用户在宣讲所述待宣讲内容时的语音数据,并对所述语音数据进行语音识别,以得到识别结果;
比对模块,适于将所述识别结果与所述提示要点进行比对,以得到比对结果;
提示模块,适于根据所述比对结果向所述用户进行提示;
所述比对模块包括:
语义计算单元,适于计算所述识别结果与所述提示要点的语义相似度,并加入所述比对结果;
所述比对模块还包括:
完整性判断单元,适于判断所述识别结果中是否完全包括所述提示要点,以确定所述语音数据的完整性结果并加入所述比对结果;
所述提示模块包括:
第二获取单元,适于在所述比对结果中所述语义相似度阈值达到预设阈值,且所述完整性结果表示识别结果中包括所述提示要点时,继续获取提示要点;
第一错误提示单元,适于在所述比对结果中所述语义相似度阈值未达到预设阈值,和/或所述完整性结果表示识别结果中未完全包括所述提示要点时,向所述用户提示错误。
8.根据权利要求7所述的语音监控装置,其特征在于,所述提示要点确定模块包括:
第一获取单元,适于依次获取所述待宣讲内容的多个提示要点,每次获取一个提示要点;
所述比对模块包括:
第一比对单元,适于将所述识别结果与当前获取的提示要点进行比对。
9.根据权利要求7所述的语音监控装置,其特征在于,所述提示要点确定模块包括:
第二获取单元,适于获取所述待宣讲内容中按序排列的多个提示要点;对所述语音数据进行语音识别时,得到的是按序排列的多个识别结果;
所述比对模块包括:
第二比对单元,适于按照排列顺序,将所述多个提示要点中的每一个分别与对应的识别结果进行比对。
10.根据权利要求7所述的语音监控装置,其特征在于,所述提示模块包括:
标记单元,适于当至少一个提示要点与对应的识别结果不一致时,根据不一致的提示要点对所述待宣讲内容进行标记并呈现给用户。
11.根据权利要求7所述的语音监控装置,其特征在于,所述比对模块包括:
按词比对单元,适于按将所述识别结果中的词语与所述提示要点中的词语进行比对。
12.根据权利要求7所述的语音监控装置,其特征在于,所述提示模块包括:
第一获取单元,适于在所述比对结果表示所述识别结果与所述提示要点一致时,继续获取提示要点;
第一错误提示单元,适于在所述比对结果表示所述识别结果与所述提示要点不一致时,向所述用户提示错误。
13.一种存储介质,其上存储有计算机指令,其特征在于,所述计算机指令运行时执行权利要求1至6中任一项所述语音监控方法的步骤。
14.一种终端,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,其特征在于,所述处理器运行所述计算机指令时执行权利要求1至6中任一项所述语音监控方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810311243.5A CN108511001B (zh) | 2018-04-09 | 2018-04-09 | 语音监控方法及装置、存储介质、终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810311243.5A CN108511001B (zh) | 2018-04-09 | 2018-04-09 | 语音监控方法及装置、存储介质、终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108511001A CN108511001A (zh) | 2018-09-07 |
CN108511001B true CN108511001B (zh) | 2020-05-12 |
Family
ID=63380912
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810311243.5A Active CN108511001B (zh) | 2018-04-09 | 2018-04-09 | 语音监控方法及装置、存储介质、终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108511001B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113257246B (zh) * | 2021-04-19 | 2023-03-14 | 歌尔股份有限公司 | 提示方法、装置、设备、系统及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102339193A (zh) * | 2010-07-21 | 2012-02-01 | Tcl集团股份有限公司 | 一种声控会议演讲的方法及系统 |
CN102915730A (zh) * | 2012-10-19 | 2013-02-06 | 东莞宇龙通信科技有限公司 | 语音处理方法及系统 |
CN104657032A (zh) * | 2013-11-22 | 2015-05-27 | 英业达科技有限公司 | 阅读提示信息的系统及其方法 |
CN106910504A (zh) * | 2015-12-22 | 2017-06-30 | 北京君正集成电路股份有限公司 | 一种基于语音识别的演讲提示方法及装置 |
CN107203279A (zh) * | 2017-05-24 | 2017-09-26 | 北京小米移动软件有限公司 | 关键词提示方法及设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9672829B2 (en) * | 2015-03-23 | 2017-06-06 | International Business Machines Corporation | Extracting and displaying key points of a video conference |
-
2018
- 2018-04-09 CN CN201810311243.5A patent/CN108511001B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102339193A (zh) * | 2010-07-21 | 2012-02-01 | Tcl集团股份有限公司 | 一种声控会议演讲的方法及系统 |
CN102915730A (zh) * | 2012-10-19 | 2013-02-06 | 东莞宇龙通信科技有限公司 | 语音处理方法及系统 |
CN104657032A (zh) * | 2013-11-22 | 2015-05-27 | 英业达科技有限公司 | 阅读提示信息的系统及其方法 |
CN106910504A (zh) * | 2015-12-22 | 2017-06-30 | 北京君正集成电路股份有限公司 | 一种基于语音识别的演讲提示方法及装置 |
CN107203279A (zh) * | 2017-05-24 | 2017-09-26 | 北京小米移动软件有限公司 | 关键词提示方法及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN108511001A (zh) | 2018-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10210154B2 (en) | Input method editor having a secondary language mode | |
US8543375B2 (en) | Multi-mode input method editor | |
CN107622054B (zh) | 文本数据的纠错方法及装置 | |
KR101768509B1 (ko) | 온라인 음성 번역 방법 및 장치 | |
CN112417102B (zh) | 一种语音查询方法、装置、服务器和可读存储介质 | |
US20190279622A1 (en) | Method for speech recognition dictation and correction, and system | |
CN103970765B (zh) | 一种改错模型训练方法、装置和文本改错方法、装置 | |
JP2015176099A (ja) | 対話システム構築支援装置、方法、及びプログラム | |
CN109256125B (zh) | 语音的离线识别方法、装置与存储介质 | |
CN109165336B (zh) | 一种信息输出控制方法及家教设备 | |
CN109614623B (zh) | 一种基于句法分析的作文处理方法及系统 | |
CN109448717B (zh) | 一种语音单词拼写识别方法、设备及存储介质 | |
CN108511001B (zh) | 语音监控方法及装置、存储介质、终端 | |
CN109166569B (zh) | 音素误标注的检测方法和装置 | |
CN112151034B (zh) | 设备的语音控制方法、装置、电子设备及存储介质 | |
CN112309429A (zh) | 一种失爆检测方法、装置、设备及计算机可读存储介质 | |
CN109273004B (zh) | 基于大数据的预测性语音识别方法及装置 | |
US20190228765A1 (en) | Speech analysis apparatus, speech analysis system, and non-transitory computer readable medium | |
CN113327615B (zh) | 语音评测方法、装置、设备及存储介质 | |
CN106599312B (zh) | 知识库的检验方法、装置及终端 | |
JP7371644B2 (ja) | 発音トレーニングプログラム及び端末装置 | |
CN111951827B (zh) | 一种连读识别校正方法、装置、设备以及可读存储介质 | |
CN109035896B (zh) | 一种口语训练方法及学习设备 | |
CN110147556B (zh) | 一种多向神经网络翻译系统的构建方法 | |
CN108922278B (zh) | 一种人机交互方法及学习设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: Voice monitoring method and device, storage medium and terminal Effective date of registration: 20230223 Granted publication date: 20200512 Pledgee: China Construction Bank Corporation Shanghai No.5 Sub-branch Pledgor: SHANGHAI XIAOI ROBOT TECHNOLOGY Co.,Ltd. Registration number: Y2023980033272 |