CN108549628A - 流式自然语言信息的断句装置及方法 - Google Patents

流式自然语言信息的断句装置及方法 Download PDF

Info

Publication number
CN108549628A
CN108549628A CN201810218878.0A CN201810218878A CN108549628A CN 108549628 A CN108549628 A CN 108549628A CN 201810218878 A CN201810218878 A CN 201810218878A CN 108549628 A CN108549628 A CN 108549628A
Authority
CN
China
Prior art keywords
punctuate
recognition result
voice recognition
sequential
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810218878.0A
Other languages
English (en)
Other versions
CN108549628B (zh
Inventor
王星光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yunzhisheng Information Technology Co Ltd
Original Assignee
Beijing Yunzhisheng Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yunzhisheng Information Technology Co Ltd filed Critical Beijing Yunzhisheng Information Technology Co Ltd
Priority to CN201810218878.0A priority Critical patent/CN108549628B/zh
Publication of CN108549628A publication Critical patent/CN108549628A/zh
Application granted granted Critical
Publication of CN108549628B publication Critical patent/CN108549628B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供一种流式自然语言信息的断句装置及方法,其中,所述装置包括:语音识别模块,用于按照指定频率输出带有时序的语音识别结果;信息流聚合模块,用于形成语音识别结果序列;动态窗口设定模块,用于选择指定范围的文本;断句识别模块,用于根据分析得到的语义确定所述指定范围的文本中的分割点;句子注册模块,用于将分割得到的多个断句注册至时间轴上,并基于当前注册的断句,对之前注册过的断句进行修正;句子输出模块,用于输出未曾注册过的断句以及经过修正的断句。本发明提供的技术方案,能够提高断句的准确性,并且可以实现断句修正能力。

Description

流式自然语言信息的断句装置及方法
技术领域
本发明涉及语音识别技术领域,特别涉及一种流式自然语言信息的断句装置及方法。
背景技术
随着语音识别技术的不断发展,当前越来越多的软件支持语音识别功能,可以将语音识别为文字,并向用户展示识别出的文字。
现有的语音处理方案是先用语音活动检测模块对语音进行断句,再将断开的语音进行自动语音识别。
然而,现有语音处理方案存在断句不准确的问题,同时对时序上断错的文本缺乏可回溯的断句修正能力。
发明内容
本发明提供一种流式自然语言信息的断句装置及方法,能够提高断句的准确性,并且可以实现断句修正能力。
为实现上述目的,本申请提供一种流式自然语言信息的断句装置,所述装置包括:语音识别模块、信息流聚合模块、动态窗口设定模块、断句识别模块、句子注册模块以及句子输出模块,其中:所述语音识别模块,用于接收并识别语音实时流,并按照指定频率输出带有时序的语音识别结果;所述信息流聚合模块,用于对所述带有时序的语音识别结果进行优化处理,并整合经过优化处理后的带有时序的语音识别结果,以形成语音识别结果序列;所述动态窗口设定模块,用于从所述语音识别结果序列中选择指定范围的文本,所述指定范围的文本用于进行断句分析;所述断句识别模块,用于分析所述指定范围的文本的语义,并根据分析得到的语义确定所述指定范围的文本中的分割点,所述分割点用于将所述指定范围的文本划分为多个断句;所述句子注册模块,用于将分割得到的多个断句注册至时间轴上,并基于当前注册的断句,对之前注册过的断句进行修正;所述句子输出模块,用于输出未曾注册过的断句以及经过修正的断句。
进一步地,所述信息流聚合模块包括时序整合单元,所述时序整合单元用于根据时序从先到后的顺序,将经过优化处理后的带有时序的语音识别结果依次进行连接,得到语音识别结果序列。
进一步地,所述信息流聚合模块包括优化处理单元,所述优化处理单元用于在所述带有时序的语音识别结果中添加新的语音识别结果,或者从所述带有时序的语音识别结果中删除无效的语音识别结果,或者在所述带有时序的语音识别结果修正不符合语言排列规则的语音识别结果。
进一步地,所述断句识别模块包括分词单元和语言模型单元,其中:
所述分词单元,用于为所述指定范围的文本中的各个字符标注标签,并基于标注的标签,将所述指定范围的文本拆分为多个词汇;
所述语言模型单元,用于接收拆分得到的所述多个词汇,并按照预设语言模型计算由所述多个词汇中部分词汇构成具备完整语义的断句的概率,并将概率最大的断句作为划分得到的一个断句。
进一步地,所述句子注册模块包括注册单元和修正单元,其中:
所述注册单元,用于判断分割得到的当前断句在相同的时间轴上是否生成过;若未生成过,将所述当前断句在时间轴上注册,并将所述当前断句传送至所述句子输出模块;
所述修正单元,用于若分割得到的当前断句在相同的时间轴上生成过,根据所述当前断句的语义,判断是否需要对之前生成过的断句进行修正。
为实现上述目的,本申请提供一种流式自然语言信息的断句方法,所述方法包括:接收并识别语音实时流,并按照指定频率输出带有时序的语音识别结果;对所述带有时序的语音识别结果进行优化处理,并整合经过优化处理后的带有时序的语音识别结果,以形成语音识别结果序列;从所述语音识别结果序列中选择指定范围的文本,所述指定范围的文本用于进行断句分析;分析所述指定范围的文本的语义,并根据分析得到的语义确定所述指定范围的文本中的分割点,所述分割点用于将所述指定范围的文本划分为多个断句;将分割得到的多个断句注册至时间轴上,并基于当前注册的断句,对之前注册过的断句进行修正;输出未曾注册过的断句以及经过修正的断句。
进一步地,整合经过优化处理后的带有时序的语音识别结果包括:
根据时序从先到后的顺序,将经过优化处理后的带有时序的语音识别结果依次进行连接,得到语音识别结果序列。
进一步地,对所述带有时序的语音识别结果进行优化处理包括:
在所述带有时序的语音识别结果中添加新的语音识别结果,或者从所述带有时序的语音识别结果中删除无效的语音识别结果,或者在所述带有时序的语音识别结果修正不符合语言排列规则的语音识别结果。
进一步地,根据分析得到的语义确定所述指定范围的文本中的分割点包括:
为所述指定范围的文本中的各个字符标注标签,并基于标注的标签,将所述指定范围的文本拆分为多个词汇;
接收拆分得到的所述多个词汇,并按照预设语言模型计算由所述多个词汇中部分词汇构成具备完整语义的断句的概率,并将概率最大的断句作为划分得到的一个断句。
进一步地,所述方法还包括:
判断分割得到的当前断句在相同的时间轴上是否生成过;若未生成过,将所述当前断句在时间轴上注册,并输出所述当前断句;
若分割得到的当前断句在相同的时间轴上生成过,根据所述当前断句的语义,判断是否需要对之前生成过的断句进行修正。
由上可见,本申请提供的技术方案,包括语音识别模块、信息流聚合模块、动态窗口设定模块、断句识别模块、句子注册模块以及句子输出模块,其中:所述语音识别模块,用于接收并识别语音实时流,并按照指定频率输出带有时序的语音识别结果;所述信息流聚合模块,用于对所述带有时序的语音识别结果进行优化处理,并整合经过优化处理后的带有时序的语音识别结果,以形成语音识别结果序列;所述动态窗口设定模块,用于从所述语音识别结果序列中选择指定范围的文本,所述指定范围的文本用于进行断句分析;所述断句识别模块,用于分析所述指定范围的文本的语义,并根据分析得到的语义确定所述指定范围的文本中的分割点,所述分割点用于将所述指定范围的文本划分为多个断句;所述句子注册模块,用于将分割得到的多个断句注册至时间轴上,并基于当前注册的断句,对之前注册过的断句进行修正;所述句子输出模块,用于输出未曾注册过的断句以及经过修正的断句。由上可见,与传统的断句只利用声学特征进行语音断句相比,本申请结合文本语义信息对语音流进行断句,提高了语音断句的准确率,同时对时序上断错的文本有可回溯的修正能力,大大提高了人机交互友好性。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明实施方式中流式自然语言信息的断句装置的结构示意图;
图2是本发明实施方式中流式自然语言信息的断句方法流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
请参阅图1,本申请提供一种流式自然语言信息的断句装置,所述装置包括:语音识别模块、信息流聚合模块、动态窗口设定模块、断句识别模块、句子注册模块以及句子输出模块,其中:
所述语音识别模块,用于接收并识别语音实时流,并按照指定频率输出带有时序的语音识别结果;
所述信息流聚合模块,用于对所述带有时序的语音识别结果进行优化处理,并整合经过优化处理后的带有时序的语音识别结果,以形成语音识别结果序列;
所述动态窗口设定模块,用于从所述语音识别结果序列中选择指定范围的文本,所述指定范围的文本用于进行断句分析;
所述断句识别模块,用于分析所述指定范围的文本的语义,并根据分析得到的语义确定所述指定范围的文本中的分割点,所述分割点用于将所述指定范围的文本划分为多个断句;
所述句子注册模块,用于将分割得到的多个断句注册至时间轴上,并基于当前注册的断句,对之前注册过的断句进行修正;
所述句子输出模块,用于输出未曾注册过的断句以及经过修正的断句。
在一个实施方式中,所述信息流聚合模块包括时序整合单元,所述时序整合单元用于根据时序从先到后的顺序,将经过优化处理后的带有时序的语音识别结果依次进行连接,得到语音识别结果序列。
在一个实施方式中,所述信息流聚合模块包括优化处理单元,所述优化处理单元用于在所述带有时序的语音识别结果中添加新的语音识别结果,或者从所述带有时序的语音识别结果中删除无效的语音识别结果,或者在所述带有时序的语音识别结果修正不符合语言排列规则的语音识别结果。
在一个实施方式中,所述断句识别模块包括分词单元和语言模型单元,其中:
所述分词单元,用于为所述指定范围的文本中的各个字符标注标签,并基于标注的标签,将所述指定范围的文本拆分为多个词汇;
例如,标签可以分为B,E,I,S,这四个标签分别表示:beginning(开头),inside(中间),ending(结尾),single(单独),也就是一个词的开始,中间,结束以及单个字的词。例如“南京市长江大桥”的标注结果可能为:“南(B)京(I)市(E)长(B)江(E)大(B)桥(E)”。
所述语言模型单元,用于接收拆分得到的所述多个词汇,并按照预设语言模型计算由所述多个词汇中部分词汇构成具备完整语义的断句的概率,并将概率最大的断句作为划分得到的一个断句。
所述预设语言模型例如可以是N-Gram语言模型,Class-based n-gram模型,topic-based n-gram模型,cache-based n-gram模型,skipping n-gram模型,指数语言模型(最大熵模型,条件随机域模型),神经网络语言模型等。
在一个实施方式中,所述句子注册模块包括注册单元和修正单元,其中:
所述注册单元,用于判断分割得到的当前断句在相同的时间轴上是否生成过;若未生成过,将所述当前断句在时间轴上注册,并将所述当前断句传送至所述句子输出模块;
所述修正单元,用于若分割得到的当前断句在相同的时间轴上生成过,根据所述当前断句的语义,判断是否需要对之前生成过的断句进行修正。
具体地,在实现本申请技术方案时,可以包括多个步骤:
第1步:语音识别模块识别语音实时流,并按照一定的频率输出带有时序的语音识别结果。
第2步:信息流聚合模块用于接受并整合时序语音识别结果,形成语音识别结果时间序列。功能包括附加新的语音识别结果、删除无效的语音识别结果、修正不顺滑的语音识别结果。
第3步:动态窗口设定模块从语音识别结果时序中选择一块合适的范围用于断句分析。
第4步:断句模块结合语义完整性判断动态窗口范围内应该断句的分割点。
第5步:句子注册模块用于将分割好的句子注册到时间轴上。据此可以判断生成的句子在相同的时间轴上是否曾经生成过,以及是否有必要对曾经生成过的句子进行修正。
第6步:句子输出模块将不曾注册过的新句子以及修正过的句子输出。
请参阅图2,本申请还提供一种流式自然语言信息的断句方法,所述方法包括:
S1:接收并识别语音实时流,并按照指定频率输出带有时序的语音识别结果;
S2:对所述带有时序的语音识别结果进行优化处理,并整合经过优化处理后的带有时序的语音识别结果,以形成语音识别结果序列;
S3:从所述语音识别结果序列中选择指定范围的文本,所述指定范围的文本用于进行断句分析;
S4:分析所述指定范围的文本的语义,并根据分析得到的语义确定所述指定范围的文本中的分割点,所述分割点用于将所述指定范围的文本划分为多个断句;
S5:将分割得到的多个断句注册至时间轴上,并基于当前注册的断句,对之前注册过的断句进行修正;
S6:输出未曾注册过的断句以及经过修正的断句。
在一个实施方式中,整合经过优化处理后的带有时序的语音识别结果包括:
根据时序从先到后的顺序,将经过优化处理后的带有时序的语音识别结果依次进行连接,得到语音识别结果序列。
在一个实施方式中,对所述带有时序的语音识别结果进行优化处理包括:
在所述带有时序的语音识别结果中添加新的语音识别结果,或者从所述带有时序的语音识别结果中删除无效的语音识别结果,或者在所述带有时序的语音识别结果修正不符合语言排列规则的语音识别结果。
在一个实施方式中,根据分析得到的语义确定所述指定范围的文本中的分割点包括:
为所述指定范围的文本中的各个字符标注标签,并基于标注的标签,将所述指定范围的文本拆分为多个词汇;
接收拆分得到的所述多个词汇,并按照预设语言模型计算由所述多个词汇中部分词汇构成具备完整语义的断句的概率,并将概率最大的断句作为划分得到的一个断句。
在一个实施方式中,所述方法还包括:
判断分割得到的当前断句在相同的时间轴上是否生成过;若未生成过,将所述当前断句在时间轴上注册,并输出所述当前断句;
若分割得到的当前断句在相同的时间轴上生成过,根据所述当前断句的语义,判断是否需要对之前生成过的断句进行修正。
由上可见,本申请提供的技术方案,包括语音识别模块、信息流聚合模块、动态窗口设定模块、断句识别模块、句子注册模块以及句子输出模块,其中:所述语音识别模块,用于接收并识别语音实时流,并按照指定频率输出带有时序的语音识别结果;所述信息流聚合模块,用于对所述带有时序的语音识别结果进行优化处理,并整合经过优化处理后的带有时序的语音识别结果,以形成语音识别结果序列;所述动态窗口设定模块,用于从所述语音识别结果序列中选择指定范围的文本,所述指定范围的文本用于进行断句分析;所述断句识别模块,用于分析所述指定范围的文本的语义,并根据分析得到的语义确定所述指定范围的文本中的分割点,所述分割点用于将所述指定范围的文本划分为多个断句;所述句子注册模块,用于将分割得到的多个断句注册至时间轴上,并基于当前注册的断句,对之前注册过的断句进行修正;所述句子输出模块,用于输出未曾注册过的断句以及经过修正的断句。由上可见,与传统的断句只利用声学特征进行语音断句相比,本申请结合文本语义信息对语音流进行断句,提高了语音断句的准确率,同时对时序上断错的文本有可回溯的修正能力,大大提高了人机交互友好性。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种流式自然语言信息的断句装置,其特征在于,所述装置包括:语音识别模块、信息流聚合模块、动态窗口设定模块、断句识别模块、句子注册模块以及句子输出模块,其中:
所述语音识别模块,用于接收并识别语音实时流,并按照指定频率输出带有时序的语音识别结果;
所述信息流聚合模块,用于对所述带有时序的语音识别结果进行优化处理,并整合经过优化处理后的带有时序的语音识别结果,以形成语音识别结果序列;
所述动态窗口设定模块,用于从所述语音识别结果序列中选择指定范围的文本,所述指定范围的文本用于进行断句分析;
所述断句识别模块,用于分析所述指定范围的文本的语义,并根据分析得到的语义确定所述指定范围的文本中的分割点,所述分割点用于将所述指定范围的文本划分为多个断句;
所述句子注册模块,用于将分割得到的多个断句注册至时间轴上,并基于当前注册的断句,对之前注册过的断句进行修正;
所述句子输出模块,用于输出未曾注册过的断句以及经过修正的断句。
2.根据权利要求1所述的装置,其特征在于,所述信息流聚合模块包括时序整合单元,所述时序整合单元用于根据时序从先到后的顺序,将经过优化处理后的带有时序的语音识别结果依次进行连接,得到语音识别结果序列。
3.根据权利要求1所述的装置,其特征在于,所述信息流聚合模块包括优化处理单元,所述优化处理单元用于在所述带有时序的语音识别结果中添加新的语音识别结果,或者从所述带有时序的语音识别结果中删除无效的语音识别结果,或者在所述带有时序的语音识别结果修正不符合语言排列规则的语音识别结果。
4.根据权利要求1所述的装置,其特征在于,所述断句识别模块包括分词单元和语言模型单元,其中:
所述分词单元,用于为所述指定范围的文本中的各个字符标注标签,并基于标注的标签,将所述指定范围的文本拆分为多个词汇;
所述语言模型单元,用于接收拆分得到的所述多个词汇,并按照预设语言模型计算由所述多个词汇中部分词汇构成具备完整语义的断句的概率,并将概率最大的断句作为划分得到的一个断句。
5.根据权利要求1所述的装置,其特征在于,所述句子注册模块包括注册单元和修正单元,其中:
所述注册单元,用于判断分割得到的当前断句在相同的时间轴上是否生成过;若未生成过,将所述当前断句在时间轴上注册,并将所述当前断句传送至所述句子输出模块;
所述修正单元,用于若分割得到的当前断句在相同的时间轴上生成过,根据所述当前断句的语义,判断是否需要对之前生成过的断句进行修正。
6.一种流式自然语言信息的断句方法,其特征在于,所述方法包括:
接收并识别语音实时流,并按照指定频率输出带有时序的语音识别结果;
对所述带有时序的语音识别结果进行优化处理,并整合经过优化处理后的带有时序的语音识别结果,以形成语音识别结果序列;
从所述语音识别结果序列中选择指定范围的文本,所述指定范围的文本用于进行断句分析;
分析所述指定范围的文本的语义,并根据分析得到的语义确定所述指定范围的文本中的分割点,所述分割点用于将所述指定范围的文本划分为多个断句;
将分割得到的多个断句注册至时间轴上,并基于当前注册的断句,对之前注册过的断句进行修正;
输出未曾注册过的断句以及经过修正的断句。
7.根据权利要求6所述的方法,其特征在于,整合经过优化处理后的带有时序的语音识别结果包括:
根据时序从先到后的顺序,将经过优化处理后的带有时序的语音识别结果依次进行连接,得到语音识别结果序列。
8.根据权利要求6所述的方法,其特征在于,对所述带有时序的语音识别结果进行优化处理包括:
在所述带有时序的语音识别结果中添加新的语音识别结果,或者从所述带有时序的语音识别结果中删除无效的语音识别结果,或者在所述带有时序的语音识别结果修正不符合语言排列规则的语音识别结果。
9.根据权利要求6所述的方法,其特征在于,根据分析得到的语义确定所述指定范围的文本中的分割点包括:
为所述指定范围的文本中的各个字符标注标签,并基于标注的标签,将所述指定范围的文本拆分为多个词汇;
接收拆分得到的所述多个词汇,并按照预设语言模型计算由所述多个词汇中部分词汇构成具备完整语义的断句的概率,并将概率最大的断句作为划分得到的一个断句。
10.根据权利要求6所述的方法,其特征在于,所述方法还包括:
判断分割得到的当前断句在相同的时间轴上是否生成过;若未生成过,将所述当前断句在时间轴上注册,并输出所述当前断句;
若分割得到的当前断句在相同的时间轴上生成过,根据所述当前断句的语义,判断是否需要对之前生成过的断句进行修正。
CN201810218878.0A 2018-03-16 2018-03-16 流式自然语言信息的断句装置及方法 Active CN108549628B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810218878.0A CN108549628B (zh) 2018-03-16 2018-03-16 流式自然语言信息的断句装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810218878.0A CN108549628B (zh) 2018-03-16 2018-03-16 流式自然语言信息的断句装置及方法

Publications (2)

Publication Number Publication Date
CN108549628A true CN108549628A (zh) 2018-09-18
CN108549628B CN108549628B (zh) 2021-08-27

Family

ID=63516525

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810218878.0A Active CN108549628B (zh) 2018-03-16 2018-03-16 流式自然语言信息的断句装置及方法

Country Status (1)

Country Link
CN (1) CN108549628B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111161711A (zh) * 2020-04-01 2020-05-15 支付宝(杭州)信息技术有限公司 对流式语音识别文本进行断句的方法及装置
CN111160003A (zh) * 2018-11-07 2020-05-15 北京猎户星空科技有限公司 一种断句方法及装置
CN111259163A (zh) * 2020-01-14 2020-06-09 北京明略软件系统有限公司 一种知识图谱的生成方法和装置及计算机可读存储介质
CN111627423A (zh) * 2019-02-27 2020-09-04 百度在线网络技术(北京)有限公司 Vad尾点检测方法、装置、服务器和计算机可读介质
CN111797632A (zh) * 2019-04-04 2020-10-20 北京猎户星空科技有限公司 信息处理方法、装置及电子设备
CN113628626A (zh) * 2020-05-09 2021-11-09 阿里巴巴集团控股有限公司 语音识别方法、装置和系统以及翻译方法和系统
CN114420102A (zh) * 2022-01-04 2022-04-29 广州小鹏汽车科技有限公司 语音断句方法、装置、电子设备及存储介质
CN114648984A (zh) * 2022-05-23 2022-06-21 深圳华策辉弘科技有限公司 音频断句方法、装置、计算机设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140280072A1 (en) * 2013-03-14 2014-09-18 Advanced Search Laboratories, lnc. Method and Apparatus for Human-Machine Interaction
US20140358879A1 (en) * 2012-05-31 2014-12-04 International Business Machines Corporation Search engine suggestion
CN105895103A (zh) * 2015-12-03 2016-08-24 乐视致新电子科技(天津)有限公司 一种语音识别方法及装置
CN106503123A (zh) * 2016-10-20 2017-03-15 宁波江东大金佰汇信息技术有限公司 一种基于计算机云数据的深度学习智能应答系统
CN106547737A (zh) * 2016-10-25 2017-03-29 复旦大学 基于深度学习的自然语言处理中的序列标注方法
CN107315737A (zh) * 2017-07-04 2017-11-03 北京奇艺世纪科技有限公司 一种语义逻辑处理方法及系统
CN107797984A (zh) * 2017-09-11 2018-03-13 远光软件股份有限公司 智能交互方法、设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140358879A1 (en) * 2012-05-31 2014-12-04 International Business Machines Corporation Search engine suggestion
US20140280072A1 (en) * 2013-03-14 2014-09-18 Advanced Search Laboratories, lnc. Method and Apparatus for Human-Machine Interaction
CN105895103A (zh) * 2015-12-03 2016-08-24 乐视致新电子科技(天津)有限公司 一种语音识别方法及装置
CN106503123A (zh) * 2016-10-20 2017-03-15 宁波江东大金佰汇信息技术有限公司 一种基于计算机云数据的深度学习智能应答系统
CN106547737A (zh) * 2016-10-25 2017-03-29 复旦大学 基于深度学习的自然语言处理中的序列标注方法
CN107315737A (zh) * 2017-07-04 2017-11-03 北京奇艺世纪科技有限公司 一种语义逻辑处理方法及系统
CN107797984A (zh) * 2017-09-11 2018-03-13 远光软件股份有限公司 智能交互方法、设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SINISA HUSNJAK 等: ""Possibilities of Using Speech Recognition Systems of Smart Terminal Devices in Traffic Environment"", 《PROCEDIA ENGINEERING》 *
刘长征 等: ""语音识别中卷积神经网络优化算法"", 《哈尔滨理工大学学报》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111160003A (zh) * 2018-11-07 2020-05-15 北京猎户星空科技有限公司 一种断句方法及装置
CN111160003B (zh) * 2018-11-07 2023-12-08 北京猎户星空科技有限公司 一种断句方法及装置
CN111627423B (zh) * 2019-02-27 2023-08-04 百度在线网络技术(北京)有限公司 Vad尾点检测方法、装置、服务器和计算机可读介质
CN111627423A (zh) * 2019-02-27 2020-09-04 百度在线网络技术(北京)有限公司 Vad尾点检测方法、装置、服务器和计算机可读介质
CN111797632A (zh) * 2019-04-04 2020-10-20 北京猎户星空科技有限公司 信息处理方法、装置及电子设备
CN111797632B (zh) * 2019-04-04 2023-10-27 北京猎户星空科技有限公司 信息处理方法、装置及电子设备
CN111259163A (zh) * 2020-01-14 2020-06-09 北京明略软件系统有限公司 一种知识图谱的生成方法和装置及计算机可读存储介质
CN111161711B (zh) * 2020-04-01 2020-07-03 支付宝(杭州)信息技术有限公司 对流式语音识别文本进行断句的方法及装置
CN111161711A (zh) * 2020-04-01 2020-05-15 支付宝(杭州)信息技术有限公司 对流式语音识别文本进行断句的方法及装置
CN113628626A (zh) * 2020-05-09 2021-11-09 阿里巴巴集团控股有限公司 语音识别方法、装置和系统以及翻译方法和系统
CN114420102B (zh) * 2022-01-04 2022-10-14 广州小鹏汽车科技有限公司 语音断句方法、装置、电子设备及存储介质
CN114420102A (zh) * 2022-01-04 2022-04-29 广州小鹏汽车科技有限公司 语音断句方法、装置、电子设备及存储介质
CN114648984B (zh) * 2022-05-23 2022-08-19 深圳华策辉弘科技有限公司 音频断句方法、装置、计算机设备及存储介质
CN114648984A (zh) * 2022-05-23 2022-06-21 深圳华策辉弘科技有限公司 音频断句方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN108549628B (zh) 2021-08-27

Similar Documents

Publication Publication Date Title
CN108549628A (zh) 流式自然语言信息的断句装置及方法
CN110728997B (zh) 一种基于情景感知的多模态抑郁症检测系统
CN106611597B (zh) 基于人工智能的语音唤醒方法和装置
CN110364171B (zh) 一种语音识别方法、语音识别系统及存储介质
CN110838289A (zh) 基于人工智能的唤醒词检测方法、装置、设备及介质
US20170270922A1 (en) Smart home control method based on emotion recognition and the system thereof
CN110263322A (zh) 用于语音识别的音频语料筛选方法、装置及计算机设备
CN110675859B (zh) 结合语音与文本的多情感识别方法、系统、介质及设备
CN105895103A (zh) 一种语音识别方法及装置
WO2021047233A1 (zh) 一种基于深度学习的情感语音合成方法及装置
CN103559880B (zh) 语音输入系统和方法
CN108899013A (zh) 语音搜索方法、装置和语音识别系统
CN110120221A (zh) 用于车机系统的用户个性化离线语音识别方法及其系统
CN110930993A (zh) 特定领域语言模型生成方法及语音数据标注系统
CN110148399A (zh) 一种智能设备的控制方法、装置、设备及介质
CN111161726B (zh) 一种智能语音交互方法、设备、介质及系统
CN110599999A (zh) 数据交互方法、装置和机器人
Buß et al. Evaluation and optimisation of incremental processors
CN112579762B (zh) 一种基于语义、情感惯性和情感共性的对话情感分析方法
CN112489618A (zh) 利用多级别上下文特征的神经文本到语音合成
CN108446278A (zh) 一种基于自然语言的语义理解系统及方法
JP2002215187A (ja) 音声認識方法及びその装置
CN104347071A (zh) 生成口语考试参考答案的方法及系统
CN109933773A (zh) 一种多重语义语句解析系统及方法
CN110503943B (zh) 一种语音交互方法以及语音交互系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Room 101, 1st floor, building 1, Xisanqi building materials City, Haidian District, Beijing 100096

Applicant after: Yunzhisheng Intelligent Technology Co.,Ltd.

Address before: 12 / F, Guanjie building, building 1, No. 16, Taiyanggong Middle Road, Chaoyang District, Beijing

Applicant before: BEIJING UNISOUND INFORMATION TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant