CN114254628A - 一种语音转写中结合用户文本的快速热词提取方法、装置、电子设备及存储介质 - Google Patents
一种语音转写中结合用户文本的快速热词提取方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114254628A CN114254628A CN202111173936.0A CN202111173936A CN114254628A CN 114254628 A CN114254628 A CN 114254628A CN 202111173936 A CN202111173936 A CN 202111173936A CN 114254628 A CN114254628 A CN 114254628A
- Authority
- CN
- China
- Prior art keywords
- user
- word
- hot
- text
- current
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013518 transcription Methods 0.000 title claims abstract description 64
- 230000035897 transcription Effects 0.000 title claims abstract description 64
- 238000000034 method Methods 0.000 title claims abstract description 26
- 230000011218 segmentation Effects 0.000 claims abstract description 42
- 238000012549 training Methods 0.000 claims abstract description 19
- 238000007781 pre-processing Methods 0.000 claims description 19
- 238000000605 extraction Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001149 cognitive effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明公开了一种语音转写中结合用户文本的快速热词提取方法、装置、电子设备及存储介质,方法可以分为以下步骤:对用户提供的行业常用语音文本,进行分词预处理;对用户文本的分词结果进行词频分析,获取用户当前文本词频;分析获取在用户当前文本词频中较高而在已有语音转写模型训练语料词频中较低的词,作为用户当前热词集;将用户当前热词集与历史热词库进行递归合并,重新调节热词的权重得到用户当前热词库;基于用户当前热词库,进行语音转文本。可根据用户提供的行业常用语音文本,快速提取热词,极大提高语音转写正确率;由于获取的热词库是包含热词出现概率的信息,可依据所有热词的出现概率自动调节热词权重。
Description
技术领域
本发明涉及语音技术领域,尤其涉及一种语音转写中结合用户文本的快速热词提取方法、装置、电子设备及存储介质。
背景技术
在通用的语音识别技术中,由于行业领域数据较少的问题,在训练声学模型、语言模型时受到训练语料不足的限制,无法涵盖不同用户、不同行业的行业用词,特别是对专有名词、同音字词转写往往很难达到用户的期望结果,通用的语音识别技术只能转写为发音类似且在声学模型、语言模型训练语料中出现频率较高的字词,以至于得到错误的转写结果。
随着业界语音技术的不断突破以及近年来人们认知水平和需求的提高,大家对语音识别技术提出了越来越多的挑战,例如用户希望在自己行业领域中的语音识别效果也能接近通用语音的识别效果,并且避免进行声学模型、语言模型训练等费时而又繁琐的技术操作。
针对上述行业领域语音转写错误问题,除了添加大量用户行业领域的语料数据进行声学模型、语言模型训练来提高语音转写引擎的转写正确率,还可以通过设置语音转写热词库的方法,让语音转写引擎更倾向于识别出用户当前热词库中的热词,从而极大地提高一些不常见词或用户行业用词的转写正确率,提高用户满意度。
传统的设置语音转写热词库的方法,往往只能人工统计整理一个行业领域的热词库,并且该热词库不能区分高频词和低频词,无法区分不同热词的权重,另外由于人工统计整理它有耗时、效率低、热词覆盖面广度无法保证等问题。
正因如此,目前市面上通过设置热词来提高语音转写正确率的较少,一直受到用户热词提取相关技术问题的困扰。
发明内容
本发明的目的是针对现有技术中存在的不足,提供一种语音转写中结合用户文本的快速热词提取方法、装置、电子设备及存储介质。
为实现上述目的,在第一方面,本发明提供了一种语音转写中结合用户文本的快速热词提取方法,包括以下步骤:
1)对用户提供的行业语音文本即用户文本,进行分词预处理;
2)对用户文本的分词预处理结果进行词频分析,获取用户当前文本词频;
3)分析获取在用户当前文本词频中大于设置的词频阈值n1,而在已有语音转写模型训练语料词频中小于设置的词频阈值n2的词,作为用户当前热词集;
4)将用户当前热词集与历史热词库进行递归合并,重新调节热词的权重得到用户当前热词库;
5)基于用户当前热词库,进行语音转文本。
优选的,所述步骤1)中分词预处理包括以下步骤:
所述分词预处理操作通过jieba分词工具完成,在分词预处理操作之前根据用户需求添加自定义词典,确保用户文本中的特殊词在分词处理时不被拆分,并根据用户需求设置停用词;
对用户文本合并汇总后,通过jieba分词工具进行分词处理,生成分词后的用户文本文件。
优选的,所述步骤2)中获取用户当前文本词频的具体步骤如下:
将所述分词后的用户文本文件通过语言模型训练工具SRILM生成词频统计文件。
优选的,所述步骤3)中确定用户当前热词集的具体步骤如下:
分析筛选出用户当前文本词频统计文件中满足预置条件的词,即在用户当前文本词频中词频高于词频阈值n1而在语音转写模型训练语料词频中词频低于词频阈值n2的词,作为用户当前热词集。
优选的,所述步骤4)中重新获取用户当前热词库的具体步骤如下:
在用户当前热词集中去除与历史热词库中重复的热词;
将用户当前文本词频统计文件与历史文本词频统计文件合并,计算用户当前热词集与历史热词库所有热词在合并的文本词频统计文件中的出现概率;
根据用户当前热词集与历史热词库所有热词在合并的文本词频统计文件中的出现概率,进行递归合并得到该用户当前热词库,如果用户没有历史热词库,则用户当前热词集即为用户当前热词库;
然后依据用户当前热词库热词的出现概率自动重新调节热词权重,且用户自定义特殊热词的热词权重。
优选的,所述步骤5)中进行语音转文本的具体步骤如下:
导入含有用户当前热词库中的热词的语音,语音转写引擎更倾向于识别出用户当前热词库中的热词。
在第二方面,本发明提供了一种语音转写中结合用户文本的快速热词提取装置,包括:
用户文本预处理模块,用于对用户提供的行业语音文本即用户文本,进行分词预处理;
用户当前文本词频获取模块,用于对用户文本的分词预处理结果进行词频分析,获取用户当前文本词频;
用户当前热词集获取模块,用于分析获取在用户当前文本词频中大于设置的词频阈值n1,而在已有语音转写模型训练语料词频中小于设置的词频阈值n2的词,作为用户当前热词集;
用户当前热词库获取模块,用于将用户当前热词集与历史热词库进行递归合并,重新调节热词的权重得到用户当前热词库;
语音转写模块,用于基于用户当前热词库,进行语音转文本。
优选的,所述用户当前热词库获取模块用于在用户当前热词集中去除与历史热词库中重复的热词;
将用户当前文本词频统计文件与历史文本词频统计文件合并,计算用户当前热词集与历史热词库所有热词在合并的文本词频统计文件中的出现概率;
根据用户当前热词集与历史热词库所有热词在合并的文本词频统计文件中的出现概率,进行递归合并得到该用户当前热词库,如果用户没有历史热词库,则用户当前热词集即为用户当前热词库;
然后依据用户当前热词库热词的出现概率自动重新调节热词权重,且用户自定义特殊热词的热词权重;
并通过语音转写模块导入含有用户当前热词库中的热词的语音,语音转写引擎更倾向于识别出用户当前热词库中的热词。
在第三方面,本发明提供了一种电子设备,所述电子设备包括:
存储器,用于存储指令;
处理器,用于调用所述存储器存储的指令执行权利要求1-6中任一项所述的一种语音转写中结合用户文本的快速热词提取方法。
在第四方面,本发明提供了一种存储介质,所述存储介质存储有计算机可执行指令,所述计算机可执行指令执行权利要求1-6中任一项所述的一种语音转写中结合用户文本的快速热词提取方法。
有益效果:本发明可根据用户提供的行业常用语音文本,快速提取热词,极大提高语音转写正确率;由于本发明获取的热词库是包含热词出现概率的信息,可依据所有热词的出现概率自动调节热词权重;由于本发明支持用户的当前热词集与历史热词库进行递归合并,用户可在使用过程中持续便捷地添加热词。
附图说明
图1是本发明实施例的语音转写中结合用户文本的快速热词提取方法的流程示意图。
具体实施方式
下面将结合本实施例中的附图,对本实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,不能理解为对本发明的限制。基于本申请中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本申请保护的范围。
如图1所示,本发明实施例提供了一种语音转写中结合用户文本的快速热词提取方法,包括:
步骤S1:对用户提供的行业语音文本,进行分词预处理。分词预处理操作通过jieba分词工具完成,在分词操作之前根据用户需求添加自定义词典 user_dict.txt,确保用户文档中的特殊词在分词处理时不被拆分,并根据用户需求设置停用词。
其中jieba分词时采用精确模式,将句子最精确地切开,无冗余,生成分词后的用户文本文件user_text。
步骤S2:对用户文本的分词结果进行词频分析,获取用户当前文本词频。将分词后的用户文本文件user_text通过语言模型训练工具SRILM生成词频统计文件unigram.counts。
其中主要操作如命令ngram-count-text user_text-order 1-writeunigram.counts所示,其中参数-text指向输入文件user_text;-order指向生成几元的n-gram语言模型,即n,此处只对单个词语分析即设置为1元; -write指向输出文件,此处为unigram.counts。
步骤S3:分析获取在用户当前文本词频中较高而在已有语音转写模型训练语料词频中较低的词,作为用户当前热词集。分析筛选出用户当前文本词频统计文件unigram.counts中满足预置条件的词,即在用户当前文本词频中词频高于词频阈值n1,而在语音转写模型训练语料词频中词频低于词频阈值 n2的词,作为用户当前热词集。
其中词频阈值n1可根据用户文本词数的量级自定义调节数值,词频阈值 n2可根据语音转写模型训练语料词频统计文件unigram.counts词数的量级自定义调节数值。
步骤S4:将用户当前热词集与历史热词库进行递归合并,重新调节热词的权重得到用户当前热词库。
在用户当前热词集中去除与历史热词库中重复的热词;
将用户当前文本词频统计文件unigram.counts与历史文本词频统计文件unigram.counts合并,计算用户当前热词集与历史热词库所有热词在合并的文本词频统计文件中的出现概率;
根据用户当前热词集与历史热词库所有热词在合并的文本词频统计文件中的出现概率,进行递归合并得到该用户当前热词库,如果用户没有历史热词库,则用户当前热词集即为用户当前热词库;
然后依据用户当前热词库热词的出现概率自动重新调节热词权重,且用户可自定义特殊热词的热词权重。
步骤S5:基于用户当前热词库,进行语音转文本。导入含有用户当前热词库中的热词的语音,语音转写引擎更倾向于识别出用户当前热词库中的热词,从而极大地提高一些不常见词或用户行业用词的转写正确率,提高用户满意度。
基于以上实施例,本领域技术人员可以理解,本发明还提供了一种语音转写中结合用户文本的快速热词提取装置,包括:用户文本预处理模块、用户当前文本词频获取模块、用户当前热词集获取模块、用户当前热词库获取模块和语音转写模块。
其中,用户文本预处理模块用以对用户提供的行业常用语音文本,进行分词预处理,分词预处理操作通过jieba分词工具完成,在分词操作之前根据用户需求添加自定义词典user_dict.txt,确保用户文档中的特殊词在分词处理时不被拆分,并根据用户需求设置停用词。
本发明实施例进行jieba分词时采用精确模式,将句子最精确地切开,无冗余,生成分词后的用户文本文件user_text。
用户当前文本词频获取模块用以对用户文本的分词结果进行词频分析,获取用户当前文本词频。将分词后的用户文本文件user_text通过语言模型训练工具SRILM生成词频统计文件unigram.counts。
其中主要操作如命令ngram-count-text user_text-order 1-writeunigram.counts所示,其中参数-text指向输入文件user_text;-order指向生成几元的n-gram语言模型,即n,此处只对单个词语分析即设置为1元; -write指向输出文件,此处为unigram.counts。
用户当前热词集获取模块用以分析获取在用户当前文本词频中较高而在已有语音转写模型训练语料词频中较低的词,作为用户当前热词集。分析筛选出用户当前文本词频统计文件unigram.counts中满足预置条件的词,即在用户当前文本词频中词频高于词频阈值n1而在语音转写模型训练语料词频中词频低于词频阈值n2的词,作为用户当前热词集。
其中词频阈值n1可根据用户文本词数的量级自定义调节数值,词频阈值 n2可根据语音转写模型训练语料词频统计文件unigram.counts词数的量级自定义调节数值。
用户当前热词库获取模块用以将用户当前热词集与历史热词库进行递归合并,重新调节热词的权重得到用户当前热词库。
在用户当前热词集中去除与历史热词库中重复的热词;
将用户当前文本词频统计文件unigram.counts与历史文本词频统计文件unigram.counts合并,计算用户当前热词集与历史热词库所有热词在合并的文本词频统计文件中的出现概率;
根据用户当前热词集与历史热词库所有热词在合并的文本词频统计文件中的出现概率,进行递归合并得到该用户当前热词库,如果用户没有历史热词库,则用户当前热词集即为用户当前热词库;
然后依据用户当前热词库热词的出现概率自动重新调节热词权重,且用户可自定义特殊热词的热词权重。
语音转写模块用以基于用户当前热词库,进行语音转文本。导入含有用户当前热词库中的热词的语音,语音转写引擎更倾向于识别出用户当前热词库中的热词,从而极大地提高一些不常见词或用户行业用词的转写正确率,提高用户满意度。
基于以上实施例,本领域技术人员可以理解,本发明还提供了一种语音转写中结合用户文本的快速热词提取电子设备,包括:存储器、处理器、输入/输出(Input/Output,I/O)接口。其中,存储器,用于存储指令。处理器,用于调用存储器存储的指令执行本发明实施例的一种语音转写中结合用户文本的快速热词提取方法。其中,处理器分别与存储器、I/O接口连接。存储器可用于存储程序和数据,包括本发明实施例中涉及的用于一种语音转写中结合用户文本的快速热词提取方法的程序,处理器通过运行存储在存储器的程序从而执行电子设备的各种功能应用以及数据处理。
上述实施例与的本发明的一种语音转写中结合用户文本的快速热词方法对应的实施例相类似,此处不再赘述。
本发明还提供的一种存储介质,该存储介质的存在形式可以是只读存储器,磁盘或光盘等。存储介质存储有计算机可执行指令,计算机可执行指令在由处理器执行时,执行上文所述的任何方法。
以上对本申请所提供的一种语音转写中结合用户文本的快速热词提取方法和装置,进行了详细介绍,但不应理解为对本发明专利范围的限制;同时,对于本领域的一般技术人员来说,其它未具体描述的部分,属于现有技术或公知常识。在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种语音转写中结合用户文本的快速热词提取方法,其特征在于,包括以下步骤:
1)对用户提供的行业语音文本即用户文本,进行分词预处理;
2)对用户文本的分词预处理结果进行词频分析,获取用户当前文本词频;
3)分析获取在用户当前文本词频中大于设置的词频阈值n1,而在已有语音转写模型训练语料词频中小于设置的词频阈值n2的词,作为用户当前热词集;
4)将用户当前热词集与历史热词库进行递归合并,重新调节热词的权重得到用户当前热词库;
5)基于用户当前热词库,进行语音转文本。
2.根据权利要求1所述的一种语音转写中结合用户文本的快速热词提取方法,其特征在于,所述步骤1)中分词预处理包括以下步骤:
所述分词预处理操作通过jieba分词工具完成,在分词预处理操作之前根据用户需求添加自定义词典,确保用户文本中的特殊词在分词处理时不被拆分,并根据用户需求设置停用词;
对用户文本合并汇总后,通过jieba分词工具进行分词处理,生成分词后的用户文本文件。
3.根据权利要求1所述的一种语音转写中结合用户文本的快速热词提取方法,其特征在于,所述步骤2)中获取用户当前文本词频的具体步骤如下:
将所述分词后的用户文本文件通过语言模型训练工具SRILM生成词频统计文件。
4.根据权利要求3所述的一种语音转写中结合用户文本的快速热词提取方法,其特征在于,所述步骤3)中确定用户当前热词集的具体步骤如下:
分析筛选出用户当前文本词频统计文件中满足预置条件的词,即在用户当前文本词频中词频高于词频阈值n1而在语音转写模型训练语料词频中词频低于词频阈值n2的词,作为用户当前热词集。
5.根据权利要求3所述的一种语音转写中结合用户文本的快速热词提取方法,其特征在于,所述步骤4)中重新获取用户当前热词库的具体步骤如下:
在用户当前热词集中去除与历史热词库中重复的热词;
将用户当前文本词频统计文件与历史文本词频统计文件合并,计算用户当前热词集与历史热词库所有热词在合并的文本词频统计文件中的出现概率;
根据用户当前热词集与历史热词库所有热词在合并的文本词频统计文件中的出现概率,进行递归合并得到该用户当前热词库,如果用户没有历史热词库,则用户当前热词集即为用户当前热词库;
然后依据用户当前热词库热词的出现概率自动重新调节热词权重,且用户自定义特殊热词的热词权重。
6.根据权利要求5所述的一种语音转写中结合用户文本的快速热词提取方法,其特征在于,所述步骤5)中进行语音转文本的具体步骤如下:
导入含有用户当前热词库中的热词的语音,语音转写引擎更倾向于识别出用户当前热词库中的热词。
7.一种语音转写中结合用户文本的快速热词提取装置,其特征在于,包括:
用户文本预处理模块,用于对用户提供的行业语音文本即用户文本,进行分词预处理;
用户当前文本词频获取模块,用于对用户文本的分词预处理结果进行词频分析,获取用户当前文本词频;
用户当前热词集获取模块,用于分析获取在用户当前文本词频中大于设置的词频阈值n1,而在已有语音转写模型训练语料词频中小于设置的词频阈值n2的词,作为用户当前热词集;
用户当前热词库获取模块,用于将用户当前热词集与历史热词库进行递归合并,重新调节热词的权重得到用户当前热词库;
语音转写模块,用于基于用户当前热词库,进行语音转文本。
8.根据权利要求7所述一种语音转写中结合用户文本的快速热词提取装置,其特征在于,所述用户当前热词库获取模块用于在用户当前热词集中去除与历史热词库中重复的热词;
将用户当前文本词频统计文件与历史文本词频统计文件合并,计算用户当前热词集与历史热词库所有热词在合并的文本词频统计文件中的出现概率;
根据用户当前热词集与历史热词库所有热词在合并的文本词频统计文件中的出现概率,进行递归合并得到该用户当前热词库,如果用户没有历史热词库,则用户当前热词集即为用户当前热词库;
然后依据用户当前热词库热词的出现概率自动重新调节热词权重,且用户自定义特殊热词的热词权重;
并通过语音转写模块导入含有用户当前热词库中的热词的语音,语音转写引擎更倾向于识别出用户当前热词库中的热词。
9.一种电子设备,其特征在于,所述电子设备包括:
存储器,用于存储指令;
处理器,用于调用所述存储器存储的指令执行权利要求1-6中任一项所述的一种语音转写中结合用户文本的快速热词提取方法。
10.一种存储介质,其特征在于,所述存储介质存储有计算机可执行指令,所述计算机可执行指令执行权利要求1-6中任一项所述的一种语音转写中结合用户文本的快速热词提取方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111173936.0A CN114254628A (zh) | 2021-10-09 | 2021-10-09 | 一种语音转写中结合用户文本的快速热词提取方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111173936.0A CN114254628A (zh) | 2021-10-09 | 2021-10-09 | 一种语音转写中结合用户文本的快速热词提取方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114254628A true CN114254628A (zh) | 2022-03-29 |
Family
ID=80790319
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111173936.0A Pending CN114254628A (zh) | 2021-10-09 | 2021-10-09 | 一种语音转写中结合用户文本的快速热词提取方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114254628A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115577712B (zh) * | 2022-12-06 | 2023-04-21 | 共道网络科技有限公司 | 一种文本纠错方法及装置 |
-
2021
- 2021-10-09 CN CN202111173936.0A patent/CN114254628A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115577712B (zh) * | 2022-12-06 | 2023-04-21 | 共道网络科技有限公司 | 一种文本纠错方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10748528B2 (en) | Language model generating device, language model generating method, and recording medium | |
US6839667B2 (en) | Method of speech recognition by presenting N-best word candidates | |
Schuster et al. | Japanese and korean voice search | |
JP5901001B1 (ja) | 音響言語モデルトレーニングのための方法およびデバイス | |
EP1696421B1 (en) | Learning in automatic speech recognition | |
EP2572355B1 (en) | Voice stream augmented note taking | |
CN109710929A (zh) | 一种语音识别文本的校正方法、装置、计算机设备和存储介质 | |
CN111341305B (zh) | 一种音频数据标注方法、装置及系统 | |
US11024298B2 (en) | Methods and apparatus for speech recognition using a garbage model | |
CN110853628A (zh) | 一种模型训练方法、装置、电子设备及存储介质 | |
US6963834B2 (en) | Method of speech recognition using empirically determined word candidates | |
CN110826301B (zh) | 标点符号添加方法、系统、移动终端及存储介质 | |
CN112232055A (zh) | 一种基于拼音相似度与语言模型的文本检测与纠正方法 | |
CN107123419A (zh) | Sphinx语速识别中背景降噪的优化方法 | |
CN114254628A (zh) | 一种语音转写中结合用户文本的快速热词提取方法、装置、电子设备及存储介质 | |
KR20130126570A (ko) | 핵심어에서의 음소 오류 결과를 고려한 음향 모델 변별 학습을 위한 장치 및 이를 위한 방법이 기록된 컴퓨터 판독 가능한 기록매체 | |
Behre et al. | Smart speech segmentation using acousto-linguistic features with look-ahead | |
Wray et al. | Best practices for crowdsourcing dialectal arabic speech transcription | |
CN110600010B (zh) | 一种语料提取方法及装置 | |
JP2002082690A (ja) | 言語モデル生成方法、音声認識方法及びそのプログラム記録媒体 | |
CN113782008B (zh) | 文本音频对齐方法和装置 | |
CN114023327B (zh) | 基于语音识别的文本修正方法、装置、设备及介质 | |
JP3958908B2 (ja) | 書き起こしテキスト自動生成装置、音声認識装置および記録媒体 | |
CN113838467B (zh) | 语音处理方法、装置及电子设备 | |
CN110930992A (zh) | 数据处理方法、装置、智能终端和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |