WO2019153996A1 - 一种语音识别文本纠错方法及装置 - Google Patents

一种语音识别文本纠错方法及装置 Download PDF

Info

Publication number
WO2019153996A1
WO2019153996A1 PCT/CN2019/070817 CN2019070817W WO2019153996A1 WO 2019153996 A1 WO2019153996 A1 WO 2019153996A1 CN 2019070817 W CN2019070817 W CN 2019070817W WO 2019153996 A1 WO2019153996 A1 WO 2019153996A1
Authority
WO
WIPO (PCT)
Prior art keywords
text
error correction
candidate
speech recognition
user
Prior art date
Application number
PCT/CN2019/070817
Other languages
English (en)
French (fr)
Inventor
叶伟
Original Assignee
叶伟
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 叶伟 filed Critical 叶伟
Publication of WO2019153996A1 publication Critical patent/WO2019153996A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/685Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Definitions

  • the invention belongs to the field of speech recognition technology, and in particular relates to a speech recognition text error correction method and device.
  • the voice recognition error rate is high due to various factors such as user pronunciation and noise.
  • the prior art is focused on improving the accuracy of speech recognition, but lacks the means of correcting the recognition results. The above reasons greatly affect the promotion of voice interactive products.
  • Embodiments of the present invention provide a speech recognition text error correction method and apparatus, and aim to solve the problem of error correction for speech recognition text in speech recognition technology.
  • a speech recognition text error correction method comprising
  • User dictionary library generation method statistics common user corpus, and organize. According to the collated corpus text, text segmentation, part-of-speech tagging, word frequency statistics, and pinyin tagging are performed.
  • Candidate error correction text generation method First, after segmentation of the speech recognition text and removal of the stop word, it is checked whether the words are in the user dictionary library. If it is in the user dictionary, no error correction is performed. If it is not in the user dictionary, it is used as a candidate for error correction.
  • the candidate error correction text generation method firstly, according to the training sample, a judgment model for determining whether the word is the error correction text is generated, wherein the edit distance is used as the model input feature.
  • the candidate error correction text is replaced by all the candidate error correction texts, thereby generating candidate error correction text.
  • the candidate error correction text filtering method all the original user data, including the user ID, the voice interactive text time, the sensor data, the home appliance state and the like as the original input parameters.
  • a user sentence prediction model is constructed by using the user corpus intentions and entities obtained after the collation as outputs. Using the model, parameters such as time of voice interaction, sensor data, and home appliance status are input, thereby obtaining predicted user intentions and entities.
  • the similarity calculation is performed by predicting the obtained user intent and the entity and the candidate error-corrected text, and the candidate-corrected text with the highest similarity is obtained as the only error-corrected text.
  • the embodiment of the present invention constructs a judgment model of the error-corrected text by constructing a technical feature of the user corpus, generates a candidate error-corrected text, and establishes a user sentence prediction model, and uses the model to calculate the error-corrected text of the speech recognition.
  • One of the beneficial effects obtained is that in the field of smart home control, a further implementation scheme is provided for the accuracy of voice recognition control of smart home appliances.
  • FIG. 1 is a flow chart of a user corpus based speech recognition error correction method in an embodiment of the present invention.
  • FIG. 2 is a flow chart showing the construction of a user dictionary library in one embodiment of the present invention.
  • FIG. 3 is a flow chart of constructing a candidate error correction text model in one embodiment of the present invention.
  • FIG. 1 it is a schematic flowchart of a speech recognition result text error correction method. Process steps include
  • S11 Build a user dictionary library.
  • the collected user text corpora are cleaned up, and word segmentation and deactivation are removed.
  • the word segmentation result is based on word frequency, part of speech, and pinyin as a complete index, and a user dictionary library is constructed, and each pinyin is segmented by a separator.
  • S12 quasi-candidate error correction text generation. After the user voice interactive text is removed from the stop word, the result of each word segment is obtained. Check whether the words appear in the user dictionary library. If they appear in each user dictionary, they are not candidates for error correction, and vice versa. At the time of inspection, the words after the completion are checked in the user dictionary library, and if the words are in the user dictionary library, no error correction is required; if the words are not in the user dictionary library, the words are to be corrected.
  • S13 Text generation after candidate error correction. Firstly, according to the previously collected corpus data, the text editing distance, the initial edit distance, the full pinyin edit distance of each corrected text and the corrected text are collected, and the above edit distances are normalized as input features, and candidates are made. Error-corrected text generation model. Calculate the text editing distance, the initial edit distance, and the full pinyin edit distance of each error-correction text and the words in the user dictionary library, and input them as models to obtain which words in the user dictionary library are used as candidate error correction texts. Which is not a candidate for error correction text. If there is only one candidate error correction text, it is used as the text error correction result; if there are multiple candidate error correction texts, the candidate error correction text filtering is continued.
  • S14 Screening from each candidate error correction text to select the most likely error correction text.
  • This step involves the use of machine learning techniques to build a user corpus prediction model based on the user environment.
  • the user corpus prediction model is constructed according to the time, location, sensor data, and home appliance data of the user's voice interaction. Its output mainly includes intent, physical target, and control method. Such as output: home appliance control intention, entity is air conditioning, control mode is heating.
  • the similarity calculation is performed on each error-corrected text and the model output result, and the candidate error-corrected text with the highest similarity is selected as the only error-corrected text.
  • a user dictionary library constructs a flowchart.
  • the user dictionary library generation method includes: counting common corpus of the user's family, and organizing. According to the collated corpus text, text segmentation, part-of-speech tagging, word frequency statistics, and pinyin tagging are constructed to construct a user dictionary library.
  • FIG. 3 a schematic diagram of a candidate error correction text judgment model flow is constructed.
  • the edit distance includes a text edit distance, a first edit edit distance, a full pinyin edit distance, and normalize each edit distance as an input of the model.
  • a speech recognition text error correction method apparatus includes a memory; and one or more processors coupled to the memory, the processor being configured to execute storage in the memory An instruction that performs the following operations:
  • the candidate error correction text set is filtered to obtain the error corrected text.
  • the memory includes a computer readable recording/storage medium such as a random access memory (RAM), a read only memory (ROM), a flash memory, an optical disk, a magnetic disk, a solid state disk, and the like.
  • RAM random access memory
  • ROM read only memory
  • flash memory an optical disk
  • magnetic disk a magnetic disk
  • solid state disk a solid state disk

Abstract

一种语音识别文本纠错方法,该方法包括:生成用户词典库;生成候选待纠错文本集合;生成候选纠错后文本集合;以及对候选纠错后文本集合进行筛选,获得纠错后文本。本发明的实施例通过建立用户语料库的技术特征,构建出纠错后文本的判断模型,生成候选纠错后文本;并且建立用户语句预测模型,利用该模型,计算得到语音识别的纠错后文本,获得的有益效果之一是,在智能家居控制领域,为智能家电的语音识别控制的准确性提供了更进一步的实现方案。

Description

一种语音识别文本纠错方法及装置 技术领域
本发明属于语音识别技术领域,特别涉及一种语音识别文本纠错方法及装置。
背景技术
随着深度学习的普及,在计算机视觉、语音识别、自然语言处理等方面均取得重大突破。以语音识别为例,目前语音识别准确率已达到97%。以上技术的突破,使得语音识别的应用领域越来越广。由于相对于其他人机交互方式,语音交互更为符合人们的日常习惯,更为高效。可以预计,语音识别技术将广泛应用于智能家居、工业生产、通信、医疗、自动驾驶等各个领域。
在实际语音交互过程中,由于用户发音不标准、噪音等各因素影响,音识别错误率较高。而现有技术都集中在提升语音识别准确率上,却缺乏对识别结果的纠错手段。以上原因,极大影响语音交互产品推广。
发明内容
本发明的实施例提供了一种语音识别文本纠错方法及装置,目的在于解决语音识别技术中对于语音识别文本的纠错问题。
本发明的实施例之一,一种语音识别文本纠错方法,包括,
用户词典库生成方法:统计用户家庭常用语料,并进行整理。根据整理后的语料文本,进行文本分词、词性标注、词频统计、拼音标注。
候选待纠错文本生成方法:首先,对语音识别文本进行分词、去除停用词后,检查各词是否在用户词典库中。若在用户词典库中,则不进行纠错。若不在用户词典库中,则作为候选待纠错文本。
候选纠错后文本生成方法:首先根据训练样本,生成判断该词是否是纠错后文本的判断模型,其中将编辑距离作为模型输入特征。将所有候选纠错后文本替换掉待纠错文本,从而生成候选纠错后文本。
在智能家居控制方面,候选纠错后文本筛选方法:将所有原先统计的用户 数据,包括用户ID、语音交互文本时间、传感器数据、家电状态等参数作为原始输入参数。将整理后所得的用户语料意图及实体作为输出,构建用户语句预测模型。利用该模型,将语音交互时时间、传感器数据、家电状态等参数输入,从而获得预测得到的用户意图及实体。将预测所得到的用户意图及实体与候选纠错后文本进行相似度计算,得到相似度最高的候选纠错后文本作为唯一纠错后文本。
本发明的实施例通过建立用户语料库的技术特征,构建出纠错后文本的判断模型,生成候选纠错后文本;并且建立用户语句预测模型,利用该模型,计算得到语音识别的纠错后文本,获得的有益效果之一是,在智能家居控制领域,为智能家电的语音识别控制的准确性提供了更进一步的实现方案。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
图1是本发明一个实施例中的基于用户语料库的语音识别纠错方法的流程图。
图2是本发明一个实施例中用户词典库构建流程图。
图3是本发明一个实施例中构建候选纠错后文本模型流程图。
具体实施方式
根据一个或多个实施例,如图1所示,是语音识别结果文本纠错方法的流程示意图。流程步骤包括,
S11:构建用户词典库。将收集到的各用户文本语料进行清洗整理,并进行分词、去除停用词。将分词结果根据词频、词性、拼音为一个完整索引,构建用户词典库,并且其中各拼音用分割符分割。
S12:准候选待纠错文本生成。将用户语音交互文本经过去除停用词后,获得各分词结果。检查各词是否在用户词典库中出现,若在各用户词典库中出现,则不作为候选待纠错文本,反之则作为候选待纠错文本。检查时,针对分完后的各词一一在用户词典库中检查,若词在用户词典库中则无需纠错;若词不在 用户词典库中才作为待纠错文本。
S13:候选纠错后文本生成。首先根据之前收集到的语料数据,收集整理各待纠正文本与纠正后文本的文本编辑距离、首字母编辑距离、全拼音编辑距离,并将以上各编辑距离进行归一化作为输入特征,进行候选纠错后文本生成模型。计算出各待纠错文本与用户词典库中各词的文本编辑距离、首字母编辑距离、全拼音编辑距离,并将其作为模型输入,得出用户词典库中哪些词作为候选纠错文本,哪些不作为候选纠错文本。如果,只有一个候选纠错后文本,则将其作为文本纠错后结果;如果有多个候选纠错后文本,则继续进行候选纠错后文本筛选。
S14:从各候选纠错后文本中筛选,挑选出最有可能的纠错后文本。该步骤中涉及到利用机器学习技术,构建基于用户环境的用户语料预测模型。根据用户产生语音交互的时间、地点、传感器数据、家电数据等维度构建用户语料预测模型。其输出主要包括意图、实体目标、操控方式。如输出:家电控制意图、实体为空调、操控方式为制热。将各纠错后文本与模型输出结果进行相似度计算,选取相似度最高的候选纠错后文本作为唯一纠错后文本。
根据一个或多个实施例,如图2所示,用户词典库构建流程图。用户词典库生成方法包括:统计用户家庭常用语料,并进行整理。根据整理后的语料文本,进行文本分词、词性标注、词频统计、拼音标注,构建用户词典库。
根据一个或多个实施例,如图3所示,构建候选纠错后文本判断模型流程示意图。
S31,整理原始语音识别文本,并进行脱敏;
S32,人工对原始语音识别文本进行纠错,并记录下各纠错后文本;
S33,统计各待纠错后文本与用户词典库各词编辑距离,此编辑距离包括文本编辑距离、首拼编辑距离、全拼音编辑距离,并将各编辑距离进行归一化,作为模型的输入;
S34,标注词典库中各词是否是最终纠正后文本。若是,则标注为1,若不是则标注为0;
S35,根据以上各标注样本,利用相关机器学习算法,生成判断是否是候选纠错后文本的模型。
根据一个或多个实施例,一种语音识别文本纠错方法装置,该装置包括存储器;以及耦合到所述存储器的一个或多个处理器,处理器被配置为执行存储在所述存储器中的指令,所述处理器执行以下操作:
生成用户词典库;
生成候选待纠错文本集合;
生成候选纠错后文本集合;以及
对候选纠错后文本集合进行筛选,获得纠错后文本。
所述存储器包括计算机可读记录/存储介质,如随机存取存储器(RAM)、只读存储器(ROM)、闪存存储器、光盘、磁盘、固态盘等等。
值得说明的是,虽然前述内容已经参考若干具体实施方式描述了本发明创造的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims (12)

  1. 一种语音识别文本纠错方法,其特征在于,该方法包括:
    生成用户词典库;
    生成候选待纠错文本集合;
    生成候选纠错后文本集合;以及
    对候选纠错后文本集合进行筛选,获得纠错后文本。
  2. 如权利要求1所述语音识别文本纠错方法,其特征在于,生成用户词典库的步骤包括:
    收集用户文本语料,并进行整理;
    对整理后的语料文本进行分词和去除停用词;
    对分词结果进行词性标注、词频统计、拼音标注后构建用户词典库。
  3. 如权利要求1所述语音识别文本纠错方法,其特征在于,生成候选待纠错文本集合的步骤包括:
    对语音识别文本进行分词、去除停用词后,获得各分词结果;
    检查各分词是否在用户词典库中,若在用户词典库中出现,则所述语音识别文本不作为候选待纠错文本,若不在用户词典库中,则所述语音识别文本作为候选待纠错文本。
  4. 如权利要求1所述语音识别文本纠错方法,其特征在于,生成候选纠错后文本集合的步骤包括:
    根据训练样本,生成判断用户词典库中各词是否是候选纠错后文本的判断模型,其中将编辑距离作为模型输入特征;
    将所有候选纠错后文本替换掉待纠错文本,从而生成候选纠错后文本。
  5. 如权利要求1所述语音识别文本纠错方法,其特征在于,对候选纠错后文本集合进行筛选后获得纠错后文本的步骤包括:
    将统计获得的用户数据,作为原始输入参数,将用户语料意图及实体作为输出,构建用户语句预测模型;
    利用用户语句预测模型,将语音识别文本的包括语音交互时间的原始参数输入,从而获得预测得到的用户意图及实体;
    将预测所得到的用户意图及实体与候选纠错后文本进行相似度计算,得到相似度最高的候选纠错后文本作为唯一纠错后文本。
  6. 如权利要求4所述语音识别文本纠错方法,其特征在于,候选纠错后文本判断模型的构建步骤包括:
    整理原始语音识别文本;
    人工对原始语音识别文本进行纠错,并记录下各纠错后文本;
    统计各待纠错后文本与用户词典库各词编辑距离,此编辑距离包括文本编辑距离、首拼编辑距离、全拼音编辑距离,并将各编辑距离进行归一化,作为模型的输入;
    标注用户词典库中各词是否是最终纠正后文本。若是,则标注为1,若不是则标注为0;
    根据各标注样本,利用相关机器学习算法,生成判断是否是候选纠错后文本的模型。
  7. 一种语音识别文本纠错方法装置,其特征在于,该装置包括存储器;以及
    耦合到所述存储器的一个或多个处理器,处理器被配置为执行存储在所述存储器中的指令,所述处理器执行以下操作:
    生成用户词典库;
    生成候选待纠错文本集合;
    生成候选纠错后文本集合;以及
    对候选纠错后文本集合进行筛选,获得纠错后文本。
  8. 如权利要求7所述语音识别文本纠错装置,其特征在于,生成用户词典库的步骤包括:
    收集用户文本语料,并进行整理;
    对整理后的语料文本进行分词和去除停用词;
    对分词结果进行词性标注、词频统计、拼音标注后构建用户词典库。
  9. 如权利要求7所述语音识别文本纠错装置,其特征在于,生成候选待纠错文本集合的步骤包括:
    对语音识别文本进行分词、去除停用词后,获得各分词结果;
    检查各分词是否在用户词典库中,若在用户词典库中出现,则所述语音识别文本不作为候选待纠错文本,若不在用户词典库中,则所述语音识别文本作为候选待纠错文本。
  10. 如权利要求7所述语音识别文本纠错装置,其特征在于,生成候选纠错后文本集合的步骤包括:
    根据训练样本,生成判断用户词典库中各词是否是候选纠错后文本的判断模型,其中将编辑距离作为模型输入特征;
    将所有候选纠错后文本替换掉待纠错文本,从而生成候选纠错后文本。
  11. 如权利要求7所述语音识别文本纠错装置,其特征在于,对候选纠错后文本集合进行筛选后获得纠错后文本的步骤包括:
    将统计获得的用户数据,作为原始输入参数,将用户语料意图及实体作为输出,构建用户语句预测模型;
    利用用户语句预测模型,将语音识别文本的包括语音交互时间的原始参数输入,从而获得预测得到的用户意图及实体;
    将预测所得到的用户意图及实体与候选纠错后文本进行相似度计算,得到相似度最高的候选纠错后文本作为唯一纠错后文本。
  12. 如权利要求7所述语音识别文本纠错装置,其特征在于,候选纠错后文本判断模型的构建步骤包括:
    整理原始语音识别文本;
    人工对原始语音识别文本进行纠错,并记录下各纠错后文本;
    统计各待纠错后文本与用户词典库各词编辑距离,此编辑距离包括文本编辑距离、首拼编辑距离、全拼音编辑距离,并将各编辑距离进行归一化,作为模型的输入;
    标注用户词典库中各词是否是最终纠正后文本。若是,则标注为1,若不是则标注为0;
    根据各标注样本,利用相关机器学习算法,生成判断是否是候选纠错后文本的模型。
PCT/CN2019/070817 2018-02-09 2019-01-08 一种语音识别文本纠错方法及装置 WO2019153996A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810135187.4A CN108304385A (zh) 2018-02-09 2018-02-09 一种语音识别文本纠错方法及装置
CN201810135187.4 2018-02-09

Publications (1)

Publication Number Publication Date
WO2019153996A1 true WO2019153996A1 (zh) 2019-08-15

Family

ID=62864880

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2019/070817 WO2019153996A1 (zh) 2018-02-09 2019-01-08 一种语音识别文本纠错方法及装置

Country Status (2)

Country Link
CN (1) CN108304385A (zh)
WO (1) WO2019153996A1 (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110399608A (zh) * 2019-06-04 2019-11-01 深思考人工智能机器人科技(北京)有限公司 一种基于拼音的对话系统文本纠错系统及方法
CN110765772A (zh) * 2019-10-12 2020-02-07 北京工商大学 拼音作为特征的中文语音识别后的文本神经网络纠错模型
CN111090341A (zh) * 2019-12-24 2020-05-01 科大讯飞股份有限公司 输入法候选结果展示方法、相关设备及可读存储介质
CN111209740A (zh) * 2019-12-31 2020-05-29 中移(杭州)信息技术有限公司 文本模型训练方法、文本纠错方法、电子设备及存储介质
CN111241814A (zh) * 2019-12-31 2020-06-05 中移(杭州)信息技术有限公司 语音识别文本的纠错方法、装置、电子设备及存储介质
CN111274785A (zh) * 2020-01-21 2020-06-12 北京字节跳动网络技术有限公司 一种文本纠错方法、装置、设备及介质
CN111326160A (zh) * 2020-03-11 2020-06-23 南京奥拓电子科技有限公司 一种纠正噪音文本的语音识别方法、系统及存储介质
CN111369996A (zh) * 2020-02-24 2020-07-03 网经科技(苏州)有限公司 一种特定领域的语音识别文本纠错方法
CN111666768A (zh) * 2020-06-10 2020-09-15 京东方科技集团股份有限公司 一种中文命名实体的识别方法、识别装置及电子设备
CN111783433A (zh) * 2019-12-26 2020-10-16 北京沃东天骏信息技术有限公司 一种文本检索纠错方法和装置
CN111897953A (zh) * 2020-07-08 2020-11-06 西北工业大学 一种新型网络媒体平台评论文本分类标注数据纠正方法
CN112241445A (zh) * 2020-10-26 2021-01-19 竹间智能科技(上海)有限公司 一种标注方法及装置、电子设备、存储介质
CN112257437A (zh) * 2020-10-20 2021-01-22 科大讯飞股份有限公司 语音识别纠错方法、装置、电子设备和存储介质
CN112528663A (zh) * 2020-12-18 2021-03-19 中国南方电网有限责任公司 一种电网领域调度场景下的文本纠错方法及系统
CN112685550A (zh) * 2021-01-12 2021-04-20 腾讯科技(深圳)有限公司 智能问答方法、装置、服务器及计算机可读存储介质
CN112885335A (zh) * 2021-01-22 2021-06-01 北京读我科技有限公司 语音识别方法及相关装置
CN113674743A (zh) * 2021-08-20 2021-11-19 云知声(上海)智能科技有限公司 用于自然语言处理中asr结果替换处理设备及处理方法
CN113763961A (zh) * 2020-06-02 2021-12-07 阿里巴巴集团控股有限公司 一种文本处理方法及装置
CN113823274A (zh) * 2021-08-16 2021-12-21 华南理工大学 基于检测错误加权编辑距离的语音关键词样本筛选方法
CN114398463A (zh) * 2021-12-30 2022-04-26 南京硅基智能科技有限公司 一种语音跟踪方法及装置、存储介质、电子设备

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304385A (zh) * 2018-02-09 2018-07-20 叶伟 一种语音识别文本纠错方法及装置
CN109325227A (zh) * 2018-09-14 2019-02-12 北京字节跳动网络技术有限公司 用于生成修正语句的方法和装置
CN109376362A (zh) * 2018-11-30 2019-02-22 武汉斗鱼网络科技有限公司 一种纠错文本的确定方法以及相关设备
CN109614621B (zh) * 2018-12-11 2023-09-19 中国移动通信集团江苏有限公司 一种校正文本的方法、装置及设备
CN111368506B (zh) * 2018-12-24 2023-04-28 阿里巴巴集团控股有限公司 文本处理方法及装置
CN109948144B (zh) * 2019-01-29 2022-12-06 汕头大学 一种基于课堂教学情境的教师话语智能处理的方法
CN110399607B (zh) * 2019-06-04 2023-04-07 深思考人工智能机器人科技(北京)有限公司 一种基于拼音的对话系统文本纠错系统及方法
CN110245606B (zh) * 2019-06-13 2021-07-20 广东小天才科技有限公司 一种文本识别方法、装置、设备及存储介质
CN110647987A (zh) * 2019-08-22 2020-01-03 腾讯科技(深圳)有限公司 一种应用程序中数据的处理方法、装置、电子设备及存储介质
CN110765763B (zh) * 2019-09-24 2023-12-12 金蝶软件(中国)有限公司 语音识别文本的纠错方法、装置、计算机设备和存储介质
CN110782881A (zh) * 2019-10-25 2020-02-11 四川长虹电器股份有限公司 一种语音识别及实体识别后的影视实体纠错方法
CN110782892B (zh) * 2019-10-25 2022-03-25 四川长虹电器股份有限公司 语音文本纠错方法
CN111339757A (zh) * 2020-02-13 2020-06-26 上海凯岸信息科技有限公司 一种催收场景下语音识别结果的纠错方法
CN111401012B (zh) * 2020-03-09 2023-11-21 北京声智科技有限公司 文本纠错方法、电子设备及计算机可读存储介质
CN111753531B (zh) * 2020-06-28 2024-03-12 平安科技(深圳)有限公司 基于人工智能的文本纠错方法、装置、设备及存储介质
CN111985234B (zh) * 2020-09-08 2022-02-01 四川长虹电器股份有限公司 语音文本纠错方法
CN112133295B (zh) * 2020-11-09 2024-02-13 北京小米松果电子有限公司 语音识别方法、装置及存储介质
CN113012705B (zh) * 2021-02-24 2022-12-09 海信视像科技股份有限公司 一种语音文本的纠错方法及装置
CN116136957B (zh) * 2023-04-18 2023-07-07 之江实验室 一种基于意图一致性的文本纠错方法、装置和介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020165716A1 (en) * 2001-05-02 2002-11-07 International Business Machines Corporation Error corrective mechanisms for consensus decoding of speech
CN105374356A (zh) * 2014-08-29 2016-03-02 株式会社理光 语音识别方法、语音评分方法、语音识别系统及语音评分系统
CN105976818A (zh) * 2016-04-26 2016-09-28 Tcl集团股份有限公司 指令识别的处理方法及装置
CN107045496A (zh) * 2017-04-19 2017-08-15 畅捷通信息技术股份有限公司 语音识别后文本的纠错方法及纠错装置
CN108304385A (zh) * 2018-02-09 2018-07-20 叶伟 一种语音识别文本纠错方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150024188A (ko) * 2013-08-26 2015-03-06 삼성전자주식회사 음성 데이터에 대응하는 문자 데이터를 변경하는 방법 및 이를 위한 전자 장치
CN107220235B (zh) * 2017-05-23 2021-01-22 北京百度网讯科技有限公司 基于人工智能的语音识别纠错方法、装置及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020165716A1 (en) * 2001-05-02 2002-11-07 International Business Machines Corporation Error corrective mechanisms for consensus decoding of speech
CN105374356A (zh) * 2014-08-29 2016-03-02 株式会社理光 语音识别方法、语音评分方法、语音识别系统及语音评分系统
CN105976818A (zh) * 2016-04-26 2016-09-28 Tcl集团股份有限公司 指令识别的处理方法及装置
CN107045496A (zh) * 2017-04-19 2017-08-15 畅捷通信息技术股份有限公司 语音识别后文本的纠错方法及纠错装置
CN108304385A (zh) * 2018-02-09 2018-07-20 叶伟 一种语音识别文本纠错方法及装置

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110399608B (zh) * 2019-06-04 2023-04-25 深思考人工智能机器人科技(北京)有限公司 一种基于拼音的对话系统文本纠错系统及方法
CN110399608A (zh) * 2019-06-04 2019-11-01 深思考人工智能机器人科技(北京)有限公司 一种基于拼音的对话系统文本纠错系统及方法
CN110765772A (zh) * 2019-10-12 2020-02-07 北京工商大学 拼音作为特征的中文语音识别后的文本神经网络纠错模型
CN111090341A (zh) * 2019-12-24 2020-05-01 科大讯飞股份有限公司 输入法候选结果展示方法、相关设备及可读存储介质
CN111783433A (zh) * 2019-12-26 2020-10-16 北京沃东天骏信息技术有限公司 一种文本检索纠错方法和装置
CN111209740B (zh) * 2019-12-31 2023-08-15 中移(杭州)信息技术有限公司 文本模型训练方法、文本纠错方法、电子设备及存储介质
CN111241814A (zh) * 2019-12-31 2020-06-05 中移(杭州)信息技术有限公司 语音识别文本的纠错方法、装置、电子设备及存储介质
CN111209740A (zh) * 2019-12-31 2020-05-29 中移(杭州)信息技术有限公司 文本模型训练方法、文本纠错方法、电子设备及存储介质
CN111241814B (zh) * 2019-12-31 2023-04-28 中移(杭州)信息技术有限公司 语音识别文本的纠错方法、装置、电子设备及存储介质
CN111274785A (zh) * 2020-01-21 2020-06-12 北京字节跳动网络技术有限公司 一种文本纠错方法、装置、设备及介质
CN111274785B (zh) * 2020-01-21 2023-06-20 北京字节跳动网络技术有限公司 一种文本纠错方法、装置、设备及介质
CN111369996B (zh) * 2020-02-24 2023-08-18 网经科技(苏州)有限公司 一种特定领域的语音识别文本纠错方法
CN111369996A (zh) * 2020-02-24 2020-07-03 网经科技(苏州)有限公司 一种特定领域的语音识别文本纠错方法
CN111326160A (zh) * 2020-03-11 2020-06-23 南京奥拓电子科技有限公司 一种纠正噪音文本的语音识别方法、系统及存储介质
CN113763961B (zh) * 2020-06-02 2024-04-09 阿里巴巴集团控股有限公司 一种文本处理方法及装置
CN113763961A (zh) * 2020-06-02 2021-12-07 阿里巴巴集团控股有限公司 一种文本处理方法及装置
CN111666768A (zh) * 2020-06-10 2020-09-15 京东方科技集团股份有限公司 一种中文命名实体的识别方法、识别装置及电子设备
CN111897953A (zh) * 2020-07-08 2020-11-06 西北工业大学 一种新型网络媒体平台评论文本分类标注数据纠正方法
CN111897953B (zh) * 2020-07-08 2022-12-30 西北工业大学 一种网络媒体平台评论文本分类标注数据纠正方法
CN112257437A (zh) * 2020-10-20 2021-01-22 科大讯飞股份有限公司 语音识别纠错方法、装置、电子设备和存储介质
CN112257437B (zh) * 2020-10-20 2024-02-13 中国科学技术大学 语音识别纠错方法、装置、电子设备和存储介质
CN112241445B (zh) * 2020-10-26 2023-11-07 竹间智能科技(上海)有限公司 一种标注方法及装置、电子设备、存储介质
CN112241445A (zh) * 2020-10-26 2021-01-19 竹间智能科技(上海)有限公司 一种标注方法及装置、电子设备、存储介质
CN112528663B (zh) * 2020-12-18 2024-02-20 中国南方电网有限责任公司 一种电网领域调度场景下的文本纠错方法及系统
CN112528663A (zh) * 2020-12-18 2021-03-19 中国南方电网有限责任公司 一种电网领域调度场景下的文本纠错方法及系统
CN112685550B (zh) * 2021-01-12 2023-08-04 腾讯科技(深圳)有限公司 智能问答方法、装置、服务器及计算机可读存储介质
CN112685550A (zh) * 2021-01-12 2021-04-20 腾讯科技(深圳)有限公司 智能问答方法、装置、服务器及计算机可读存储介质
CN112885335A (zh) * 2021-01-22 2021-06-01 北京读我科技有限公司 语音识别方法及相关装置
CN113823274B (zh) * 2021-08-16 2023-10-27 华南理工大学 基于检测错误加权编辑距离的语音关键词样本筛选方法
CN113823274A (zh) * 2021-08-16 2021-12-21 华南理工大学 基于检测错误加权编辑距离的语音关键词样本筛选方法
CN113674743A (zh) * 2021-08-20 2021-11-19 云知声(上海)智能科技有限公司 用于自然语言处理中asr结果替换处理设备及处理方法
CN114398463B (zh) * 2021-12-30 2023-08-11 南京硅基智能科技有限公司 一种语音跟踪方法及装置、存储介质、电子设备
CN114398463A (zh) * 2021-12-30 2022-04-26 南京硅基智能科技有限公司 一种语音跟踪方法及装置、存储介质、电子设备

Also Published As

Publication number Publication date
CN108304385A (zh) 2018-07-20

Similar Documents

Publication Publication Date Title
WO2019153996A1 (zh) 一种语音识别文本纠错方法及装置
CN109146610B (zh) 一种智能保险推荐方法、装置及智能保险机器人设备
CN110096570B (zh) 一种应用于智能客服机器人的意图识别方法及装置
CN109472033B (zh) 文本中的实体关系抽取方法及系统、存储介质、电子设备
TWI664540B (zh) Search word error correction method and device, and weighted edit distance calculation method and device
EP3230896B1 (en) Localization complexity of arbitrary language assets and resources
WO2018157805A1 (zh) 一种自动问答处理方法及自动问答系统
CN108052499B (zh) 基于人工智能的文本纠错方法、装置及计算机可读介质
CN107315737A (zh) 一种语义逻辑处理方法及系统
CN108806671B (zh) 语义分析方法、装置及电子设备
CN110414004B (zh) 一种核心信息提取的方法和系统
CN110442859B (zh) 标注语料生成方法、装置、设备及存储介质
CN111931795B (zh) 基于子空间稀疏特征融合的多模态情感识别方法及系统
US11869501B2 (en) Processing multi-party conversations
CN115357719B (zh) 基于改进bert模型的电力审计文本分类方法及装置
CN106257455A (zh) 一种基于依存关系模板抽取观点评价对象的Bootstrapping算法
CN111143571B (zh) 实体标注模型的训练方法、实体标注方法以及装置
CN111180025A (zh) 表示病历文本向量的方法、装置及问诊系统
CN111462752B (zh) 基于注意力机制、特征嵌入及bi-lstm的客户意图识别方法
CN111553159A (zh) 一种问句生成方法及系统
CN113705207A (zh) 语法错误识别方法及装置
CN112749277A (zh) 医学数据的处理方法、装置及存储介质
CN109977391A (zh) 一种文本数据的信息抽取方法及装置
CN114741512A (zh) 一种文本自动分类方法及系统
Menon et al. Deep learning based transcribing and summarizing clinical conversations

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19751872

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19751872

Country of ref document: EP

Kind code of ref document: A1