CN106328145A - 语音修正方法及装置 - Google Patents

语音修正方法及装置 Download PDF

Info

Publication number
CN106328145A
CN106328145A CN201610696696.5A CN201610696696A CN106328145A CN 106328145 A CN106328145 A CN 106328145A CN 201610696696 A CN201610696696 A CN 201610696696A CN 106328145 A CN106328145 A CN 106328145A
Authority
CN
China
Prior art keywords
text
predetermined keyword
editor
content
urtext
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610696696.5A
Other languages
English (en)
Other versions
CN106328145B (zh
Inventor
黄丽丰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisound Intelligent Technology Co Ltd
Xiamen Yunzhixin Intelligent Technology Co Ltd
Original Assignee
Beijing Yunzhisheng Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yunzhisheng Information Technology Co Ltd filed Critical Beijing Yunzhisheng Information Technology Co Ltd
Priority to CN201610696696.5A priority Critical patent/CN106328145B/zh
Publication of CN106328145A publication Critical patent/CN106328145A/zh
Application granted granted Critical
Publication of CN106328145B publication Critical patent/CN106328145B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明是关于一种语音修正方法及装置,其中,方法包括:获取用户输入的语音信息;对所述语音信息进行识别,以得到所述语音信息对应的文本内容;当所述文本内容中包含第一预设关键词时,根据所述第一预设关键词将所述文本内容划分为原始文本和编辑文本,其中,所述编辑文本用于对所述原始文本进行修改;根据所述编辑文本从所述原始文本中提取出待修改文本;根据所述编辑文本和所述待修改文本修改所述原始文本,以得到修改后的文本。通过该技术方案,可以根据编辑文本对原始文本进行修改。用户只要语音输入修改内容就可以实现对文本内容的修改,方便用户的操作,提升了用户的使用体验。

Description

语音修正方法及装置
技术领域
本发明涉及语音纠错技术领域,尤其涉及一种语音修正方法及装置。
背景技术
语音处理的过程中,在通过语义进行理解的时候,依赖于语音识别的效果。如果语音识别效果较差,则会影响语义分析的效果。并且,在识别出语音对应的文字后,如果用户想要修改其中的某些文字,则可能需要手动进行修改,或者取消已输入的语音,重新进行输入,用户体验不佳。
发明内容
本发明实施例提供一种语音修正方法及装置,用以实现方便用户进行语音修正,提升用户的使用体验。
根据本发明实施例的第一方面,提供一种语音修正方法,用于终端设备,包括:
获取用户输入的语音信息;
对所述语音信息进行识别,以得到所述语音信息对应的文本内容;
当所述文本内容中包含第一预设关键词时,根据所述第一预设关键词将所述文本内容划分为原始文本和编辑文本,其中,所述编辑文本用于对所述原始文本进行修改;
根据所述编辑文本从所述原始文本中提取出待修改文本;
根据所述编辑文本和所述待修改文本修改所述原始文本,以得到修改后的文本。
在该实施例中,用户在输入语音信息时,如果部分语音信息需要进行修改,则可以直接输入需修改的语音信息,其中,在这部分信息中,包含第一预设关键词,第一预设关键词相当于一个语音开关,只要检测到这个第一预设关键词,就可以对语音信息对应的文字内容进行划分,从而确定用户输入的原始文本,和修改内容对应的编辑文本,这样,可以根据编辑文本对原始文本进行修改。通过该技术方案,用户只要语音输入修改内容就可以实现对文本内容的修改,方便用户的操作,提升了用户的使用体验。
在一个实施例中,所述根据所述第一预设关键词将所述文本内容划分为原始文本和编辑文本,包括:
确定所述第一预设关键词在所述文本内容中所处的位置;
将所述第一预设关键词之前的文本内容确定为原始文本,将所述第一预设关键词之后的文本内容确定为编辑文本。
在该实施例中,可以根据第一预设关键词的位置,对文本内容进行划分,其中,可以将第一预设关键词作为划分标记,该关键词前边的文本内容,都划分为原始文本,该关键词后边的文本,都划分为编辑文本。这样,方便对文本内容进行划分。
在一个实施例中,所述根据所述编辑文本从所述原始文本中提取出待修改文本,包括:
根据所述编辑文本的起始字符和终止字符,从所述原始文本中查找出与所述编辑文本对应的相似度大于预设相似度的目标文本;
将所述目标文本与所述编辑文本进行对比,将所述目标文本中与所述编辑文本中的内容不同的文本确定为所述待修改文本。
在该实施例中,可以根据编辑文本的起始字符和终止字符,从原始文本中查找出与编辑文本对应的相似度大于预设相似度的目标文本,例如,根据编辑文本的起始字符和终止字符,在原始文本中查找与起始字符和终止字符相同或相似的字符,将起始到终止字符这段的文本确定为目标文本,并从目标文本中,查找出与编辑文本中内容不同的修改文本,这个修改文本即为需要进行修改的内容。
在一个实施例中,所述根据所述编辑文本和所述待修改文本修改所述原始文本,包括:
使用所述编辑文本中与所述待修改文本对应的文本替换所述原始文本中的待修改文本。
在该实施例中,使用编辑文本中与待修改文本对应的文本替换原始文本中的待修改文本,从而实现对原始文本的修改。
在一个实施例中,所述方法还包括:
检测所述文本内容中是否包含预设字符替换库中的第二预设关键词;
当所述文本内容中包含所述第二预设关键词时,从所述预设字符替换库中获取与所述第二预设关键词对应的目标预设关键词;
使用所述目标预设关键词替换所述文本内容中的第二预设关键词。
在该实施例中,还可以检测文字内容中是否包含预设字符替换中的第二预设关键词,如果包含,则获取预设字符替换库中第二预设关键词对应的目标预设关键词,从而使用该目标预设关键词替换第二预设关键词,从而使得文本内容更符合要求,更准确。
根据本发明实施例的第二方面,提供一种语音修正装置,包括:
第一获取模块,用于获取用户输入的语音信息;
识别模块,用于对所述语音信息进行识别,以得到所述语音信息对应的文本内容;
划分模块,用于当所述文本内容中包含第一预设关键词时,根据所述第一预设关键词将所述文本内容划分为原始文本和编辑文本,其中,所述编辑文本用于对所述原始文本进行修改;
提取模块,用于根据所述编辑文本从所述原始文本中提取出待修改文本;
修正模块,用于根据所述编辑文本和所述待修改文本修改所述原始文本,以得到修改后的文本。
在一个实施例中,所述划分模块包括:
第一确定子模块,用于确定所述第一预设关键词在所述文本内容中所处的位置;
第二确定子模块,用于将所述第一预设关键词之前的文本内容确定为原始文本,将所述第一预设关键词之后的文本内容确定为编辑文本。
在一个实施例中,所述提取模块包括:
查找子模块,用于根据所述编辑文本的起始字符和终止字符,从所述原始文本中查找出与所述编辑文本对应的相似度大于预设相似度的目标文本;
对比子模块,用于将所述目标文本与所述编辑文本进行对比,将所述目标文本中与所述编辑文本中的内容不同的文本确定为所述待修改文本。
在一个实施例中,所述修正模块用于:
使用所述编辑文本中与所述待修改文本对应的文本替换所述原始文本中的待修改文本。
在一个实施例中,所述装置还包括:
检测模块,用于检测所述文本内容中是否包含预设字符替换库中的第二预设关键词;
第二获取模块,用于当所述文本内容中包含所述第二预设关键词时,从所述预设字符替换库中获取与所述第二预设关键词对应的目标预设关键词;
替换模块,用于使用所述目标预设关键词替换所述文本内容中的第二预设关键词。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种语音修正方法的流程图。
图2是根据一示例性实施例示出的一种语音修正方法中步骤S103的流程图。
图3是根据一示例性实施例示出的一种语音修正方法中步骤S104的流程图。
图4是根据一示例性实施例示出的一种语音修正方法中步骤S105的流程图。
图5是根据一示例性实施例示出的另一种语音修正方法的流程图。
图6是根据一示例性实施例示出的一种语音修正装置的框图。
图7是根据一示例性实施例示出的一种语音修正装置中划分模块的框图。
图8是根据一示例性实施例示出的一种语音修正装置中提取模块的框图。
图9是根据一示例性实施例示出的另一种语音修正装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种语音修正方法的流程图。该语音修正方法应用于终端设备中,该终端设备可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等任一具有语音控制功能的设备。如图1所示,该方法包括步骤S101-S105:
在步骤S101中,获取用户输入的语音信息;
在步骤S102中,对语音信息进行识别,以得到语音信息对应的文本内容;
在步骤S103中,当文本内容中包含第一预设关键词时,根据第一预设关键词将文本内容划分为原始文本和编辑文本,其中,编辑文本用于对原始文本进行修改;
其中,第一预设关键词可以根据需要自行设置,如设置“不对”为第一预设关键词。
在步骤S104中,根据编辑文本从原始文本中提取出待修改文本;
例如,识别出用户输入的语音信息对应的文字内容为“患者体温是37度,不对是36度”,此时,检测到第一预设关键词“不对”,根据该关键词,确定“患者体温是37度”为原始文本,“是36度”为编辑文本,根据编辑文本和原始文本,确定待修改文本为“37”。
在步骤S105中,根据编辑文本和待修改文本修改原始文本,以得到修改后的文本。
如上述例子,根据编辑文本“是36度”和待修改文本“37”,将原始文本中的“37”修改为“36”,则修改后的文本为“患者体温是36度”。
在该实施例中,用户在输入语音信息时,如果部分语音信息需要进行修改,则可以直接输入需修改的语音信息,其中,在这部分信息中,包含第一预设关键词,第一预设关键词相当于一个语音开关,只要检测到这个第一预设关键词,就可以对语音信息对应的文字内容进行划分,从而确定用户输入的原始文本,和修改内容对应的编辑文本,这样,可以根据编辑文本对原始文本进行修改。通过该技术方案,用户只要语音输入修改内容就可以实现对文本内容的修改,方便用户的操作,提升了用户的使用体验。
图2是根据一示例性实施例示出的一种语音修正方法中步骤S103的流程图。
如图2所示,在一个实施例中,上述步骤S103包括步骤S201-S202:
在步骤S201中,确定第一预设关键词在文本内容中所处的位置;
在步骤S202中,将第一预设关键词之前的文本内容确定为原始文本,将第一预设关键词之后的文本内容确定为编辑文本。
在该实施例中,可以根据第一预设关键词的位置,对文本内容进行划分,其中,可以将第一预设关键词作为划分标记,该关键词前边的文本内容,都划分为原始文本,该关键词后边的文本,都划分为编辑文本。这样,方便对文本内容进行划分。
例如,识别出用户输入的语音信息对应的文字内容为“患者体温是37度,不对是36度”,此时,检测到第一预设关键词“不对”,根据该关键词,确定“患者体温是37度”为原始文本,“是36度”为编辑文本。
图3是根据一示例性实施例示出的一种语音修正方法中步骤S104的流程图。
如图3所示,在一个实施例中,上述步骤S104包括步骤S301-S302:
在步骤S301中,根据编辑文本的起始字符和终止字符,从原始文本中查找出与编辑文本对应的相似度大于预设相似度的目标文本;
例如,识别出用户输入的语音信息对应的文字内容为“患者体温是37度,不对是36度”,此时,检测到第一预设关键词“不对”,根据该关键词,确定“患者体温是37度”为原始文本,“是36度”为编辑文本。其中编辑文本“是36度”中“是”为起始字符,“度”为终止字符,则根据该起始字符和终止字符,从原始字符中查找出与编辑文本对应的相似度大于预设相似度的目标文本为“是37度”。
在步骤S302中,将目标文本与编辑文本进行对比,将目标文本中与编辑文本中的内容不同的文本确定为待修改文本。
如上例,将编辑文本“是36度”与目标文本“是37度”进行对比,将目标文本中与编辑文本中的内容不同的文本确定为待修改文本,即将“37”确定为待修改文本。
在该实施例中,可以根据编辑文本的起始字符和终止字符,从原始文本中查找出与编辑文本对应的相似度大于预设相似度的目标文本,例如,根据编辑文本的起始字符和终止字符,在原始文本中查找与起始字符和终止字符相同或相似的字符,将起始到终止字符这段的文本确定为目标文本,并从目标文本中,查找出与编辑文本中内容不同的修改文本,这个修改文本即为需要进行修改的内容。
图4是根据一示例性实施例示出的一种语音修正方法中步骤S105的流程图。
如图4所示,在一个实施例中,上述步骤S105包括步骤S401:
在步骤S401中,使用编辑文本中与待修改文本对应的文本替换原始文本中的待修改文本。
在该实施例中,使用编辑文本中与待修改文本对应的文本替换原始文本中的待修改文本,从而实现对原始文本的修改。
图5是根据一示例性实施例示出的另一种语音修正方法的流程图。
如图5所示,在一个实施例中,在步骤S102之后,上述方法还包括步骤S501-S503:
在步骤S501中,检测文本内容中是否包含预设字符替换库中的第二预设关键词;
其中,预设字符替换库中可以预置一些第二预设关键词和与其对应的目标预设关键词,其中,目标预设关键词比第二预设关键词更精准,如,第二预设关键词为“度”,对应的目标预设关键词为“摄氏度”,第二关键词为“12指肠”,对应的目标预设关键词为“十二指肠”等。
在步骤S502中,当文本内容中包含第二预设关键词时,从预设字符替换库中获取与第二预设关键词对应的目标预设关键词;
在步骤S503中,使用目标预设关键词替换文本内容中的第二预设关键词。
在该实施例中,还可以检测文字内容中是否包含预设字符替换中的第二预设关键词,如果包含,则获取预设字符替换库中第二预设关键词对应的目标预设关键词,从而使用该目标预设关键词替换第二预设关键词,从而使得文本内容更符合要求,更准确。
下述为本发明装置实施例,可以用于执行本发明方法实施例。
图6是根据一示例性实施例示出的一种语音修正装置的框图,该装置可以通过软件、硬件或者两者的结合实现成为终端设备的部分或者全部。如图6所示,该语音修正装置包括:
第一获取模块61,用于获取用户输入的语音信息;
识别模块62,用于对所述语音信息进行识别,以得到所述语音信息对应的文本内容;
划分模块63,用于当所述文本内容中包含第一预设关键词时,根据所述第一预设关键词将所述文本内容划分为原始文本和编辑文本,其中,所述编辑文本用于对所述原始文本进行修改;
其中,第一预设关键词可以根据需要自行设置,如设置“不对”为第一预设关键词。
提取模块64,用于根据所述编辑文本从所述原始文本中提取出待修改文本;
例如,识别出用户输入的语音信息对应的文字内容为“患者体温是37度,不对是36度”,此时,检测到第一预设关键词“不对”,根据该关键词,确定“患者体温是37度”为原始文本,“是36度”为编辑文本,根据编辑文本和原始文本,确定待修改文本为“37”。
修正模块65,用于根据所述编辑文本和所述待修改文本修改所述原始文本,以得到修改后的文本。
如上述例子,根据编辑文本“是36度”和待修改文本“37”,将原始文本中的“37”修改为“36”,则修改后的文本为“患者体温是36度”。
在该实施例中,用户在输入语音信息时,如果部分语音信息需要进行修改,则可以直接输入需修改的语音信息,其中,在这部分信息中,包含第一预设关键词,第一预设关键词相当于一个语音开关,只要检测到这个第一预设关键词,就可以对语音信息对应的文字内容进行划分,从而确定用户输入的原始文本,和修改内容对应的编辑文本,这样,可以根据编辑文本对原始文本进行修改。通过该技术方案,用户只要语音输入修改内容就可以实现对文本内容的修改,方便用户的操作,提升了用户的使用体验。
图7是根据一示例性实施例示出的一种语音修正装置中划分模块的框图。
如图7所示,在一个实施例中,所述划分模块63包括:
第一确定子模块71,用于确定所述第一预设关键词在所述文本内容中所处的位置;
第二确定子模块72,用于将所述第一预设关键词之前的文本内容确定为原始文本,将所述第一预设关键词之后的文本内容确定为编辑文本。
在该实施例中,可以根据第一预设关键词的位置,对文本内容进行划分,其中,可以将第一预设关键词作为划分标记,该关键词前边的文本内容,都划分为原始文本,该关键词后边的文本,都划分为编辑文本。这样,方便对文本内容进行划分。
例如,识别出用户输入的语音信息对应的文字内容为“患者体温是37度,不对是36度”,此时,检测到第一预设关键词“不对”,根据该关键词,确定“患者体温是37度”为原始文本,“是36度”为编辑文本。
图8是根据一示例性实施例示出的一种语音修正装置中提取模块的框图。
如图8所示,在一个实施例中,所述提取模块64包括:
查找子模块81,用于根据所述编辑文本的起始字符和终止字符,从所述原始文本中查找出与所述编辑文本对应的相似度大于预设相似度的目标文本;
例如,识别出用户输入的语音信息对应的文字内容为“患者体温是37度,不对是36度”,此时,检测到第一预设关键词“不对”,根据该关键词,确定“患者体温是37度”为原始文本,“是36度”为编辑文本。其中编辑文本“是36度”中“是”为起始字符,“度”为终止字符,则根据该起始字符和终止字符,从原始字符中查找出与编辑文本对应的相似度大于预设相似度的目标文本为“是37度”。
对比子模块82,用于将所述目标文本与所述编辑文本进行对比,将所述目标文本中与所述编辑文本中的内容不同的文本确定为所述待修改文本。
如上例,将编辑文本“是36度”与目标文本“是37度”进行对比,将目标文本中与编辑文本中的内容不同的文本确定为待修改文本,即将“37”确定为待修改文本。
在该实施例中,可以根据编辑文本的起始字符和终止字符,从原始文本中查找出与编辑文本对应的相似度大于预设相似度的目标文本,例如,根据编辑文本的起始字符和终止字符,在原始文本中查找与起始字符和终止字符相同或相似的字符,将起始到终止字符这段的文本确定为目标文本,并从目标文本中,查找出与编辑文本中内容不同的修改文本,这个修改文本即为需要进行修改的内容。
在一个实施例中,所述修正模块65用于:
使用所述编辑文本中与所述待修改文本对应的文本替换所述原始文本中的待修改文本。
在该实施例中,使用编辑文本中与待修改文本对应的文本替换原始文本中的待修改文本,从而实现对原始文本的修改。
图9是根据一示例性实施例示出的另一种语音修正装置的框图。
如图9所示,在一个实施例中,上述装置还包括:
检测模块91,用于检测所述文本内容中是否包含预设字符替换库中的第二预设关键词;
其中,预设字符替换库中可以预置一些第二预设关键词和与其对应的目标预设关键词,其中,目标预设关键词比第二预设关键词更精准,如,第二预设关键词为“度”,对应的目标预设关键词为“摄氏度”,第二关键词为“12指肠”,对应的目标预设关键词为“十二指肠”等。
第二获取模块92,用于当所述文本内容中包含所述第二预设关键词时,从所述预设字符替换库中获取与所述第二预设关键词对应的目标预设关键词;
替换模块93,用于使用所述目标预设关键词替换所述文本内容中的第二预设关键词。
在该实施例中,还可以检测文字内容中是否包含预设字符替换中的第二预设关键词,如果包含,则获取预设字符替换库中第二预设关键词对应的目标预设关键词,从而使用该目标预设关键词替换第二预设关键词,从而使得文本内容更符合要求,更准确。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种语音修正方法,用于终端设备,其特征在于,包括:
获取用户输入的语音信息;
对所述语音信息进行识别,以得到所述语音信息对应的文本内容;
当所述文本内容中包含第一预设关键词时,根据所述第一预设关键词将所述文本内容划分为原始文本和编辑文本,其中,所述编辑文本用于对所述原始文本进行修改;
根据所述编辑文本从所述原始文本中提取出待修改文本;
根据所述编辑文本和所述待修改文本修改所述原始文本,以得到修改后的文本。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一预设关键词将所述文本内容划分为原始文本和编辑文本,包括:
确定所述第一预设关键词在所述文本内容中所处的位置;
将所述第一预设关键词之前的文本内容确定为原始文本,将所述第一预设关键词之后的文本内容确定为编辑文本。
3.根据权利要求1所述的方法,其特征在于,所述根据所述编辑文本从所述原始文本中提取出待修改文本,包括:
根据所述编辑文本的起始字符和终止字符,从所述原始文本中查找出与所述编辑文本对应的相似度大于预设相似度的目标文本;
将所述目标文本与所述编辑文本进行对比,将所述目标文本中与所述编辑文本中的内容不同的文本确定为所述待修改文本。
4.根据权利要求3所述的方法,其特征在于,所述根据所述编辑文本和所述待修改文本修改所述原始文本,包括:
使用所述编辑文本中与所述待修改文本对应的文本替换所述原始文本中的待修改文本。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
检测所述文本内容中是否包含预设字符替换库中的第二预设关键词;
当所述文本内容中包含所述第二预设关键词时,从所述预设字符替换库中获取与所述第二预设关键词对应的目标预设关键词;
使用所述目标预设关键词替换所述文本内容中的第二预设关键词。
6.一种语音修正装置,用于终端设备,其特征在于,包括:
第一获取模块,用于获取用户输入的语音信息;
识别模块,用于对所述语音信息进行识别,以得到所述语音信息对应的文本内容;
划分模块,用于当所述文本内容中包含第一预设关键词时,根据所述第一预设关键词将所述文本内容划分为原始文本和编辑文本,其中,所述编辑文本用于对所述原始文本进行修改;
提取模块,用于根据所述编辑文本从所述原始文本中提取出待修改文本;
修正模块,用于根据所述编辑文本和所述待修改文本修改所述原始文本,以得到修改后的文本。
7.根据权利要求6所述的装置,其特征在于,所述划分模块包括:
第一确定子模块,用于确定所述第一预设关键词在所述文本内容中所处的位置;
第二确定子模块,用于将所述第一预设关键词之前的文本内容确定为原始文本,将所述第一预设关键词之后的文本内容确定为编辑文本。
8.根据权利要求6所述的装置,其特征在于,所述提取模块包括:
查找子模块,用于根据所述编辑文本的起始字符和终止字符,从所述原始文本中查找出与所述编辑文本对应的相似度大于预设相似度的目标文本;
对比子模块,用于将所述目标文本与所述编辑文本进行对比,将所述目标文本中与所述编辑文本中的内容不同的文本确定为所述待修改文本。
9.根据权利要求8所述的装置,其特征在于,所述修正模块用于:
使用所述编辑文本中与所述待修改文本对应的文本替换所述原始文本中的待修改文本。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
检测模块,用于检测所述文本内容中是否包含预设字符替换库中的第二预设关键词;
第二获取模块,用于当所述文本内容中包含所述第二预设关键词时,从所述预设字符替换库中获取与所述第二预设关键词对应的目标预设关键词;
替换模块,用于使用所述目标预设关键词替换所述文本内容中的第二预设关键词。
CN201610696696.5A 2016-08-19 2016-08-19 语音修正方法及装置 Active CN106328145B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610696696.5A CN106328145B (zh) 2016-08-19 2016-08-19 语音修正方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610696696.5A CN106328145B (zh) 2016-08-19 2016-08-19 语音修正方法及装置

Publications (2)

Publication Number Publication Date
CN106328145A true CN106328145A (zh) 2017-01-11
CN106328145B CN106328145B (zh) 2019-10-11

Family

ID=57742078

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610696696.5A Active CN106328145B (zh) 2016-08-19 2016-08-19 语音修正方法及装置

Country Status (1)

Country Link
CN (1) CN106328145B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106940595A (zh) * 2017-03-16 2017-07-11 北京云知声信息技术有限公司 一种信息编辑方法及装置
CN107273364A (zh) * 2017-05-15 2017-10-20 百度在线网络技术(北京)有限公司 一种语音翻译方法和装置
CN107945802A (zh) * 2017-10-23 2018-04-20 北京云知声信息技术有限公司 语音识别结果处理方法及装置
WO2018157789A1 (zh) * 2017-03-02 2018-09-07 腾讯科技(深圳)有限公司 一种语音识别的方法、计算机、存储介质以及电子装置
CN108682421A (zh) * 2018-04-09 2018-10-19 平安科技(深圳)有限公司 一种语音识别方法、终端设备及计算机可读存储介质
CN109215661A (zh) * 2018-08-30 2019-01-15 上海与德通讯技术有限公司 语音转文字方法、装置设备及存储介质
CN109858005A (zh) * 2019-03-07 2019-06-07 百度在线网络技术(北京)有限公司 基于语音识别的文档更新方法、装置、设备及存储介质
CN111554296A (zh) * 2020-04-27 2020-08-18 中国银行股份有限公司 一种客户信息修改方法、装置、服务器及存储介质
WO2022253061A1 (zh) * 2021-06-03 2022-12-08 华为技术有限公司 一种语音处理方法及相关设备

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02128389A (ja) * 1988-11-08 1990-05-16 Matsushita Graphic Commun Syst Inc 音声データの編集方法
CN101655837A (zh) * 2009-09-08 2010-02-24 北京邮电大学 一种对语音识别后文本进行检错并纠错的方法
AU2010257392A1 (en) * 2009-12-23 2011-07-07 Biosense Webster (Israel), Inc. Measuring weak signals over ablation lines
CN103021412A (zh) * 2012-12-28 2013-04-03 安徽科大讯飞信息科技股份有限公司 语音识别方法和系统
CN103247291A (zh) * 2013-05-07 2013-08-14 华为终端有限公司 一种语音识别设备的更新方法、装置及系统
CN103366741A (zh) * 2012-03-31 2013-10-23 盛乐信息技术(上海)有限公司 语音输入纠错方法及系统
CN103377652A (zh) * 2012-04-25 2013-10-30 上海智臻网络科技有限公司 一种用于进行语音识别的方法、装置和设备
CN104331265A (zh) * 2014-09-30 2015-02-04 北京金山安全软件有限公司 一种语音输入方法、装置及终端
CN105047198A (zh) * 2015-08-24 2015-11-11 百度在线网络技术(北京)有限公司 语音纠错处理方法及装置
CN105206260A (zh) * 2015-08-31 2015-12-30 努比亚技术有限公司 一种终端语音播报方法、装置及终端语音操作方法
CN105609104A (zh) * 2016-01-22 2016-05-25 北京云知声信息技术有限公司 一种信息处理方法、装置及智能语音路由控制器
CN105869632A (zh) * 2015-01-22 2016-08-17 北京三星通信技术研究有限公司 基于语音识别的文本修订方法和装置

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02128389A (ja) * 1988-11-08 1990-05-16 Matsushita Graphic Commun Syst Inc 音声データの編集方法
CN101655837A (zh) * 2009-09-08 2010-02-24 北京邮电大学 一种对语音识别后文本进行检错并纠错的方法
AU2010257392A1 (en) * 2009-12-23 2011-07-07 Biosense Webster (Israel), Inc. Measuring weak signals over ablation lines
CN103366741A (zh) * 2012-03-31 2013-10-23 盛乐信息技术(上海)有限公司 语音输入纠错方法及系统
CN103377652A (zh) * 2012-04-25 2013-10-30 上海智臻网络科技有限公司 一种用于进行语音识别的方法、装置和设备
CN103021412A (zh) * 2012-12-28 2013-04-03 安徽科大讯飞信息科技股份有限公司 语音识别方法和系统
CN103247291A (zh) * 2013-05-07 2013-08-14 华为终端有限公司 一种语音识别设备的更新方法、装置及系统
CN104331265A (zh) * 2014-09-30 2015-02-04 北京金山安全软件有限公司 一种语音输入方法、装置及终端
CN105869632A (zh) * 2015-01-22 2016-08-17 北京三星通信技术研究有限公司 基于语音识别的文本修订方法和装置
CN105047198A (zh) * 2015-08-24 2015-11-11 百度在线网络技术(北京)有限公司 语音纠错处理方法及装置
CN105206260A (zh) * 2015-08-31 2015-12-30 努比亚技术有限公司 一种终端语音播报方法、装置及终端语音操作方法
CN105609104A (zh) * 2016-01-22 2016-05-25 北京云知声信息技术有限公司 一种信息处理方法、装置及智能语音路由控制器

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018157789A1 (zh) * 2017-03-02 2018-09-07 腾讯科技(深圳)有限公司 一种语音识别的方法、计算机、存储介质以及电子装置
CN106940595A (zh) * 2017-03-16 2017-07-11 北京云知声信息技术有限公司 一种信息编辑方法及装置
CN107273364A (zh) * 2017-05-15 2017-10-20 百度在线网络技术(北京)有限公司 一种语音翻译方法和装置
CN107945802A (zh) * 2017-10-23 2018-04-20 北京云知声信息技术有限公司 语音识别结果处理方法及装置
CN108682421A (zh) * 2018-04-09 2018-10-19 平安科技(深圳)有限公司 一种语音识别方法、终端设备及计算机可读存储介质
CN109215661A (zh) * 2018-08-30 2019-01-15 上海与德通讯技术有限公司 语音转文字方法、装置设备及存储介质
CN109858005A (zh) * 2019-03-07 2019-06-07 百度在线网络技术(北京)有限公司 基于语音识别的文档更新方法、装置、设备及存储介质
CN109858005B (zh) * 2019-03-07 2024-01-12 百度在线网络技术(北京)有限公司 基于语音识别的文档更新方法、装置、设备及存储介质
CN111554296A (zh) * 2020-04-27 2020-08-18 中国银行股份有限公司 一种客户信息修改方法、装置、服务器及存储介质
CN111554296B (zh) * 2020-04-27 2023-11-10 中国银行股份有限公司 一种客户信息修改方法、装置、服务器及存储介质
WO2022253061A1 (zh) * 2021-06-03 2022-12-08 华为技术有限公司 一种语音处理方法及相关设备

Also Published As

Publication number Publication date
CN106328145B (zh) 2019-10-11

Similar Documents

Publication Publication Date Title
CN106328145A (zh) 语音修正方法及装置
CN108052577B (zh) 一种通用文本内容挖掘方法、装置、服务器及存储介质
KR102347398B1 (ko) 터치스크린 상에 표시되는 조치 가능한 콘텐츠
TWI437449B (zh) 多重模式輸入方法及輸入方法編輯器系統
CN107798052B (zh) 词典更新装置及词典更新方法
US20150169552A1 (en) Techniques for predictive input method editors
CN111091811B (zh) 语音训练数据的处理方法、装置及存储介质
CN111160004B (zh) 一种断句模型的建立方法及装置
US11630825B2 (en) Method and system for enhanced search term suggestion
CN109710834B (zh) 相似网页检测方法、装置、存储介质及电子设备
CN112818680B (zh) 语料的处理方法、装置、电子设备及计算机可读存储介质
CN106601236A (zh) 语音识别方法及装置
CN106126080A (zh) 语音管理方法及装置
CN111325031B (zh) 简历解析方法及装置
CN113449489A (zh) 标点符号标注方法、装置、计算机设备和存储介质
CN104699844A (zh) 为广告确定视频标签的方法及装置
EP3971732A1 (en) Method and system for performing summarization of text
CN111354354A (zh) 一种基于语义识别的训练方法、训练装置及终端设备
CN109872718A (zh) 语音数据的答案获取方法及装置、存储介质、计算机设备
JP2016110256A (ja) 情報処理装置及び情報処理プログラム
CN115858776B (zh) 一种变体文本分类识别方法、系统、存储介质和电子设备
CN111339910A (zh) 文本的处理、文本分类模型的训练方法及装置
CN116188250A (zh) 图像处理方法、装置、电子设备及存储介质
CN110728137B (zh) 用于分词的方法和装置
CN106233373B (zh) 信息提供装置及信息提供方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: No. 101, 1st Floor, 1st Building, Xisanqi Building Materials City, Haidian District, Beijing, 100000

Patentee after: Yunzhisheng Intelligent Technology Co.,Ltd.

Address before: 100191 Beijing, Huayuan Road, Haidian District No. 2 peony technology building, 5 floor, A503

Patentee before: BEIJING UNISOUND INFORMATION TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20200416

Address after: No. 101, 1st Floor, 1st Building, Xisanqi Building Materials City, Haidian District, Beijing, 100000

Co-patentee after: Xiamen yunzhixin Intelligent Technology Co.,Ltd.

Patentee after: Yunzhisheng Intelligent Technology Co.,Ltd.

Address before: No. 101, 1st Floor, 1st Building, Xisanqi Building Materials City, Haidian District, Beijing, 100000

Patentee before: Yunzhisheng Intelligent Technology Co.,Ltd.