CN107221328A - 修改源的定位方法及装置、计算机设备及可读介质 - Google Patents

修改源的定位方法及装置、计算机设备及可读介质 Download PDF

Info

Publication number
CN107221328A
CN107221328A CN201710380472.8A CN201710380472A CN107221328A CN 107221328 A CN107221328 A CN 107221328A CN 201710380472 A CN201710380472 A CN 201710380472A CN 107221328 A CN107221328 A CN 107221328A
Authority
CN
China
Prior art keywords
word
text
modification source
restriction parameter
error correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710380472.8A
Other languages
English (en)
Other versions
CN107221328B (zh
Inventor
姚树杰
瞿琴
胡泽进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201710380472.8A priority Critical patent/CN107221328B/zh
Publication of CN107221328A publication Critical patent/CN107221328A/zh
Priority to US15/980,261 priority patent/US10528670B2/en
Application granted granted Critical
Publication of CN107221328B publication Critical patent/CN107221328B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明提供一种修改源的定位方法及装置、计算机设备及可读介质。其方法包括:从用户输入的语音纠错指令的语义解析信息中,获取标识修改源的第一目标词以及修改源的限定参数;根据第一目标词以及修改源的限定参数,从待纠错的文本中定位修改源。与现有技术的采用模板匹配定位的方案相比,本发明的技术方案能够支持任意形式的语音纠错指令,修改源的定位方式较为灵活,从而能够有效地提高修改源的定位效率。

Description

修改源的定位方法及装置、计算机设备及可读介质
【技术领域】
本发明涉及计算机应用技术领域,尤其涉及一种修改源的定位方法及装置、计算机设备及可读介质。
【背景技术】
为了更加方便用户使用应用(Application;App),现有技术中,很多应用均支持语音输入,这样,用户在使用时仅需要向该App输入语音数据即可,操作简单,使用方便。
例如,用户在文本编辑时,App可以接收用户输入的语音纠错指令,然后根据用户的语音纠错指令的语义解析信息,在待修改文本中精确定位修改源,并后续进行文本纠错。现有技术中,可以采用模板匹配定位的方法,根据预先设置的定位修改源的模块,从语音纠错指令的语义解析信息中定位修改源。
但是,现有技术的采用模板匹配定位的方法,仅能够支持有限的特定模板,修改源的定位方式较为死板,且定位修改源的效率较低。
【发明内容】
本发明提供了一种修改源的定位方法及装置、计算机设备及可读介质,用于丰富修改源定位的灵活性,提高修改源的定位效率。
本发明提供一种修改源的定位方法,所述方法包括:
从用户输入的语音纠错指令的语义解析信息中,获取标识修改源的第一目标词以及所述修改源的限定参数;
根据所述第一目标词以及所述限定参数,从待纠错的文本中定位所述修改源。
进一步可选地,如上所述的方法中,根据所述第一目标词以及所述限定参数,从待纠错的文本中定位所述修改源,具体包括:
根据所述限定参数,从所述待纠错的文本中查找所述第一目标词;
若查找到,则确定定位到所述修改源,并返回所述修改源的位置信息。
进一步可选地,如上所述的方法中,还包括:
若从所述待纠错的文本中未查找所述第一目标词,根据所述限定参数,从所述待纠错的文本中对所述第一目标词进行文本模糊定位。
进一步可选地,如上所述的方法中,根据所述限定参数,从所述待纠错的文本中对所述第一目标词进行文本模糊定位,具体包括:
将所述第一目标词进行同语义转换,得到第二目标词;
根据所述限定参数,从所述待纠错的文本中查找所述第二目标词;
若查找到,则确定定位到所述修改源,并返回所述修改源的位置信息。
进一步可选地,如上所述的方法中,根据所述限定参数,从所述待纠错的文本中对所述目标词进行文本模糊定位,具体包括:
将所述第一目标词进行相似性转换,得到所述第三目标词,且所述第三目标词与所述第一目标词之间的编辑距离与所述第一目标词的最大编辑距离的比例,小于或者等于预设编辑距离比例阈值;
根据所述限定参数,从所述待纠错的文本中查找所述第三目标词;
若查找到,则确定定位到所述修改源,并返回所述修改源的位置信息。
进一步可选地,如上所述的方法中,还包括:
若在所述文本模糊定位中未定位到所述修改源,根据所述限定参数,从所述待纠错的文本中对所述第一目标词进行注音模糊定位。
进一步可选地,如上所述的方法中,根据所述限定参数,从所述待纠错的文本中对所述第一目标词进行注音模糊定位,具体包括:
将所述第一目标词中每个字进行真实注音;
根据所述第一目标词中的各字的真实注音,为具有混淆发音的各字扩展混淆注音;
根据所述第一目标词中各字的所述真实注音和所述混淆注音,生成对应的所述字的注音集;
根据所述限定参数,按照所述第一目标词中各所述字的顺序,从所述待纠错的文本中查找第一疑似目标词,所述第一疑似目标词中各字的读音依次与所述第一目标词中对应位置的各所述字的所述注音集中的所述真实注音或者所述混淆注音相匹配;
若查找到,则确定定位到所述修改源,并返回所述修改源的位置信息;
否则,进一步根据所述限定参数,按照所述第一目标词中各所述字的顺序,从所述待纠错的文本中查找第二疑似目标词;所述第二疑似目标词中,读音与所述第一目标词中对应位置的各所述字的所述注音集中的所述真实注音或者所述混淆注音相匹配的字的数量,占所述第一目标词包括的字的总数的比例,大于或者等于预设字比例阈值;
若查找到,则确定定位到所述修改源,并返回所述修改源的位置信息。
进一步可选地,如上所述的方法中,所述限定参数包括精确位置、相对位置、覆盖范围、相对位置关联词以及描述词中的至少一种参数类别;
进一步地,根据所述第一目标词以及所述限定参数,从待纠错的文本中定位所述修改源,具体包括:
根据所述限定参数所包括的参数类别,获取对应的定位接口;
向所述定位接口发送所述第一目标词以及所述限定参数,由所述定位接口根据所述第一目标词以及所述限定参数,从待纠错的文本中定位所述修改源。
本发明提供一种修改源的定位装置,所述装置包括:
获取模块,用于从用户输入的语音纠错指令的语义解析信息中,获取标识修改源的第一目标词以及所述修改源的限定参数;
定位模块,用于根据所述第一目标词以及所述限定参数,从待纠错的文本中定位所述修改源。
进一步可选地,如上所述的装置中,所述定位模块,具体用于:
根据所述限定参数,从所述待纠错的文本中查找所述第一目标词;
若查找到,则确定定位到所述修改源,并返回所述修改源的位置信息。
进一步可选地,如上所述的装置中,所述定位模块,具体还用于若从所述待纠错的文本中未查找所述第一目标词,根据所述限定参数,从所述待纠错的文本中对所述第一目标词进行文本模糊定位。
进一步可选地,如上所述的装置中,所述定位模块,具体还用于:
将所述第一目标词进行同语义转换,得到第二目标词;
根据所述限定参数,从所述待纠错的文本中查找所述第二目标词;
若查找到,则确定定位到所述修改源,并返回所述修改源的位置信息。
进一步可选地,如上所述的装置中,所述定位模块,具体还用于:
将所述第一目标词进行相似性转换,得到所述第三目标词,且所述第三目标词与所述第一目标词之间的编辑距离与所述第一目标词的最大编辑距离的比例,小于或者等于预设编辑距离比例阈值;
根据所述限定参数,从所述待纠错的文本中查找所述第三目标词;
若查找到,则确定定位到所述修改源,并返回所述修改源的位置信息。
进一步可选地,如上所述的装置中,所述定位模块,具体还用于若在所述文本模糊定位中未定位到所述修改源,根据所述限定参数,从所述待纠错的文本中对所述第一目标词进行注音模糊定位。
进一步可选地,如上所述的装置中,所述定位模块,具体还用于:
将所述第一目标词中每个字进行真实注音;
根据所述第一目标词中的各字的真实注音,为具有混淆发音的各字扩展混淆注音;
根据所述第一目标词中各字的所述真实注音和所述混淆注音,生成对应的所述字的注音集;
根据所述限定参数,按照所述第一目标词中各所述字的顺序,从所述待纠错的文本中查找第一疑似目标词,所述第一疑似目标词中各字的读音依次与所述第一目标词中对应位置的各所述字的所述注音集中的所述真实注音或者所述混淆注音相匹配;
若查找到,则确定定位到所述修改源,并返回所述修改源的位置信息;
否则,进一步根据所述限定参数,按照所述第一目标词中各所述字的顺序,从所述待纠错的文本中查找第二疑似目标词;所述第二疑似目标词中,读音与所述第一目标词中对应位置的各所述字的所述注音集中的所述真实注音或者所述混淆注音相匹配的字的数量,占所述第一目标词包括的字的总数的比例,大于或者等于预设字比例阈值;
若查找到,则确定定位到所述修改源,并返回所述修改源的位置信息。
进一步可选地,如上所述的装置中,所述限定参数包括精确位置、相对位置、覆盖范围、相对位置关联词以及描述词中的至少一种参数类别;
进一步地,所述定位模块,具体还用于:
根据所述限定参数所包括的参数类别,获取对应的定位接口;
向所述定位接口发送所述第一目标词以及所述限定参数,由所述定位接口根据所述第一目标词以及所述限定参数,从待纠错的文本中定位所述修改源。
本发明还提供一种计算机设备,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的修改源的定位方法。
本发明还提供一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的修改源的定位方法。
本发明的修改源的定位方法及装置、计算机设备及可读介质,通过从用户输入的语音纠错指令的语义解析信息中,获取标识修改源的第一目标词以及修改源的限定参数;根据第一目标词以及修改源的限定参数,从待纠错的文本中定位修改源。与现有技术的采用模板匹配定位的方案相比,本发明的技术方案能够支持任意形式的语音纠错指令,修改源的定位方式较为灵活,从而能够有效地提高修改源的定位效率。
【附图说明】
图1为本发明的修改源的定位方法实施例一的流程图。
图2为本发明的三个修改源的限定参数的示例图。
图3为本发明的修改源的定位方法实施例二的流程图。
图4为本发明的修改源定位的使用场景图。
图5为本发明的修改源定位的流程示意图。
图6为本发明的修改源的定位装置实施例一的结构图。
图7为本发明的修改源的定位装置实施例二的结构图。
图8为本发明的计算机设备实施例的结构图。
图9为本发明提供的一种计算机设备的示例图。
【具体实施方式】
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
图1为本发明的修改源的定位方法实施例一的流程图。如图1所示,本实施例的修改源的定位方法,具体可以包括如下步骤:
100、从用户输入的语音纠错指令的语义解析信息中,获取标识修改源的第一目标词以及修改源的限定参数;
本实施例的修改源的定位方法的执行主体为修改源的定位装置,本实施例的修改源的定位装置应用在支持语音输入的应用或者平台中。具体地,修改源的定位装置可以接收用户输入的语音纠错指令,并将语音纠错指令解析为文本形式的语义解析信息。或者由修改源的定位装置所嵌入的应用或者平台来接收用户输入的语音纠错指令,并对用户输入的语音纠错指令进行解析,得到文本形式的语义解析信息。然后由修改源的定位装置根据该语义解析信息,进行修改源的定位。本实施例中,用户输入的语音纠错指令中具体可以包括修改源。但是考虑到语义解析时,难免会有解析误差,因此对语音纠错指令解析得到的语义解析信息中包括的第一目标词本身是用于标识修改源,或者也可以说是描述修改源。但如果正确标识了,该第一目标词就等于修改源,若存在解析误差,该第一目标词便不能正确标识该修改源,此时该第一目标词便不等同于修改源。因此,本实施例中,语义解析信息中包括的第一目标词仅能够标识修改源,未必等于修改源。
本实施例中的修改源的限定参数可以包括多种类别,具体用于描述修改源,便于确定修改源的位置的一些参数。例如修改源的限定参数中可以包括修改源的精确位置、修改源的相对位置、修改源的覆盖范围、修改源的相对位置关联词以及修改源的描述词中的至少一种参数类别。例如,用户的语音纠错指令可以为“将第一个我们之后的组装的组字修改为祖宗的祖字”,“把第5个字改成蓝”,“在你后加个不好”等等。所有的纠错指令中都包括纠错意图,即增加、修改或者删除。本实施例的技术方案,主要用于对纠错意图为修改的修改源进行定位。纠错指令中除了纠错意图还可以包括修改源的各类别的限定参数,如下述表1所示,解释修改源的5种类别的限定参数以及标识修改源的第一目标词。
表1
例如图2为本发明的三个修改源的限定参数的示例图。根据上述修改源的各种类别的限定参数的描述,可以知道,在例1.1中,“第三个我们”中,精确位置actual_pos为3,第一目标词pre_ope_error为我们。在例1.2中,“南京后面的好”中,第一目标词pre_ope_error为好,描述词pre_ope_word为南京,相对位置relative_pos为after。在例1.3中,“南京的南”中,第一目标词pre_ope_error为南,描述词pre_ope_word为南京。其它语音纠错指令的语义解析可以按照各限定参数的定义,从语义解析中获取修改源的各限定参数。
101、根据第一目标词以及修改源的限定参数,从待纠错的文本中定位修改源。
由于修改源的限定参数用于限定修改源,第一目标词用于标识修改源,因此,可以根据第一目标词以及修改源的限定参数,在待纠错的文本中定位修改源。
本实施例的修改源的定位方法,通过从用户输入的语音纠错指令的语义解析信息中,获取标识修改源的第一目标词以及修改源的限定参数;根据第一目标词以及修改源的限定参数,从待纠错的文本中定位修改源。与现有技术的采用模板匹配定位的方案相比,能够支持任意形式的语音纠错指令,修改源的定位方式较为灵活,从而能够有效地提高修改源的定位效率。
图3为本发明的修改源的定位方法实施例二的流程图。如图3所示,本实施例的修改源的定位方法,具体可以包括如下步骤:
200、从用户输入的语音纠错指令的语义解析信息中,获取标识修改源的第一目标词以及修改源的限定参数;
201、根据限定参数,从待纠错的文本中查找第一目标词;
202、判断从待纠错的文本中是否查找到第一目标词,若查找到,执行步骤203;若未查找到,执行步骤204;
203、确定定位到修改源,并返回修改源的位置信息,结束。
此时定位的修改源等于第一目标词,定位到修改源之后,表示定位成功,此时可以返回修改源的位置信息。例如,本实施例的修改源的位置信息可以为结构化的位置信息。定位到修改源的位置信息之后,通过返回修改源的位置信息,后续可以根据修改源的位置信息,进行修改。
204、根据限定参数,从待纠错的文本中对第一目标词进行文本模糊定位;执行步骤205;
205、判断文本模糊定位是否成功,若定位成功,执行步骤203;否则若定位未成功,执行步骤206;
本实施例的从待纠错的文本中对第一目标词进行文本模糊定位成功时,此时修改源不等于第一目标词。
具体地,根据限定参数,从待纠错的文本中对第一目标词进行文本模糊定位,具体可以包括如下两种方式:
第一种方式为对第一目标词进行同义转换之后进行文本模糊定位。此时步骤204具体可以包括如下步骤:
(a1)将第一目标词进行同语义转换,得到第二目标词;
(a2)根据限定参数,从待纠错的文本中查找第二目标词;若查找到,文本模糊定位成功,则执行步骤203;若未查找到,文本模糊定位未成功,继续执行步骤206。
此时步骤203确定定位到的是包括第二目标词的修改源,并返回修改源的位置信息。也就是说,此时第二目标词等于修改源。
本实施例中,对于将待纠错的文本与需要定位的第一目标词的内容出现不一致时,将第一目标词的内容同语义转换后进行匹配,例如,本实施例的同语义转换可以包括特殊符号、数字等进行全半角转换。例如以前是全角,转换为半角,以前是半角转换为全角等。还可以包括文字到符号转换,数字转换、标点符号省略等等。例如,将文本数字“一百”转换成阿拉伯数字“100”;这些转换都不改变第一目标词的语义,所以统称为同语义转换,并将转换之后的目标词称为第二目标词。此时根据限定参数,从待纠错的文本中查找第二目标词;若查找到,则表示定位到的是包括第二目标词的修改源,定位成功,此时返回修改源的位置信息。否则可以再次对第一目标词进行同语义转换,直到完成对第一目标词的所有同语义转换之后,还未定位到修改源,此时可以确定定位失败,此时再执行步骤206。
第二种方式为对第一目标词进行相似性转换,得到第三目标词之后进行文本模糊定位。
此时步骤204具体可以包括如下步骤:
(b1)将第一目标词进行相似性转换,得到第三目标词;
(b2)根据限定参数,从待纠错的文本中查找第三目标词;若查找到,文本模糊定位成功,则执行步骤203;若未查找到,文本模糊定位未成功,继续执行步骤206。
此时步骤203确定定位到的是包括第三目标词的修改源,并返回修改源的位置信息。也就是说,此时第三目标词等于修改源。
其中的第三目标词与第一目标词之间的编辑距离与第一目标词的最大编辑距离的比例,小于或者等于预设编辑距离比例阈值。其中第一目标词的最大编辑距离可以为将第一目标词全部修改的距离,若第一目标词包括五个字,那么最大编辑距离便为5。修改第一目标词中的一个字,对应的编辑距离为1,修改第一目标词中的两个字,对应的编辑距离为2,以此类推。也就是说,本实施例的相似性转换允许对第一目标词进行少许编辑,得到第三目标词。但是编辑的距离与第一目标词的最大编辑距离的比例,必须小于或者等于预设编辑距离比例阈值,否则修改后的第三目标词不被认同。然后,可以根据限定参数,从待纠错的文本中查找第三目标词;若查找到,则确定定位到修改源,并返回修改源的位置信息。否则可以再次对第一目标词进行相似性转换,直到完成对第一目标词的所有相似性转换之后,还未定位到修改源,此时可以确定定位失败,此时再执行步骤206。
本实施例通过编辑距离进行相似性转换,定位相似文本,可以召回由于语义识别导致相同内容被识别成不同文本的case和用户通过相似文本做修改的case。例如,相似性转换时,可以将“7748”修改后“7788”,可以实现在满足预设编辑距离比例阈值的情况下,定位到修改源,并返回修改源的结构化的位置信息,在保证准确率的同时提高召回率。
206、根据限定参数,从待纠错的文本中对第一目标词进行注音模糊定位;执行步骤207;
207、判断注音模糊定位是否成功,若定位成功,执行步骤203;否则若定位未成功,返回定位未成功的提示消息。
由于本实施例中的第一目标词为从对用户输入的语音纠错指令进行语义解析得到的语义解析信息中提取的,由于在语音识别中,对于相同的发音在上下文不同的情况下可能会被识别成不同的文本,这样的case可以通过注音模糊定位来召回。再例如,有的用户带有一定的口音,例如有的用户卷舌和平舌不分,例如,“zh”和“z”、“sh”和“s”、“l”和“n”等不分,所以造成用户输入的语音纠错指令中描述的修改源是错误的,本实施例中通过注音模糊定位,可以提高对修改源的定位效率,提高信息召回率,增强定位的容错率。
例如,本实施例的根据限定参数,从待纠错的文本中对第一目标词进行注音模糊定位,具体可以包括如下步骤:
(c1)将第一目标词中每个字进行真实注音;
(c2)根据第一目标词中的各字的真实注音,为具有混淆发音的各字扩展混淆注音;
本实施例的混淆发音可以为所有带有平舌音的注音对应的卷舌音的注音,以及所有带有卷舌音的注音对应的平舌音的注音。
(c3)根据第一目标词中各字的真实注音和混淆注音,生成对应的字的注音集;
对于第一目标词中的每个字,可以将该字的真实注音以及该字的所有混淆注音生成该字的一个注音字。这样,在后续查找时,某个字只要与注音集中该字的一个注音(不论是真实注音还是混淆注音)相匹配,就认为与该字相匹配。
(c4)根据限定参数,按照第一目标词中各字的顺序,从待纠错的文本中查找第一疑似目标词,其中第一疑似目标词中各字的读音依次与第一目标词中对应位置的各字的注音集中的真实注音或者混淆注音相匹配;若查找到,执行步骤203;否则,若未查找到,执行步骤(c5)
也就是说,第一目标词与第一疑似目标词中包括的字数是相同的,且第一疑似目标词的第一个字的读音与第一目标词中第一个字的注音集中的真实注音或者混淆注音相同;同理,第一疑似目标词的第二个字的读音与第一目标词中第二个字的注音集中的真实注音或者混淆注音相同;依次类推,第一疑似目标词的每一个位置的字的读音均与第一目标词中对应位置的字的注音集中的真实注音或者混淆注音相同,这样,才可以确定从待纠错的文本中查找第一疑似目标词。
此时步骤203确定定位到包括第一疑似目标词的修改源,并返回修改源的结构化位置信息;也就是说,此时第一疑似目标词等于修改源。
(c5)根据限定参数,按照第一目标词中各字的顺序,从待纠错的文本中查找第二疑似目标词;其中第二疑似目标词中,读音与第一目标词中对应位置的各字的注音集中的真实注音或者混淆注音相匹配的字的数量,占第一目标词包括的字的总数的比例,大于或者等于预设字比例阈值;若查找到,执行步骤203;否则,定位未成功,返回定位未成功的提示消息。
此时步骤203确定定位到包括第二疑似目标词的修改源,并返回所述修改源的位置信息。也就是说,此时第二疑似目标词等于修改源。
具体地,本实施例中,第二疑似目标词与第一疑似目标词相比,不是每一个字的读音均与第一目标词的对应位置的字的注音集中的真实注音或者混淆注音相匹配。而是只要相匹配的字的数量,占第一目标词包括的字的总数的比例,大于或者等于预设字比例阈值;此时也可以认为定位成功,采用该技术方案,可以进一步提高信息的召回率,增强了定位修改源的容错率。
本实施例的修改源的定位方法,通过采用上述技术方案,可以在根据限定参数,从待纠错的文本中未查找第一目标词的时候,进一步采用文本模糊定位和注音模糊定位实现对修改源的定位,能够进一步提高信息的召回率,保证定位准确率的同时,提高对修改源定位的容错率。
图4为本发明的修改源定位的使用场景图。如图4所示,为本发明的修改源定位方法的一种示例。在该修改源的定位装置可以采用上述图1-图3所示实施例的修改源的定位方法。具体地,在使用时,源文本的内容可以包括“真好,我也觉得南京号有文化底蕴”。对应地用户输入的语音纠错指令对应的语义解析信息即指令文本可以包括“把南京后边的好改成好坏的好”。此时修改源的定位装置可以根据指令文本在源文本中对修改源进行定位,详细可以参考上述图1-图3所示实施例的方法实现对修改源的定位,在此不再赘述。
进一步可选地,上述实施例中为修改源的定位装置直接对各种类别的限定参数对应的修改源进行定位。实际应用中,修改源的定位装置还可以设置多个定位接口,分别对各种类别的限定参数进行修改源定位。例如,本实施例中限定参数可以包括精确位置、相对位置、覆盖范围、相对位置关联词以及描述词中五种类别中的至少一种参数类别。语音纠错指令中可以包括任意一种、两种或者多种参数类别。此时根据五种类别的限定参数,共可以得到2*2*2*2*2=32种限定参数的搭配。在设置定位接口(Locater)时,可以针对每一种搭配,设置一种定位接口,这样,共可以设置32种定位接口如Locater_1、Locater_2……Locater_32。例如,图5为本发明的修改源定位的流程示意图。如图5所示,修改源定位装置获取到各个限定参数之后,5种类别的限定参数对应采用不同的ID来表示,例如本实施例中,采用1、2、3、4和5分别表示精确位置actual_pos、相对位置relative_pos、相对位置关联词relative_pos_word、描述词pre_ope_word、以及覆盖范围与数量ope_word_num。如图5所示,第一目标词pre_ope_error为号,相对位置关联词relative_pos_word以及描述词pre_ope_word分别为after和“南京”,此时对应的ID3和4具有数值,因此,可以标识为1和1,此时可以采用对应的定位接口Locater_6来进行修改源定位,即定位接口Locater_6仅处理具有相对位置关联词relative_pos_word以及描述词pre_ope_word两种类别的限定参数的修改源的定位。本实施例中通过设置多个定位接口,可以避免修改源定位装置对所有类别的限定参数都进行定位,处理过程繁琐,通过根据不同类别的限定参数选择不同的定位接口,可以将定位任务分发,操作非常简单。实际应用中,限定参数的类别的数量发生变化时,定位接口的数量也发生变化,实际应用中,当包括定位接口时,可以设置至少两个定位接口。否则定位接口的设置没有意义。或者实际应用中还可以采用其他方式来设置定位接口,例如,还可以为若包括前三个参数由第一个定位接口负责对修改源进行定位处理,若包括后两个参数由第二定位接口负责对修改源进行定位处理。
即,对于上述实施例中的步骤101“根据第一目标词以及修改源的限定参数,从待纠错的文本中定位所述修改源”,具体可以包括如下步骤:
(d1)根据限定参数所包括的参数类别,获取对应的定位接口;
(d2)向定位接口发送第一目标词以及限定参数,由定位接口根据第一目标词以及限定参数,从待纠错的文本中定位修改源。且本实施例中每一种定位接口的定位方法与上述图1-图3所示实施例相同,详细可以参考上述图1所示实施例的定位方法,在此不再赘述。
图6为本发明的修改源的定位装置实施例一的结构图。如图6所示,本实施例的修改源的定位装置,具体可以包括:获取模块10和定位模块11。
获取模块10用于从用户输入的语音纠错指令的语义解析信息中,获取标识修改源的第一目标词以及修改源的限定参数;
定位模块11用于根据获取模块10获取的第一目标词以及限定参数,从待纠错的文本中定位修改源。
本实施例的修改源的定位装置,通过采用上述模块实现修改源的定位的实现原理以及技术效果与上述相关方法实施例的实现相同,详细可以参考上述相关方法实施例的记载,在此不再赘述。
进一步可选地,本实施例的修改源的定位装置中,定位模块11具体用于:
根据获取模块10获取的限定参数,从待纠错的文本中查找获取模块10获取的第一目标词;
若查找到,则确定定位到修改源,并返回修改源的位置信息。
进一步可选地,本实施例的修改源的定位装置中,定位模块11具体还用于若从待纠错的文本中未查找获取模块10获取的第一目标词,根据获取模块10获取的限定参数,从待纠错的文本中对获取模块10获取的第一目标词进行文本模糊定位。
进一步可选地,本实施例的修改源的定位装置中,定位模块11具体还用于:
将获取模块10获取的第一目标词进行同语义转换,得到第二目标词;
根据获取模块10获取的限定参数,从待纠错的文本中查找第二目标词;
若查找到,则确定定位到修改源,并返回修改源的位置信息。
进一步可选地,本实施例的修改源的定位装置中,定位模块11具体还用于:
将获取模块10获取的第一目标词进行相似性转换,得到第三目标词,且第三目标词与第一目标词之间的编辑距离与第一目标词的最大编辑距离的比例,小于或者等于预设编辑距离比例阈值;
根据获取模块10获取的限定参数,从待纠错的文本中查找第三目标词;
若查找到,则确定定位到修改源,并返回修改源的位置信息。
进一步可选地,本实施例的修改源的定位装置中,定位模块11具体还用于若在文本模糊定位中未定位到修改源,根据获取模块10获取的限定参数,从待纠错的文本中对获取模块10获取的第一目标词进行注音模糊定位。
进一步可选地,本实施例的修改源的定位装置中,定位模块11具体还用于:
将获取模块10获取的第一目标词中每个字进行真实注音;
根据第一目标词中的各字的真实注音,为具有混淆发音的各字扩展混淆注音;
根据第一目标词中各字的真实注音和混淆注音,生成对应的字的注音集;
根据限定参数,按照第一目标词中各字的顺序,从待纠错的文本中查找第一疑似目标词,第一疑似目标词中各字的读音依次与第一目标词中对应位置的各字的注音集中的真实注音或者混淆注音相匹配;
若查找到,则确定定位到修改源,并返回修改源的位置信息;
否则,进一步根据获取模块10获取的限定参数,按照第一目标词中各字的顺序,从待纠错的文本中查找第二疑似目标词;第二疑似目标词中,读音与第一目标词中对应位置的各字的注音集中的真实注音或者混淆注音相匹配的字的数量,占第一目标词包括的字的总数的比例,大于或者等于预设字比例阈值;
若查找到,则确定定位到修改源,并返回修改源的位置信息。
图7为本发明的修改源的定位装置实施例二的结构图。如图7所示,本实施例的修改源的定位装置,在上述图6所示实施例的技术方案的基础上,还可以包括至少两个定位接口12。各定位接口12可以与修改源的限定参数所包括的参数类别对应。
本实施例中的限修改源的限定参数包括精确位置、相对位置、覆盖范围、相对位置关联词以及描述词中的至少一种参数类别;可以设置至少两个定位接口,分别与一定的参数类别的组合相对应,例如,5种参数类别的不同组合,可以对应32个定位接口,详细可以参考上述相关实施例的记载,在此不再赘述。
进一步地,此时,定位模块11具体用于根据限定参数所包括的参数类别,获取对应的定位接口12;并向对应的定位接口12发送获取模块10获取的第一目标词以及限定参数,由定位接口12根据第一目标词以及限定参数,从待纠错的文本中定位修改源。此时定位模块11具有分发的功能,而不执行具体的修改原的定位,而由各定位接口12执行修改源的定位。其中定位接口12根据第一目标词以及限定参数,从待纠错的文本中定位修改源的方式,可以参考上述实施例中的定位模块11根据第一目标词以及限定参数,从待纠错的文本中定位修改源的记载,在此不再赘述。
图8为本发明的计算机设备实施例的结构图。如图8所示,本实施例的计算机设备,包括:一个或多个处理器30,以及存储器40,存储器40用于存储一个或多个程序,当存储器40中存储的一个或多个程序被一个或多个处理器30执行,使得一个或多个处理器30实现如上图1-图7所示实施例的修改源的定位方法。图8所示实施例中以包括多个处理器30为例。
例如,图9为本发明提供的一种计算机设备的示例图。图9示出了适于用来实现本发明实施方式的示例性计算机设备12a的框图。图9显示的计算机设备12a仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图9所示,计算机设备12a以通用计算设备的形式表现。计算机设备12a的组件可以包括但不限于:一个或者多个处理器16a,系统存储器28a,连接不同系统组件(包括系统存储器28a和处理器16a)的总线18a。
总线18a表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机设备12a典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12a访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28a可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30a和/或高速缓存存储器32a。计算机设备12a可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34a可以用于读写不可移动的、非易失性磁介质(图9未显示,通常称为“硬盘驱动器”)。尽管图9中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18a相连。系统存储器28a可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明上述图1-图7各实施例的功能。
具有一组(至少一个)程序模块42a的程序/实用工具40a,可以存储在例如系统存储器28a中,这样的程序模块42a包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42a通常执行本发明所描述的上述图1-图7各实施例中的功能和/或方法。
计算机设备12a也可以与一个或多个外部设备14a(例如键盘、指向设备、显示器24a等)通信,还可与一个或者多个使得用户能与该计算机设备12a交互的设备通信,和/或与使得该计算机设备12a能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22a进行。并且,计算机设备12a还可以通过网络适配器20a与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20a通过总线18a与计算机设备12a的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12a使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器16a通过运行存储在系统存储器28a中的程序,从而执行各种功能应用以及数据处理,例如实现上述实施例所示的修改源的定位方法。
本发明还提供一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例所示的修改源的定位方法。
本实施例的计算机可读介质可以包括上述图9所示实施例中的系统存储器28a中的RAM30a、和/或高速缓存存储器32a、和/或存储系统34a。
随着科技的发展,计算机程序的传播途径不再受限于有形介质,还可以直接从网络下载,或者采用其他方式获取。因此,本实施例中的计算机可读介质不仅可以包括有形的介质,还可以包括无形的介质。
本实施例的计算机可读介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (18)

1.一种修改源的定位方法,其特征在于,所述方法包括:
从用户输入的语音纠错指令的语义解析信息中,获取标识修改源的第一目标词以及所述修改源的限定参数;
根据所述第一目标词以及所述限定参数,从待纠错的文本中定位所述修改源。
2.根据权利要求1所述的方法,其特征在于,根据所述第一目标词以及所述限定参数,从待纠错的文本中定位所述修改源,具体包括:
根据所述限定参数,从所述待纠错的文本中查找所述第一目标词;
若查找到,则确定定位到所述修改源,并返回所述修改源的位置信息。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
若从所述待纠错的文本中未查找所述第一目标词,根据所述限定参数,从所述待纠错的文本中对所述第一目标词进行文本模糊定位。
4.根据权利要求3所述的方法,其特征在于,根据所述限定参数,从所述待纠错的文本中对所述第一目标词进行文本模糊定位,具体包括:
将所述第一目标词进行同语义转换,得到第二目标词;
根据所述限定参数,从所述待纠错的文本中查找所述第二目标词;
若查找到,则确定定位到所述修改源,并返回所述修改源的位置信息。
5.根据权利要求3所述的方法,其特征在于,根据所述限定参数,从所述待纠错的文本中对所述目标词进行文本模糊定位,具体包括:
将所述第一目标词进行相似性转换,得到所述第三目标词,且所述第三目标词与所述第一目标词之间的编辑距离与所述第一目标词的最大编辑距离的比例,小于或者等于预设编辑距离比例阈值;
根据所述限定参数,从所述待纠错的文本中查找所述第三目标词;
若查找到,则确定定位到所述修改源,并返回所述修改源的位置信息。
6.根据权利要求4或5所述的方法,其特征在于,所述方法还包括:
若在所述文本模糊定位中未定位到所述修改源,根据所述限定参数,从所述待纠错的文本中对所述第一目标词进行注音模糊定位。
7.根据权利要求6所述的方法,其特征在于,根据所述限定参数,从所述待纠错的文本中对所述第一目标词进行注音模糊定位,具体包括:
将所述第一目标词中每个字进行真实注音;
根据所述第一目标词中的各字的真实注音,为具有混淆发音的各字扩展混淆注音;
根据所述第一目标词中各字的所述真实注音和所述混淆注音,生成对应的所述字的注音集;
根据所述限定参数,按照所述第一目标词中各所述字的顺序,从所述待纠错的文本中查找第一疑似目标词,所述第一疑似目标词中各字的读音依次与所述第一目标词中对应位置的各所述字的所述注音集中的所述真实注音或者所述混淆注音相匹配;
若查找到,则确定定位到所述修改源,并返回所述修改源的位置信息;
否则,进一步根据所述限定参数,按照所述第一目标词中各所述字的顺序,从所述待纠错的文本中查找第二疑似目标词;所述第二疑似目标词中,读音与所述第一目标词中对应位置的各所述字的所述注音集中的所述真实注音或者所述混淆注音相匹配的字的数量,占所述第一目标词包括的字的总数的比例,大于或者等于预设字比例阈值;
若查找到,则确定定位到所述修改源,并返回所述修改源的位置信息。
8.根据权利要求1-5以及7中任一所述的方法,其特征在于,所述限定参数包括精确位置、相对位置、覆盖范围、相对位置关联词以及描述词中的至少一种参数类别;
进一步地,根据所述第一目标词以及所述限定参数,从待纠错的文本中定位所述修改源,具体包括:
根据所述限定参数所包括的参数类别,获取对应的定位接口;
向所述定位接口发送所述第一目标词以及所述限定参数,由所述定位接口根据所述第一目标词以及所述限定参数,从待纠错的文本中定位所述修改源。
9.一种修改源的定位装置,其特征在于,所述装置包括:
获取模块,用于从用户输入的语音纠错指令的语义解析信息中,获取标识修改源的第一目标词以及所述修改源的限定参数;
定位模块,用于根据所述第一目标词以及所述限定参数,从待纠错的文本中定位所述修改源。
10.根据权利要求9所述的装置,其特征在于,所述定位模块,具体用于:
根据所述限定参数,从所述待纠错的文本中查找所述第一目标词;
若查找到,则确定定位到所述修改源,并返回所述修改源的位置信息。
11.根据权利要求10所述的装置,其特征在于,所述定位模块,具体还用于若从所述待纠错的文本中未查找所述第一目标词,根据所述限定参数,从所述待纠错的文本中对所述第一目标词进行文本模糊定位。
12.根据权利要求11所述的装置,其特征在于,所述定位模块,具体还用于:
将所述第一目标词进行同语义转换,得到第二目标词;
根据所述限定参数,从所述待纠错的文本中查找所述第二目标词;
若查找到,则确定定位到所述修改源,并返回所述修改源的位置信息。
13.根据权利要求11所述的装置,其特征在于,所述定位模块,具体还用于:
将所述第一目标词进行相似性转换,得到所述第三目标词,且所述第三目标词与所述第一目标词之间的编辑距离与所述第一目标词的最大编辑距离的比例,小于或者等于预设编辑距离比例阈值;
根据所述限定参数,从所述待纠错的文本中查找所述第三目标词;
若查找到,则确定定位到所述修改源,并返回所述修改源的位置信息。
14.根据权利要求12或13所述的装置,其特征在于,所述定位模块,具体还用于若在所述文本模糊定位中未定位到所述修改源,根据所述限定参数,从所述待纠错的文本中对所述第一目标词进行注音模糊定位。
15.根据权利要求14所述的装置,其特征在于,所述定位模块,具体还用于:
将所述第一目标词中每个字进行真实注音;
根据所述第一目标词中的各字的真实注音,为具有混淆发音的各字扩展混淆注音;
根据所述第一目标词中各字的所述真实注音和所述混淆注音,生成对应的所述字的注音集;
根据所述限定参数,按照所述第一目标词中各所述字的顺序,从所述待纠错的文本中查找第一疑似目标词,所述第一疑似目标词中各字的读音依次与所述第一目标词中对应位置的各所述字的所述注音集中的所述真实注音或者所述混淆注音相匹配;
若查找到,则确定定位到所述修改源,并返回所述修改源的位置信息;
否则,进一步根据所述限定参数,按照所述第一目标词中各所述字的顺序,从所述待纠错的文本中查找第二疑似目标词;所述第二疑似目标词中,读音与所述第一目标词中对应位置的各所述字的所述注音集中的所述真实注音或者所述混淆注音相匹配的字的数量,占所述第一目标词包括的字的总数的比例,大于或者等于预设字比例阈值;
若查找到,则确定定位到所述修改源,并返回所述修改源的位置信息。
16.根据权利要求9-13以及14中任一所述的装置,其特征在于,所述限定参数包括精确位置、相对位置、覆盖范围、相对位置关联词以及描述词中的至少一种参数类别;
进一步地,所述定位模块,具体还用于:
根据所述限定参数所包括的参数类别,获取对应的定位接口;
向所述定位接口发送所述第一目标词以及所述限定参数,由所述定位接口根据所述第一目标词以及所述限定参数,从待纠错的文本中定位所述修改源。
17.一种计算机设备,其特征在于,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一所述的方法。
18.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8中任一所述的方法。
CN201710380472.8A 2017-05-25 2017-05-25 修改源的定位方法及装置、计算机设备及可读介质 Active CN107221328B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201710380472.8A CN107221328B (zh) 2017-05-25 2017-05-25 修改源的定位方法及装置、计算机设备及可读介质
US15/980,261 US10528670B2 (en) 2017-05-25 2018-05-15 Amendment source-positioning method and apparatus, computer device and readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710380472.8A CN107221328B (zh) 2017-05-25 2017-05-25 修改源的定位方法及装置、计算机设备及可读介质

Publications (2)

Publication Number Publication Date
CN107221328A true CN107221328A (zh) 2017-09-29
CN107221328B CN107221328B (zh) 2021-02-19

Family

ID=59944940

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710380472.8A Active CN107221328B (zh) 2017-05-25 2017-05-25 修改源的定位方法及装置、计算机设备及可读介质

Country Status (2)

Country Link
US (1) US10528670B2 (zh)
CN (1) CN107221328B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108091328A (zh) * 2017-11-20 2018-05-29 北京百度网讯科技有限公司 基于人工智能的语音识别纠错方法、装置及可读介质
CN109994105A (zh) * 2017-12-29 2019-07-09 宝马股份公司 信息输入方法、装置、系统、车辆以及可读存储介质
CN110211592A (zh) * 2019-05-17 2019-09-06 北京华控创为南京信息技术有限公司 智能语音数据处理装置及方法
CN112256953A (zh) * 2019-07-22 2021-01-22 腾讯科技(深圳)有限公司 查询改写方法、装置、计算机设备和存储介质
CN112612442A (zh) * 2019-09-19 2021-04-06 北京搜狗科技发展有限公司 一种输入方法、装置和电子设备
CN113378530A (zh) * 2021-06-28 2021-09-10 北京七维视觉传媒科技有限公司 语音编辑方法及装置、设备和介质

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112668311A (zh) * 2019-09-29 2021-04-16 北京国双科技有限公司 文本错误的检测方法及装置
CN111028834B (zh) * 2019-10-30 2023-01-20 蚂蚁财富(上海)金融信息服务有限公司 语音信息提醒方法、装置、服务器和语音信息提醒设备
CN113743093B (zh) * 2020-06-17 2024-05-17 北京沃东天骏信息技术有限公司 一种文本校正的方法和装置
CN117591531B (zh) * 2024-01-18 2024-03-22 北京快立方科技有限公司 一种数据库的远程数据同步方法及系统

Citations (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07261790A (ja) * 1994-03-24 1995-10-13 Matsushita Electric Ind Co Ltd 音声認識装置
US20010041980A1 (en) * 1999-08-26 2001-11-15 Howard John Howard K. Automatic control of household activity using speech recognition and natural language
US20050234901A1 (en) * 2004-04-15 2005-10-20 Caruso Jeffrey L Database with efficient fuzzy matching
US20060190255A1 (en) * 2005-02-22 2006-08-24 Canon Kabushiki Kaisha Speech recognition method
CN101196898A (zh) * 2007-08-21 2008-06-11 新百丽鞋业(深圳)有限公司 将词组索引技术应用在互联网搜索引擎中的方法
CN101206673A (zh) * 2007-12-25 2008-06-25 北京科文书业信息技术有限公司 网络搜索过程中关键词的智能纠错系统及方法
CN101287229A (zh) * 2008-05-26 2008-10-15 北京捷讯畅达科技发展有限公司 应用于手机短信查询的自然语言处理技术及装置
US20090018829A1 (en) * 2004-06-08 2009-01-15 Metaphor Solutions, Inc. Speech Recognition Dialog Management
CN102156853A (zh) * 2010-02-11 2011-08-17 深圳鼎识科技有限公司 证件识读系统及证件识读方法
CN102207973A (zh) * 2011-06-22 2011-10-05 上海互联网软件有限公司 一种模糊检索系统及其检索方法
CN102915314A (zh) * 2011-08-05 2013-02-06 腾讯科技(深圳)有限公司 一种纠错对自动生成方法及系统
CN102955770A (zh) * 2011-08-17 2013-03-06 腾讯科技(深圳)有限公司 一种拼音自动识别方法及系统
US20130191125A1 (en) * 2012-01-25 2013-07-25 Kabushiki Kaisha Toshiba Transcription supporting system and transcription supporting method
CN103559220A (zh) * 2013-10-18 2014-02-05 北京奇虎科技有限公司 图片搜索设备、方法及系统
CN103903618A (zh) * 2012-12-28 2014-07-02 联想(北京)有限公司 一种语音输入方法及电子设备
CN103914455A (zh) * 2012-12-30 2014-07-09 高德软件有限公司 一种兴趣点检索方法和装置
CN104756183A (zh) * 2012-08-29 2015-07-01 纽昂斯通讯公司 在智能汉语语音口述记录校正中使用字符描述器有效输入模糊字符
CN104882139A (zh) * 2015-05-28 2015-09-02 百度在线网络技术(北京)有限公司 语音合成的方法和装置
US20150331936A1 (en) * 2014-05-14 2015-11-19 Faris ALQADAH Method and system for extracting a product and classifying text-based electronic documents
CN105739819A (zh) * 2016-01-22 2016-07-06 努比亚技术有限公司 光标定位方法、装置及移动终端
CN106098060A (zh) * 2016-05-19 2016-11-09 北京搜狗科技发展有限公司 语音的纠错处理方法和装置、用于语音的纠错处理的装置
CN106297797A (zh) * 2016-07-26 2017-01-04 百度在线网络技术(北京)有限公司 语音识别结果纠错方法和装置
CN106534548A (zh) * 2016-11-17 2017-03-22 科大讯飞股份有限公司 语音纠错方法和装置
CN106708893A (zh) * 2015-11-17 2017-05-24 华为技术有限公司 搜索查询词纠错方法和装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6839669B1 (en) * 1998-11-05 2005-01-04 Scansoft, Inc. Performing actions identified in recognized speech
US6604075B1 (en) * 1999-05-20 2003-08-05 Lucent Technologies Inc. Web-based voice dialog interface
JP3762327B2 (ja) * 2002-04-24 2006-04-05 株式会社東芝 音声認識方法および音声認識装置および音声認識プログラム
US7383172B1 (en) * 2003-08-15 2008-06-03 Patrick William Jamieson Process and system for semantically recognizing, correcting, and suggesting domain specific speech
US7412387B2 (en) * 2005-01-18 2008-08-12 International Business Machines Corporation Automatic improvement of spoken language
US8219407B1 (en) * 2007-12-27 2012-07-10 Great Northern Research, LLC Method for processing the output of a speech recognizer
GB2458461A (en) * 2008-03-17 2009-09-23 Kai Yu Spoken language learning system
US9646606B2 (en) * 2013-07-03 2017-05-09 Google Inc. Speech recognition using domain knowledge
US9558740B1 (en) * 2015-03-30 2017-01-31 Amazon Technologies, Inc. Disambiguation in speech recognition

Patent Citations (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07261790A (ja) * 1994-03-24 1995-10-13 Matsushita Electric Ind Co Ltd 音声認識装置
US20010041980A1 (en) * 1999-08-26 2001-11-15 Howard John Howard K. Automatic control of household activity using speech recognition and natural language
US20050234901A1 (en) * 2004-04-15 2005-10-20 Caruso Jeffrey L Database with efficient fuzzy matching
US20090018829A1 (en) * 2004-06-08 2009-01-15 Metaphor Solutions, Inc. Speech Recognition Dialog Management
US20060190255A1 (en) * 2005-02-22 2006-08-24 Canon Kabushiki Kaisha Speech recognition method
CN101196898A (zh) * 2007-08-21 2008-06-11 新百丽鞋业(深圳)有限公司 将词组索引技术应用在互联网搜索引擎中的方法
CN101206673A (zh) * 2007-12-25 2008-06-25 北京科文书业信息技术有限公司 网络搜索过程中关键词的智能纠错系统及方法
CN101287229A (zh) * 2008-05-26 2008-10-15 北京捷讯畅达科技发展有限公司 应用于手机短信查询的自然语言处理技术及装置
CN102156853A (zh) * 2010-02-11 2011-08-17 深圳鼎识科技有限公司 证件识读系统及证件识读方法
CN102207973A (zh) * 2011-06-22 2011-10-05 上海互联网软件有限公司 一种模糊检索系统及其检索方法
CN102915314A (zh) * 2011-08-05 2013-02-06 腾讯科技(深圳)有限公司 一种纠错对自动生成方法及系统
CN102955770A (zh) * 2011-08-17 2013-03-06 腾讯科技(深圳)有限公司 一种拼音自动识别方法及系统
US20130191125A1 (en) * 2012-01-25 2013-07-25 Kabushiki Kaisha Toshiba Transcription supporting system and transcription supporting method
CN104756183A (zh) * 2012-08-29 2015-07-01 纽昂斯通讯公司 在智能汉语语音口述记录校正中使用字符描述器有效输入模糊字符
CN103903618A (zh) * 2012-12-28 2014-07-02 联想(北京)有限公司 一种语音输入方法及电子设备
CN103914455A (zh) * 2012-12-30 2014-07-09 高德软件有限公司 一种兴趣点检索方法和装置
CN103559220A (zh) * 2013-10-18 2014-02-05 北京奇虎科技有限公司 图片搜索设备、方法及系统
US20150331936A1 (en) * 2014-05-14 2015-11-19 Faris ALQADAH Method and system for extracting a product and classifying text-based electronic documents
CN104882139A (zh) * 2015-05-28 2015-09-02 百度在线网络技术(北京)有限公司 语音合成的方法和装置
CN106708893A (zh) * 2015-11-17 2017-05-24 华为技术有限公司 搜索查询词纠错方法和装置
CN105739819A (zh) * 2016-01-22 2016-07-06 努比亚技术有限公司 光标定位方法、装置及移动终端
CN106098060A (zh) * 2016-05-19 2016-11-09 北京搜狗科技发展有限公司 语音的纠错处理方法和装置、用于语音的纠错处理的装置
CN106297797A (zh) * 2016-07-26 2017-01-04 百度在线网络技术(北京)有限公司 语音识别结果纠错方法和装置
CN106534548A (zh) * 2016-11-17 2017-03-22 科大讯飞股份有限公司 语音纠错方法和装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108091328A (zh) * 2017-11-20 2018-05-29 北京百度网讯科技有限公司 基于人工智能的语音识别纠错方法、装置及可读介质
CN108091328B (zh) * 2017-11-20 2021-04-16 北京百度网讯科技有限公司 基于人工智能的语音识别纠错方法、装置及可读介质
CN109994105A (zh) * 2017-12-29 2019-07-09 宝马股份公司 信息输入方法、装置、系统、车辆以及可读存储介质
CN110211592A (zh) * 2019-05-17 2019-09-06 北京华控创为南京信息技术有限公司 智能语音数据处理装置及方法
CN112256953A (zh) * 2019-07-22 2021-01-22 腾讯科技(深圳)有限公司 查询改写方法、装置、计算机设备和存储介质
CN112256953B (zh) * 2019-07-22 2023-11-14 腾讯科技(深圳)有限公司 查询改写方法、装置、计算机设备和存储介质
CN112612442A (zh) * 2019-09-19 2021-04-06 北京搜狗科技发展有限公司 一种输入方法、装置和电子设备
CN113378530A (zh) * 2021-06-28 2021-09-10 北京七维视觉传媒科技有限公司 语音编辑方法及装置、设备和介质

Also Published As

Publication number Publication date
CN107221328B (zh) 2021-02-19
US20180341640A1 (en) 2018-11-29
US10528670B2 (en) 2020-01-07

Similar Documents

Publication Publication Date Title
CN107221328A (zh) 修改源的定位方法及装置、计算机设备及可读介质
US10755713B2 (en) Generic virtual personal assistant platform
US10698932B2 (en) Method and apparatus for parsing query based on artificial intelligence, and storage medium
US11328017B2 (en) Method and system for generating a conversational agent by automatic paraphrase generation based on machine translation
CN107220235A (zh) 基于人工智能的语音识别纠错方法、装置及存储介质
CN107273356A (zh) 基于人工智能的分词方法、装置、服务器和存储介质
CN108091328A (zh) 基于人工智能的语音识别纠错方法、装置及可读介质
CN109949797A (zh) 一种训练语料的生成方法、装置、设备及存储介质
CN107193973A (zh) 语义解析信息的领域识别方法及装置、设备及可读介质
CN110164435A (zh) 语音识别方法、装置、设备及计算机可读存储介质
US20140172411A1 (en) Apparatus and method for verifying context
CN107170453A (zh) 基于人工智能的跨语种语音转录方法、设备及可读介质
CN108549656A (zh) 语句解析方法、装置、计算机设备及可读介质
CN107729300A (zh) 文本相似度的处理方法、装置、设备和计算机存储介质
CN107545029A (zh) 智能设备的语音反馈方法、设备及可读介质
CN109992765A (zh) 文本纠错方法及装置、存储介质和电子设备
CN108052499A (zh) 基于人工智能的文本纠错方法、装置及计算机可读介质
CN104391793B (zh) 测试步骤及测试脚本生成方法及装置
EP3195308B1 (en) Actions on digital document elements from voice
CN111144128A (zh) 语义解析方法和装置
CN109815481A (zh) 对文本进行事件抽取的方法、装置、设备和计算机存储介质
CN112541068A (zh) 语音对话的意图识别方法、系统、设备及存储介质
CN109710951A (zh) 基于翻译历史的辅助翻译方法、装置、设备及存储介质
US20220198153A1 (en) Model training
CN109344374A (zh) 基于大数据的报表生成方法及装置、电子设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant