CN106126080B - 语音管理方法及装置 - Google Patents

语音管理方法及装置 Download PDF

Info

Publication number
CN106126080B
CN106126080B CN201610460833.5A CN201610460833A CN106126080B CN 106126080 B CN106126080 B CN 106126080B CN 201610460833 A CN201610460833 A CN 201610460833A CN 106126080 B CN106126080 B CN 106126080B
Authority
CN
China
Prior art keywords
message
content information
information
type
voice messaging
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610460833.5A
Other languages
English (en)
Other versions
CN106126080A (zh
Inventor
李鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisound Intelligent Technology Co Ltd
Xiamen Yunzhixin Intelligent Technology Co Ltd
Original Assignee
Beijing Yunzhisheng Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yunzhisheng Information Technology Co Ltd filed Critical Beijing Yunzhisheng Information Technology Co Ltd
Priority to CN201610460833.5A priority Critical patent/CN106126080B/zh
Publication of CN106126080A publication Critical patent/CN106126080A/zh
Application granted granted Critical
Publication of CN106126080B publication Critical patent/CN106126080B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明是关于一种语音管理方法及装置,其中,方法包括:获取用户输入的通过应用程序处理消息的语音信息;对所述语音信息进行识别,以得到所述语音信息对应的文字内容信息;将所述文字内容信息划分为执行指令信息和执行内容信息;从所述执行指令信息中获取出执行应用程序和对应的目标处理操作,以及所述执行内容消息的消息类型,其中,所述消息类型包括语音类型和文字类型;根据所述消息类型和所述执行内容消息确定目标处理消息;控制所述执行应用程序对所述目标处理消息执行所述目标处理操作。通过该技术方案,可以根据用户输入的语音信息自动执行通过应用程序处理语音内容信息的操作,从而减少用户的操作,提升用户的使用体验。

Description

语音管理方法及装置
技术领域
本发明涉及语音管理技术领域,尤其涉及一种语音管理方法及装置。
背景技术
相关技术中,当用户发语音信息时,需要用户手动进行发送。如用户想发即时消息给朋友,通知朋友今天有雨,则用户需要找到该朋友的通讯方式,进而输入语音信息告诉朋友今天有雨,然后点击发送按钮进行发送。这样,用户操作起来繁琐,用户体验不佳。
发明内容
本发明实施例提供一种语音管理方法及装置,用以实现方便用户发送语音信息,简化用户发送语音信息的过程,提升用户的使用体验。
根据本发明实施例的第一方面,提供一种语音管理方法,包括:
获取用户输入的通过应用程序处理消息的语音信息;
对所述语音信息进行识别,以得到所述语音信息对应的文字内容信息;
将所述文字内容信息划分为执行指令信息和执行内容信息;
从所述执行指令信息中获取出执行应用程序和对应的目标处理操作,以及所述执行内容消息的消息类型,其中,所述消息类型包括语音类型和文字类型;
根据所述消息类型和所述执行内容消息确定目标处理消息;
控制所述执行应用程序对所述目标处理消息执行所述目标处理操作。
在一个实施例中,所述对所述语音信息进行识别,以得到所述语音信息对应的文字内容信息,包括:
对所述语音信息分别进行语音和语义识别,以得到所述语音信息对应的文字内容信息。
在一个实施例中,所述根据所述消息类型和所述执行内容消息确定目标处理消息,包括:
判断所述消息类型;
当所述消息类型为语音类型时,根据所述执行内容信息从所述语音信息中截取出待处理的目标处理消息;
当所述消息类型为文字类型时,将所述执行内容消息确定为所述目标处理消息。
在一个实施例中,所述将所述文字内容信息划分为执行指令信息和执行内容信息,包括:
获取所述语音信息对应的语音停顿信息;
对文字内容信息进行词义解析,以得到词义解析结果;
根据所述语音停顿信息和所述词义解析结果对所述文字内容信息进行分词操作,得到分词操作结果;
根据分词操作结果,将所述文字内容信息划分为执行指令信息和执行内容信息。
在一个实施例中,所述根据分词操作结果,将所述文字内容信息划分为执行指令信息和执行内容信息,包括:
根据分词操作结果确定所述执行指令信息和所述执行内容信息之间的分界点,以及所述执行内容信息的结束点。
在一个实施例中,所述根据所述执行内容信息从所述语音信息中截取出待处理的目标处理消息,包括:
根据所述执行指令信息和所述执行内容信息之间的分界点,以及所述执行内容信息的结束点,从所述语音信息中截取出所述目标处理消息。
根据本发明实施例的第二方面,提供一种语音管理装置,包括:
第一获取模块,用于获取用户输入的通过应用程序处理消息的语音信息;
识别模块,用于对所述语音信息进行识别,以得到所述语音信息对应的文字内容信息;
划分模块,用于将所述文字内容信息划分为执行指令信息和执行内容信息;
第二获取模块,用于从所述执行指令信息中获取出执行应用程序和对应的目标处理操作,以及所述执行内容消息的消息类型,其中,所述消息类型包括语音类型和文字类型;
确定模块,用于根据所述消息类型和所述执行内容消息确定目标处理消息;
执行模块,用于控制所述执行应用程序对所述目标处理消息执行所述目标处理操作。
在一个实施例中,所述确定模块包括:
判断子模块,用于判断所述消息类型;
截取子模块,用于当所述消息类型为语音类型时,根据所述执行内容信息从所述语音信息中截取出待处理的目标处理消息;
确定子模块,用于当所述消息类型为文字类型时,将所述执行内容消息确定为所述目标处理消息。
在一个实施例中,所述识别模块用于:
对所述语音信息分别进行语音和语义识别,以得到所述语音信息对应的文字内容信息。
在一个实施例中,所述划分模块包括:
获取子模块,用于获取所述语音信息对应的语音停顿信息;
解析子模块,用于对文字内容信息进行词义解析,以得到词义解析结果;
分词子模块,用于根据所述语音停顿信息和所述词义解析结果对所述文字内容信息进行分词操作,得到分词操作结果;
划分子模块,用于根据分词操作结果,将所述文字内容信息划分为执行指令信息和执行内容信息。
在一个实施例中,所述划分子模块用于:
根据分词操作结果确定所述执行指令信息和所述执行内容信息之间的分界点,以及所述执行内容信息的结束点。
在一个实施例中,所述截取子模块用于:
根据所述执行指令信息和所述执行内容信息之间的分界点,以及所述执行内容信息的结束点,从所述语音信息中截取出所述目标处理消息。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种语音管理方法的流程图。
图2是根据一示例性实施例示出的一种语音管理方法中步骤S102的流程图。
图3是根据一示例性实施例示出的一种语音管理方法中步骤S103的流程图。
图4是根据一示例性实施例示出的一种语音管理方法中步骤S304的流程图。
图5是根据一示例性实施例示出的一种语音管理方法中步骤S105的流程图。
图6A是根据一示例性实施例示出的一种语音管理装置的框图。
图6B是根据一示例性实施例示出的一种语音管理装置中确定模块的框图。
图7是根据一示例性实施例示出的一种语音管理装置中划分模块的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种语音管理方法的流程图。该语音管理方法可应用于终端设备中,该终端设备可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理、车载终端等任一具有语音管理功能的设备。如图1所示,该方法包括步骤S101-S106:
在步骤S101中,获取用户输入的通过应用程序处理消息的语音信息;
用户输入的通过应用程序处理内容消息的语音信息中,可以包括应用程序、处理动作、内容消息等,如用户输入语音信息“发语音微信给李雪,今天下雨”,则应用程序为微信,处理动作为发语音信息,语音内容为今天下雨。
在步骤S102中,对所述语音信息进行识别,以得到所述语音信息对应的文字内容信息;
在步骤S103中,将所述文字内容信息划分为执行指令信息和执行内容信息;
文字内容信息可以划分为执行指令信息和执行内容信息,如识别出用户输入的语音信息对应的文字内容为“发语音微信给李雪,今天下雨”,则发语音微信给李雪为执行指令信息,今天下雨为执行内容信息。
在步骤S104中,从所述执行指令信息中获取出执行应用程序和对应的目标处理操作,以及所述执行内容消息的消息类型,其中,所述消息类型包括语音类型和文字类型;
在执行指令信息中,包括执行应用程序和对应的目标处理操作,例如执行指令信息“发语音微信给李雪”,则执行应用程序为微信,对应的目标处理操作为“发语音给李雪,消息类型为语音”。
具体地,在划分文字内容信息和从执行指令信息中获取执行应用程序和对应的目标处理操作时,可以对文字内容信息中的词语进行分词,将其与各词典库匹配,从而根据匹配结果进行划分和获取操作。
在步骤S105中,根据所述消息类型和所述执行内容消息确定目标处理消息;
执行内容信息即应用程序需要处理的内容,执行内容信息是文字形式的,由于消息类型分为语音和文字两种,因此,针对不同的语音类型,处理方式也不同。例如,如果消息类型是语音形式的,可以根据执行内容信息从用户输入的语音信息中,截取出于执行内容对应的目标处理消息,而如果消息类型是文字形式的,则可以直接将执行内容信息作为目标处理消息。
例如,用户输入的语音信息为“发语音微信给李雪,今天下雨”,进行语音识别和划分后,确定发语音微信给李雪为执行指令信息,今天下雨为执行内容信息,则根据文字形式的“今天下雨”从用户输入的语音信息中截取出语音形式的“今天下雨”。
在步骤S106中,控制所述执行应用程序对所述目标处理消息执行所述目标处理操作。
在该实施例中,可以根据用户输入的语音信息自动执行通过应用程序处理语音内容信息的操作,从而减少用户的操作,提升用户的使用体验。
图2是根据一示例性实施例示出的一种语音管理方法中步骤S105的流程图。
如图2所示,在一个实施例中,上述步骤S105包括步骤S201-S203:
在步骤S201中,判断所述消息类型;
在步骤S202中,当所述消息类型为语音类型时,根据所述执行内容信息从所述语音信息中截取出待处理的目标处理消息;
在步骤S203中,当所述消息类型为文字类型时,将所述执行内容消息确定为所述目标处理消息。
在该实施例中,由于执行内容信息是文字形式的,而消息类型分为语音和文字两种,因此,针对不同的语音类型,处理方式也不同。例如,如果消息类型是语音形式的,可以根据执行内容信息从用户输入的语音信息中,截取出于执行内容对应的目标处理消息,而如果消息类型是文字形式的,则可以直接将执行内容信息作为目标处理消息。
例如,用户输入的语音信息为“发语音微信给李雪,今天下雨”,进行语音识别和划分后,确定发语音微信给李雪为执行指令信息,消息类型为语音类型,今天下雨为执行内容信息,则根据文字形式的“今天下雨”从用户输入的语音信息中截取出语音形式的“今天下雨”。
又例如,用户输入的语音信息为“发文字微信给李雪”,进行语音识别和划分后,确定发文字微信给李雪为执行指令信息,消息类型为文字类型,今天下雨为执行内容信息,则直接发送文字形式的“今天下雨”给李雪。
在一个实施例中,所述将所述文字内容信息划分为执行指令信息和执行内容信息,包括:
对所述语音信息分别进行语音和语义识别,以得到所述语音信息对应的文字内容信息。
在该实施例中,可以通过语音识别模型和语义识别模块对语音信息进行处理,从而得到语音信息对应的文字内容信息,保证文字内容信息的准确性。
图3是根据一示例性实施例示出的一种语音管理方法中步骤S103的流程图。
如图3所示,在一个实施例中,上述步骤S103包括步骤S301-S304:
在步骤S301中,获取所述语音信息对应的语音停顿信息;
语音停顿信息,可以是用户输入语音时,说的不同词语之间的时间间隔信息。
在步骤S302中,对文字内容信息进行词义解析,以得到词义解析结果;
对文字内容信息进行词义解析,如分析文字内容信息中词语的词性等,也可以将词语与不同的词典库进行匹配,从而根据匹配结果确定词义。如不同性质、词性的词语可以将其分为不同的词典库,从而,便于对文字内容信息进行词义解析。
在步骤S303中,根据所述语音停顿信息和所述词义解析结果对所述文字内容信息进行分词操作,得到分词操作结果;
根据语音停顿信息和词义解析结果,可以对完整的文字内容信息进行分词操作,如对于文字内容信息“发语音微信给李雪,今天下雨”,则根据语音停顿信息和词义解析结果,可以将其分为“发”“语音”“微信”“给”“李雪”“今天下雨”几个词。
在步骤S304中,根据分词操作结果,将所述文字内容信息划分为执行指令信息和执行内容信息。
根据分词操作结果,可以将文字内容信息划分为执行指令信息和执行内容信息,如执行指令信息为“发”“语音”“微信”“给”“李雪”,执行内容信息为“今天下雨”。
图4是根据一示例性实施例示出的一种语音管理方法中步骤S304的流程图。
如图4所示,在一个实施例中,上述步骤S304包括步骤S401:
在步骤S401中,根据分词操作结果确定所述执行指令信息和所述执行内容信息之间的分界点,以及所述执行内容信息的结束点。
根据分词操作结果,可以确定每个词的属性,如“语音”为消息类型,“微信”为执行应用程序,“发”、“给”为操作动作,“李雪”为接收对象,“今天下雨”为执行内容。则根据上述分词结果,确定执行指令信息和执行内容信息之间的分界点,以及执行内容信息的结束点,从而便于从语音信息中截取出语音形式的执行内容。
图5是根据一示例性实施例示出的一种语音管理方法中步骤S105的流程图。
如图5所示,在一个实施例中,上述步骤S201包括步骤S501:
在步骤S501中,根据所述执行指令信息和所述执行内容信息之间的分界点,以及所述执行内容信息的结束点,从所述语音信息中截取出所述目标处理消息。
在该实施例中,在执行指令信息和所述执行内容信息之间的分界点,以及所述执行内容信息的结束点确定后,可以根据该分界点和结束点从所述语音信息中截取出所述目标处理消息。
例如,用户输入的语音信息为“帮我给李雪发语音消息,内容是明天下雪不要开车,完毕发送”,则根据上述技术方案,截取出的目标处理消息为“明天下雪不要开车”。
上述技术方案,还可以采用另外一种方式实现,例如,对于语音信息“发语音微信给李雪,今天下雨”,先对语音进行声音识别,根据声音的停顿对语音进行分句。将第一句话识别成文字,判断从文字中是否可以识别出待处理应用程序、处理动作、接收对象、消息格式等信息。如果能够识别出,则生成相应的指令,后面的语音不再识别,将后面的语音作为语音消息内容直接发送。如果未识别出上述信息,说明上述信息是消息内容,则对下一句话进行识别。这样,可以缩短识别过程,从而加快处理速度。
下述为本发明装置实施例,可以用于执行本发明方法实施例。
图6A是根据一示例性实施例示出的一种语音管理装置的框图,该装置可以通过软件、硬件或者两者的结合实现成为终端设备的部分或者全部。如图6A所示,该语音管理装置包括:
第一获取模块61,用于获取用户输入的通过应用程序处理消息的语音信息;
识别模块62,用于对所述语音信息进行识别,以得到所述语音信息对应的文字内容信息;
划分模块63,用于将所述文字内容信息划分为执行指令信息和执行内容信息;
第二获取模块64,用于从所述执行指令信息中获取出执行应用程序和对应的目标处理操作,以及所述执行内容消息的消息类型,其中,所述消息类型包括语音类型和文字类型;
确定模块65,用于根据所述执行内容信息从所述语音信息中截取出待处理的目标处理消息;
执行模块66,用于控制所述执行应用程序对所述目标处理消息执行所述目标处理操作。
图6B是根据一示例性实施例示出的一种语音管理装置中确定模块的框图。
如图6B所示,在一个实施例中,所述确定模块65包括:
判断子模块651,用于判断所述消息类型;
截取子模块652,用于当所述消息类型为语音类型时,根据所述执行内容信息从所述语音信息中截取出待处理的目标处理消息;
确定子模块653,用于当所述消息类型为文字类型时,将所述执行内容消息确定为所述目标处理消息。
在一个实施例中,所述识别模块62用于:
对所述语音信息分别进行语音和语义识别,以得到所述语音信息对应的文字内容信息。
图7是根据一示例性实施例示出的一种语音管理装置中划分模块的框图。
如图7所示,在一个实施例中,所述划分模块63包括:
获取子模块71,用于获取所述语音信息对应的语音停顿信息;
解析子模块72,用于对文字内容信息进行词义解析,以得到词义解析结果;
分词子模块73,用于根据所述语音停顿信息和所述词义解析结果对所述文字内容信息进行分词操作,得到分词操作结果;
划分子模块74,用于根据分词操作结果,将所述文字内容信息划分为执行指令信息和执行内容信息。
在一个实施例中,所述划分子模块74用于:
根据分词操作结果确定所述执行指令信息和所述执行内容信息之间的分界点,以及所述执行内容信息的结束点。
在一个实施例中,所述截取子模块652用于:
根据所述执行指令信息和所述执行内容信息之间的分界点,以及所述执行内容信息的结束点,从所述语音信息中截取出所述目标处理消息。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (8)

1.一种语音管理方法,其特征在于,包括:
获取用户输入的通过应用程序处理消息的语音信息;
对所述语音信息进行识别,以得到所述语音信息对应的文字内容信息;
将所述文字内容信息划分为执行指令信息和执行内容信息;
从所述执行指令信息中获取出执行应用程序和对应的目标处理操作,以及所述执行内容信息的消息类型,其中,所述消息类型包括语音类型和文字类型;
根据所述消息类型和所述执行内容信息确定目标处理消息;
控制所述执行应用程序对所述目标处理消息执行所述目标处理操作;
所述根据所述消息类型和所述执行内容信息确定目标处理消息,包括:
判断所述消息类型;
当所述消息类型为语音类型时,根据所述执行内容信息从所述语音信息中截取出待处理的目标处理消息;或者
当所述消息类型为语音类型时,所述对所述语音信息进行识别,以得到所述语音信息对应的文字内容信息,包括:
对所述语音信息进行声音识别,根据声音的停顿对所述语音信息进行分句;
对所述语音信息中的第一句进行识别;
所述将所述文字内容信息划分为执行指令信息和执行内容信息,包括:
判断是否识别出执行指令信息;
当识别出执行指令信息时,不再识别除所述第一句之外的剩余语音信息,并将剩余语音信息确定为执行内容。
2.根据权利要求1所述的方法,其特征在于,所述将所述文字内容信息划分为执行指令信息和执行内容信息,包括:
获取所述语音信息对应的语音停顿信息;
对文字内容信息进行词义解析,以得到词义解析结果;
根据所述语音停顿信息和所述词义解析结果对所述文字内容信息进行分词操作,得到分词操作结果;
根据分词操作结果,将所述文字内容信息划分为执行指令信息和执行内容信息。
3.根据权利要求2所述的方法,其特征在于,所述根据分词操作结果,将所述文字内容信息划分为执行指令信息和执行内容信息,包括:
根据分词操作结果确定所述执行指令信息和所述执行内容信息之间的分界点,以及所述执行内容信息的结束点。
4.根据权利要求3所述的方法,其特征在于,所述根据所述执行内容信息从所述语音信息中截取出待处理的目标处理消息,包括:
根据所述执行指令信息和所述执行内容信息之间的分界点,以及所述执行内容信息的结束点,从所述语音信息中截取出所述目标处理消息。
5.一种语音管理装置,其特征在于,包括:
第一获取模块,用于获取用户输入的通过应用程序处理消息的语音信息;
识别模块,用于对所述语音信息进行识别,以得到所述语音信息对应的文字内容信息;
划分模块,用于将所述文字内容信息划分为执行指令信息和执行内容信息;
第二获取模块,用于从所述执行指令信息中获取出执行应用程序和对应的目标处理操作,以及所述执行内容信息的消息类型,其中,所述消息类型包括语音类型和文字类型;
确定模块,用于根据所述消息类型和所述执行内容信息确定目标处理消息;
执行模块,用于控制所述执行应用程序对所述目标处理消息执行所述目标处理操作;
所述确定模块包括:
判断子模块,用于判断所述消息类型;
截取子模块,用于当所述消息类型为语音类型时,根据所述执行内容信息从所述语音信息中截取出待处理的目标处理消息;或者
当所述消息类型为语音类型时,所述识别模块还用于:
对所述语音信息进行声音识别,根据声音的停顿对所述语音信息进行分句;
对所述语音信息中的第一句进行识别;
所述划分模块还用于:
判断是否识别出执行指令信息;
当识别出执行指令信息时,不再识别除所述第一句之外的剩余语音信息,并将剩余语音信息确定为执行内容。
6.根据权利要求5所述的装置,其特征在于,所述划分模块包括:
获取子模块,用于获取所述语音信息对应的语音停顿信息;
解析子模块,用于对文字内容信息进行词义解析,以得到词义解析结果;
分词子模块,用于根据所述语音停顿信息和所述词义解析结果对所述文字内容信息进行分词操作,得到分词操作结果;
划分子模块,用于根据分词操作结果,将所述文字内容信息划分为执行指令信息和执行内容信息。
7.根据权利要求6所述的装置,其特征在于,所述划分子模块用于:
根据分词操作结果确定所述执行指令信息和所述执行内容信息之间的分界点,以及所述执行内容信息的结束点。
8.根据权利要求7所述的装置,其特征在于,所述截取子模块用于:
根据所述执行指令信息和所述执行内容信息之间的分界点,以及所述执行内容信息的结束点,从所述语音信息中截取出所述目标处理消息。
CN201610460833.5A 2016-06-22 2016-06-22 语音管理方法及装置 Active CN106126080B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610460833.5A CN106126080B (zh) 2016-06-22 2016-06-22 语音管理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610460833.5A CN106126080B (zh) 2016-06-22 2016-06-22 语音管理方法及装置

Publications (2)

Publication Number Publication Date
CN106126080A CN106126080A (zh) 2016-11-16
CN106126080B true CN106126080B (zh) 2019-08-16

Family

ID=57268028

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610460833.5A Active CN106126080B (zh) 2016-06-22 2016-06-22 语音管理方法及装置

Country Status (1)

Country Link
CN (1) CN106126080B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106598621B (zh) * 2016-12-22 2020-06-02 维沃移动通信有限公司 一种应用程序的工作方法及移动终端
CN107452382A (zh) * 2017-07-19 2017-12-08 珠海市魅族科技有限公司 语音操作方法及装置、计算机装置和计算机可读存储介质
CN110138951A (zh) * 2018-02-02 2019-08-16 郑州工业应用技术学院 一种通信方法及通信终端
CN110265022A (zh) * 2018-03-12 2019-09-20 郑州工业应用技术学院 一种传送语音的方法及智能设备
CN111090379A (zh) * 2019-11-29 2020-05-01 联想(北京)有限公司 一种信息处理方法及信息处理装置
CN110931010A (zh) * 2019-12-17 2020-03-27 用友网络科技股份有限公司 语音控制系统
CN112019421A (zh) * 2020-08-20 2020-12-01 浙江企蜂信息技术有限公司 一种话务机及其消息综合处理方法、装置及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102883041A (zh) * 2012-08-02 2013-01-16 聚熵信息技术(上海)有限公司 移动终端的语音控制装置及方法
CN103714815A (zh) * 2013-12-09 2014-04-09 何永 语音控制方法及其设备
CN104575501A (zh) * 2015-01-19 2015-04-29 北京云知声信息技术有限公司 一种收音机语音操控指令解析方法及系统
CN105162678A (zh) * 2015-07-07 2015-12-16 腾讯科技(深圳)有限公司 语音聊天的模式自适应方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9400633B2 (en) * 2012-08-02 2016-07-26 Nuance Communications, Inc. Methods and apparatus for voiced-enabling a web application

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102883041A (zh) * 2012-08-02 2013-01-16 聚熵信息技术(上海)有限公司 移动终端的语音控制装置及方法
CN103714815A (zh) * 2013-12-09 2014-04-09 何永 语音控制方法及其设备
CN104575501A (zh) * 2015-01-19 2015-04-29 北京云知声信息技术有限公司 一种收音机语音操控指令解析方法及系统
CN105162678A (zh) * 2015-07-07 2015-12-16 腾讯科技(深圳)有限公司 语音聊天的模式自适应方法及装置

Also Published As

Publication number Publication date
CN106126080A (zh) 2016-11-16

Similar Documents

Publication Publication Date Title
CN106126080B (zh) 语音管理方法及装置
US10923119B2 (en) Speech data processing method and apparatus, device and storage medium
US10922804B2 (en) Method and apparatus for evaluating image definition, computer device and storage medium
CN107195303B (zh) 语音处理方法及装置
TWI467418B (zh) 效率高的姿勢處理方法及電腦程式產品
EP3232160A1 (en) Voice input assistance device, voice input assistance system, and voice input method
CN106486126B (zh) 语音识别纠错方法及装置
CN109429522A (zh) 语音交互方法、装置及系统
CN106126157B (zh) 基于医院信息系统的语音输入方法及装置
EP3477635A1 (en) System and method for natural language processing
CN106601257B (zh) 一种声音识别方法、设备和第一电子设备
US20130346066A1 (en) Joint Decoding of Words and Tags for Conversational Understanding
CN106653030A (zh) 标点添加方法及装置
US20140207453A1 (en) Method and apparatus for editing voice recognition results in portable device
JP2014132342A (ja) 対話型サーバ、ディスプレイ装置及びその制御方法
CN111597808A (zh) 仪表盘绘制处理方法、装置、电子设备和存储介质
CN106328145A (zh) 语音修正方法及装置
CN103076893A (zh) 一种用于实现语音输入的方法与设备
CN111524507A (zh) 语音信息的反馈方法、装置、设备、服务器及存储介质
CN106486118B (zh) 一种应用的语音控制方法和装置
CN106210908A (zh) 一种广告推送方法及装置
CN109829431B (zh) 用于生成信息的方法和装置
CN114055468B (zh) 轨迹复现方法、系统及终端设备
CN103399737B (zh) 基于语音数据的多媒体处理方法及装置
CN105893345A (zh) 一种信息处理方法和电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: No. 101, 1st Floor, 1st Building, Xisanqi Building Materials City, Haidian District, Beijing, 100000

Patentee after: Yunzhisheng Intelligent Technology Co.,Ltd.

Address before: 100191 Beijing, Huayuan Road, Haidian District No. 2 peony technology building, 5 floor, A503

Patentee before: BEIJING UNISOUND INFORMATION TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20200402

Address after: No. 101, 1st Floor, 1st Building, Xisanqi Building Materials City, Haidian District, Beijing, 100000

Co-patentee after: Xiamen yunzhixin Intelligent Technology Co.,Ltd.

Patentee after: Yunzhisheng Intelligent Technology Co.,Ltd.

Address before: No. 101, 1st Floor, 1st Building, Xisanqi Building Materials City, Haidian District, Beijing, 100000

Patentee before: Yunzhisheng Intelligent Technology Co.,Ltd.