CN106777099A - 业务语音数据的处理方法、装置及终端设备 - Google Patents

业务语音数据的处理方法、装置及终端设备 Download PDF

Info

Publication number
CN106777099A
CN106777099A CN201611154825.4A CN201611154825A CN106777099A CN 106777099 A CN106777099 A CN 106777099A CN 201611154825 A CN201611154825 A CN 201611154825A CN 106777099 A CN106777099 A CN 106777099A
Authority
CN
China
Prior art keywords
speech data
data
business
guiding
business speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611154825.4A
Other languages
English (en)
Inventor
方茗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhangyue Technology Co Ltd
Original Assignee
Zhangyue Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhangyue Technology Co Ltd filed Critical Zhangyue Technology Co Ltd
Priority to CN201611154825.4A priority Critical patent/CN106777099A/zh
Publication of CN106777099A publication Critical patent/CN106777099A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B19/00Driving, starting, stopping record carriers not specifically of filamentary or web form, or of supports therefor; Control thereof; Control of operating function ; Driving both disc and head
    • G11B19/02Control of operating function, e.g. switching from recording to reproducing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例提供了一种业务语音数据的处理方法、装置及终端设备,其中,所述业务语音数据的处理方法包括:在第一业务语音数据的播放过程中,检测到第二业务语音数据的播放标记;中断所述第一业务语音数据的播放,获取所述第二业务语音数据中的引导语音数据并播放,并接收根据所述引导语音数据输入的用户行为数据;对所述用户行为数据进行识别;根据识别结果对所述第二业务语音数据进行处理。通过本发明实施例降低了网络资源和客户端资源的占用,为用户提供了播放第二业务语音数据的选择机会,提升了用户播放第一业务语音数据的体验。

Description

业务语音数据的处理方法、装置及终端设备
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种业务语音数据的处理方法、装置及终端设备。
背景技术
随着终端设备的普及,在终端设备上通过类似听书、广播直播、广播录播或其它途径获取信息的人越来越多。由此,通过相应的语音播放应用进行语音播放为许多新的业务提供了商机,成为一些业务植入如广告植入的优质资源。
现有语音广告主要通过植入的方式,在语音播放的某个时间插入固定时长的广告。但是,一方面,这种语音广告方式不但占用网络资源,也占用客户端的系统资源;另一方面,这种语音广告方式可能会打扰一部分听众的正常收听体验,引起观众反感,不能达到预想的广告效果,也使得用户对语音播放的体验较差。
发明内容
本发明实施例提供了一种业务语音数据的处理方法、装置及终端设备,已解决目前的业务植入方式占用网络资源和客户端资源,以及引起观众反感,不能达到预想的效果,使得用户对语音播放的体验较差的问题。
根据本发明实施例的一方面,提供了一种业务语音数据的处理方法,包括:
在第一业务语音数据的播放过程中,检测到第二业务语音数据的播放标记;
中断所述第一业务语音数据的播放,获取所述第二业务语音数据中的引导语音数据并播放,并接收根据所述引导语音数据输入的用户行为数据;
对所述用户行为数据进行识别;
根据识别结果对所述第二业务语音数据进行处理。
根据本发明实施例的另一方面,提供了一种业务语音数据的处理装置,包括:
检测模块,用于在第一业务语音数据的播放过程中,检测到第二业务语音数据的播放标记;
获取模块,用于中断所述第一业务语音数据的播放,获取所述第二业务语音数据中的引导语音数据并播放,并接收根据所述引导语音数据输入的用户行为数据;
识别模块,用于对所述用户行为数据进行识别;
处理模块,用于根据识别结果对所述第二业务语音数据进行处理。
根据本发明实施例的另一方面,还提供了一种终端设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如上所述的业务语音数据的处理方法对应的操作。
根据本发明实施例的再一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有:用于在第一业务语音数据的播放过程中,检测到第二业务语音数据的播放标记的可执行指令;用于中断所述第一业务语音数据的播放,获取所述第二业务语音数据中的引导语音数据并播放,并接收根据所述引导语音数据输入的用户行为数据的可执行指令;用于对所述用户行为数据进行识别的可执行指令;用于根据识别结果对所述第二业务语音数据进行处理的可执行指令。
根据本发明实施例提供的一种业务语音数据的处理方法、装置及终端设备,在播放第一业务语音数据时,检测到第二业务语音数据的播放标记,该播放标记可以设置于第一业务语音数据的任意适当位置,如某段内容或者某章内容的结尾处。当检测到第二业务语音数据的播放标记时,中断正在播放的第一业务语音数据,获取引导语音数据并播放。其中,引导语音数据主要包含第二业务语音数据的简要信息,播放时间比较短,而且,引导语音数据可以指示用户进行输入操作。在接收并识别到根据引导语音数据输入的用户行为数据后,可以根据识别结果对第二业务语音数据进行处理,例如,播放或者不播放第二业务语音数据的详情数据等。本发明实施例在播放第一业务语音数据的过程中:一方面、播放一段第二业务语音数据的引导语音数据,引导语音数据的时间较短,降低了网络资源和客户端资源的占用;另一方面、可以根据用户行为数据确定是否播放第二业务语音数据的详情数据等,增加了与用户之间的交互过程,为用户提供了播放详情数据的选择机会,提升了用户播放第一业务语音数据的体验。
附图说明
图1是根据本发明实施例一的一种业务语音数据的处理方法的步骤流程图;
图2是根据本发明实施例二的一种业务语音数据的处理方法的步骤流程图;
图3是根据本发明实施例三的一种业务语音数据的处理装置的结构框图;
图4是根据本发明实施例四的一种业务语音数据的处理装置的结构框图;
图5是根据本发明实施例五的一种终端设备的结构示意图。
具体实施方式
下面结合附图(若干附图中相同的标号表示相同的元素)和实施例,对本发明实施例的具体实施方式作进一步详细说明。以下实施例用于说明本发明,但不用来限制本发明的范围。
本领域技术人员可以理解,本发明实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
实施例一
参照图1,示出了根据本发明实施例一的一种业务语音数据的处理方法的步骤流程图。
本实施例中的业务语音数据的处理方法可以由任意适当的终端设备实现,如智能手机、平板电脑或台式电脑等,但不限于此,其它具备类似数据处理功能的装置均可参照本实施例实现业务语音数据的处理方法,本发明实施例对此不作限制,本实施例仅以终端设备为例进行说明。
本实施例的业务语音数据的处理方法包括如下步骤:
步骤S100、在第一业务语音数据的播放过程中,检测到第二业务语音数据的播放标记。
本实施例中,第一业务语音数据可以认为是用户通过应用程序播放的语音数据,如小说、散文等从文本到语音(Text To Speech,TTS)数据。第二业务语音数据可以认为是在第一业务语音数据中插入的、与第一业务语音数据的内容相关或者不相关语音数据,如语音广告等。
在第一业务语音数据的至少一个位置处,可以预先设置第二业务语音数据的播放标记,该播放标记可以为符号、标签、备注等等,不同位置处的播放标记可以相同或者不同,本实施例对第二业务语音数据的播放标记的类别不做限制。
步骤S102、中断第一业务语音数据的播放,获取第二业务语音数据中的引导语音数据并播放,并接收根据引导语音数据输入的用户行为数据。
在上述步骤S100检测到第二业务语音数据的播放标记之后,中断播放第一业务语音数据,即将第一业务语音数据由播放状态转换为暂停状态。
在暂停第一业务语音数据之后,获取并播放第二业务语音数据的引导语音数据,该引导语音数据用于简要介绍第二业务语音数据的内容,引导语音数据的播放时间可以设置得比较短,具体时间可以由本领域技术人员根据实际情况适当设置,如5秒左右,以减少播放引导语音数据的时间,降低对播放第一业务语音数据的干扰。而且,引导语音数据中还包括指示用户输入用户行为数据的内容。
用户在接收到引导语音数据的指示后,可以通过适当方式进行输入操作,包括但不限于:语音输入、手势输入、表情输入、文字输入等等。
步骤S104、对用户行为数据进行识别。
本实施例中,对前述用户输入相对应,用户行为数据可以认为是用户通过终端设备输入的语音数据、手势数据、表情数据、文字数据等等。
本步骤S104对用户行为数据进行识别,可以认为是识别语音数据、手势数据或者表情数据等,例如,通过语音识别技术对语音数据进行识别,通过图像识别技术对手势数据或者表情数据进行识别,本实施例对用户行为数据进行识别所采用的技术手段不做限制。
步骤S106、根据识别结果对第二业务语音数据进行处理。
本实施例中,根据不同的识别结果可以采用不同的方式处理第二业务语音数据,例如,若确定允许播放第二业务语音数据,则在第一业务语音数据的播放过程中,获取并播放第二业务语音数据;若确定禁止播放第二业务语音数据,则在第一业务语音数据的播放过程中,禁止获取第二业务语音数据。
根据本实施例提供的一种业务语音数据的处理方法,在播放第一业务语音数据时,检测到第二业务语音数据的播放标记,该播放标记可以设置于第一业务语音数据的任意适当位置,如某段内容或者某章内容的结尾处。当检测到第二业务语音数据的播放标记时,中断正在播放的第一业务语音数据,获取引导语音数据并播放。其中,引导语音数据主要包含第二业务语音数据的简要信息,播放时间比较短,而且,引导语音数据可以指示用户进行输入操作。在接收并识别到根据引导语音数据输入的用户行为数据后,可以根据识别结果对第二业务语音数据进行处理,例如,播放或者不播放第二业务语音数据的详情数据等。本实施例在播放第一业务语音数据的过程中:一方面、播放一段第二业务语音数据的引导语音数据,引导语音数据的时间较短,降低了网络资源和客户端资源的占用;另一方面、可以根据用户行为数据确定是否播放第二业务语音数据的详情数据等,增加了与用户之间的交互过程,为用户提供了播放详情数据的选择机会,提升了用户播放第一业务语音数据的体验。
实施例二
参照图2,示出了根据本发明实施例二的一种业务语音数据的处理方法的步骤流程图。
本实施例中的业务语音数据的处理方法可以由任意适当的终端设备实现,如智能手机、平板电脑或台式电脑等,但不限于此,其它具备类似数据处理功能的装置均可参照本实施例实现业务语音数据的处理方法,本发明实施例对此不作限制,本实施例仍以终端设备为例进行说明。
本实施例在上述实施例的基础上,强调与上述实施例的不同之处,相同之处可以参照上述实施例中的介绍和说明。
本实施例的业务语音数据的处理方法包括如下步骤:
步骤S200、在第一业务语音数据的播放过程中,检测到第二业务语音数据的播放标记。
本实施例中,第一业务语音数据包括电子书语音数据或广播数据,本实施例以电子书语音数据例如为小说语音数据为例进行说明。第二业务语音数据包括语音广告,本实施例以语音广告例如为汽车语音广告为例进行说明。
步骤S202、中断第一业务语音数据的播放,获取第二业务语音数据中的引导语音数据,播放引导语音数据并提示用户对引导语音数据进行响应。
中断第一业务语音数据的播放,即暂时停止播放第一业务语音数据,并记录第一业务语音数据停止时的播放进度信息或者播放位置信息,如小说语音数据在播放完第一章时中断,则记录播放进度信息或播放位置信息为第一章结尾处;小说语音数据在播放完第10页时中断,则记录播放进度信息或播放位置信息为第10页结尾处。
本发明实施例中,第二业务语音数据包括引导语音数据和详情数据。其中,引导语音数据主要包含第二业务语音数据的简要信息,播放时间比较短;详情数据主要包含第二业务语音数据的详细信息。
本步骤S202中,在获取第二业务语音数据中的引导语音数据,播放引导语音数据时,一种可行方式为:可以根据对当前用户的历史业务语音播放数据的分析结果,从第二业务语音数据库中获取并播放与分析结果对应的引导语音数据。历史业务语音播放数据可以认为是一段时间内用户播放的业务语音数据的类别、时间等,历史业务语音播放数据还可以包括用户禁止播放的业务语音数据。第二业务语音数据库可以设置于服务器侧,还可以设置于终端设备上。本实施例根据对当前用户的历史业务语音播放数据的分析结果,获取并播放与分析结果对应的引导语音数据,充分考虑了当前用户对业务语音数据的喜好,可以针对不同的用户获取并播放适合的引导语音数据,为不同用户提供个性化服务。
另一种可行方式为:可以根据第一业务语音数据,如小说语音数据的内容,从第二业务语音数据库中获取并播放与小说语音数据的内容相关的引导语音数据。例如,小说语音数据的内容为网络游戏,则可以获取并播放与网络游戏相关的引导语音数据。
再一种可行方式为:为第一业务语音数据预先设置第二业务语音数据的引导语音数据,例如,第一业务语音数据为广播数据,广播数据可以认为是一种录播的语音数据。预先在广播数据的第10分钟时间节点处设置由广播数据的主持人录播完成的引导语音数据,由于广播数据和引导语音数据均由同一人录播,保证了第一业务语音数据和第二业务语音数据的引导语音数据的场景一致性,提升用户播放第一业务语音数据和第二业务语音数据的引导语音数据的体验。
本步骤S202中,提示用户对引导语音数据进行响应的形式可以为在引导语音数据的结尾处,通过语音的形式提示用户如何操作以实现响应引导语音数据,本实施例对提示用户对引导语音数据进行响应的具体形式不做限制。步骤S204、接收用户响应引导语音数据输入的用户行为数据。
根据不同类别的用户行为数据,本步骤S204可以接收用户响应引导语音数据输入的语音数据或手势数据。
引导语音数据中可以包含引导用户是否播放第二业务语音数据的详情数据的操作内容,如引导语音数据为一段关于某款汽车的简介信息,其中包含了引导用户是否播放该款汽车的具体参数的操作指示:如果用户对着终端设备的麦克风说“好”,表示播放该款汽车的具体参数;如果用户对着终端设备的麦克风说“忽略”,表示不播放该款汽车的具体参数;如果用户对着终端设备的摄像头摆出“OK”手势,表示播放该款汽车的具体参数;如果用户对着终端设备的摄像头摆出“摆手”手势,表示不播放该款汽车的具体参数。本实施例对用户输入的语音数据或手势数据的具体内容不做限制。
除上述介绍的用户行为数据之外,还可以根据提示用户对引导语音数据进行响应的操作窗口,从操作窗口中选择符合用户意愿的选项,将选择的选项对应的操作数据作为用户行为数据。步骤S206、识别语音数据或手势数据中包含的对第二业务语音数据中的引导语音数据的响应信息。
例如,识别语音数据中包含对第二业务语音数据的引导语音数据的响应信息为“好”,或者识别手势数据中包含对第二业务语音数据的引导语音数据的响应信息为“OK”。
步骤S208、根据识别结果对第二业务语音数据进行处理。
本实施例中,根据不同的识别结果可以按照如下方式处理第二业务语音数据。
方式一、获取并播放第二业务语音数据的详情数据。
若上述步骤S206识别得到的响应信息指示允许播放第二业务语音数据的详情数据,则获取并播放与引导语音数据对应的第二业务语音数据中的详情数据。例如,识别语音数据中包含对关于某款汽车的简介信息的响应信息为“好”,则获取并播放与关于某款汽车的简介信息对应的汽车的具体参数详细信息。
方式二、忽略已检测到的播放标记所标记的第二业务语音数据,继续播放第一业务语音数据。
若上述步骤S206识别得到的响应信息指示忽略获取第二业务语音数据的详情数据,则跳转至第一业务语音数据中断处并继续播放第一业务语音数据。例如,识别语音数据中包含对关于某款汽车的简介信息的响应信息为“忽略”,则跳转到小说语音数据的第一章结尾处继续播放小说语音数据的第二章。
方式三、忽略已检测到和后续待检测的播放标记所标记的第二业务语音数据,继续播放第一业务语音数据。
若上述步骤S206识别得到的响应信息指示关闭第二业务语音数据的播放,则跳转至第一业务语音数据中断处并继续播放第一业务语音数据,并且,从第一业务语音数据的播放中断处开始,停止播放再次检测到的第二业务语音数据的播放标记所标记的第二业务语音数据。例如,识别语音数据中包含对关于某款汽车的简介信息的响应信息为“关闭”,则跳转到小说语音数据的第一章结尾处继续播放小说语音数据的第二章。并且,从小说语音数据的第一章结尾处开始,停止播放再次检测到的第二业务语音数据的播放标记所标记的第二业务语音数据,所标记的第二业务语音数据可以包括第二业务语音数据的引导语音数据和详情数据。也即,从小说语音数据的第一章结尾处开始,对后续检测到的所有第二业务语音数据的播放标记均忽略,在本次本小说语音数据的播放过程中,不再播放任何语音广告。
根据本实施例提供的一种业务语音数据的处理方法,在播放第一业务语音数据时,检测到第二业务语音数据的播放标记,该播放标记可以设置于第一业务语音数据的任意适当位置,如某段内容或者某章内容的结尾处。当检测到第二业务语音数据的播放标记时,中断正在播放的第一业务语音数据,获取引导语音数据并播放。其中,引导语音数据主要包含第二业务语音数据的简要信息,播放时间比较短,而且,引导语音数据可以指示用户进行输入操作。在接收并识别到根据引导语音数据输入的用户行为数据后,可以根据识别结果对第二业务语音数据进行处理,例如,播放或者不播放第二业务语音数据的详情数据等。本实施例在播放第一业务语音数据的过程中:一方面、播放一段第二业务语音数据的引导语音数据,引导语音数据的时间较短,降低了网络资源和客户端资源的占用;另一方面、可以根据用户行为数据确定是否播放第二业务语音数据的详情数据等,增加了与用户之间的交互过程,为用户提供了播放详情数据的选择机会,提升了用户播放第一业务语音数据的体验。
本实施例不仅可以根据对当前用户的历史业务语音播放数据的分析结果或第一业务语音数据的内容,获取并播放引导语音数据,令第二业务语音数据符合用户的播放习惯、个人喜好或者与第一业务语音数据的内容有关联性。还可以获取并播放预先设置的引导语音数据,保证第一业务语音数据和第二业务语音数据的引导语音数据的场景一致性。
本实施例提供了多种提示用户对引导语音数据进行响应的形式,如语音提示、窗口提示等,满足了用户多样化的使用需求,并为用户提供了丰富的参与交互的方式。
本实施例介绍了几种对第二业务语音数据的处理方式,不仅可以选择播放第二业务语音数据的详情数据,还可以忽略第二业务语音数据的详情数据,也可以关闭第二业务语音数据的播放,提升了用户播放第一业务语音数据和第二业务语音数据的体验。
实施例三
参照图3,示出了根据本发明实施例三的一种业务语音数据的处理装置的结构框图。
本实施例的业务语音数据的处理装置包括:检测模块300,用于在第一业务语音数据的播放过程中,检测到第二业务语音数据的播放标记;获取模块302,用于中断第一业务语音数据的播放,获取第二业务语音数据中的引导语音数据并播放,并接收根据引导语音数据输入的用户行为数据;识别模块304,用于对用户行为数据进行识别;处理模块306,用于根据识别结果对第二业务语音数据进行处理。
根据本实施例提供的一种业务语音数据的处理装置,在播放第一业务语音数据时,检测到第二业务语音数据的播放标记,该播放标记可以设置于第一业务语音数据的任意适当位置,如某段内容或者某章内容的结尾处。当检测到第二业务语音数据的播放标记时,中断正在播放的第一业务语音数据,获取引导语音数据并播放。其中,引导语音数据主要包含第二业务语音数据的简要信息,播放时间比较短,而且,引导语音数据可以指示用户进行输入操作。在接收并识别到根据引导语音数据输入的用户行为数据后,可以根据识别结果对第二业务语音数据进行处理,例如,播放或者不播放第二业务语音数据的详情数据等。本实施例在播放第一业务语音数据的过程中:一方面、播放一段第二业务语音数据的引导语音数据,引导语音数据的时间较短,降低了网络资源和客户端资源的占用;另一方面、可以根据用户行为数据确定是否播放第二业务语音数据的详情数据等,增加了与用户之间的交互过程,为用户提供了播放详情数据的选择机会,提升了用户播放第一业务语音数据的体验。
本实施例的业务语音数据的处理装置可以设置于适当的具有数据处理能力的设备中,包括但不限于移动终端、台式机等。
实施例四
参照图4,示出了根据本发明实施例四的一种业务语音数据的处理装置的结构框图。
本实施例的业务语音数据的处理装置包括:检测模块400,用于在第一业务语音数据的播放过程中,检测到第二业务语音数据的播放标记;获取模块402,用于中断第一业务语音数据的播放,获取第二业务语音数据中的引导语音数据并播放,并接收根据引导语音数据输入的用户行为数据;识别模块404,用于对用户行为数据进行识别;处理模块406,用于根据识别结果对第二业务语音数据进行处理。
可选地,获取模块402包括:获取播放模块4020,用于获取第二业务语音数据中的引导语音数据,播放引导语音数据并提示用户对引导语音数据进行响应;接收模块4022,用于接收用户响应引导语音数据输入的用户行为数据。
可选地,接收模块4022,用于接收用户响应引导语音数据输入的语音数据或手势数据。
可选地,识别模块404,用于识别语音数据或手势数据中包含的对第二业务语音数据中的引导语音数据的响应信息。
可选地,处理模块406包括:详情播放模块4060,用于若响应信息指示允许播放第二业务语音数据的详情数据,则获取并播放与引导语音数据对应的第二业务语音数据中的详情数据;继续播放模块4062,用于若响应信息指示忽略获取第二业务语音数据的详情数据,则跳转至第一业务语音数据中断处并继续播放第一业务语音数据;停止播放模块4064,用于若响应信息指示关闭第二业务语音数据的播放,则跳转至第一业务语音数据中断处并继续播放第一业务语音数据,并且,从第一业务语音数据的播放中断处开始,停止播放再次检测到的第二业务语音数据的播放标记所标记的第二业务语音数据。
可选地,获取模块402,用于根据对当前用户的历史业务语音播放数据的分析结果,从第二业务语音数据库中获取并播放与分析结果对应的引导语音数据。
可选地,第二业务语音数据包括语音广告。
可选地,第一业务语音数据包括电子书语音数据或广播数据。
本实施例的业务语音数据的处理装置用于实现前述多个实施例中相应的业务语音数据的处理方法,并具有相应的方法实施例的有益效果,在此不再赘述。
实施例五
图5为本发明实施例提供的一种终端设备的结构示意图,本发明具体实施例并不对终端设备的具体实现做限定。
如图5所示,该终端设备可以包括:处理器(processor)510、通信接口(Communications Interface)520、存储器(memory)530、以及通信总线540。
其中:
处理器510、通信接口520、以及存储器530通过通信总线540完成相互间的通信。
通信接口520,用于与比如服务器或其它终端设备等的网元通信。
处理器510,用于执行程序532,具体可以执行上述方法实施例中的相关步骤。
具体地,程序532可以包括程序代码,该程序代码包括计算机操作指令。
处理器510可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。终端设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器530,用于存放相关的电子书数据和程序532。存储器530可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序532具体可以用于使得处理器510执行以下操作:在第一业务语音数据的播放过程中,检测到第二业务语音数据的播放标记;中断第一业务语音数据的播放,获取第二业务语音数据中的引导语音数据并播放,并接收根据引导语音数据输入的用户行为数据;对用户行为数据进行识别;根据识别结果对第二业务语音数据进行处理。
在一种可选的实施方式中,程序532还用于使得处理器510在获取第二业务语音数据中的引导语音数据并播放,并接收根据引导语音数据输入的用户行为数据时,获取第二业务语音数据中的引导语音数据,播放引导语音数据并提示用户对引导语音数据进行响应;接收用户响应引导语音数据输入的用户行为数据。
在一种可选的实施方式中,程序532还用于使得处理器510在接收用户响应引导语音数据输入的用户行为数据时,接收用户响应引导语音数据输入的语音数据或手势数据。
在一种可选的实施方式中,程序532还用于使得处理器510在对用户行为数据进行识别时,识别语音数据或手势数据中包含的对第二业务语音数据中的引导语音数据的响应信息。
在一种可选的实施方式中,程序532还用于使得处理器510在根据识别结果对第二业务语音数据进行处理时,若响应信息指示允许播放第二业务语音数据的详情数据,则获取并播放与引导语音数据对应的第二业务语音数据中的详情数据;若响应信息指示忽略获取第二业务语音数据的详情数据,则跳转至第一业务语音数据中断处并继续播放第一业务语音数据;若响应信息指示关闭第二业务语音数据的播放,则跳转至第一业务语音数据中断处并继续播放第一业务语音数据,并且,从第一业务语音数据的播放中断处开始,停止播放再次检测到的第二业务语音数据的播放标记所标记的第二业务语音数据。
在一种可选的实施方式中,程序532还用于使得处理器510在获取第二业务语音数据中的引导语音数据并播放时,根据对当前用户的历史业务语音播放数据的分析结果,从第二业务语音数据库中获取并播放与分析结果对应的引导语音数据。
在一种可选的实施方式中,第二业务语音数据包括语音广告。
在一种可选的实施方式中,第一业务语音数据包括电子书语音数据或广播数据。
程序532中各步骤的具体实现可以参见上述实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
根据本实施例提供的一种终端设备,在播放第一业务语音数据时,检测到第二业务语音数据的播放标记,该播放标记可以设置于第一业务语音数据的任意适当位置,如某段内容或者某章内容的结尾处。当检测到第二业务语音数据的播放标记时,中断正在播放的第一业务语音数据,获取引导语音数据并播放。其中,引导语音数据主要包含第二业务语音数据的简要信息,播放时间比较短,而且,引导语音数据可以指示用户进行输入操作。在接收并识别到根据引导语音数据输入的用户行为数据后,可以根据识别结果对第二业务语音数据进行处理,例如,播放或者不播放第二业务语音数据的详情数据等。本实施例在播放第一业务语音数据的过程中:一方面、播放一段第二业务语音数据的引导语音数据,引导语音数据的时间较短,降低了网络资源和客户端资源的占用;另一方面、可以根据用户行为数据确定是否播放第二业务语音数据的详情数据等,增加了与用户之间的交互过程,为用户提供了播放详情数据的选择机会,提升了用户播放第一业务语音数据的体验。
需要说明的是,本发明实施例提供的业务语音数据的处理方案,适用于使用语音播放应用进行业务语音数据处理的场景,但不限于此,其它与此类似的场景也同样适用。
需要指出,根据实施的需要,可将本发明实施例中描述的各个部件/步骤拆分为更多部件/步骤,也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤,以实现本发明实施例的目的。
上述根据本发明实施例的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的处理方法。此外,当通用计算机访问用于实现在此示出的处理的代码时,代码的执行将通用计算机转换为用于执行在此示出的处理的专用计算机。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明实施例的范围。
以上实施方式仅用于说明本发明实施例,而并非对本发明实施例的限制,有关技术领域的普通技术人员,在不脱离本发明实施例的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明实施例的范畴,本发明实施例的专利保护范围应由权利要求限定。
本发明实施例提供了A1、一种业务语音数据的处理方法,包括:
在第一业务语音数据的播放过程中,检测到第二业务语音数据的播放标记;
中断所述第一业务语音数据的播放,获取所述第二业务语音数据中的引导语音数据并播放,并接收根据所述引导语音数据输入的用户行为数据;
对所述用户行为数据进行识别;
根据识别结果对所述第二业务语音数据进行处理。
A2、根据A1所述的方法,其中,获取所述第二业务语音数据中的引导语音数据并播放,并接收根据所述引导语音数据输入的用户行为数据,包括:
获取所述第二业务语音数据中的引导语音数据,播放所述引导语音数据并提示用户对所述引导语音数据进行响应;
接收用户响应所述引导语音数据输入的用户行为数据。
A3、根据A2所述的方法,其中,接收用户响应所述引导语音数据输入的用户行为数据,包括:
接收用户响应所述引导语音数据输入的语音数据或手势数据。
A4、根据A3所述的方法,其中,对所述用户行为数据进行识别,包括:
识别所述语音数据或手势数据中包含的对所述第二业务语音数据中的引导语音数据的响应信息。
A5、根据A4所述的方法,其中,根据识别结果对所述第二业务语音数据进行处理,包括:
若所述响应信息指示允许播放第二业务语音数据的详情数据,则获取并播放与所述引导语音数据对应的第二业务语音数据中的详情数据;
若所述响应信息指示忽略获取第二业务语音数据的详情数据,则跳转至所述第一业务语音数据中断处并继续播放所述第一业务语音数据;
若所述响应信息指示关闭所述第二业务语音数据的播放,则跳转至所述第一业务语音数据中断处并继续播放所述第一业务语音数据,并且,从所述第一业务语音数据的播放中断处开始,停止播放再次检测到的第二业务语音数据的播放标记所标记的第二业务语音数据。
A6、根据A1所述的方法,其中,获取所述第二业务语音数据中的引导语音数据并播放,包括:
根据对当前用户的历史业务语音播放数据的分析结果,从第二业务语音数据库中获取并播放与分析结果对应的引导语音数据。
A7、根据A1-A6任一项所述的方法,其中,所述第二业务语音数据包括语音广告。
A8、根据A1-A6任一项所述的方法,其中,所述第一业务语音数据包括电子书语音数据或广播数据。
B9、一种业务语音数据的处理装置,包括:
检测模块,用于在第一业务语音数据的播放过程中,检测到第二业务语音数据的播放标记;
获取模块,用于中断所述第一业务语音数据的播放,获取所述第二业务语音数据中的引导语音数据并播放,并接收根据所述引导语音数据输入的用户行为数据;
识别模块,用于对所述用户行为数据进行识别;
处理模块,用于根据识别结果对所述第二业务语音数据进行处理。
B10、根据B9所述的装置,其中,所述获取模块,包括:
获取播放模块,用于获取所述第二业务语音数据中的引导语音数据,播放所述引导语音数据并提示用户对所述引导语音数据进行响应;
接收模块,用于接收用户响应所述引导语音数据输入的用户行为数据。
B11、根据B10所述的装置,其中,所述接收模块,用于接收用户响应所述引导语音数据输入的语音数据或手势数据。
B12、根据B11所述的装置,其中,所述识别模块,用于识别所述语音数据或手势数据中包含的对所述第二业务语音数据中的引导语音数据的响应信息。
B13、根据B12所述的装置,其中,所述处理模块,包括:
详情播放模块,用于若所述响应信息指示允许播放第二业务语音数据的详情数据,则获取并播放与所述引导语音数据对应的第二业务语音数据中的详情数据;
继续播放模块,用于若所述响应信息指示忽略获取第二业务语音数据的详情数据,则跳转至所述第一业务语音数据中断处并继续播放所述第一业务语音数据;
停止播放模块,用于若所述响应信息指示关闭所述第二业务语音数据的播放,则跳转至所述第一业务语音数据中断处并继续播放所述第一业务语音数据,并且,从所述第一业务语音数据的播放中断处开始,停止播放再次检测到的第二业务语音数据的播放标记所标记的第二业务语音数据。
B14、根据B9所述的装置,其中,所述获取模块,用于根据对当前用户的历史业务语音播放数据的分析结果,从第二业务语音数据库中获取并播放与分析结果对应的引导语音数据。
B15、根据B9-B14任一项所述的装置,其中,所述第二业务语音数据包括语音广告。
B16、根据B9-B14任一项所述的装置,其中,所述第一业务语音数据包括电子书语音数据或广播数据。
C17、一种终端设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如A1-A8任一项所述的业务语音数据的处理方法对应的操作。

Claims (10)

1.一种业务语音数据的处理方法,包括:
在第一业务语音数据的播放过程中,检测到第二业务语音数据的播放标记;
中断所述第一业务语音数据的播放,获取所述第二业务语音数据中的引导语音数据并播放,并接收根据所述引导语音数据输入的用户行为数据;
对所述用户行为数据进行识别;
根据识别结果对所述第二业务语音数据进行处理。
2.根据权利要求1所述的方法,其中,获取所述第二业务语音数据中的引导语音数据并播放,并接收根据所述引导语音数据输入的用户行为数据,包括:
获取所述第二业务语音数据中的引导语音数据,播放所述引导语音数据并提示用户对所述引导语音数据进行响应;
接收用户响应所述引导语音数据输入的用户行为数据。
3.根据权利要求2所述的方法,其中,接收用户响应所述引导语音数据输入的用户行为数据,包括:
接收用户响应所述引导语音数据输入的语音数据或手势数据。
4.根据权利要求3所述的方法,其中,对所述用户行为数据进行识别,包括:
识别所述语音数据或手势数据中包含的对所述第二业务语音数据中的引导语音数据的响应信息。
5.根据权利要求4所述的方法,其中,根据识别结果对所述第二业务语音数据进行处理,包括:
若所述响应信息指示允许播放第二业务语音数据的详情数据,则获取并播放与所述引导语音数据对应的第二业务语音数据中的详情数据;
若所述响应信息指示忽略获取第二业务语音数据的详情数据,则跳转至所述第一业务语音数据中断处并继续播放所述第一业务语音数据;
若所述响应信息指示关闭所述第二业务语音数据的播放,则跳转至所述第一业务语音数据中断处并继续播放所述第一业务语音数据,并且,从所述第一业务语音数据的播放中断处开始,停止播放再次检测到的第二业务语音数据的播放标记所标记的第二业务语音数据。
6.根据权利要求1所述的方法,其中,获取所述第二业务语音数据中的引导语音数据并播放,包括:
根据对当前用户的历史业务语音播放数据的分析结果,从第二业务语音数据库中获取并播放与分析结果对应的引导语音数据。
7.根据权利要求1-6任一项所述的方法,其中,所述第二业务语音数据包括语音广告。
8.根据权利要求1-6任一项所述的方法,其中,所述第一业务语音数据包括电子书语音数据或广播数据。
9.一种业务语音数据的处理装置,包括:
检测模块,用于在第一业务语音数据的播放过程中,检测到第二业务语音数据的播放标记;
获取模块,用于中断所述第一业务语音数据的播放,获取所述第二业务语音数据中的引导语音数据并播放,并接收根据所述引导语音数据输入的用户行为数据;
识别模块,用于对所述用户行为数据进行识别;
处理模块,用于根据识别结果对所述第二业务语音数据进行处理。
10.一种终端设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-8任一项所述的业务语音数据的处理方法对应的操作。
CN201611154825.4A 2016-12-14 2016-12-14 业务语音数据的处理方法、装置及终端设备 Pending CN106777099A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611154825.4A CN106777099A (zh) 2016-12-14 2016-12-14 业务语音数据的处理方法、装置及终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611154825.4A CN106777099A (zh) 2016-12-14 2016-12-14 业务语音数据的处理方法、装置及终端设备

Publications (1)

Publication Number Publication Date
CN106777099A true CN106777099A (zh) 2017-05-31

Family

ID=58888112

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611154825.4A Pending CN106777099A (zh) 2016-12-14 2016-12-14 业务语音数据的处理方法、装置及终端设备

Country Status (1)

Country Link
CN (1) CN106777099A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108899036A (zh) * 2018-05-31 2018-11-27 出门问问信息科技有限公司 一种语音数据的处理方法及装置
CN110032355A (zh) * 2018-12-24 2019-07-19 阿里巴巴集团控股有限公司 语音播放方法、装置、终端设备及计算机存储介质
CN111312298A (zh) * 2020-02-26 2020-06-19 杭州涂鸦信息技术有限公司 一种基于时间调度的音视频播放方法及系统
CN112596694A (zh) * 2020-12-23 2021-04-02 北京城市网邻信息技术有限公司 一种房源信息的处理方法和装置
WO2022111206A1 (zh) * 2020-11-26 2022-06-02 北京字节跳动网络技术有限公司 音频与文本的同步方法、装置、可读介质和电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1919218A2 (en) * 2004-12-30 2008-05-07 LG Electronics Inc. Apparatus and method for providing in a terminal a pause function for a broadcast stream
CN102646016A (zh) * 2012-02-13 2012-08-22 北京百纳信息技术有限公司 显示手势语音交互统一界面的用户终端及其显示方法
US20140358267A1 (en) * 2006-09-26 2014-12-04 Clear Channel Management Services, Inc. Scheduling Advertising During Restricted Periods
CN104216990A (zh) * 2014-09-09 2014-12-17 科大讯飞股份有限公司 视频广告播放方法及系统
CN105204743A (zh) * 2015-09-28 2015-12-30 百度在线网络技术(北京)有限公司 用于语音和视频通讯的交互控制方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1919218A2 (en) * 2004-12-30 2008-05-07 LG Electronics Inc. Apparatus and method for providing in a terminal a pause function for a broadcast stream
US20140358267A1 (en) * 2006-09-26 2014-12-04 Clear Channel Management Services, Inc. Scheduling Advertising During Restricted Periods
CN102646016A (zh) * 2012-02-13 2012-08-22 北京百纳信息技术有限公司 显示手势语音交互统一界面的用户终端及其显示方法
CN104216990A (zh) * 2014-09-09 2014-12-17 科大讯飞股份有限公司 视频广告播放方法及系统
CN105204743A (zh) * 2015-09-28 2015-12-30 百度在线网络技术(北京)有限公司 用于语音和视频通讯的交互控制方法及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108899036A (zh) * 2018-05-31 2018-11-27 出门问问信息科技有限公司 一种语音数据的处理方法及装置
CN110032355A (zh) * 2018-12-24 2019-07-19 阿里巴巴集团控股有限公司 语音播放方法、装置、终端设备及计算机存储介质
CN110032355B (zh) * 2018-12-24 2022-05-17 阿里巴巴集团控股有限公司 语音播放方法、装置、终端设备及计算机存储介质
CN111312298A (zh) * 2020-02-26 2020-06-19 杭州涂鸦信息技术有限公司 一种基于时间调度的音视频播放方法及系统
WO2022111206A1 (zh) * 2020-11-26 2022-06-02 北京字节跳动网络技术有限公司 音频与文本的同步方法、装置、可读介质和电子设备
CN112596694A (zh) * 2020-12-23 2021-04-02 北京城市网邻信息技术有限公司 一种房源信息的处理方法和装置
CN112596694B (zh) * 2020-12-23 2022-02-11 北京城市网邻信息技术有限公司 一种房源信息的处理方法和装置

Similar Documents

Publication Publication Date Title
CN106777099A (zh) 业务语音数据的处理方法、装置及终端设备
CN106372059B (zh) 信息输入方法和装置
CN109862393B (zh) 视频文件的配乐方法、系统、设备及存储介质
CN104951335B (zh) 应用程序安装包的处理方法及装置
WO2014069122A1 (ja) 表現分類装置、表現分類方法、不満検出装置及び不満検出方法
CN110956956A (zh) 基于策略规则的语音识别方法及装置
KR20140094282A (ko) 다자간 메신저 서비스를 제공하는 방법 및 시스템
CN104270531A (zh) 连续播放多条消息的方法和装置
CN108038102A (zh) 表情图像的推荐方法、装置、终端及存储介质
CN105450862A (zh) 一种用于通信信息提醒的方法及电子设备
CN105827516A (zh) 消息处理方法和装置
CN104618568A (zh) 调整终端的情景模式的方法和装置
CN111931835A (zh) 一种图像识别方法、装置及系统
CN111831795A (zh) 多轮对话处理方法、装置、电子设备及存储介质
CN112529585A (zh) 风险交易的交互唤醒方法、装置、设备及系统
WO2016107278A1 (zh) 一种用户信息标注的方法、装置及系统
CN107071575A (zh) 贴片媒体文件播放方法和装置
CN103984699B (zh) 推广信息的推送方法及装置
CN105357388A (zh) 一种信息推荐的方法及电子设备
CN108881766A (zh) 视频处理方法、装置、终端和存储介质
CN110516151B (zh) 有效行为检测和个性化推荐方法
CN104980396A (zh) 一种用于社交网络的通信方法及系统
CN109714248B (zh) 一种数据处理方法及装置
CN104700830A (zh) 一种语音端点检测方法及装置
CN110070385A (zh) 广告评论方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170531

RJ01 Rejection of invention patent application after publication