CN111383663A - 一种录音控制方法、装置、用户终端及存储介质 - Google Patents

一种录音控制方法、装置、用户终端及存储介质 Download PDF

Info

Publication number
CN111383663A
CN111383663A CN201811654202.2A CN201811654202A CN111383663A CN 111383663 A CN111383663 A CN 111383663A CN 201811654202 A CN201811654202 A CN 201811654202A CN 111383663 A CN111383663 A CN 111383663A
Authority
CN
China
Prior art keywords
preset
recording
voice
voice input
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811654202.2A
Other languages
English (en)
Inventor
俞帅帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Beijing Didi Infinity Technology and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Didi Infinity Technology and Development Co Ltd filed Critical Beijing Didi Infinity Technology and Development Co Ltd
Priority to CN201811654202.2A priority Critical patent/CN111383663A/zh
Publication of CN111383663A publication Critical patent/CN111383663A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B19/00Driving, starting, stopping record carriers not specifically of filamentary or web form, or of supports therefor; Control thereof; Control of operating function ; Driving both disc and head
    • G11B19/02Control of operating function, e.g. switching from recording to reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Navigation (AREA)

Abstract

本申请涉及一种录音控制方法、装置、用户终端及存储介质,属于互联网技术领域。该录音控制方法应用于网约车的服务提供方的终端,所述方法包括:响应输入到服务提供方的终端的预设操作,开始录音;在第一预设时长内不存在预设的语音输入,停止录音。本申请实施例中,在录音的过程中,检测到在第一预设时长内不存在预设的语音输入时,停止录音,不再是全程进行录音,使得整个录音过程中的空白(没有语音输出)或者无效录音大幅度减少,降低了传输以及存储录音时的资源消耗,减少了后期对录音进行处理的工作量,进而提高了工作效率。

Description

一种录音控制方法、装置、用户终端及存储介质
技术领域
本申请属于互联网技术领域,具体涉及一种录音控制方法、装置、用户终端及存储介质。
背景技术
随着互联网和智能终端技术的发展,人们经常使用手机并通过打车软件来满足自己方便出行的需求。乘客在使用打车软件过程中,只需要设置出发地、目的地、支付方式等基本信息,就可以满足最基本的出行需要。
在出行的过程中,为了保障出行安全,在司机客户端设置了全程录音功能,因此,在乘客上车直到下车,就会全程录音,并上传后台服务器进行存储。在实际情况中,往往出现全程乘客和司机语言交流并不多的情形,在这种情况下,全程录音就会造成资源浪费,包括对带宽的占用和对存储空间的资源浪费。另外,后期对录音进行处理时,也需要花费大量的工作。
发明内容
鉴于此,本发明的设计者通过长期的探索和尝试,以及多次的实验和努力,在不断的付出创造性劳动后,提供了一种录音控制方法、装置、用户终端及存储介质,以有效地改善现有技术中全程录音所存在的十分耗费资源以及后期对录音进行处理时需要花费大量的工作的缺陷。
本申请的实施例是这样实现的:
第一方面,本申请实施例提供了一种录音控制方法,应用于网约车的服务提供方的终端,所述方法包括:响应输入到服务提供方的终端的预设操作,开始录音;在第一预设时长内不存在预设的语音输入时停止录音。本申请实施例中,在录音的过程中,检测到在第一预设时长内不存在预设的语音输入,停止录音,不再是全程进行录音,使得整个录音过程中的空白(没有语音输出)或者无效录音(如环境嘈杂声)大幅度减少,降低了传输以及存储录音时的资源消耗,减少了后期对录音进行处理的工作量,进而提高了工作效率。
结合第一方面的一种可选实施方式,所述响应输入到服务提供方的终端的预设操作为:响应服务提供方在接到用车订单对应的用户后输入到所述终端的预设操作。
结合第一方面的一种可选实施方式,通过以下步骤确定在第一预设时长内是否存在预设的语音输入:检测是否有语音输入;在没有语音输入时,判断没有语音输入持续的时长是否超过所述第一预设时长;在没有语音输入持续的时长超过所述第一预设时长时,确定在所述第一预设时长内不存在预设的语音输入。本申请实施例中,通过检测是否有语音输入,若没有语音输入持续的时长超过第一预设时长时,则可以确定在第一预设时长内没有预设的语音输入,便停止录音,避免录音中存在大量的空白(没有语音输出)录音,浪费资源消耗。
结合第一方面的一种可选实施方式,在检测到有语音输入之后,所述确定在第一预设时长内是否存在预设的语音输入,还包括:判断输入的语音是否为环境噪声;在输入的语音为环境噪声时,确定在所述第一预设时长内不存在预设的语音输入。本申请实施例中,通过检测是否有语音输入,若有语音输入时,判断其是否是环境噪声,若确定为环境噪声时,确定在第一预设时长内不存在预设的语音输入,避免录音中存在大量的无效录音(如环境嘈杂声),浪费资源消耗。
结合第一方面的一种可选实施方式,在所述停止录音的步骤之后,所述方法还包括:确定满足恢复录音的预设条件;恢复录音。本申请过程中,在停止录音的过程中,在确定满足恢复录音的预设条件时,恢复录音,以免遗漏掉有效语音,保证有效语音的全程录音,进而保证出行安全。
结合第一方面的一种可选实施方式,所述确定满足恢复录音的预设条件,包括:检测是否有语音输入;在为是时,判断语音输入的持续时长是否不小于第二预设时长;在语音输入的持续时长大于等于第二预设时长时,确定满足恢复录音的预设条件。本申请实施例中,通过检测是否有有效的语音输入,若语音输入的持续时长大于等于第二预设时长时,则恢复录音,以保证录音的有效性,降低录入空白录音或无效录音的概率。
结合第一方面的一种可选实施方式,所述确定满足恢复录音的预设条件,包括:检测是否有语音输入;在为是时,判断输入的语音是否为特定的预设语音指令;在输入的语音为特定的预设语音指令时,确定满足恢复录音的预设条件。本申请实施例中,通过检测是否有语音输入,若输入的语音为特定的预设语音指令时,也即检测到有特定的语音指令时,则恢复录音,提高录音的实效性,以免遗漏掉有效语音,保证有效语音的全程录音,进而保证出行安全。
第二方面,本申请实施例还提供了一种录音控制装置,应用于网约车的服务提供方的终端,所述装置包括:录音模块以及停止录音模块;录音模块,用于响应输入到服务提供方的终端的预设操作,开始录音;停止录音模块,用于在第一预设时长内不存在预设的语音输入时,停止录音。
结合第二方面的一种可选实施方式,所述响应输入到服务提供方的终端的预设操作为:响应服务提供方在接到用车订单对应的用户后输入到所述终端的预设操作。
结合第二方面的一种可选实施方式,所述装置还包括第一确定模块,所述第一确定模块用于:检测是否有语音输入;在没有语音输入时,判断没有语音输入持续的时长是否超过所述第一预设时长;在没有语音输入持续的时长超过所述第一预设时长时,确定在所述第一预设时长内不存在预设的语音输入。
结合第二方面的一种可选实施方式,在检测到有语音输入之后,所述第一确定模块,还用于:判断输入的语音是否为环境噪声;在输入的语音为环境噪声时,确定在所述第一预设时长内不存在预设的语音输入。
结合第二方面的一种可选实施方式,所述装置还包括:第二确定模块以及恢复录音模块;第二确定模块,用于确定满足恢复录音的预设条件;恢复录音模块,用于恢复录音。
结合第二方面的一种可选实施方式,所述第二确定模块,还用于检测是否有语音输入;在为是时,判断语音输入的持续时长是否不小于第二预设时长;在语音输入的持续时长大于等于第二预设时长时,确定满足恢复录音的预设条件。
结合第二方面的一种可选实施方式,所述第二确定模块,还用于检测是否有语音输入;在为是时,判断输入的语音是否为特定的预设语音指令;在输入的语音为特定的预设语音指令时,确定满足恢复录音的预设条件。
第三方面,本申请实施例还提供了一种用户终端,包括:存储器和处理器,所述存储器和所述处理器连接;所述存储器用于存储程序;所述处理器用于调用存储于所述存储器中的程序以执行上述第一方面实施例和/或结合第一方面的一种可选实施方式提供的方法。
第四方面,本申请实施例还提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器运行时执行第一方面实施例和/或结合第一方面的一种可选实施方式提供的方法。
本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。通过附图所示,本申请的上述及其它目的、特征和优势将更加清晰。在全部附图中相同的附图标记指示相同的部分。并未刻意按实际尺寸等比例缩放绘制附图,重点在于示出本申请的主旨。
图1示出了本申请实施例提供的一种派单系统的交互示意图。
图2示出了本申请实施例提供的一种用户终端的结构示意图。
图3示出了本申请实施例提供的一种录音控制方法的流程示意图。
图4示出了本申请实施例提供的确定在第一预设时长内是否存在预设的语音输入的流程示意图。
图5示出了本申请实施例提供一种确定满足恢复录音的预设条件的流程示意图。
图6示出了本申请实施例提供又一种确定满足恢复录音的预设条件的流程示意图。
图7示出了本申请实施例提供的一种录音控制装置的模块示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本申请的描述中,需要说明的是,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。再者,本申请中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
第一实施例
请参阅图1,图1为本申请实施例提供的一种派单系统100的交互示意图。该派单系统100包括:服务请求方终端10、服务提供方终端30和服务器20,服务请求方终端10通过网络与服务器20进行数据交互,服务提供方终端30通过网络与服务器20进行数据交互。本实施例中,服务请求方终端10、服务提供方终端30的数量为至少一个。其中,该派单系统100可以是用于诸如出租车、代驾服务、快车、拼车、公共汽车服务、驾驶员租赁、或班车服务之类的运输服务、或其任意组合的在线运输服务平台。其中,服务请求方终端10以及服务提供方终端30中安装有至少一个应用程序(Application,APP)与服务器20进行数据交互,以便服务器20接收服务请求方通过服务请求方终端10发送的用车订单,然后为该服务请求方分派合适的服务提供方,并将订单分配给该服务提供方的服务提供方终端30。
其中,网络可以包括有线网络、无线网络、光纤网络、远程通信网络、内联网、因特网、局域网(Local Area Network,LAN)、广域网(Wide Area Network,WAN)、无线局域网(Wireless Local Area Networks,WLAN)、城域网(Metropolitan Area Network,MAN)、广域网(Wide Area Network,WAN)、公共电话交换网(Public Switched Telephone Network,PSTN)、蓝牙网络、ZigBee网络、或近场通信(Near Field Communication,NFC)网络等,或其任意组合。
其中,该服务提供方终端30为服务提供方的终端,如手机、平板电脑或服务提供方车辆内安装的车载设备等移动终端;而该服务请求方终端10为服务请求方的终端,如手机、平板电脑等移动终端。其中,服务提供方终端30包括:存储器和处理器,所述存储器和所述处理器连接;所述存储器用于存储程序;所述处理器用于调用存储于所述存储器中的程序,以执行第二实施例所述的方法。其中,服务提供方终端30的结构示意图可以参阅用户终端300的结构示意图。
服务器20可以为网络服务器、数据库服务器或由多个子服务器构成的服务器集群。其中,服务器集群可以是集中式的,也可以是分布式的(例如,服务器20可以是分布式系统)。服务器20通过分别与服务提供方终端30和服务请求方终端10进行数据交互,可以执行并实现录音控制方法。
可选地,如图2所示,用户终端300可以包括:存储器31、通信模块32、总线33和处理器34。其中,处理器34、通信模块32和存储器31通过总线33连接。处理器34用于执行存储器31中存储的可执行模块,例如计算机程序。图2所示的用户终端300的组件和结构只是示例性的,而非限制性的,根据需要,用户终端300也可以具有其他组件和结构。
其中,存储器31可能包含高速随机存取存储器(Random Access Memory RAM),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。本实施例中,存储器31存储了处理器34执行录音控制方法所需要的程序。
总线33可以是ISA总线、PCI总线或EISA总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图2中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
处理器34可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器34中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器34可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。
本申请实施例任意实施例揭示的流过程或定义的装置所执行的方法可以应用于处理器34中,或者由处理器34实现。处理器34在接收到执行指令后,通过总线33调用存储在存储器31中的程序后,处理器34通过总线33控制通信模块32则可以执行录音控制方法的流程。
请参阅图3,为本发明实施例提供的一种应用于上述服务提供方终端30的录音控制方法,下面将结合图3对其所包含的步骤进行说明。
步骤S101:响应输入到服务提供方的终端的预设操作,开始录音。
在出行的过程中,为了保证出行安全,需要进行录音,例如服务请求方(如乘客)有用车需求时,利用打车软件打车,服务器将该订单分派给服务提供方的终端(如司机终端),服务提供方的终端响应服务提供方输入到服务提供方的终端的预设操作,开始录音,例如,服务提供方在接到用车订单对应的用户后在终端上点击“开始行程”,则终端响应该操作便开始录音。
步骤S102:在第一预设时长内不存在预设的语音输入时,停止录音。
在录音的过程中,确定在第一预设时长内不存在预设的语音输入时,停止录音,例如,没有语音输入持续的时长超过第一预设时长时,停止录音。又例如,检测到输入的语音为环境噪声时,停止停录音。该方法不再是全程进行录音,使得整个录音过程中的空白(没有语音输出)或者无效录音(如环境嘈杂声)大幅度减少,降低了传输以及存储录音时的资源消耗,减少了后期对录音进行处理的工作量,进而提高了工作效率。
在如何确定在第一预设时长内是否存在预设的语音输入时,作为一种可选的实施方式,可以结合图4所示的实施例来进行说明,下面将结合图4所述的步骤对这一过程进行说明。
步骤S201:检测是否有语音输入。
在录音的过程中,检测是否有语音输入,在为否时,也即在没有语音输入时,则执行步骤S202;在为是时,也即有语音输入时,则执行步骤S203。
执行步骤S202:判断没有语音输入持续的时长是否超过所述第一预设时长。
在为否时,也即在检测到没有语音输入之后,通过判断没有语音输入持续的时长是否超过所述第一预设时长来确定在第一预设时长内是否存在预设的语音输入。若没有语音输入持续的时长超过第一预设时长时,则确定在所述第一预设时长内不存在预设的语音输入,则停止录音;若没有语音输入持续的时长没有超过第一预设时长时,则继续录音,直到没有语音输入持续的时长超过第一预设时长时,才确定在所述第一预设时长内不存在预设的语音输入。本申请实施例中,通过检测是否有语音输入,若没有语音输入持续的时长超过第一预设时长时,则可以确定在第一预设时长内不存在预设的语音输入,便停止录音,避免录音中存在大量的空白(没有语音输出)录音,浪费资源消耗。
步骤S203:判断输入的语音是否为环境噪声。
在检测到有语音输入之后,通过判断输入的语音是否为环境噪声来确定在第一预设时长内是否存在预设的语音输入。其中,在输入的语音为环境噪声时,确定在所述第一预设时长内不存在预设的语音输入,则停止录音,反之,也即输入的语音不为环境噪声时,则继续录音。本申请实施例中,通过检测是否有语音输入,若有语音输入时,判断其是否是环境噪声,若确定为环境噪声时,确定在第一预设时长内不存在预设的语音输入,避免录音中存在大量的无效录音(如环境嘈杂声),浪费资源消耗。
其中,第一预设时长为事先设置,其可以根据不同的出行需求设置不同的时长,例如,在不同时间段出行时的设置的第一预设时长的值不同,举例来说,在白天(例如,早上7点至下午7点)出行时的第一预设时长与晚上(下午7点至第二天早上7点)出行时的第一预设时长不同。由于白天出行,安全系数相对于晚上出行较高,因此,第一预设时长的数值可以相对于晚上出行时的第一预设时长的数值小一些,如白天的第一预设时长的数值可以为1秒,晚上的第一预设时长的数值可以为5秒。其中,需要说明的是,上述的数值示意,仅仅是为了便于理解而示意的例子而已,不能将其理解成是对本申请的限制。同样的,上述仅示出了白天和晚上两个时间段,其可以根据需求将一天划分为多个时间段,不同时间段的对应的第一预设时长可以不同,且不同的季节(春夏秋冬)所划分的时间段也有所不同。
其中,需要说明的是,现有技术中为了保证出行的安全,会全程录音,本申请的发明人在发明本申请时发明:全程进行录音,非常耗费资源,特别是在传输以及存储的时候,由于全程录音,使得录音文件很大,传输需要的带宽要求较高,同时存储需要更多空间,此外,由于整个录音过程中有很多空白(没有语音输出)或者无效录音(嘈杂的环境等),使得后期对录音进行处理的工作量非常大,带来很多困扰,对录音的体验效率非常不好。鉴于此,本发明的设计者通过长期的探索和尝试,以及多次的实验和努力,在不断的付出创造性劳动后,提供了本申请所示的录音控制方法。其中,针对以上方案所存在的缺陷,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及本发明实施例针对上述问题所提出的解决方案,都应该是发明人在本发明过程中对本发明做出的贡献。
作为一种可选的实施方式,在所述停止录音的步骤之后,所述方法还包括:确定满足恢复录音的预设条件;恢复录音。本申请过程中,在停止录音的过程中,在确定满足恢复录音的预设条件时,恢复录音,以免遗漏掉有效语音,保证有效语音的全程录音,进而保证出行安全。
其中,该预设条件为事先设置,其可以根据不同的出行需求设置不同的条件,只要输入的语音满足该预设条件时,便恢复录音。
在如何确定满足恢复录音的预设条件时,作为一种可选的实施方式,可以结合图5所示的实施例来进行说明,下面将结合图5所述的步骤对这一过程进行说明。
步骤S301:检测是否有语音输入。
在暂停录音的过程中,检测是否有语音输入,在为是时,也即检测到有语音输入时,执行步骤S302;在为否时,也即没有检测的到有输入时,则继续停止录音。其中,作为一种可选的实施方式,检测是否有语音输入可以是检测是有有效的语音输入。其中,在如何确定是否有有效的语音输入时,可以通过判断是否有语音输入,若没有语音输入,则可以确定没有有效的语音输入,若有语音输入,可以通过判断输入的语音是否为环境噪声来确定是否有有效的语音输入,其中,在输入的语音为环境噪声时,确定没有有效的语音输入。
步骤S302:判断语音输入的持续时长是否不小于第二预设时长。
在检测到有语音输入时,通过判断语音输入(如有效语音输入)的持续时长是否不小于第二预设时长来确定是否满足恢复录音的预设条件。在语音输入的持续时长大于等于第二预设时长时,确定满足恢复录音的预设条件,则恢复录音。在语音输入的持续时长小于第二预设时长时,则继续暂停。
其中,第二预设时长为事先设置,其可以根据不同的出行需求设置不同的时长,例如,在不同时间段出行时的设置的第二预设时长的值不同,举例来说,在白天(例如,早上7点至下午7点)出行时的第二预设时长与晚上(下午7点至第二天早上7点)出行时的第二预设时长不同。由于白天出行,安全系数相对于晚上出行较高,因此,第二预设时长的数值可以相对于晚上出行时的第二预设时长的数值大一些,如白天的第二预设时长的数值可以为0.5秒,晚上的第二预设时长的数值可以为0.1秒。其中,需要说明的是,上述的数值示意,仅仅是为了便于理解而示意的例子而已,不能将其理解成是对本申请的限制。同样的,上述仅示出了白天和晚上两个时间段,其可以根据需求将一天划分为多个时间段,不同时间段的对应的第二预设时长可以不同,且不同的季节(春夏秋冬)所划分的时间段也有所不同。
在如何确定满足恢复录音的预设条件时,作为又一种可选的实施方式,可以结合图6所示的实施例来进行说明,下面将结合图6所述的步骤对这一过程进行说明。
步骤S401:检测是否有语音输入。
在暂停录音的过程中,检测是否有语音输入,在为是时,也即检测到有语音输入时,执行步骤S402;在为否时,也即没有检测的到有语音输入时,则继续停止录音。其中,作为一种可选的实施方式,检测是否有语音输入可以是检测是有有效的语音输入。其中,在如何确定是否有有效的语音输入时,可以通过判断是否有语音输入,若没有语音输入,则可以确定没有有效的语音输入,若有语音输入,可以通过判断输入的语音是否为环境噪声来确定是否有有效的语音输入,其中,在输入的语音为环境噪声时,确定没有有效的语音输入。该过程可以参见上述如何确定在第一预设时长内没有有效的语音输入时的过程。
步骤S402:判断输入的语音是否为特定的预设语音指令。
在检测到有语音输入时,通过判断输入的语音是否为特定的预设语音指令来确定是否满足恢复录音的预设条件。在输入的语音为特定的预设语音指令时,确定满足恢复录音的预设条件,则恢复录音。在输入的语音不为特定的预设语音指令时,则继续暂停,直至语音输入的持续时长大于等于第二预设时长时恢复录音,或者输入的语音为特定的预设语音指令时,恢复录音。
其中,特定的预设语音指令为事先设置,其可以根据不同的需求设置不同的语音指令,例如,开始/恢复录音等指令,或者为一些敏感词汇,例如,报警、涉及到财产、人身安全等的词汇时,则恢复录音。
其中,需要说明的是,在出行的过程中,可能会出现多次停止录音和/或多次恢复录音的情况。每次触发停止录音,以及触发恢复录音的触发可以参见上述内容。其中,在行程开始时,也即服务提供方的终端(司机终端)响应服务提供方(司机)接到用车订单对应的用户后输入的操作,开始录音;在行程结束时,也即服务提供方的终端(司机终端)响应服务提供方(司机)结束用车订单的操作,停止录音。
其中,服务提供方的终端在录音的过程中,会将所录入的语音文件通过网络传输给服务器进行存储。作为一种可选的实施方式,该语音文件可以是实时传输的,也即边录入边传输。作为有一种可选的实施方式,该语音文件可以是先存储在本地,待累积一定量(例如,先将录音的语音文件存储在本地,待累积到预设字节)时再将存储的片段进行传输,也就是说,整个出行过程中的语音文件是分段式传输的,整个语音文件是由几个语音片段构成。
其中,服务提供方的终端在录音的过程中,会记录录音的起始时间以及结束时间,也即该语音文件包括录入的语音内容以及时间节点。为了便于理解,举例来说,假设行程于XX年XX月XX日10点23分57秒开始,于10点25分01秒停止录音,中途于10点28分12秒开始恢复录音,于10点29分05秒停止录音,中途于10点30分18秒开始恢复录音,并最终于10点31分42秒结束行程停止录音。可以看出整个语音文件可以有三端录音构成,第一段录音的起始时间节点是10点23分57秒,结束时间节点是10点25分01秒;第二段录音的起始时间节点是10点28分12秒,结束时间节点是10点29分05秒;第三端录音的起始时间节点是10点30分18秒,结束时间节点是10点31分42秒。其中,需要说明的是,出行中的录音情况取决于出行当时的实际情况,上述示意仅仅是为了便于理解,而举的例子而已,并不表示真实的出行情况,因此,不能将其理解成是对本申请的限制。
第二实施例
本申请实施例提供了一种应用于网约车的服务提供方终端30的录音控制装置200,如图7所示。该录音控制装置200包括:录音模块210、第一确定模块220以及停止录音模块230。
录音模块210,用于响应输入到服务提供方的终端的预设操作,开始录音。其中,所述响应输入到服务提供方的终端的预设操作为:响应服务提供方在接到用车订单对应的用户后输入到所述终端的预设操作。
第一确定模块220,用于:检测是否有语音输入;在没有语音输入时,判断没有语音输入持续的时长是否超过所述第一预设时长;在没有语音输入持续的时长超过所述第一预设时长时,确定在所述第一预设时长内不存在预设的语音输入。可选地,在检测到有语音输入之后,所述第一确定模块220,还用于判断输入的语音是否为环境噪声;在输入的语音为环境噪声时,确定在所述第一预设时长内不存在预设的语音输入。
停止录音模块230,用于在第一预设时长内不存在预设的语音输入时,停止录音。
作为一种可选的实施方式,该录音控制装置200还包括:第二确定模块以及恢复录音模块。
第二确定模块,用于确定满足恢复录音的预设条件。可选地,所述第二确定模块,还用于检测是否有语音输入;在为是时,判断语音输入的持续时长是否不小于第二预设时长;在语音输入的持续时长大于等于第二预设时长时,确定满足恢复录音的预设条件。可选地,所述第二确定模块,还用于检测是否有语音输入;在为是时,判断输入的语音是否为特定的预设语音指令;在输入的语音为特定的预设语音指令时,确定满足恢复录音的预设条件。
恢复录音模块,用于恢复录音。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本发明实施例所提供的录音控制装置200,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
第三实施例
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述第一实施例所述的方法的步骤。具体实现可参见方法实施例,在此不再赘述。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的程序代码被运行时,能够执行上述实施例示出的录音控制方法,在录音的过程中,确定在第一预设时长内不存在预设的语音输入,停止录音,不再是全程进行录音,使得整个录音过程中的空白(没有语音输出)或者无效录音大幅度减少,降低了传输以及存储录音时的资源消耗,减少了后期对录音进行处理的工作量,进而提高了工作效率。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,笔记本电脑,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (16)

1.一种录音控制方法,其特征在于,应用于网约车的服务提供方的终端,所述方法包括:
响应输入到服务提供方的终端的预设操作,开始录音;
在第一预设时长内不存在预设的语音输入时,停止录音。
2.根据权利要求1所述的方法,其特征在于,所述响应输入到服务提供方的终端的预设操作为:
响应服务提供方在接到用车订单对应的用户后输入到所述终端的预设操作。
3.根据权利要求1所述的方法,其特征在于,通过以下步骤确定在第一预设时长内是否存在预设的语音输入:
检测是否有语音输入;
在没有语音输入时,判断没有语音输入持续的时长是否超过所述第一预设时长;
在没有语音输入持续的时长超过所述第一预设时长时,确定在所述第一预设时长内不存在预设的语音输入。
4.根据权利要求3所述的方法,其特征在于,在检测到有语音输入之后,所述确定在第一预设时长是否存在预设的语音输入,还包括:
判断输入的语音是否为环境噪声;
在输入的语音为环境噪声时,确定在所述第一预设时长内不存在预设的语音输入。
5.根据权利要求1所述的方法,其特征在于,在所述停止录音的步骤之后,所述方法还包括:
确定满足恢复录音的预设条件;
恢复录音。
6.根据权利要求5所述的方法,其特征在于,所述确定满足恢复录音的预设条件,包括:
检测是否有语音输入;
在为是时,判断语音输入的持续时长是否不小于第二预设时长;
在语音输入的持续时长大于等于第二预设时长时,确定满足恢复录音的预设条件。
7.根据权利要求5所述的方法,其特征在于,所述确定满足恢复录音的预设条件,包括:
检测是否有语音输入;
在为是时,判断输入的语音是否为特定的预设语音指令;
在输入的语音为特定的预设语音指令时,确定满足恢复录音的预设条件。
8.一种录音控制装置,其特征在于,应用于网约车的服务提供方的终端,所述装置包括:
录音模块,用于响应输入到服务提供方的终端的预设操作,开始录音;
停止录音模块,用于在第一预设时长内不存在预设的语音输入时,停止录音。
9.根据权利要求8所述的装置,其特征在于,所述响应输入到服务提供方的终端的预设操作为:
响应服务提供方在接到用车订单对应的用户后输入到所述终端的预设操作。
10.根据权利要求8所述的装置,其特征在于,所述装置还包括第一确定模块,所述第一确定模块用于:
检测是否有语音输入;
在没有语音输入时,判断没有语音输入持续的时长是否超过所述第一预设时长;
在没有语音输入持续的时长超过所述第一预设时长时,确定在所述第一预设时长内不存在预设的语音输入。
11.根据权利要求10所述的装置,其特征在于,在检测到有语音输入之后,所述第一确定模块,还用于:
判断输入的语音是否为环境噪声;
在输入的语音为环境噪声时,确定在所述第一预设时长内不存在预设的语音输入。
12.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第二确定模块,用于确定满足恢复录音的预设条件;
恢复录音模块,用于恢复录音。
13.根据权利要求12所述的装置,其特征在于,所述第二确定模块,还用于:
检测是否有语音输入;
在为是时,判断语音输入的持续时长是否不小于第二预设时长;
在语音输入的持续时长大于等于第二预设时长时,确定满足恢复录音的预设条件。
14.根据权利要求12所述的装置,其特征在于,所述第二确定模块,还用于:
检测是否有语音输入;
在为是时,判断输入的语音是否为特定的预设语音指令;
在输入的语音为特定的预设语音指令时,确定满足恢复录音的预设条件。
15.一种用户终端,其特征在于,包括:存储器和处理器,所述存储器和所述处理器连接;
所述存储器用于存储程序;
所述处理器用于调用存储于所述存储器中的程序以执行如权利要求1-7中任一项所述的方法。
16.一种存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1-7中任一项所述的方法。
CN201811654202.2A 2018-12-29 2018-12-29 一种录音控制方法、装置、用户终端及存储介质 Pending CN111383663A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811654202.2A CN111383663A (zh) 2018-12-29 2018-12-29 一种录音控制方法、装置、用户终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811654202.2A CN111383663A (zh) 2018-12-29 2018-12-29 一种录音控制方法、装置、用户终端及存储介质

Publications (1)

Publication Number Publication Date
CN111383663A true CN111383663A (zh) 2020-07-07

Family

ID=71221280

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811654202.2A Pending CN111383663A (zh) 2018-12-29 2018-12-29 一种录音控制方法、装置、用户终端及存储介质

Country Status (1)

Country Link
CN (1) CN111383663A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111916076A (zh) * 2020-07-10 2020-11-10 北京搜狗科技发展有限公司 一种录音方法、装置和电子设备
CN114143307A (zh) * 2021-11-29 2022-03-04 广州宸祺出行科技有限公司 一种网约车行程录音数据高效完整传输的方法及系统
CN115208976A (zh) * 2021-04-13 2022-10-18 深圳市万普拉斯科技有限公司 通话通道切换的处理方法、装置、通话设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100135185A1 (en) * 2007-08-13 2010-06-03 Fujitsu Limited Voice communication quality assessing system
US20120078397A1 (en) * 2010-04-08 2012-03-29 Qualcomm Incorporated System and method of smart audio logging for mobile devices
US20160180844A1 (en) * 2014-12-19 2016-06-23 Lenovo (Singapore) Pte, Ltd. Executing a voice command during voice input
CN105895132A (zh) * 2016-03-18 2016-08-24 北京智驾互联信息服务有限公司 车载语音记录方法、装置及系统
CN205921586U (zh) * 2016-08-29 2017-02-01 叶振平 一种车载网约车司机专用终端听单操作系统
CN107071170A (zh) * 2017-04-01 2017-08-18 深圳天珑无线科技有限公司 一种录音的方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100135185A1 (en) * 2007-08-13 2010-06-03 Fujitsu Limited Voice communication quality assessing system
US20120078397A1 (en) * 2010-04-08 2012-03-29 Qualcomm Incorporated System and method of smart audio logging for mobile devices
US20160180844A1 (en) * 2014-12-19 2016-06-23 Lenovo (Singapore) Pte, Ltd. Executing a voice command during voice input
CN105895132A (zh) * 2016-03-18 2016-08-24 北京智驾互联信息服务有限公司 车载语音记录方法、装置及系统
CN205921586U (zh) * 2016-08-29 2017-02-01 叶振平 一种车载网约车司机专用终端听单操作系统
CN107071170A (zh) * 2017-04-01 2017-08-18 深圳天珑无线科技有限公司 一种录音的方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111916076A (zh) * 2020-07-10 2020-11-10 北京搜狗科技发展有限公司 一种录音方法、装置和电子设备
CN115208976A (zh) * 2021-04-13 2022-10-18 深圳市万普拉斯科技有限公司 通话通道切换的处理方法、装置、通话设备和存储介质
CN114143307A (zh) * 2021-11-29 2022-03-04 广州宸祺出行科技有限公司 一种网约车行程录音数据高效完整传输的方法及系统

Similar Documents

Publication Publication Date Title
US10395333B2 (en) Hierarchical selection process
CN111383663A (zh) 一种录音控制方法、装置、用户终端及存储介质
CN107682419B (zh) 拼车路线的提供方法、客户端、服务器及拼车系统
US9976863B2 (en) Casual driver ride sharing
CN108346010B (zh) 基于用户需求分析的共享汽车调度方法
CN103035117B (zh) 出租车智能电招的方法及系统
WO2019133456A1 (en) Session-based transportation dispatch
JP2019507396A (ja) パケットベースのデータメッセージ伝送のシーケンス依存オペレーションの処理
CN109308537B (zh) 站点推荐方法及装置
KR102288490B1 (ko) 한계 대기 시간에 기초한 차량 방법, 시스템 및 프로그램
CN110570003A (zh) 一种基于空闲行程车辆的预约出行订单的派单方法和装置
KR20180090184A (ko) 음성 기동 컴퓨터 네트워크 환경에서의 시퀀스 종속 데이터 메시지 통합
WO2021031634A1 (zh) 一种基于实时单行程车辆的预约单连环派单方法和装置
CN109766217B (zh) 一种车机系统故障修复方法及装置
CN110942220B (zh) 运力调度方法、装置和服务器
CN110782320A (zh) 一种订单处理方法、装置、订单报消系统及存储介质
JP5832144B2 (ja) 情報通知装置、情報通知方法及び情報通知プログラム
CN111416841A (zh) 监控信息处理方法、系统、终端及可读存储介质
CN109428921A (zh) 消息推送方法及装置
CN110930537A (zh) 基于大数据的车辆数据获取方法、装置、设备及存储介质
CN106382036A (zh) 一种停车位管理方法、系统及终端
CN113408877A (zh) 网约车信息处理方法、装置、设备和计算机存储介质
CN112884373A (zh) 派单处理方法及装置
CN114971803A (zh) 服务处理方法及装置
CN111382883A (zh) 网约车接单权限控制方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination