CN113012696A - 一种接单方法及设备、介质、程序产品 - Google Patents

一种接单方法及设备、介质、程序产品 Download PDF

Info

Publication number
CN113012696A
CN113012696A CN202110190538.3A CN202110190538A CN113012696A CN 113012696 A CN113012696 A CN 113012696A CN 202110190538 A CN202110190538 A CN 202110190538A CN 113012696 A CN113012696 A CN 113012696A
Authority
CN
China
Prior art keywords
order
voice
information
service provider
received
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110190538.3A
Other languages
English (en)
Inventor
李杨
赵帅
史耀云
彭静
王姝懿
石浩言
吕诚
周庭乔
胡刚涛
刘阳
宋辉
王飞
袁龙
张同新
代东锋
张啸虎
张市理
李玉泊
李燕
吕冉
邹伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Beijing Didi Infinity Technology and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Didi Infinity Technology and Development Co Ltd filed Critical Beijing Didi Infinity Technology and Development Co Ltd
Priority to CN202110190538.3A priority Critical patent/CN113012696A/zh
Publication of CN113012696A publication Critical patent/CN113012696A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/02Reservations, e.g. for tickets, services or events
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing
    • G06Q30/0635Processing of requisition or of purchase orders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Finance (AREA)
  • Human Resources & Organizations (AREA)
  • Multimedia (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Operations Research (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Primary Health Care (AREA)
  • User Interface Of Digital Computer (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请实施例提供了一种接单方法及设备、介质、程序产品,其中,该接单方法包括:在接收到服务器发送的订单信息后,通过听单服务页面展示语音输入提示信息,所述语音输入提示信息用于提示服务提供方录入指示接单的目标语音内容;检测是否在预设时间长度内接收到所述服务提供方确认接单的目标语音内容;若在所述预设时间长度内接收到所述目标语音内容,则向所述服务器反馈接单确认信息,否则向所述服务器反馈拒绝接单信息。本申请实施例能够通过语音接单,降低服务提供方在接单时存在的驾驶安全隐患。

Description

一种接单方法及设备、介质、程序产品
本申请是提交日为2019年6月19日、母案申请号为2019105329060、发明名称为“一种接单方法及装置”的发明专利申请的分案申请。
技术领域
本申请涉及计算机应用技术领域,具体而言,涉及一种接单方法及设备、介质、程序产品。
背景技术
随着网络技术和移动终端技术的不断发展,不管是在本国,还是在他国,网约车作为一种便捷的出行方式,成为人们出行的重要选择。
网约车平台的用户包括服务请求方和服务提供方。当服务提供方使用的服务提供端进入听单状态后,网约车平台会将服务请求端的订单信息发送至服务提供端,以供服务提供方选择是否要接受订单。
当前接单的方式一般为手动触发服务提供端展示的听单服务页面上的接单按钮。但由于服务提供方在听单时通常处于开车状态,在其触发接单按钮时需要将手脱离方向盘,同时需要将一部分注意力集中在服务提供端上,存在驾驶安全隐患。
发明内容
有鉴于此,本申请的目的在于提供一种接单方法及设备、介质、程序产品,能够通过语音接单,降低服务提供方在接单时存在的驾驶安全隐患。
第一方面,本申请实施例提供一种接单方法,该接单方法包括:
在接收到服务器按预设规则匹配的订单信息后,通过听单服务页面展示语音输入提示信息,所述语音输入提示信息用于提示服务提供方录入指示接单的目标语音内容;
检测是否在预设时间长度内接收到所述服务提供方输入的所述目标语音内容;
若在所述预设时间长度内接收到所述目标语音内容,则向所述服务器反馈接单确认信息;
若未在所述预设时间长度内接收到所述目标语音内容,则向所述服务器反馈拒绝接单信息。
一种可选实施方式中,所述听单服务页面还展示时间长度信息,所述时间长度信息指示所述服务提供方在预设时间长度内输入所述目标语音内容。
一种可选实施方式中,所述时间长度信息的展示包括:动态展示,或者,静态展示。
一种可选实施方式中,所述在接收到服务器按预设规则匹配的订单信息之后,还包括:
以文字的形式展示所述订单信息;或者,
以图形的形式展示所述订单信息。
一种可选实施方式中,所述听单服务页面,包括:
电子地图展示区域,用于展示电子地图;
距离显示区域,用于展示从服务提供方的当前地理位置到达出发地的路程长度。
一种可选实施方式中,所述听单服务页面还包括至少以下至少一项:
语音输入提示信息展示区域,用于展示语音输入提示信息;
时间展示区域,用于展示时间长度信息;
收音指示标识展示区域,用于展示收音指示标识。
一种可选实施方式中,所述检测是否在预设时间长度内接收到所述服务提供方输入的所述目标语音内容,包括:
检测是否在预设时间长度内接收到待识别语音内容;
若接收到所述待识别语音内容,将接收到的待识别语音内容输入至预先训练的语音识别模型中,得到语音识别结果;
检测所述语音识别结果与所述目标语音内容是否匹配;
如果匹配,则确认接收到所述目标语音内容。
第二方面,本申请实施例还提供一种接单装置,该接单装置包括:
展示模块,用于在接收到服务器按预设规则匹配的订单信息后,通过听单服务页面展示语音输入提示信息,所述语音输入提示信息用于提示服务提供方录入指示接单的目标语音内容;
检测模块,用于检测是否在预设时间长度内接收到所述服务提供方输入的所述目标语音内容;
反馈模块,用于若在所述预设时间长度内接收到所述目标语音内容,则向所述服务器反馈接单确认信息;若未在所述预设时间长度内接收到所述目标语音内容,则向所述服务器反馈拒绝接单信息。
第三方面,本申请实施例还提供一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
第四方面,本申请实施例还提供一种计算机程序/指令,该计算机程序/指令被处理器执行时实现上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
本申请实施例通过在接收到服务器发送的订单信息后,通过听单服务页面展示语音输入提示信息,以指示服务提供方在选择接单时,录入指示接单的额目标语音内容;若在预设时间长度内接受到目标语音内容,则向服务器反馈接单确认信息,实现语音接单,进而能够通过语音接单,降低服务提供方在接单时存在的驾驶安全隐患。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例提供的一种服务系统的架构示意图;
图2示出了本申请实施例提供的一种接单方法的流程图;
图3示出了本申请实施例提供的一种听单服务页面的具体示例;
图4示出了本申请实施例提供的接单方法中,检测是否在预设时间长度内接收到服务提供方确认接单的目标语音内容的具体方法的流程图;
图5示出了本申请实施例提供的接单方法中,训练语音识别模型的具体方法的流程图;
图6示出了本申请实施例提供的另一种接单方法的流程图;
图7示出了本申请实施例提供的一种接单装置的结构示意图;
图8示出了本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了使得本领域技术人员能够使用本申请内容,结合特定应用场景“网约车”,给出以下实施方式。对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。虽然本申请主要围绕网约车的服务提供方采用语音的方式接单进行描述,但是应该理解,这仅是一个示例性实施例。该接单方法也可以用于其他领域,例如外卖配送领域的外卖配送员接单、同城快递中快递员接单等。
需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。
本申请中的术语“乘客”、“请求方”、“服务请求方”和“客户”可互换使用,以指代可以请求或订购服务的个人、实体或工具。本申请中的术语“司机”、“提供方”、“服务提供方”和“供应商”可互换使用,以指代可以提供服务的个人、实体或工具。本申请中的术语“用户”可以指代请求服务、订购服务、提供服务或促成服务的提供的个人、实体或工具。例如,用户可以是乘客、驾驶员、操作员等,或其任意组合。在本申请中,“乘客”和“乘客终端”可以互换使用,“驾驶员”和“驾驶员终端”可以互换使用。
本申请中的术语“服务请求”和“订单”可互换使用,以指代由乘客、服务请求方、司机、服务提供方、或供应商等、或其任意组合发起的请求。接受该“服务请求”或“订单”的可以是乘客、服务请求方、司机、服务提供方、或供应商等、或其任意组合。服务请求可以是收费的或免费的。
本申请中使用的定位技术可以基于全球定位系统(Global Positioning System,GPS)、全球导航卫星系统(Global Navigation Satellite System,GLONASS),罗盘导航系统(COMPASS)、伽利略定位系统、准天顶卫星系统(Quasi-Zenith Satellite System,QZSS)、无线保真(Wireless Fidelity,WiFi)定位技术等,或其任意组合。一个或多个上述定位系统可以在本申请中互换使用。
本申请的一个方面涉及一种用于接单系统。该系统可以通过在听单服务页面上展示语音输入提示系信息,并检测是否在预设时间长度内接收到服务提供方确认接单的目标语音内容来确定是否接单,避免服务提供方通过手动触发服务提供端展示的听单服务页面上的接单按钮来接单,进而在接单是不需要将手推理方向盘,实现语音接单,降低服务提供方在接受订单时存在的驾驶安全隐患。
图1是本申请实施例提供的一种用于接单的服务系统100的架构示意图。例如,服务系统100可以是用于诸如出租车、代驾服务、快车、拼车、公共汽车服务、驾驶员租赁、或班车服务之类的运输服务、或其任意组合的在线运输服务平台。服务系统100可以包括服务器110、网络120、服务请求方终端130、服务提供方终端140、和数据库150中的一种或多种。
在一些实施例中,服务器110可以包括处理器。处理器可以处理与服务请求有关的信息和/或数据,以执行本申请中描述的一个或多个功能。例如,处理器可以基于从服务请求方终端130获得的服务请求来向服务提供方终端140发送订单信息。在一些实施例中,处理器可以包括一个或多个处理核(例如,单核处理器(S)或多核处理器(S))。仅作为举例,处理器可以包括中央处理单元(Central Processing Unit,CPU)、专用集成电路(Application Specific Integrated Circuit,ASIC)、专用指令集处理器(ApplicationSpecific Instruction-set Processor,ASIP)、图形处理单元(Graphics ProcessingUnit,GPU)、物理处理单元(Physics Processing Unit,PPU)、数字信号处理器(DigitalSignal Processor,DSP)、现场可编程门阵列(Field Programmable Gate Array,FPGA)、可编程逻辑器件(Programmable Logic Device,PLD)、控制器、微控制器单元、简化指令集计算机(Reduced Instruction Set Computing,RISC)、或微处理器等,或其任意组合。
在一些实施例中,服务请求方终端130和服务提供方终端140对应的设备类型可以是移动设备,比如可以包括智能家居设备、可穿戴设备、智能移动设备、虚拟现实设备、或增强现实设备等,也可以是平板计算机、膝上型计算机、或机动车辆中的内置设备等。
在一些实施例中,数据库150可以连接到网络120以与服务系统100中的一个或多个组件(例如,服务器110,服务请求方终端130,服务提供方终端140等)通信。服务系统100中的一个或多个组件可以经由网络120访问存储在数据库150中的数据或指令。在一些实施例中,数据库150可以直接连接到服务系统100中的一个或多个组件,或者,数据库150也可以是服务器110的一部分。
下面结合上述图1示出的服务系统100中描述的内容,对本申请实施例提供的接单方法进行详细说明。
参照图2所示,为本申请实施例提供的一种接单方法的流程示意图,该接单方法可以由服务系统100中的服务提供方终端140来执行,具体执行过程包括:
S201:在接收到服务器发送的订单信息后,通过听单服务页面展示语音输入提示信息,所述语音输入提示信息用于提示服务提供方录入指示接单的目标语音内容;
S202:检测是否在预设时间长度内接收到所述服务提供方确认接单的目标语音内容;
S203:若接收到所述目标语音内容,则向所述服务器反馈接单确认信息。
以下分别为对上述S201~S203的说明。
I:在上述S201中,听单服务页面是通过服务提供方终端140展示给服务提供方用于接单的服务页面。
当服务器接收到服务请求方终端发起的订单后,会基于一定的规则为该订单匹配至少一个服务提供方终端,并将该订单的订单信息发送至匹配到的服务提供方终端中。
服务提供方终端在接收到订单信息后,会在听单服务页面中展示语音输入提示信息。该语音输入提示信息用于指示服务提供方录入指示接单的目标语音内容。
根据服务提供方所使用的语言不同,语音输入提示信息也有所区别;例如若服务提供方使用的语言为中文,则语音输入提示信息例如为下述任意一种:
接到新订单,请说“接受订单”接单;
接到新订单,如您同意接单,请说“接单”;
如您同意接单,请在7秒内说“同意接受”接单;
又例如若服务提供方使用的语言为日文,则语音输入提示信息例如为:お話しください:了解しました(请说:了解了)。
具体地,语音输入提示信息可以根据实际需要进行具体设定。
另外,在听单服务页面上还可以展示时间长度信息,该时间长度信息用于指示服务提供方需要在对应的预设时间长度内,录入指示接单的目标语音内容,才可以实现接单。若超出该预设时间长度,则即使服务请求方再录入目标语音内容,也无法实现接单。
该时间长度信息的展示可以是静态展示,也可以是动态展示;当时间长度信息的展示为动态展示时,随着时间推移,该时间长度信息不断发生变化;例如时间长度信息展示形式为当前剩余可以接收语音信息的时长,可以通过进度条的形式展示、通过读秒的形式展示等。
在另一实施例中,在接收到服务器发送的订单信息后,服务提供方终端还会进入语音接收状态,以接收服务提供方录入的语音;另外,在超出预设时间长度后,服务提供方终端退出语音接收状态。
在另一实施例中,服务提供方终端在接收到订单信息后,还可以将订单信息通过一定的形式,全部或者部分展示在听单服务页面中,以使服务提供方对当前接收到的订单信息具有更直观的理解。
展示订单信息时,可以以文字的形式展示,例如订单信息包括:服务请求方的出发地、目的地、订单执行时间等;在听单服务页面上设置有文字展示区域,该区域用于以文字的形式展示订单信息中的目的地、或者服务请求方与出发地之间的路程长度;
也可以以图形的形式展示,例如在听单服务页面上设置有电子地图显示区域,该区域以电子地图的形式展示订单信息中的出发地、服务提供方当前的地理位置,以及从服务提供方的当前地理位置到达出发地的路线等。
在另一实施例中,服务提供方终端还可以通过听单服务页面展示收音指示标识,并控制所述收音指示标识发生形态变化,以提示服务请求方录入所述目标语音内容。
示例性的,该收音指示标识可以展示为声波波动动画;当未有语音录入时,声波轻微抖动;当有语音录入时,录入语音的声音越大,则对应能量值越大,声波的形态变化越明显。
如图3所示,提供一种听单服务页面的具体示例。在该听单服务页面上,分别包括以下几个显示区域:
电子地图展示区域a1,用于展示电子地图;在电子地图中,标注有订单信息的出发地、服务提供方当前的地理位置,以及从服务提供方的当前地理位置到达出发地的路线。
距离显示区域a2,用于展示从服务提供方的当前地理位置到达出发地的路程长度。
语音输入提示信息展示区域a3,用于展示语音输入提示信息。
时间展示区域a4,用于展示时间长度信息。
收音指示标识展示区域a5,用于展示收音指示标识。
另外,在该听单服务页面中还可以展示其他的标识或者其他功能性按钮,在此不再赘述。
在另一实施例中,在接收到服务器发送的订单信息后,在所述预设时间长度开始之前,还包括:对所述订单信息进行语音播报。
这样可以使得服务提供方只需要听取播报的内容,就能够确认自己是否要接单,而不需要将视力注视到服务提供方终端上,减少服务提供方在驾驶过程中将注意力集中到服务提供方终端上,进而进一步降低驾驶安全隐患。
Ⅱ:在上述S202中,服务提供方终端在向服务提供方展示语音输入提示信息之后,至少存在以下几种情况:服务提供方未发出声音、服务提供方发出的声音中不包含目标语音内容、对服务提供方发出的声音进行内容识别失败、服务提供方发出的声音中包含目标语音内容。仅在服务提供方发出的声音中包含目标语音内容时,才会向服务器反馈接单确认信息,否则都会认为服务提供方没有接单。
具体地,参见图4所示,本申请实施例还提供一种检测是否在预设时间长度内接收到服务提供方确认接单的目标语音内容的具体方法,包括:
S401:检测是否在预设时间长度内接收到待识别语音内容。如果是,则跳转至S402;如果否,则跳转至S405;
这里,服务提供方终端处于语音接收状态,能够捕捉到外界的声音。只要有声音的能量达到预设的阈值,无论该声音是否为服务提供方发出,都会认为当前存在待识别语音内容。且收到的待识别语音内容可以为一段,也可以为多段。
S402:将接收到的待识别语音内容输入至预先训练的语音识别模型中,得到语音识别结果。
这里,语音识别模型用于对待识别语音内容进行识别。
S403:检测所述语音识别结果与所述目标语音内容是否匹配;如果是,则跳转至S404;如果否,则跳转至S405;
S404:确认接收到所述目标语音内容。
S405:确认未接收到所述目标语音内容。
具体地,参见图5所示,本申请实施例还提供一种训练语音识别模型的具体方法,该接单方法包括:
S501:获取多段样本语音在至少一种语音特征下的特征值,以及各段所述样本语音对应的真实语音内容。
此处,语音特征包括:梅尔频率倒谱系数(Mel-frequency cepstralcoefficients,MFCC)特征、音素特征、音节特征、字符特征中至少一项。
具体地,MFCC特征能够刻画每一帧语音帧的声学特征,样本语音在MFCC下的特征值能够构成一个样本MFCC向量,其可以采用下述方式获得:
(1)预加重:将经采样后的样本语音信号通过一个高通滤波器,得到预加重后的样本语音信号。其中,预加重的目的是提升样本语音信号中的高频部分,使样本语音信号的频谱变得平坦,保持在低频到高频的整个频带中,能用同样的信噪比求频谱。同时,也是为了消除发声过程中声带和嘴唇的效应,来补偿样本语音信号受到发音系统所抑制的高频部分,也为了突出高频的共振峰。
(2)分帧和加窗:分帧即将样本语音信号分成多个帧,先将样本语音信号中的N个采样点集合成一个观测单位,称为帧。为了避免相邻两帧的变化过大,因此会让两相邻帧之间有一段重叠区域。
加窗:样本语音信号在长范围内是不停变动的,没有固定的特性无法做处理,所以将每一帧代入窗函数,窗外的值设定为0,其目的是消除各个帧两端可能会造成的信号不连续性。常用的窗函数有方窗、汉明窗和汉宁窗等。
(3)快速傅里叶变换:由于信号在时域上的变换通常很难看出信号的特性,所以通常将它转换为频域上的能量分布来观察,不同的能量分布,就能代表不同语音的特性。所以加窗后,每帧还必须再经过快速傅里叶变换以得到在频谱上的能量分布。对分帧加窗后的各帧信号进行快速傅里叶变换得到各帧的频谱。并对样本语音信号的频谱取模平方得到样本语音信号的功率谱。
(4)使用梅尔滤波器对经过快速傅里叶变换后的样本语音信号进行滤波。
(5)对经过梅尔滤波器滤波的样本语音信号进行对数能量参数的运算。
(6)对(5)输出的信号进行离散余弦变换,得到样本语音的MFCC向量。
音素特征、音节特征、字符特征均是样本语音的发音特征,其能够表征相邻帧之间相互的关联关系,其一般采用MFCC向量进行特征再提取而得到。例如针对每一种发音特征,训练一个与该发音特征对应的特征提取神经网络;在需要得到样本语音的任一种发音特征时,将该样本语音对应的MFCC向量输入至与该发音特征对应的特征提取神经网络中,得到与该样本语音对应的该种发音特征下的特征值。
S502:将各段所述样本语音在至少一种语音特征下的特征值,输入至进行语音识别的基础识别模型中,获取与各段所述样本语音分别对应的样本语音识别结果。
这里,基础识别模型包括:神经网络模型、条件随机场模型、概率线性判别分析(Probabilistic Linear Discriminant Analysis,PLDA)模型中一种或者多种。
S503:基于所述样本语音识别结果以及所述真实语音内容,训练所述基础识别模型,得到所述语音识别模型。
在得到语音识别模型后,将接收到的待识别语音内容输入至预先训练的语音识别模型中,得到语音识别结果的过程,即为:
获取待识别语音内容在至少一种语音特征下的特征值;
将待识别语音内容在至少一种语音特征下的特征值输入至预先训练的语音识别模型中,得到语音识别结果的过程。
Ⅲ:若检测接受到了目标语音内容,服务提供方终端生成并向服务器反馈接单确认信息。
另外,在另一实施例中,承接上述S202,本申请实施例提供的接单方法还包括:
S204:若未在预设时间长度内接收到所述服务提供方确认接单的目标语音内容,则向所述服务器反馈拒绝接单信息。
这里,也可以不向服务器反馈拒绝接单信息;服务器在向服务提供方终端发出订单信息后会进行计时;若计时到预设时间,服务器也未接收到服务提供方终端反馈的订单确认信息,则认为该服务提供方终端拒绝接单,并执行后续订单处理逻辑。
在本申请另一实施例中,参见图6所示,该接单方法还包括:
S601:在设置服务页面展示语音接单开关;
S602:在所述语音接单开关被打开时,校验是否开启了麦克风权限;
S603:如果未开启麦克风权限,则展示麦克风权限开启弹窗,所述麦克风权限开启弹窗用于开启所述麦克风权限;
如果开启了麦克风权限,则服务提供方终端在进入听单状态时,若确认语音接单开关处于打开状态,通过所述听单服务页面展示所述语音输入提示信息。
其中,在设置服务页面展示的语音接单开关,若处于关闭状态,则服务提供方终端采用现有的手动触发方式进行接单;若处于开启状态,则服务提供方终端此案用语音接单的方式进行接单。
麦克风权限开启弹窗上展示有确认开启麦克风权限的按钮以及拒绝开启麦克风权限的按钮;当该弹窗弹出后,服务提供方触发确认开启麦克风权限的按钮,则服务提供方终端自动开启麦克分权限;若服务提供方触发拒绝开启麦克风权限的按钮,则语音接单开关复位至关闭状态。
在另一实施例中,还包括:
在设置服务页面展示语音接单教学按钮;
当所述语音接单教学按钮被触发后,执行语音接单新手引导流程。
这里,语音接单新手引导流程的形式可以采用但不限于下述至少一种引导方式:
通过弹出展示弹窗,以展示语音接单过程。
通过引导服务提供方开启语音接单开关,并进入听单服务页面,以展示语音接单过程。
其中,还可以结合语音解释的方式,实现语音接单新手的引导。
本申请实施例通过在接收到服务器发送的订单信息后,通过听单服务页面展示语音输入提示信息,以指示服务提供方在选择接单时,录入指示接单的额目标语音内容;若在预设时间长度内接受到目标语音内容,则向服务器反馈接单确认信息,实现语音接单,进而能够通过语音接单,降低服务提供方在接单时存在的驾驶安全隐患。
基于同一发明构思,本申请实施例中还提供了与接单方法对应的接单装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述接单方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
实施例二
参照图7所示,为本申请实施例二提供的一种接单装置的示意图,所述装置包括:展示模块71、检测模块72、反馈模块73;其中,
展示模块71,用于在接收到服务器发送的订单信息后,通过听单服务页面展示语音输入提示信息,所述语音输入提示信息用于提示服务提供方录入指示接单的目标语音内容;
检测模块72,用于检测是否在预设时间长度内接收到所述服务提供方确认接单的目标语音内容;
反馈模块73,用于若接收到所述目标语音内容,则向所述服务器反馈接单确认信息。
本申请实施例通过在接收到服务器发送的订单信息后,通过听单服务页面展示语音输入提示信息,以指示服务提供方在选择接单时,录入指示接单的额目标语音内容;若在预设时间长度内接受到目标语音内容,则向服务器反馈接单确认信息,实现语音接单,进而能够通过语音接单,降低服务提供方在接单时存在的驾驶安全隐患。
一种可能的实施方式中,所述反馈模块73,还用于:
若未在预设时间长度内接收到所述服务提供方确认接单的目标语音内容,则向所述服务器反馈拒绝接单信息。
一种可能的实施方式中,所述检测模块72,具体用于:
检测是否在预设时间长度内接收到待识别语音内容;
若接收到所述待识别语音内容,将接收到的待识别语音内容输入至预先训练的语音识别模型中,得到语音识别结果;
检测所述语音识别结果与所述目标语音内容是否匹配;
如果匹配,则确认接收到所述目标语音内容。
一种可能的实施方式中,还包括:模型训练模块74,用于采用下述方式训练所述语音识别模型:
获取多段样本语音在至少一种语音特征下的特征值,以及各段所述样本语音对应的真实语音内容;
将各段所述样本语音在至少一种语音特征下的特征值,输入至进行语音识别的基础识别模型中,获取与各段所述样本语音分别对应的样本语音识别结果;
基于所述样本语音识别结果以及所述真实语音内容,训练所述基础识别模型,得到所述语音识别模型。
一种可能的实施方式中,所述语音特征包括:梅尔频率倒谱系数MFCC特征、音素特征、音节特征、字符特征中至少一项。
一种可能的实施方式中,所述基础识别模型包括:神经网络模型、条件随机场模型、概率线性判别分析PLDA模型中一种或者多种。
一种可能的实施方式中,所述展示模块71,还用于:在设置服务页面展示语音接单开关;
在所述语音接单开关被打开时,校验是否开启了麦克风权限;
如果未开启麦克风权限,则展示麦克风权限开启弹窗,所述麦克风权限开启弹窗用于开启所述麦克风权限;
所述展示模块,用与采用下述方式通过听单服务页面展示语音输入提示信息:
在确认所述语音接单开关处于打开状态时,通过所述听单服务页面展示所述语音输入提示信息。
一种可能的实施方式中,所述展示模块71,还用于:
在设置服务页面展示语音接单教学按钮;
当所述语音接单教学按钮被触发后,执行语音接单新手引导流程。
一种可能的实施方式中,还包括:语音播报模块75,用于所述在接收到服务器发送的订单信息后,在所述预设时间长度开始之前,对所述订单信息进行语音播报。
一种可能的实施方式中,所述展示模块71,还用于在接收到服务器发送的订单信息后,通过听单服务页面展示收音指示标识,并控制所述收音指示标识发生形态变化,以提示服务请求方录入所述目标语音内容。
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
实施例三
本申请实施例还提供了一种计算机设备80,如图8所示,为本申请实施例提供的计算机设备80结构示意图,包括:处理器81、存储器82、和总线83。所述存储器82存储有所述处理器81可执行的机器可读指令(比如,图7中的装置中展示模块71、检测模块72、反馈模块73对应的执行指令等),当计算机设备80运行时,所述处理器81与所述存储器82之间通过总线83通信,所述机器可读指令被所述处理器81执行时执行如下处理:
在接收到服务器发送的订单信息后,通过听单服务页面展示语音输入提示信息,所述语音输入提示信息用于提示服务提供方录入指示接单的目标语音内容;
检测是否在预设时间长度内接收到所述服务提供方确认接单的目标语音内容;
若接收到所述目标语音内容,则向所述服务器反馈接单确认信息。
一种可能的实施方式中,处理器81执行的指令中,该接单方法还包括:
若未在预设时间长度内接收到所述服务提供方确认接单的目标语音内容,则向所述服务器反馈拒绝接单信息。
一种可能的实施方式中,处理器81执行的指令中,所述检测是否在预设时间长度内接收到所述服务提供方确认接单的目标语音内容,包括:
检测是否在预设时间长度内接收到待识别语音内容;
若接收到所述待识别语音内容,将接收到的待识别语音内容输入至预先训练的语音识别模型中,得到语音识别结果;
检测所述语音识别结果与所述目标语音内容是否匹配;
如果匹配,则确认接收到所述目标语音内容。
一种可能的实施方式中,处理器81执行的指令中,采用下述方式训练所述语音识别模型:
获取多段样本语音在至少一种语音特征下的特征值,以及各段所述样本语音对应的真实语音内容;
将各段所述样本语音在至少一种语音特征下的特征值,输入至进行语音识别的基础识别模型中,获取与各段所述样本语音分别对应的样本语音识别结果;
基于所述样本语音识别结果以及所述真实语音内容,训练所述基础识别模型,得到所述语音识别模型。
一种可能的实施方式中,处理器81执行的指令中,所述语音特征包括:梅尔频率倒谱系数MFCC特征、音素特征、音节特征、字符特征中至少一项。
一种可能的实施方式中,处理器81执行的指令中,所述基础识别模型包括:神经网络模型、条件随机场模型、概率线性判别分析PLDA模型中一种或者多种。
一种可能的实施方式中,处理器81执行的指令中,该接单方法还包括:在设置服务页面展示语音接单开关;
在所述语音接单开关被打开时,校验是否开启了麦克风权限;
如果未开启麦克风权限,则展示麦克风权限开启弹窗,所述麦克风权限开启弹窗用于开启所述麦克风权限;
所述通过听单服务页面展示语音输入提示信息,包括:
在确认所述语音接单开关处于打开状态时,通过所述听单服务页面展示所述语音输入提示信息。
一种可能的实施方式中,处理器81执行的指令中,该接单方法还包括:
在设置服务页面展示语音接单教学按钮;
当所述语音接单教学按钮被触发后,执行语音接单新手引导流程。
一种可能的实施方式中,处理器81执行的指令中,所述在接收到服务器发送的订单信息后,在所述预设时间长度开始之前,还包括:
对所述订单信息进行语音播报。
一种可能的实施方式中,处理器81执行的指令中,在接收到服务器发送的订单信息后,还包括:
通过听单服务页面展示收音指示标识,并控制所述收音指示标识发生形态变化,以提示服务请求方录入所述目标语音内容。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述接单方法的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述接单方法,从而解决通过手动触发接单导致的驾驶安全隐患的问题,进而达到能够通过语音接单,降低服务提供方在接单时存在的驾驶安全隐患的效果。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考方法实施例中的对应过程,本申请中不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
本申请实施例公开了TS1、一种接单方法,包括:
在接收到服务器按预设规则匹配的订单信息后,通过听单服务页面展示语音输入提示信息,所述语音输入提示信息用于提示服务提供方录入指示接单的目标语音内容;
检测是否在预设时间长度内接收到所述服务提供方输入的所述目标语音内容;
若在所述预设时间长度内接收到所述目标语音内容,则向所述服务器反馈接单确认信息;
若未在所述预设时间长度内接收到所述目标语音内容,则向所述服务器反馈拒绝接单信息。
TS2、如TS1所述的方法,其中,所述听单服务页面还展示时间长度信息,所述时间长度信息指示所述服务提供方在预设时间长度内输入所述目标语音内容。
TS3、如TS2所述的方法,其中,所述时间长度信息的展示包括:动态展示,或者,静态展示。
TS4、如TS1所述的方法,其中,所述在接收到服务器按预设规则匹配的订单信息之后,还包括:
以文字的形式展示所述订单信息;或者,
以图形的形式展示所述订单信息。
TS5、如TS1-TS4任一所述的方法,其中,所述听单服务页面,包括:
电子地图展示区域,用于展示电子地图;
距离显示区域,用于展示从服务提供方的当前地理位置到达出发地的路程长度。
TS6、如TS5所述的方法,其中,所述听单服务页面还包括至少以下至少一项:
语音输入提示信息展示区域,用于展示语音输入提示信息;
时间展示区域,用于展示时间长度信息;
收音指示标识展示区域,用于展示收音指示标识。
TS7、如TS1所述的方法,其中,所述检测是否在预设时间长度内接收到所述服务提供方输入的所述目标语音内容,包括:
检测是否在预设时间长度内接收到待识别语音内容;
若接收到所述待识别语音内容,将接收到的待识别语音内容输入至预先训练的语音识别模型中,得到语音识别结果;
检测所述语音识别结果与所述目标语音内容是否匹配;
如果匹配,则确认接收到所述目标语音内容。
TS8、如TS1所述的方法,其中,该接单方法还包括:在设置服务页面展示语音接单开关;
在所述语音接单开关被打开时,校验是否开启了麦克风权限;
如果未开启麦克风权限,则展示麦克风权限开启弹窗,所述麦克风权限开启弹窗用于开启所述麦克风权限;
所述通过听单服务页面展示语音输入提示信息,包括:
在确认所述语音接单开关处于打开状态时,通过所述听单服务页面展示所述语音输入提示信息。
TS9、如TS8所述的方法,其中,该接单方法还包括:
在设置服务页面展示语音接单教学按钮;
当所述语音接单教学按钮被触发后,执行语音接单新手引导流程。
TS10、如TS1所述的方法,其中,所述在接收到服务器发送的订单信息后,在所述预设时间长度开始之前,还包括:
对所述订单信息进行语音播报。
TS11、如TS1所述的方法,其中,在接收到服务器发送的订单信息后,还包括:
通过听单服务页面展示收音指示标识,并控制所述收音指示标识发生形态变化,以提示服务请求方录入所述目标语音内容。
TS12、一种接单装置,该接单装置包括:
展示模块,用于在接收到服务器按预设规则匹配的订单信息后,通过听单服务页面展示语音输入提示信息,所述语音输入提示信息用于提示服务提供方录入指示接单的目标语音内容;
检测模块,用于检测是否在预设时间长度内接收到所述服务提供方输入的所述目标语音内容;
反馈模块,用于若在所述预设时间长度内接收到所述目标语音内容,则向所述服务器反馈接单确认信息;若未在所述预设时间长度内接收到所述目标语音内容,则向所述服务器反馈拒绝接单信息。
TS13、一种计算机设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行TS1至TS11任一所述方法的步骤。
TS14、一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行TS1至TS11任一所述方法的步骤。
TS15、一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现TS1至TS11任一所述方法的步骤。

Claims (10)

1.一种接单方法,其特征在于,包括:
在接收到服务器按预设规则匹配的订单信息后,通过听单服务页面展示语音输入提示信息,所述语音输入提示信息用于提示服务提供方录入指示接单的目标语音内容;
检测是否在预设时间长度内接收到所述服务提供方输入的所述目标语音内容;
若在所述预设时间长度内接收到所述目标语音内容,则向所述服务器反馈接单确认信息;
若未在所述预设时间长度内接收到所述目标语音内容,则向所述服务器反馈拒绝接单信息。
2.根据权利要求1所述的接单方法,其特征在于,所述听单服务页面还展示时间长度信息,所述时间长度信息指示所述服务提供方在预设时间长度内输入所述目标语音内容。
3.根据权利要求2所述的接单方法,其特征在于,所述时间长度信息的展示包括:动态展示,或者,静态展示。
4.根据权利要求1所述的接单方法,其特征在于,所述在接收到服务器按预设规则匹配的订单信息之后,还包括:
以文字的形式展示所述订单信息;或者,
以图形的形式展示所述订单信息。
5.根据权利要求1-4任一项所述的接单方法,其特征在于,所述听单服务页面,包括:
电子地图展示区域,用于展示电子地图;
距离显示区域,用于展示从服务提供方的当前地理位置到达出发地的路程长度。
6.根据权利要求5所述的接单方法,其特征在于,所述听单服务页面还包括至少以下至少一项:
语音输入提示信息展示区域,用于展示语音输入提示信息;
时间展示区域,用于展示时间长度信息;
收音指示标识展示区域,用于展示收音指示标识。
7.根据权利要求1所述的接单方法,其特征在于,所述检测是否在预设时间长度内接收到所述服务提供方输入的所述目标语音内容,包括:
检测是否在预设时间长度内接收到待识别语音内容;
若接收到所述待识别语音内容,将接收到的待识别语音内容输入至预先训练的语音识别模型中,得到语音识别结果;
检测所述语音识别结果与所述目标语音内容是否匹配;
如果匹配,则确认接收到所述目标语音内容。
8.一种计算机设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至7任一所述方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7任一所述方法的步骤。
10.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1至7任一所述方法的步骤。
CN202110190538.3A 2019-06-19 2019-06-19 一种接单方法及设备、介质、程序产品 Pending CN113012696A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110190538.3A CN113012696A (zh) 2019-06-19 2019-06-19 一种接单方法及设备、介质、程序产品

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202110190538.3A CN113012696A (zh) 2019-06-19 2019-06-19 一种接单方法及设备、介质、程序产品
CN201910532906.0A CN110767222B (zh) 2019-06-19 2019-06-19 一种接单方法及装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201910532906.0A Division CN110767222B (zh) 2019-06-19 2019-06-19 一种接单方法及装置

Publications (1)

Publication Number Publication Date
CN113012696A true CN113012696A (zh) 2021-06-22

Family

ID=69329072

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202110190538.3A Pending CN113012696A (zh) 2019-06-19 2019-06-19 一种接单方法及设备、介质、程序产品
CN201910532906.0A Active CN110767222B (zh) 2019-06-19 2019-06-19 一种接单方法及装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201910532906.0A Active CN110767222B (zh) 2019-06-19 2019-06-19 一种接单方法及装置

Country Status (1)

Country Link
CN (2) CN113012696A (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111586185B (zh) * 2020-05-11 2023-05-26 拉扎斯网络科技(上海)有限公司 电子设备、接单确认方法、装置及可读存储介质
CN113010058B (zh) * 2021-03-09 2023-01-06 汉海信息技术(上海)有限公司 信息处理方法、装置、设备以及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103680135A (zh) * 2013-12-31 2014-03-26 北京东方车云信息技术有限公司 一种提供打车服务的方法、装置及系统
CN103680134A (zh) * 2013-12-31 2014-03-26 北京东方车云信息技术有限公司 一种提供打车服务的方法、装置及系统
US20180025001A1 (en) * 2012-10-31 2018-01-25 Tivo Solutions Inc. Method and system for voice based media search
CN108011913A (zh) * 2016-12-29 2018-05-08 北京车和家信息技术有限责任公司 数据传输方法、车机显示装置、车辆多媒体设备及系统
CN108364152A (zh) * 2018-01-17 2018-08-03 拉扎斯网络科技(上海)有限公司 一种配送方法及装置
CN109285549A (zh) * 2017-07-20 2019-01-29 北京嘀嘀无限科技发展有限公司 语音处理方法及装置
CN109389971A (zh) * 2018-08-17 2019-02-26 深圳壹账通智能科技有限公司 基于语音识别的保险录音质检方法、装置、设备和介质
CN109637525A (zh) * 2019-01-25 2019-04-16 百度在线网络技术(北京)有限公司 用于生成车载声学模型的方法和装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103269395B (zh) * 2013-04-22 2016-03-30 聚熵信息技术(上海)有限公司 基于锁屏状态下的语音控制方法及其装置
CN105895093A (zh) * 2015-11-02 2016-08-24 乐视致新电子科技(天津)有限公司 语音信息处理方法及装置
CN108346073B (zh) * 2017-01-23 2021-11-02 北京京东尚科信息技术有限公司 一种语音购物方法和装置
CN107180631A (zh) * 2017-05-24 2017-09-19 刘平舟 一种语音交互方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180025001A1 (en) * 2012-10-31 2018-01-25 Tivo Solutions Inc. Method and system for voice based media search
CN103680135A (zh) * 2013-12-31 2014-03-26 北京东方车云信息技术有限公司 一种提供打车服务的方法、装置及系统
CN103680134A (zh) * 2013-12-31 2014-03-26 北京东方车云信息技术有限公司 一种提供打车服务的方法、装置及系统
CN108011913A (zh) * 2016-12-29 2018-05-08 北京车和家信息技术有限责任公司 数据传输方法、车机显示装置、车辆多媒体设备及系统
CN109285549A (zh) * 2017-07-20 2019-01-29 北京嘀嘀无限科技发展有限公司 语音处理方法及装置
CN108364152A (zh) * 2018-01-17 2018-08-03 拉扎斯网络科技(上海)有限公司 一种配送方法及装置
CN109389971A (zh) * 2018-08-17 2019-02-26 深圳壹账通智能科技有限公司 基于语音识别的保险录音质检方法、装置、设备和介质
CN109637525A (zh) * 2019-01-25 2019-04-16 百度在线网络技术(北京)有限公司 用于生成车载声学模型的方法和装置

Also Published As

Publication number Publication date
CN110767222A (zh) 2020-02-07
CN110767222B (zh) 2021-03-09

Similar Documents

Publication Publication Date Title
US10096319B1 (en) Voice-based determination of physical and emotional characteristics of users
CN107710322B (zh) 信息提供系统、信息提供方法和计算机可读记录介质
US20170148436A1 (en) Speech processing system and terminal
US8963983B2 (en) Mobile terminal and method of controlling the same
CN110770819B (zh) 语音识别系统和方法
CN110767222B (zh) 一种接单方法及装置
JP2017509065A (ja) 異なる言語の翻訳を用いる車両用画像キャプチャーシステム
JP6391887B2 (ja) 応答生成装置、対話制御システムおよび応答生成方法
JP2017058318A (ja) 情報処理装置、情報処理方法及びプログラム
CN110998719A (zh) 信息处理设备和信息处理方法
CN110070861A (zh) 信息处理装置和信息处理方法
US20180350364A1 (en) Apparatus and method for determining operation based on context, vehicle for determining operation based on context, and method of controlling the vehicle
JP5769904B2 (ja) 評価情報投稿装置および評価情報投稿方法
CN112242143B (zh) 一种语音交互方法、装置、终端设备及存储介质
JP2017058315A (ja) 情報処理装置、情報処理方法及びプログラム
WO2014199428A1 (ja) 候補告知装置、候補告知方法及び候補告知用プログラム
JP5341548B2 (ja) 音声認識装置
JP6387287B2 (ja) 不明事項解消処理システム
US20160210961A1 (en) Speech interaction device, speech interaction system, and speech interaction method
CN111862946A (zh) 一种订单处理方法、装置、电子设备及存储介质
JP2019124976A (ja) リコメンド装置、リコメンド方法、及びリコメンドプログラム
CN113450177A (zh) 信息提供系统、装置及其控制方法、服务器、记录介质
EP3528136A1 (en) Retrieval result providing device and retrieval result providing method
JP2022103675A (ja) 情報処理装置、情報処理方法、及びプログラム
JP2005267092A (ja) 照応解析装置及びナビゲーション装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination