CN113488030A

CN113488030A - 语音点餐方法、装置及系统

Info

Publication number: CN113488030A
Application number: CN202110761284.6A
Authority: CN
Inventors: 魏朝菊; 颜峰
Original assignee: Sipic Technology Co Ltd
Current assignee: Sipic Technology Co Ltd
Priority date: 2021-07-06
Filing date: 2021-07-06
Publication date: 2021-10-08

Abstract

本发明公开一种语音点餐方法，应用于点餐装置，该方法包括：接收来自至少一个音频采集装置的语音点餐信号；根据所述语音点餐信号确定目标菜品名称；根据所述目标菜品名称生成标准点餐指令；发送所述标准点餐指令至点餐中控台。本发明只需要几个音频采集装置配合点餐装置以及现有的点餐中控台即可以以较低的成本实现具备语音点餐功能的点餐系统。

Description

语音点餐方法、装置及系统

技术领域

本发明涉及餐饮技术领域，尤其涉及一种语音点餐方法、装置及系统。

背景技术

随着信息技术的发展，自助点餐逐步进入了餐饮行业，用户借助自助点餐机即可完成自助点餐。在实现语音自助点餐时，现有语音点餐机都是一体式，无法对已有设备进行改造，若要使用语音点餐功能，需商家更换自助收银机，改造成本巨大。

发明内容

本发明实施例提供一种语音点餐方法、装置及系统，用于至少解决上述技术问题之一。

第一方面，本发明实施例提供一种语音点餐方法，应用于点餐装置，所述方法包括：

接收来自至少一个音频采集装置的语音点餐信号；

根据所述语音点餐信号确定目标菜品名称；

根据所述目标菜品名称生成标准点餐指令；

发送所述标准点餐指令至点餐中控台。

在一些实施例中，所述点餐装置配置有与所述点餐中控台的标准接口相匹配的通信接口，以向所述点餐中控台发送所述标准点餐指令。

本实施例中直接借助于现有点餐中控台的标准接口就可以将其升级为具备语音点餐功能的点餐系统，无需对现有点餐中控台进行任何的改进，降低了升级难度及成本，非常有利于产品的推广及使用。

在一些实施例中，所述标准接口至少包括RS232接口、usb接口和RJ45接口之一。

在一些实施例中，所述根据所述语音点餐信号确定目标菜品名称，包括：对所述语音点餐信号进行语音识别得到点餐文本；从所述点餐文本中提取目标菜品名称。

在一些实施例中，所述点餐装置配置有预先训练的语音识别模型；所述对所述语音点餐信号进行语音识别得到点餐文本，包括：采用所述预先训练的语音识别模型对所述语音点餐信号进行语音识别得到点餐文本。

在一些实施例中，所述根据所述语音点餐信号确定目标菜品名称，包括：将所述语音点餐信号发送至服务器，以对所述语音点餐信号进行语音识别得到点餐文本，从所述点餐文本中提取目标菜品名称；接收所述服务器发回的目标菜品名称。

在一些实施例中，本发明的语音点餐方法还包括：从所述点餐中控台获取菜品数据信息上传至服务器，以训练得到语音识别模型。

第二方面，本发明实施例还提供一种点餐装置，其包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本发明任意一项实施例所述语音点餐方法的步骤。

第三方面，本发明实施例还一种存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现本发明任意一项实施例所述语音点餐方法的步骤。

第四方面，本发明实施例还一种语音点餐系统，包括：

发明任意一项实施例所述的点餐装置和至少一个音频采集装置；

所述点餐装置配置为：

接收来自所述至少一个音频采集装置的语音点餐信号，根据所述语音点餐信号确定目标菜品名称，根据所述目标菜品名称生成标准点餐指令；

发送所述标准点餐指令至点餐中控台。

第五方面，本发明实施例还提供一种计算机程序产品，所述计算机程序产品包括存储在存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，使所述计算机执行上述任一项语音点餐方法。

本发明实施例只需要几个音频采集装置配合点餐装置以及现有的点餐中控台即可以以较低的成本实现具备语音点餐功能的点餐系统。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明的语音点餐方法的一实施例的流程图；

图2为本发明的语音点餐方法的另一实施例的流程图；

图3为本发明的语音点餐方法的另一实施例的流程图；

图4为本发明的电子设备的一实施例的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、元件、数据结构等等。也可以在分布式计算环境中实践本发明，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

在本发明中，“模块”、“装置”、“系统”等指应用于计算机的相关实体，如硬件、硬件和软件的组合、软件或执行中的软件等。详细地说，例如，元件可以、但不限于是运行于处理器的过程、处理器、对象、可执行元件、执行线程、程序和/或计算机。还有，运行于服务器上的应用程序或脚本程序、服务器都可以是元件。一个或多个元件可在执行的过程和/或线程中，并且元件可以在一台计算机上本地化和/或分布在两台或多台计算机之间，并可以由各种计算机可读介质运行。元件还可以根据具有一个或多个数据包的信号，例如，来自一个与本地系统、分布式系统中另一元件交互的，和/或在因特网的网络通过信号与其它系统交互的数据的信号通过本地和/或远程过程来进行通信。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”，不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

如图1所示，本发明的实施例提供一种语音点餐方法，应用于点餐装置，该方法包括：

S10、接收来自至少一个音频采集装置的语音点餐信号。

示例性地，音频采集装置配置有麦克风，用于采集语音信号。音频采集装置还配置有通信模块，用于将所采集的语音信号发送至点餐装置。音频采集装置还可以配置有显示屏用于显示餐厅的菜品，以供用户浏览；该显示屏还可以供用户预览说点餐食的菜单，以及菜单总价等信息。

示例性地，音频采集装置可以设置在餐厅的每个餐桌上，或者设置在餐厅的预定位置供用户点餐使用。

S20、根据所述语音点餐信号确定目标菜品名称。

示例性地，点餐装置可以在本地根据所述语音点餐信号确定目标菜品名称，也可以将语音点餐信号发送到服务器来确定目标菜品名称。

S30、根据所述目标菜品名称生成标准点餐指令。

示例性地，标准点餐指令为点餐中控台能够识别的指令。示例性地，在确定了目标菜品名称之后，根据该目标菜品名称生成点餐中控台所能够识别的指令。例如，在点餐中控台内部每个菜品名称都对应有各自的菜品ID，此时根据目标菜品名称生成标准点餐指令可以是：确定目标菜品名称的菜品ID，并生成包含该菜品ID的指令。

S40、发送所述标准点餐指令至点餐中控台。示例性地，餐中控台为现有收银、点单设备等。

本实施例中的语音点餐方法只需要几个音频采集装置配合点餐装置以及现有的点餐中控台即可以以较低的成本实现具备语音点餐功能的点餐系统。其中，点餐装置在音频采集装置与点餐中控台之间起到中枢的作用，实现了音频采集装置与点餐中控台之间的通信连接，并且实现了将音频信号转换为标准点餐指令。无需每个音频采集装置各自配置将音频信号转换为标准点餐指令的功能，这在一定程度上也降低了实现语音点餐的成本。

在一些实施例中，所述点餐装置配置有与所述点餐中控台的标准接口相匹配的通信接口，以向所述点餐中控台发送所述标准点餐指令。示例性地，标准接口至少包括RS232接口、usb接口和RJ45接口之一。

本实施例中的语音点餐方法直接借助于现有点餐中控台的标准接口就可以将其升级为具备语音点餐功能的点餐系统，无需对现有点餐中控台进行任何的改进，降低了升级难度及成本，非常有利于产品的推广及使用。

如图2所示为本发明的语音点餐方法的另一实施例的流程图，在该实施例中，根据所述语音点餐信号确定目标菜品名称，包括：

S21、对所述语音点餐信号进行语音识别得到点餐文本。

示例性地，点餐装置配置有预先训练的语音识别模型；对所述语音点餐信号进行语音识别得到点餐文本，包括：采用所述预先训练的语音识别模型对所述语音点餐信号进行语音识别得到点餐文本。

S22、从所述点餐文本中提取目标菜品名称。

本实施例的语音点餐方法实现了离线语音点餐，即便是在离线状态下也可以根据语音点餐信号确定点餐文本，从而提取出目标菜品名称，实现离线语音点餐。

如图3所示为本发明的语音点餐方法的另一实施例的流程图，在该实施例中，根据所述语音点餐信号确定目标菜品名称，包括：

S21′、将所述语音点餐信号发送至服务器，以对所述语音点餐信号进行语音识别得到点餐文本，从所述点餐文本中提取目标菜品名称；

S22′、接收所述服务器发回的目标菜品名称。

本实施例的语音点餐方法中，语音识别功能在服务器上实现，本地点餐装置无需配置相应的人工智能芯片用于支持语音识别功能，从而进一步降低了实现语音点餐方法的成本。

本实施例中采用点餐中控台中所能够识别的菜品数据上传至服务器进行语音识别模型的训练，使得训练得到的语音识别模型能够很好的匹配当前的点餐中控台，提升了语音点餐的准确性与可靠性。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作合并，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在一些实施例中，本发明实施例还提供一种点餐装置，其包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行：

接收来自至少一个音频采集装置的语音点餐信号；

根据所述语音点餐信号确定目标菜品名称；

根据所述目标菜品名称生成标准点餐指令；

发送所述标准点餐指令至点餐中控台。

本实施例中的点餐装置只需要几个音频采集装置配合现有的点餐中控台即可以以较低的成本实现具备语音点餐功能的点餐系统。

在一些实施例中，点餐装置还配置为：从所述点餐中控台获取菜品数据信息上传至服务器，以训练得到语音识别模型。

本发明实施例的点餐装置通过以下两大流程实现语音点餐：

A、点餐装置使用前初始化流程

步骤1：商家在对接语音外接装置(即，点餐装置)前，需对语音外接装置简单进行商品初始化设置，设置“商品名称”、“商品ID”，商品名称&id(需与收银系统的商品数据一致)，设置方式支持手动录入、文件导入、接口更新等录入方式；还可修改装置预置的点单回复语。

步骤2：完成第一步录入后，需将语音外接装置联网进行初始化，语音装置自动将商品名称上传服务器训练语音识别模型，并将相关点餐的语音识别模型自动下载到语音外接装置中，以实现离线语音点餐。

步骤3：将语音外接装置通过USB接口或者RS232接口或者RJ45接口或网络等标准接口与收银机连接，通过标准接口，即可实现语音指令传输给收银机，收银机将订单生成结果回传给语音设备，语音设备将处理结果回馈给点单消费者。

B、用户点单流程

步骤1：在用户站到语音外接装置(或者与语音外接装置连接的音频采集装置)前，AI摄像头依据人脸距离位置及人眼直视状态，自动开启语音识别监听；并可配置提示语音，例如：“您需要点什么？”

步骤2：顾客点单，例如：“我要1份鸡腿堡套餐和牛排套餐”，语音外接装置将点单信息通过标准接口发送上位机(收银机)，并提示顾客：添加成功，还需要什么？顾客回复：“就这些”，语音装置，将“下单”指令发送上位机，并提示顾客下单完成，请支付XX元，支付完成提示取餐号，点餐完毕。

本发明实施例的点餐装置集成AI摄像头、拾音模块、播报模块、网络、标准外设接口，实现人脸自动唤醒，语音拾音、信号处理与语音播报。

本发明实施例的点餐装置通过语音识别模型针对点餐场景定制的点餐语料进行训练，能够理解顾客的点餐话术。语音识别模型设计#商品名称#、#数量#等语义槽，设计下单、改单、取消、确认等意图，模拟用户点餐流程，实现多轮对话式点餐询问。

本发明实施例的点餐装置针对语音识别模型的语料进行识别模型训练，语义及识别资源自动下载到语音装置中。当语音装置离线时，可以使用本地资源进行语义的识别与理解，从而满足离线使用的语音场景。

本发明实施例的点餐装置中的点餐指令：顾客语音输入的点餐话术经过语音识别模型的语义理解，转化为标准的接口通讯指令(如usb或网络)，将指令转化为收银系统的下单指令。即可与收银系统实现语音点单。

本装置适用于集成到各种收银设备的收银软件和应用上，采用标准接口对接已有点餐设备，减少二次开发，使用简单，可以方便、快捷的实现语音点餐。可以同时配置多路语音点餐装置，实现多人同时语音点餐，能适应点餐高峰时的响应。大大提高点餐速度，减少排队等待，提升用户点餐体验。

1)本发明实施例的点餐装置为独立的语音交互单元，通过标准接口外接现有收银、点单设备实现语音点单交互。

标准接口采用通用标准的数据通信的接口标准，包括不限于RS232，usb，RJ45等通讯接口，商家将语音装置通过标准接口连接到现有收银、点单设备的现有通信接口。

2)本发明实施例的点餐装置除了集成语音识别功能外，还可集成AI摄像头，实现更为流畅的语音唤醒和语音点单交互体验。

3)本发明实施例的点餐装置可以内置一套语音系统，与原有收银装置业务系统解耦，可灵活配置商品列表，处理在线、离线语音模型训练与识别。

4)服务器对点餐话术和商品列表进行语言模型训练，语言模型可下载到语音装置本地，实现离线识别使用。

4-1:日常点餐场景中，菜式多种多样，并且随着季节的变化菜品会存在新增和删除，商家只需将变更的菜单名称重新录入并上传至云端自动进行语言模型训练，训练成功即可支持语言点单，提高语音识别的准确性。

4-2：训练成功的语言模式支持下载至本地，支持商家在不联网的情况依旧可以使用智能语音点餐，应对生活中突发的断网情况，并且不会降低语音识别的准确性。

在一些实施例中，本发明实施例还提供一种存储介质，其上存储有计算机程序，该程序被处理器执行时实现前述任意一项所述的语音点餐方法的步骤。

在一些实施例中，本发明实施例还提供一种语音点餐系统，包括：

前述任一实施例所述的点餐装置和至少一个音频采集装置；

所述点餐装置配置为：

发送所述标准点餐指令至点餐中控台。

图4是本申请另一实施例提供的执行语音点餐方法的电子设备的硬件结构示意图，如图4所示，该设备包括：

一个或多个处理器410以及存储器420，图4中以一个处理器410为例。

执行语音点餐方法的设备还可以包括：输入装置430和输出装置440。

处理器410、存储器420、输入装置430和输出装置440可以通过总线或者其他方式连接，图4中以通过总线连接为例。

存储器420作为一种非易失性计算机可读存储介质，可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块，如本申请实施例中的语音点餐方法对应的程序指令/模块。处理器410通过运行存储在存储器420中的非易失性软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例语音点餐方法。

存储器420可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据语音点餐装置的使用所创建的数据等。此外，存储器420可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中，存储器420可选包括相对于处理器410远程设置的存储器，这些远程存储器可以通过网络连接至语音点餐装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置430可接收输入的数字或字符信息，以及产生与语音点餐装置的用户设置以及功能控制有关的信号。输出装置440可包括显示屏等显示设备。

所述一个或者多个模块存储在所述存储器420中，当被所述一个或者多个处理器410执行时，执行上述任意方法实施例中的语音点餐方法。

上述产品可执行本申请实施例所提供的方法，具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，可参见本申请实施例所提供的方法。

本申请实施例的电子设备以多种形式存在，包括但不限于:

(1)移动通信设备:这类设备的特点是具备移动通信功能，并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机，以及低端手机等。

(2)超移动个人计算机设备:这类设备属于个人计算机的范畴，有计算和处理功能，一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等，例如iPad。

(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod)，掌上游戏机，电子书，以及智能玩具和便携式车载导航设备。

(4)其他具有数据交互功能的电子装置。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种语音点餐方法，应用于点餐装置，所述方法包括：

接收来自至少一个音频采集装置的语音点餐信号；

根据所述语音点餐信号确定目标菜品名称；

根据所述目标菜品名称生成标准点餐指令；

发送所述标准点餐指令至点餐中控台。

2.根据权利要求1所述的方法，其特征在于，所述点餐装置配置有与所述点餐中控台的标准接口相匹配的通信接口，以向所述点餐中控台发送所述标准点餐指令。

3.根据权利要求2所述的方法，其特征在于，所述标准接口至少包括RS232接口、usb接口和RJ45接口之一。

4.根据权利要求1所述的方法，其特征在于，所述根据所述语音点餐信号确定目标菜品名称，包括：

对所述语音点餐信号进行语音识别得到点餐文本；

从所述点餐文本中提取目标菜品名称。

5.根据权利要求4所述的方法，其特征在于，所述点餐装置配置有预先训练的语音识别模型；

所述对所述语音点餐信号进行语音识别得到点餐文本，包括：采用所述预先训练的语音识别模型对所述语音点餐信号进行语音识别得到点餐文本。

6.根据权利要求1所述的方法，其特征在于，所述根据所述语音点餐信号确定目标菜品名称，包括：

将所述语音点餐信号发送至服务器，以对所述语音点餐信号进行语音识别得到点餐文本，从所述点餐文本中提取目标菜品名称；

接收所述服务器发回的目标菜品名称。

7.根据权利要求5或6所述的方法，其特征在于，还包括：从所述点餐中控台获取菜品数据信息上传至服务器，以训练得到语音识别模型。

8.一种点餐装置，其包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7中任意一项所述方法的步骤。

9.一种存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1-7中任意一项所述方法的步骤。

10.一种语音点餐系统，包括：

权利要求8所述的点餐装置和至少一个音频采集装置；

所述点餐装置配置为：

发送所述标准点餐指令至点餐中控台。