CN111881330B

CN111881330B - 居家服务场景自动还原方法及系统

Info

Publication number: CN111881330B
Application number: CN202010779180.3A
Authority: CN
Inventors: 刘燚璇
Original assignee: Yijia Shanghai Medical Elderly Care Service Co ltd
Current assignee: Yijia Shanghai Medical Elderly Care Service Co ltd
Priority date: 2020-08-05
Filing date: 2020-08-05
Publication date: 2023-10-27
Anticipated expiration: 2040-08-05
Also published as: CN111881330A

Abstract

本发明公开了居家服务场景自动还原方法及系统，本发明利用语音识别技术来实现服务场景的还原，即可客观、自动化的实现服务场景过程的记录，进而通过对语言数据的识别处理，得到待测数据，将待测数据与预设的映射数据库中的样本数据进行相似度计算，输出相似度最高的样本数据所对应的标签值，即可实现对服务场景的自动化还原，无需人工干预且不会涉及侵犯被服务对象的隐私。

Description

居家服务场景自动还原方法及系统

技术领域

本发明涉及计算机处理技术领域，具体涉及居家服务场景自动还原方法及系统。

背景技术

现有的服务场景还原技术通常通过人工记录或者利用图像或者视频记录的方式来进行居家服务场景的还原，然而人工记录方式存在填错、填漏、甚至作假等纰漏，不利于管控；另外人工记录方式不便于查询、追踪等等。而利用图像或者视频记录的方式也存在诸多不便之处，特别是某些服务，例如沐浴、擦拭身体、医疗检查等等服务过程中，如果通过图像或者视频容易侵犯被服务对象的隐私。

发明内容

为了克服现有服务场景还原技术存在的缺陷，本发明提供了一种居家服务场景自动还原方法。

本发明通过下述技术方案实现：

居家服务场景自动还原方法，该方法包括以下步骤：

步骤一、构建标准化的服务流程，并基于标准化的服务流程构建映射数据库，所述映射数据库由不同服务的样本数据及其标签值构成；

步骤二、按照标准化的服务流程进行居家服务；

步骤三、采集居家服务过程中的服务数据并进行关键词提取，由关键词构成待测数据；

步骤四、待测数据与映射数据库中的样本数据进行相似度计算，获得相似度最高的样本数据对应的标签值并输出，即可实现服务场景的自动还原。

本发明利用语音识别技术来实现服务场景的还原，即可客观、自动化的实现服务场景过程的记录，进而通过对语言数据的识别处理，得到待测数据，将待测数据与预设的映射数据库中的样本数据进行相似度计算，输出相似度最高的样本数据所对应的标签值，即可实现对服务场景的自动化还原，无需人工干预且不会涉及侵犯被服务对象的隐私。

可选的，本发明的步骤一基于标准化服务流程建立映射数据库具体包括：

步骤S11，依据标准化服务流程建立关键词数据库：根据不同服务内容对服务流程进行梳理，将服务过程中的关键词分类设置TAG标签，对于TAG标签对应的内容进行筛选和合并，确定TAG标签所占权重和类别，然后对TAG标签对应的内容进行清洗进而确定初始映射规则；

步骤S12，建立标准映射规则：

以“[主关键词，第一辅助关键词，第二辅助关键词，操作时间]→[服务项目标签]”作为标准映射关系；

步骤S13，建立辅助映射规则，以提高识别准确率：

以“[第一关键词，第二关键词，第三关键词]→[服务项目标签]”作为辅助映射关系，保证输出第一关键词、第二关键词或第三关键词时能够准确定位到对应服务项目；

步骤S14，设定初始识别阈值，对关键词数据库进行语料识别测试，基于识别情况更新步骤S13设置的辅助映射规则，并调整识别阈值，直到关键词识别情况符合预期，则得到映射颗粒度；

步骤S15，自动检测关键词数据库，根据分类映射等级颗粒度，对步骤S11得到的初始映射规则和步骤S12自定义的标准映射规则进行几何运算和文本匹配，匹配得到服务项目的识别映射规则：

[主识别关键词，第一辅助识别关键词，第二辅助识别关键词，操作时间]→

[服务项目标签]；

由多个服务项目的识别映射规则作为样本数据+标签的格式存储构成映射数据库。

本发明根据标准化的服务流程建立服务关键词数据库，将服务过程中的关键词划分为服务过程关键词(服务前关键词、服务中关键词和服务后关键词)、服务质量关键词和服务过程环境关键词，并分别建立对应的TAG标签，按照TAG标签对其对应内容进行处理，得到初始映射规则；然后再自定义标准映射规则，以及辅助映射规则，利用辅助映射规则进行模糊识别和误识别的测试，得到映射颗粒度；最后基于映射颗粒度，对初始映射规则和标准映射规则进行运算处理，得到最终的识别映射规则，再将其转换为标准的存储格式即可得到映射数据库。

本发明利用服务过程中交互语音以及背景环境声音来训练语音识别模型，以提高识别、还原的准确性和可靠性。

可选的，本发明的步骤三具体包括：

步骤S31，采用语音设备获取居家服务过程中的服务数据并进行预处理，所述服务数据包括语音交互数据、环境语音数据和其他服务数据；

步骤S32，采用语音识别模型对预处理之后的语音数据进行文本识别并进行有效性判断；如果判断识别的文本有效则继续执行步骤S33；

步骤S33，从识别出的文本中以及其他服务数据中提取关键词，由关键词构成待测数据。

可选的，本发明的步骤S32中的语音识别模型包括声学模型和语言模型；

其中，所述语言模型用于处理文字序列，结合声学模型的输出，给出概率最大的文字序列作为语音识别结果。

可选的，本发明的步骤S32中的语音识别模型通过对预处理之后的语音数据的音色、音调和频率进行识别，从而判定识别出的文本是否有效。本发明通过对语音数据的预处理以及有效性判断，提高了识别的可靠性和精度，进而提高了服务场景还原的可靠性和准确性。

另一方面，本发明还提出了一种居家服务场景自动还原系统，该系统包括标准化服务模块、映射数据库模块、语音采集模块和数据处理模块；

所述标准化服务模块用于构建标准化的服务流程；

所述映射数据库模块基于标准化的服务流程构建映射数据库，所述映射数据库由不同服务的样本数据及其标签值构成；

所述语音采集模块用于采集按照标准化的服务流程进行居家服务过程中的服务数据；

所述数据处理模块对语音采集模块采集的数据进行处理得到待测数据，并将待测数据与映射数据库中的样本数据进行相似度计算，获得相似度最高的样本数据对应的标签值并输出，即可实现服务场景的自动还原。

可选的，本发明的映射数据库模块被配置为执行如下过程：

A，依据标准化服务流程建立关键词数据库：根据不同服务内容对服务流程进行梳理，将服务过程中的关键词分类设置TAG标签，对于TAG标签对应的内容进行筛选和合并，确定TAG标签所占权重和类别，然后对TAG标签对应的内容进行清洗进而确定初始映射规则；

B，建立标准映射规则：

C，建立辅助映射规则，以提高识别准确率：

D，设定初始识别阈值，对关键词数据库进行语料识别测试，基于识别情况更新步骤C设置的辅助映射规则，并调整识别阈值，直到关键词识别情况符合预期，则得到映射颗粒度；

E，自动检测关键词数据库，根据分类映射等级颗粒度，对A得到的初始映射规则和B自定义的标准映射规则进行几何运算和文本匹配，匹配得到服务项目的识别映射规则：

[主识别关键词，第一辅助识别关键词，第二辅助识别关键词，操作时间]→[服务项目标签]；

可选的，本发明的数据处理模块包括预处理单元、语音识别单元和相似度计算单元；

其中，所述预处理单元用于对语音设备获取居家服务过程中的服务数据并进行预处理，所述服务数据包括语音交互数据、环境语音数据和其他服务数据；

所述语音识别单元采用语音识别模型对预处理之后的语音数据进行文本识别并进行有效性判断，如果判断识别的文本有效则从识别出的文本中以及其他服务数据中提取关键词，由关键词构成待测数据；

所述相似度计算单元用于将待测数据与映射数据库中的样本数据进行相似度计算，获得相似度最高的样本数据对应的标签值并输出，即可实现服务场景的自动还原。

可选的，本发明的语音识别单元通过对预处理之后的语音数据的音色、音调和频率进行识别，从而判定识别出的文本是否有效。

本发明具有如下的优点和有益效果：

1、本发明的服务场景还原方法和系统利用语音识别技术，获得服务过程中的服务数据并对其进行处理得到待测数据，将待测数据与预设的映射数据库中的样本数据进行相似度计算，进而得到相似度最高的样本数据，则该样本数据对应的标签数据即为本次的服务项目，本发明实现了智能化的服务场景还原，无需人工干预且不会存在侵犯隐私的风险。

2、本发明的预设的映射数据库是基于标准化的服务流程，结合自动化映射技术实现。

3、本发明还在语音识别过程中设置了有效性识别，提高了识别的可靠性和精度，从而增强了场景环境的可靠性和准确性。

附图说明

此处所说明的附图用来提供对本发明实施例的进一步理解，构成本申请的一部分，并不构成对本发明实施例的限定。在附图中：

图1为本发明的方法流程示意图。

图2为本发明的系统结构示意图。

图3为本发明的数据处理模块结构示意图。

具体实施方式

在下文中，可在本发明的各种实施例中使用的术语“包括”或“可包括”指示所发明的功能、操作或元件的存在，并且不限制一个或更多个功能、操作或元件的增加。此外，如在本发明的各种实施例中所使用，术语“包括”、“具有”及其同源词仅意在表示特定特征、数字、步骤、操作、元件、组件或前述项的组合，并且不应被理解为首先排除一个或更多个其它特征、数字、步骤、操作、元件、组件或前述项的组合的存在或增加一个或更多个特征、数字、步骤、操作、元件、组件或前述项的组合的可能性。

在本发明的各种实施例中，表述“或”或“A或/和B中的至少一个”包括同时列出的文字的任何组合或所有组合。例如，表述“A或B”或“A或/和B中的至少一个”可包括A、可包括B或可包括A和B二者。

在本发明的各种实施例中使用的表述(诸如“第一”、“第二”等)可修饰在各种实施例中的各种组成元件，不过可不限制相应组成元件。例如，以上表述并不限制所述元件的顺序和/或重要性。以上表述仅用于将一个元件与其它元件区别开的目的。例如，第一用户装置和第二用户装置指示不同用户装置，尽管二者都是用户装置。例如，在不脱离本发明的各种实施例的范围的情况下，第一元件可被称为第二元件，同样地，第二元件也可被称为第一元件。

应注意到：如果描述将一个组成元件“连接”到另一组成元件，则可将第一组成元件直接连接到第二组成元件，并且可在第一组成元件和第二组成元件之间“连接”第三组成元件。相反地，当将一个组成元件“直接连接”到另一组成元件时，可理解为在第一组成元件和第二组成元件之间不存在第三组成元件。

在本发明的各种实施例中使用的术语仅用于描述特定实施例的目的并且并非意在限制本发明的各种实施例。如在此所使用，单数形式意在也包括复数形式，除非上下文清楚地另有指示。除非另有限定，否则在这里使用的所有术语(包括技术术语和科学术语)具有与本发明的各种实施例所属领域普通技术人员通常理解的含义相同的含义。所述术语(诸如在一般使用的词典中限定的术语)将被解释为具有与在相关技术领域中的语境含义相同的含义并且将不被解释为具有理想化的含义或过于正式的含义，除非在本发明的各种实施例中被清楚地限定。

为使本发明的目的、技术方案和优点更加清楚明白，下面结合实施例和附图，对本发明作进一步的详细说明，本发明的示意性实施方式及其说明仅用于解释本发明，并不作为对本发明的限定。

实施例1

相较于现有的利用人工记录或者视频采集方式实现居家服务场景还原的技术，存在人工干预造假不便于实时追踪监管，或者存在侵权隐私的风险等技术问题，本实施例提出了一种基于语音识别的居家服务场景自动还原方法。

本实施例利用语音识别技术来实现服务场景的还原，即可客观、自动化的实现服务场景过程的记录，进而通过对语言数据的识别处理，得到待测数据，将待测数据与预设的映射数据库中的样本数据进行相似度计算，输出相似度最高的样本数据所对应的标签值，即可实现对服务场景的自动化还原，无需人工干预且不会涉及侵犯被服务对象的隐私。

如图1所示，本实施例的方法包括以下步骤：

步骤一、构建标准化的服务流程，并基于标准化的服务流程构建映射数据库，所述映射数据库由不同服务的样本数据及其标签值构成。

本实施例构建的标准化的服务流程按照如下表所示的流程进行服务(沐浴)：

本实施例根据标准化的服务流程建立服务关键词数据库，将服务过程中的关键词划分为服务过程关键词(服务前关键词、服务中关键词和服务后关键词)、服务质量关键词和服务过程环境关键词，并分别建立对应的TAG标签，按照TAG标签对其对应内容进行处理，得到初始映射规则；然后再自定义标准映射规则，以及辅助映射规则，利用辅助映射规则进行模糊识别和误识别的测试，得到映射颗粒度；最后基于映射颗粒度，对初始映射规则和标准映射规则进行运算处理，得到最终的识别映射规则，再将其转换为标准的存储格式即可得到映射数据库。具体过程如下：

步骤S11，依据标准化服务流程建立关键词数据库：根据不同服务内容对服务流程进行梳理，将服务过程中的关键词分类设置TAG标签，对于TAG标签对应的内容进行筛选和合并，确定TAG标签所占权重和类别，然后对TAG标签对应的内容进行清洗进而确定初始映射规则。

本实施例以沐浴服务项目为例，导入标准服务操作流程：用物准备→试水温→洗发→额头→脸部→耳后→颈部→前胸→后背→两臂→臀部→会阴部→两腿部→双足→擦干保暖。根据服务项目确定各项目判定主关键词，将操作流程文本建立TAG标签(操作前、操作中、操作后)。将流程文本词进行分类、筛选、合并分别归类于对应TAG标签(操作前、操作中、操作后)中。

步骤S12，建立标准映射规则：

以“[主关键词，第一辅助关键词，第二辅助关键词，操作时间]→[服务项目标签]”作为标准映射关系。本实施例设置的上述标准映射规则使得当服务过程中工作人员说出关键词则自动匹配对应TAG标签，初步识别服务内容(例如试水温可对应沐浴/洗头/洗脚/进食)。

步骤S13，建立辅助映射规则，以提高识别准确率：

以“[第一关键词，第二关键词，第三关键词]→[服务项目标签]”作为辅助映射关系，保证输出第一关键词、第二关键词或第三关键词时能够准确定位到对应服务项目。本实施例中设置的辅助映射关系使得在服务过程中工作人员说出第一关键词、第二关键词或第三关键词能够增加识别准确率，精准定位服务内容，例如沐浴。

步骤二、按照标准化的服务流程进行居家服务。

步骤三、采集居家服务过程中的服务数据并进行关键词提取，由关键词构成待测数据。具体过程如下：

步骤S32，采用语音识别模型对预处理之后的语音数据进行文本识别并进行有效性判断；如果判断识别的文本有效则继续执行步骤S33。

本实施例采用的语音识别模型为现有的语音识别模型，包括声学模型和语言模型，语言模型用于处理文字序列，结合声学模型的输出，给出概率最大的文字序列作为语音识别结果。

本实施例采用的语音模型还通过对预处理之后的语音数据的音色、音调和频率进行识别，从而判定识别出的文本是否有效，如果有效则进行场景还原，如果无效直接判定未实施服务，以提高服务场景还原的可靠性和准确性。

步骤四、待测数据与映射数据库中的样本数据进行相似度计算，获得相似度最高的样本数据对应的标签值并输出，标签值代表服务项目，即可实现服务场景的自动还原。

实施例2

基于上述实施例1提出的方法，本实施例还提出了一种居于语音识别的居家服务场景自动还原系统。

如图2所示，本实施例的系统包括标准化服务模块、映射数据库模块、语音采集模块和数据处理模块。

标准化服务模块用于构建标准化的服务流程，本实施例构建的标准化的服务流程与实施例1构建的相同。

映射数据库模块基于标准化的服务流程构建映射数据库，所述映射数据库由不同服务的样本数据及其标签值构成。本实施例采用上述实施例1提出的方法构建映射数据库。

语音采集模块用于采集按照标准化的服务流程进行居家服务过程中的服务数据；

数据处理模块对语音采集模块采集的数据进行处理得到待测数据，并将待测数据与映射数据库中的样本数据进行相似度计算，获得相似度最高的样本数据对应的标签值并输出，即可实现服务场景的自动还原。

如图3所示，本实施例的数据处理模块包括预处理单元、语音识别单元和相似度计算单元；

其中，预处理单元用于对语音设备获取居家服务过程中的服务数据并进行预处理，所述服务数据包括语音交互数据、环境语音数据和其他服务数据；

语音识别单元采用语音识别模型对预处理之后的语音数据进行文本识别并进行有效性判断，如果判断识别的文本有效则从识别出的文本中以及其他服务数据中提取关键词，由关键词构成待测数据；

相似度计算单元用于将待测数据与映射数据库中的样本数据进行相似度计算，获得相似度最高的样本数据对应的标签值并输出，即可实现服务场景的自动还原。

本实施例的语音识别单元通过对预处理之后的语音数据的音色、音调和频率进行识别，从而判定识别出的文本是否有效。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.居家服务场景自动还原方法，其特征在于，该方法包括以下步骤：

步骤二、按照标准化的服务流程进行居家服务；

步骤四、待测数据与映射数据库中的样本数据进行相似度计算，获得相似度最高的样本数据对应的标签值并输出，即可实现服务场景的自动还原；

所述步骤一的基于标准化的服务流程构建映射数据库具体包括：

步骤S12，建立标准映射规则：

以“”作为标准映射关系；

步骤S13，建立辅助映射规则，以提高识别准确率：

以“”作为辅助映射关系，保证输出第一关键词、第二关键词或第三关键词时能够准确定位到对应服务项目；

；

2.根据权利要求1所述的居家服务场景自动还原方法，其特征在于，所述步骤三具体包括：

步骤S31，采用语音设备获取居家服务过程中的服务数据并进行预处理，所述服务数据包括语音交互数据和环境语音数据；

步骤S33，从识别出的文本中提取关键词，由关键词构成待测数据。

3.根据权利要求2所述的居家服务场景自动还原方法，其特征在于，所述步骤S32中的语音识别模型包括声学模型和语言模型；

4.根据权利要求2所述的居家服务场景自动还原方法，其特征在于，所述步骤S32中的语音识别模型通过对预处理之后的语音数据的音色、音调和频率进行识别，从而判定识别出的文本是否有效。

5.居家服务场景自动还原系统，其特征在于，该系统包括标准化服务模块、映射数据库模块、语音采集模块和数据处理模块；

所述标准化服务模块用于构建标准化的服务流程；

所述数据处理模块对语音采集模块采集的数据进行处理得到待测数据，并将待测数据与映射数据库中的样本数据进行相似度计算，获得相似度最高的样本数据对应的标签值并输出，即可实现服务场景的自动还原；

所述映射数据库模块被配置为执行如下过程：

B，建立标准映射规则：

以“”作为标准映射关系；

C，建立辅助映射规则，以提高识别准确率：

；

6.根据权利要求5所述的居家服务场景自动还原系统，其特征在于，所述数据处理模块包括预处理单元、语音识别单元和相似度计算单元；

其中，所述预处理单元用于对语音设备获取居家服务过程中的服务数据并进行预处理，所述服务数据包括语音交互数据和环境语音数据；

所述语音识别单元采用语音识别模型对预处理之后的语音数据进行文本识别并进行有效性判断，如果判断识别的文本有效则从识别出的文本中提取关键词，由关键词构成待测数据；

7.根据权利要求6所述的居家服务场景自动还原系统，其特征在于，所述语音识别单元通过对预处理之后的语音数据的音色、音调和频率、准确度进行识别，利用等价信息原理从而判定识别出的文本是否有效。