CN110347248A

CN110347248A - 交互处理方法、装置、设备及音频设备

Info

Publication number: CN110347248A
Application number: CN201910550417.8A
Authority: CN
Inventors: 张向军
Original assignee: Goertek Techology Co Ltd
Current assignee: Goertek Techology Co Ltd
Priority date: 2019-06-24
Filing date: 2019-06-24
Publication date: 2019-10-18
Anticipated expiration: 2039-06-24
Also published as: CN110347248B

Abstract

本发明公开了一种交互处理方法、装置、设备及音频设备。该方法通过音频设备实施，包括：根据最近的统计周期获取的用户使用数据，确定用户使用指标；根据用户使用指标，确定对应的交互改进措施；根据交互改进措施，向用户发出对应的交互改进提示，获取用户返回的交互改进确认，实施对应的交互改进处理。

Description

交互处理方法、装置、设备及音频设备

技术领域

本发明涉及交互处理技术领域，更具体地，涉及一种交互处理方法、装置、设备及音频设备。

背景技术

近年来随着人工智能技术以及设备制造技术的发展，人工智能设备普及率大幅提高。例如，音频设备近年来就成为许多家庭的必备家用设备，可以令用户通过自然语言交互，就能获取信息、进行娱乐、控制家电等应用服务，令用户获取全新的快捷家居体验。

但是，目前对于音频设备的使用性能，通常是通过语音识别率、唤醒成功率等在理想环境下测试获取的指标来进行评价，但这些指标无法实际反映用户在使用音频设备时真实的用户体验，因此，基于这些指标评价获取的音频设备的使用性能，难以实际满足用户对音频设备的真实交互需求。

发明内容

本发明的一个目的是提供一种用于处理音频设备与用户交互的新技术方案。

根据本发明的第一方面，提供了一种交互处理方法，包括：

根据最近的统计周期获取的用户使用数据，确定用户使用指标；

根据所述用户使用指标，确定对应的交互改进措施；

根据所述交互改进措施，向用户发出对应的交互改进提示，获取用户返回的交互改进确认，实施对应的交互改进处理。

根据本发明的第二方面，提供一种交互处理装置，设置在音频设备侧，包括：

指标确定单元，用于根据最近的统计周期获取的用户使用数据，确定用户使用指标；

措施确定单元，用于根据所述用户使用指标，确定对应的交互改进措施；

改进处理单元，用于根据所述交互改进措施，向用户发出对应的交互改进提示，获取用户返回的交互改进确认，实施对应的交互改进处理。

根据本发明的第三方面，提供一种交互处理设备，包括：

存储器，用于存储可执行的指令；

处理器，用于根据所述可执行的指令的控制，运行所述交互处理设备，执行根据本发明的第一方面所述的任意一项交互处理方法。

根据本发明的第四方面，提供一种音频设备，包括：

如本发明的第一方面所述的交互处理装置，或者如本发明的第二方面所述的交互处理设备。

根据本公开的一个实施例，通过根据用户使用音频设备的用户使用数据，确定反映用户对音频设备的实际使用体验的用户使用指标，以不同于语音识别率、唤醒成功率等在理想环境下测试获取的指标，从用户使用音频设备的实际体验角度，来评价音频设备的使用性能，对应采取交互改进措施来改进音频设备与用户的交互，有效提升音频设备的使用性能，实际满足用户对音频设备的真实交互需求，提升用户体验。

通过以下参照附图对本发明的示例性实施例的详细描述，本发明的其它特征及其优点将会变得清楚。

附图说明

被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例，并且连同其说明一起用于解释本发明的原理。

图1是显示可用于实现本发明的实施例的音频设备1000的硬件配置的例子的框图。

图2示出了本发明的实施例的交互处理方法的流程图。

图3示出了音频设备与用户交互过程的例子的框图。

图4示出了音频设备与用户交互过程的又一例子的框图。

图5示出了音频设备的数据传递风险与用户关注度之间的关系的例子的示意图。

图6示出了预设的时长指数关系的例子的示意图。

图7示出了本发明实施例的交互处理装置3000的框图。

图8示出了本发明实施例的交互处理设备4000的框图。

具体实施方式

现在将参照附图来详细描述本发明的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本发明及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为说明书的一部分。

在这里示出和讨论的所有例子中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它例子可以具有不同的值。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

<硬件配置>

图1是示出可以实现本发明的实施例的音频设备1000的硬件配置的框图。

音频设备1000可以是智能音箱、智能耳机等。如图1所示，音频设备1000可以包括处理器1100、存储器1200、接口装置1300、通信装置1400、显示装置1500、输入装置1600、扬声器1700、麦克风1800等等。其中，处理器1100可以是中央处理器CPU、微处理器MCU等。存储器1200例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1300例如包括USB接口、耳机接口等。通信装置1400例如能够进行有线或无线通信，具体地可以包括Wifi通信、蓝牙通信、2G/3G/4G/5G通信等。显示装置1500例如是液晶显示屏、触摸显示屏等。输入装置1600例如可以包括触摸屏、键盘、体感输入等。用户可以通过麦克风1800输入语音指令，触发音频设备1000通过处理器1100根据存储器1200中存储的可执行指令的控制，运行音频设备1000处理该语音指令，将语音指令的处理结果通过扬声器1700播放给用户。

图1所示的音频设备仅仅是说明性的并且决不意味着对本发明、其应用或使用的任何限制。应用于本发明的实施例中，音频设备1000的所述存储器1200用于存储指令，所述指令用于控制所述处理器1100进行操作以执行本发明实施例提供的任意一项交互处理方法。本领域技术人员应当理解，尽管在图1中对音频设备1000示出了多个装置，但是，本发明可以仅涉及其中的部分装置，例如，音频设备1000只涉及处理器1100和存储装置1200。技术人员可以根据本发明所公开方案设计指令。指令如何控制处理器进行操作，这是本领域公知，故在此不再详细描述。

<实施例>

在本实施例中，提供一种交互处理方法，通过音频设备实施。该音频设备是基于人工智能技术(例如智能语音技术)实现的音箱、耳机等产品，可以与用户交互提供对应的应用服务，例如接收用户的语音指令播放歌曲、购物、查询天气信息等。在一个例子中，音频设备的硬件配置可以如图1所示。

该交互处理方法，如图2所示，包括：步骤S2100-S2300。

步骤S2100，根据最近的统计周期获取的用户使用数据，确定用户使用指标。

统计周期是预先设置的、用于统计音频设备的用户使用数据的时间周期，统计周期的具体时长可以根据历史经验或者实验仿真结果设置，或者由用户自定义设置。

用户使用数据是用户在使用音频设备的过程中，与音频设备交互产生的相关数据。具体的数据内容可以根据具体的应用场景或者应用需求设置。

例如，假设用户与音频设备交互过程可以包括三个阶段：唤醒词(包括唤醒词接收)、语音指令(包括接收及处理语音指令)以及信息播放(即播放指令处理结果)，如图3所示。用户使用数据至少包括在对应的统计周期内，音频设备接收唤醒词的唤醒词时间、音频设备接收和处理语音指令的语音指令时间以及音频设备播放指令处理结果的信息播放时间。信息播放时间是用户实际得到有效信息的时间，对用户而言具有实际意义，用户需要付出唤醒词时间以及语音指令时间作为时间成本。

在实际应用中，用户发出语音指令后，音频设备接收语音指令进行处理，得到的指令处理结果可能不能满足用户的需求，用户会再次发出语音触发音频设备重新执行，如图4所示，在这种情况下，前一次指令处理结果的信息播放时间并不是用户实际得到有效信息的时间，可以将前一次指令处理结果的信息播放时间，计入前一次音频设备接收和处理语音指令的语音指令时间中，表明前一次指令处理结果的信息播放时间中，没有给予用户实际有效信息，使得统计的用户使用数据更为精准。

在本实施例中，可以通过音频设备中可支持的软件或者硬件接口，监听音频设备与用户交互的状态，获取每个统计周期的用户使用数据。

用户使用指标是根据用户使用音频设备的用户使用数据，得到的用于评价用户使用音频设备体验的指标。用户使用指标越高，意味着用户使用音频设备的体验的评价越高。用户使用指标中具体可以包括多个指标参数，具体的指标参数可以根据具体的应用场景或者应用需求设置。例如，用户使用指标可以至少包括用户有效使用率。用户有效使用率是用户有效使用音频设备的比率。

在本实施例中，通过根据用户使用音频设备的用户使用数据，确定反映用户对音频设备的实际使用体验的用户使用指标，可以结合后续步骤，以不同于语音识别率、唤醒成功率等在理想环境下测试获取的指标，从用户使用音频设备的实际体验角度，来评价音频设备的使用性能，对应采取交互改进措施来改进音频设备与用户的交互，有效提升音频设备的使用性能，实际满足用户对音频设备的真实交互需求，提升用户体验。

在一个例子中，用户使用数据至少包括在对应的统计周期内，音频设备接收唤醒词的唤醒词时间、音频设备接收和处理语音指令的语音指令时间以及音频设备播放指令处理结果的信息播放时间。唤醒词时间、语音指令时间以及信息播放时间如上文所述，不再赘述。用户使用指标至少包括用户有效使用率。根据最近的统计周期获取的用户使用数据，确定用户使用指标，可以包括：步骤S2110-S2120。

步骤S2110，根据唤醒词时间、语音指令时间以及信息播放时间，确定音频设备的有效交互时间。

音频设备的有效交互时间，是用户与音频设备发生有效交互的时间。在本例中，音频设备的有效交互时间可以是唤醒词时间、语音指令时间以及信息播放时间的总和。

步骤S2120，根据信息播放时间、有效交互时间，获取用户有效使用率。

在本例中，有效交互时间可以是唤醒词时间、语音指令时间以及信息播放时间的总和。根据信息播放时间、有效交互时间，可以通过下述公式得到用户有效使用率：

信息播放时间是用户与音频设备交互过程中，实际获取有效信息的时间，是对应用户具有实际意义的信息接收时间。有效交互时间是用户与音频设备发生有效交互的时间。通过信息播放时间以及有效交互时间来获取的用户有效使用率，可以精准地反映用户在使用音频设备过程中的有效信息获取状态，体现用户使用音频设备的实际体验。

在确定用户使用指标之后，进入：

步骤S2200，根据用户使用指标，确定对应的交互改进措施。

用户使用指标反映用户对音频设备的实际使用体验，根据用户使用指标确定对应的交互改进措施，结合后续步骤，基于交互改进措施，改进音频设备与用户的交互，有效提升音频设备的使用性能，实际满足用户对音频设备的真实交互需求，提升用户体验。

交互改进措施可以根据工程经验或者统计用户反馈结果来设置，具体内容可以包括设备自检措施、用户调查反馈措施、设备更新升级措施、设备故障自恢复措施等。设备自检措施中可以包括对音频设备中与用户交互相关的交互功能模块的自启动检测、采集相关模块状态的措施，交互功能模块可以是软件模块或者硬件模块，例如，可以是麦克风、扬声器等硬件模块或者交互相关的应用程序接口等。用户调查反馈措施是基于与用户的语音交互，采集与用户对音频设备的使用相关的反馈信息的措施，具体的反馈信息内容可以根据具体场景设置。设备更新升级措施是触发音频设备自动更新升级的措施。设备故障自恢复措施是触发音频设备自动进行故障恢复的措施。

在本实施例中，可以针对不同的用户使用指标范围，设置对应的交互改进措施，并将用户使用指标范围与交互改进措施的对应关系保存，以便确定具体的用户使用指标后，根据该对应关系，确定对应的一个或多个交互改进措施。

在一个例子中，根据用户使用指标，确定对应的交互改进措施，可以包括：步骤S2201-S2202。

步骤S2201，在用户使用指标低于预设的正常指标阈值时，获取预先设置的交互改进措施。

预设的正常指标阈值是用于根据用户使用指标是否需要触发交互改进的阈值，可以根据工程经或者历史统计结果设置。例如，可以采集历史统计周期内多个音频设备的用户使用指标计算平均指标，将该平均指标设置为正常指标阈值。

预先设置的交互改进措施可以是一个或多个。可以针对不同的用户使用指标的指标范围，预先设置一个或者多个交互改进措施，但当前统计周期获取的用户使用指标落入某个特定的指标范围时，可以直接选取对应的交互改进措施。

用户使用指标低于预设的正常指标阈值，意味着当前用户使用音频设备的实际体验已经偏离正常范围，获取预先设置的交互改进措施，可以结合后续步骤对音频设备与用户的交互进行改进，有效提升音频设备的使用性能。

步骤S2202，在用户使用指标不低于预设的正常指标阈值时，设置不获取交互改进措施。

用户使用指标不低于预设的正常指标阈值，意味着当前用户使用音频设备的实际体验没有偏离正常范围，设置不获取交互改进措施对音频设备与用户的交互进行改进，可以在确保用户体验的前提下，降低音频设备的处理资源消耗，提升处理效率。

在另一个例子中，根据用户使用指标，确定对应的交互改进措施，可以包括：步骤S221-S223。

步骤S221，获取用户使用指标，在已获取的用户群体指标集合中的分布排序值。

在本例中，用户群体指标集合中包括多个音频设备在最近的统计周期中确定的用户使用指标，可以通过与多个音频设备建立连接的后台服务器进行采集统计。

用户使用指标在用户群体指标集合中的分布排序值，可以通过对用户群体指标集合中所有用户使用指标进行排序后，将当前的用户使用指标在其中的排序值作为该分布排序值。

用户使用指标在已获取的用户群体指标集合中的分布排序值，可以精准地反映对应的用户使用音频设备的实际体验，在整个用户群体体验中的分布相对位置。

步骤S222，在分布排序值低于预设的正常分布阈值时，获取预先设置的交互改进措施。

预设的正常分布阈值是根据用户使用指标在用户群体指标集合中的分布排序值，确定是否需要触发交互改进的阈值，可以根据工程经或者历史统计结果设置。

分布排序值低于预设的正常分布阈值，意味着当前用户使用音频设备的实际体验，在整个用户群体中已经偏离正常范围，获取预先设置的交互改进措施，可以结合后续步骤对音频设备与用户的交互进行改进，有效提升音频设备的使用性能。

步骤S223，在分布排序值不低于预设的正常分布阈值时，设置不获取交互改进措施。

分布排序值不低于预设的正常分布阈值，意味着当前用户使用音频设备的实际体验，在整个用户群体中属于正常范围，设置不获取交互改进措施对音频设备与用户的交互进行改进，可以在确保用户体验的前提下，降低音频设备的处理资源消耗，提升处理效率。

根据用户使用指标，确定对应的交互改进措施，可以在音频设备本地实施，也可以将用户使用指标，发送给与音频设备通过无线或者有线建立连接的后台服务器(例如云端服务)，有后台服务器根据用户使用指标，确定对应的交互改进措施后返回给音频设备，以此节省音频设备的处理资源消耗，降低音频设备的实现复杂度。

在一个例子中，根据用户使用指标，确定对应的交互改进措施，可以包括：步骤S2210-S2230。

步骤S2210，获取当前的数据安全风险指数。

数据安全风险指数用于表征音频设备在当前交互环境中传递数据存在的风险。数据安全风险指数越高，对应的音频设备传递数据存在的风险越大。

获取数据安全风险指数，可以结合后续步骤，根据数据安全风险指数，控制音频设备是否向后台服务器发送用户使用指标，避免在不安全的环境下发送用户使用指标，带来隐私泄露风险。

在这个例子中，获取当前的数据安全风险指数，可以包括：步骤S2211-S2212。

步骤S2211，获取音频设备最近一次与用户完成语音交互的交互完成时刻，与当前时刻之间的静默时长。

用户与音频设备完成语音交互，可以是用户发送唤醒词，成功唤醒音频设备，或者，音频设备主动发出语音消息与用户交互，得到用户的语音响应等。在本例中，可以实时监测音频设备与用户的交互，实时记录每次音频设备与用户完成语音交互的时刻，以此获取音频设备最近一次与用户完成语音交互的交互完成时刻。

在交互完成时刻，音频设备最近一次与用户完成语音交互，也是最近一次音频设备获得用户关注。对应的，获取交互完成时刻与当前时刻之间的静默时长，通过静默时长可以表征用户对音频设备的用户关注度的变化。在本例中，认为音频设备的用户关注度与音频设备的数据传递风险呈反比，即音频设备的用户关注度越高，音频设备的数据传递风险越低，例如，如图5所示。

步骤S2212，根据静默时长以及预设的时长指数关系，确定数据安全风险指数。

预设的时长指数关系用于描述不同的静默时长与数据安全风险指数之间的对应关系。该预设的时长指数关系可以通过音频设备的历史使用数据提取，或者通过对音频设备构建的数据传递风险模型进行计算后获取。通过预设的时长指数关系，可以根据静默时长，确定对应的数据安全风险指数。静默时长反映用户关注度的变化，数据安全风险指数反映数据传递风险，静默时长越长，对应的数据安全风险指数越大。

例如，假设音频设备与用户交互包括唤醒词激活、(接收及处理)语音指令、信息播放(包括播放语音指令处理结果)等三个阶段，而用户交互时刻是最近一次音频设备被用户发送的唤醒词激活的时刻，假设当前时刻是用户交互时刻时，静默时长是0，对应的数据安全风险指数也是0，之后，随着当前时刻后移，静默时长增加，假设静默时长每增加10秒，对应的数据安全风险指数增加1，直至静默时长增加到10分钟后，数据安全风险指数对应增加到60时，可以保持不变，直至当前时刻后移到下一次音频设备被下一个唤醒词激活的用户交互时刻，对应的，预设的时长指数关系可以如图6所示。

根据静默时长以及预设的时长指数关系，确定数据安全风险指数，可以利用反映用户关注度变化的静默时长，以及预设的时长指数关系，精准地确定反映数据传递风险的数据安全风险指数，以便基于数据安全风险指数结合后续步骤，精准控制音频设备发送用户使用指标，避免数据发送过程中出现安全风险。

获取当前的数据安全风险指数后，进入：

步骤S2220，在数据安全风险指数属于预设的低风险指数范围时，向后台服务器发送用户使用指标，触发后台服务器返回交互改进措施。

在数据安全风险指数属于预设的低风险指数范围时，确定数据传递不存在泄露风险，对应的，向后台服务器发送用户使用指标，触发后台服务器返回交互改进措施，可以在保证不泄露用户使用指标的基础上，触发后台服务器根据当用户使用指标，返回对应的交互改进措施，无需音频设备自身进行处理，可以降低音频设备的实现复杂度。

在本例中，后台服务器可以是与音频设备通过无线或者有线网络连接的服务器，例如，云端服务器等。后台服务器根据当用户使用指标，确定对应的交互改进措施的具体方式，可以如上所述，在此不再赘述。

步骤S2230，在数据安全风险指数不属于预设的低风险指数范围时，向用户获取数据传递授权后，再向后台服务器发送用户使用指标，触发后台服务器返回交互改进措施。

在数据安全风险指数不属于预设的低风险指数范围时，意味着数据传递存在泄露的高风险，在向用户获取数据传递授权后，再向后台服务器发送用户使用指标，可以避免在用户不知情的情况下，在高风险环境中向后台服务器发送用户使用指标，带来隐私泄露的安全风险。

数据传递授权是用户允许音频设备传递数据给予的权限。在一个例子中，向用户获取数据传递授权，可以包括：步骤S2231-S2233。

步骤S2231，向用户发送数据传递申请。

数据传递申请用于向用户申请数据传递权限，在数据传递申请中可以包括用于指示音频设备请求数据传递权限的申请权限指示，数据传递申请还可以具体的应用需求包括其他内容。

例如，数据传递申请还可以包括音频设备传递数据所需的权限内容。比如，音频设备传递的数据是音频数据，对应的，音频设备传递数据所需的权限内容包括麦克风权限等；或者，音频设备传递的数据是视频数据，对应的，音频设备传递数据所需的权限内容包括摄像头权限等；或者，音频设备传递的数据是地理位置数据，对应的，音频设备传递数据所需的权限内容包括定位权限等。

在本例中，可以由音频设备通过语音交互，向用户发送数据传递申请，也可以由音频设备，向用户使用的、与音频设备建立连接的至少一个移动终端，发送数据传递申请。音频设备可以与用户使用的移动终端通过WIFI、蓝牙或者其他无线连接等方式，进行配对建立连接。移动终端可以包括手机、平板电脑等。通过向用户使用的、与音频设备建立连接的至少一个移动终端，发送数据传递申请，可以突破音频设备的语音传输范围，以时效性更高、更为安全隐秘的方式，向用户发送数据传递申请。为了提高数据交互的安全性，还可以对音频设备与移动终端之间的连接实施加密或者数据完整性保护。

向用户发从数据传递申请后，会触发用户返回对应的数据传递响应。

步骤S2232，在用户返回的数据传递响应指示允许数据传递后，触发用户进行身份验证。

在向用户发送数据传递申请后，可以通过音频设备等待用户返回对应的数据传递响应。在数据传递响应指示允许数据传递后，可以通过发出对应的语音指令，触发用户通过音频设备进行身份验证，例如，对于用户发出的声音进行声纹验证或者要求用户提供对应的语音权限密码等。

或者，通过音频设备向与其连接的移动终端发送数据传递申请后，可以等待移动终端通过与音频设备的连接，返回对应的数据传递响应。在数据传递响应指示允许数据传递后，可以通过音频设备与移动终端建立的连接，通过发出对应的指令，触发用户通过移动终端进行身份验证。身份验证的方式可以是移动终端支持的指纹识别验证、脸部识别验证、数字密码验证、语音密码验证、手势验证等。通过移动终端来实施用户身份验证，可以直接调用移动终端现有的验证模块来实施用户身份验证，相对于通过在音频设备中设置身份验证模块进行用户身份验证，无需对音频设备进行改动，实施更为简单，实现复杂度更低，更易于推广。

应当理解的是，在数据传递响应指示不允许数据传递后，可以确定用户不给予数据传递权限，获取数据传递权限失败，将不执行本实施例后续步骤，拦截本次数据传递。或者，在向多个移动终端发送数据传递申请后，未收齐所有移动终端返回的、指示允许数据传递的数据传递响应时，可以确定用户不给予数据传递权限，获取数据传递权限失败，将不执行本实施例后续步骤，拦截本次数据传递。

步骤S2233，在获取的身份验证结果指示身份验证通过后，确定获取数据传递授权。

在身份验证结果指示身份验证通过后，表示允许数据传递的用户是合法有效的用户，对应可以确定获取数据传递授权，保证获取的数据传递授权真实、有效性，提高基于数据传递授权进行数据传递的安全性。

应当理解的是，在身份验证结果指示身份验证未通过时，可以确定用户不具有给予数据传递权限的合法身份，获取数据传递权限失败，将不执行本实施例后续步骤，拦截本次数据传递。

以上已经说明了本例中的步骤S2210-S2230，通过获取当前的数据安全风险指数，根据数据安全风险指数控制向后台服务器发送用户使用指标，触发后台服务器返回对应的交互改进措施，可以在有效保证用户使用指标的传递安全性的基础上，由后台服务器来处理返回交互改进措施，无需音频设备自身进行处理，可以降低音频设备的实现复杂度。

在确定对应的交互改进措施后，进入：

步骤S2300，根据交互改进措施，向用户发出对应的交互改进提示，获取用户返回的交互改进确认，实施对应的交互改进处理。

如上文所述，交互改进措施可以根据工程经验或者统计用户反馈结果来设置，具体内容可以包括设备自检措施、用户调查反馈措施、设备更新升级措施、设备故障自恢复措施等。

在根据交互改进措施进行对应的交互改进处理前，向用户发出对应的交互处理指示，可以提示用户音频设备即将进行交互改进，在用户返回交互改进确认后，才实际进行交互改进处理，可以避免在用户不能感知的环境中实施交互改进处理，带来不可预估的安全风险。

应当理解的是，本领域技术人员，基于本实施例中，也能无需创造性地进行变形，在一些安全风险较低的环境中，为了提高处理效率，可以不向用户发出对应的交互改进提示，直接根据交互改进措施进行响应的交互改进处理。

通过根据用户使用音频设备的用户使用数据，确定反映用户对音频设备的实际使用体验的用户使用指标，可以结合后续步骤，以不同于语音识别率、唤醒成功率等在理想环境下测试获取的指标，从用户使用音频设备的实际体验角度，来评价音频设备的使用性能，

交互改进措施，是根据能反映用户对音频设备的实际使用体验的用户使用指标来确定的，根据交互改进措施实施对应的交互处理，可以从用户实际体验的角度，有效提升音频设备的使用性能，实际满足用户对音频设备的真实交互需求，提升用户体验。

<交互处理装置>

在本实施例中，还提供一种交互处理装置3000，如图7所示，包括：指标确定单元3100、措施确定单元3200、改进处理单元3300，用于实施本实施例中提供的交互处理方法，在此不再赘述。

指标确定单元3100，用于根据最近的统计周期获取的用户使用数据，确定用户使用指标。

可选地，所述用户使用数据至少包括在对应的统计周期内，所述音频设备接收唤醒词的唤醒词时间、所述音频设备接收和处理语音指令的语音指令时间以及所述音频设备播放指令处理结果的信息播放时间；所述用户使用指标至少包括用户有效使用率；所述指标确定单元还用于：

根据所述唤醒词时间、所述语音指令时间以及所述信息播放时间，确定所述音频设备的有效交互时间；

根据所述信息播放时间、所述有效交互时间，获取所述用户有效使用率。

措施确定单元3200，用于根据所述用户使用指标，确定对应的交互改进措施。

可选地，措施确定单元3200还用于：

获取当前的数据安全风险指数；

在所述数据安全风险指数属于预设的低风险指数范围时，向后台服务器发送所述用户使用指标，触发所述后台服务器返回所述交互改进措施；

在所述数据安全风险指数不属于预设的低风险指数范围时，向用户获取数据传递授权后，再向所述后台服务器发送所述用户使用指标，触发所述后台服务器返回所述交互改进措施。

可选地，获取数据安全风险指数，包括：

获取所述音频设备最近一次与用户完成语音交互的交互完成时刻，与当前时刻之间的静默时长；

根据所述静默时长以及预设的时长指数关系，确定所述数据安全风险指数；

其中，所述时长指数关系用于描述不同的所述静默时长与所述数据安全风险指数之间的对应关系。

可选地，向用户获取数据传递授权，包括：

向用户发送数据传递申请；

在用户返回的数据传递响应指示允许数据传递后，触发用户进行身份验证；

在获取的身份验证结果指示身份验证通过后，确定获取所述数据传递授权。

可选地，措施确定单元3200还用于：

在所述用户使用指标低于预设的正常指标阈值时，获取预先设置的交互改进措施；

在所述用户使用指标不低于预设的正常指标阈值时，设置不获取交互改进措施。

可选地，措施确定单元3200还用于：

获取所述用户使用指标，在已获取的用户群体指标集合中的分布排序值；

在所述分布排序值低于预设的正常分布阈值时，获取预先设置的交互改进措施；

在所述分布排序值不低于预设的正常分布阈值时，设置不获取交互改进措施。

改进处理单元3300，用于根据所述交互改进措施，向用户发出对应的交互改进提示，获取用户返回的交互改进确认，实施对应的交互改进处理。

本领域技术人员应当明白，可以通过各种方式来实现交互处理装置3000。例如，可以通过指令配置处理器来实现交互处理装置3000。例如，可以将指令存储在ROM中，并且当启动设备时，将指令从ROM读取到可编程器件中来实现交互处理装置3000。例如，可以将交互处理装置3000固化到专用器件(例如ASIC)中。可以将交互处理装置3000分成相互独立的单元，或者可以将它们合并在一起实现。交互处理装置3000可以通过上述各种实现方式中的一种来实现，或者可以通过上述各种实现方式中的两种或更多种方式的组合来实现。

在本实施例中，交互处理装置3000设置在音频设备侧，可以是设置在音频设备中的软件模块，或者是被加载在音频设备中的补丁、嵌入件等，还可以是设置在与音频设备建立连接的设备中的应用程序。在一个例子中，交互处理装置3000还可以封装成软件开发工具包形式(例如SDK)，被音频设备安装后运行。

<交互处理设备>

在本实施例中，还提供一种交互处理设备4000，如图8所示，包括：

存储器4100，用于存储可执行的指令；

处理器4200，用于根据所述可执行的指令的控制，运行所述交互处理设备4000，执行如本实施例中提供的所述的交互处理方法。

在本实施例中，交互处理设备4000可以设置在音频设备侧，可以是设置在音频设备中，也可以是与音频设备建立有线或无线连接的独立设备。

<音频设备>

在本实施例中，还提供一种音频设备5000，包括：

如图7所示的交互处理装置3000或者如图8所示的交互处理设备6000。

在本实施例中，音频设备5000的硬件配置可以如图1所示，例如，通过存储器1200存储交互处理装置3000，通过处理器1100加载交互处理装置3000，实施本实施例中的交互处理方法，或者，通过存储器1200存储可执行的指令，根据可执行的指令的控制，通过处理器1100实施本实施例中的交互处理方法。该音频设备5000可以是智能音箱、智能耳机等。

以上已经结合附图描述了本发明的实施例，根据本实施例，提供一种交互处理方法、装置、设备及音频设备，通过根据用户使用音频设备的用户使用数据，确定反映用户对音频设备的实际使用体验的用户使用指标，以不同于语音识别率、唤醒成功率等在理想环境下测试获取的指标，从用户使用音频设备的实际体验角度，来评价音频设备的使用性能，对应采取交互改进措施来改进音频设备与用户的交互，有效提升音频设备的使用性能，实际满足用户对音频设备的真实交互需求，提升用户体验。

本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质，其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身，诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如，通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备，或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令，并转发该计算机可读程序指令，以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码，所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等，以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中，通过利用计算机可读程序指令的状态信息来个性化定制电子电路，例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)，该电子电路可以执行计算机可读程序指令，从而实现本发明的各个方面。

这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解，流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合，都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器，从而生产出一种机器，使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时，产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中，这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作，从而，存储有指令的计算机可读介质则包括一个制造品，其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上，使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤，以产生计算机实现的过程，从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分，所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是，通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。

以上已经描述了本发明的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。

Claims

1.一种交互处理方法，其特征在于，通过音频设备实施，包括：

根据所述用户使用指标，确定对应的交互改进措施；

2.根据权利要求1所述的方法，其特征在于，

所述用户使用数据至少包括在对应的统计周期内，所述音频设备接收唤醒词的唤醒词时间、所述音频设备接收和处理语音指令的语音指令时间以及所述音频设备播放指令处理结果的信息播放时间；

所述用户使用指标至少包括用户有效使用率；

所述根据最近的统计周期获取的用户使用数据，确定用户使用指标，包括：

3.根据权利要求1所述的方法，其特征在于，所述根据所述用户使用指标，确定对应的交互改进措施，包括：

获取当前的数据安全风险指数；

4.根据权利要求3所述的方法，其特征在于，所述获取数据安全风险指数，包括：

5.根据权利要求3所述的方法，其特征在于，所述方法还包括向用户获取数据传递授权，包括：

向用户发送数据传递申请；

6.根据权利要求1所述的方法，其特征在于，所述根据所述用户使用指标，确定对应的交互改进措施，包括：

7.根据权利要求1所述的方法，其特征在于，所述根据所述用户使用指标，确定对应的交互改进措施的步骤包括：

8.一种交互处理装置，其特征在于，设置在音频设备侧，包括：

9.一种交互处理设备，其特征在于，包括：

存储器，用于存储可执行的指令；

处理器，用于根据所述可执行的指令的控制，运行所述交互处理设备，执行如权利要求1-7所述的任意一项交互处理方法。

10.一种音频设备，其特征在于，包括：

如权利要求8所述的交互处理装置，或者如权利要求9所述的交互处理设备。