CN117153051A

CN117153051A - 一种基于互联网实现ChatGPT语音对话的电子相框

Info

Publication number: CN117153051A
Application number: CN202311114271.5A
Authority: CN
Inventors: 曹永智; 姚立
Original assignee: Beijing Kujile Technology Co ltd
Current assignee: Beijing Kujile Technology Co ltd
Priority date: 2023-08-31
Filing date: 2023-08-31
Publication date: 2023-12-01

Abstract

本发明属于电子相框技术领域，具体涉及一种基于互联网实现ChatGPT语音对话的电子相框，包括高敏感度的Mic阵列、处理器、存储单元和网络接口，所述电子相框运行包括以下步骤：步骤1.麦克风阵列选择：选择一个高质量的麦克风阵列，其中包含多个麦克风元素，以实现远场语音捕获，确保麦克风数量和排列方式适合电子相框的设计，在选择麦克风阵列时，考虑到远场语音捕获的要求和环境噪声，确保麦克风阵列的指向性和抑制背景噪声的能力，选择适合的尺寸。该发明电子相框使用高质量的麦克风和喇叭，强大的处理器，云服务集成，多格式音频支持，智能电源管理，实现语音输入输出和ChatGPT模型调用，广泛应用于家庭、办公室和其他场所，提高了人们的生活质量。

Description

一种基于互联网实现ChatGPT语音对话的电子相框

技术领域

本发明属于电子相框技术领域，具体涉及一种基于互联网实现ChatGPT语音对话的电子相框。

背景技术

电子相框是一种智能设备，结合了传统相框和数字技术的优势，它具有显示屏幕，可以通过无线连接或存储卡展示照片和图片，同时还提供了诸如时间、日历、天气等信息显示功能，此外，一些电子相框还支持视频播放、音乐播放、闹钟提醒等功能，用户可以通过操作界面或者远程控制来管理和浏览照片、调整显示设置等，电子相框通常被放置在桌面或悬挂在墙上，用来展示个人照片、家庭照片或者作为装饰品，给人们带来更美好的回忆和视觉享受。

现有的电子相框不便于实现语音输入输出和ChatGPT模型调用，不便于用户使用，为此我们提出一种基于互联网实现ChatGPT语音对话的电子相框来解决上述问题。

发明内容

本发明的目的是提供一种基于互联网实现ChatGPT语音对话的电子相框，能够实现语音输入输出和ChatGPT模型调用，广泛应用于家庭、办公室和其他场所，提高了人们的生活质量。

本发明采取的技术方案具体如下：

一种基于互联网实现ChatGPT语音对话的电子相框，所述电子相框包括高敏感度的Mic阵列、处理器、存储单元和网络接口。

在一种优选方案中，一种基于互联网实现ChatGPT语音对话的电子相框，所述电子相框运行包括以下步骤：

步骤1.麦克风阵列选择：选择一个高质量的麦克风阵列，其中包含多个麦克风元素，以实现远场语音捕获，确保麦克风数量和排列方式适合电子相框的设计，在选择麦克风阵列时，考虑到远场语音捕获的要求和环境噪声，确保麦克风阵列的指向性和抑制背景噪声的能力，选择适合的尺寸、形状和布局；

步骤2.喇叭或扬声器选择：选择具备高保真度和广泛频率响应的喇叭或扬声器，以提供令人满意的音质，使用多通道立体声系统，以实现更加逼真的音频效果；

步骤3.主控板和处理器选型：根据ChatGPT模型的计算需求，选择强大的主控板和处理器，确保其具备足够的内存和处理性能，以便快速运行复杂的自然语言处理任务；

步骤4.连接云服务：注册并创建设备，获取与亚马逊Alexa和谷歌GoogleAssistant交互所需的设备ID和API密钥，通过设备管理控制台设置权限和功能，并配置与云服务的通信；

步骤5.音频编解码器选择：选择支持多种音频格式的编解码器，确保编解码器的性能和压缩效率，以确保高质量的语音采集和播放；

步骤6.电源管理设计：根据电子相框的功耗需求和设计要求，设计智能电源管理模块，考虑使用低功耗组件、节能模式、电池管理和供电稳定性等功能，延长设备续航时间并提高效率；

步骤7.硬件布局和集成：进行麦克风阵列、喇叭和其他硬件组件的布局和连接，确保麦克风和喇叭的位置优化，减少摩擦噪声和信号干扰，并确保物理连接可靠性和稳定性；

步骤8.软件开发与集成：使用合适的开发工具和API，编写软件代码以实现与亚马逊Alexa和谷歌GoogleAssistant的接口集成，处理语音输入和输出，实现对ChatGPT模型的调用，并与云服务进行通信和数据传输。

在一种优选方案中，一种基于互联网实现ChatGPT语音对话的电子相框，所述连接云服务注册并创建设备包括以下步骤：

步骤1.访问亚马逊开发者门户并登录开发者账号；

步骤2.在开发者控制台中，选择Alexa选项；

步骤3.创建一个新的产品，选择CreateaNewProduct；

步骤4.为设备创建一个产品名称，并选择产品类型和相关属性；

步骤5.定义设备的功能和能力，包括语音交互、音频播放，按照指引填写相关信息；

步骤6.创建成功后，获得一个设备ID和API密钥用于与亚马逊Alexa云服务通信。

在一种优选方案中，一种基于互联网实现ChatGPT语音对话的电子相框，所述连接云服务注册并创建设备还包括以下步骤：

步骤1.访问谷歌开发者控制台，并登录开发者账号；

步骤2.创建一个新项目，并为该项目命名；

步骤3.在项目设置页面中，启用GoogleAssistantAPI；

步骤4.进入Credentials页面，创建一个新的API密钥或OAuth2.0凭据，根据需求选择适当的凭据类型；

步骤5.获取生成的API密钥或OAuth2.0凭据，用于与谷歌GoogleAssistant云服务通信。

在一种优选方案中，所述多通道立体声系统包括2.0立体声、2.1立体声、5.1环绕立体声、7.1环绕立体声、DolbyAtmos。

在一种优选方案中，所述主控板包括显示控制器、存储器。

在一种优选方案中，所述处理器包括图像处理器及音频处理器。

在一种优选方案中，所述主控板还包括触摸屏控制器。

在一种优选方案中，所述主控板还包括电源管理模块。

在一种优选方案中，所述音频编解码器包括PCM、MP3、AAC。

本发明取得的技术效果为：

通过选择高敏感度的麦克风阵列和具备高保真度的喇叭或扬声器，可以实现清晰的语音输入和输出，提供令人满意的音质和听觉效果；

通过选择强大的主控板和处理器，确保设备具备足够的内存和处理性能，能够快速运行复杂的自然语言处理任务，实现高效的语音对话功能；

通过注册并创建设备，获取与亚马逊Alexa和谷歌GoogleAssistant交互所需的设备ID和API密钥，并与云服务进行通信，实现与智能助手的集成，拓展了设备的功能和能力；

选择支持多种音频格式的编解码器，确保高质量的语音采集和播放，提供更广泛的兼容性和灵活性；

通过设计智能电源管理模块，考虑功耗需求和设计要求，可以延长设备的续航时间，并提高供电的稳定性和效率；

通过优化麦克风和喇叭的位置，减少摩擦噪声和信号干扰，确保硬件连接的可靠性和稳定性，提供稳定的语音输入和输出；

通过合适的开发工具和API，实现与亚马逊Alexa和谷歌GoogleAssistant的接口集成，处理语音输入和输出，实现对ChatGPT模型的调用，并与云服务进行通信和数据传输。

附图说明

图1是本发明的一种基于互联网实现ChatGPT语音对话的电子相框的示意图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合说明书附图对本发明的具体实施方式做详细的说明。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是本发明还可以采用其他不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本发明内涵的情况下做类似推广，因此本发明不受下面公开的具体实施例的限制。

其次，此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个较佳的实施方式中”并非均指同一个实施例，也不是单独的或选择性的与其他实施例互相排斥的实施例。

再其次，本发明结合示意图进行详细描述，在详述本发明实施例时，为便于说明，表示器件结构的剖面图会不依一般比例作局部放大，而且所述示意图只是示例，其在此不应限制本发明保护的范围。此外，在实际制作中应包含长度、宽度及深度的三维空间尺寸。

实施例一

请参阅图1所示，本发明提供了一种基于互联网实现ChatGPT语音对话的电子相框，电子相框包括高敏感度的Mic阵列、处理器、存储单元和网络接口；

一种基于互联网实现ChatGPT语音对话的电子相框，电子相框运行包括以下步骤：

步骤8.软件开发与集成：使用合适的开发工具和API，编写软件代码以实现与亚马逊Alexa的接口集成，处理语音输入和输出，实现对ChatGPT模型的调用，并与云服务进行通信和数据传输；

一种基于互联网实现ChatGPT语音对话的电子相框，连接云服务注册并创建设备包括以下步骤：

步骤1.访问亚马逊开发者门户并登录开发者账号；

步骤2.在开发者控制台中，选择Alexa选项；

步骤3.创建一个新的产品，选择CreateaNewProduct；

多通道立体声系统包括2.0立体声、2.1立体声、5.1环绕立体声、7.1环绕立体声、DolbyAtmos，主控板包括显示控制器、存储器，处理器包括图像处理器及音频处理器，主控板还包括触摸屏控制器，主控板还包括电源管理模块，音频编解码器包括PCM、MP3、AAC。

实施例二

步骤8.软件开发与集成：使用合适的开发工具和API，编写软件代码以实现与谷歌GoogleAssistant的接口集成，处理语音输入和输出，实现对ChatGPT模型的调用，并与云服务进行通信和数据传输；

一种基于互联网实现ChatGPT语音对话的电子相框，连接云服务注册并创建设备还包括以下步骤：

步骤1.访问谷歌开发者控制台，并登录开发者账号；

步骤2.创建一个新项目，并为该项目命名；

步骤3.在项目设置页面中，启用GoogleAssistantAPI；

步骤5.获取生成的API密钥或OAuth2.0凭据，用于与谷歌GoogleAssistant云服务通信

ChatGPT对接技术：利用语音助手平台，电子相框制作了一个专门的skill，该skill可以直接连接到ChatGPT，并允许用户与其进行语音对话。

二次编辑功能：对话内容会自动记录，并通过内置的应用程序或email发送给用户。用户可以进行二次编辑，以满足个性化需求。

独特性：

多功能整合：该电子相框不仅仅是一个展示图片和视频的设备，还集成了语音助手和ChatGPT对话功能，为用户提供了多种互动方式。

高度个性化：用户可以选择使用Alexa或GoogleAssistant，还可以编辑和保存与ChatGPT的对话内容。

实时互动体验：利用ChatGPT的语音对话功能，用户可以实时与其进行深度互动，提高了用户体验。

二次编辑：对话内容的二次编辑功能为用户提供了更多的创造空间，使得每次的对话都可以根据个人喜好进行修改和保存。

ChatGPT在相框上的独特优势：

情境互动体验：用户可以询问关于正在展示的照片的信息，如“这张照片是什么时候拍的？”或“谁在这张照片里？”。

个性化故事讲述：电子相框可以结合ChatGPT为照片或视频提供背景故事，增强浏览体验。

实时Q&A：用户可以实时与ChatGPT进行问答，关于摄影技巧、图片来源等。

提供信息：用户可以询问天气、新闻或其他实时信息，使电子相框不仅仅是一个展示设备。

学习和适应：ChatGPT可以学习用户的偏好，随着时间的推移为用户提供更加定制化的互动体验。

本发明中，通过选择高敏感度的麦克风阵列和具备高保真度的喇叭或扬声器，可以实现清晰的语音输入和输出，提供令人满意的音质和听觉效果，通过选择强大的主控板和处理器，确保设备具备足够的内存和处理性能，能够快速运行复杂的自然语言处理任务，实现高效的语音对话功能，通过注册并创建设备，获取与亚马逊Alexa和谷歌GoogleAssistant交互所需的设备ID和API密钥，并与云服务进行通信，实现与智能助手的集成，拓展了设备的功能和能力，选择支持多种音频格式的编解码器，确保高质量的语音采集和播放，提供更广泛的兼容性和灵活性，通过设计智能电源管理模块，考虑功耗需求和设计要求，可以延长设备的续航时间，并提高供电的稳定性和效率，通过优化麦克风和喇叭的位置，减少摩擦噪声和信号干扰，确保硬件连接的可靠性和稳定性，提供稳定的语音输入和输出，通过合适的开发工具和API，实现与亚马逊Alexa和谷歌GoogleAssistant的接口集成，处理语音输入和输出，实现对ChatGPT模型的调用，并与云服务进行通信和数据传输。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以作出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。本发明中未具体描述和解释说明的结构、装置以及操作方法，如无特别说明和限定，均按照本领域的常规手段进行实施。

Claims

1.一种基于互联网实现ChatGPT语音对话的电子相框，其特征在于：所述电子相框包括高敏感度的Mic阵列、处理器、存储单元和网络接口。

2.根据权利要求1所述的一种基于互联网实现ChatGPT语音对话的电子相框，其特征在于：所述电子相框运行包括以下步骤：

3.根据权利要求2所述的一种基于互联网实现ChatGPT语音对话的电子相框，其特征在于：所述连接云服务注册并创建设备包括以下步骤：

步骤1.访问亚马逊开发者门户并登录开发者账号；

步骤2.在开发者控制台中，选择Alexa选项；

步骤3.创建一个新的产品，选择CreateaNewProduct；

4.根据权利要求2所述的一种基于互联网实现ChatGPT语音对话的电子相框，其特征在于：所述连接云服务注册并创建设备还包括以下步骤：

步骤1.访问谷歌开发者控制台，并登录开发者账号；

步骤2.创建一个新项目，并为该项目命名；

步骤3.在项目设置页面中，启用GoogleAssistantAPI；

5.根据权利要求2所述的一种基于互联网实现ChatGPT语音对话的电子相框，其特征在于：所述多通道立体声系统包括2.0立体声、2.1立体声、5.1环绕立体声、7.1环绕立体声、DolbyAtmos。

6.根据权利要求2所述的一种基于互联网实现ChatGPT语音对话的电子相框，其特征在于：所述主控板包括显示控制器、存储器。

7.根据权利要求2所述的一种基于互联网实现ChatGPT语音对话的电子相框，其特征在于：所述处理器包括图像处理器及音频处理器。

8.根据权利要求2所述的一种基于互联网实现ChatGPT语音对话的电子相框，其特征在于：所述主控板还包括触摸屏控制器。

9.根据权利要求2所述的一种基于互联网实现ChatGPT语音对话的电子相框，其特在于：所述主控板还包括电源管理模块。

10.根据权利要求2所述的一种基于互联网实现ChatGPT语音对话的电子相框，其特征在于：所述音频编解码器包括PCM、MP3、AAC。