CN110309470A

CN110309470A - 一种基于空气成像的虚拟新闻主播系统及其实现方法

Info

Publication number: CN110309470A
Application number: CN201910396513.1A
Authority: CN
Inventors: 李新福
Original assignee: Guangdong Kangyun Technology Co Ltd
Current assignee: Guangdong Kangyun Technology Co Ltd
Priority date: 2019-05-14
Filing date: 2019-05-14
Publication date: 2019-10-08
Also published as: WO2020228349A1

Abstract

本发明公开了一种基于空气成像的虚拟新闻主播系统及其实现方法，所述系统包括信号检测装置、控制装置、展示装置和播音装置，所述信号检测装置用于检测输入的信号，所述控制装置用于生成三维模型并根据输入的信号查找播报内容，然后根据所述播报内容生成音频信号，所述展示装置用于接收控制装置所生成的三维模型，然后在空气中通过空气成像的方式进行展示，所述播音装置用于播放音频信号。本发明可以通过空气成像的方式将虚拟新闻主播的三维模型展示出来，不需要借助显示屏即可将虚拟新闻主播在空气中立体展示出来，能够很好地模拟真人新闻主播的播音效果，从而极大地增强了虚拟新闻主播的使用体验。本发明广泛应用于虚拟主播技术领域。

Description

一种基于空气成像的虚拟新闻主播系统及其实现方法

技术领域

本发明涉及虚拟主播技术领域，尤其是一种基于空气成像的虚拟新闻主播系统及其实现方法。

背景技术

虚拟新闻主播是一种通过显示屏等模拟出真人的形象来播报新闻的技术。现有技术中，虚拟新闻主播是通过液晶显示屏等介质显示的，虚拟新闻主播被局限在显示屏所在的平面上，缺乏立体感，显得生硬而不够亲切。

发明内容

为了解决上述技术问题，本发明的目的在于提供一种基于空气成像的虚拟新闻主播系统及其实现方法。

一方面，本发明实施例包括一种基于空气成像的虚拟新闻主播系统，包括：

信号检测装置，用于检测输入的信号，所述输入的信号包括手势信号、体感信号、脑波信号、眼球动作信号、语音信号、触摸信号和面部表情信号中的至少一个；

控制装置，用于生成三维模型并根据输入的信号查找播报内容，然后根据所述播报内容生成音频信号；

展示装置，用于接收控制装置所生成的三维模型，然后在空气中通过空气成像的方式进行展示；

播音装置，用于接收控制装置所生成的音频信号，然后通过音频方式进行播放。

进一步地，所述控制装置中存储有本地知识库，所述本地知识库中包含的知识用于确定问题与答案之间的对应关系；所述基于空气成像的虚拟新闻主播系统还包括服务器，所述服务器用于生成新的知识并对所述控制装置存储的本地知识库进行更新，使得所述控制装置在接收到输入的信号时解析出所述输入的信号中包含的问题，并按照本地知识库、服务器和互联网的优先顺序检索与所述问题对应的答案，从而根据所述答案生成音频信号。

进一步地，所述输入的信号包括手势信号，所述控制装置包括：

手语识别单元，用于从所述手势信号中识别出手语信息；

关键词提取单元，用于从所述手语信息中提取关键词；

新闻消息检索单元，用于根据所述关键词检索并获取新闻消息；

播报内容生成单元，用于根据所述新闻消息检索单元检索到的新闻消息生成播报内容；

三维模型生成单元，用于生成三维模型；

音频信号生成单元，用于根据所述播报内容生成音频信号。

进一步地，所述输入的信号包括面部表情信号，所述控制装置包括：

面部表情识别单元，用于获取所述面部表情并识别所述面部表情对应的情感状态；所述情感状态包括严肃、喜悦、哀伤、激动；

新闻消息检索单元，用于根据所述情感状态检索并获取新闻消息；

三维模型生成单元，用于生成三维模型；

音频信号生成单元，用于根据所述播报内容生成音频信号。

进一步地，所述新闻消息检索单元具体用于：

当所述情感状态为严肃时，检索并获取政治经济类新闻消息；

当所述情感状态为喜悦时，检索并获取民生类新闻消息；

当所述情感状态为哀伤时，检索并获取娱乐类新闻消息；

当所述情感状态为激动时，检索并获取人文类新闻消息。

另一方面，本发明实施例还包括一种基于空气成像的虚拟新闻主播实现方法，包括以下步骤：

检测输入的信号，所述输入的信号包括手势信号、体感信号、脑波信号、眼球动作信号、语音信号、触摸信号和面部表情信号中的至少一个；

生成三维模型并根据输入的信号查找播报内容，然后根据所述播报内容生成音频信号；

接收控制装置所生成的三维模型，然后在空气中通过空气成像的方式进行展示；

接收控制装置所生成的音频信号，然后通过音频方式进行播放。

进一步地，所述基于空气成像的虚拟新闻主播实现方法还包括以下步骤：

生成新的知识并更新本地知识库；所述知识用于确定问题与答案之间的对应关系；

在接收到输入的信号时解析出所述输入的信号中包含的问题；

按照本地知识库、服务器和互联网的优先顺序检索与所述问题对应的答案；

根据所述答案生成音频信号。

进一步地，所述输入的信号包括手势信号，所述生成三维模型并根据输入的信号查找播报内容，然后根据所述播报内容生成音频信号这一步骤具体包括：

从所述手势信号中识别出手语信息；

从所述手语信息中提取关键词；

根据所述关键词检索并获取新闻消息；

根据所述新闻消息检索单元检索到的新闻消息生成播报内容；

根据所述播报内容生成三维模型；

根据所述播报内容生成音频信号。

进一步地，所述输入的信号包括面部表情信号，所述生成三维模型并根据输入的信号查找播报内容，然后根据所述播报内容生成音频信号这一步骤具体包括：

获取所述面部表情并识别所述面部表情对应的情感状态；所述情感状态包括严肃、喜悦、哀伤、激动；

根据所述情感状态检索并获取新闻消息；

根据所述播报内容生成三维模型；

根据所述播报内容生成音频信号。

进一步地，所述根据所述情感状态检索并获取新闻消息这一步骤具体包括：

当所述情感状态为喜悦时，检索并获取民生类新闻消息；

当所述情感状态为哀伤时，检索并获取娱乐类新闻消息；

当所述情感状态为激动时，检索并获取人文类新闻消息。

本发明的有益效果是：本发明实施例中的虚拟新闻主播系统及其实现方法可以通过空气成像的方式将虚拟新闻主播的三维模型展示出来，不需要借助显示屏即可将虚拟新闻主播在空气中立体展示出来，可以带来巨大的视觉震撼体验，并且虚拟新闻主播的嘴型、眼部动作和面部表情等可以配合播音装置所播放的新闻消息进行动作，具有强烈的真实感，能够很好地模拟真人新闻主播的播音效果，从而极大地增强了虚拟新闻主播的使用体验。

附图说明

图1为本发明方法虚拟新闻主播系统的一个具体实施方式的结构框图；

图2为本发明方法虚拟新闻主播系统的另一个具体实施方式的结构框图；

图3为本发明方法虚拟新闻主播实现方法的一个具体实施方式的流程图。

具体实施方式

实施例1

本实施例中一种基于空气成像的虚拟新闻主播系统，参照图1或图2，包括：

本实施例中，参照图1或图2，所述信号检测装置包括：

体感传感器，用于获取输入的体感信号；

手势传感器，用于获取输入的手势信号；

眼球跟踪器，用于获取输入的眼球动作信号；

触摸模块，用于获取输入的触摸信号；

语音采集模块，用于获取输入的语音信号；

脑波采集装置，用于获取输入的脑波信号；

摄像头，用于获取输入的图像信号，从而识别使用者的面部表情。

本实施例中的控制装置是一个具有数据存储能力和处理能力的装置，例如，可以使用个人计算机作为本实施例中的控制装置。所述控制装置连接到互联网，并可以在互联网上检索所要获得的资源。

使用者可以通过发出体感、做出手势、进行眼球动作、触摸、发出语音、发出脑波和做出面部表情等动作来与虚拟新闻主播系统进行互动。

所述控制装置用于生成三维模型并根据输入的信号查找播报内容，然后根据所述播报内容生成音频信号。所述播报内容是指能够传递时事新闻消息的多媒体内容，例如一段由新闻通讯社发布的新闻稿。控制装置根据播报内容的文字信息转换得到音频信号，该音频信号可以驱动播音装置发出音效，从而读出播报内容。控制装置根据播报内容的文字信息转换得到三维模型，所述三维模型可以表现为一个男性或女性的人类播音员形象，也可以表现为猫、狗、牛、鸡等卡通形象，所述三维模型是可变的，主要是三维模型的嘴型、眼部动作和面部表情等与音频信号同步变化，使得三维模型的嘴型、眼部动作和面部表情等与音频信号发出的音效对应的文字可以匹配起来。

本实施例中的展示装置是空气成像仪。参照图1或图2，所述展示装置包括驱动单元和投影单元。所述驱动单元用于接收控制装置所生成的三维模型，所述投影单元用于在所述驱动单元的驱动下对空气进行投影从而展示所述三维模型。所述驱动单元上安装有相应的解码程序和驱动程序，所述解码程序用于对接收到的控制装置所生成的三维模型进行解码，所述驱动程序根据解码的结果驱动投影单元对空气进行投影从而展示所述三维模型。

本实施例中的播音装置可以是音响。参照图1或图2，所述播音装置包括功放单元和扬声器。所述功放单元用于接收控制装置所生成的音频信号并进行放大，所述扬声器用于在所述功放单元的驱动下发出相应的音效。所述功放单元上安装有相应的解码电路、放大电路和降噪电路，所述解码电路用于对接收到的控制装置所生成的音频信号进行解码，所述放大电路对解码的结果进行放大，所述降噪电路用于降低放大电路工作过程中的噪音。

本实施例中的虚拟新闻主播系统可以通过空气成像的方式将虚拟新闻主播的三维模型展示出来，所展示的虚拟新闻主播是立体的，并且虚拟新闻主播的嘴型、眼部动作和面部表情等可以配合播音装置所播放的新闻消息进行动作，具有强烈的真实感，能够很好地模拟真人新闻主播的播音效果，从而极大地增强了虚拟新闻主播的使用体验。

进一步地，所述控制装置中存储有本地知识库，所述本地知识库中包含的知识用于确定各种问题和答案的对应关系，使得可以根据问题查找到相应的答案。参照图1和图2，所述基于空气成像的虚拟新闻主播系统还包括服务器，所述服务器用于通过AI程序的训练和学习生成新的知识并更新本地知识库，该本地知识库存储在控制装置中。所述控制装置在接收到输入的信号时，通过语音识别程序解析出所述输入的信号中包含的问题，并按照本地知识库、服务器和互联网的优先顺序检索与所述问题对应的答案，从而根据所述答案生成音频信号。也就是说，所述控制装置首先在本地知识库中进行检索，如果在本地知识库中检索到答案，就将从本地知识库中检索到的答案生成音频信号；如果没有在本地知识库中检索到答案，就从服务器所存储的知识库中进行检索，如果在服务器所存储的知识库中检索到答案，就将从服务器所存储知识库中检索到的答案生成音频信号；如果没有在服务器所存储的知识库中检索到答案，连接到百度等搜索引擎进行检索，使得虚拟新闻主播系统可以检索到匹配的答案，实现对用户所提问题的智能解答。

进一步作为优选的实施方式，所述输入的信号包括语音信号，所述控制装置包括：

语音识别单元，用于从所述手势信号中识别出语音信息；

关键词提取单元，用于从所述语音信息中提取关键词；

三维模型生成单元，用于生成三维模型；

音频信号生成单元，用于根据所述播报内容生成音频信号。

所述语音识别单元、关键词提取单元、新闻消息检索单元、播报内容生成单元、三维模型生成单元和音频信号生成单元是控制装置内所安装的具有相应功能的软件模块。其中，所述语音识别单元具有一个语音识别程序，可以识别所述手势信号所包含的内容，例如一些语音识别程序可以将手势信号转换成文字。所述关键词提取单元可以从所述语音信号的内容中提取关键词。所述新闻消息检索单元连接到互联网上的新闻搜索引擎，利用关键词提取单元提取到的关键词进行检索，并获取新闻搜索引擎返回的新闻消息。所述播报内容生成单元通过删除商业广告以及其他无关消息、重新整理顺序和提取关键段落等手段对新闻消息进行处理，从而生成播报内容。所述三维模型生成单元是一个三维建模程序，可以生成一个表现为男性或女性的人类播音员形象或表现为猫、狗、牛、鸡等卡通形象的三维模型，该三维模型的嘴型、眼部动作和面部表情等随着播报内容中按时序进行播放时每个文字的发音而变化。所述音频信号生成单元是一个包含一个文字-语音转换程序，可以将各文字转换得到相应的音频信号。

通过语音识别单元、关键词提取单元、新闻消息检索单元、播报内容生成单元、三维模型生成单元和音频信号生成单元，所述控制装置可以识别语音信号，并从互联网上检索得到相应的新闻消息。使用者可以语音与虚拟新闻主播进行互动，获取想要的新闻消息。

进一步作为优选的实施方式，所述输入的信号包括手势信号，参照图1，所述控制装置包括：

手语识别单元，用于从所述手势信号中识别出手语信息；

关键词提取单元，用于从所述手语信息中提取关键词；

三维模型生成单元，用于生成三维模型；

音频信号生成单元，用于根据所述播报内容生成音频信号。

所述手语识别单元、关键词提取单元、新闻消息检索单元、播报内容生成单元、三维模型生成单元和音频信号生成单元是控制装置内所安装的具有相应功能的软件模块。其中，所述手语识别单元具有一个手语识别程序，可以识别所述手势信号所包含的内容，例如一些手语识别程序可以将手势信号转换成文字。所述关键词提取单元可以从所述手语信号的内容中提取关键词。所述新闻消息检索单元连接到互联网上的新闻搜索引擎，利用关键词提取单元提取到的关键词进行检索，并获取新闻搜索引擎返回的新闻消息。所述播报内容生成单元通过删除商业广告以及其他无关消息、重新整理顺序和提取关键段落等手段对新闻消息进行处理，从而生成播报内容。所述三维模型生成单元是一个三维建模程序，可以生成一个表现为男性或女性的人类播音员形象或表现为猫、狗、牛、鸡等卡通形象的三维模型，该三维模型的嘴型、眼部动作和面部表情等随着播报内容中按时序进行播放时每个文字的发音而变化。所述音频信号生成单元是一个包含一个文字-语音转换程序，可以将各文字转换得到相应的音频信号。

通过手语识别单元、关键词提取单元、新闻消息检索单元、播报内容生成单元、三维模型生成单元和音频信号生成单元，所述控制装置可以识别手语信号，并从互联网上检索得到相应的新闻消息。本实施例中的虚拟新闻主播系统对发音存在困难的人士非常友好，他们只需要对虚拟新闻主播系统做出手语手势，虚拟新闻主播系统就可以识别出手语信号，并从互联网上检索得到相应的新闻消息，使得发音存在困难的人士也可以享受到本发明虚拟新闻主播系统带来的便利。

进一步作为优选的实施方式，参照图2，所述输入的信号包括面部表情信号，所述控制装置包括：

三维模型生成单元，用于生成三维模型；

音频信号生成单元，用于根据所述播报内容生成音频信号。

所述面部表情识别单元、新闻消息检索单元、播报内容生成单元、三维模型生成单元和音频信号生成单元是控制装置内所安装的具有相应功能的软件模块。

其中，所述面部表情识别单元具有一个面部表情识别程序，可以识别使用者人脸表情当前对应的严肃、喜悦、哀伤、激动等情感状态。所述新闻消息检索单元连接到互联网上的新闻搜索引擎，根据使用者的情感状态来检索相应分类的新闻消息，并获取新闻搜索引擎返回的新闻消息。所述播报内容生成单元通过删除商业广告以及其他无关消息、重新整理顺序和提取关键段落等手段对新闻消息进行处理，从而生成播报内容。所述三维模型生成单元是一个三维建模程序，可以生成一个表现为男性或女性的人类播音员形象或表现为猫、狗、牛、鸡等卡通形象的三维模型，该三维模型的嘴型、眼部动作和面部表情等随着播报内容中按时序进行播放时每个文字的发音而变化。所述音频信号生成单元是一个包含一个文字-语音转换程序，可以将各文字转换得到相应的音频信号。

进一步作为优选的实施方式，所述新闻消息检索单元具体用于：

当所述情感状态为喜悦时，检索并获取民生类新闻消息；

当所述情感状态为哀伤时，检索并获取娱乐类新闻消息；

当所述情感状态为激动时，检索并获取人文类新闻消息。

当使用者的面部表情反映出使用者的情感状态为严肃时，表明使用者当前比较理智，如果收听收看政治经济类新闻消息将会获得更好的效果；当使用者的面部表情反映出使用者的情感状态为喜悦时，表明使用者当前比较感性，如果收听收看民生类新闻消息将会获得更热爱生活的效果；当使用者的面部表情反映出使用者的情感状态为哀伤时，表明使用者需要接受精神治疗，如果收听收看娱乐类新闻消息将会获得更好的治疗效果，所述娱乐类新闻消息包括跟电视剧、电影、明星和搞笑有关的新闻消息；当使用者的面部表情反映出使用者的情感状态为激动时，表明使用者需要快速平静下来，此时可以让使用者观看与历史、艺术和社会有关的人文类新闻消息。

通过对新闻消息检索单元进行上述设置，本实施例中的虚拟新闻主播系统可以针对使用者的不同情感状态主动推送不同类型的新闻消息，从而提供更好的新闻体验。

进一步作为优选的实施方式，参照图1或图2，所述控制装置还包括：

人工智能单元，用于使用人工智能对所述三维模型生成单元生成的三维模型进行训练。

所述人工智能单元通过卷积神经网络等工具对三维模型进行训练，可以使得三维模型的嘴型、眼部动作和面部表情等更加自然，并且可以为三维模型更改不同的服装、穿戴和妆容等造型，提供更好和更真实的新闻体验。

实施例2

本实施例一种基于空气成像的虚拟新闻主播实现方法，参照图3，包括以下步骤：

S1.检测输入的信号，所述输入的信号包括手势信号、体感信号、脑波信号、眼球动作信号、语音信号、触摸信号和面部表情信号中的至少一个；

S2.生成三维模型并根据输入的信号查找播报内容，然后根据所述播报内容生成音频信号；

S3.接收控制装置所生成的三维模型，然后在空气中通过空气成像的方式进行展示；

S4.接收控制装置所生成的音频信号，然后通过音频方式进行播放。

进一步作为优选的实施方式，所述基于空气成像的虚拟新闻主播实现方法还包括以下步骤：

S5.生成知识并更新本地知识库；所述知识用于确定问题与答案之间的对应关系；

S6.在接收到输入的信号时解析出所述输入的信号中包含的问题；

S7.按照本地知识库、服务器和互联网的优先顺序检索与所述问题对应的答案；

S8.根据所述答案生成音频信号。

所述步骤S5-S8可以通过服务器来执行。所述服务器用于通过AI程序的训练和学习生成新的知识并更新本地知识库，该本地知识库存储在控制装置中。所述控制装置在接收到输入的信号时，通过语音识别程序解析出所述输入的信号中包含的问题，并按照本地知识库、服务器和互联网的优先顺序检索与所述问题对应的答案，从而根据所述答案生成音频信号。也就是说，所述控制装置首先在本地知识库中进行检索，如果在本地知识库中检索到答案，就将从本地知识库中检索到的答案生成音频信号；如果没有在本地知识库中检索到答案，就从服务器所存储的知识库中进行检索，如果在服务器所存储的知识库中检索到答案，就将从服务器所存储知识库中检索到的答案生成音频信号；如果没有在服务器所存储的知识库中检索到答案，连接到百度等搜索引擎进行检索，使得虚拟新闻主播系统可以检索到匹配的答案，实现对用户所提问题的智能解答。

进一步作为优选的实施方式，所述输入的信号包括手势信号，所述生成三维模型并根据输入的信号查找播报内容，然后根据所述播报内容生成音频信号这一步骤，即步骤S2，具体包括：

S201A.从所述手势信号中识别出手语信息；

S202A.从所述手语信息中提取关键词；

S203A.根据所述关键词检索并获取新闻消息；

S204A.根据所述新闻消息检索单元检索到的新闻消息生成播报内容；

S205A.根据所述播报内容生成三维模型；

S206A.根据所述播报内容生成音频信号。

进一步作为优选的实施方式，所述输入的信号包括面部表情信号，所述生成三维模型并根据输入的信号查找播报内容，然后根据所述播报内容生成音频信号这一步骤，即步骤S2，具体包括：

S201B.获取所述面部表情并识别所述面部表情对应的情感状态；所述情感状态包括严肃、喜悦、哀伤、激动；

S202B.根据所述情感状态检索并获取新闻消息；

S203B.根据所述新闻消息检索单元检索到的新闻消息生成播报内容；

S204B.根据所述播报内容生成三维模型；

S205B.根据所述播报内容生成音频信号。

进一步作为优选的实施方式，所述根据所述情感状态检索并获取新闻消息这一步骤，即步骤S202B，具体包括：

S20201.当所述情感状态为严肃时，检索并获取政治经济类新闻消息；

S20202.当所述情感状态为喜悦时，检索并获取民生类新闻消息；

S20203.当所述情感状态为哀伤时，检索并获取娱乐类新闻消息；

S20204.当所述情感状态为激动时，检索并获取人文类新闻消息。

进一步作为优选的实施方式，所述生成三维模型并根据输入的信号查找播报内容，然后根据所述播报内容生成音频信号这一步骤，即步骤S2，具体还包括：

S207.使用人工智能对所述三维模型生成单元生成的三维模型进行训练。

本实施例中的各步骤，可以使用实施例1中的各相应装置或单元来实现，可以取得与实施例1相同的有益效果。由于实施例1中各装置或单元就是使用本实施例中的各步骤来实现相应的功能的，因此实施例1中已对本实施例中的各步骤进行了详细说明，本实施例中不再赘述。

应当认识到，本发明的实施例可以由计算机硬件、硬件和软件的组合、或者通过存储在非暂时性计算机可读存储器中的计算机指令来实现或实施。所述方法可以使用标准编程技术-包括配置有计算机程序的非暂时性计算机可读存储介质在计算机程序中实现，其中如此配置的存储介质使得计算机以特定和预定义的方式操作——根据在具体实施例中描述的方法和附图。每个程序可以以高级过程或面向对象的编程语言来实现以与计算机系统通信。然而，若需要，该程序可以以汇编或机器语言实现。在任何情况下，该语言可以是编译或解释的语言。此外，为此目的该程序能够在编程的专用集成电路上运行。

此外，可按任何合适的顺序来执行本文描述的过程的操作，除非本文另外指示或以其他方式明显地与上下文矛盾。本文描述的过程(或变型和/或其组合)可在配置有可执行指令的一个或多个计算机系统的控制下执行，并且可作为共同地在一个或多个处理器上执行的代码(例如，可执行指令、一个或多个计算机程序或一个或多个应用)、由硬件或其组合来实现。所述计算机程序包括可由一个或多个处理器执行的多个指令。

进一步，所述方法可以在可操作地连接至合适的任何类型的计算平台中实现，包括但不限于个人电脑、迷你计算机、主框架、工作站、网络或分布式计算环境、单独的或集成的计算机平台、或者与带电粒子工具或其它成像装置通信等等。本发明的各方面可以以存储在非暂时性存储介质或设备上的机器可读代码来实现，无论是可移动的还是集成至计算平台，如硬盘、光学读取和/或写入存储介质、RAM、ROM等，使得其可由可编程计算机读取，当存储介质或设备由计算机读取时可用于配置和操作计算机以执行在此所描述的过程。此外，机器可读代码，或其部分可以通过有线或无线网络传输。当此类媒体包括结合微处理器或其他数据处理器实现上文所述步骤的指令或程序时，本文所述的发明包括这些和其他不同类型的非暂时性计算机可读存储介质。当根据本发明所述的方法和技术编程时，本发明还包括计算机本身。

计算机程序能够应用于输入数据以执行本文所述的功能，从而转换输入数据以生成存储至非易失性存储器的输出数据。输出信息还可以应用于一个或多个输出设备如显示器。在本发明优选的实施例中，转换的数据表示物理和有形的对象，包括显示器上产生的物理和有形对象的特定视觉描绘。

以上是对本发明的较佳实施进行了具体说明，但对本发明创造并不限于所述实施例，熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换，这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims

1.一种基于空气成像的虚拟新闻主播系统，其特征在于，包括：

2.根据权利要求1所述的一种基于空气成像的虚拟新闻主播系统，其特征在于，所述控制装置中存储有本地知识库，所述本地知识库中包含的知识用于确定问题与答案之间的对应关系；所述基于空气成像的虚拟新闻主播系统还包括服务器，所述服务器用于生成新的知识并对所述控制装置存储的本地知识库进行更新，使得所述控制装置在接收到输入的信号时解析出所述输入的信号中包含的问题，并按照本地知识库、服务器和互联网的优先顺序检索与所述问题对应的答案，从而根据所述答案生成音频信号。

3.根据权利要求1所述的一种基于空气成像的虚拟新闻主播系统，其特征在于，所述输入的信号包括手势信号，所述控制装置包括：

手语识别单元，用于从所述手势信号中识别出手语信息；

关键词提取单元，用于从所述手语信息中提取关键词；

三维模型生成单元，用于生成三维模型；

音频信号生成单元，用于根据所述播报内容生成音频信号。

4.根据权利要求1所述的一种基于空气成像的虚拟新闻主播系统，其特征在于，所述输入的信号包括面部表情信号，所述控制装置包括：

三维模型生成单元，用于生成三维模型；

音频信号生成单元，用于根据所述播报内容生成音频信号。

5.根据权利要求4所述的一种基于空气成像的虚拟新闻主播系统，其特征在于，所述新闻消息检索单元具体用于：

当所述情感状态为喜悦时，检索并获取民生类新闻消息；

当所述情感状态为哀伤时，检索并获取娱乐类新闻消息；

当所述情感状态为激动时，检索并获取人文类新闻消息。

6.一种基于空气成像的虚拟新闻主播实现方法，其特征在于，包括以下步骤：

7.根据权利要求6所述的一种基于空气成像的虚拟新闻主播实现方法，其特征在于，还包括以下步骤：

根据所述答案生成音频信号。

8.根据权利要求6所述的一种基于空气成像的虚拟新闻主播实现方法，其特征在于，所述输入的信号包括手势信号，所述生成三维模型并根据输入的信号查找播报内容，然后根据所述播报内容生成音频信号这一步骤具体包括：

从所述手势信号中识别出手语信息；

从所述手语信息中提取关键词；

根据所述关键词检索并获取新闻消息；

根据所述播报内容生成三维模型；

根据所述播报内容生成音频信号。

9.根据权利要求6所述的一种基于空气成像的虚拟新闻主播实现方法，其特征在于，所述输入的信号包括面部表情信号，所述生成三维模型并根据输入的信号查找播报内容，然后根据所述播报内容生成音频信号这一步骤具体包括：

根据所述情感状态检索并获取新闻消息；

根据所述播报内容生成三维模型；

根据所述播报内容生成音频信号。

10.根据权利要求9所述的一种基于空气成像的虚拟新闻主播实现方法，其特征在于，所述根据所述情感状态检索并获取新闻消息这一步骤具体包括：

当所述情感状态为喜悦时，检索并获取民生类新闻消息；

当所述情感状态为哀伤时，检索并获取娱乐类新闻消息；

当所述情感状态为激动时，检索并获取人文类新闻消息。