CN106502938B - 用于实现图像和语音交互的方法和装置 - Google Patents

用于实现图像和语音交互的方法和装置 Download PDF

Info

Publication number
CN106502938B
CN106502938B CN201510567978.0A CN201510567978A CN106502938B CN 106502938 B CN106502938 B CN 106502938B CN 201510567978 A CN201510567978 A CN 201510567978A CN 106502938 B CN106502938 B CN 106502938B
Authority
CN
China
Prior art keywords
audio
module
image
image information
transmission
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510567978.0A
Other languages
English (en)
Other versions
CN106502938A (zh
Inventor
赵晨
张彦福
张运龙
赵思聪
李磊
李领昌
顾嘉唯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510567978.0A priority Critical patent/CN106502938B/zh
Publication of CN106502938A publication Critical patent/CN106502938A/zh
Application granted granted Critical
Publication of CN106502938B publication Critical patent/CN106502938B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/72409User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality by interfacing with external accessories

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

本申请公开了用于实现图像和语音交互的方法和装置。所述装置的一具体实施方式包括:摄像头模块、音频模块、核心控制模块、传输模块;所述摄像头模块,用于提供图像信息采集操作;所述音频模块,用于提供音频信息采集和语音播放操作;所述核心控制模块,与所述摄像头模块和所述音频模块相连,用于将采集到的图像信息进行优化操作,并控制所述图像信息和所述音频信息的传输;所述传输模块,连接电子设备和所述核心控制模块,用于实现所述传输操作。该实施方式实现了对信号的实时处理和识别功能,并能够及时反馈给客户。

Description

用于实现图像和语音交互的方法和装置
技术领域
本申请涉及通信技术领域,具体涉及信号传输领域,尤其涉及用于实现图像和语音交互的方法和装置。
背景技术
随着科学技术的发展,多媒体应用日益广泛,数据存储容量不断增大,传输速率的要求也在不断提高。为了满足PDA(Personal Digital Assistant,个人数字助理)、移动电话、数码相机、打印机等电子设备与PC(Personal Computer,个人电脑)机之间的连接,或者在电子设备之间实现高速数据传输的要求,越来越多的电子产品具有USB2.0和USB(Universal Serial Bus,通用串行总线)OTG(On The Go)功能。
USB OTG规范由USB-IF(USB Implementers Forum,USB实施者论坛)制定,在完全兼容USB2.0标准的基础上,允许电子设备既可作为USB主设备工作,又可作为USB从设备工作,并可提供一定的检测能力。USB OTG使USB设备摆脱了原来主从架构的限制,实现了端对端的传输模式,拓展了USB的应用领域。
目前,采用上述现有技术的录音录像产品,其自身都是独立的硬件设备,在与其他设备的连接方式上主要是采用WIFI或者蓝牙进行连接。由此造成了只能输入采集到的图像和音频,而无法进行实时信号的处理和识别功能,且不能给用户反馈信息。
发明内容
本申请的目的在于提出一种用于实现图像和语音交互的方法和装置,来解决以上背景技术部分提到的技术问题。
第一方面,本申请提供了一种用于实现图像和语音交互的装置,上述装置包括:摄像头模块、音频模块、核心控制模块、传输模块;上述摄像头模块,用于提供图像信息采集操作;上述音频模块,用于提供音频信息采集和语音播放操作;上述核心控制模块,与上述摄像头模块和上述音频模块相连,用于将采集到的图像信息进行优化操作,并控制上述图像信息和上述音频信息的传输;上述传输模块,连接电子设备和上述核心控制模块,用于实现上述传输操作。
在一些实施例中,上述音频模块包括:音频编解码器、麦克风和耳机。
在一些实施例中,上述核心控制模块包括:微控制单元和图像信号处理单元。
在一些实施例中,上述传输模块包括:USB OTG传输线和按键。
在一些实施例中,上述电子设备用于将上述图像信息和上述音频信息进行存储和播放。
在一些实施例中,上述电子设备用于将上述图像信息和上述音频信息发送到网络。
第二方面,本申请提供了一种用于实现图像和语音交互的方法,上述方法包括:通过摄像头实现图像信息采集操作;通过音频模块实现音频信息采集和语音播放操作;对于采集到的图像信息实现优化操作,并控制上述图像信息和上述音频信息的传输;在电子设备和核心控制模块之间实现传输操作。
在一些实施例中,上述图像信息采集包括:利用图像信号处理器对图像进行优化调整,并通过USB OTG传输线进行传输。
在一些实施例中,上述音频信息采集包括:利用语音编码器对音频进行编码,并通过USB OTG传输线进行传输。
在一些实施例中,电子设备对上述图像信息和上述音频信息进行存储和播放。
在一些实施例中,电子设备将上述图像信息和上述音频信息发送到网络。
本申请提供的用于实现图像和语音交互的方法和装置,通过摄像头实现图像信息采集操作以便对图像进行优化调整,再通过音频模块实现音频信息采集和语音播放操作以便对音频进行编码,最后控制上述图像信息和上述音频信息的传输以便实现电子设备和核心控制模块之间的信息传递。从而实现了对信号的实时处理和识别功能,并能够及时反馈给客户。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性系统架构图;
图2是根据本申请的用于图像和语音交互方法的一个实施例的流程图;
图3是根据本申请的通过USB模块实现主机模式和设备模式判断的模块示意图;
图4是根据本申请的用于图像和语音交互装置的一个实施例的流程图;
图5是适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的图像和语音交互装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括摄像头模块101,音频模块102、核心控制模块103、传输模块104和电子设备105。
在本实施例中,用户可以使用摄像头模块101采集图像,由ISP(Image SignalProcessor,图像处理器)对图像进行优化调整,然后经由传输模块104传送到电子设备105,电子设备105接到图片后通过本地或者经上传到服务器后进行图像识别,最后把识别结果通过音频模块102以语音的形式播放出来。
在本实施例中,用户可以使用音频模块102采集音频,由语音编解码器对音频进行编码,然后经由传输模块104传送到电子设备105,电子设备105接收到音频信号后通过本地或者经上传到服务器后进行语音识别,最后根据识别结果执行相应的操作,同时使用耳机播报相应的语音信息。
在本实施例中,用户可以通过摄像头模块101连续采集图像,同时通过麦克风采集音频,由图像处理器和语音编解码器对图像音频分别进行处理,然后经由传输模块104传送到电子设备105,继而由电子设备105通过WIFI或者3G/4G通信网络传送到远程协助端,远程协助端根据接收到的视频语音信息进行实时处理,处理结果通过耳机传送给用户。
在本实施例中,用户可以通过摄像头模块101连续采集图像,同时通过麦克风采集音频,由图像信号处理器和语音编解码器对图像音频分别进行处理,然后经由传输模块104传送到电子设备105存储器存储起来,录制结束后可以在电子设备105上播放,或者上传到网络与朋友共享。
电子设备105可以是具有显示屏并且支持图像和音频操作的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts GroupAudio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture ExpertsGroup Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器可以是提供各种服务的服务器,例如对电子设备105上接收的图像和音频信息提供支持的后台服务器。后台服务器可以对接收到的图像和音频请求等数据进行分析和识别等处理,并将处理结果(例如识别结果)以图像或语音形式反馈给用户。
需要说明的是,本申请实施例所提供的图像和语音交互方法一般由服务器执行,相应地,识别结果分析处理装置一般设置于服务器中。
需要指出的是,上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。
应该理解,图1中的电子设备105、传输模块104和核心控制模块103等的数目仅仅是示意性的。根据实现需要,可以具有任意数目的电子设备105、传输模块104和核心控制模块103等。
继续参考图2,示出了根据本申请的图像和语音交互方法的一个实施例的流程200。所述的交互方法,包括以下步骤:
步骤201,通过摄像头实现图像信息采集操作。
在本实施例中,图像采集方法运行于其上的摄像头(例如图1所示的摄像头模块),可以通过图像处理器从摄像头接收图像信息,其中,上述图像处理器设置于核心控制模块中。
通常,图像处理器将图像进行优化调整并压缩成MJPEG(Motion JointPhotographic Experts Group,技术即运动静止图像(或逐帧)压缩技术)格式,然后经由USB OTG传输线传到电子设备,电子设备端读取USB底层信息包并将其重新组合成MJPEG帧信息数据。MJPEG信息数据经由解码器解码并转换成为电子设备常用的RGB格式信息然后传递到上层应用层,并同时发送至GPU(Graphics Processing Unit,图形处理器)以供屏幕预览使用。在用户触发识别时,手机开启摄像头,并截取一帧RGB图像,重新压缩之后以JPEG格式由本地或者上传到服务器进行图像识别。识别结果以文本格式传递到电子设备应用层的程序中,该程序最终把文本结果通过Text-To-Speech(人机对话)功能转化为语音信号并播报出来。
需要说明的是,TTS(Text To Speech,人机对话)是语音合成应用的一种,它将储存于电脑中的文件,如帮助文件或者网页,转换成自然语音输出。该技术可以帮助有视觉障碍的人阅读计算机上的信息,或者只是简单的用来增加文本文档的可读性。TTL应用包括语音驱动的邮件以及音频敏感系统且经常与音频识别程序一起使用。
步骤202,通过音频模块实现音频信息采集和语音播放操作。
在本实施例中,音频采集方法运行于上述麦克风(例如图1所示的音频模块),可以通过麦克风采集音频,并利用语音编解码器对音频进行放大和消噪处理。
在本实施例的一些可选的实现方式中,通过麦克风采集音频,由语音编解码器对音频信号进行放大和编码,编码结果通过信号线传递到MCU(Microcontroller Unit,微控制单元)中,然后经由USB数据线与图像信息数据一起传到电子设备端。电子设备在本地或者上传到服务器进行语音识别,最后根据识别结果执行相应的操作,同时用耳机播报响应的语音信息。语音部分的硬件电路在电子设备端可被识别为标准USB Audio Class(USB音频类)设备,电子设备的操作系统可直接通过该设备播放音频、音乐和采集音频信号。
需要说明的是,上述语音编解码器对音频的处理是目前广泛研究和应用的公知技术,在此不再赘述。
步骤203,对于采集到的图像信息实现优化操作,并控制所述图像信息和所述音频信息的传输。
在本实施例中,通过摄像头连续采集图像,同时通过麦克风采集音频。图像信号处理器将图像进行优化调整并压缩为MJPEG序列数据,音编解码器对音频进行放大和消噪处理。处理得到的图像数据和音频数据统一经由USB线传到电子设备。电子设备将USB数据包重新组合,并分离为视频数据和音频数据,然后传送到相关的视频流传输压缩程序,通过WIFI或者3G/4G通信网路传送到远程协助端;远程协助端依据接收到的视频语音信息进行实时处理,处理结果通过本申请的耳塞传送给用户。
在本实施例中,通过摄像头连续采集图像同时通过麦克风采集音频,图像信号处理器将图像进行优化调整并压缩为MJPEG序列数据,音编解码器对音频进行放大消噪处理,并量化为数字信号。处理得到的图像数据和音频数据统一经由USB线传到电子设备。电子设备将USB数据包重新组合,并分离为视频数据和音频数据,然后调用电子设备的硬件压缩模块,将视频和音频压缩并保存到电子设备内置存储器中,录制结束后可以在电子设备端播放,或者上传网络共享给朋友。
步骤204,在电子设备和核心控制模块之间实现传输操作。
在本实施例中,通过USB OTG传输线连接电子设备,并在USB OTG传输线上提供线控按钮。核心控制模块中的MCU使用5芯数据线连接电子设备,其中4芯线用于USB供电以及数据传输,剩余的1芯线在USB OTG传输线中部被截断,通过一个按钮与地线相接,在MCU端与MCU的IO口连接,实现按钮检测功能。在电子设备端的USB接口上将ID脚接地实现USB OTG传输功能。
需要说明的是,USB OTG传输技术已经被越来越广泛的应用,该技术中非常重要的一项工作是判断设备中的USB模块是主机模式还是设备模式,由此才能进行后续通信。具体的,USB硬件接口上有个ID管脚,当检测到ID管脚的状态为低电平时,表示设备的USB模块需要采取主机模式;当检测到ID管脚的状态为高电平时,表示设备的USB模块需要采取设备模式。
作为示例,请参见图3,图3是通过USB模块实现主机模式和设备模式判断的模块示意图300。
在本实施例中,USB硬件接口304上的ID管脚直接与USB模块301中的ID管脚连接,通过所述USB模块301实现对所述USB硬件接口304上的ID管脚的状态监测。具体的,所述USB硬件接口304上的ID管脚与所述USB模块301中的USB OTG物理层303上的ID管脚连接,通过USB OTG控制器302便可检测到USB硬件接口304上的ID管脚的状态是低电平还是高电平,从而可以直接得到USB模块应采取主机模式还是设备模式。
进一步参考图4,作为对上述各图所示方法的实现,本申请提供了用于图像和语音交互装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图4所示,本实施例所述的图像和语音交互装置400包括:摄像头模块401,音频模块402、核心控制模块403、传输模块404。其中,摄像头模块401配置用于提供图像信息采集操作;音频模块402配置用于提供音频信息采集和语音播放操作;上述核心控制模块403,与上述摄像头模块401和上述音频模块402相连,配置用于将采集到的图像信息进行优化操作,并控制上述图像信息和上述音频信息的传输;上述传输模块404,连接电子设备和上述核心控制模块403,配置用于实现上述传输操作。
在本实施例中,用户可以使用摄像头模块401采集图像,由ISP对图像进行优化调整,然后经由传输模块404传送到电子设备,电子设备接到图片后通过本地或者经上传到服务器后进行图像识别,最后把识别结果通过音频模块402以语音的形式播放出来。
在本实施例中,用户可以使用音频模块401采集音频,由语音编解码器对音频进行编码,然后经由传输模块404传送到电子设备,电子设备接收到音频信号后通过本地或者经上传到服务器后进行语音识别,最后根据识别结果执行相应的操作,同时使用耳机播报相应的语音信息。
在本实施例中,用户可以通过摄像头模块401连续采集图像,同时通过麦克风采集音频,由图像处理器和语音编解码器对图像音频进行处理,然后经由传输模块404传送到电子设备,继而由电子设备通过WIFI或者3G/4G通信网络传送到远程协助端,远程协助端根据接收到的视频语音信息进行实时处理,处理结果通过耳机传送给用户。
在本实施例中,用户可以通过摄像头模块401连续采集图像,同时通过麦克风采集音频,由图像信号处理器和语音编解码器对图像音频进行处理,然后经由传输模块404传送到电子设备存储器存储起来,录制结束后可以在电子设备上播放,或者上传到网络与朋友共享。
本领域技术人员可以理解,上述图像和语音交互装置400还包括一些其他公知结构,例如处理器、存储器等,为了不必要地模糊本公开的实施例,这些公知的结构在图4中未示出。
下面参考图5,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统500的结构示意图。
如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括摄像头模块、音频模块、核心控制模块和传输模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,音频模块还可以被描述为“接收用户音频信号的模块”。
作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述设备:通过摄像头实现图像信息采集操作;通过音频模块实现音频信息采集和语音播放操作;对于采集到的图像信息实现优化操作,并控制所述图像信息和所述音频信息的传输;在电子设备和核心控制模块之间实现传输操作。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种用于实现图像和语音交互的装置,其特征在于,包括:
摄像头模块、音频模块、核心控制模块、传输模块;
所述摄像头模块,用于提供图像信息采集操作;
所述音频模块,用于提供音频信息采集和语音播放操作;
所述核心控制模块,与所述摄像头模块和所述音频模块相连,用于将采集到的图像信息进行优化操作,并控制所述图像信息和所述音频信息的传输;
所述传输模块,连接电子设备和所述核心控制模块,用于实现所述传输操作;其中,所述传输操作,包括:将经所述优化操作优化的图像信息,通过USB OTG传输线传输至所述电子设备,其中,所述电子设备接收到图像信息后通过本地或者上传到服务器后进行图像识别;
所述核心控制模块包括微控制单元,所述传输模块包括USB OTG传输线和按键;
所述核心控制模块的微控制单元使用5芯数据线连接电子设备,其中4芯线用于USB供电以及数据传输,剩余的1芯线在USB OTG传输线中部被截断,通过一个按键与地线相接,在所述微控制单元端与所述微控制单元的IO口连接;
所述音频模块将接收到的识别结果以语音的形式播放。
2.根据权利要求1所述的装置,其特征在于,所述音频模块包括:音频编解码器、麦克风和耳机。
3.根据权利要求1所述的装置,其特征在于,所述核心控制模块包括图像信号处理单元。
4.根据权利要求1-3之一所述的装置,其特征在于,所述电子设备用于将所述图像信息和所述音频信息进行存储和播放。
5.根据权利要求1-3之一所述的装置,其特征在于,所述电子设备用于将所述图像信息和所述音频信息发送到网络。
6.一种用于实现图像和语音交互的方法,其特征在于,所述方法应用于所述权利要求1-5中任一项所述的装置,所述方法包括:
通过摄像头实现图像信息采集操作;
通过音频模块实现音频信息采集和语音播放操作;
对于采集到的图像信息实现优化操作,并控制所述图像信息和所述音频信息的传输;
在电子设备和核心控制模块之间实现传输操作;其中
所述在电子设备和核心控制模块之间实现传输操作,包括:
将经所述优化操作优化的图像信息,通过所述USB OTG传输线传输至所述电子设备,其中,所述电子设备接收到图像信息后通过本地或者上传到服务器后进行图像识别;以及
所述通过音频模块实现音频信息采集和语音播放操作,包括:
通过所述音频模块,将接收到的识别结果以语音的形式播放。
7.根据权利要求6所述的方法,其特征在于,所述图像信息采集包括:利用图像信号处理器对图像进行优化调整,并通过USB OTG传输线进行传输。
8.根据权利要求6所述的方法,其特征在于,所述音频信息采集包括:利用语音编码器对音频进行编码,并通过USB OTG传输线进行传输。
9.根据权利要求6-8之一所述的方法,其特征在于,电子设备对所述图像信息和所述音频信息进行存储和播放。
10.根据权利要求6-8之一所述的方法,其特征在于,电子设备将所述图像信息和所述音频信息发送到网络。
CN201510567978.0A 2015-09-08 2015-09-08 用于实现图像和语音交互的方法和装置 Active CN106502938B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510567978.0A CN106502938B (zh) 2015-09-08 2015-09-08 用于实现图像和语音交互的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510567978.0A CN106502938B (zh) 2015-09-08 2015-09-08 用于实现图像和语音交互的方法和装置

Publications (2)

Publication Number Publication Date
CN106502938A CN106502938A (zh) 2017-03-15
CN106502938B true CN106502938B (zh) 2020-03-10

Family

ID=58286834

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510567978.0A Active CN106502938B (zh) 2015-09-08 2015-09-08 用于实现图像和语音交互的方法和装置

Country Status (1)

Country Link
CN (1) CN106502938B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113380247A (zh) * 2021-06-08 2021-09-10 阿波罗智联(北京)科技有限公司 多音区语音唤醒、识别方法和装置、设备、存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102821271A (zh) * 2012-08-02 2012-12-12 上海殷浩电子科技股份有限公司 3g远程视频传输系统
WO2013182118A1 (zh) * 2012-12-27 2013-12-12 中兴通讯股份有限公司 一种语音数据的传输方法及装置
US9042943B2 (en) * 2013-02-12 2015-05-26 Nec Casio Mobile Communications Ltd. TV phone apparatus and control method therefor
CN104702886A (zh) * 2013-12-04 2015-06-10 杨光 一种音视频插播监控系统装置
CN204614276U (zh) * 2015-03-31 2015-09-02 刘宛平 一种具有混合现实功能的仿真全向模拟飞行器

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4787063A (en) * 1984-10-19 1988-11-22 Francis Muguet Acquisition and transmission system for a recorder and a computer center
JPH06311104A (ja) * 1993-04-26 1994-11-04 Nec Corp 携帯電話装置
CN202282829U (zh) * 2011-10-25 2012-06-20 深圳市世纪安软信息技术有限公司 基于智能移动终端的现场执法记录仪
CN202694333U (zh) * 2012-03-29 2013-01-23 深圳市宇恒互动科技开发有限公司 具有usb扩展功能的装置
CN203387203U (zh) * 2013-05-09 2014-01-08 上海斐讯数据通信技术有限公司 一种具有usb otg功能的充电切换系统
CN103545678A (zh) * 2013-11-01 2014-01-29 乐志峰 具有usb otg、充电和数据传输功能的三合一数据线
CN204442643U (zh) * 2015-02-15 2015-07-01 无锡汉咏微电子股份有限公司 基于智能手机otg接口的音频装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102821271A (zh) * 2012-08-02 2012-12-12 上海殷浩电子科技股份有限公司 3g远程视频传输系统
WO2013182118A1 (zh) * 2012-12-27 2013-12-12 中兴通讯股份有限公司 一种语音数据的传输方法及装置
US9042943B2 (en) * 2013-02-12 2015-05-26 Nec Casio Mobile Communications Ltd. TV phone apparatus and control method therefor
CN104702886A (zh) * 2013-12-04 2015-06-10 杨光 一种音视频插播监控系统装置
CN204614276U (zh) * 2015-03-31 2015-09-02 刘宛平 一种具有混合现实功能的仿真全向模拟飞行器

Also Published As

Publication number Publication date
CN106502938A (zh) 2017-03-15

Similar Documents

Publication Publication Date Title
JP5859111B2 (ja) 対象オブジェクトベースの画像処理
WO2021164532A1 (zh) 云游戏直播方法和装置
CN112394895B (zh) 画面跨设备显示方法与装置、电子设备
KR102133531B1 (ko) 컨텐츠 재생 방법 및 그에 따른 단말, 그에 따른 시스템
CN110213616B (zh) 视频提供方法、获取方法、装置及设备
EP2698704A2 (en) Method and device for displaying image
US9282291B2 (en) Audio video recording device
CN112398855B (zh) 应用内容跨设备流转方法与装置、电子设备
US20140013015A1 (en) Method and system for transferring data between portable terminal and external device
US9445142B2 (en) Information processing apparatus and control method thereof
CN101458616A (zh) 多媒体多计算机切换系统
CN111837181A (zh) 将以不同格式捕获的音频信号转换为减少数量的格式以简化编码及解码操作
US20180268822A1 (en) Information processing system and information processing apparatus
US10468029B2 (en) Communication terminal, communication method, and computer program product
CN106502938B (zh) 用于实现图像和语音交互的方法和装置
US8957987B2 (en) Still image sound annotation system
US20230292011A1 (en) Information processing system, image-capturing device, and display method
WO2023093344A1 (zh) 图像显示方法、装置、存储介质及电子设备
US20160085348A1 (en) Application host with distributed remote input and output interfaces
US11368611B2 (en) Control method for camera device, camera device, camera system, and storage medium
CN112104840B (zh) 视频采集方法及移动基带工作站
CN112562688A (zh) 语音转写方法、装置、录音笔和存储介质
TW504932B (en) Video conference system of wireless network browsing device and its implementation method
CN215734614U (zh) 一种直播系统
JP6499582B2 (ja) 送信側コンピュータ、受信側コンピュータ、及びそれらにより実行される方法、並びにコンピュータプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant