CN113179202A - 用于分享数据的方法、电子设备和计算机存储介质 - Google Patents

用于分享数据的方法、电子设备和计算机存储介质 Download PDF

Info

Publication number
CN113179202A
CN113179202A CN202010022328.9A CN202010022328A CN113179202A CN 113179202 A CN113179202 A CN 113179202A CN 202010022328 A CN202010022328 A CN 202010022328A CN 113179202 A CN113179202 A CN 113179202A
Authority
CN
China
Prior art keywords
data
voice
vehicle
user
shared data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010022328.9A
Other languages
English (en)
Inventor
应臻恺
徐婷婷
黄硕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Pateo Electronic Equipment Manufacturing Co Ltd
Original Assignee
Shanghai Pateo Electronic Equipment Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Pateo Electronic Equipment Manufacturing Co Ltd filed Critical Shanghai Pateo Electronic Equipment Manufacturing Co Ltd
Priority to CN202010022328.9A priority Critical patent/CN113179202A/zh
Publication of CN113179202A publication Critical patent/CN113179202A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
    • G10L15/142Hidden Markov Models [HMMs]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/224Monitoring or handling of messages providing notification on incoming messages, e.g. pushed notifications of received messages

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Traffic Control Systems (AREA)

Abstract

本公开涉及一种用于分享数据的方法、电子设备和计算机存储介质。该方法包括:经由车载感知设备,获取用户的第一语音;确定所述第一语音是否与分享数据相关联;响应于确定所述第一语音与分享数据相关联,基于所述第一语音,确定采集数据的属性和用于接收所述分享数据的播放设备的标识;获取所述采集数据,以生成所述分享数据;发送所述分享数据和所述播放设备的所述标识,以用于所述播放设备响应于预定条件满足而呈现所述分享数据。本公开能够在一些不适于手动操作的场景下,特别是驾驶车辆的过程中,安全和及时地进行数据的分享。

Description

用于分享数据的方法、电子设备和计算机存储介质
技术领域
本公开总体上涉及数据共享,并且具体地,涉及分享数据的方法、电子设备和计算机存储介质。
背景技术
传统的分享数据的方案例如包括:分享者首先在电子设备已存储的数据中查询并选取待分享的数据,然后通过邮件、微信或者其他通信方式发送给接收者,以便分享数据。
在上述传统的分享数据的方案中,需要分享者先后历经待分享数据的查询与筛选,然后再进行发送待分享数据的途径的选择与发送操作,才能实现待分享数据的分享,因而需要繁琐的人工或手动操作,比较费时,特别是在一些不适于手动操作的场景下,例如是驾驶车辆的过程中,难以安全和及时地进行数据的分享。
发明内容
本公开提供一种分享数据的方法、电子设备和计算机存储介质,能够在一些不适于手动操作的场景下,特别是驾驶车辆的过程中,安全和及时地进行数据的分享。
根据本公开的第一方面,提供了一种用采集图像的方法。该方法包括:经由车载感知设备,获取用户的第一语音;确定第一语音是否与分享数据相关联;响应于确定第一语音与分享数据相关联,基于第一语音,确定采集数据的属性和用于接收分享数据的播放设备的标识;获取采集数据,以生成分享数据;发送分享数据和播放设备的标识,以用于播放设备响应于预定条件满足而呈现分享数据。
采集图像根据本发明的第二方面,还提供了一种电子设备,设备包括:存储器,被配置为存储一个或多个计算机程序;以及处理器,耦合至存储器并且被配置为执行一个或多个程序使装置执行本公开的第一方面的方法。
根据本公开的第三方面,还提供了一种非瞬态计算机可读存储介质。该非瞬态计算机可读存储介质上存储有机器可执行指令,该机器可执行指令在被执行时使机器执行本公开的第一方面的方法。
提供发明内容部分是为了以简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识本公开的关键特征或主要特征,也无意限制本公开的范围。
附图说明
图1示出了根据本公开的实施例的用于分享数据的方法的系统100的示意图。;
图2示出了根据本公开的实施例的用于分享数据的方法200的流程图;
图3示出了根据本公开的实施例的用于呈现即时消息的方法300的流程图;
图4示出了根据本公开的实施例的用于播放设备播放分享数据的方法400的流程图;
图5示出了根据本公开的实施例的用于确定采集数据的属性和播放设备的标识的方法500流程图;
图6示意性示出了根据本公开的实施例的播放设备600的示意图;以及
图7示意性示出了适于用来实现本公开实施例的电子设备700的框图。
在各个附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施例。虽然附图中显示了本公开的优选实施例,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
如上文所描述的,在上述传统的用于分享数据的方案中,需要分享者复杂的人工或手动操作才能实现待分享数据的分享,比较费时,并且在驾驶车辆等不适于手动操作的场景下,难以安全和及时地进行数据的分享。
为了至少部分地解决上述问题以及其他潜在问题中的一个或者多个,本公开的示例实施例提出了一种用于分享数据的方案。该方案包括:经由车载感知设备,获取用户的第一语音;确定第一语音是否与分享数据相关联;响应于确定第一语音与分享数据相关联,基于第一语音,确定采集数据的属性和用于接收分享数据的播放设备的标识;获取采集数据,以生成分享数据;发送分享数据和播放设备的标识,以用于播放设备响应于预定条件满足而呈现分享数据。
在上述方案中,通过基于车载感知设备所获取的第一语音来确定采集数据的属性和用于接收分享数据的播放设备的标识,以及将基于所获采集数据而生成分享数据发送,以用于在所标识的播放设备处呈现该分享数据,本公开能够在一些不适于手动操作的场景下,特别是驾驶车辆的过程中,安全和及时地进行数据的分享。
图1示出了根据本公开的实施例的用于分享数据的方法的系统100的示意图。如图1所示,系统100包括:车辆110、用户122(分享者)的移动设备120、服务器160、多个播放装置(例如用户178(接收者)家176中的智能电视170、智能音箱系统172)。在一些实施例中,车辆110、移动设备120、服务器160、智能电视170、智能音箱系统172例如可以经由基站150、网络140进行数据交互。车辆110和移动设备也可以经由Wi-Fi、蓝牙、蜂窝、NFC等无线通信手段进行数据交互与共享。
关于车辆110,其例如至少包括:车载设备114(例如车机)、车载感知设备、车载T-BOX等。车载感知设备用于实时感知车辆自身的车辆数据、车内数据和车辆110所在外部环境数据。车载感知设备至少包括多个车载摄像装置、拾音器和多个车辆状态传感器。车载摄像装置例如包括:车辆前置摄像头(未示出)、后置前置摄像头(未示出)、车顶摄像装置118和车内摄像装置116、拾音器等。车内摄像装置116例如可以采集车内图像。车顶摄像装置118例如可以采集车外的环境图像。拾音器,用于采集车内的声音信号,例如用户122的语音等。在一些实施例中,车辆110与移动设备120可以通过Wi-Fi、蓝牙、蜂窝、NFC等无线通信手段进行数据交互与共享。例如,移动设备120可以通过检测到移动设备120上的预定动作(例如摇一摇)而建立与车辆110之间的关联。通过移动设备120藉由预定动作(例如摇一摇)建立与车辆110之间的关联,本公开可以通过方便并且安全的方式,建立车辆110与特定用户122(如驾驶者)的关联移动设备120之间的联系,以便共享数据与计算资源。
车载T-BOX用于与车载设备114(例如车机)、移动设备120、服务器160进行数据交互。在一些实施例中,车载T-BOX例如包括SIM卡、GPS天线,4G或5G天线等。当用户通过移动设备120(例如手机)的应用程序(APP)发送控制命令(例如,远程启动车辆、打开空调、调整座椅至合适位置等),TSP后台会发出监控请求指令到车载T-BOX,车辆在获取到控制命令后,通过CAN总线发送控制报文并实现对车辆的控制,最后反馈操作结果到用户的移动设备的APP上。车载T-BOX与车机之间通过canbus通信,实现数据交互,例如传输车辆状态信息、按键状态信息、控制指令等。车载T-BOX可以采集车辆110总线Dcan、Kcan、PTcan相关的总线数据。
关于移动设备120,其例如但不限于是手机,其也可以是平板电脑、手机、穿戴设备等。移动设备120可以直接与车载T-BOX进行数据交互,也可以经由基站150、网络140与服务器160、播放设备进行数据交互。穿戴设备可以用于采集用户122的健康数据,例如心跳或者睡眠数据等。移动设备120例如存储有用户122的多个存储图像(照片或者视频)。
关于服务器160,其例如用于接收来自车辆110的分享数据、播放设备的标识和提示消息。服务器160可以预先存储有与用户122的关联用户178相关联的所有播放设备(例如智能电视170、智能音箱系统172)的注册信息。服务器160可以基于所获取的、来自车载设备114或者移动设备120的、至少指示播放设备的关联用户178的播放设备的标识,来获取关联用户178的播放设备的注册信息,以便向关联用户178的播放设备发送分享数据。在一些实施例中,服务器160还可以接受播放设备所发送的分享数据已被分享的消息,以用于发送给车辆110的车载设备114或用户122(分享者)的移动设备120。服务器160例如经由网络140、基站150与车辆110、移动设备120、播放设备进行数据交互。在一些实施例中,服务器160可以具有一个或多个处理单元,包括诸如GPU、FPGA和ASIC等的专用处理单元以及诸如CPU的通用处理单元。另外,在每个计算设备上也可以运行着一个或多个虚拟机。
关于播放设备,其例如是音视频播放设备,用于播放视频和/或音频数据。播放装置例如包括关联用户178的家176中所配置的智能电视170、智能音箱系统172等。播放设备还可以接收服务器160所发送的分享数据和提示消息,以及经由音频播放设备输出用于指示分享数据的属性的指示信息(例如语音信息,或者显示信息,如图6中播放设备600中的显示信息616),以及当检测到关于提示消息的语音应答时,由智能音箱系统172播放分享数据中的音频数据(例如用户122的语音,即分享者的第二语音),和/或由智能电视170播放分享数据中的视频或照片。智能电视170或带有显示功能的智能音箱系统172也可以播放分享数据中的音视频数据。在一些实施例中,播放设备还可以在确认检测到分享数据已被播放时,向服务器160发送分享数据已被分享的消息,以用于经由服务器160和车辆110通知用户122(分享者)。在一些实施例中,也可以经由关联用户178的移动设备来发送分享数据已被分享的消息。例如,关联用户178的移动设备通过模拟虚拟点击的方式经由即时通信应用来发送分享数据已被分享的消息。
图2示出了根据本公开的实施例的用于分享数据的方法200的流程图。应当理解,方法200例如可以在图7所描述的电子设备700处执行。也可以在图1所描述的车载设备114或者移动设备120处执行。应当理解,方法200还可以包括未示出的附加动作和/或可以省略所示出的动作,本公开的范围在此方面不受限制。
在框202处,车载设备114获取用户122的第一语音。用户122例如是车辆110的驾驶者。该第一语音例如是“将手机中最新的几张风景图片发送到家中电视”。车载设备114例如经由车辆110的拾音器获取用户122的上述第一语音。在一些实施例中,车载设备114在获取上述第一语音后,提取第一语音的声纹特征,以及基于声纹特征确认该第一语音是否与预先存储的用户122的声音相匹配,如果车载设备114确定第一语音与预先存储的用户122的声音相匹配,则确认第一语音为用户122的第一语音。通过采用上述手段,可以保证仅对特定用户122进行数据的分享,以便保证信息的安全。
在框204处,车载设备114确定第一语音是否与分享数据相关联。通过采用上述手段,避免针对与分享数据无关的用户语音进行识别及相关处理,以便节省计算资源。
在框206处,如果车载设备114确定第一语音与分享数据相关联,基于第一语音,确定采集数据的属性和用于接收分享数据的播放设备的标识。
在一些实施例中,采集数据包括以下至少一项:车载感知设备所采集的当前数据;与用户相关联的移动设备所存储的数据;与用户相关联的健康数据;车辆状态信息和车辆位置信息中的至少一项。
在一些实施例中,用户122在驾车时,特别是长时间驾车或自驾出行时,收到家人(例如用户178)的微信。车载设备114可以控制车辆110的扬声器直接播报微信信息,例如该微信信息指示家人希望了解用户122的当前状态。用户122的第一语音例如是“将我和车现在的状态同步给家中电视,并告诉爸妈:我很好,别担心,就要抵达目的地了!”。车载设备114例如基于上述第一语音所确定的采集数据的属性例如是:车内摄像装置116所采集的包括用户122的当前图像、车辆110的位置信息和车辆110的状态信息。在一些实施例中,例如还到达目的地的时间和距离等。另外,车载设备114基于上述第一语音所确定的用于接收分享数据(例如包括用户122的图像、车辆110的位置信息和车辆110的状态信息)的播放设备例如是:用户178的智能电视170。
关于确定采集数据的属性和用于接收分享数据的播放设备的标识的方法包括多种。在一些实施例中,该方法例如包括:提取第一语音的声学特征;基于所提取的声学特征,经由识别模型,确定采集数据的属性和用于接收分享数据的播放设备,该识别模型经由多个关于采集数据的语音样本所训练;获取播放设备的标识,播放设备的标识至少指示播放设备的关联用户178。下文将结合图5说明确定采集数据的属性和用于接收分享数据的播放设备的标识的方法,在此,不再赘述。
关于获取采集数据的方式包括多种。在一些实施例中,获取采集数据的方式例如包括:如果车载设备114确定采集数据的属性与用户122的当前图像相关联,则启动车内摄像装置116;然后,获取车内摄像装置116所采集的车内图像;以及裁剪车内图像,以生成关于用户122的当前数据。
在一些实施例中,获取采集数据的方式包括:启动车载摄像装置(例如车顶摄像装置118),以采集关于车辆110的外部环境图像的采集数据。
在一些实施例中,获取采集数据的方式包括:车载设备114确定采集数据的属性是否与移动设备120的存储图像相关联;如果车载设备114确定采集数据的属性与移动设备120的存储图像相关联,则基于第一语音,确定存储图像的属性;以及基于存储图像的属性,在移动设备处的存储图像中获取采集图像。在一些实施例中,存储图像的属性包括以下至少一项:存储图像的时间、存储图像的类别、存储图像的格式。在一些实施例中,移动设备120的存储图像是经由经训练的分类器所分类的,以便利用训练好的分类器判定存储图像所属的类别(存储图像的类别例如是风景、美食、儿童等)。而该分类器是利用带类别标签的训练数据所训练出来的。在一些实施例中,基于存储图像的属性获取采集数据的方式例如是:在移动设备120处的多个存储图像中搜索与查询条件(所确定的存储图像的属性)相似的存储图像,然后根据相似性大小排序而输出关于存储图像的一个或多个搜索结果。
在一些实施例中,获取采集数据的方式包括:车载设备114建立与用户122的穿戴设备的通信连接;以及经由穿戴设备,获取与用户122相关联的健康数据。
关于获取采集数据以生成分享数据的方式,在一些实施例中,其例如包括:车载设备114还可以获取用户122的第二语音和预定音频数据(例如而不限于是背景音乐)中的至少一个;以及将第二语音、第二语音的对应文本数据和预定音频数据中的至少一个与采集数据进行融合,以生成分享数据,第二语音的对应文本数据是经由针对第二语音的识别而生成的。例如,车载设备114所获取的用户第一语音例如是“将手机中最新的几张风景图片发送到家中电视”,车载设备114例如如前文所示,确定采集数据的属性与移动设备120的存储图像相关联,则基于该第一语音例如确定:存储图像的时间属性为预定时间(例如今天)、存储图像的类别属性为风景、以及存储图像的格式属性为照片。车载设备114将所确定的上述属性发送至移动设备120。移动设备120在所存储的图像中检索符合上述时间属性、类别属性和格式属性的照片,并将所选取的照片作为分享数据中的第二数据。车载设备114在获得所选取的照片之后,例如经由扬声器输出提示语音(该提示语音例如是“需要添加语音吗”)。如果车载设备114检测到预定提示音(预定提示例如是音效“叮”)之后的用户122的第二语音(该第二语音例如为“这是刚刚拍的今晚的晚霞,特别美”),和/或检测到预定的背景音乐,则车载设备114将所采集(例如录制)的第二语音、预定的背景音乐、以及第二语音对应的文本数据(该对应的文本数据例如是经由针对第二语音的识别而成的文字)以作为分享数据中的第一数据。车载设备114将分享数据中的第一数据和分享数据中的第二数据进行融合,例如打包、压缩,以用于发送至该分享数据。在一些实施例中,车载设备114还将分享数据进行加密。通过采用上述手段,本公开可以针对融合了图像、语音、健康数据、车辆状态数据、语音所对应的文字等多模态的分享数据进行远程即时分享。
在框208处,车载设备114发送分享数据和播放设备的标识,以用于播放设备响应于预定条件满足而呈现分享数据。在一些实施例中,车载设备114可以向服务器160发送分享数据和播放设备的标识。在一些实施例中,车载设备114也可以经由用户122的移动设备120(例如通过模拟屏幕点击的方式)将所生成的分享数据和播放设备的标识发送至关联用户178的播放设备。
关于分享数据,在一些实施例中,分享数据包括第一数据和第二数据中的至少一个,第一数据用于在音频播放设备处被播放,第二数据用于在视频播放设备处被播放。在一些实施例中,第一数据例如是用户122的第二语音,预定的音频数据(例如背景音乐)。第二数据例如是关于用户122的车内图像、车辆110的车外环境图像、移动设备120处已存储的照片、关于用户122的健康数据、车辆110的车辆状态信息、位置信息和第二语音的对应文本数据中的至少一个。
在上述方案中,通过基于车载感知设备所获取的第一语音来确定采集数据的属性和用于接收分享数据的播放设备的标识,以及将基于所获采集数据而生成分享数据进行发送,以用于在所标识的播放设备处呈现该分享数据,本公开能够在一些不适于手动操作的场景下,特别是驾驶车辆的过程中,安全和及时地进行数据的分享。
在一些实施例中,方法200还包括呈现即时消息的方法300。图3示出了根据本公开的实施例的用于呈现即时消息的方法300的流程图。应当理解,方法300例如可以在图7所描述的电子设备700处执行。也可以在图1所描述的车载设备114处执行。应当理解,方法300还可以包括未示出的附加动作和/或可以省略所示出的动作,本公开的范围在此方面不受限制。
在框302处,车载设备114确认是否检测到即时消息。在一些实施例中,该即时消息例如是由分享数据的接收者(例如用户122的家人,例如用户178)的移动设备180和播放设备(例如智能音箱系统172)中的一个发送至用户122的移动设备120。在一些实施例中,该即时消息包括分享数据的接收者(例如用户178)的移动设备180或播放设备(例如智能电视170、智能音箱系统172)的标识。
在框304处,如果车载设备114检测到即时消息,则输出第三语音,第三语音指示该即时消息的属性。在一些实施例中,即时消息的属性包括消息的来源(例如发送者,即用户178)。例如,车载设备114基于分享数据接收者的移动设备180或播放设备的标识来确认即时消息的属性。然后,车载设备114基于所确定的属性,生成指示该即时消息的属性的第三语音(例如TTS语音),以经由车辆110的扬声器输出。该输出的第三语音例如是“刚收到爸爸(例如是用户178)的微信,直接进行播报吗”。
在框306处,车载设备114确认是否检测到关于第三语音的用户应答。例如,车载设备114检测经由拾音器所拾取的用户语音(该用户语音例如是“好的”)。车载设备114检测该用户语音是否是关于第三语音的确认。
在框308处,如果车载设备114检测到关于第三语音的用户应答,则基于即时消息,生成用于指示即时消息的对应语音。例如,车载设备114将消息经由TTS语音转换而生成用于指示即时消息的对应语音。
在框310处,经由车辆110的扬声器输出对应语音。前文提及的用户122的第一语音例如为针对该对应语音的应答。该对应语音例如是“沿途的风景应该都不错吧,好想看看”。用户122的第一语音例如是“请打开对外摄像头,请同步给家里的电视”。
在上述方案中,通过车载设备114在接收到即时消息时通过语音提醒即时消息的属性,并在得到用户的应答后,以语音的方式呈现即时消息的内容,本公开能够安全并且及时地提醒用户122所收到的即时消息,而不会对用户122的安全驾驶带来干扰。
图4示出了根据本公开的实施例的用于播放设备播放分享数据的方法400的流程图。应当理解,方法400例如可以在图7所描述的电子设备700处执行。也可以在图1所描述的播放设备处执行。应当理解,方法400还可以包括未示出的附加动作和/或可以省略所示出的动作,本公开的范围在此方面不受限制。
在框402处,播放设备确认是否检测到提示消息。该提示消息例如来源于服务器160,也可以来自用户122的移动设备120。在一些实施例中,该提示消息也可以直接来源于车载设备114或者用户122的移动设备120。
在框404处,如果播放设备检测到提示消息,经由音频播放设备(例如智能音响系统172)输出用于指示分享数据的属性的语音信息。在一些实施例中,分享数据的属性例如至少指示用户122的关联车辆110的车辆信息(例如是车牌信息)。用于指示分享数据的属性的语音信息例如是“Hi,收到了一条来自于沪A HXXXX的新消息,现在看吗?”。
在框406处,确认播放设备所接收的验证信息是否通过验证。在一些实施例中,所发送的分享数据经由密钥加密。在一些实施例中,该密钥例如是一对匹配的公钥和私钥中的公钥。
在框408处,如果确认播放设备所接收的验证信息是否通过验证,播放设备确认是否检测到关于提示消息的确认输入。在一些实施例中,上述验证信息例如是与上述公钥匹配的私钥。在一些实施例中,关于提示消息的确认输入包括以下一项:关于提示消息的语音应答;或者经由播放设备的遥控器的确认输入。
在框410处,如果播放设备确认检测到关于消息的语音应答,经由音频播放设备(例如智能音响系统172)和视频播放设备(例如智能电视170)中的至少一个播放分享数据,音频播放设备和视频播放设备由播放设备所包括。
在上述方案中,本公开能够经由播放设备及时提醒用户178关于分享数据的消息,并根据用户178的输入播放分享数据。
在一些实施例中,方法400还包括:播放设备检测分享数据是否已被呈现;如果播放设备检测到分享数据已被播放,发送用于指示分享数据已被分享的消息,分享数据已被分享的消息经由服务器160和/或用户122的移动设备发送至用户122的关联车辆110的车载设备114。
通过采用上述手段,可以安全并及时地通知用户122该分享数据是否已被播放给用户178。
在一些实施例中,方法400还包括:播放设备接收第四语音;然后,播放设备确认第四语音是否与播放设备所呈现的分享数据有关。如果播放设备确认第四语音与播放设备所呈现的分享数据有关,则将第四语音例如经由服务器160或者关联用户的移动设备发送至移动设备120和车载设备114中的至少一处,以用于经由车辆的扬声器进行播放。
通过采用上述手段,本公开可以将用户178关于分享数据的语音安全并及时地反馈给用户122。
图5示出了根据本公开的实施例的用于确定采集数据的属性和播放设备的标识的方法500流程图。应当理解,方法500例如可以在图7所描述的电子设备700处执行。也可以在图1所描述的车载设备114或者移动设备120处执行。应当理解,方法500还可以包括未示出的附加动作和/或可以省略所示出的动作,本公开的范围在此方面不受限制。
在框502处,车载设备114或者移动设备120提取第一语音的声学特征。在一些实施例中,车载设备114或者移动设备120可以基于移动窗对第一语音的声音波形进行分帧,以生成多帧(例如N帧,N为自然数)第一语音的声音段。针对每一帧第一语音的声音段提取声学特征,以便将每一帧第一语音的声音段转换为用于指示语音内容的多维向量(例如M维,M为自然数)以便形成由多帧的多维向量所构建的多维向量矩阵(例如N*M序列)。
在框504处,车载设备114或者移动设备120可以基于声学特征,经由识别模型,确定采集数据的属性和用于接收分享数据的播放设备,识别模型经由多个关于采集数据的语音样本所训练。该识别模型包括声学模型和语言模型。声学模型用于将语音转换到发音序列,以及从发音序列转换到输出文字序列。声学模型例如包括由隐马尔可夫模型(HiddenMarkov Model,HMM)所构建的状态网络。语言模型用于在声学模型给出发音序列之后,从候选的文字序列中找出概率最大的字符串序列。上述识别模型的输入例如是第一语音的声学特征。该识别模型的输出是采集数据的属性和用于接收分享数据的播放设备。该识别模型的训练样本例如是经由人工或者标注工具所标注的多个关于采集数据的用户语音样本。
在框506处,车载设备114或者移动设备120获取播放设备的标识,播放设备的标识至少指示播放设备的关联用户178。在一些实施例中,在服务器160处预先存储有与关联用户178相关联的所有播放设备的注册信息。服务器160基于所获取的、来自车载设备114或者移动设备120的、至少指示播放设备的关联用户178的播放设备的标识,可以获取关联用户178的播放设备的注册信息,以便向关联用户178的播放设备发送分享信息。
通过采用上述手段,本公开可以基于所采集的用户122语音识别接收者的播放设备和待采集数据的信息,以便基于该待采集数据的信息启动车载设备等装置采集数据以便生成分享数据。
图6示意性示出了根据本公开的实施例的播放设备600的示意图。应当理解,播放设备600还可以包括未示出的附加组成部分和/或可以省略所示出的组成部分,本公开的范围在此方面不受限制。
如图6所示,播放设备600例如是智能电视。图6的上半部分指示接收到提示信息606的显示界面604。
图6的下半部分指示呈现分享数据的显示界面614。显示界面614的左侧显示信息616例如指示了用户122的状态信息和车辆110的位置信息和预计到达目的地的时间等分享数据。显示界面614的右侧显示信息616例如显示了智能电视当前所播放的电视节目的画面。通过采用上述手段,本公开用户178可以方便地获知用户122所分享的数据。
图7示意性示出了适于用来实现本公开实施例的电子设备700的框图。设备700可以是用于实现执行图2至6所示的方法200、300、400、500和600的设备。如图7所示,设备700包括中央处理单元(CPU)701,其可以根据存储在只读存储器(ROM)702中的计算机程序指令或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序指令,来执行各种适当的动作和处理。在RAM 703中,还可存储设备700操作所需的各种程序和数据。CPU 701、ROM 702以及RAM703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
设备700中的多个部件连接至I/O接口705,包括:输入单元706、输出单元707、存储单元708,处理单元701执行上文所描述的各个方法和处理,例如执行方法200至600。例如,在一些实施例中,方法200至600可被实现为计算机软件程序,其被存储于机器可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到RAM 703并由CPU 701执行时,可以执行上文描述的方法200至600的一个或多个操作。备选地,在其他实施例中,CPU701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行方法200至600的一个或多个动作。
需要进一步说明的是,本公开可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,该编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给语音交互装置中的处理器、通用计算机、专用计算机或其它可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的设备、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,该模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
以上该仅为本公开的可选实施例,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等效替换、改进等,均应包含在本公开的保护范围之内。

Claims (18)

1.一种分享数据的方法,包括:
经由车载感知设备,获取用户的第一语音;
确定所述第一语音是否与分享数据相关联;
响应于确定所述第一语音与分享数据相关联,基于所述第一语音,确定采集数据的属性和用于接收所述分享数据的播放设备的标识;
获取所述采集数据,以生成所述分享数据;以及
发送所述分享数据和所述播放设备的所述标识,以用于所述播放设备响应于预定条件满足而呈现所述分享数据。
2.根据权利要求1所述的方法,还包括:
向所述播放设备发送用于指示所述分享数据的提示消息。
3.根据权利要求1所述的方法,其中所述采集数据包括以下至少一项:
所述车载感知设备所采集的当前数据;
与所述用户相关联的移动设备所存储的数据;
与所述用户相关联的健康数据;以及
车辆状态信息和车辆位置信息中的至少一项。
4.根据权利要求1所述的方法,其中确定采集数据的属性和用于接收所述分享数据的播放设备的标识包括:
提取所述第一语音的声学特征;
基于所述声学特征,经由识别模型,确定所述采集数据的属性和用于接收所述分享数据的播放设备,所述识别模型经由多个关于所述采集数据的语音样本所训练;以及
获取所述播放设备的标识,所述播放设备的标识至少指示所述播放设备的关联用户。
5.根据权利要求3所述的方法,其中获取所述采集数据包括:
响应于确定所述采集数据的属性与所述用户的当前图像相关联,启动车内摄像装置;
获取所述车内摄像装置所采集的车内图像;以及
裁剪所述车内图像,以生成关于所述用户的当前数据。
6.根据权利要求3所述的方法,其中获取所述采集数据包括:
启动所述车载摄像装置,以采集关于所述车辆的外部环境图像的采集数据。
7.根据权利要求3所述的方法,其中获取与所述用户相关联的移动设备所存储的数据包括:
响应于确定所述采集数据的属性与所述移动设备的存储图像相关联,基于所述第一语音,确定所述存储图像的属性;以及
基于所述存储图像的属性,在所述移动设备处的存储图像中获取所述采集图像。
8.根据权利要求7所述的方法,其中所述存储图像的属性包括以下至少一项:
所述存储图像的时间、所述存储图像的类别、所述存储图像的格式。
9.根据权利要求3所述的方法,其中获取所述采集数据包括:
建立与所述用户的穿戴设备的通信连接;以及
经由所述穿戴设备,获取与所述用户相关联的健康数据。
10.根据权利要求1所述的方法,其中获取所述采集数据以生成分享数据包括:
获取所述用户的第二语音和预定音频数据中的至少一个;以及
将所述第二语音、第二语音的对应文本数据、所述预定音频数据中的至少一个与所述采集数据进行融合,以生成所述分享数据,所述第二语音的对应文本数据是经由针对所述第二语音的识别而生成的。
11.根据权利要求1所述的方法,还包括:
响应于确认检测到即时消息,输出第三语音,所述第三语音指示所述即时消息的属性;
响应于确认检测到关于所述第三语音的用户应答,基于所述即时消息,生成用于指示所述即时消息内容的对应语音;以及
经由所述车辆的扬声器输出所述对应语音,所述第一语音为关于所述对应语音的用户应答。
12.根据权利要求1所述的方法,其中所述播放设备包括音频播放设备和视频播放设备,所述分享数据包括第一数据和第二数据中的至少一个,所述第一数据用于在所述音频播放设备处被播放,所述第二数据用于在所述视频播放设备处被播放。
13.根据权利要求2所述的方法,其中所述播放设备响应于预定条件满足而呈现所述分享数据包括:
在所述播放设备处,响应于检测到所述提示消息,经由音频播放设备输出用于指示所述分享数据的属性的语音信息;
响应于确认所述播放设备所接收的验证信息通过验证,确认是否检测到关于所述提示消息的确认输入;以及
响应于检测到关于所述提示消息的确认输入,经由所述音频播放设备和视频播放设备中的至少一个播放所述分享数据,所述音频播放设备和所述视频播放设备由所述播放设备所包括。
14.根据权利要求1所述的方法,其中所述播放设备响应于预定条件满足而呈现所述分享数据包括:
检测所述分享数据是否已被呈现;以及
响应于检测到所述分享数据已被呈现,发送用于指示所述分享数据已被分享的消息,所述分享数据已被分享的消息被发送至所述车载设备或所述用户的关联移动设备。
15.根据权利要求13所述的方法,其中所述分享数据的属性至少指示所述用户的关联车辆的车辆信息,所述确认输入包括以下一项:
关于所述提示消息的语音应答;以及
经由所述播放设备的遥控器的确认输入。
16.根据权利要求15所述的方法,还包括:
接收第四语音;以及
响应于确认所述第四语音与所呈现的所述分享数据有关,将所述第四语音经被发送至所述移动设备和所述车载设备中的至少一处,以用于经由所述车辆的扬声器进行播放。
17.一种电子设备,包括:
存储器,被配置为存储一个或多个计算机程序;以及
处理器,耦合至所述存储器并且被配置为执行所述一个或多个程序使所述装置执行根据权利要求1-16中任一项所述的方法。
18.一种非瞬态计算机可读存储介质,其上存储有机器可执行指令,所述机器可执行指令在被执行时使机器执行根据权利要求1-16中任一项所述的方法的步骤。
CN202010022328.9A 2020-01-09 2020-01-09 用于分享数据的方法、电子设备和计算机存储介质 Pending CN113179202A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010022328.9A CN113179202A (zh) 2020-01-09 2020-01-09 用于分享数据的方法、电子设备和计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010022328.9A CN113179202A (zh) 2020-01-09 2020-01-09 用于分享数据的方法、电子设备和计算机存储介质

Publications (1)

Publication Number Publication Date
CN113179202A true CN113179202A (zh) 2021-07-27

Family

ID=76921441

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010022328.9A Pending CN113179202A (zh) 2020-01-09 2020-01-09 用于分享数据的方法、电子设备和计算机存储介质

Country Status (1)

Country Link
CN (1) CN113179202A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115118816A (zh) * 2021-10-22 2022-09-27 博泰车联网科技(上海)股份有限公司 一种基于位置的语音交互方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104125282A (zh) * 2014-07-25 2014-10-29 大陆汽车投资(上海)有限公司 基于即时通讯/社交应用的位置分享及导航方法
CN106791015A (zh) * 2016-11-29 2017-05-31 维沃移动通信有限公司 一种消息播放和回复方法及装置
CN109451140A (zh) * 2018-09-25 2019-03-08 深圳壹账通智能科技有限公司 社交消息推送方法、装置、计算机存储介质和终端
CN109981443A (zh) * 2019-02-28 2019-07-05 维沃移动通信有限公司 语音交互方法、装置及终端设备
CN110290059A (zh) * 2019-07-05 2019-09-27 北京梧桐车联科技有限责任公司 发送社交内容的方法和装置
CN110381097A (zh) * 2018-04-12 2019-10-25 上海博泰悦臻网络技术服务有限公司 一种语音分享音频的方法、系统及车载终端

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104125282A (zh) * 2014-07-25 2014-10-29 大陆汽车投资(上海)有限公司 基于即时通讯/社交应用的位置分享及导航方法
CN106791015A (zh) * 2016-11-29 2017-05-31 维沃移动通信有限公司 一种消息播放和回复方法及装置
CN110381097A (zh) * 2018-04-12 2019-10-25 上海博泰悦臻网络技术服务有限公司 一种语音分享音频的方法、系统及车载终端
CN109451140A (zh) * 2018-09-25 2019-03-08 深圳壹账通智能科技有限公司 社交消息推送方法、装置、计算机存储介质和终端
CN109981443A (zh) * 2019-02-28 2019-07-05 维沃移动通信有限公司 语音交互方法、装置及终端设备
CN110290059A (zh) * 2019-07-05 2019-09-27 北京梧桐车联科技有限责任公司 发送社交内容的方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115118816A (zh) * 2021-10-22 2022-09-27 博泰车联网科技(上海)股份有限公司 一种基于位置的语音交互方法及系统
CN115118816B (zh) * 2021-10-22 2023-11-17 博泰车联网科技(上海)股份有限公司 一种基于位置的语音交互方法及系统

Similar Documents

Publication Publication Date Title
CN105578267B (zh) 终端装置及其信息提供方法
CN103491399B (zh) 服务提供系统及其提供服务的方法
CN102348014B (zh) 用于使用声音提供增强现实服务的装置和方法
US11068529B2 (en) Information output system, information output method, and program
US20160205344A1 (en) Video telephone device and video telephone processing method
EP3876441A1 (en) Method for surveying broadcast ratings and ratings statistics information server
WO2018211983A1 (en) Speech enhancement for speech recognition applications in broadcasting environments
KR102003546B1 (ko) 사용자 디바이스와 스트리밍 미디어 콘텐츠 디바이스 간의 연결을 인증하기 위한 방법들, 시스템들, 및 매체들
EP2665290A1 (en) Simultaneous display of a reference video and the corresponding video capturing the viewer/sportsperson in front of said video display
US20190394423A1 (en) Data Processing Apparatus, Data Processing Method and Storage Medium
CN105578113A (zh) 一种视频通信的方法、装置和系统
CN111428672A (zh) 交互对象的驱动方法、装置、设备以及存储介质
US20120242860A1 (en) Arrangement and method relating to audio recognition
CN107851129B (zh) 信息处理装置、信息处理方法和程序
AU2018432003B2 (en) Video processing method and device, and terminal and storage medium
CN111742557A (zh) 显示装置和包括该显示装置的系统
CN113179202A (zh) 用于分享数据的方法、电子设备和计算机存储介质
CN113099311B (zh) 用于播放数据的方法、电子设备和计算机存储介质
JP6212719B2 (ja) 映像受信装置、情報表示方法および映像受信システム
TW202245440A (zh) 透過修改音訊和視訊介面來廣播情境資訊
WO2021129444A1 (zh) 文件聚类方法及装置、存储介质和电子设备
KR20180137724A (ko) 음성 인식에 기반한 영상 공유 장치 및 그를 이용한 영상 공유 시스템
CN113115251A (zh) 用于信息处理的方法、设备和计算机存储介质
CN117608506A (zh) 信息显示方法、装置、电子设备及存储介质
JP6559096B2 (ja) 情報出力システム及び情報出力方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 201821 room 208, building 4, No. 1411, Yecheng Road, Jiading Industrial Zone, Jiading District, Shanghai

Applicant after: Botai vehicle networking technology (Shanghai) Co.,Ltd.

Address before: Room 208, building 4, No. 1411, Yecheng Road, Jiading Industrial Zone, Jiading District, Shanghai 201821

Applicant before: SHANGHAI PATEO ELECTRONIC EQUIPMENT MANUFACTURING Co.,Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210727