CN109583413A - 一种数据处理方法及装置 - Google Patents

一种数据处理方法及装置 Download PDF

Info

Publication number
CN109583413A
CN109583413A CN201811502552.7A CN201811502552A CN109583413A CN 109583413 A CN109583413 A CN 109583413A CN 201811502552 A CN201811502552 A CN 201811502552A CN 109583413 A CN109583413 A CN 109583413A
Authority
CN
China
Prior art keywords
language
feature information
image
fisrt feature
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811502552.7A
Other languages
English (en)
Inventor
赵谦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201811502552.7A priority Critical patent/CN109583413A/zh
Publication of CN109583413A publication Critical patent/CN109583413A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请公开一种数据处理方法及装置,对第一图像中的第一目标对象,获得第一目标对象的第一特征信息,并根据第一特征信息,获得与第一特征信息对应的第一语言,这样在获得输入信息后,可以基于第一语言确定输入信息所对应的第一内容,并将第一内容转换为与第二语言对应的第二内容,输出第二内容,由此可以根据第一图像中第一目标对象的第一特征信息,自动获得第一语言,那么在不同国籍用户沟通的场景下,可以获得任一用户所在环境下的第一图像以获得任一用户使用的语言,从而省去手动选取语言过程,提高沟通的流畅度。并且获得的第一语言是与第一特征信息匹配的语言,由此缩小用来与输入信息匹配的语言数量,提高匹配速率。

Description

一种数据处理方法及装置
技术领域
本申请属于数据处理技术领域,更具体的说,尤其涉及一种数据处理方法及装置。
背景技术
目前具有不同国籍的用户可借助于翻译工具进行沟通,如具有不同国籍的第一用户和第二用户沟通时,第一用户在听取到第二用户的语音的情况下,从第一用户所使用终端上配置的翻译工具中查找与第二用户的语音相匹配的语言,将该相匹配的语言作为第二用户的语言,从而可以将第一用户的语音翻译成符合第二用户的语言要求的语音,但是目前语种选取均需要基于沟通双方中对方(即上述第二用户)的语音,由己方(第一用户)手动选取对方的语言。
发明内容
有鉴于此,本申请的目的在于公开一种数据处理方法及装置,用于根据第一目标对象的第一特征信息,自动获得第一语言。技术方案如下:
本申请公开一种数据处理方法,所述方法包括:
获得第一图像;其中,所述第一图像中包括第一目标对象;
根据所述第一图像,获得所述第一目标对象的第一特征信息;
根据所述第一特征信息,获得与所述第一特征信息对应的第一语言;
获得输入信息,基于所述第一语言确定输入信息所对应的第一内容,其中,所述第一内容不属于所述第一图像;
将所述第一内容转换为与第二语言对应的第二内容,输出所述第二内容;其中,所述第一语言和所述第二语言不同。
优选的,根据所述第一图像,获得所述第一目标对象的第一特征信息包括:
如果所述第一图像中包括至少两个对象,则基于预定策略获得第一目标对象;
获得所述第一目标对象的第一特征信息;其中,所述第一目标对象的第一特征信息用于确定所述第一目标对象的语言。
优选的,所述获得所述第一目标对象的第一特征信息包括:
分析所述第一目标对象,获得所述第一目标对象的面部特征信息;
所述第一目标对象的面部特征信息包括如下至少一种:
面部结构特征、眼睛颜色、肤色。
优选的,所述根据所述第一特征信息,获得与所述第一特征信息对应的第一语言包括:
根据所述第一特征信息从第一语言集合中确定与所述第一特征信息匹配的第二语言集合,所述第二语言集合所包括的语言数量小于所述第一语言集合所包括的语言数量;其中,所述第二语言集合的语言数量为大于等于1的整数;所述第二语言集合中至少包括第一语言。
优选的,所述根据所述第一特征信息,获得与所述第一特征信息对应的第一语言包括:
基于所述第一特征信息识别所述第一目标对象,以确定所述第一目标对象的身份标识,所述第一特征信息为面部结构特征;
基于所述第一目标对象的身份标识登录云端服务器,以确定所述第一目标对象的第一语言。
优选的,所述获得输入信息,基于所述第一语言确定输入信息所对应的第一内容包括:
获得输入信息;
基于所述第二语言集合所包括的多个语言逐一匹配所述输入信息;
如果与所述输入信息匹配成功输出所述第一内容。
优选的,所述方法还包括:
将所述与所述输入信息匹配成功的语言标记为所述第一语言。
优选的,所述方法还包括:
确定第二语言,所述第二语言与第二目标对象对应;
其中,所述确定第二语言包括:
获得第二图像;所述第二图像中包括第二目标对象;
根据所述第二图像,获得所述第二目标对象的第二特征信息;
根据所述第二特征信息,获得与所述第二特征信息对应的第二语言;
或者
如果所述第一图像中包括至少两个对象,则基于识别策略获得第一目标对象和第二目标对象,获得所述第二目标对象的第二特征信息;
根据所述第二特征信息,获得与所述第二特征信息对应的第二语言。
本申请还公开一种数据处理装置,所述装置包括:
图像获得单元,用于获得第一图像;其中,所述第一图像中包括第一目标对象;
特征信息获得单元,用于根据所述第一图像,获得所述第一目标对象的第一特征信息;
语言获得单元,用于根据所述第一特征信息,获得与所述第一特征信息对应的第一语言;
内容确定单元,用于获得输入信息,基于所述第一语言确定输入信息所对应的第一内容,其中,所述第一内容不属于所述第一图像;
转换单元,用于将所述第一内容转换为与第二语言对应的第二内容,输出所述第二内容;其中,所述第一语言和所述第二语言不同。
优选的,所述特征信息获得单元,具体用于如果所述第一图像中包括至少两个对象,则基于预定策略获得第一目标对象,并获得所述第一目标对象的第一特征信息;其中,所述第一目标对象的第一特征信息用于确定所述第一目标对象的语言。
优选的,所述特征信息获得单元,具体用于分析所述第一目标对象,获得所述第一目标对象的面部特征信息;所述第一目标对象的面部特征信息包括如下至少一种:
面部结构特征、眼睛颜色、肤色。
优选的,所述语言获得单元,具体用于根据所述第一特征信息从第一语言集合中确定与所述第一特征信息匹配的第二语言集合,所述第二语言集合所包括的语言数量小于所述第一语言集合所包括的语言数量;其中,所述第二语言集合的语言数量为大于等于1的整数;所述第二语言集合中至少包括第一语言。
优选的,所述语言获得单元,具体用于基于所述第一特征信息识别所述第一目标对象,以确定所述第一目标对象的身份标识,基于所述第一目标对象的身份标识登录云端服务器,以确定所述第一目标对象的第一语言,所述第一特征信息为面部结构特征。
优选的,所述内容确定单元,具体用于获得输入信息,基于所述第二语言集合所包括的多个语言逐一匹配所述输入信息,如果与所述输入信息匹配成功输出所述第一内容。
优选的,所述装置还包括:标记单元,用于将所述与所述输入信息匹配成功的语言标记为所述第一语言。
优选的,所述装置还包括:语言确定单元,用于确定第二语言,所述第二语言与第二目标对象对应;
其中,所述语言确定单元,具体用于获得第二图像,所述第二图像中包括第二目标对象,根据所述第二图像,获得所述第二目标对象的第二特征信息,并根据所述第二特征信息,获得与所述第二特征信息对应的第二语言;
或者
所述语言确定单元,具体用于如果所述第一图像中包括至少两个对象,则基于识别策略获得第一目标对象和第二目标对象,获得所述第二目标对象的第二特征信息,并根据所述第二特征信息,获得与所述第二特征信息对应的第二语言。
本申请还公开一种电子设备,所述电子设备包括处理器和存储器;
所述处理器,用于获得第一图像,根据所述第一图像,获得所述第一图像中的第一目标对象的第一特征信息,根据所述第一特征信息,获得与所述第一特征信息对应的第一语言,获得输入信息,基于所述第一语言确定输入信息所对应的第一内容,并将所述第一内容转换为与第二语言对应的第二内容,输出所述第二内容,其中,所述第一内容不属于所述第一图像,所述第一语言和所述第二语言不同;
所述存储器,用于存储所述第一语言和所述第二语言。
本申请还公开一种存储介质,所述存储介质上存储有计算机程序代码,所述计算机程序代码实现上述数据处理方法。
从上述技术方案可知,对第一图像中的第一目标对象,获得第一目标对象的第一特征信息,并根据第一特征信息,获得与第一特征信息对应的第一语言,这样在获得输入信息后,可以基于第一语言确定输入信息所对应的第一内容,并将第一内容转换为与第二语言对应的第二内容,输出第二内容,由此可以根据第一图像中第一目标对象的第一特征信息,自动获得第一语言,那么在不同国籍用户沟通的场景下,可以获得任一用户所在环境下的第一图像以获得任一用户使用的语言,从而省去手动选取语言过程,提高沟通的流畅度。
并且获得的第一语言是与第一特征信息匹配的语言,在获得输入信息后可以将输入信息与所获得第一语言进行匹配,而不再与现有所有语言进行匹配,由此缩小用来与输入信息匹配的语言数量,提高匹配速率。若再次获得同一个第一目标对象,可以直接采用与第一目标对象的第一特征信息对应的第一语言来匹配输入信息,节省再次从所有语言中获得第一语言的过程,进一步提高匹配速率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例公开的一种数据处理方法的流程图;
图2是本申请实施例公开的数据处理方法对应的一种应用场景图;
图3是本申请实施例公开的数据处理方法对应的另一种应用场景图;
图4是本申请实施例公开的数据处理方法对应的再一种应用场景图;
图5是本申请实施例公开的数据处理方法对应的再一种应用场景图;
图6是本申请实施例公开的数据处理方法对应的再一种应用场景图;
图7是本申请实施例公开的另一种数据处理方法的流程图;
图8是本申请实施例公开的数据处理方法对应的再一种应用场景图;
图9是本申请实施例公开的再一种数据处理方法的流程图;
图10是本申请实施例公开的再一种数据处理方法的流程图;
图11是本申请实施例公开的数据处理方法对应的再一种应用场景图;
图12是本申请实施例公开的数据处理方法对应的再一种应用场景图;
图13是本申请实施例公开的一种数据处理装置的结构示意图;
图14是本申请实施例公开的另一种数据处理装置的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参阅图1,其示出了本申请实施例公开的一种数据处理方法的流程,用于自动获得第一语言,可以包括以下步骤:
101:获得第一图像;其中第一图像中包括第一目标对象,该第一目标对象是第一图像中能够提取到用于识别语言的特征的对象。可以理解的是:第一目标对象可以是人物和具有代表性的景物,其中具有代表性的景物可以是能够体现所属国家的景物,如标志性建筑物和体现国家文化特点的对象,例如体现国家文化特点的对象可以是购物标识和食品等。
之所以人物可以视为是第一目标对象是因为:不同国家的人物的面部特征、服装、配饰、动作中的至少一种会有所不同,而不同国家的人物使用的语言也不同,由此可以通过人物的面部特征、服装、配饰、动作中的至少一种来获得该人物所属国家,进而获得该人物使用的语言,因此可以将人物视为是第一目标对象。该人物可以是第一图像中一个展示载体中的人物,如位于展示载体:广告牌或屏幕中的人物,又或者是与展示载体无关的人物,如第一图像中所拍摄到的人群中的某个人、与第一图像中其他物体有联系的,如坐在第一图像中的椅子上的人等等,只要第一图像中的人物即可,对于人物具体有没有位于展示载体中以及采用什么姿势本实施例不进行限定。
而将标志性建筑视为是第一目标对象的原因是:标志性建筑是一个城市的象征,一个城市隶属一个国家,通过标志性建筑可以联想到该标志性建筑所隶属国家,国家使用的语言是可知的,由此可以将标志性建筑和一个国家使用的语言对应,通过标志性建筑可以获得语言,因此可以将标志性建筑视为是第一目标对象。
对于体现国家文化特点的对象来说,以购物标识为例,购物标识会根据每个国家文化不同而做出一定修改,以使得购物标识符合该国家文化的要求,因此通过购物标识可以对应国家,进而获得国家使用的语言。例如购物标识为:双11、则该购物标识对应的国家为中国,如果购物标识为:黑色星期五,则该购物标识对应的国家为美国,又例如购物标识为:京东或淘宝,则该购物标识对应的国家为中国,对于购物标识在哪展示不进行说明,如购物标识可以展示在广告牌中、屏幕中等。同样的对于食品来说,不同国家的饮食文化不同,导致不同国家使用的食品也会不同,例如日本的饮食有寿司,意大利则有意大利面,因此通过食品也可以对应国家。
102:根据第一图像,获得第一目标对象的第一特征信息。其中第一特征信息会因为选取出的第一目标对象的不同而不同,且第一特征信息需要能够体现出该不同的,也就是说第一特征信息是第一目标对象独有且用于与其他对象进行区分的特征信息,进而可以通过第一特征信息区分第一目标对象和其他对象对应的语言。
例如第一目标对象为人物,不同人物的面部特征信息、动作、服装和配饰会有所不同,由此在第一目标对象为人物的情况下,第一特征信息包括:面部特征信息、动作、服装和配饰中的至少一种。如亚洲人的面部特征信息与非洲人的面部特征信息明显不同,因此可以将面部特征信息作为第一特征信息。
如果第一目标对象为标志性建筑物,标志性建筑物在外形上有所不同,如长城和埃菲尔铁塔,在轮廓和颜色上会不同,因此对于标志性建筑物来说,第一特征信息可以是第一目标对象的轮廓、颜色中的至少一种。
如果第一目标对象为体现国家文化特点的对象,第一特征信息可以是:体现该国家文化的颜色、排版、对象的外形、图文形式等,例如对于购物标识来说,购物标识的第一特征信息可以是:颜色、排版方式、标识形状中的至少一种,对于食品来说,食品的第一特征信息可以是:食品所用材料的外形、烹饪方式和装盘方式中的至少一种。
在本实施例中,第一图像中除包括第一目标对象之外,还包括其他内容,为此获得第一目标对象的第一特征信息的方式可以是:获得第一图像中第一目标对象所在区域的图像,对第一目标对象所在区域的图像进行识别,以此对第一目标对象进行分析来获得第一目标对象的第一特征信息,如通过图像识别技术或预先构建识别模型方式分析第一目标对象,以获得第一目标对象的第一特征信息,对于图像识别技术以及识别模型的构建本实施例不再阐述。
以第一目标对象为人物为例,获得第一目标对象的第一特征信息包括:分析第一目标对象,获得第一目标对象的面部特征信息,其中分析第一目标对象可通过人脸识别技术从一个人物中确定出该人物的脸部,然后再通过人脸识别技术从脸部提取出面部特征信息,当然还可以采用其他技术分析提取,对此本实施例不再一一阐述。
其中第一目标对象的面部特征信息包括如下至少一种:面部结构特征、眼睛颜色、肤色。该肤色可以是脸部的颜色,除面部特征信息之外第一特征信息还可以包括:除面部之外的其他特征信息,如第一目标对象的头发颜色、第一目标对象的颈部颜色、第一目标对象的服饰(服装和配饰)、第一目标对象的动作等。
如果分析出第一目标对象的至少两种类型特征信息,则可以根据预设条件从至少两种类型特征信息中选取一种作为第一特征信息,例如第一目标对象为站在标志性建筑物上的人物,那么在分析过程中可能会将标志性建筑物也作为目标对象提取到,进而使得分析出的第一目标对象的特征信息有:人物的特征信息和标志性建筑物的特征信息,在此种情况下则需要从这两种类型特征信息中选取一种作为第一特征信息。
其中预设条件包括如下至少一种:按照特征优先级获得第一目标对象的第一特征信息,或,按照特征类型获得第一目标对象的第一特征信息。
特征优先级可以是根据第一特征信息能够唯一对应一种语言,或者根据第一特征信息能够提高所确定语言的准确度来设定,在根据特征优先级获得第一目标对象的第一特征信息的方式可以是但不限于是:将特征优先级高于其他特征信息的特征优先级的特征信息作为第一特征信息;特征类型可以是人物类型、景物类型等,按照特征类型获得第一特征信息也可以是基于是否能够唯一对应一种语言或者是否能够提高所确定语言的准确度来获得,对此本实施例不再阐述。
在这里需要说明的一点是:有些情况下第一图像中包括至少两个对象,在此情况下需要基于预定策略获得第一目标对象,然后获得第一目标对象的第一特征信息,其中第一目标对象的第一特征信息用于确定第一目标对象的语言。在本实施例中预定策略包括如下至少一种:
一种方式:将至少两个对象中满足预设朝向的对象作为第一目标对象。所谓预设朝向是指与第二语言相对应的对象的朝向相对,如第二语言相对应的对象为人物,第一语言相对应的对象也为人物,当第一图像中出现多个人物时,将身形朝向面向第二语言相对应的人物定义为第一目标对象;其中,身形朝向可以是人体的膝盖和胸部所对应的朝向。举例:第二语言对应的人物身形朝向北方向,在第一图像中出现朝西的人物、朝东的人物以及朝南的人物,则朝南的人物为第一目标对象,与第二语言对应的人物相匹配。。
另一种方式:将至少两个对象中满足预设动作的对象作为第一目标对象,此种方式特指两个对象均为人物,在人们沟通过程中,可能会作出一些特殊的动作,如摆手打招呼,勾手让对方靠近等,那么可以将这些特殊的动作设置为预设动作,如果检测到第一图像中的至少两个对象中有对象的动作为预设动作,则可以将其作为第一目标对象。
再一种方式:如果至少两个对象的朝向和/或动作相同,以至少两个对象中满足移动轨迹不同于其他对象的对象作为第一目标对象。也就是说通过朝向和/或动作不能从至少两个对象中选取出第一目标对象,则需要借助于移动轨迹这一特征来选取第一目标对象,其中移动轨迹可通过获得多张第一图像确定,通过多张第一图像中同一个对象的位置变化得到该对象的移动轨迹,如果该移动轨迹与其他对象的移动轨迹不同,则将其作为第一目标对象,或者说指定移动轨迹是一个什么类型的轨迹,如移动轨迹可以是逐渐靠近与第二语言对应的对象,逐渐靠近可以通过对象在多张第一图像中体现为:对象逐渐变大,如对象在第一图像中占用的区域逐渐变大,则视为是逐渐靠近。
再一种方式:如果至少两个对象的朝向和/或动作相同,以至少两个对象中满足眼睛朝向预定方向的对象作为第一目标对象,此方式仍是针对通过朝向和/或动作不能从至少两个对象中选取出第一目标对象,其中预定方向是对象的眼睛朝向第二语言对应的对象,即对象正在注视第二语言对应的对象,因为这符合人们沟通过程中眼睛的观看习惯,也可以说,第一目标对象的眼睛的观看方向指向与第二语言相对应的对象的眼睛的观看方向,换句话说两个人物的眼睛相对,以通过各自眼睛可以看到另一方,此时视为满足预定方向。
103:根据第一特征信息,获得与第一特征信息对应的第一语言。可以理解的是:第一特征信息可以表明第一目标对象所属国家或第一目标对象所属洲,而所属国家和所属洲的语言是已知的,因此可以将第一特征信息所指示的国家或洲的语言作为第一特征信息对应的第一语言。
例如第一特征信息为面部特征信息,亚洲人的面部特征信息与非洲人的面部特征信息明显不同,因此通过面部特征信息可以确定第一目标对象所属洲,然后将第一目标对象所属洲的语言作为第一特征信息对应的第一语言,如面部特征信息可以确定第一目标对象所属洲为亚洲,则将中文、韩语和日语视为第一特征信息对应的第一语言。又例如第一特征信息为标志性建筑物的轮廓和/或颜色,通过标志性建筑物的轮廓和/或颜色可以确定第一目标对象所属国家,如对于长城来说,长城的轮廓和颜色与埃菲尔铁塔的轮廓和颜色不同,因此通过长城的轮库和颜色可以确定第一目标对象所属国家为中国,则可以将中文确定为第一特征信息对应的第一语言。
104:获得输入信息,基于第一语言确定输入信息所对应的第一内容,其中第一内容不属于第一图像。
在本实施例中,输入信息可以属于第一图像,即将第一图像中包括第一目标对象和输入信息,如该输入信息可以是第一图像中的一段文字内容,则获得输入信息的方式可以是:通过文本识别方式从第一图像中提取出文字内容作为输入信息,或者该输入信息可以是从第一图像中含有文字内容的对象识别出的内容,则获得输入信息的方式可以是:通过对对象识别,获得对象中含有的文字内容作为输入信息。
例如含有文字内容的对象可以是一个二维码,则可以识别该二维码,获得二维码中包含的内容作为输入信息,又例如含有文字内容的对象可以是一个图标,将从该图标中识别出的内容作为输入信息。
在本实施例中,输入信息可以是某个对象输入的信息,如第一目标对象为人物的情况下,输入信息可以是第一目标对象输入的文字信息、语音信息等中的任意一种,这些文字信息和语音信息可以是第一目标对象自己说出的信息,或者是第一目标对象从其他设备中获得的信息。
而基于第一语言确定输入信息所对应的第一内容的可行方式是:将第一语言和输入信息对应,以获得第一内容,例如基于第一语言对输入信息进行标注,以获得标注属于第一语言的输入信息,这个标注有属于第一语言的输入信息可以作为第一内容。以第一语言是英语为例,获得输入信息1之后,为输入信息1添加上英语标签,则添加有英语标签的输入信息可以作为第一内容。例如:当获取一段输入信息,设备本身不知输入信息所对应的语种,通过第一特征确定输入信息的语言为英语,则第一内容为英语输入信息。
105:将第一内容转换为与第二语言对应的第二内容,输出第二内容,其中第一语言和第二语言不同。该第二语言是目前需要得到内容对应的目标语言,例如在双方沟通过程中,第一内容可以是双方中一方的内容,需要将该第一内容转换为双方中另一方的内容,而另一方对应的语言则是第二语言(目标语言),对于将第一内容转换为与第二语言对应的第二内容采用的手段,本实施例不进行限定。
输出第二内容的方式可以有:以语音方式和/或显示方式输出第二内容,其中以显示方式输出第二内容可以是:显示在电子设备的显示区域、通过投影设备显示、通过抬头显示方式显示中的至少一种。
下面通过几种应用场景对本实施例提供的数据处理方法进行说明,在这些应用场景下,实施数据处理方法的可以是具备拍摄功能的电子设备,或者是能够从其他设备中获得第一图像但能够获得第一目标对象的第一特征信息的设备,在图2所示应用场景中,由穿戴设备如图2中的眼镜实施数据处理方法,该眼镜中集成有摄像头,以通过摄像头来获得第一图像。并且图2所示应用场景为一翻译场景,在该翻译场景中沟通双方的一方(简称第一用户)佩戴有眼镜,通过眼镜中的摄像头获得包括沟通双方的另一方(简称第二用户)的第一图像,且第二用户为第一目标对象。
在获得第一图像之后,通过人脸识别技术得到第一图像中第二用户的面部特征信息(第一特征信息的一种形式),然后根据面部特征信息确定第二用户所属洲为亚洲,则获得与面部特征信息对应的第一语言为:中文、韩语和日语,这样在获得第二用户的输入信息(如第二用户说的一段话),确定输入信息所对应的第一内容可以是:分别标注有中文、韩语和日语的输入信息,进而将这些第一内容转换为与第二语言对应的第二内容,并输出第二内容。其中第二语言可以是第一用户的语言,由此可以将第一内容转换为第一用户的语言对应的第二内容,实现自动翻译。
此外还可以在实施数据处理方法的设备中配置有其他部件,如声音采集部件和播放部件,如麦克风和耳机,通过耳机可以播放第二内容,通过麦克风可以获得第一用户的语音信息(视为是第一用户的输入信息的一种形式),从而将第一用户的语音信息转换为上述第一语言对应的第三内容,并输出第三内容,实现翻译场景中语言自动确定和自动翻译。
在图3所示应用场景中,第二用户不在用于拍摄第一图像的设备的拍摄范围,如第二用户不在第一用户佩戴的眼镜的拍摄范围,此时眼镜可以拍摄到第一用户前方的景物,如拍摄到的第一图像中包括某个标志性建筑物,该标志性建筑物则视为是第一目标对象,所获得的第一特征信息是标志性建筑物的轮廓和颜色,且根据轮廓和颜色可以确定标志性建筑物为东京塔,而东京塔属于日本,由此可以获得第一特征信息对应的第一语言为日语,在获得输入信息后,可以基于日语确定第一内容,再将第一内容转换为与第二语言对应的第二内容输出。
图4和图5示出了另两个应用场景,在这两个应用场景中第一用户和第二用户位于一个会议中,通过会议中的投影仪可以获得第一图像,并将第一图像发送给第一用户和第二用户中至少一个用户使用的电子设备中,以发送至第一用户使用的电子设备中为例进行说明,通过投影仪获得的第一图像中包括有一广告策划文案,该广告策划文案中包括一个购物标识,而不同国家购物标识有所不同,由此可以将第一图像中的购物标识视为是第一目标对象。
经过对购物标识分析,获得第一特征信息有:颜色、标识形状、排版方式中的至少一种,并且根据第一特征信息可以确定购物标识为黑色星期五的购物标识,而黑色星期五属于美国的购物节,由此根据该购物标识可以获得第一语言为英语。
但是图4和图5所示应用场景中不同之处在于:在图4的第一图像中可以获得输入信息,例如将第一图像的广告策划文案中的文字内容作为输入信息,而在图5对应的应用场景中输入信息是第二用户给出的语音内容,对于这两种形式的输入信息,可以基于英语确定这两种形式的输入信息各自对应的第一内容,然后将第一内容转换为与第二语言对应的第二内容输出,其中第二语言可以是第一用户使用的语言。
图6示出了本申请实施例公开的数据处理方法对应的再一种应用场景,该应用场景与上述图2所示应用场景的不同之处在于:作为第一目标对象的人物位于一个展示载体中,如广告牌、屏幕、橱窗等,在图6中以广告牌为例。对于位于广告牌中的人物,同样可以分析该人物来获得人物的第一特征信息,以获得第一特征信息对应的第一语言。相对于图2来说,图6所示应用场景中输入信息可以是其他对象给出的输入信息,如其他人物给出的输入信息,例如位于广告牌附近的某个用户的语音信息,当然也可以从广告牌中获得输入信息,对于输入信息的处理不再详述。
从上述技术方案可知,对第一图像中的第一目标对象,获得第一目标对象的第一特征信息,并根据第一特征信息,获得与第一特征信息对应的第一语言,这样在获得输入信息后,可以基于第一语言确定输入信息所对应的第一内容,并将第一内容转换为与第二语言对应的第二内容,输出第二内容,由此可以根据第一图像中第一目标对象的第一特征信息,自动获得第一语言,那么在不同国籍用户沟通的场景下,可以获得任一用户所在环境下的第一图像以获得任一用户使用的语言,从而省去手动选取语言过程,提高沟通的流畅度。
并且获得的第一语言是与第一特征信息匹配的语言,在获得输入信息后可以将输入信息与所获得第一语言进行匹配,而不再与现有所有语言进行匹配,由此缩小用来与输入信息匹配的语言数量,提高匹配速率。若再次获得同一个第一目标对象,基于语言标记,可以直接采用与第一目标对象的第一特征信息对应的第一语言来匹配输入信息,节省再次从所有语言中获得第一语言的过程,进一步提高匹配速率。
请参阅图7,其示出了本申请实施例公开的另一种数据处理方法的流程图,可以包括以下步骤:
701:获得第一图像;其中第一图像中包括第一目标对象。
702:根据第一图像,获得第一目标对象的第一特征信息。
在本实施例中,步骤701和步骤702:与上述步骤101和步骤102相同,对此本实施例不再阐述。
703:根据第一特征信息从第一语言集合中确定与第一特征信息匹配的第二语言集合。
在本实施例中,第一语言集合可以是目前所有语言的集合,在获得第一特征信息的情况下,可以从第一语言集合的所有语言中选取出与第一特征信息匹配的语言,将这些与第一特征信息匹配的语言组成第二语言集合。由于是第二语言集合中的语言是:从第一语言集合中的语言中选出的与第一特征信息匹配的语言,所以第二语言集合所包括的语言数量小于第一语言集合所包括的语言数量。而根据第一特征信息可以匹配出至少一种语言,如第一语言,因此第二语言集合的语言数量为大于等于1的整数,具体数量视第一特征信息而定。
如果第一特征信息是面部特征信息,根据面部特征信息确定出第一目标对象所属洲,则可以从第一语言集合中匹配出该洲中的国家使用的语言,由该洲中的国家使用的语言组成第二语言集合。当然第二语言集合也存在包括一种语言,即第一语言的情况,如第一特征信息是标志性建筑物的特征信息,根据该特征信息能确定出所属国家,若该国家仅使用一种语言,则第二语言集合仅包括第一语言,语言数量为1。
704:获得输入信息,基于第一语言确定输入信息所对应的第一内容,其中第一内容不属于第一图像。在本实施例中第一内容的确定方式如下:
获得输入信息;基于第二语言集合所包括的多个语言逐一匹配输入信息,如果与输入信息匹配成功输出第一内容。其中输入信息的获得方式可以参阅上述方法实施例中的相关说明,而第二语言集合中有多个语言,第一内容是将多个语言和输入信息逐一匹配时语言与输入信息匹配成功时输出第一内容,也就是说输入信息对应的语言是匹配成功时的语言,在此时输出第一内容,对于第一内容的说明请参阅上述方法实施例中的相关说明。
虽然需要基于第二语言集合所包括的多个语言逐一匹配输入信息,但是第二语言集合所包括的语言数量相对于第一语言集合所包括的语言数量已经明显缩小,相对于现有从第一语言集合所包括的语言进行匹配来说,缩小输入信息的匹配范围,并提高匹配速率。例如第一语言集合所包括的语言有20多种,而第二语言集合所包括的语言有3种,实现缩小匹配范围和提高匹配速度的目的。
在这里需要说明的一点是:基于第二语言集合中的语言,需要将输入信息与第二语言集合中的多个语言逐一匹配,如逐一尝试第二语言集合中的每个语言,以找到与输入信息匹配的,在此情况下,本实施例还可以在第一特征信息中引入更多信息以进一步缩小第二语言集合所包括的语言数量,例如第一特征信息包括至少两种类型的特征信息,如上述面部特征信息和标志性建筑物的特征信息,当然除上述类型的特征信息之外,还可以引入位置信息等等能够再次缩小语言数量的特征信息。
705:将第一内容转换为与第二语言对应的第二内容,输出第二内容,其中第一语言和第二语言不同,过程请参阅上述方法实施例中的相关说明。
从上述技术方案可知,根据第一特征信息,可以从现有语言中获得与第一特征信息相匹配的多个语言,然后将输入信息与这多个语言进行逐一匹配,相对于与现有所有语言的逐一匹配来说,缩小逐一匹配的语言数量,从而缩小匹配范围,提高匹配速率。此外在根据第一特征信息缩小匹配范围之后,还可以采用其他信息对第二语言集合中的语言进行再次筛选,以进一步的缩小匹配范围。
下面以图8所示应用场景进行说明,根据第一目标对象的面部特征信息,确定第一目标对象为亚洲人,由此从第一语言集合中获得与面部特征信息匹配的语言有:中文、韩语和日语,从而从亚洲、非洲、欧洲等各个国家使用的语言中筛选出了能够匹配面部特征信息的几种语言。在基于面部特征信息筛选出语言:中文、韩语和日语之后,还可以进行再次筛选,如获得第一目标对象的位置信息(如借助于GPS技术等),根据第一目标对象的位置信息,确定第一目标对象当前位于韩国,则可以从筛选出的语言中获得与位置信息匹配的语言为韩语,由此将韩语作为第一语言,从而再次缩小匹配范围。
上述图8是以面部特征信息和位置信息相结合来说明如何缩小匹配范围,在实际应用中并不限于这两种信息,如可以将面部特征信息、标志性建筑物的特征信息和其他类型的特征信息中的至少两种相结合,对此本实施例不再一一说明。
此外在与输入信息匹配成功之后,本实施例公开的数据处理方法还可以包括:将与输入信息匹配成功的语言标记为第一语言,由此可以从第二语言集合的多个语言中确定出一种语言来作为第一语言,这样后续再次获得输入信息,可以直接基于所确定出的第一语言,获得第一内容,无需与第二语言集合的多个语言逐一匹配,实现进一步缩小匹配范围的效果。
请参阅图9,其示出了本申请实施例公开的再一种数据处理方法的流程,在图9所示数据处理方法中,第一特征信息特指面部结构特征,阐述基于面部结构特征来获得第一语言的过程,可以包括以下步骤:
901:获得第一图像;其中第一图像中包括第一目标对象。
902:根据第一图像,获得第一目标对象的第一特征信息。
在本实施例中,步骤901和步骤902:与上述步骤101和步骤102相同,对此本实施例不再阐述。
903:基于第一特征信息识别第一目标对象,以确定第一目标对象的身份标识。由于第一特征信息为面部结构特征,而每个人的面部结构特征会有所不同,所以基于第一特征信息可以确定该面部结构特征对应哪位用户,例如基于面部结构特征1识别第一目标对象为用户1,基于面部结构特征2识别第一目标对象为用户2。
对于每个用户来说,可以通过身份标识来唯一表示其身份,因此在识别到第一目标对象之后,可以确定该第一目标对象的身份标识,其中身份标识可以是:用户的姓名、用户使用的账户名称等等,对此本实施例不进行限定。
904:基于第一目标对象的身份标识登陆云端服务器,以确定第一目标对象的第一语言。其中云端服务器存储有:第一目标对象的身份标识和第一目标对象使用的第一语言,并且将两者进行对应,因此在以第一目标对象的身份标识登陆至云端服务器之后,基于第一目标对象的身份标识确定与其对应的第一语言,所确定的第一语言则是第一目标对象的第一语言。
或者,对于云端服务器来说,第一目标对象在通过第一目标对象的身份标识登陆到云端服务器之后,云端服务器仅显示该第一目标对象的相关信息,如第一目标对象的第一语言,因此从云端服务器显示的内容中可以确定出第一目标对象的第一语言。
905:获得输入信息,基于第一语言确定输入信息所对应的第一内容,其中第一内容不属于第一图像。
在本实施例中,如果确定的第一目标对象的第一语言是多个(适用于第一目标对象会多国语言的情况),则可以基于确定出的多个语言逐一匹配输入信息,如果与输入信息匹配成功输出第一内容。如果确定的第一目标对象的第一语言是一个,则可以省去逐一匹配过程,直接输出该输入信息所对应的第一内容。对于输入信息所对应的第一内容的获得过程可以参阅上述方法实施例中的说明,对此本实施例不再阐述。
此外在与输入信息匹配成功之后,本实施例公开的数据处理方法还可以包括:将与输入信息匹配成功的语言标记为第一语言,由此可以基于第一目标对象的身份标识确定出的多个语言中获得一种语言来作为第一语言,这样后续再次获得输入信息,可以直接基于所获得的第一语言,获得第一内容,无需与多个语言逐一匹配,实现进一步缩小匹配范围的效果。
906:将第一内容转换为与第二语言对应的第二内容,输出第二内容,其中第一语言和第二语言不同,过程请参阅上述方法实施例中的相关说明。
从上述技术方案可知,基于第一特征信息识别第一目标对象,以确定第一目标对象的身份标识,基于第一目标对象的身份标识登陆云端服务器,以确定第一目标对象的第一语言,实现基于第一目标对象的身份标识匹配出第一语言,相对于与现有所有语言的逐一匹配来说,也可以缩小逐一匹配的语言数量,从而缩小匹配范围,提高匹配速率。
例如基于面部特征信息识别第一目标对象为王五,云端服务器中存储有王五使用的第一语言,因此通过王五的身份标识,如王五在云端服务器中注册的账号登录到云端服务器上,从云端服务器中获得王五使用的语言,所获得的语言视为是王五的第一语言,那么在获得王五对应的输入信息,则可以直接使用该第一语言进行匹配,缩小匹配范围。并且在与王五结束本次沟通后,如果再次基于面部特征信息识别到第一目标对象为王五,则可以直接使用王五使用的第一语言与输入信息进行匹配,而无需再次登录到云端服务器。
请参阅图10,其示出了本申请实施例公开的再一种数据处理方法的流程,可以包括以下步骤:
1001:获得第一图像;其中第一图像中包括第一目标对象。
1002:根据第一图像,获得第一目标对象的第一特征信息。
1003:根据第一特征信息,获得与第一特征信息对应的第一语言。
1004:获得输入信息,基于第一语言确定输入信息所对应的第一内容,其中第一内容不属于第一图像。
在本实施例中,步骤1001至步骤1004:与上述步骤101至步骤104相同,对此本实施例不再对步骤1001至步骤1004进行说明。
1005:确定第二语言,第二语言与第二目标对象对应。其中第二语言可以基于实施数据处理方法的电子设备使用的语言,如实施数据处理方法的电子设备是手机,手机上会将用户常用的语言作为默认语言,由此可以从电子设备的菜单中获取默认语言作为第二语言。
在本实施例中,第二语言的确定方式还可以采用如下方式:
一种方式:获得第二图像,其中第二图像中包括第二目标对象;根据第二图像,获得第二目标对象的第二特征信息,并根据第二特征信息,获得与第二特征信息对应的第二语言,此方式与获得与第一特征信息对应的第一语言的过程相同,对此本实施例不再对此方式中各步骤进行详细说明。
另一种方式:如果第一图像中包括至少两个对象,则基于识别策略获得第一目标对象和第二目标对象,获得第二目标对象的第二特征信息,并根据第二特征信息,获得与第二特征信息对应的第二语言。
其中识别策略用于表明从第一图像中的多个对象中选取第一目标对象和第二目标对象的策略,例如第一目标对象和第二目标对象可以是:人物和具有代表性的景物,其中具有代表性的景物可以是能够体现所属国家的景物,如标志性建筑物和体现国家文化特点的对象,例如体现国家文化特点的对象可以是购物标识和食品等,那么识别策略则是能够识别出这些对象的策略。
在获得第一目标对象和第二目标对象之后,获得第二目标对象的第二特征信息以及获得与第二特征信息对应的第二语言的说明请参阅第一特征信息的相关内容的说明,对此本实施例不再阐述。
但是此处需要说明的一点是:第一目标对象和第二目标对象可以是相同类型的对象,如第一目标对象和第二目标对象都是人物,或者第一目标对象和第二目标对象是不同类型的对象,如第一目标对象和第二目标对象其中之一是人物,另一个是具有代表性的景物。
1006:将第一内容转换为与第二语言对应的第二内容,输出第二内容,其中第一语言和第二语言不同,过程请参阅上述方法实施例中的相关说明,对此本实施例不再阐述。
下面结合应用场景,对图10所示数据处理方法进行说明,请参阅图11,其示出了一种应用场景图,在该应用场景中两个用户(为了描述方便称为第一用户和第二用户)在一个会议中,且第一用户和第二用户的电子设备(图11中以眼镜作为电子设备为例)均能够获得另一个用户的图像,如第一用户的电子设备获得包括第二用户的第二图像,第二用户的电子设备获得包括第一用户的第一图像,则第一用户可以是第一目标对象,第二用户是第二目标对象,每个电子设备均能够实施数据处理方法,以第一用户的电子设备实施为例进行说明。
第一用户的电子设备可以获得第一图像和获得第二用户的电子设备发送的第二图像,根据第一图像和第二图像,获得第一目标对象的第一特征信息和第二目标对象的第二特征信息,然后获得与第一特征信息对应的第一语言和与第二特征信息对应的第二语言。第一用户的电子设备在获得输入信息之后,由于该电子设备所在场景中有第一用户和第二用户,所以该电子设备能够获得第一用户给出的输入信息和第二用户给出的输入信息,这就意味着在获得输入信息之后无法确定输入信息对应哪个目标对象,进而无法确定输入信息对应哪个语言,使得电子设备需要从第一语言和第二语言中逐一与输入信息匹配,如果匹配成功输出第一内容,然后将第一内容转换为另一个没有匹配成功的语言对应的第二内容。
图12是本申请实施例公开的另一个应用场景,该应用场景是一个多人会议场景,通过该多人会议场景中的同声传译设备实施上述图10所示数据处理方法,且同声传译设备可以获得包括多个对象的第一图像,由同声传译设备从第一图像中获得第一目标对象和第二目标对象,进而根据第一图像,获得第一目标对象的第一特征信息和获得第二目标对象的第二特征信息,进一步的获得与第一特征信息对应的第一语言和与第二特征信息对应的第二语言。也就是说,在至少两人的会议中,将会议中出现的对象的语言集合中匹配输入信息所对应的语言,可以缩小与输入信息匹配的语言数量,提高匹配速率。
同声传译设备在获得输入信息之后,由于同声传译设备对应多个目标对象,所以同声传译设备在获得输入信息之后无法确定该输入信息对应哪个目标对象,使得同声传译设备需要从第一语言和第二语言中逐一与输入信息匹配,如果匹配成功输出第一内容,然后将第一内容转换为另一个没有匹配成功的语言对应的第二内容。
假设上述图11和图12中实施数据处理方法的设备在获得输入信息之后能够确定该输入信息对应哪个语言,则可以基于所确定出的语言确定输入信息所对应的内容,然后将该内容转换为另一个语言对应的内容。
其中确定出输入信息对应语言的一种方式是:如果实施上述数据处理方法的电子设备,在获得输入信息过程中还可以获得仅包括一个目标对象的图像,则可以通过该图像获得目标对象的特征信息,以获得相对应的语言,所获得的相对应的语言则是输入信息对应的语言。为了能够获得仅包括一个目标对象的图像,其方式可以是:在采集输入信息时将电子设备对焦给出输入信息的对象,从而获得仅包括一个目标对象的图像,基于此确定出输入信息对应语言的另一种方式可以是:基于电子设备的朝向,确定电子设备对应的目标对象,而目标对象对应的语言已知(根据目标对象的特征信息确定出),因此可以确定出输入信息对应的语言。
上述是以第一目标对象和第二目标对象进行说明,在实际应用中还可以有除第一目标对象和第二目标对象之外的其他目标对象,如第三目标对象和第四目标对象,同样基于本实施例公开的数据处理方法也可以确定第三目标对象的第三语言和第四目标对象的第四语言,确定方式可以参阅确定第二目标对象的第二语言,由此可以满足两人以上的沟通需求。
在这里需要说明的一点是:如果实施上述数据处理方法的电子设备获得至少两张图像,则需要从这多张图像中选取一张图像作为第一图像,如选取方式可以是:将使用电子设备的第一对象满足预设姿态所获得的图像作为第一图像,或者将使用电子设备的第一对象的姿态满足预设停留时长所获得的图像作为第一图像。
对于预设姿态和预设停留时长可以根据实际应用而定,例如预设姿态可以是第一对象的视野范围正对目标对象的姿态,该目标对象是能够得到用于获得语言的特征信息的对象,且在第一对象是用户时视野范围是眼睛的观看范围,在此情况下预设姿态可以是用户的头部和身体位于一条直线上。
相对于预设停留时长则是第一对象维持一个姿态,且足以在该姿态下获得图像的一个时长,具体取值可以根据实际应用而定,对此本实施例不进行限定。
与上述方法实施例相对应,本申请实施例还公开一种数据处理装置,其结构如图13所示,可以包括:图像获得单元11、特征信息获得单元12、语言获得单元13、内容确定单元14和转换单元15。
图像获得单元11,用于获得第一图像。其中,第一图像中包括第一目标对象,该第一目标对象是第一图像中能够提取到用于识别语言的特征的对象。可以理解的是:第一目标对象可以是人物和具有代表性的景物,其中具有代表性的景物可以是能够体现所属国家的景物,如标志性建筑物和体现国家文化特点的对象,例如体现国家文化特点的对象可以是购物标识和食品等,具体说明请参阅方法实施例。
特征信息获得单元12,用于根据第一图像,获得第一目标对象的第一特征信息。其中第一特征信息会因为选取出的第一目标对象的不同而不同,且第一特征信息需要能够体现出该不同的,也就是说第一特征信息是第一目标对象独有且用于与其他对象进行区分的特征信息,进而可以通过第一特征信息区分第一目标对象和其他对象对应的语言。
例如第一目标对象为人物,不同人物的面部特征信息、动作、服装和配饰会有所不同,由此在第一目标对象为人物的情况下,第一特征信息包括:面部特征信息、动作、服装和配饰中的至少一种。如亚洲人的面部特征信息与非洲人的面部特征信息明显不同,因此可以将面部特征信息作为第一特征信息。相对应的特征信息获得单元12具体用于分析第一目标对象,获得第一目标对象的面部特征信息。第一目标对象的面部特征信息包括如下至少一种:面部结构特征、眼睛颜色、肤色。该肤色可以是脸部的颜色,除面部特征信息之外第一特征信息还可以包括:除面部之外的其他特征信息,如第一目标对象的头发颜色、第一目标对象的颈部颜色、第一目标对象的服饰(服装和配饰)、第一目标对象的动作等。
在这里需要说明的一点是:有些情况下第一图像中包括至少两个对象,在此情况下特征信息获得单元12需要基于预定策略获得第一目标对象,然后获得第一目标对象的第一特征信息,其中第一目标对象的第一特征信息用于确定第一目标对象的语言,在本实施例中预定策略的方式可参阅上述方法实施例中的说明。
语言获得单元13,用于根据第一特征信息,获得与第一特征信息对应的第一语言。可以理解的是:第一特征信息可以表明第一目标对象所属国家或第一目标对象所属洲,而所属国家和所属洲的语言是已知的,因此可以将第一特征信息所指示的国家或洲的语言作为第一特征信息对应的第一语言。
在本实施例中,语言获得单元13获得第一语言的方式有如下但不限于如下方式:
一种方式:语言获得单元13根据第一特征信息从第一语言集合中确定与第一特征信息匹配的第二语言集合,第二语言集合所包括的语言数量小于第一语言集合所包括的语言数量。其中,第二语言集合的语言数量为大于等于1的整数。第二语言集合中至少包括第一语言。
另一种方式:语言获得单元13基于第一特征信息识别第一目标对象,以确定第一目标对象的身份标识,基于第一目标对象的身份标识登录云端服务器,以确定第一目标对象的第一语言,第一特征信息为面部结构特征。
对于上述两种方式的说明请参阅方法实施例,对此本实施例不再阐述。并且通过上述两种方式相对于现有从所有语言中匹配来说,均可以缩小匹配范围,提高匹配速率。
内容确定单元14,用于获得输入信息,基于第一语言确定输入信息所对应的第一内容,其中,第一内容不属于第一图像,基于第一语言确定输入信息所对应的第一内容的可行方式是:将第一语言和输入信息对应,以获得第一内容,例如基于第一语言对输入信息进行标注,以获得标注属于第一语言的输入信息,这个标注有属于第一语言的输入信息可以作为第一内容。以第一语言是英语为例,获得输入信息1之后,为输入信息1添加上英语标签,则添加有英语标签的输入信息可以作为第一内容,对于输入信息的说明请参阅方法实施例。
在这需要说明一点:如果第一语言有多种,则内容确定单元14的执行过程是:获得输入信息,基于第二语言集合所包括的多个语言逐一匹配输入信息,如果与输入信息匹配成功输出第一内容。相对应的,本实施例提供的数据处理装置还包括:标记单元,用于将与输入信息匹配成功的语言标记为第一语言,由此可以从多个语言中确定出一种语言来作为第一语言,这样后续再次获得输入信息,可以直接基于所确定出的第一语言,获得第一内容,无需与第二语言集合的多个语言逐一匹配,实现缩小匹配范围的效果。
转换单元15,用于将第一内容转换为与第二语言对应的第二内容,输出第二内容。其中,第一语言和第二语言不同。该第二语言是目前需要得到内容对应的目标语言,例如在双方沟通过程中,第一内容可以是双方中一方的内容,需要将该第一内容转换为双方中另一方的内容,而另一方对应的语言则是第二语言(目标语言),对于将第一内容转换为与第二语言对应的第二内容采用的手段,本实施例不进行限定。
从上述技术方案可知,对第一图像中的第一目标对象,获得第一目标对象的第一特征信息,并根据第一特征信息,获得与第一特征信息对应的第一语言,这样在获得输入信息后,可以基于第一语言确定输入信息所对应的第一内容,并将第一内容转换为与第二语言对应的第二内容,输出第二内容,由此可以根据第一图像中第一目标对象的第一特征信息,自动获得第一语言,那么在不同国籍用户沟通的场景下,可以获得任一用户所在环境下的第一图像以获得任一用户使用的语言,从而省去手动选取语言过程,提高沟通的流畅度。
请参阅图14,其示出了本申请实施例公开的另一种数据处理装置的结构,在图13基础上还可以包括:语言确定单元16,用于确定第二语言,第二语言与第二目标对象对应,从而实现第二语言的自动确定。
其中,语言确定单元确定第二语言的方式有如下但不限于如下方式:
一种方式:语言确定单元16获得第二图像,第二图像中包括第二目标对象,根据第二图像,获得第二目标对象的第二特征信息,并根据第二特征信息,获得与第二特征信息对应的第二语言。
另一种方式:语言确定单元16用于如果第一图像中包括至少两个对象,则基于识别策略获得第一目标对象和第二目标对象,获得第二目标对象的第二特征信息,并根据第二特征信息,获得与第二特征信息对应的第二语言。
此外本申请实施例还公开一种电子设备,电子设备包括处理器和存储器。
处理器,用于获得第一图像,根据第一图像,获得第一图像中的第一目标对象的第一特征信息,根据第一特征信息,获得与第一特征信息对应的第一语言,获得输入信息,基于第一语言确定输入信息所对应的第一内容,并将第一内容转换为与第二语言对应的第二内容,输出第二内容,其中,第一内容不属于第一图像,第一语言和第二语言不同,对于处理器的执行过程的说明请参阅上述方法实施例。存储器,用于存储第一语言和第二语言。
本申请实施例还公开一种存储介质,存储介质上存储有计算机程序代码,计算机程序代码实现上述数据处理方法。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种数据处理方法,所述方法包括:
获得第一图像;其中,所述第一图像中包括第一目标对象;
根据所述第一图像,获得所述第一目标对象的第一特征信息;
根据所述第一特征信息,获得与所述第一特征信息对应的第一语言;
获得输入信息,基于所述第一语言确定输入信息所对应的第一内容,其中,所述第一内容不属于所述第一图像;
将所述第一内容转换为与第二语言对应的第二内容,输出所述第二内容;其中,所述第一语言和所述第二语言不同。
2.根据权利要求1所述的方法,根据所述第一图像,获得所述第一目标对象的第一特征信息包括:
如果所述第一图像中包括至少两个对象,则基于预定策略获得第一目标对象;
获得所述第一目标对象的第一特征信息;其中,所述第一目标对象的第一特征信息用于确定所述第一目标对象的语言。
3.根据权利要求1所述的方法,所述获得所述第一目标对象的第一特征信息包括:
分析所述第一目标对象,获得所述第一目标对象的面部特征信息;
所述第一目标对象的面部特征信息包括如下至少一种:
面部结构特征、眼睛颜色、肤色。
4.根据权利要求3所述的方法,所述根据所述第一特征信息,获得与所述第一特征信息对应的第一语言包括:
根据所述第一特征信息从第一语言集合中确定与所述第一特征信息匹配的第二语言集合,所述第二语言集合所包括的语言数量小于所述第一语言集合所包括的语言数量;其中,所述第二语言集合的语言数量为大于等于1的整数;所述第二语言集合中至少包括第一语言。
5.根据权利要求3所述的方法,所述根据所述第一特征信息,获得与所述第一特征信息对应的第一语言包括:
基于所述第一特征信息识别所述第一目标对象,以确定所述第一目标对象的身份标识,所述第一特征信息为面部结构特征;
基于所述第一目标对象的身份标识登录云端服务器,以确定所述第一目标对象的第一语言。
6.根据权利要求4所述的方法,所述获得输入信息,基于所述第一语言确定输入信息所对应的第一内容包括:
获得输入信息;
基于所述第二语言集合所包括的多个语言逐一匹配所述输入信息;
如果与所述输入信息匹配成功输出所述第一内容。
7.根据权利要求6所述的方法,所述方法还包括:
将所述与所述输入信息匹配成功的语言标记为所述第一语言。
8.根据权利要求1所述的方法,所述方法还包括:
确定第二语言,所述第二语言与第二目标对象对应;
其中,所述确定第二语言包括:
获得第二图像;所述第二图像中包括第二目标对象;
根据所述第二图像,获得所述第二目标对象的第二特征信息;
根据所述第二特征信息,获得与所述第二特征信息对应的第二语言;
或者
如果所述第一图像中包括至少两个对象,则基于识别策略获得第一目标对象和第二目标对象,获得所述第二目标对象的第二特征信息;
根据所述第二特征信息,获得与所述第二特征信息对应的第二语言。
9.一种数据处理装置,所述装置包括:
图像获得单元,用于获得第一图像;其中,所述第一图像中包括第一目标对象;
特征信息获得单元,用于根据所述第一图像,获得所述第一目标对象的第一特征信息;
语言获得单元,用于根据所述第一特征信息,获得与所述第一特征信息对应的第一语言;
内容确定单元,用于获得输入信息,基于所述第一语言确定输入信息所对应的第一内容,其中,所述第一内容不属于所述第一图像;
转换单元,用于将所述第一内容转换为与第二语言对应的第二内容,输出所述第二内容;其中,所述第一语言和所述第二语言不同。
10.一种电子设备,所述电子设备包括处理器和存储器;
所述处理器,用于获得第一图像,根据所述第一图像,获得所述第一图像中的第一目标对象的第一特征信息,根据所述第一特征信息,获得与所述第一特征信息对应的第一语言,获得输入信息,基于所述第一语言确定输入信息所对应的第一内容,并将所述第一内容转换为与第二语言对应的第二内容,输出所述第二内容,其中,所述第一内容不属于所述第一图像,所述第一语言和所述第二语言不同;
所述存储器,用于存储所述第一语言和所述第二语言。
CN201811502552.7A 2018-12-10 2018-12-10 一种数据处理方法及装置 Pending CN109583413A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811502552.7A CN109583413A (zh) 2018-12-10 2018-12-10 一种数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811502552.7A CN109583413A (zh) 2018-12-10 2018-12-10 一种数据处理方法及装置

Publications (1)

Publication Number Publication Date
CN109583413A true CN109583413A (zh) 2019-04-05

Family

ID=65927910

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811502552.7A Pending CN109583413A (zh) 2018-12-10 2018-12-10 一种数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN109583413A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110072075A (zh) * 2019-04-30 2019-07-30 平安科技(深圳)有限公司 一种基于人脸识别的会议管理方法、系统和可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103699527A (zh) * 2013-12-20 2014-04-02 上海合合信息科技发展有限公司 图像翻译系统及图像翻译方法
CN103941870A (zh) * 2014-04-21 2014-07-23 百度在线网络技术(北京)有限公司 头戴式显示设备
CN105758414A (zh) * 2016-02-17 2016-07-13 广东小天才科技有限公司 切换车载导航的语言的方法及装置
CN106649290A (zh) * 2016-12-21 2017-05-10 上海木爷机器人技术有限公司 语音翻译方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103699527A (zh) * 2013-12-20 2014-04-02 上海合合信息科技发展有限公司 图像翻译系统及图像翻译方法
CN103941870A (zh) * 2014-04-21 2014-07-23 百度在线网络技术(北京)有限公司 头戴式显示设备
CN105758414A (zh) * 2016-02-17 2016-07-13 广东小天才科技有限公司 切换车载导航的语言的方法及装置
CN106649290A (zh) * 2016-12-21 2017-05-10 上海木爷机器人技术有限公司 语音翻译方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110072075A (zh) * 2019-04-30 2019-07-30 平安科技(深圳)有限公司 一种基于人脸识别的会议管理方法、系统和可读存储介质
CN110072075B (zh) * 2019-04-30 2022-05-13 平安科技(深圳)有限公司 一种基于人脸识别的会议管理方法、系统和可读存储介质

Similar Documents

Publication Publication Date Title
US20230283654A1 (en) Realistic neural network based image style transfer
CN110968736B (zh) 视频生成方法、装置、电子设备及存储介质
US7764828B2 (en) Method, apparatus, and computer program for processing image
CN110557678B (zh) 视频处理方法、装置及设备
US11900565B2 (en) Deep feature generative adversarial neural networks
CN109729420A (zh) 图片处理方法及装置、移动终端及计算机可读存储介质
CN114787813A (zh) 上下文敏感化身字幕
CN108885639A (zh) 内容集合导航和自动转发
US11423652B2 (en) Adding beauty products to augmented reality tutorials
US11657575B2 (en) Generating augmented reality content based on third-party content
US20190222806A1 (en) Communication system and method
CN102271241A (zh) 一种基于面部表情/动作识别的图像通信方法及系统
US20230154042A1 (en) Skeletal tracking using previous frames
CN112513875B (zh) 眼部纹理修复
CN111243101A (zh) 基于人工智能增加用户ar环境沉浸度方法、系统及装置
CN106203286A (zh) 一种增强现实的内容获取方法、装置及移动终端
CN108198159A (zh) 一种图像处理方法、移动终端以及计算机可读存储介质
CN110210449A (zh) 一种用于虚拟现实交友的人脸识别系统及方法
CN109816743A (zh) 生成标识图案的方法和终端设备
CN106846438A (zh) 一种基于增强现实的首饰试戴方法、装置及系统
CN109583413A (zh) 一种数据处理方法及装置
CN106791091A (zh) 图像生成方法、装置和移动终端
CN110458751B (zh) 一种基于粤剧图片的面部替换方法、设备及介质
CN106777083A (zh) 一种标记图片中物体的方法及装置
CN112287909A (zh) 一种随机生成检测点和交互要素的双随机活体检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination