发明内容
本说明书实施例旨在提供一种更有效的,以解决现有技术中的不足。
为实现上述目的,本说明书一个方面提供一种图片处理方法,包括:在用户打开图片之后,响应于用户操作,接收用户的语音;从所述语音识别出第一字符串,作为添加项;以及在所述图片上添加所述添加项。
本说明书另一方面提供一种图片处理方法,包括:在用户打开图片之后,响应于用户操作,接收用户的语音;从所述语音识别出第一字符串;根据预设的关键字符串库,获取与所述第一字符串对应的至少一个第二字符串、和/或与所述第一字符串对应的至少一个图形,作为至少一个添加项;以及在所述图片上分别添加所述至少一个添加项。
在一个实施例中,在上述图片处理方法中,获取与所述第一字符串对应的至少一个第二字符串、和/或与所述第一字符串对应的至少一个图形,作为至少一个添加项包括,从所述第一字符串中获取与所述关键字符串库中的关键字符串匹配的字符串,作为添加项。
在一个实施例中,在上述图片处理方法中,获取与所述第一字符串对应的至少一个第二字符串、和/或与所述第一字符串对应的至少一个图形,作为至少一个添加项包括,从所述第一字符串中获取与所述关键字符串库中的关键字符串匹配的第三字符串,其中,所述第三字符串为表示量的单位的字符串,并且在所述第一字符串中,在所述第三字符串之前为数字字符串,以及,获取顺序包括所述数字字符串和所述第三字符串的字符串作为添加项。
在一个实施例中,在上述图片处理方法中,获取与所述第一字符串对应的至少一个第二字符串、和/或与所述第一字符串对应的至少一个图形,作为至少一个添加项包括,从所述第一字符串中获取与所述关键字符串库中的关键字符串匹配的第四字符串作为添加项,其中,所述第四字符串预设为对应于特定图形,以及,获取所述特定图形作为添加项。
在一个实施例中,在上述图片处理方法中,获取与所述第一字符串对应的至少一个第二字符串、和/或与所述第一字符串对应的至少一个图形,作为至少一个添加项包括,从所述第一字符串中获取与所述关键字符串库中的关键字符串匹配的第五字符串,其中,所述第五字符串预设为对应于特定图形,以及,获取所述特定图形作为添加项。
在一个实施例中,上述图片处理方法还包括,在用户打开图片之后,根据用户选择的图片应用场景,获取预设为与所述场景对应的至少一个图形作为至少一个添加项,以及在所述图片上分别添加根据所述场景获取的至少一个添加项。
在一个实施例中,在上述图片处理方法中,所述图片应用场景为商品营销场景,以及,其中,预设为与所述商品营销场景对应的至少一个图形包括:标尺、标签、图框和箭头。
在一个实施例中,在上述图片处理方法中,所述根据预设的关键字符串库包括,根据与用户选择的图片应用场景对应的关键字符串库。
在一个实施例中,在上述图片处理方法中,所述场景为商品营销场景,以及,其中,与所述场景对应的关键字符串库包括关于以下属性的关键字符串:材质、尺寸、颜色、价格和外观。
在一个实施例中,上述图片处理方法还包括,在接收用户的语音之前或之后,在屏幕上显示与所述图片应用场景对应的语音输入内容提示。
在一个实施例中,上述图片处理方法还包括,在图片中添加所述添加项之后,根据用户手势或输入进行以下至少一种修改:改变所述添加项的位置、改变所述添加项的尺寸、编辑所述添加项的内容、以及删除所述添加项。
在一个实施例中,在上述图片处理方法中,所述用户打开图片包括,用户在其终端的相册中打开图片、用户在社交APP中打开图片、或者用户在用于执行所述方法的APP中打开图片。
本说明书另一方面提供一种图片处理装置,包括:接收单元,配置为,在用户打开图片之后,响应于用户操作,接收用户的语音;识别单元,配置为,从所述语音识别出第一字符串,作为添加项;以及添加单元,配置为,在所述图片上添加所述添加项。
本说明书另一方面提供一种图片处理装置,包括:接收单元,配置为,在用户打开图片之后,响应于用户操作,接收用户的语音;识别单元,配置为,从所述语音识别出第一字符串;获取单元,配置为,根据预设的关键字符串库,获取与所述第一字符串对应的至少一个第二字符串、和/或与所述第一字符串对应的至少一个图形,作为至少一个添加项;以及添加单元,配置为,在所述图片上分别添加所述至少一个添加项。
本说明书另一方面提供一种计算机可读的存储介质,其上存储有指令代码,所述指令代码在计算机中执行时,令计算机上述图像处理方法。
具体实施方式
下面将结合附图描述本说明书实施例。
图1示意示出了根据本说明书实施例的系统100。如图1所示,系统100包括显示单元11、语音接收单元12、语音识别单元13、获取单元14、关键字符串库15以及图片编辑单元16。首先,用户通过显示单元11打开图片。在打开图片之后,用户可通过语音接收单元12的接口触发语音接收单元12。例如,通过长按屏幕上显示的麦克风图标,从而触发语音接收单元12开始接收语音。在用户断开语音接收单元12的接口(例如,松开所述麦克风图标)之后,语音接收单元12将接收到的语音发送给语音识别单元13。语音识别单元13通过语音识别功能将接收的语音识别为字符串,该字符串可包括文字、数字、字母、符号等。在一个实施例中,语音识别单元13将识别出的字符串发送给图片编辑单元16,从而图片编辑单元16在图片上添加所述字符串。在另一个实施例中,语音识别单元将识别出的字符串发送给获取单元14,获取单元14通过调用关键字符串库15,而将所述字符串与所述词库中的关键字符串进行匹配,从而获取所述字符串中的关键字符串、或对应的字符串组合、或对应的图形作为添加项,并将该添加项发送给图片编辑单元16。之后,图片编辑单元16在图片上添加所述添加项。
图2示出了根据本说明书实施例的一种图片处理方法的流程图。所述方法包括:在步骤S21,在用户打开图片之后,响应于用户操作,接收用户的语音;在步骤S22,从所述语音识别出字符串,作为添加项;以及在步骤S23,在所述图片上添加所述添加项。
首先,在步骤S21,在用户打开图片之后,响应于用户操作,接收用户的语音。这里,不限定用户打开图片的设备,例如,用户可在便携式智能设备中打开图片,或者,用户可在计算机中打开图片。当用户在例如手机中打开图片时,不限定用户具体的打开位置。例如,用户可在带有根据本说明书实施例的图片处理功能的手机相册中打开图片、可在带有根据本说明书实施例的图片处理功能的社交APP(例如朋友圈、生活圈等)中打开图片,或者可在用于执行根据本说明书实施例的图片处理方法的APP中打开图片。
用户在打开图片之后,可进行用于打开语音接收的接口的操作。例如,在用户通过计算机打开图片的情况中,用户可通过打开麦克风以开始计算机的语音接收。在用户使用手机打开图片的情况中,用户可长按屏幕上的麦克风图标,以开始手机的语音接收。在一个实施例中,用户可单点屏幕上的麦克风图标(该图标位于图片外部),然后长按图片中的特定位置,进行语音输入。从而可以在图片中的特定位置插入通过语音识别获得的标签。
在步骤S22,从所述语音识别出字符串,作为添加项。这里,可通过已有的语音识别功能进行语音识别。从而从输入的语音识别出对应的字符串。所述对应的字符串可包括汉子字符、数字字符、字母字符、或符合字符等。
在步骤S23,在所述图片上添加所述添加项。即,将上述字符串作为文本框添加到图片中。在一个实施例中,用户长按屏幕中的麦克风图标进行语音输入,在该情况中,系统将所述添加项随机添加到图片中的一个位置。在另一个实施例中,用户在单点麦克风图标之后,长按图片中的特定位置进行语音输入,在该情况中,系统将所述添加项添加到图片中的特定位置。
在一个实施例中,在用户打开图片之后,根据用户选择的图片应用场景,获取预设为与所述场景对应的至少一个图形作为至少一个添加项,以及在所述图片上分别添加根据所述场景获取的至少一个添加项。例如,当在根据本说明书实施例的图片处理APP中进行所述图片处理时,APP可提供多个场景的选择按钮。所述多个场景例如包括:商品营销场景、自拍场景、教学场景、婚介场景等。在该APP中,用户可在打开图片之前预先选择好场景,也可以在打开图片之后选择场景。在该APP中,对部分场景预设对应的图形,例如,对于商品营销场景,预设对应的图形包括,标尺、标签、图片、箭头等。从而,在用户打开图片之后,在用户选择了商品营销场景的情况下,APP自动获取对应的图形标尺、标签等,并在图片上自动添加标尺和标签。本领域技术人员可以理解,这里在APP中打开图片只是为了示例说明,例如,用户也可以在手机相册中打开图片,并在图片打开之后选择图片应用场景。
在一个实施例中,在接收用户的语音之前或之后,在屏幕上显示与所述图片应用场景对应的语音输入内容提示。
在添加了所述添加项之后,用户可对该添加项进行各种操作。例如,在用户使用手机的情况中,用户可以通过手势,改变所述添加项的位置、改变所述添加项的尺寸,例如通过按着添加项在屏幕上滑动,以将添加项调整到新的位置,通过两个手指对所述添加项进行旋转,而调整添加项的角度,通过在添加项的对角线方向滑动两个手指,从而调整添加项的大小等。另外,用户可在所述添加项中输入新的字符或删除已有的字符,或者,用户通过长按所述添加项,以显示更多的操作按钮,例如,删除按钮,从而进行更多的对该添加项的编辑操作。
图3示出了根据本说明书实施例的一种图片处理方法的流程图。所述方法包括:在步骤S31,在用户打开图片之后,响应于用户操作,接收用户的语音;在步骤S32,从所述语音识别出第一字符串;在步骤S33,根据预设的关键字符串库,获取与所述第一字符串对应的至少一个第二字符串、和/或与所述第一字符串对应的至少一个图形,作为至少一个添加项;以及在步骤S34,在所述图片上分别添加所述至少一个添加项。
该方法中的步骤S31和S32与图2中的步骤S21和S22基本相同,在此不再赘述。
在步骤S33,根据预设的关键字符串库,获取与所述第一字符串对应的至少一个第二字符串、和/或与所述第一字符串对应的至少一个图形,作为至少一个添加项。
在一个实施例中,所述第二字符串为所述第一字符串。
所述关键字符串库可通过人工整理、或机器学习获得。其可以包括对应于各个具体场景的关键字符串。例如,一个具体的场景为商品营销场景,在该场景中,用户为了推广图片中的物品,需要对物品的各种属性打上标签,例如,所述属性包括材质、尺寸、颜色、价格、外观等。因此,在对应于商品营销场景的关键字符串库中,可包括关于上述各个属性的关键字符串。例如,在材质这类中,可包括“纯铜”、“塑料”、“玻璃”等表示材料的关键字符串,在尺寸这类中,可包括“cm”、“m”、“公分”等表示尺寸单位的关键字符串,在颜色这类中,可包括“红色”、“藕荷色”、“洋红色”等表示颜色的关键字符串,在价格这类中,可包括“元”、“美元”等表示货币单位的关键字符串,以及,在外观这类中,可包括“金属拉丝”、“抛光”等表示外观的关键字符串。
再例如,所述场景为婚介场景,在该场景中,用户为了介绍图片中的人物,需要给人物打上各种人物属性标签。例如,所述属性包括年龄、专业、工作单位等。则与婚介场景对应的关键字符串库中可包括与上述属性对应的关键字符串,如年龄单位(岁)、物理、生物、自动化、公司、事务所等等。
再例如,所述场景为自拍场景。在该场景中,用户可以给自拍图打上心情、感受标签等。从而,与该场景对应的关键字符串库中可包括“开心、愤怒、焦虑”等关键字符串。
在一个实施例中,用户可选择图片应用场景。例如,在用户打开图片之后,可在屏幕上显示场景选项按钮,用户可通过所述按钮选择希望的图片应用场景,或者,用户可在打开图片之前预先选择好图片应用场景。在用户选择了场景之后,系统根据与该场景对应的预设关键字符串库,获取所述添加项。例如,图4示出了商品营销场景的示例。用户在打开如图4所示的图片之后,可选择“商品营销场景”。从而,系统在对用户的语音输入语音识别为字符串之后,调用对应于商品营销场景的关键字符串库与所述字符串进行匹配。
在一个实施例中,系统在接收用户选择的图片应用场景之后,在接收用户的语音之前或之后,在屏幕上显示与所述场景对应的语音输入内容提示。图5示意示出在商品营销场景下,屏幕上的语音输入内容提示,包括“长120里面”(尺寸)、“金属是拉丝抛光纯铜材质”(材质)、“春季新款”、“50元拿货价”(价格)等。可对应于特定的场景预先设定所述语音输入内容提示。
在一个实施例中,例如用户在如上所述选择商品营销场景之后,用户通过长按屏幕上的麦克风输入语音“高30cm,宽35cm,五金材质是纯铜五金磨砂,装饰物为圆头钉打孔,价格120元”。系统在将该语音识别为字符串之后,将该字符串与对应于商品营销场景的关键字符串库中的关键字符串相匹配。在所述关键字符串库的关于材质的分类中包括关键字符串“纯铜五金磨砂”、在关于外观的分类中包括关键字符串“圆头钉打孔”,因此,获取“纯铜五金磨砂”和“圆头钉打孔”作为将要添加到图片上的添加项。在一个实施例中,在关键字符串库中将关于材质和外观的关键字符串预设为对应于标签图形。从而在获取添加项“纯铜五金磨砂”和“圆头钉打孔”之后,系统还自动获取标签图形作为添加项。所述标签图形用于在图片中标注出“纯铜五金磨砂”材质对应的具体位置,以及“圆头钉打孔”外观对应的具体位置。
在一个实施例中,从上述字符串可获取,与所述关键字符串库的关于尺寸的分类中的关键字符串“cm”匹配的“cm”,并且可判断出在上述字符串中,“cm”之前为数字字符串,因此获取字符串中的“30cm”和“35cm”作为添加项分别添加到图片上。在一个实施例中,在关键字符串库中将“cm”设定为对应于标尺图形,从而在获取添加项“30cm”和“35cm”之后,系统还自动获取标尺图形作为添加项。
在一个实施例中,在所述关键字符串库的关于价格的分类中包括关键字符串“元”,从而可从上述字符串中获取关键字符串“元”。并且可判断,在上述字符串中,“元”的之前为数字字符串,因此获取上述字符串中的“120元”作为添加项添加到图片上。
在一个实施例中,在所述关键字符串中的关于尺寸的分类中包括关键字符串“高”和“宽”,而在关键字符串库中将“高”设定为对应于标尺图形。因此,在获取字符串中的关键字符串“高”和“宽”之后,系统获取标尺图形作为添加项。
所述添加的图形不限于上述标签和标尺,还可以是箭头、各种用于圈注的几何形状、图框等等。例如,可将标签设置为与关键字符串库中的颜色、材质等关键字符串对应,将标尺设置为与关键字符串中的表示长度或长度单位的字符串对应。而在例如自拍场景中,还可以根据关键字符串匹配,添加与对话内容对应的图框,与心情对应的表情图标等。
再回到图3,在步骤S34,在所述图片上分别添加所述至少一个添加项。图6示出了在图片上分别添加的文本添加项、标签添加项、及标尺添加项的示意图。在添加了所述添加项之后,用户可根据手势或输入进行以下至少一种修改:改变所述添加项的位置、改变所述添加项的尺寸、编辑所述添加项的内容、以及删除所述添加项。例如,如图6所示,对于图中的标尺,用户可通过手势移动标尺的两端,改变标尺的长度,可通过手势旋转标尺,改变标尺的角度,通过手势删除所述标尺等。
在一个实施例中,如参考图2中所述,在用户打开图片之后,根据用户选择的图片应用场景,获取预设为与所述场景对应的至少一个图形作为至少一个添加项,以及在所述图片上分别添加根据所述场景获取的至少一个添加项。其具体实例如参考图2所述,在此不再赘述。
另外,在完成上述编辑之后,用户还可以通过例如屏幕上的添加二维码的接口对图片添加二维码,从而可以保存图片,并分享图片。在该分享图片中,通过图中的标签准确明了地展现了商品的各个属性,便于购买者对该商品进行快速地了解,从而促进了对商品的营销。
图7示出了根据本说明书实施例的一种图片处理装置700,包括:接收单元71,配置为,在用户打开图片之后,响应于用户操作,接收用户的语音;识别单元72,配置为,从所述语音识别出第一字符串,作为添加项;以及添加单元73,配置为,在所述图片上添加所述添加项。
图8示出了根据本说明书实施例的一种图片处理装置800,包括:接收单元81,配置为,在用户打开图片之后,响应于用户操作,接收用户的语音;识别单元82,配置为,从所述语音识别出第一字符串;第一获取单元83,配置为,根据预设的关键字符串库,获取与所述第一字符串对应的至少一个第二字符串、和/或与所述第一字符串对应的至少一个图形,作为至少一个添加项;以及第一添加单元84,配置为,在所述图片上分别添加所述至少一个添加项。
在一个实施例中,在上述图片处理装置800中,所述第一获取单元还配置为,从所述第一字符串中获取与所述关键字符串库中的关键字符串匹配的字符串,作为添加项。
在一个实施例中,在上述图片处理装置800中,所述第一获取单元还配置为,从所述第一字符串中获取与所述关键字符串库中的关键字符串匹配的第三字符串,其中,所述第三字符串为表示量的单位的字符串,并且在所述第一字符串中,在所述第三字符串之前为数字字符串,以及,获取顺序包括所述数字字符串和所述第三字符串的字符串作为添加项。
在一个实施例中,在上述图片处理装置800中,所述第一获取单元还配置为,从所述第一字符串中获取与所述关键字符串库中的关键字符串匹配的第四字符串作为添加项,其中,所述第四字符串预设为对应于特定图形,以及,获取所述特定图形作为添加项。
在一个实施例中,在上述图片处理装置800中,所述第一获取单元还配置为,从所述第一字符串中获取与所述关键字符串库中的关键字符串匹配的第五字符串,其中,所述第五字符串预设为对应于特定图形,以及,获取所述特定图形作为添加项。
在一个实施例中,上述图片处理装置800还包括:第二获取单元85,配置为,在用户打开图片之后,根据用户选择的图片应用场景,获取预设为与所述场景对应的至少一个图形作为至少一个添加项,以及第二添加单元86,配置为,在所述图片上分别添加根据所述场景获取的至少一个添加项
在一个实施例中,上述图片处理装置800还包括,提示单元87,配置为,在接收用户选择的图片应用场景之后,在屏幕上显示与所述场景对应的语音输入内容提示。
在一个实施例中,上述图片处理装置800还包括修改单元88,配置为,在图片中添加所述添加项之后,根据用户手势或输入进行以下至少一种修改:改变所述添加项的位置、改变所述添加项的尺寸、编辑所述添加项的内容、以及删除所述添加项。
本说明书实施例还提供一种计算机可读的存储介质,其上存储有指令代码,所述指令代码在计算机中执行时,令计算机执行如上所述的图片处理方法。
在根据本说明书实施例的图片处理方法和装置中,通过以语音输入的方式对图片打标签,降低了图片处理难度,大大提高了图片处理效率,满足了用户的需求。
本领域普通技术人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执轨道,取决于技术方案的特定应用和设计约束条件。本领域普通技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执轨道的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。